KR100671077B1 - Server, Method and System for Providing Information Search Service by Using Sheaf of Pages - Google Patents

Server, Method and System for Providing Information Search Service by Using Sheaf of Pages Download PDF

Info

Publication number
KR100671077B1
KR100671077B1 KR20060020346A KR20060020346A KR100671077B1 KR 100671077 B1 KR100671077 B1 KR 100671077B1 KR 20060020346 A KR20060020346 A KR 20060020346A KR 20060020346 A KR20060020346 A KR 20060020346A KR 100671077 B1 KR100671077 B1 KR 100671077B1
Authority
KR
South Korea
Prior art keywords
bundle
information
search
url
web
Prior art date
Application number
KR20060020346A
Other languages
Korean (ko)
Other versions
KR20060096356A (en
Inventor
남세동
신중호
Original Assignee
(주)첫눈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)첫눈 filed Critical (주)첫눈
Priority to PCT/KR2006/000739 priority Critical patent/WO2006107141A1/en
Priority to CN2006800066318A priority patent/CN101133415B/en
Priority to JP2007557935A priority patent/JP4769822B2/en
Priority to CN201210008279.9A priority patent/CN102622402B/en
Publication of KR20060096356A publication Critical patent/KR20060096356A/en
Application granted granted Critical
Publication of KR100671077B1 publication Critical patent/KR100671077B1/en
Priority to US11/849,982 priority patent/US20080021889A1/en
Priority to US16/681,183 priority patent/US20200175081A1/en

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 제공 방법 및 시스템이 개시된다. 본 발명에 따른 검색 서비스 제공 방법은 수집된 데이터로부터 그 데이터가 존재하였던 위치정보를 분석하여 상기 위치정보의 형식을 생성하는 단계와, 상기 생성된 위치정보의 형식에 따라 상기 수집된 데이터를 그룹별로 묶는 단계와, 상기 묶여진 그룹에서 임의의 키워드와 관련된 그룹을 선택하여, 그룹별 묶음 검색결과를 제공하는 단계를 포함하는 것을 특징으로 한다. 이에 의해, 질의어를 가장 많이 포함할 뿐만 아니라 질의어와 연관된 정보를 많이 포함하는 검색 결과를 제공하여 사용자로 하여금 정확한 정보를 빠르게 검색하게 하는 검색 서비스를 제공할 수 있다.Disclosed are an information retrieval service providing server, a providing method, and a system using a page bundle. The search service providing method according to the present invention comprises generating the format of the location information by analyzing the location information from which the data existed from the collected data, and grouping the collected data according to the format of the generated location information. Grouping and selecting a group related to any keyword from the group to provide a grouped search result for each group. Accordingly, it is possible to provide a search service that allows a user to quickly search for accurate information by providing a search result including not only the most query words but also a lot of information related to the query words.

검색 엔진, 검색 서비스, 페이지 묶음, 게시판, 게시글 Search engines, search services, page bundles, bulletin boards, posts

Description

페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법 및 시스템 {Server, Method and System for Providing Information Search Service by Using Sheaf of Pages}Server, Method and System for Providing Information Search Service by Using Sheaf of Pages}

도 1은 본 발명의 바람직한 실시예에 따른 페이지 묶음을 이용한 정보 검색 서비스 제공 시스템의 블록도,1 is a block diagram of an information retrieval service providing system using a page bundle according to a preferred embodiment of the present invention;

도 2는 본 발명의 바람직한 실시예에 따른 묶음 검색 서버의 블록도,2 is a block diagram of a bundled search server according to a preferred embodiment of the present invention;

도 3a 내지 도 3b는 본 발명의 바람직한 실시예에 따른 URL 형식과 UP 트리를 설명하기 위한 도면,3A to 3B are diagrams for explaining a URL format and a UP tree according to an embodiment of the present invention;

도 4는 본 발명의 바람직한 실시예에 따른 페이지 묶음을 이용한 정보 검색 서비스 제공 방법의 플로우차트,4 is a flowchart of a method for providing an information retrieval service using a page bundle according to a preferred embodiment of the present invention;

도 5는 본 발명의 바람직한 실시예에 따른 묶음 검색 결과 화면의 일예를 도시한 도면이다.5 is a diagram illustrating an example of a bundled search result screen according to an exemplary embodiment of the present invention.

< 도면의 주요 부분에 대한 부호의 설명 ><Description of Symbols for Main Parts of Drawings>

110: 사용자 단말기 120: 유무선 통신망110: user terminal 120: wired and wireless communication network

130: 웹 서버 140: 묶음 검색 서버130: Web Server 140: Bundle Search Server

141: 묶음검색 DB 150: 색인 서버141: Packed Search DB 150: Index Server

151: 색인 DB 210: 웹 페이지 수집 모듈151: Index DB 210: Web Page Collection Module

220: URL 형식 생성 모듈 230: 페이지 묶음 모듈220: URL format generation module 230: page bundle module

240: 색인 관리 모듈 250: 질의 관리 모듈240: index management module 250: query management module

260: 제어부 260: control unit

본 발명은 정보 검색 서비스에 관한 것으로, 보다 상세하게는 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법 및 그 시스템에 관한 것이다. The present invention relates to an information retrieval service, and more particularly, to an information retrieval service providing server, method, and system using page bundles.

정보화시대가 도래하여 급속히 성장해 감에 따라 정보량이 급속하게 증가하는 한편 세분화하고 복합적으로 이용되는 등 정보의 정확하고 빠른 활용이 정보화시대를 살아가는 데에 있어서 중요한 수단이 되어 가고 있는 추세이다. 또한, 최근 인터넷의 발달로 인해 정보의 바다라 불리는 인터넷 상의 넘쳐나는 방대한 양의 정보를 컴퓨터를 이용하여 적절히 가공하고 체계적으로 축적하여 정보를 신속하고 정확하게 찾는 인터넷 정보 검색 기술이 발전하고 있는 실정이다.As the information age evolves rapidly, the amount of information increases rapidly, and the accurate and rapid use of information, such as segmentation and complex use, is becoming an important means in living the information age. In addition, due to the recent development of the Internet, Internet information retrieval technology has been developed to search for information quickly and accurately by appropriately processing and systematically accumulating a large amount of information on the Internet, called the sea of information, using a computer.

인터넷 정보 검색 기술은 인터넷 상의 이미지, 음성, 동영상 등의 다양한 형태의 정보를 웹 브라우저(Web Browser)를 이용하여 쉽고 빠르게 찾아 주지만 매일 기하급수적으로 증가하는 수많은 웹 사이트(Web Site) 중에서 어느 웹 사이트에 필요한 정보가 있는지를 확인하기 어렵다는 단점이 있다. 이러한 단점을 극복하기 위해 모색된 여러 방안 중에서 가장 보편적인 방안은 검색 엔진(Search Engine)을 이용하는 방안이다.Internet information retrieval technology finds various types of information such as images, voices, and videos on the Internet easily and quickly by using a web browser, but it can be used on any website among the growing number of web sites that grow exponentially every day. The disadvantage is that it is difficult to determine whether there is the necessary information. The most common method among various methods sought to overcome this disadvantage is to use a search engine.

검색 엔진이란 웹 사이트의 URL 정보를 일일이 숙지하지 않아도 인터넷 상의 방대한 양의 정보 중에서 자신이 원하는 정보를 찾아 주는 소프트웨어를 통칭하는 것이다. 검색 엔진은 통상적으로 검색 로봇(Search Robot)이나 웹 스파이더(Web Spider) 프로그램이라 불리는 검색 프로그램이 인터넷 상의 수많은 웹 사이트를 돌아다니면서 미리 수집된 웹 사이트의 정보들의 색인 작업을 수행하고 데이터베이스(Database)로 저장한 후, 정보의 검색을 원하는 인터넷 사용자가 특정 질의어를 입력하면 데이터베이스의 색인을 확인하여 질의어와 일치되는 내용이 있는 웹 사이트만을 선택하여 제공한다.Search engines are the names of software that finds the information you want from the vast amount of information on the Internet without having to know the URL information of a web site. Search engines, which are commonly referred to as Search Robots or Web Spider programs, navigate through numerous websites on the Internet, indexing the information of pre-collected websites, After storing, when an Internet user who wants to search for information enters a specific query, the index of the database is checked and only the web site that matches the query is selected and provided.

검색 엔진은 검색 엔진의 동작 방법에 따라서 웹 인덱스(Web Index) 방식, 웹 디렉터리(Web Directory) 방식, 메타(Meta) 검색 방식 등으로 구현된다. 여기서, 웹 인덱스 방식이란 가장 통상적인 방식으로 검색 로봇(Search Robot)이나 웹 스파이더(Web Spider) 프로그램이라 불리는 검색 프로그램이 인터넷 상의 수많은 웹 사이트를 돌아다니면서 미리 수집된 웹 사이트의 정보들을 색인 작업을 수행하고 데이터베이스(Database)로 저장한 후, 정보의 검색을 원하는 인터넷 사용자가 특정 질의어를 입력하면 데이터베이스의 색인을 확인하여 질의어와 일치되는 내용이 있는 웹 페이지만을 선택하여 제공하는 방식이다.The search engine is implemented by a web index method, a web directory method, a meta search method, and the like according to a method of operating the search engine. Here, the web indexing method is the most common way that a search program called a search robot or a web spider program navigates through a number of web sites on the Internet and indexes the information of previously collected web sites. After storing the information in a database, if an Internet user who wants to search for information enters a specific query, the user checks the index of the database and selects and provides only a web page with content that matches the query.

또한, 웹 디렉터리 방식은 인터넷 상에 존재하는 웹 페이지들을 주제별, 계층별로 정리하여 데이터베이스를 구축하여 검색을 위한 특정 웹 페이지 상에 주제별, 계층별 등으로 분류하고 항목을 메뉴로서 디렉토리화 하여 구성하며 사용자가 나열된 항목 중에서 검색하고자 하는 정보와 가장 근접한 항목을 선택하여 검색 범 위를 점차 좁혀가면서 정보를 검색하는 방식이다.In addition, the web directory method organizes web pages existing on the Internet by subject and hierarchy, constructs a database, classifies them by subject, hierarchy, etc. on a specific web page for searching, and organizes items by directory as a menu. Is to search for information by narrowing down the search range by selecting the item that is closest to the information to be searched.

또한, 메타 검색 방식은 웹 인덱스 방식에서 진화한 방식으로서, 웹 인덱스 방식으로 검색 서비스를 제공하는 다수의 검색 엔진을 모아 메뉴로서 구성하고 사용자로 하여금 다수의 검색 엔진 중에서 하나의 검색 엔진을 선택해서 선택한 검색 엔진을 이용하여 검색을 수행하는 방식이다.In addition, the meta search method has evolved from the web index method, and a plurality of search engines that provide a search service using the web index method are configured as a menu, and a user selects one search engine from among a plurality of search engines. The search is performed using a search engine.

한편, 이러한 검색 엔진은 그 방식에 따라 각각 문제점을 갖는다. 즉, 웹 디렉터리 방식은 검색 결과로 얻는 웹 페이지의 수가 비교적 적기 때문에 풍부한 검색 결과를 얻을 수 없을 뿐만 아니라 원하는 정보를 얻기까지 대분류, 중분류, 소분류, 정보 등의 다수의 단계를 거쳐야 하기 때문에 중간의 단계를 잘못 들어서게 되면 검색에 소요되는 시간이 늘어나게 된다. 또한, 웹 인덱스 방식과 메타 검색 방식은 검색 결과가 너무 많아져서 사용자의 판단을 흐리게 할 수 있을 뿐만 아니라 특정 질의어를 포함하는 웹 페이지들을 모두 수집한 결과를 제공하기 때문에 검색의 신뢰도가 낮다.On the other hand, these search engines have problems in accordance with their methods. In other words, the web directory method does not have abundant search results because the number of web pages obtained from the search results is relatively small, and it is an intermediate step because it has to go through a number of steps such as large classification, medium classification, small classification, and information before obtaining the desired information. If you enter incorrectly, the search time will increase. In addition, the web index method and the meta search method have a large number of search results, which can obscure the user's judgment, and provide a result of collecting all web pages including a specific query and thus have low search reliability.

특히, 웹 인덱스 방식을 부분 차용한 메타 검색 방식과 웹 인덱스 방식은 검색을 수행하는 데에 있어서 자체적인 알고리즘을 통해 신뢰도가 높은 웹 페이지를 우선적으로 제공하기는 하지만 질의어를 포함하는 모든 웹 페이지를 제공하기 때문에 검색 결과로서 제공되는 웹 페이지들이 사용자가 진정으로 원하는 정보를 담은 웹 페이지일 확률이 낮다.In particular, the meta-search method and the web index method partially borrowing the web index method provide all the web pages including the query, although the high-priority web page is preferentially provided through its own algorithm in performing the search. Therefore, it is unlikely that the web pages provided as search results are web pages containing information that the user really wants.

이러한 종래의 검색 방식은 책으로부터 정보를 검색하는 것에 비유하면, 검색하고자 하는 정보를 담은 한 권 또는 그 이상의 책을 제공하는 것이 아니라 그 책에서 그 정보를 포함하는 낱장을 제공하는 데에 그치는 단편적인 검색이기 때문에 그 정보와 관련된 정보를 제공하지 못해 포괄적인 검색이 불가능했다. 그리고 그로 인해 발생하는 검색 결과의 낮은 신뢰도를, 검색 엔진과는 별도로 내부 컨텐츠(예를 들면, 포탈(Portal) 사이트의 카페(Cafe), 블로그(Blog), 지식인 서비스 등)를 이용하여 보완하고 있는 실정이다.Compared to searching for information from a book, such a conventional search method is not a fragment of providing one or more books containing the information to be searched, but merely providing a sheet containing the information in the book. Because it was a search, it could not provide information related to the information, so comprehensive search was not possible. In addition, the low reliability of the resulting search results is supplemented by using internal contents (e.g., cafes, blogs, intellectual services, etc.) of the portal site separately from the search engines. It is true.

이러한 문제점을 해결하기 위해 본 발명은, 인터넷 상의 정보를 검색하는 데에 있어서 검색하고자 하는 정보와 가장 일치하는 정보를 검색하기 위해 유사한 정보를 포함하는 다수의 웹 페이지들을 묶어서 색인하고 웹 페이지의 묶음 단위로 검색을 수행하는 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법 및 시스템을 제공하는 데에 그 목적이 있다.In order to solve this problem, the present invention, in retrieving the information on the Internet to bundle and index a plurality of web pages containing similar information in order to search for information that most closely matches the information to be searched and the unit of the web page An object of the present invention is to provide an information retrieval service providing server, a method, and a system using a bundle of pages that perform a search.

이러한 목적을 달성하기 위해 본 발명은, (a) 수집된 데이터로부터 그 데이터가 위치하였던 위치정보를 분석하여 상기 위치정보의 형식을 생성하는 단계; (b) 상기 생성된 위치정보의 형식에 따라 상기 수집된 데이터를 그룹별로 묶는 단계; 및 (c) 상기 묶여진 그룹에서 임의의 키워드와 관련된 그룹을 선택하여, 그룹별 묶음 검색결과를 제공하는 단계를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법을 제공한다.In order to achieve this object, the present invention comprises the steps of: (a) analyzing the position information where the data is located from the collected data to generate the format of the position information; (b) grouping the collected data into groups according to a format of the generated location information; And (c) selecting a group related to any keyword from the group to provide a group search result for each group.

또한 이러한 목적을 달성하기 위해 본 발명은, 질의어를 송신하고 검색 결과를 출력하는 사용자 단말기, 다수의 웹 페이지를 제공하는 웹 서버 및 사용자 단말 기로부터 질의어를 수신하여 검색 결과를 생성하고 사용자 단말기로 송신하는 묶음 검색 서버를 포함하는 시스템에서 정보를 검색하는 서비스를 제공하는 방법에 있어서, (a) 사용자 단말기로부터 질의어 및 검색 요청 신호를 수신하는 단계; (b) 웹 서버로부터 다수의 웹 페이지를 수신하는 단계; (c) 다수의 웹 페이지를 분석하여 URL 형식(Uniform Resource Locator Pattern)을 생성하고, URL 형식을 이용하여 다수의 웹 페이지를 묶는 단계; (d) 단계 (c)에서 묶인 웹 페이지의 묶음으로부터 색인어를 추출하여 색인어 정보 및 색인어가 참조하는 웹 페이지 묶음의 URL 정보를 생성하는 단계; 및 (e) 질의어를 색인어와 비교하여 묶음 검색 결과 정보를 생성한 후 사용자 단말기로 송신하는 단계를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법을 제공한다.In order to achieve the above object, the present invention provides a user terminal for transmitting a query and outputting a search result, a web server for providing a plurality of web pages, and a query word from the user terminal to generate a search result and transmit the result to the user terminal. A method of providing a service for searching for information in a system including a bundled search server, the method comprising: (a) receiving a query word and a search request signal from a user terminal; (b) receiving a plurality of web pages from a web server; (c) analyzing a plurality of web pages to generate a Uniform Resource Locator Pattern, and grouping the plurality of web pages using the URL format; (d) extracting an index word from a bundle of web pages bundled in step (c) to generate index word information and URL information of a web page bundle referred to by the index word; And (e) generating the bundled search result information by comparing the query word with the index word and transmitting the generated search result information to the user terminal.

한편 본 발명의 다른 목적에 의하면, 유무선 통신망 상의 다수의 웹 페이지(Web Page) 내의 정보를 검색하여 검색 결과를 제공하는 시스템에 있어서, 유무선 통신망을 이용하여 웹 서핑(Web Surfing)을 수행하고 질의어 정보 및 검색 요청 신호를 송신하여 검색을 요청하며 검색의 요청에 대한 묶음 검색 결과 정보를 수신하여 구비된 화면에 출력하는 사용자 단말기; 정보를 다수의 웹 페이지로서 구성하여 생성하고 제공하는 웹 서버; 및 웹 서버로부터 다수의 웹 페이지를 수신하고 분석하여 URL 형식(Uniform Resource Locator Pattern)을 생성하고, 다수의 웹 페이지들을 URL 형식을 이용하여 묶어서 웹 페이지의 묶음 단위로 색인하며, 웹 페이지의 묶음 단위로 정보를 검색하여 묶음 검색 결과 정보를 생성한 후 사용자 단말기로 송신하는 묶음 검색 서버를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 시스템을 제공한다.Meanwhile, according to another object of the present invention, in a system for searching for information in a plurality of web pages on a wired or wireless communication network and providing a search result, performing web surfing using a wired or wireless communication network and querying information And a user terminal that transmits a search request signal to request a search and receives bundle search result information for the request for search and outputs the result to a screen. A web server for organizing, generating, and providing information as a plurality of web pages; And receiving and analyzing a plurality of web pages from a web server to generate a URL format (Uniform Resource Locator Pattern), grouping the plurality of web pages using the URL format and indexing them into a unit of a web page, and unit of a web page The present invention provides a system for providing a bundled search service, comprising: a bundled search server configured to search for information and generate bundle search result information and transmit the result to a user terminal.

한편 본 발명의 또 다른 목적에 의하면, 수집된 데이터로부터 그 데이터가 위치하였던 위치정보를 분석하여 상기 위치정보의 형식을 생성하는 위치정보 형식 생성 모듈; 상기 생성된 위치정보의 형식에 따라 상기 수집된 데이터를 그룹별로 묶는 페이지 묶음 모듈; 및 상기 묶여진 그룹에서 임의의 키워드와 관련된 그룹을 선택하여, 그룹별 묶음 검색결과를 제공하는 제어부를 포함하는 것을 특징으로 하는 묶음 검색 서버를 제공한다.On the other hand, according to another object of the present invention, a location information format generation module for generating a format of the location information by analyzing the location information where the data is located from the collected data; A page bundle module for grouping the collected data into groups according to a format of the generated location information; And a control unit for selecting a group related to a predetermined keyword from the bundled group and providing a grouped search result for each group.

또한 이러한 목적을 달성하기 위해 본 발명은, 유무선 통신망을 이용하여 웹 서핑(Web Surfing)을 수행하는 사용자 단말기로부터 질의어 및 검색 요청 신호를 수신하면 웹 서버에 의해 제공되는 웹 페이지 상의 정보를 검색하여 검색 결과를 사용자 단말기로 송신하는 검색 서비스를 제공하는 서버에 있어서, 웹 페이지 수집 프로그램을 실행하여 유무선 통신망에 접속한 웹 서버에 의해 제공되는 다수의 웹 페이지들을 읽어서 웹 서버로부터 수신하여 저장하는 웹 페이지 수집 모듈; 웹 페이지 수집 모듈에 의해 수신된 다수의 웹 페이지들을 분석하여 URL 형식을 생성하는 URL 형식 생성 모듈; URL 형식 생성 모듈에 의해 생성된 URL 형식을 이용하여 다수의 웹 페이지를 웹 페이지의 묶음으로 묶는 페이지 묶음 모듈; 페이지 묶음 모듈에 의해 묶인 웹 페이지의 묶음으로부터 색인어를 추출하여 색인어 정보 및 색인어가 참조하는 웹 페이지 묶음의 URL 정보를 생성하여 저장하는 색인 관리 모듈; 사용자 단말기로부터 질의어 및 정보 검색 요청 신호를 수신하면 색인어 정보를 검색하여 질의어와 관련된 색인어를 갖는 상기 웹 페이지 묶음의 URL 정보를 묶음 검 색 결과 정보로서 생성한 후 사용자 단말기로 송신하는 질의 관리 모듈; 및 묶음 검색 서버가 웹 페이지의 묶음을 이용하여 검색을 수행하도록 웹 페이지 수집 모듈, URL 형식 생성 모듈, 페이지 묶음 모듈, 색인 관리 모듈 및 질의 관리 모듈을 제어하고, 묶음 검색 서버가 유무선 통신망을 이용하여 사용자 단말기 및 웹 서버와 통신을 수행하도록 제어하는 제어부를 포함하는 것을 특징으로 하는 묶음 검색 서버를 제공한다.In order to achieve the above object, the present invention, when receiving a query word and a search request signal from a user terminal performing web surfing (Web Surfing) using a wired or wireless communication network to search and search the information on the web page provided by the web server A server providing a search service for transmitting a result to a user terminal, wherein the web page collection program executes a web page collection program and reads a plurality of web pages provided by a web server connected to a wired / wireless communication network and receives and stores the web pages. module; A URL format generation module for analyzing a plurality of web pages received by the web page collection module to generate a URL format; A page bundle module that bundles a plurality of web pages using a URL format generated by the URL format generation module; An index management module that extracts an index word from a bundle of web pages bundled by the page bundle module and generates and stores index word information and URL information of a web page bundle referred to by the index word; A query management module that retrieves index word information and generates URL information of the web page bundle having the index word related to the query word as bundle search result information and transmits the index word information to the user terminal after receiving the query word and the information search request signal from the user terminal; And control the web page collection module, the URL format generation module, the page aggregation module, the index management module, and the query management module so that the bundled search server performs a search using a bundle of web pages, and the bundled search server uses a wired or wireless network. It provides a bundled search server comprising a control unit for controlling the communication with the user terminal and the web server.

이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 갖도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. First of all, in adding reference numerals to the components of each drawing, it should be noted that the same reference numerals are used as much as possible even though they are shown in different drawings. In addition, in describing the present invention, when it is determined that the detailed description of the related well-known configuration or function may obscure the gist of the present invention, the detailed description thereof will be omitted.

도 1은 본 발명의 바람직한 실시예에 따른 페이지 묶음을 이용한 정보 검색 서비스 제공 시스템의 블록도이다.1 is a block diagram of an information retrieval service providing system using a page bundle according to a preferred embodiment of the present invention.

본 발명의 바람직한 실시예에 따른 페이지 묶음을 이용한 정보 검색 서비스 제공 시스템은 사용자 단말기(110), 유무선 통신망(120), 웹 서버(130), 묶음 검색 서버(140), 묶음 검색 데이터베이스(DB: Database, 이하 'DB'라 칭함)(141), 색인서버(150) 및 색인 DB(151)를 포함한다.System for providing information retrieval service using a bundle of pages according to a preferred embodiment of the present invention is a user terminal 110, wired and wireless communication network 120, Web server 130, bundle search server 140, bundle search database (DB: Database) (Hereinafter referred to as 'DB') 141, index server 150 and index DB 151.

사용자 단말기(110)는 인터넷 이용자의 조작에 따라 유무선 통신망(120)을 이용하여 묶음 검색 서버(140)에 접속하고 질의어 정보와 함께 검색 요청 신호를 송신하며 묶음 검색 서버(140)가 제공하는 묶음 검색 결과 정보를 수신하여 구비된 화면에 출력하는 컴퓨터이다.The user terminal 110 accesses the bundled search server 140 using the wired / wireless communication network 120 according to the operation of the Internet user, transmits a search request signal along with the query information, and provides the bundled search provided by the bundled search server 140. It is a computer that receives the result information and outputs it on the provided screen.

이를 위해 사용자 단말기(110)는 유무선 통신망(120)을 이용하여 묶음 검색 서버(140)에 접속하기 위해 VDSL(Very High Data Rate Digital Subscriber Line) 모뎀, 케이블 모뎀 등과 같은 인터넷 모뎀을 포함하는 유선 통신 수단 및/또는 CDMA(Code Division Multiple Access) 2000 모뎀, WCDMA(Wide band CDMA) 모뎀 등과 같은 이동통신 모뎀을 포함하는 이동통신 수단을 구비하고, 사용자로부터 질의어를 입력 받고 정보의 검색을 요청하고 검색 결과를 화면에 출력하기 위한 웹 브라우저(Web Browser) 프로그램을 저장한 메모리(Memory)와 사용자 단말기(110)의 전체적인 동작을 제어하기 위한 연산을 수행하는 마이크로프로세서를 포함하는 제어부를 구비한다.To this end, the user terminal 110 is a wired communication means including an Internet modem such as a VDSL (Very High Data Rate Digital Subscriber Line) modem, a cable modem, and the like to access the bundled search server 140 using the wired or wireless communication network 120. And / or a mobile communication means including a mobile communication modem such as a code division multiple access (CDMA) 2000 modem, a wide band CDMA (WCDMA) modem, or the like, wherein the user receives a query and requests a search for information and retrieves a search result. A control unit includes a memory storing a web browser program for output to a screen and a microprocessor for performing operations for controlling the overall operation of the user terminal 110.

이러한 사용자 단말기(110)로서는 데스크톱(Desktop) 컴퓨터나 랩톱(Lap Top) 또는 노트북 등의 이동컴퓨터와 같은 개인용 컴퓨터(PC: Personal Computer) 등이 될 수도 있고, 또한, PDA(Personal Digital Assistant), 셀룰러폰, PCS(Personal Communication Service)폰, 핸드헬드 PC(Hand-Held PC), GSM(Global System for Mobile) 폰, W-CDMA(Wide Band CDMA)폰, CDMA-2000폰, MBS(Mobile Broadband System) 폰 등과 같은 이동통신 단말기가 될 수 있다.The user terminal 110 may be a personal computer (PC) such as a desktop computer, a laptop (Lap Top), or a mobile computer such as a laptop, and may also be a personal digital assistant (PDA) or cellular. Phones, Personal Communication Service (PCS) Phones, Hand-Held PCs, Global System for Mobile (GSM) Phones, Wide Band CDMA (W-CDMA) Phones, CDMA-2000 Phones, Mobile Broadband System (MBS) Phones It may be a mobile communication terminal such as a phone.

유무선 통신망(120)은 사용자 단말기(120), 웹 서버(130), 묶음 검색 서버(140), 색인서버(150)를 유선 또는 무선으로 연결하여 각 구성 요소 상호 간에 송수신 되는 데이터를 중계한다.The wired / wireless communication network 120 connects the user terminal 120, the web server 130, the bundled search server 140, and the index server 150 by wire or wirelessly to relay data transmitted and received between each component.

웹 서버(130)는 통상적인 네트워크 서버로 구현되는 다수의 컴퓨터 시스템 또는 컴퓨터 소프트웨어로서, 다양한 정보를 웹 페이지(Web Page)로서 구성하여 제공한다. 여기서, 네트워크 서버란, 통상적으로 사설 인트라넷 또는 인터넷과 같은 컴퓨터 네트워크를 통해 다른 네트워크 서버와 통신할 수 있는 하위 장치와 연결되어 작업 수행 요청을 접수하고 그에 대한 작업을 수행하여 수행 결과를 제공하는 컴퓨터 시스템 및 컴퓨터 소프트웨어(네트워크 서버 프로그램)를 뜻하는 것이다. 그러나 이러한 네트워크 서버 프로그램 이외에도, 네트워크 서버 상에서 동작하는 일련의 응용 프로그램과 경우에 따라서는 내부에 구축되어 있는 각종 데이터베이스를 포함하는 넓은 개념으로 이해되어야 할 것이다. 이러한 네트워크 서버는 도스(DOS), 윈도우(Windows), 리눅스(Linux), 유닉스(UNIX) 또는 맥OS(Macintosh) 등의 운영체제에 따라 다양하게 제공되고 있는 네트워크 서버 프로그램을 이용하여 구현될 수 있다.The web server 130 is a plurality of computer systems or computer software implemented as a conventional network server, and configures and provides various information as a web page. Here, a network server is a computer system that is connected to a subordinate device that can communicate with other network servers through a computer network such as a private intranet or the Internet, and receives a task execution request and performs a task to provide a result of the task. And computer software (network server program). However, in addition to such a network server program, it should be understood as a broad concept including a series of applications running on a network server and in some cases various databases built therein. Such a network server may be implemented using a network server program that is variously provided according to an operating system such as DOS, Windows, Linux, UNIX, or MacOS.

색인서버(150)는 통상 웹 로봇(web robot)으로 지칭되는 데이터 수집 프로그램을 수행하여 유무선 통신망(120)에 연결된 웹서버(130)들로부터 데이터를 수집한다. 색인서버(150)는 주기적으로 수집 데이터를 갱신하며, 색인 DB(151)는 상기 수집된 데이터를 역파일(inverted file) 등을 이용하여 저장한다. The index server 150 collects data from web servers 130 connected to the wired / wireless communication network 120 by executing a data collection program, which is commonly referred to as a web robot. The index server 150 periodically updates the collected data, and the index DB 151 stores the collected data by using an inverted file or the like.

묶음 검색 서버(140)는 색인서버(150) 및 색인DB(151)와의 통신으로 읽어들인 웹 데이터의 위치정보를 분석하여 다수의 위치정보 형식을 생성한다. 여기서 위치정보는 수집된 웹 데이터의 인터넷 상에서의 경로를 포함한 위치정보를 의미하는 것으로, 바람직하게는 웹 데이터의 URL(Uniform Resource Locator)를 포함한다. 이렇게 생성된 다수의 위치정보 형식들 간의 관계 분석를 분석하여 그루핑(grouping) 과정을 수행한다. 이 과정에서 바람직하게는 URL 형식 트리(UP Tree: URL Pattern Tree, 이하 'UP 트리'라 칭함) 정보를 이용하여 동일하지 않은 다수의 URL 형식들 간의 관계를 설정하고, URL 형식의 묶음 필드 값이 동일한 웹 페이지들을 묶는 단계가 포함될 수 있으며, URL 형식을 생성하고 그루핑하는 과정에 있어서는 미리 정의된 URL 형식 사전 등을 참조하는 단계가 대안적으로 또는 추가적으로 포함될 수 있다. The bundled search server 140 analyzes the location information of the web data read through the communication with the index server 150 and the index DB 151 to generate a plurality of location information formats. Here, the location information means location information including a path on the Internet of the collected web data, and preferably includes a URL (Uniform Resource Locator) of the web data. The grouping process is performed by analyzing the relationship analysis between the plurality of location information formats thus generated. In this process, it is preferable to set up a relationship between a plurality of URL formats that are not identical by using a URL pattern tree (UP Tree: URL pattern tree). Grouping the same web pages may be included, and in the process of generating and grouping the URL format, the step of referring to a predefined URL format dictionary or the like may alternatively or additionally be included.

또한, 묶음 검색 서버(140)는 웹 페이지의 묶음에 따라 색인어를 추출하여 색인어 정보와 색인어가 참조하는 웹 페이지 묶음의 URL 정보를 생성한 후 묶음 검색 DB(141)에 저장하고, 사용자 단말기(110)로부터 질의어와 함께 정보 검색 요청 신호를 수신하면 질의어와 색인어를 비교하여 묶음 검색 결과 정보를 생성한다. 생성된 묶음 검색결과 정보는 질의어와 관련된 다른 검색결과와 함께 사용자 단말기(110)로 전송될 수 있으며, 묶음 검색 서버(140)에 관한 상세한 설명은 도 2를 통해 설명하기로 한다.In addition, the bundle search server 140 extracts the index word according to the bundle of the web page, generates the index word information and the URL information of the web page bundle referred to by the index word, and stores the index word in the bundle search DB 141 and stores the user terminal 110. When receiving an information retrieval request signal together with the query from the query), the query search result is compared with the query word to generate the bundled search result information. The generated bundled search result information may be transmitted to the user terminal 110 along with other search results related to the query, and a detailed description of the bundled search server 140 will be described with reference to FIG. 2.

한편, 묶음 검색 서버(140)는 특정 질의어와 관련한 사용자로부터의 검색 요청 신호가 없는 경우에도 임의의 키워드와 관련된 묶음검색 결과를 제공하는 데 사용될 수 있다. 예를 들어, 사용자 입력 질의어를 포함하는 상위개념 또는 사용자 입력 질의어와 관련된 임의의 키워드를 사용하여 묶음 검색결과를 제공할 수도 있으며, 이슈화 된 뉴스 등에 대한 키워드를 사용하여 묶음 검색결과를 제공함으로써 풍부한 정보원의 제공에 일조할 수도 있다.Meanwhile, the bundled search server 140 may be used to provide a bundled search result associated with any keyword even when there is no search request signal from a user associated with a specific query. For example, it is possible to provide a bundled search result using any keyword related to a high level concept including a user input query or a user input query word, and a rich source of information by providing a bundled search result using a keyword about an issue at issue. May also contribute to the provision of

묶음 검색 DB(141)는 묶음 검색 서버(140)가 생성한 색인어 정보와 웹 페이지 묶음의 위치정보 정보(URL 정보를 포함한다.)를 저장한다. 바람직하게는 각 묶음에 대한 표제어 정보가 추가적으로 저장될 수 있다. 여기서, DB는 데이터베이스 관리 시스템(DBMS: Database Management System) 프로그램 등을 이용하여 컴퓨터 시스템의 저장 공간에 구현된 데이터 구조를 의미하는 것으로, 데이터의 검색, 삭제, 편집 및 추가 등을 자유롭게 행할 수 있는 데이터 저장 형태를 뜻한다. 이러한 데이터베이스는 오라클(Oracle), 인포믹스(informix), 사이베이스(Sybase), MS SQL(Microsoft Structured Query Language) 또는 DB2와 같은 관계형 데이터베이스 관리 시스템(RDBMS: Relational Database Management System) 등을 이용하여 본 발명의 목적에 맞게 구현될 수 있고, 데이터의 저장, 검색, 삭제, 편집 및 추가 등의 기능을 수행하기 위한 적당한 필드(Field) 또는 구성요소들이 있다. 또한. 상기 묶음 검색 DB(141)와 색인 DB(151)는 분리되거나 또는 통합되어 운영될 수 있다. The bundled search DB 141 stores the index word information generated by the bundled search server 140 and the location information information (including URL information) of the web page bundle. Preferably, heading information for each bundle may be additionally stored. Here, DB refers to a data structure implemented in a storage space of a computer system by using a database management system (DBMS) program, and the like, which can freely search, delete, edit, and add data. It means the storage form. Such a database may be implemented using a relational database management system (RDBMS) such as Oracle, Informix, Sybase, Microsoft Structured Query Language (MS SQL) or DB2. It may be implemented according to the purpose, and there are appropriate fields or components for performing functions such as storing, searching, deleting, editing, and adding data. Also. The bundled search DB 141 and the index DB 151 may be operated separately or integrated.

도 2는 본 발명의 바람직한 실시예에 따른 묶음 검색 서버의 블록도이다.2 is a block diagram of a bundled search server according to a preferred embodiment of the present invention.

본 발명의 바람직한 실시예에 따른 묶음 검색 서버(140)는 웹 페이지 수집 모듈(210), URL 형식 생성 모듈(220), 페이지 묶음 모듈(230), 색인 관리 모듈(240), 질의 관리 모듈(250) 및 제어부(260)를 포함하는 네트워크 서버이다.Bundled search server 140 according to a preferred embodiment of the present invention is a web page collection module 210, URL format generation module 220, page bundle module 230, index management module 240, query management module 250 And a control unit 260.

웹 페이지 수집 모듈(210)은 유무선 통신망(120)을 통한 웹서버(130)들에 접속하여 데이터를 수집하는 기능을 수행하며, 색인 서버(150)가 수집하여 색인 DB(151)에 저장한 위치정보가 참조하는 데이터들의 변경 등을 반영하기 위하여 묶음 검색 서버(140)에 선택적으로 포함될 수 있다.The web page collection module 210 performs a function of collecting data by accessing the web servers 130 through the wired / wireless communication network 120, and the location collected by the index server 150 and stored in the index DB 151. The data may be optionally included in the bundled search server 140 to reflect changes in data referred to by the information.

URL 형식 생성 모듈(220)은 제어부(260) 또는 웹 페이지 수집모듈(210)에 의해 획득된 웹 페이지들의 URL을 분석하여 URL 형식을 생성한다. 본 발명에서 URL 형식이란 웹 페이지의 URL이 갖는 소정의 형식으로서, 정보를 검색하는 데에 있어서 유사한 내용을 갖거나 유사한 형식으로 작성된 웹 페이지들을 묶어서 웹 페이지의 묶음으로 관리하기 위해 생성된다. 본 발명에서는 유사한 다수의 웹 페이지를 하나의 그룹으로서 관리하여 정보를 검색한다. 이때, 유사한 다수의 웹 페이지를 선정하는 기준이 필요하고, 이 기준으로 이용되는 것이 URL 형식이다.The URL format generation module 220 analyzes the URLs of the web pages acquired by the controller 260 or the web page collection module 210 to generate a URL format. In the present invention, the URL format is a predetermined format of a URL of a web page, and is generated to bundle web pages having similar contents or created in a similar format in retrieving information and managing them as a bundle of web pages. In the present invention, a plurality of similar web pages are managed as a group to retrieve information. In this case, a criterion for selecting a plurality of similar web pages is required, and the URL format is used as the criterion.

URL 형식 생성 모듈(220)은 제어부(260) 또는 웹 페이지 수집모듈(210)에 의해 수신된 웹 페이지의 URL들을 분석하여 묶음 필드를 포함하는 URL 형식(타입)을 생성한다. 즉, 예를 들면, 네오위즈(Neowiz) 사의 세이클럽(Sayclub) 홈피(Hompy) 서비스의 ID(Identification)별 대표 페이지의 URL을 분석하여 ID를 묶음 필드로서 설정한 "http://hompy.sayclub.com/[ID]"라는 URL 형식이 생성될 수 있다. URL 형식은 후술하는 과정에서 도 3을 통해 상세하게 설명하기로 한다. 단, 본 발명에서 URL 형식은 묶음 필드뿐만 아니라 다수의 웹 페이지가 공유하는 HTML 템플릿 또는 본문 내용 등에 따라 다양하게 생성될 수 있으며, 전술한 묶음 필드에 한정되어 생성되지는 않는다.The URL format generation module 220 analyzes URLs of the web page received by the controller 260 or the web page collection module 210 to generate a URL format (type) including a bundle field. That is, for example, "http: //hompy.sayclub." Which sets the ID as a bundle field by analyzing the URL of the representative page for each ID of the Saywiz Hompy service of Neowiz. com / [ID] "URL format may be generated. The URL format will be described in detail with reference to FIG. 3 in the following process. However, in the present invention, the URL format may be variously generated according to not only a bundle field but also an HTML template or body content shared by a plurality of web pages, and is not limited to the aforementioned bundle field.

본 발명에서 HTML 템플릿이란 웹 페이지의 작성이 용이하도록 자주 사용되는 부분을 일정한 구조로 작성한 기본 골격을 말한다. 예를 들면, <Table...><TD>[글번호]</TD><TD>[제목]</TD>...</TABLE> 과 같이 웹 페이지를 작성할 때 자주 사용되는 태그(Tag)의 형식이다.In the present invention, the HTML template refers to a basic skeleton in which a part of frequently used parts is easily structured so that a web page can be easily created. For example, <Table ...> <TD> [Post Number] </ TD> <TD> [Title] </ TD> ... </ TABLE> Tag).

통상적으로 웹 페이지로서 작성되는 HTML 문서는 HTML 문법에 맞춘 HTML 태그와 텍스트의 조합으로 구성된다. HTML 문서는 표현하고자 하는 기능에 따라 다수의 기능 블록 즉, 예를 들면, 메뉴를 구성하기 위한 메뉴 블록, 다른 포탈 사이트와 연결하기 위한 링크 블록, 본문 내용을 담기 위한 메시지 블록 등으로 구성된다. 이러한 기능 블록들은 웹 페이지 내에서 자주 사용되기 때문에 템플릿으로 작성되어 사용자의 편의를 도모한다.Typically, an HTML document written as a web page consists of a combination of HTML tags and text that conforms to the HTML grammar. The HTML document is composed of a plurality of functional blocks, for example, a menu block for constructing a menu, a link block for linking with another portal site, a message block for containing body content, etc. according to a function to be expressed. Since these functional blocks are often used within web pages, they are created as templates for user convenience.

동일한 관리자에 의해 생성된 웹 페이지들은 게시판(Board) 서비스, 블로그(Blog) 서비스, 미니 홈피(Mini Hompy) 서비스 등을 제공하는 특정 웹 서버에 의해 관리되는 다수의 페이지에 포함될 수 있다. 즉, 동일한 HTML 템플릿(Hypertext Markup Language Template)을 공유하는 다수의 웹 페이지들은 동일한 관리자에 의해 생성될 가능성이 클 뿐만 아니라 웹 페이지들이 포함하는 내용에 있어서도 유사한 사항이 포함될 가능성이 크다. Web pages generated by the same administrator may be included in a plurality of pages managed by a specific web server providing a board service, a blog service, a mini hompy service, and the like. That is, a plurality of web pages that share the same HTML template (Hypertext Markup Language Template) is not only generated by the same administrator, but also similarly included in the contents of the web pages.

게시판 서비스, 블로그 서비스, 미니 홈피 서비스 등의 서비스를 제공하는 특정 웹 서버(130)는 자신이 관리하는 대부분의 웹 페이지들을 HTML 템플릿을 이용하여 작성하기 때문에 하나의 웹 서버(130)에 의해 관리되는 웹 페이지들은 같은 HTML 템플릿을 공유하게 된다. 따라서, 동일한 HTML 템플릿을 공유하는 웹 페이지들은 동일한 URL 형식으로 변환될 수 있다.The specific web server 130 that provides services such as bulletin board service, blog service, and mini homepage service is managed by one web server 130 because most web pages managed by the web server are created using HTML templates. Web pages will share the same HTML template. Thus, web pages sharing the same HTML template can be converted to the same URL format.

페이지 묶음 모듈(230)은 URL 형식 생성 모듈(220)에 의해 생성된 URL 형식을 이용하여 동일하지 않은 다수의 URL 형식을 UP 트리 정보를 이용하여 그 관계를 설정하여 묶은 후에 그 다수의 URL 형식의 묶음 중에서 동일한 묶음 필드 값을 갖 는 웹 페이지들을 묶는다. 즉, 페이지 묶음 모듈(230)은 URL 형식 생성 모듈(220)에 의해 생성된 수많은 URL 형식 중에 URL 형식은 다르지만 상호 간에 관련 있는 URL 형식을 UP 트리(URL Pattern Tree) 정보를 이용하여 그 관계를 설정하여 묶은 후에 그 URL 형식의 묶음 중에서 URL 형식의 묶음 필드 값이 동일한 웹 페이지들을 웹 페이지의 그룹으로서 묶는다.The page bundle module 230 sets up a relationship of the plurality of URL formats which are not identical by using the URL format generated by the URL format generating module 220 by using UP tree information, and then bundles the plurality of URL formats. Group web pages that have the same bundle field value among the bundles. That is, the page bundle module 230 sets a relationship among URL counts generated by the URL format generation module 220 using URL pattern tree (UP tree) information, although the URL formats differ from each other but are related to each other. After grouping together, the web pages are grouped together as a group of web pages among the URL-formatted bundles with the same URL-formatted field value.

예를 들면, 세이클럽 홈피에 등록된 모든 웹 페이지의 URL들은 약 20 개 정도의 서로 다른 URL 형식으로 일반화할 수 있는데, 이러한 약 20개 정도의 서로 다른 URL 형식을 UP 트리 정보를 이용하여 하나의 묶음으로 묶은 후에 그 중 특정 사용자의 ID를 묶음 필드 값으로 갖는 웹 페이지들을 웹 페이지의 묶음으로 묶는다. 이를 통해 세이클럽 홈피에 등록된 웹 페이지들은 사용자 ID를 기준으로 묶으면 세이클럽 홈피 서비스에 등록한 사용자 수만큼의 묶음으로 묶이게 된다. 또한, 이러한 작업은 세이클럽 홈피뿐만 아니라 네이버(Naver) 블로그(Blog)에 등록된 웹 페이지들에도 동일하게 적용하여 네이버 블로그에 등록된 사용자 ID 수만큼의 웹 페이지 묶음이 생성될 수 있다.For example, the URLs of all web pages registered in SayClub Homepage can be generalized to about 20 different URL formats. About 20 different URL formats can be generated by using UP tree information. After grouping, web pages that bundle the specific user's ID as the bundle field value are bundled into web pages. Through this, the webpages registered in SayClub Homepage are grouped by the number of users registered in SayClub Homepage service based on the user ID. In addition, this operation may be equally applied to webpages registered to Naver blog as well as Sayclub homepage to generate a web page bundle as many as user IDs registered to Naver blog.

단, 본 발명에서 웹 페이지들을 묶는 기준은 묶음 필드 값의 동일 여부에만 한정되는 것이 아니고, 예를 들면 다수의 묶음 필드를 'AND'나 'OR'로 조합하여 그 조건을 충족하는 웹 페이지들을 묶는 등의 다양한 방법으로 묶을 수 있다. 또한 색인 관리모듈(240)에서 추출된 색인어와 해당 묶음과의 관련성을 평가하여 페이지 묶음을 세분화하거나 변경하는 과정 등이 추가적으로 포함될 수 있다. 예를 들어, 하나의 페이지 묶음(그룹)에서 추출된 색인어가 두 가지 이상의 분야에 대한 것일 경우, 각 분야별 성격에 따라 하나의 그룹으로 통합하거나. 둘 이상의 그룹으로 세분화하는 작업이 요구될 수 있다. 또한 하나의 페이지 묶음(그룹)에서 추출된 색인어가 그 묶음의 내용을 잘 대변하지 못하는 경우에, 묶음 검색결과의 노출순위를 후순위로 조정하는 것 대신에, 일정한 수치화 된 기준에 따라 해당 묶음을 더 이상 유지하지 않는 것이 검색결과의 신뢰성을 줄 수 있으므로 해당 묶음을 삭제할 수도 있다. However, in the present invention, the criterion for grouping web pages is not limited to whether the bundle field value is the same. For example, a plurality of bundle fields are combined with 'AND' or 'OR' to bundle web pages that satisfy the condition. It can be bundled in various ways. In addition, a process of subdividing or changing the page bundle may be additionally included by evaluating the relation between the index word extracted from the index management module 240 and the corresponding bundle. For example, if the index word extracted from one page group (group) is for more than one field, combine them into one group according to the characteristics of each field. Subdivision into two or more groups may be required. Also, if an index that is extracted from a single page group (group) does not represent the content of that group well, instead of adjusting the ranking of the bundle's search results to post-priority, the bundle is added based on certain numerical criteria. Keeping things out of the way can give you confidence in your search results, so you can delete those bundles.

색인 관리 모듈(240)은 페이지 묶음 모듈(230)에 의해 묶인 웹 페이지의 묶음으로부터 색인어를 추출하여 색인어 정보 및 웹 페이지의 URL 정보를 묶음 검색 DB(150)에 저장한다. 즉, 색인 관리 모듈(240)은 웹 페이지의 묶음으로부터 색인어를 추출하여 색인어 정보를 생성하고 묶음 검색 DB(150)의 색인 DB(152)에 저장하고, 각각의 웹 페이지들의 URL 정보를 UP 트리 정보로 그 관계를 설정한 웹 페이지 묶음의 URL 정보를 생성하여 묶음 검색 DB(141)에 저장한다.The index management module 240 extracts an index word from a bundle of web pages bundled by the page bundle module 230 and stores the index word information and URL information of the web page in the bundle search DB 150. That is, the index management module 240 extracts index words from a bundle of web pages to generate index word information, stores the index words in the index DB 152 of the bundled search DB 150, and stores URL information of respective web pages in UP tree information. URL information of the web page bundle having the log relation set is generated and stored in the bundle search DB 141.

질의 관리 모듈(250)은 사용자 단말기(110)로부터의 질의어 또는 임의의 키워드에 대해 색인 DB(152)를 검색하여 질의어에 의하여 매칭되는 색인어를 갖는 웹 페이지 묶음의 URL 정보를 묶음 검색 DB(141)로부터 수신하여 묶음 검색 결과 정보를 생성한다. 상기 질의어 또는 임의의 키워드와 색인어간의 매칭과정은 미리 정의된 용어 분류사전 등을 사용하거나. 상호정보 MI(Mutual Information)값을 이용하여 수행될 수 있으며, 그외에도 종래에 공지된 여러 알고리즘을 사용하여 구현될 수 있다. The query management module 250 searches the index DB 152 for the query word or any keyword from the user terminal 110 and bundles the URL information of the web page bundle having the index word matched by the query word. Generates batch search result information received from. The matching process between the query word or any keyword and index word uses a predefined term classification dictionary or the like. The mutual information may be performed using a mutual information (MI) value, and may be implemented by using various conventionally known algorithms.

제어부(260)는 묶음 검색 서버(140)가 웹 페이지의 묶음을 이용하여 검색을 수행하도록 전술한 웹 페이지 수집 모듈(210), URL 형식 생성 모듈(220), 페이지 묶음 모듈(230), 색인 관리 모듈(240), 질의 관리 모듈(250) 등을 제어한다. 또한색인 서버(140) 및 색인 DB(141)와의 통신기능을 수행하며, 사용자 단말기(110)로 부터의 질의어 검색 요청 신호를 수신하고 생성된 묶음 검색결과를 송신하는 기능을 수행한다. The control unit 260 is a web page collection module 210, URL format generation module 220, the page bundle module 230, index management to the bundle search server 140 to perform a search using a bundle of web pages Module 240, query management module 250, and the like. In addition, it performs a communication function with the index server 140 and the index DB 141, and receives a query search request signal from the user terminal 110 and transmits the generated batch search result.

도 3a 내지 도 3b는 본 발명의 바람직한 실시예에 따른 URL 형식과 UP 트리를 설명하기 위한 도면이다.3A to 3B are diagrams for describing a URL format and an UP tree according to an exemplary embodiment of the present invention.

도 3a는 네오위즈사의 세이클럽 홈피(http://hompy.sayclub.com,이하 '홈피'라 칭함) 서비스를 이용하는 특정 사용자의 홈페이지와 그 관련 페이지의 URL을 나타낸 것이다. 도 3a에 도시된 바와 같이 특정 사용자의 홈피는 다수의 웹 페이지를 포함하고 다수의 웹 페이지는 사용자의 ID 를 자신의 URL 내에 포함한다. 세이클럽 홈피의 경우에는 URL이 쿼리형태 즉, '?'부호 뒤에서 '변수명=해당변수값'의 형태로 표현된다. 따라서, 도 3a에서 'targetmsrl='뒤의 값들을 사용자의 ID를 형식을 식별하기 위한 기준으로 파악하여 URL 형식을 생성하면 도 3B와 같이 생성된다. 또 다른 예로 포털사이트 등이 제공하는 개인형 블로그, 게시판 등의 서비스의 경우에는 서비스제공자의 도메인 이후에 '/'의 구분자를 사용하여 사용자 및 게시판을 구별하기도 한다.FIG. 3a shows a URL of a specific user's homepage and its related page using Neowiz's Sayclub Homepage (http://hompy.sayclub.com, hereinafter referred to as 'Homepage') service. As shown in FIG. 3A, the homepage of a particular user includes a plurality of web pages and the plurality of web pages include the user's ID in their URL. In the case of SayClub Homepage, the URL is expressed in the form of a query, that is, 'variable name = corresponding variable value' after the '?' Sign. Therefore, in FIG. 3A, when the values after 'targetmsrl =' are identified as a criterion for identifying the format, the URL format is generated as shown in FIG. 3B. As another example, in the case of services such as personal blogs and bulletin boards provided by portal sites, the user and bulletin board may be distinguished by using a '/' separator after the service provider's domain.

도 3b는 홈피 웹 페이지의 URL을 분석하여 생성한 URL 형식을 트리구조로 나타낸 것이다. 도 3a에 도시된 홈피 웹 페이지의 URL들을 분석하면 모든 웹 페이지들은 그 URL 내에 사용자 ID 정보를 포함한다. 따라서, 다수의 웹 페이지들의 URL 중에서 사용자의 ID 부분은 일반화하기 위해 [ID]의 묶음 필드(Field)로 변환되고, 상기 홈피에 포함된 게시판 분류를 나타내는 부분은 [boardtype]등의 묶음필드로 변환될 수 있다. 묶음 필드(field) 후보군을 생성하고 상기 후보군들 중에서 그 필드값이 변경되어도 URL에 의하여 브라우징될 수 있는 내용의 실질적인 변화가 없는 등의 경우에는 URL형식 묶음과정에서 영향을 주지 않는 [IGNORE] 필드로 구분될 수 있다. 또한, 각 묶음 필드간의 상하위 구조는 각 묶음필드 값의 변화에 따른 해당 그룹내 문서들의 포함관계, 참조(link)관계 등의 분석을 통하여 결정될 수 있다. 3B illustrates a URL structure generated by analyzing a URL of a homepage web page in a tree structure. When the URLs of the homepage web page shown in Fig. 3A are analyzed, all web pages include user ID information in the URL. Accordingly, the ID portion of the user among the URLs of the plurality of web pages is converted into a bundle field of [ID] for generalization, and the portion representing the bulletin board classification included in the homepage is converted into a bundle field such as [boardtype]. Can be. In the case of generating a candidate field group and there is no substantial change in the content that can be browsed by the URL even if the field value is changed among the candidate groups, the URL field is an [IGNORE] field which does not affect the URL format aggregation process. Can be distinguished. In addition, the structure of the parent and child between each bundle field may be determined through analysis of inclusion, link, etc. of the documents in the group according to the value of each bundle field.

이러한 과정을 통해 URL 형식이 생성되면 네오위즈 홈피의 모든 사용자의 웹 페이지는 생성된 URL 형식으로 일반화할 수 있다. 상기 묶음 필드의 구성은 URL 주소의 분석과정을 통하여 자동으로 이루어 질 수 있으며, 포털사이트, 커뮤니티 사이트 등이 제공하는 개인형 블로그, 게시판 등의 경우에는 해당 서비스 제공자의 정책에 따라 URL 패턴이 획일적으로 생성되는 경향이 있는바. 이러한 사이트들에 대해서는 URL 패턴과 묶음 필드 사전을 미리 정의하여 참조하는 방식으로 상기 URL 형식 생성과 그 묶음과정을 수행할 수 있다.When the URL format is generated through this process, web pages of all users of Neowiz Homepage can be generalized to the generated URL format. The bundle field may be automatically configured through a URL address analysis process. In the case of a personal blog or a bulletin board provided by a portal site or a community site, the URL pattern may be uniformly determined according to the policy of the service provider. Tend to be generated. For such sites, the URL format generation and the grouping process may be performed by defining and referring to a URL pattern and a bundle field dictionary in advance.

도 4는 본 발명의 바람직한 실시예에 따른 페이지의 묶음을 이용한 정보 검색 서비스 제공 방법의 플로우차트이다.4 is a flowchart of a method for providing an information retrieval service using a bundle of pages according to a preferred embodiment of the present invention.

인터넷을 이용하는 사용자는 원하는 정보를 검색하기 위해 사용자 단말기(110)를 이용하여 질의어를 입력하고 질의어와 함께 검색 요청 신호를 묶음 검색 서버(140)로 송신한다(S410). 한편, 상기 S410 단계는 경우에 따라 생략될 수 있다. 즉, 사용자로부터 질의어 입력이나 검색 요청 신호의 입력없이 저장된 데이터 를 분석하여 묶음 검색 서비스를 수행할 수 있다.A user using the Internet inputs a query using the user terminal 110 to search for desired information, and transmits a search request signal together with the query to the bundled search server 140 (S410). On the other hand, step S410 may be omitted in some cases. That is, the bundled search service may be performed by analyzing the stored data without inputting a query or a search request signal from the user.

다음으로 사용자 단말기(110)로부터 질의어와 함께 검색 요청 신호를 수신한 묶음 검색 서버(140)는 색인서버(150)가 사전에 수집하여 구축한 색인DB(151)로부터 웹 페이지들과 관련된 정보(주소정보를 포함한다.)를 수신한다(S420). 묶음 검색 서버(140)는 색인DB(151)로부터 자료를 보충받기 위하여 웹 페이지 수집모듈(210)을 선택적으로 수행할 수 있다.Next, the bundled search server 140 receiving the search request signal together with the query word from the user terminal 110 may provide information (addresses) related to web pages from the index DB 151 collected and built by the index server 150 in advance. Information). (S420). The bundled search server 140 may selectively perform the web page collection module 210 to supplement the data from the index DB 151.

한편, 사용자로부터의 질의어나 검색 요청 신호 없이 미리 설정된 방법에 따라 웹 로봇 프로그램이 실행되어 웹 페이지를 수신하여 데이터를 저장할 수도 있다. 이렇게 수신된 데이터는 색인서버(150)를 통해 색인DB(151)에 저장된다.Meanwhile, a web robot program may be executed according to a preset method without a query word or a search request signal from a user to receive a web page and store data. The received data is stored in the index DB 151 through the index server 150.

색인서버(150)로부터 웹 페이지들을 수신한 묶음 검색 서버(140)는 수신한 웹 페이지들을 분석하여 URL 형식을 생성한다(S430).After receiving the web pages from the index server 150, the bundled search server 140 analyzes the received web pages to generate a URL format (S430).

URL 형식을 생성한 묶음 검색 서버(140)는 서로 다른 URL 형식을 UP 트리 정보를 이용하여 그 관계를 설정하고 묶은 후에 그 URL 형식의 묶음에서 URL 형식의 묶음 필드 값이 동일한 웹 페이지들을 묶는다(S440).The bundle search server 140 that generates the URL format sets and ties the different URL formats using UP tree information, and then bundles web pages having the same URL field value in the bundle of the URL format (S440). ).

웹 페이지들을 묶은 묶음 검색 서버(140)는 웹 페이지들의 묶음으로부터 그 묶음 단위로 색인어를 추출하여 색인어 정보와 그 색인어가 참조하는 웹 페이지 묶음의 URL 정보를 생성하고(S450) 색인어 정보와 웹 페이지 묶음의 URL 정보를 묶음 검색 DB(150)에 저장한다(S460).The bundle search server 140 which bundles the web pages extracts index words from the bundle of web pages in units of bundles to generate index information and URL information of the bundle of web pages referred to by the index words (S450). URL information of the bundle is stored in the search DB (150) (S460).

색인어 정보와 웹 페이지 묶음의 URL 정보를 묶음 검색 DB(150)에 저장한 묶음 검색 서버(140)는 사용자 단말기(110)로부터 수신한 질의어와 묶음 검색 DB(150)에 저장된 색인어와 비교하여 검색하고 묶음 검색 결과 정보를 생성하여 사용자 단말기(110)로 송신한다(S470).The bundled search server 140 storing the index word information and the URL information of the web page bundle in the bundled search DB 150 searches and compares the query words received from the user terminal 110 with the index words stored in the bundled search DB 150. The bundle search result information is generated and transmitted to the user terminal 110 (S470).

묶음 검색 서버(140)로부터 검색 결과 정보를 수신한 사용자 단말기(110)는 수신한 검색 결과를 구비된 화면에 출력한다. 한편, 사용자로부터 입력된 질의어 없이도 본 발명의 서비스는 제공될 수 있다.The user terminal 110 receiving the search result information from the bundled search server 140 outputs the received search result to the screen. On the other hand, the service of the present invention can be provided without a query input from the user.

본 발명인 묶음 검색 서비스는 다수의 웹 페이지를 묶어 웹 페이지의 묶음으로 관리하여 검색에 활용하는 것으로서 웹 페이지에 포함된 단어만을 검색하는 좁은 검색 서비스가 아니라 다수의 웹 페이지를 묶어 그에 관련된 주제어를 검색하는 넓은 개념의 검색 서비스이다. 이러한 검색 서비스는 게시판 검색 서비스와 같이 활용될 수 있다.The present inventors bundle search service is to manage a plurality of web pages as a bundle of web pages to utilize the search, not a narrow search service for searching only words contained in the web page, but to search a number of related words by grouping a plurality of web pages It is a broad concept search service Such a search service may be used together with a bulletin board search service.

즉, 최근에는 '마니아'라는 신생 계층의 출현으로 특정 정보에 관한 자료를 등록하고 그 정보에 관한 질문과 답변을 쓰고 읽음으로써 구성원 간에 특정 정보를 공유하는 사람들의 온라인 모임으로서 웹 페이지 상에서 게시판 서비스가 활성화되고 있다. 따라서, 이러한 '마니아' 층의 게시판 서비스에는 사용자가 검색하고자 하는 정보를 더 많이 담은 웹 페이지들이 포함될 수 있다.In other words, with the emergence of a new class of enthusiasts, a bulletin board service on a web page is an online gathering of people who share specific information among members by registering data on specific information and writing and reading questions and answers about the information. It is being activated. Therefore, the bulletin board service of the 'mania' layer may include web pages containing more information that the user wants to search.

따라서, 사용자가 질의어를 입력하여 검색을 요청할 때, 단순히 질의어를 포함한 웹 페이지들을 나열하는 것보다 질의어와 관련된 정보를 공유하는 특정 게시판들을 그 게시판의 웹 페이지 하나하나가 아닌 게시판의 대표 페이지와 그 하위 페이지들을 묶고 이러한 다수의 게시판의 묶음을 그 묶음 단위로 순위를 결정한 후 나열하여 출력함으로써 사용자의 검색 의도에 보다 적합한 검색 결과를 출력할 수 있게 된다.Therefore, when a user inputs a query and requests a search, certain bulletin boards that share information related to the query, rather than simply listing web pages containing the query, are represented by the bulletin board's main page and its subordinates, rather than the web pages of the bulletin board. By grouping pages and ranking a plurality of bulletin boards in the unit of ranking, the list is outputted so that a search result more suited to a user's search intention can be output.

이하에서는 본 발명의 바람직한 실시예에 따른 묶음 검색 서비스를 게시판 서비스라고 가정한다. 단, 이러한 가정은 설명의 편의를 위한 것으로서 본 발명은 이에 한정되는 것이 아니라 다수의 웹 페이지들을 하나의 묶음 페이지로 묶어 검색하는 다양한 서비스에 적용될 수 있다.Hereinafter, it is assumed that the bundled search service according to the preferred embodiment of the present invention is a bulletin board service. However, this assumption is for convenience of description and the present invention is not limited thereto and may be applied to various services that bundle and search a plurality of web pages into one bundled page.

도 5는 본 발명의 바람직한 실시예에 따른 묶음 검색 결과를 설명하기 위한 도면이다.5 is a view for explaining a bundle search results according to a preferred embodiment of the present invention.

묶음 검색 결과 정보의 제공에 있어서, 노출순위는 사용자 입력 질의어 및 임의의 키워드와의 관련성, 그룹내의 문서의 수, 일정한 유효기간 동안 그룹내 문서 증가량, 그룹 및 그룹문서의 생성시각 또는 그룹별 사용자들의 열람 회수를 포함한 인기도 정보 등을 고려하여 변경될 수 있다. 이러한 관련성을 평가하기 위하여 사용자 입력 질의어 및 임의의 키워드의 해당 그룹내 출현빈도수, 미리 정의된 용어 분류 사전을 이용한 평가 기법 등이 활용될 수 있으며, 상기 인기도 정보는 해당 그룹내에서의 문서 조회수, 검색결과로 제공된 그룹에 대한 사용자 클릭횟수 등과 같은 반응, 일정시간동안 그룹내 생성된 데이터의 양을 고려하여 측정될 수 있다. In providing the bundled search result information, the exposure ranking is related to the user input query word and any keyword, the number of documents in the group, the amount of document increase in the group for a certain validity period, the generation time of the group and group documents or the users of each group. It may be changed in consideration of popularity information including the number of readings. In order to evaluate such relevance, the frequency of occurrence of a user input query word and an arbitrary keyword in a corresponding group, an evaluation technique using a predefined term classification dictionary, and the like may be utilized. As a result, the response may be measured in consideration of the amount of data generated in the group over a period of time, such as the number of user clicks on the provided group.

사용자는 사용자 단말기(110)에 출력된 묶음 검색 서비스를 제공하는 웹 페이지에서 질의어 입력 방식으로 입력창(510)에 질의어인 "psp"를 입력하고 '검색'을 선택하여 검색을 요청하면 묶음 검색 결과(530)가 출력된다. 도시된 묶음 검색 결과(530)는 정렬방식 메뉴(520)의 '네오랭킹순'으로 정렬된 것이다. 사용자는 필 요에 따라 정렬방식 메뉴(520)의 '관련글순'이나 '인기도순'을 선택하여 묶음 검색 결과(530)를 관련글순으로 또는 인기도순으로 정렬할 수 있다. When a user requests a search by inputting a query word "psp" into the input window 510 as a query input method on a web page providing a bundled search service output to the user terminal 110 and selecting 'search', the search result is bundled. 530 is output. The illustrated bundle search results 530 are sorted in 'neo ranking order' of the sorting menu 520. The user may sort the bundled search results 530 in order of relevance or popularity by selecting 'relevant article order' or 'popularity order' of the sorting menu 520 as needed.

묶음 검색 결과(530)는 효율적인 정보의 제공을 위하여 웹 문서의 그룹에 대한 명칭과 그 내부 게시물의 제목 등을 상하위 구조로 표시할 수 있다. 각 페이지 묶음들에 대한 정보(540)는 그 묶음의 분류정보 및 포함문서 수 등을 추가적으로 제공할 수 있으며, 사용자의 편의를 위해 각 묶음 내의 개별 문서에 대한 리스트(550)가 추가적으로 표시될 수 있다. 또한 효과적인 정보 제시를 위하여 각 페이지 묶음의 정보원에 대한 분류(560)를 추가적으로 제시할 수 있다. The bundled search result 530 may display a name of a group of web documents and a title of an internal post in a top and bottom structure in order to provide efficient information. The information 540 for each page bundle may additionally provide the classification information and the number of documents included in the bundle, and a list 550 of individual documents in each bundle may be additionally displayed for the user's convenience. . Also, in order to effectively present information, the classification 560 of the source of each page may be additionally presented.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the present invention, and those skilled in the art to which the present invention pertains may make various modifications and changes without departing from the essential characteristics of the present invention. Therefore, the embodiments disclosed in the present invention are not intended to limit the technical idea of the present invention but to describe the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. The protection scope of the present invention should be interpreted by the following claims, and all technical ideas within the equivalent scope should be interpreted as being included in the scope of the present invention.

이상에서 설명한 바와 같이 본 발명에 의하면, 인터넷 상의 웹 페이지의 정보를 검색하는 데에 있어서, 질의어를 포함하는 웹 페이지를 검색하는 단순한 방식에서 벗어나 다수의 웹 페이지들을 분석하여 위치정보 형식을 생성하고 이를 이용 하여 유사한 정보를 포함하는 웹 페이지를 묶어서 정보 검색에 이용함으로써 질의어와 관련된 정보를 포함하는 다수의 최상위의 웹 페이지 즉, 대표 페이지와 그 하위 페이지들을 묶어서 검색 결과로서 제공하여 사용자로 하여금 정확한 정보를 빠르게 검색하게 하는 검색 서비스를 제공할 수 있다.As described above, according to the present invention, in retrieving the information of the web page on the Internet, apart from a simple method of searching a web page including a query, a plurality of web pages are analyzed to generate a location information format and By grouping web pages that contain similar information and using them for information retrieval, a plurality of top-level web pages that contain information related to the query, that is, representative pages and sub-pages, are bundled and provided as a search result so that users can obtain accurate information. It can provide a search service that makes searching fast.

Claims (22)

(a) 수집된 데이터로부터 그 데이터가 존재하였던 위치정보를 분석하여 상기 위치정보의 형식을 생성하는 단계;(a) analyzing the location information of the collected data from the collected data to generate a format of the location information; (b) 상기 생성된 위치정보의 형식에 따라 상기 수집된 데이터를 그룹별로 묶는 단계; 및(b) grouping the collected data into groups according to a format of the generated location information; And (c) 상기 묶여진 그룹에서 임의의 키워드와 관련된 그룹을 선택하여, 묶음 검색결과를 제공하는 단계를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.(c) selecting a group related to any keyword from the bundled group, and providing a bundled search result. 제1항에 있어서, The method of claim 1, 상기 위치정보는 수집된 데이터의 URL(Uniform Resource Locator) 정보를 포함하고, 상기 위치정보 형식은 상기 수집된 데이터들이 공유하는 소정의 형식으로서 상기 데이터들을 묶기 위한 묶음 필드를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.The location information includes URL (Uniform Resource Locator) information of the collected data, the location information format is a predetermined format shared by the collected data, characterized in that it comprises a bundle field for binding the data How to Provide Search Services. 제1항 또는 제2항에 있어서, 상기 (b) 단계는 The method of claim 1 or 2, wherein step (b) (b1) 서로 다른 다수의 상기 위치정보 형식을 위치정보 형식트리 정보를 이용하여 다수의 상기 위치정보 형식 간의 관계를 설정하여 묶어 상기 위치정보 형식의 묶음을 생성하는 단계; 및(b1) generating a bundle of the location information formats by combining a plurality of different location information formats by establishing a relationship between the plurality of location information formats using location information format tree information; And (b2) 상기 위치정보 형식의 묶음 중에 상기 위치정보 형식의 묶음 필드 값을 기준으로 상기 웹 페이지들을 그룹으로 묶는 단계(b2) grouping the web pages into groups based on a bundle field value of the location information format among the bundles of the location information format; 를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.Bundle search service providing method comprising a. 제1항 또는 제2항에 있어서,The method according to claim 1 or 2, 상기 (c) 단계의 묶음 검색 결과는, 상기 각 그룹과 상기 임의의 키워드와의 관련 정도, 소정 기간내에서 생성된 문서들의 수 및 그룹별 열람 회수 들 중 적어도 하나를 고려하여 정렬되는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.The bundle search result of step (c) is arranged in consideration of at least one of the degree of association between each group and the keyword, the number of documents generated within a predetermined period, and the number of readings of each group. How to provide a bundled search service. 제3항에 있어서,The method of claim 3, 상기 (c) 단계의 묶음 검색 결과는, 상기 각 그룹과 상기 임의의 키워드와의 관련 정도, 소정 기간내에서 생성된 문서들의 수 및 그룹별 열람 회수 들 중 적어도 하나를 고려하여 정렬되는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.The bundle search result of step (c) is arranged in consideration of at least one of the degree of association between each group and the keyword, the number of documents generated within a predetermined period, and the number of readings of each group. How to provide a bundled search service. 제1항에 있어서, 상기 (a) 단계 이전에 The method of claim 1, wherein before step (a) 인터넷 상의 데이터들을 미리 수집하여 색인화 하는 단계를 더 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법A method of providing a bundled search service further comprising the step of collecting and indexing data on the Internet in advance. 질의어를 송신하고 검색 결과를 출력하는 사용자 단말기, 다수의 웹 페이지를 제공하는 웹 서버 및 상기 사용자 단말기로부터 상기 질의어를 수신하여 상기 검색 결과를 생성하고 상기 사용자 단말기로 송신하는 묶음 검색 서버를 포함하는 시스템에서 정보를 검색하는 서비스를 제공하는 방법에 있어서,A system comprising a user terminal for transmitting a query and outputting a search result, a web server for providing a plurality of web pages, and a bundled search server for receiving the query from the user terminal, generating the search result, and transmitting the search result to the user terminal. In the method for providing a service for retrieving information in, (a) 상기 사용자 단말기로부터 상기 질의어 및 검색 요청 신호를 수신하는 단계;(a) receiving the query word and the search request signal from the user terminal; (b) 상기 웹 서버로부터 상기 다수의 웹 페이지를 수신하는 단계;(b) receiving the plurality of web pages from the web server; (c) 상기 다수의 웹 페이지를 분석하여 URL(Uniform Resource Locator) 형식을 생성하고, 상기 URL 형식을 이용하여 상기 다수의 웹 페이지를 묶는 단계;(c) analyzing the plurality of web pages to generate a Uniform Resource Locator (URL) format, and grouping the plurality of web pages using the URL format; (d) 상기 단계 (c)에서 묶인 웹 페이지의 묶음으로부터 색인어를 추출하여 색인어 정보 및 상기 색인어가 참조하는 웹 페이지 묶음의 URL 정보를 생성하는 단계; 및(d) extracting an index word from a bundle of web pages bundled in step (c) to generate index word information and URL information of a web page bundle referred to by the index word; And (e) 상기 질의어를 상기 색인어와 비교하여 묶음 검색 결과 정보를 생성한 후 상기 사용자 단말기로 송신하는 단계를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.(e) generating the bundled search result information by comparing the query word with the index word and transmitting the generated search result information to the user terminal. 제7항에 있어서, 상기 (c) 단계는,The method of claim 7, wherein step (c) is (c1) 상기 다수의 웹 페이지를 분석하여 다수의 URL 형식을 생성하는 단계;(c1) analyzing the plurality of web pages to generate a plurality of URL formats; (c2) 서로 다른 다수의 상기 URL 형식을 URL 형식 트리(UP Tree: URL Pattern Tree) 정보를 이용하여 다수의 상기 URL 형식 간의 관계를 설정하여 묶음으로써 상기 URL 형식의 묶음을 생성하는 단계; 및(c2) generating a bundle of the URL formats by setting and grouping a plurality of different URL formats by using a URL Pattern Tree (UP Tree) information; And (c3) 상기 URL 형식의 묶음 필드 값을 기준으로 웹 페이지들을 상기 웹 페이 지의 그룹으로서 묶는 단계를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.(c3) grouping the web pages as a group of the web pages based on the bundle field value of the URL format. 제7항에 있어서, 상기 단계 (d)는,The method of claim 7, wherein step (d) is (d1) 상기 웹 페이지의 묶음에 포함된 다수의 웹 페이지로부터 색인어를 추출하여 색인어 정보를 생성하고 묶음 검색 데이터베이스(DB: Database, 이하 'DB'라 칭함)에 저장하는 단계; 및 (d1) extracting index words from a plurality of web pages included in the bundle of web pages to generate index word information and storing the index words in a bundled search database (DB); And (d2) 상기 색인어가 참조하는 상기 웹 페이지 묶음의 URL 정보를 상기 색인어와 대응되도록 상기 묶음 검색 DB에 저장하는 단계를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.and (d2) storing the URL information of the web page bundle referred to by the index word in the bundle search DB to correspond to the index word. 제7항에 있어서, 상기 단계 (e)는,The method of claim 7, wherein step (e) (e1) 상기 질의어와 관련된 상기 색인어를 검색하는 단계;(e1) retrieving the index word related to the query word; (e2) 상기 단계 (e1)에서 검색한 상기 색인어가 참조하는 상기 웹 페이지 묶음의 URL 정보를 검색하는 단계;(e2) retrieving URL information of the web page bundle referred to by the index word retrieved in step (e1); (e3) 상기 단계 (e2)에서 검색한 상기 웹 페이지 묶음의 URL 정보를 묶음 검색 결과 정보로서 생성하는 단계; 및(e3) generating URL information of the web page bundle retrieved in step (e2) as bundle search result information; And (e4) 상기 묶음 검색 결과 정보를 상기 사용자 단말기로 송신하는 단계를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.and (e4) transmitting the bundled search result information to the user terminal. 제7항 내지 제10항 중 어느 한 항에 있어서, The method according to any one of claims 7 to 10, 상기 (e) 단계에서 묶음 검색 결과 정보는, 상기 각 그룹과 상기 임의의 키워드와의 관련 정도, 소정 기간내에서 생성된 문서들의 수 및 그룹별 열람 회수 들 중 적어도 하나를 고려하여 정렬되는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.In the step (e), the bundled search result information is arranged in consideration of at least one of the degree of association between each group and the keyword, the number of documents generated within a predetermined period, and the number of readings of each group. To provide a bundled search service. 유무선 통신망 상의 다수의 웹 페이지(Web Page) 내의 정보를 검색하여 검색 결과를 제공하는 시스템에 있어서,In a system for searching for information in a plurality of Web pages (Wired and Wireless) on a wired and wireless network to provide a search result, 상기 유무선 통신망을 이용하여 웹 서핑(Web Surfing)을 수행하고 질의어 정보 및 검색 요청 신호를 송신하여 검색을 요청하며 상기 검색의 요청에 대한 묶음 검색 결과 정보를 수신하여 구비된 화면에 출력하는 사용자 단말기; A user terminal performing web surfing using the wired / wireless communication network, requesting a search by transmitting query information and a search request signal, and receiving and outputting a bundled search result information for the search request; 상기 정보를 상기 다수의 웹 페이지로서 구성하여 생성하고 제공하는 웹 서버; 및A web server configured to generate and provide the information as the plurality of web pages; And 상기 다수의 웹 페이지를 수신하고 분석하여 URL 형식(Uniform Resource Locator Pattern)을 생성하고, 상기 다수의 웹 페이지들을 상기 URL 형식을 이용하여 묶어서 웹 페이지의 묶음 단위로 색인하며, 상기 웹 페이지의 묶음 단위로 상기 정보를 검색하여 상기 묶음 검색 결과 정보를 생성한 후 상기 사용자 단말기로 송신하는 묶음 검색 서버를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 시스템.Receive and analyze the plurality of web pages to generate a Uniform Resource Locator Pattern (URL), group the plurality of web pages using the URL format and index them in a bundle unit of the web page, unit of the bundle of the web page And a bundle search server for generating the bundle search result information by searching the information and transmitting the bundle search result information to the user terminal. 제12항에 있어서, 상기 묶음 검색 서버는,The method of claim 12, wherein the bundled search server, 웹 페이지 수집 프로그램을 실행하여 상기 유무선 통신망에 접속한 상기 웹 서버에 의해 제공되는 상기 다수의 웹 페이지들을 상기 웹 서버로부터 수신하여 저장하는 웹 페이지 수집 모듈;A web page collection module which executes a web page collection program and receives and stores the plurality of web pages provided by the web server connected to the wired / wireless communication network from the web server; 상기 웹 페이지 수집 모듈에 의해 수신된 상기 다수의 웹 페이지들을 분석하여 상기 URL 형식을 생성하는 URL 형식 생성 모듈;A URL format generation module for analyzing the plurality of web pages received by the web page collection module to generate the URL format; 상기 URL 형식 생성 모듈에 의해 생성된 상기 URL 형식을 이용하여 상기 다수의 웹 페이지를 웹 페이지의 묶음으로 묶는 페이지 묶음 모듈;A page bundle module which bundles the plurality of web pages into bundles of web pages using the URL format generated by the URL format generation module; 상기 페이지 묶음 모듈에 의해 묶인 상기 웹 페이지의 묶음으로부터 색인어를 추출하여 색인어 정보 및 상기 색인어가 참조하는 웹 페이지 묶음의 URL 정보를 생성하여 저장하는 색인 관리 모듈;An index management module that extracts an index word from a bundle of the web pages bundled by the page bundle module and generates and stores index word information and URL information of a web page bundle referenced by the index word; 상기 사용자 단말기로부터 상기 질의어 및 상기 정보 검색 요청 신호를 수신하면 상기 색인어 정보를 검색하여 상기 질의어와 관련된 색인어를 갖는 상기 웹 페이지 묶음의 URL 정보를 묶음 검색 결과 정보로서 생성한 후 상기 사용자 단말기로 송신하는 질의 관리 모듈; 및When the query word and the information search request signal are received from the user terminal, the index word information is searched to generate URL information of the web page bundle having the index word related to the query word as bundle search result information and then transmitted to the user terminal. Query management module; And 상기 묶음 검색 서버가 상기 웹 페이지의 묶음을 이용하여 검색을 수행하도록 상기 웹 페이지 수집 모듈, URL 형식 생성 모듈, 페이지 묶음 모듈, 색인 관리 모듈 및 질의 관리 모듈을 제어하고, 상기 묶음 검색 서버가 상기 유무선 통신망을 이용하여 상기 사용자 단말기 및 상기 웹 서버와 통신을 수행하도록 제어하는 제어부를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 시스템.The bundle search server controls the web page collection module, the URL format generation module, the page bundle module, the index management module, and the query management module to perform a search by using the bundle of the web pages, and the bundle search server controls the wired / wireless network. And a control unit for controlling communication with the user terminal and the web server using a communication network. 제12항에 있어서, 상기 URL 형식 생성 모듈은,The method of claim 12, wherein the URL format generation module, 상기 URL 형식을 상기 웹 페이지들을 묶기 위한 기준으로서 상기 웹 페이지들 중에서 유사한 정보를 갖는 웹 페이지들이 공유하는 소정의 형식으로 생성하되, 상기 URL 형식은 상기 웹 페이지들을 묶기 위한 묶음 필드를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 시스템.The URL format is generated in a predetermined format shared by web pages having similar information among the web pages as a criterion for grouping the web pages, wherein the URL format includes a bundle field for grouping the web pages. System for providing a bundled search service. 제12항에 있어서, 상기 페이지 묶음 모듈은,The method of claim 12, wherein the page bundle module, 서로 다른 다수의 상기 URL 형식을 URL 형식 트리(UP Tree: URL Pattern Tree) 정보를 이용하여 다수의 상기 URL 형식 간의 관계를 설정한 후 묶어 상기 URL 형식의 묶음을 생성하고 상기 URL 형식의 묶음 중에 상기 URL 형식의 묶음 필드 값이 동일한 웹 페이지들을 상기 웹 페이지의 그룹으로서 묶는 것을 특징으로 하는 묶음 검색 서비스 제공 시스템.A plurality of different URL formats may be set after establishing a relationship between the plurality of URL formats using URL pattern tree (UP Tree) information to generate a bundle of the URL formats, and the bundle of URL formats may be generated. A bundle search service providing system, characterized by grouping web pages having the same bundle field value in URL format as a group of the web pages. 제12항에 있어서, 상기 페이지 묶음 모듈은,The method of claim 12, wherein the page bundle module, 상기 URL 형식의 묶음 필드를 'AND' 또는 'OR'로 조합한 값이 동일한 웹 페이지들을 상기 웹 페이지 그룹으로서 묶는 것을 특징으로 하는 묶음 검색 서비스 제공 시스템.And grouping web pages having the same value by combining the bundle field of the URL format as 'AND' or 'OR' as the web page group. 제12항에 있어서, 상기 색인 관리 모듈은,The method of claim 12, wherein the index management module, 상기 웹 페이지의 묶음 내의 다수의 웹 페이지로부터 색인어를 추출하여 색인어 정보를 생성한 후 저장하고, 상기 색인어가 참조하는 상기 웹 페이지 묶음의 URL 정보를 생성하여 상기 색인어와 대응되도록 저장하는 것을 특징으로 하는 묶음 검색 서비스 제공 시스템.Extracting index words from a plurality of web pages in the bundle of web pages to generate index word information, and storing the index word information, and generating URL information of the web page bundle referred to by the index word and storing the index information so as to correspond to the index word Bundled search service provision system. 제12항에 있어서, 상기 묶음 검색 서비스 제공 시스템은,The system of claim 12, wherein the bundled search service providing system comprises: 상기 묶음 검색 서버로부터 수신한 상기 색인어 정보를 저장하는 색인 데이터베이스(DB: Database, 이하 'DB'라 칭함) 및 상기 웹 페이지 묶음의 URL 정보를 저장하는 URL DB를 포함하는 묶음 검색 DB를 더 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 시스템.Further comprising a bundled search DB including an index database (DB: Database, hereinafter referred to as "DB") for storing the index word information received from the bundled search server and a URL DB for storing URL information of the web page bundle. Bundled search service providing system, characterized in that. 수집된 데이터로부터 그 데이터가 위치하였던 위치정보를 분석하여 상기 위치정보의 형식을 생성하는 위치정보 형식 생성 모듈;A location information format generation module for analyzing the location information where the data is located from the collected data to generate the format of the location information; 상기 생성된 위치정보의 형식에 따라 상기 수집된 데이터를 그룹별로 묶는 페이지 묶음 모듈; 및A page bundle module for grouping the collected data into groups according to a format of the generated location information; And 상기 묶여진 그룹에서 임의의 키워드와 관련된 그룹을 선택하여, 묶음 검색결과를 제공하는 제어부를 포함하는 것을 특징으로 하는 묶음 검색 서버.And a control unit for selecting a group related to an arbitrary keyword from the bundled group and providing a bundled search result. 제19항에 있어서,The method of claim 19, 상기 위치정보는 수집된 데이터의 URL(Uniform Resource Locator) 정보를 포 함하고, 상기 위치정보 형식은 상기 수집된 데이터들이 공유하는 소정의 형식으로서 상기 데이터들을 묶기 위한 묶음 필드를 포함하는 것을 특징으로 하는 묶음 검색 서비스 제공 방법.The location information includes Uniform Resource Locator (URL) information of the collected data, and the location information format is a predetermined format shared by the collected data, and includes a bundle field for binding the data. How to provide a bundled search service. 유무선 통신망을 이용하여 웹 서핑(Web Surfing)을 수행하는 사용자 단말기로부터 질의어 및 검색 요청 신호를 수신하면 웹 서버에 의해 제공되는 웹 페이지 상의 정보를 검색하여 검색 결과를 상기 사용자 단말기로 송신하는 검색 서비스를 제공하는 서버에 있어서,Receiving a query and a search request signal from a user terminal performing web surfing using a wired / wireless communication network, a search service for searching for information on a web page provided by a web server and transmitting a search result to the user terminal In the providing server, 웹 페이지 수집 프로그램을 실행하여 상기 유무선 통신망에 접속한 상기 웹 서버에 의해 제공되는 상기 다수의 웹 페이지들을 읽어서 상기 웹 서버로부터 수신하여 저장하는 웹 페이지 수집 모듈; A web page collection module which executes a web page collection program and reads and stores the plurality of web pages provided by the web server connected to the wired / wireless communication network from the web server; 상기 웹 페이지 수집 모듈에 의해 수신된 상기 다수의 웹 페이지들을 분석하여 상기 URL 형식을 생성하는 URL 형식 생성 모듈;A URL format generation module for analyzing the plurality of web pages received by the web page collection module to generate the URL format; 상기 URL 형식 생성 모듈에 의해 생성된 상기 URL 형식을 이용하여 상기 다수의 웹 페이지를 웹 페이지의 묶음으로 묶는 페이지 묶음 모듈;A page bundle module which bundles the plurality of web pages into bundles of web pages using the URL format generated by the URL format generation module; 상기 페이지 묶음 모듈에 의해 묶인 상기 웹 페이지의 묶음으로부터 색인어를 추출하여 색인어 정보 및 상기 색인어가 참조하는 웹 페이지 묶음의 URL 정보를 생성하여 저장하는 색인 관리 모듈;An index management module that extracts an index word from a bundle of the web pages bundled by the page bundle module and generates and stores index word information and URL information of a web page bundle referenced by the index word; 상기 사용자 단말기로부터 상기 질의어 및 상기 정보 검색 요청 신호를 수신하면 상기 색인어 정보를 검색하여 상기 질의어와 관련된 색인어를 갖는 상기 웹 페이지 묶음의 URL 정보를 묶음 검색 결과 정보로서 생성한 후 상기 사용자 단말기로 송신하는 질의 관리 모듈; 및When the query word and the information search request signal are received from the user terminal, the index word information is searched to generate URL information of the web page bundle having the index word related to the query word as bundle search result information and then transmitted to the user terminal. Query management module; And 상기 묶음 검색 서버가 상기 웹 페이지의 묶음을 이용하여 검색을 수행하도록 상기 웹 페이지 수집 모듈, URL 형식 생성 모듈, 페이지 묶음 모듈, 색인 관리 모듈 및 질의 관리 모듈을 제어하고, 상기 묶음 검색 서버가 상기 유무선 통신망을 이용하여 상기 사용자 단말기 및 상기 웹 서버와 통신을 수행하도록 제어하는 제어부를 포함하는 것을 특징으로 하는 묶음 검색 서버.The bundle search server controls the web page collection module, the URL format generation module, the page bundle module, the index management module, and the query management module to perform a search by using the bundle of the web pages, and the bundle search server controls the wired / wireless network. And a control unit for controlling communication with the user terminal and the web server using a communication network. 제21항에 있어서, 상기 묶음 검색 서버는,The method of claim 21, wherein the bundled search server, 상기 묶음 검색 서버로부터 수신한 상기 색인어 정보를 저장하는 색인 데이터베이스(DB: Database, 이하 'DB'라 칭함) 및 상기 웹 페이지 묶음의 URL 정보를 저장하는 URL DB를 포함하는 묶음 검색 DB를 더 포함하는 것을 특징으로 하는 묶음 검색 서버.Further comprising a bundled search DB including an index database (DB: Database, hereinafter referred to as "DB") for storing the index word information received from the bundled search server and a URL DB for storing URL information of the web page bundle. Bundle search server, characterized in that.
KR20060020346A 2005-03-04 2006-03-03 Server, Method and System for Providing Information Search Service by Using Sheaf of Pages KR100671077B1 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
PCT/KR2006/000739 WO2006107141A1 (en) 2005-03-04 2006-03-03 Server, method and system for providing information search service by using sheaf of pages
CN2006800066318A CN101133415B (en) 2005-03-04 2006-03-03 Server, method and system for providing information search service by using sheaf of pages
JP2007557935A JP4769822B2 (en) 2005-03-04 2006-03-03 Information search service providing server, method and system using page group
CN201210008279.9A CN102622402B (en) 2005-03-04 2006-03-03 Server, method and system for providing information search service by using sheaf of pages
US11/849,982 US20080021889A1 (en) 2005-03-04 2007-09-04 Server, method and system for providing information search service by using sheaf of pages
US16/681,183 US20200175081A1 (en) 2005-03-04 2019-11-12 Server, method and system for providing information search service by using sheaf of pages

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020050018309 2005-03-04
KR20050018309 2005-03-04

Publications (2)

Publication Number Publication Date
KR20060096356A KR20060096356A (en) 2006-09-11
KR100671077B1 true KR100671077B1 (en) 2007-01-17

Family

ID=37623990

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20060020346A KR100671077B1 (en) 2005-03-04 2006-03-03 Server, Method and System for Providing Information Search Service by Using Sheaf of Pages

Country Status (3)

Country Link
JP (1) JP4769822B2 (en)
KR (1) KR100671077B1 (en)
CN (2) CN102622402B (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892537B2 (en) 2009-07-15 2014-11-18 Neopad Inc. System and method for providing total homepage service

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5588981B2 (en) * 2008-08-01 2014-09-10 グーグル・インコーポレーテッド Providing posts to discussion threads in response to search queries
WO2015074455A1 (en) * 2013-11-25 2015-05-28 北京奇虎科技有限公司 Method and apparatus for computing url pattern of associated webpage
CN106663108B (en) * 2014-06-25 2020-08-04 谷歌有限责任公司 Deep links for native applications
CN104158890B (en) * 2014-08-21 2018-05-22 广州品唯软件有限公司 The advisory feedback method and device of e-commerce website
KR101647596B1 (en) * 2015-04-20 2016-08-10 숭실대학교산학협력단 Method and server for providing contents service
CN105045684B (en) * 2015-07-16 2018-06-15 北京京东尚科信息技术有限公司 Index switching and the method and device of index control

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934911A (en) * 1995-07-18 1997-02-07 Fuji Xerox Co Ltd Information retrieval device
JP2001134616A (en) * 1999-10-25 2001-05-18 Nec Corp Method and system for constructing web information on specific topic
JP2001306947A (en) * 2000-04-20 2001-11-02 Ntt Data Corp System and method for analyzing access and recording medium
CN1439135A (en) * 2000-05-01 2003-08-27 R.R.唐纳利父子公司 Methods and apparatus for serving a web page to a client device based on printed publications and publisher controlled links
KR20010104871A (en) * 2000-05-16 2001-11-28 임갑철 System for internet site search service having a function of automatic sorting of search results
KR100643979B1 (en) * 2000-05-18 2006-11-13 엘지전자 주식회사 Information providing method for information searching result in an internet
JP2002288074A (en) * 2001-03-28 2002-10-04 Nec Corp Electronic communication system, electronic communication method, and computer program
JP3922693B2 (en) * 2002-06-17 2007-05-30 Necシステムテクノロジー株式会社 Internet information retrieval system
JP4231298B2 (en) * 2003-01-14 2009-02-25 日本電信電話株式会社 Information extraction rule creation system, information extraction rule creation program, information extraction system, and information extraction program
JP2004341942A (en) * 2003-05-16 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> Content classification method, content classification device, content classification program, and storage medium storing content classification program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892537B2 (en) 2009-07-15 2014-11-18 Neopad Inc. System and method for providing total homepage service

Also Published As

Publication number Publication date
CN102622402A (en) 2012-08-01
JP2008537809A (en) 2008-09-25
CN101133415B (en) 2012-03-21
KR20060096356A (en) 2006-09-11
JP4769822B2 (en) 2011-09-07
CN101133415A (en) 2008-02-27
CN102622402B (en) 2014-12-03

Similar Documents

Publication Publication Date Title
US20200311155A1 (en) Systems for and methods of finding relevant documents by analyzing tags
US20080065632A1 (en) Server, method and system for providing information search service by using web page segmented into several inforamtion blocks
CN103177075B (en) The detection of Knowledge based engineering entity and disambiguation
US7809716B2 (en) Method and apparatus for establishing relationship between documents
US9268873B2 (en) Landing page identification, tagging and host matching for a mobile application
TWI391834B (en) Systems for and methods of finding relevant documents by analyzing tags
KR101463974B1 (en) Big data analysis system for marketing and method thereof
CN101986306B (en) Method and equipment for acquiring yellow page information based on query sequence
US20200175081A1 (en) Server, method and system for providing information search service by using sheaf of pages
US8990193B1 (en) Method, system, and graphical user interface for improved search result displays via user-specified annotations
US20100161592A1 (en) Query Intent Determination Using Social Tagging
WO2007051397A1 (en) An information retrieval system and information retrieval method
KR100671077B1 (en) Server, Method and System for Providing Information Search Service by Using Sheaf of Pages
US20100131485A1 (en) Method and system for automatic construction of information organization structure for related information browsing
US20080201317A1 (en) Ranking documents
US20070271228A1 (en) Documentary search procedure in a distributed system
US20110208715A1 (en) Automatically mining intents of a group of queries
US20100005088A1 (en) Using An Encyclopedia To Build User Profiles
US20110238653A1 (en) Parsing and indexing dynamic reports
US20160103913A1 (en) Method and system for calculating a degree of linkage for webpages
US8645315B2 (en) Bookmark extracting apparatus, method and computer program
JP4430598B2 (en) Information sharing system and information sharing method
Jadidoleslamy Search result merging and ranking strategies in meta-search engines: a survey
JP2009205588A (en) Page search system and program
KR20010095215A (en) Method for retrieving data on internet through constructing site information database

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111228

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131224

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141230

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151228

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170105

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180109

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 14