KR100906927B1 - Method and system for offering branch office search - Google Patents

Method and system for offering branch office search Download PDF

Info

Publication number
KR100906927B1
KR100906927B1 KR1020070029456A KR20070029456A KR100906927B1 KR 100906927 B1 KR100906927 B1 KR 100906927B1 KR 1020070029456 A KR1020070029456 A KR 1020070029456A KR 20070029456 A KR20070029456 A KR 20070029456A KR 100906927 B1 KR100906927 B1 KR 100906927B1
Authority
KR
South Korea
Prior art keywords
search
branch
point
site
keyword
Prior art date
Application number
KR1020070029456A
Other languages
Korean (ko)
Other versions
KR20080087358A (en
Inventor
강춘식
최병엽
양주영
정영희
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020070029456A priority Critical patent/KR100906927B1/en
Publication of KR20080087358A publication Critical patent/KR20080087358A/en
Application granted granted Critical
Publication of KR100906927B1 publication Critical patent/KR100906927B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 지점검색 제공 방법 및 상기 방법을 수행하기 위한 시스템에 관한 것이다. 본 발명에 따른 지점검색 제공 방법은 입력된 검색키워드를 이용하여 사이트 색인 검색을 수행하는 단계, 검색된 상기 해당 사이트를 크롤(crawl)하는 단계, 상기 크롤된 웹데이터로부터 지점정보를 수집하는 단계 및 상기 수집된 지점정보에 따른 지점검색 결과를 제공하는 단계를 포함한다. 상기 크롤된 웹데이터로부터 지점정보를 수집하는 상기 단계는 상기 크롤된 웹데이터를 이용하여 지점 페이지지수를 계산하는 단계, 상기 계산한 지점 페이지지수를 임계값과 비교하는 단계 및 상기 크롤된 웹데이터로부터 수집한 지점정보를 조직화하는 단계를 포함한다.The present invention relates to a method for providing a point search and a system for performing the method. In accordance with an aspect of the present invention, there is provided a method of providing a branch search by performing a site index search using an input search keyword, crawling the searched corresponding site, collecting branch information from the crawled web data, and And providing a point search result according to the collected point information. The step of collecting branch information from the crawled web data includes the steps of calculating a branch page index using the crawled web data, comparing the calculated branch page index with a threshold value and the crawled web data. Organizing the collected branch information.

지점 검색, 지점 페이지지수, 지점검색 키워드, 검색키워드 카운터, 웹데이터 Branch Search, Branch Page Index, Branch Search Keyword, Search Keyword Counter, Web Data

Description

지점검색 제공 방법 및 시스템 {METHOD AND SYSTEM FOR OFFERING BRANCH OFFICE SEARCH}METHOD AND SYSTEM FOR OFFERING BRANCH OFFICE SEARCH}

도 1은 검색키워드가 지점검색 키워드인지 판단하고, 검색키워드의 검색 결과를 제공하는 본 발명의 전체적인 개요를 도시한 도면이다.1 is a diagram illustrating an overall outline of the present invention for determining whether a search keyword is a branch search keyword and providing a search result of the search keyword.

도 2는 본 발명의 일실시예에 있어서, 입력받은 검색키워드에 대해서 지점검색을 하는 과정을 나타낸 순서도를 도시한 도면이다.FIG. 2 is a flowchart illustrating a process of performing a point search on an input search keyword according to an embodiment of the present invention.

도 3은 본 발명의 일실시예에 있어서, 사이트에서 크롤한 웹데이터로부터 지점정보를 수집하는 과정을 나타낸 순서도를 도시한 도면이다.3 is a flowchart illustrating a process of collecting branch information from web data crawled from a site according to an embodiment of the present invention.

도 4는 수집된 지점정보에 따른 지점검색 결과를 제공하는 것을 도시한 도면이다.4 is a diagram illustrating providing a point search result according to the collected point information.

도 5는 본 발명의 일실시예에 있어서, 지점검색 시스템의 구성을 도시한 도면이다.5 is a diagram illustrating a configuration of a point search system according to an embodiment of the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

501: 지점검색 시스템501: branch search system

502: 검색키워드 카운터502: search keyword counter

503: 지점검색 키워드 판단부503: branch search keyword determination unit

506: 지점정보 수집부506: branch information collection unit

508: 지점 페이지지수 비교부508: branch page index comparison unit

본 발명은 지점검색 방법 및 시스템에 관한 것이고, 보다 상세하게는 검색키워드가 지점검색 키워드 대상으로 판단된 경우, 해당 사이트 페이지를 검색하고 크롤한 웹데이터로부터 수집한 지점정보를 이용하여 검색결과를 제공하는 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for a branch search, and more particularly, when a search keyword is determined to be a branch search keyword, a search result is searched using the branch information collected from the crawled web data. To a method and system.

종래에는 검색키워드의 지점을 검색하기 위해서는 검색요청자가 검색키워드에 지역명을 결합하여 검색해야 했다. 이 경우 상기 지역에 지점이 존재하지 않는 경우 의도한 것과 다른 결과를 노출시키는 상황이 발생할 수 있고, 검색어의 길이가 길어짐에 따라 검색 서버의 처리부담도 증대되는 문제점이 있었다. Conventionally, in order to search for a point of a search keyword, a search requester has to search by combining a region name with a search keyword. In this case, when a branch does not exist in the region, a situation in which a result different from the intended one may be exposed may occur, and as the length of the search word is increased, the processing burden of the search server may be increased.

또한 검색요청자가 정확한 지점명과 검색키워드를 결합하여 검색하는 경우를 논외로 하고, 일반적으로 검색키워드의 지점을 검색하기 위해서는 검색키워드로 검색한 후 해당 사이트 내부에서 찾거나 다시 지점이 위치한 정확한 지역명을 병기하여 검색할 수 밖에 없는 문제점이 있었다.In addition, except that the search requester searches by combining the exact branch name and the search keyword, and generally, in order to search for the branch of the search keyword, the search keyword is searched inside the site or the exact local name where the branch is located again. There was a problem that can only be searched in parallel.

예를 들어, 피자주문을 하기 위해 "피자헛"이라는 검색키워드를 입력하는 경우 검색요청자의 의도는 "피자헛"이라는 업체의 내용과 설명보다는 주문한 위치와 가까운 지점의 정보를 얻기 위한 목적이 크다고 할 수 있다. 특히 지점이 전국적으로 많은 경우 주문하기 위해 검색요청자의 현재 위치와 가장 가까운 지점의 연락 처나 주소정보를 얻기 위해서는 "피자헛" 사이트에서 별도로 지점 정보를 서치할 수 밖에 없는 불편함이 있었다. 다시 말해 보통 사용자가 지점이나 체인점이 많은 검색키워드를 입력하는 것은 지점이나 체인점의 정보를 얻기 위한 의도도 포함될 수 있기 때문에, 사용자가 검색키워드만을 입력하더라도 지점정보를 자동으로 검색해주는 것이 필요했다. For example, if you enter the search keyword "pizza hut" to place a pizza order, the search requester's intention is to get information near the place you ordered rather than the description and description of the company "pizza hut." Can be. In particular, when there are many branches nationwide, in order to obtain contact information or address information of the branch closest to the current location of the search requester, it is inconvenient to search the branch information separately on the "pizza hut" site. In other words, since a user inputs a search keyword with many points or chain stores, it may also include an intention to obtain information of a branch or chain store. Therefore, it is necessary to automatically search for branch information even if the user inputs only a search keyword.

이를 대처하기 위한 발명도 있으나 검색 대상이 모든 키워드이고, 데이터 지점 정보를 조직화하는 방법도 단순히 웹데이터에 주소, 전화번호가 있는 모든 경우에도 그룹화하는 것이라서 해당 사이트와의 내용면에서 관련성이 떨어질 수 밖에 없었다.There is an invention to cope with this problem, but the search target is all keywords, and the method of organizing data point information is also simply related to the content of the site because it is grouped even if all the addresses and phone numbers are included in the web data. There was no.

따라서, 검색키워드만을 입력하더라도 소정의 조건을 만족하는 경우 지점정보를 함께 제공하는 방법이 절실히 필요했다.Therefore, even if only a search keyword is input, a method of providing point information together when a predetermined condition is satisfied is urgently needed.

본 발명은 상술한 바와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로서, 본 발명은 검색키워드를 입력하는 경우 지점검색 키워드 대상인지 판단하고, 검색키워드로 색인된 사이트로부터 수집한 지점정보를 이용하여 지점검색 결과를 제공하는 것을 목적으로 한다.The present invention has been made to solve the problems of the prior art as described above, the present invention is to determine whether the site search keyword target when entering a search keyword, by using the point information collected from the site indexed by the search keyword The purpose is to provide the results of the branch search.

본 발명에 따른 지점검색 제공 방법 및 시스템은 지역명과 검색키워드가 결합된 지점검색이 이전에 일정부분 수행된 검색키워드를 대상으로 하고, 상기 검색키워드로 색인된 사이트에서 크롤된 웹데이터에 지점을 명시하는 단어와 지역명이 존재하는 경우에 그룹화하여 지점 정보를 수집하는 것을 목적으로 한다.The method and system for providing a branch search according to the present invention targets a search keyword in which a branch search combining a region name and a search keyword has been previously performed, and specifies a branch in web data crawled from a site indexed with the search keyword. The purpose is to collect branch information by grouping words and area names if they exist.

본 발명에 따른 지점검색 제공 방법 및 시스템은 임계값을 초과하는 지점 페이지지수를 가진 해당 페이지에 대해서 지점 정보를 수집함으로써 좀더 연관도가 높은 정보를 조직화하는 것을 목적으로 한다.The method and system for providing a branch search according to the present invention aims to organize more relevant information by collecting branch information on a corresponding page having a branch page index exceeding a threshold.

상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명의 일실시예에 따른 지점검색 제공 방법은 입력된 검색키워드를 이용하여 사이트 색인 검색을 수행하는 단계, 검색된 상기 해당 사이트를 크롤(crawl)하는 단계, 상기 크롤된 웹데이터로부터 지점정보를 수집하는 단계 및 상기 수집된 지점정보에 따른 지점검색 결과를 제공하는 단계를 포함한다.In order to achieve the above object and to solve the above problems of the prior art, the method for providing a branch search according to an embodiment of the present invention performing a site index search using the input search keyword, the searched corresponding site Crawling (crawl), collecting point information from the crawled web data and providing a point search results according to the collected point information.

본 발명의 일측에 따르면, 상기 크롤된 웹데이터로부터 지점정보를 수집하는 상기 단계는 상기 크롤된 웹데이터를 이용하여 지점 페이지지수를 계산하는 단계, 상기 계산한 지점 페이지지수를 임계값과 비교하는 단계 및 상기 크롤된 웹데이터로부터 수집한 지점정보를 조직화하는 단계를 포함한다.According to one aspect of the invention, the step of collecting branch information from the crawled web data step of calculating a branch page index using the crawled web data, comparing the calculated branch page index with a threshold value And organizing branch information collected from the crawled web data.

본 발명의 다른 측면에 따르면, 상기 수집된 지점정보에 따른 지점검색 결과를 제공하는 상기 단계는 상기 지점정보를 이용하여 상기 지점검색 결과를 검색요청자로부터 가까운 위치 순서대로 제공하고, 상기 지점검색 결과를 검색요청자로부터 가까운 위치 순서대로 제공할 수 없는 경우 상기 지점검색 결과를 지점의 제목에 대해서 가나다순으로 정렬하여 제공하는 것을 특징으로 한다. According to another aspect of the present invention, the providing of the point search result according to the collected point information provides the point search results in the order of location close to the search requester using the point information, and provides the point search results. If it is not possible to provide in the order of location close to the search requester, it is characterized in that the branch search results are arranged in alphabetical order with respect to the title of the branch.

본 발명의 일실시예에 따른 지점검색 제공 시스템은 입력된 검색키워드를 이용하여 사이트 색인 검색을 수행하는 사이트 검색부, 검색된 상기 해당 사이트를 크롤하는 사이트 크롤부, 상기 크롤된 웹데이터로부터 지점정보를 수집하는 지점정보 수집부 및 상기 수집된 지점정보에 따른 지점검색 결과를 제공하는 검색결과 제공부를 포함한다. Site search providing system according to an embodiment of the present invention is a site search unit for performing a site index search using the input search keyword, the site crawler to crawl the searched the site, the branch information from the crawled web data It includes a point information collecting unit for collecting and a search result providing unit for providing a point search results according to the collected point information.

본 발명의 일측에 따르면, 상기 검색키워드가 지역명과 결합한 형태로 검색되는 경우에 검색키워드 부분을 집계하는 검색키워드 카운터 및 상기 검색키워드가 지점검색 키워드 대상인지 여부를 판단하는 지점검색 키워드 판단부를 더 포함하고, 상기 사이트 검색부는 상기 지점검색 키워드 판단부가 상기 검색키워드를 상기 지점검색 키워드 대상으로 판단하는 경우 입력된 상기 검색키워드를 이용하여 사이트 색인 검색을 수행하는 것을 특징으로 한다.According to an aspect of the present invention, the search keyword counter when the search keyword is searched in the form of combined with the region name further includes a search keyword counter and a branch search keyword determination unit for determining whether the search keyword is the target of the site search keyword. The site search unit may perform a site index search using the search keyword input when the site search keyword determination unit determines the search keyword as the target site keyword.

본 발명의 다른 측면에 따르면, 상기 크롤된 웹데이터로부터 지점정보를 수집하는 상기 지점정보 수집부는 상기 크롤된 웹데이터를 이용하여 지점 페이지지수를 계산하는 지점 페이지지수 계산부, 상기 계산한 지점 페이지지수를 임계값과 비교하는 지점 페이지지수 비교부 및 상기 크롤된 웹데이터로부터 수집한 지점정보를 조직화하는 지점정보 관리부를 포함한다.According to another aspect of the present invention, the branch information collection unit for collecting branch information from the crawled web data branch page index calculation unit for calculating a branch page index using the crawled web data, the calculated branch page index And a branch page index comparison unit comparing the threshold value with a threshold value and a branch information management unit organizing branch information collected from the crawled web data.

이하 첨부된 도면을 참조하여, 본 발명의 실시예에 대하여 구체적으로 설명한다. 본 발명의 일실시예에 따른 지점검색 제공 방법은 지점검색 제공 시스템에 의해 수행될 수 있다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. The method for providing a branch search according to an embodiment of the present invention may be performed by the branch search providing system.

도 1은 검색키워드가 지점검색 키워드인지 판단하고, 검색키워드의 검색 결과를 제공하는 본 발명의 전체적인 개요를 도시한 도면이다.1 is a diagram illustrating an overall outline of the present invention for determining whether a search keyword is a branch search keyword and providing a search result of the search keyword.

특정 사용자의 단말기(101)로부터 지역명과 검색키워드의 결합으로 이루어진 검색어(102)를 입력받으면 검색키워드 카운터(103)에서는 검색키워드 부분만 집계하여 카운팅할 수 있다. 지역명과 검색키워드의 결합으로 이루어진 검색어(102)는 지역명을 나타내는 "서울", "강남", "안양", "분당"과 검색키워드인 "롯데백화점"이 결합된 형태로 이루어져 있다. "롯데백화점"이 지역명과 결합하여 검색되는 빈도가 소정의 기준을 초과하면, 추후에 검색요청자가 검색키워드인 "롯데백화점"만으로 검색을 하더라도 상기 검색키워드의 지점정보를 검색결과로 제공할 수 있다. 사용자들이 검색키워드의 지점 등을 검색하기 위해 검색키워드에 지역명을 결합시켜 검색하는 패턴이 일정 빈도로 존재했다는 점을 이용한 것이다.When the search word 102 composed of a combination of a local name and a search keyword is received from the terminal 101 of a specific user, the search keyword counter 103 may count and count only the search keyword portion. The search word 102 formed of a combination of a local name and a search keyword is formed of a combination of "Seoul", "Gangnam", "Anyang", "Bundang" and a search keyword "Lotte department store" representing a local name. When the frequency of searching "Lotte Department Store" in combination with the area name exceeds a predetermined criterion, even if the search requester searches only with the search keyword "Lotte Department Store" in the future, the branch information of the search keyword may be provided as a search result. . This is based on the fact that there was a certain frequency of searching by combining the local name with the search keyword in order to search for the location of the search keyword.

추후에 검색요청자의 단말기(105)로부터 지역명이 결합되지 않은 검색키워드(106)를 입력받으면, 지점검색 키워드 판단부(104)는 예전에 검색키워드 카운터(103)이 카운팅한 수치를 이용하여 검색키워드가 지역명과 결합되어 검색되는 전체 지점검색에서 상기 검색키워드가 지역명과 결합하여 검색되는 지점검색의 비율이 소정의 기준을 초과하는지 판단할 수 있고, 기준을 초과하는 경우 검색요청자의 단말기(105)로부터 입력받은 검색키워드는 지점검색 키워드 대상이라고 판단될 수 있다. 예를 들면 소정의 기준치를 10%라고 정했을 때, 검색키워드와 지역명이 결합되어 검색되는 전체 지점검색 빈도가 100만회이라고 한다면, 검색요청자의 단말기(105)로부터 지역명이 결합되지 않은 검색키워드(106)인 "롯데백화점"을 입력받는 경우에, 입력받기 이전에 "서울 롯데백화점", "강남 롯데백화점", "안양 롯데백화점", "분당 롯데백화점" 등 "롯데백화점"과 지역명이 결합되어 검색되는 지점검색 빈도가 10만 이상이라면 "롯데백화점"이라는 검색키워드는 기준치를 초과하기 때문에 지점검색 키워드 대상이라고 판단할 수 있다. 만약 검색결과 제공하는 단계(107)에서 검색키워드의 지점검색 비율이 전체 지점검색의 소정의 기준치를 초과하는 경우 상기 검색키워드로 색인된 사이트와 상기 검색키워드에 대한 지점정보에 대한 결과를 제공하고, 초과하지 못하는 경우, 지점검색없이 단순히 검색키워드로 색인된 사이트의 검색결과를 제공할 수 있다. 좀더, 구체적인 지점 검색 방법에 대해서 도 2를 통해 살펴보기로 한다.Subsequently, when the search keyword 106 is inputted from the terminal 105 of the search requester and the region name is not combined, the branch search keyword determination unit 104 uses the numerical value previously counted by the search keyword counter 103. In the entire branch search that is searched by combining with the local name, it is possible to determine whether the ratio of the branch search searched by combining the search keyword with the local name exceeds a predetermined criterion. The input search keyword may be determined to be a target keyword for a branch search. For example, if the predetermined reference value is set to 10%, and the total frequency of the branch search where the search keyword and the local name are combined and searched is 1 million times, the search keyword 106 whose region name is not combined from the search requester's terminal 105 is selected. In case of inputting "Lotte Department Store", the name of "Lotte Department Store" and "Lotte Department Store" such as "Seoul Lotte Department Store", "Gangnam Lotte Department Store", "Anyang Lotte Department Store", and "Bundang Lotte Department Store" are searched before input. If the frequency of the branch search is 100,000 or more, the search keyword "Lotte department store" exceeds the reference value, so it may be determined that the branch search keyword is the target. If in step 107 of providing a search result, if the rate of the branch search of the search keyword exceeds a predetermined threshold value of the entire branch search, the search results provide the results of the site indexed with the search keyword and the branch information of the search keyword. If not exceeded, the search results of sites indexed by search keywords can be provided without branch search. More specifically, the method of searching for a point will be described with reference to FIG. 2.

도 2는 본 발명의 일실시예에 있어서, 입력받은 검색키워드에 대해서 지점검색을 하는 과정을 나타낸 순서도를 도시한 도면이다.FIG. 2 is a flowchart illustrating a process of performing a point search on an input search keyword according to an embodiment of the present invention.

단계(S201)에서는 사용자로부터 입력된 검색키워드가 지점검색 키워드 대상인지 판단하는 단계이다. 여기서 상기 검색키워드는 지역명과 결합되어 검색될 수 있으나, 지역명과 결합되지 않고 검색되는 형태가 본 발명의 목적에 부합한다고 볼 수 있다.In step S201, it is a step of determining whether a search keyword input from a user is a target point of a keyword. Here, the search keyword may be searched by being combined with a local name, but the search keyword is not combined with a local name and may be regarded as meeting the object of the present invention.

지점검색 키워드인지 판단하는 방법은 도 1에서 구체적으로 설명하였다. 다시 간단하게 설명하자면, 현재 검색요청자가 검색하기 전이나 동시에 특정 사용자로부터 지역명과 상기 검색키워드가 결합된 형태로 검색되는 수치가 지역명과 검색키워드가 결합되어 검색되는 전체 지점검색에서 차지하는 비율이 소정의 비율을 초과하는 경우에 검색요청자가 상기 검색키워드를 입력하여 검색하는 의도는 비록 검색키워드만 입력하였을지라도 상기 검색키워드의 지점을 검색하고자 하는 것이라고 파악될 수 있다. 따라서 검색요청자가 입력한 검색키워드에 대해 상기 소정의 비율을 초과하는 경우에는 상기 검색키워드는 지점검색 키워드 대상이라고 판단되어 상기 검색키워드의 사이트 검색결과 및 상기 검색키워드의 지점정보도 함께 제공받을 수 있고, 초과하지 못하는 경우 단순히 지점검색없이 상기 검색키워드로 색인된 사이트의 검색결과만 제공할 수 있다. 도 1에서의 예시를 적용해보면, 소정의 기준치를 10%라고 하고 검색키워드와 지역명이 결합되어 검색되는 전체 지점검색 수치가 100만이라고 한다면, 검색요청자가 검색하기 이전에 "서울 롯데백화점", "강남 롯데백화점", "안양 롯데백화점", "분당 롯데백화점" 등 검색키워드인 "롯데백화점"과 지역명이 결합되어 검색되는 지점검색 수치가 10만 이상인 경우일 때 상기 검색요청자가 입력한 검색키워드에 대해서는 기준치인 10%를 초과한다고 판단할 수 있다. 따라서 검색요청자가 "롯데백화점"로 검색하면 "롯데백화점"은 지점검색 키워드 대상으로 판단되어 "롯데백화점"으로 색인된 사이트의 검색결과와 함께 "롯데백화점"의 지점정보까지 함께 제공받을 수 있다.The method of determining whether the keyword is a branch search has been described in detail with reference to FIG. 1. In other words, the ratio of the number searched in the form of the combination of the region name and the search keyword from the specific user at the same time before the current search requester searches or at the same time is a predetermined percentage in the total branch search combined with the region name and the search keyword. In the case where the ratio is exceeded, the intention of the search requester entering the search keyword and searching for the search keyword may be determined to search for the point of the search keyword even though only the search keyword is entered. Therefore, when the search keyword exceeds the predetermined ratio with respect to the search keyword inputted by the search requester, the search keyword is determined as a target keyword for a site search, and thus the site search result of the search keyword and the branch information of the search keyword may be provided together. If not, the search result of the site indexed with the search keyword may be provided without a branch search. In the example of FIG. 1, if the predetermined reference value is 10% and the total number of branch search values searched by combining the search keyword and the local name is 1 million, before the search requester searches for "Seoul Lotte Department Store", " Lotte Department Store, Gangnam Lotte Department Store, Anyang Lotte Department Store, Bundang Lotte Department Store, etc. For example, it can be determined that the standard value is exceeded 10%. Therefore, when a search requester searches for "Lotte Department Store", "Lotte Department Store" is determined to be a keyword for a site search keyword and can be provided with the branch information of "Lotte Department Store" together with the search results of the site indexed as "Lotte Department Store".

단계(S202)에서는 입력받은 검색키워드가 지점검색 키워드라고 판단되는 경우에 입력된 검색키워드를 이용하여 사이트 색인 검색을 수행할 수 있다. 달리 표현하면 상기 검색키워드로 색인된 사이트를 검색하는 것이라고 할 수 있다. In operation S202, when it is determined that the input search keyword is a branch search keyword, the site index search may be performed using the input search keyword. In other words, it can be said that a site indexed by the search keyword is searched.

단계(S203)에서는 검색된 해당 사이트를 크롤할 수 있으며 이 때 해당 사이트의 전체 범위에서 정보를 크롤하는 것이라고 할 수 있다. 단계(S201)를 통해서 검색키워드가 지점검색 키워드 대상이라고 판단되었기 때문에 검색된 해당 사이트는 상기 검색키워드의 지점정보가 일정 부분 존재할 것이고, 상기 사이트를 크롤하여 지점정보를 수집하는 것이라고 할 수 있다.In step S203, the searched corresponding site may be crawled, and at this time, it may be said that the information is crawled in the entire scope of the corresponding site. Since it is determined that the search keyword is the target of the site search keyword through the step S201, the searched site may be a part of the site information of the search keyword, and the site information may be collected by crawling the site.

단계(S204)에서는 검색한 사이트에서 크롤된 웹데이터를 이용해 지점정보를 수집할 수 있다. 상기 크롤된 웹데이터에 지점을 명시하는 단어가 존재하거나 또는 지역명이 존재하면 원칙적으로 지점정보를 수집할 수 있다. 이 때, 지점을 명시하는 단어는 지점, 가맹점, 분점, 대리점, 체인점 또는 매장 등이 있으며, 언급한 단어 이외에도 지점과 유사한 뜻을 내포하고 있으면 여기에 해당한다고 할 수 있다.In step S204, branch information may be collected using web data crawled from the searched site. If there is a word specifying a branch or a local name in the crawled web data, branch information can be collected in principle. At this time, a word specifying a branch includes a branch, an affiliated store, a branch, an agency, a chain store, or a store, and if the word includes a similar meaning to the branch in addition to the words mentioned, it may be referred to this.

크롤된 웹데이터에 지점을 명시하는 단어 또는 지역명이 존재하면 원칙적으로 지점정보를 수집할 수 있으나, 검색키워드와 무의미한 지점정보를 수집할 가능성이 있기 때문에 크롤된 웹데이터를 이용하여 지점 페이지지지수라는 것을 구하고, 상기 지점 페이지지수와 임계값을 비교했을 때 임계값보다 큰 경우에 지점정보를 수집할 수 있다. 그러면 해당 사이트의 페이지와 지점정보의 관련성이 어느 정도 보장되어 효율적인 지점정보 수집이 가능하게 될 수 있다. 지점정보 수집에 대한 구체적인 단계는 도 3에서 자세히 설명하도록 하겠다.If there is a word or region name that specifies a branch in the crawled web data, the branch information can be collected in principle, but since it is likely to collect search keywords and pointless point information, In this case, the point information may be collected when the point page index and the threshold value are larger than the threshold value. Then, the relevance of the page and the branch information of the site to some extent can be ensured to efficiently collect the branch information. Specific steps for collecting branch information will be described in detail with reference to FIG. 3.

단계(S205)에서는 입력된 검색키워드의 지점검색 결과를 제공할 수 있다. 이 때, 상기 검색키워드로 색인된 사이트의 검색결과와 크롤된 웹데이터로부터 수집한 지점정보를 이용한 지점검색 결과를 함께 제공할 수 있다. 상기 사이트의 검색결과는 검색키워드의 본점정보를 포함할 수 있다.In operation S205, a point search result of the input search keyword may be provided. At this time, a search result of a site indexed with the search keyword and a branch search result using branch information collected from crawled web data may be provided together. The search results of the site may include main store information of the search keyword.

그리고 수집한 지점정보를 이용하여 검색요청자로부터 가까운 위치 순서대로 지점검색 결과를 제공할 수 있다. 검색요청자의 위치정보는 현재 접속한 IP, 사용자의 로그인 정보, 브라우저 쿠키 정보 등을 이용하여 알 수 있고, 지점의 주소는 크롤된 웹데이터에서 지점의 주소 정보를 이용해서 알 수 있다.The collected point information may be used to provide a point search result in the order of location close to the search requester. The location information of the search requester can be known using the currently connected IP, the user's login information, the browser cookie information, and the address of the branch can be known using the branch's address information in the crawled web data.

만약 검색요청자로부터 가까운 위치 순서대로 지점검색 결과를 제공할 수 없는 경우 지점 제목을 가나다순으로 정렬하여 제공할 수 있다. 만약 사용자가 해외에서 접속하거나 사용자의 위치 파악이 어려운 경우처럼 지점검색 결과를 위치 순서대로 정렬하기 힘든 경우 지점 제목은 가나다순으로 제공될 것이다. 지점검색 결과의 예시는 도 4에서 구체적으로 살펴보기로 하겠다.If the branch search results cannot be provided in the order of location close to the search requester, the branch titles can be provided in alphabetical order. If it is difficult to sort the results of the site search in order of location, such as when the user is connected from overseas or the location of the user is difficult, the branch titles are provided in alphabetical order. An example of the branch search result will be described in detail with reference to FIG. 4.

단계(S206)은 입력된 검색키워드가 지점검색 키워드 대상이 아닌 경우에 검색키워드로 색인된 사이트를 검색하고, 단계(S207)에서는 검색한 사이트의 검색 결과를 출력할 수 있다. 다시 말해, 검색요청자로부터 입력받은 검색키워드가 지점검색 키워드 대상이 아니라고 판단되는 경우 상기 검색키워드에 대해서 지점검색의 과정을 거치지 않고, 바로 검색키워드로 색인된 사이트의 검색결과를 제공할 수 있다.Step S206 may search for a site indexed by the search keyword when the input search keyword is not the target of the site search keyword, and output the search result of the searched site in step S207. In other words, when it is determined that the search keyword input from the search requester is not the target of the branch search keyword, the search result of the site indexed by the search keyword may be directly provided without performing the branch search process for the search keyword.

도 3은 본 발명의 일실시예에 있어서, 사이트에서 크롤한 웹데이터로부터 지점정보를 수집하는 과정을 나타낸 순서도를 도시한 도면이다. 단계(S204)를 좀더 구체적인 단계로 나누어 도시한 도면이다.3 is a flowchart illustrating a process of collecting branch information from web data crawled from a site according to an embodiment of the present invention. The step S204 is shown by dividing it into more specific steps.

단계(S301)에서는 크롤된 웹데이터를 이용해서 지점 페이지지수를 계산할 수 있다. 지점 페이지지수는 해당 사이트의 페이지와 지점정보의 관련성을 수치화한 것으로 지역 가중치와 지점 가중치로 표현할 수 있다. 지점 페이지지수가 높을수록 해당 페이지에 지점정보가 많이 존재하는 것을 알 수 있고, 소정의 임계값만 초과하면 지점정보를 수집하기 위한 요건을 만족할 수 있다. 이 때 지점 페이지지수는 지점 가중치와 지역 가중치를 구성되는데, 다음의 수학식 1으로 구할 수 있다.In step S301, the branch page index may be calculated using the crawled web data. Branch page index is a numerical value of the relationship between the page of the site and the branch information can be expressed as a regional weight and a branch weight. As the branch page index is higher, it is known that a lot of branch information exists on the corresponding page, and when a predetermined threshold value is exceeded, a requirement for collecting branch information may be satisfied. At this time, the branch page index is composed of the branch weight and the local weight, it can be obtained by the following equation (1).

지점 페이지지수=Branch Page Index =

Figure 112007023782249-pat00001
Figure 112007023782249-pat00001

여기서, 상기 지점 가중치는 사이트의 페이지에 표현된 여러가지 지점을 의미하는 단어가 검색키워드의 지점과 어느 정도 관련이 있는지를 수치로 나타낸 것이고, 상기 지역 가중치는 사이트의 페이지에 표현된 여러가지 지역명 중 검색키워드와 어느 정도 관련이 있는지를 수치로 나타낸 것이다. 즉, 지점 정보를 수집하기 위해서는 이미 언급한 바와 같이 크롤된 웹데이터 중에 지점을 명시하는 단어가 일정 부분 존재하거나 또는 지역명이 일정 부분 존재하여야 지점 페이지지수를 구해서 지점정보를 수집할 수 있다고 할 수 있을 것이다. 여기서 지점을 의미하는 단어는 지점, 가맹점, 분점, 대리점, 체인점 또는 매장 등을 포함할 수 있다.Here, the point weight is a numerical value indicating how much the word meaning various points expressed on the page of the site is related to the point of the search keyword, and the area weight is a search among various area names expressed on the page of the site. It is a numerical representation of how relevant the keyword is. That is, in order to collect branch information, as mentioned above, a part of a word that specifies a branch in a crawled web data or a part of a region name exist to obtain branch page index and collect branch information. will be. Here, the word for branch may include a branch, an affiliated store, a branch, an agency, a chain store or a store.

단계(S302)에서는 단계(S301)에서 구한 지점 페이지지수와 임계값을 비교할 수 있으며, 상기 지점 페이지지수가 임계값보다 크면 단계(S303)으로 진행하여 크롤된 웹데이터로부터 지점정보를 수집하게 되고, 임계값보다 작으면 단계(S305)로 진행하여 다시 지점 페이지지수를 높이기 위해 다른 검색키워드를 입력하여 재검색할 수 있다. 임계값은 검색키워드로 색인된 사이트의 페이지에 지점정보가 존재할 수 있는 최소의 지점 페이지지수 값을 의미한다고 할 수 있다. 따라서 지점 페 이지지수 값이 큰 것과는 상관없이 임계값만 초과하면 수집하기 위한 지점정보가 해당 페이지에 존재한다고 할 수 있다.In step S302, the point page index obtained in step S301 may be compared with a threshold value. If the point page index is larger than the threshold value, the process proceeds to step S303 to collect point information from the crawled web data. If it is smaller than the threshold value, the process proceeds to step S305 where another search keyword can be input again to increase the branch page index. The threshold may mean the minimum point page index value at which point information may exist on a page of a site indexed with a search keyword. Therefore, regardless of the value of the branch page index value, if the threshold value is exceeded, the branch information to be collected exists on the page.

단계(S303)에서는 지점 페이지지수가 임계값을 초과하는 경우 크롤된 웹데이터로부터 지점정보를 파싱(parsing)할 수 있다. 다시 말해서, 웹데이터로부터 지점과 관련된 단어를 문장의 분석과 해부를 통해 항목별로 분리하는 것이라 할 수 있다. 파싱하려는 항목은 일반적으로 지점명, 지점 주소, 지점 전화번호이며, 소정의 기준에 따라 파싱하는 항목은 변경될 수 있다. In operation S303, when the branch page index exceeds a threshold, branch information may be parsed from crawled web data. In other words, the word associated with the point from the web data can be said to be divided into items by analyzing and analyzing the sentence. The items to be parsed are generally a branch name, a branch address, a branch telephone number, and the parsing items may be changed according to a predetermined criterion.

단계(S304)에서는 크롤된 웹데이터로부터 파싱된 지점 정보를 조직화할 수 있다. 단계(S303)에서 파싱되어 분리된 지점정보를 항목별로 모아서 정리하는 과정이라고 할 수 있다. 지점명, 지점 주소, 지점 전화번호 등의 항목을 정하고, 파싱된 지점정보를 각각의 항목에 맞게 저장하여 조직화하는 것이다. 조직화하는 단계가 끝나면 지점검색 결과를 제공하는 단계(S205)로 진행한다.In step S304, parsed point information may be organized from crawled web data. In step S303, the parsing and separation of the branch information may be referred to as a process of collecting the items. It defines the items such as the branch name, branch address, branch telephone number, etc., and stores and organizes the parsed branch information for each item. After the step of organizing, the process proceeds to step S205 of providing a point search result.

단계(S301)에서 계산한 지점 페이지지수를 단계(S302)에서 임계값과 비교했을 때 임계값보다 작을 때 단계(S305)와 단계(S306)로 진행되어 지점 페이지지수를 높이기 위한 피드백 과정을 거치게 된다.When the point page index calculated in step S301 is smaller than the threshold value when compared with the threshold value in step S302, the process proceeds to step S305 and step S306 to go through a feedback process to increase the point page index. .

단계(S305)에서는 사용자가 입력한 검색키워드로 색인된 사이트의 제목과 전국지역명을 결합하여 다시 재검색할 수 있다. 사용자가 입력한 검색키워드가 지점검색 키워드 대상이기는 하지만 검색된 사이트의 해당 페이지와 지점정보 사이에 관련성이 낮기 때문에 지점정보를 수집하기 힘들므로 피드백과정을 거쳐 관련성을 높여 임계값을 초과하는 지점 페이지지수를 구하기 위한 단계라고 할 수 있다.In step S305, the title of the site indexed by the search keyword input by the user and the nationwide region name may be combined and searched again. Although the search keyword entered by the user is the target of the branch search keyword, it is difficult to collect the branch information because the relation between the relevant page of the searched site and the branch information is low. Therefore, the branch page index that exceeds the threshold is increased through the feedback process. It can be said to be a step to obtain.

단계(S306)에서는 재검색된 사이트를 크롤하고, 단계(S301)로 돌아가 새롭게 검색된 사이트에서 크롤한 웹데이터를 이용하여 지점 페이지지수를 다시 구할 수 있다. 계산한 지점 페이지지수가 임계값을 초과할 때까지 단계(S305)와 단계(S306)을 통한 피드백과정이 계속 이루어질 것이다.In step S306, the re-searched site may be crawled, and the process may return to step S301, and the branch page index may be obtained again by using the web data crawled in the newly searched site. The feedback process through steps S305 and S306 will continue until the calculated point page index exceeds the threshold.

도 4는 수집된 지점정보에 따른 지점검색 결과를 제공하는 것을 도시한 도면이다. 단계(S205)에서 지점검색 결과가 어떤 형식으로 제공되는 지를 나타내는 일실시예에 해당하므로 지점검색 결과페이지(401)의 인터페이스는 시스템 관리자에 의해 변경될 수 있다.4 is a diagram illustrating providing a point search result according to the collected point information. The interface of the branch search result page 401 may be changed by the system administrator since it corresponds to an embodiment indicating how the branch search result is provided in step S205.

지점검색 결과페이지(401)에서는 검색키워드 입력부분(402), 검색키워드의 카테고리부분(403), 검색키워드로 색인된 사이트에 대한 검색결과부분(404) 및 지점검색 결과부분(405)로 구성될 수 있다. 검색키워드 입력부분(402)을 통해 검색요청자로부터 검색키워드를 입력받으면, 도 2에서 도시한 단계를 거쳐서 지점검색 결과페이지(401)에 지점검색 결과가 제공될 수 있다. 그리고 검색키워드의 카테고리부분(403)에서는 검색키워드가 속한 디렉토리를 단계적으로 표시할 수 있다.The branch search result page 401 includes a search keyword input portion 402, a category portion 403 of the search keyword, a search result portion 404 for the site indexed by the search keyword, and a branch search result portion 405. Can be. When the search keyword is input from the search requester through the search keyword input unit 402, the point search result may be provided on the point search result page 401 through the steps illustrated in FIG. 2. In the category 403 of the search keyword, the directory to which the search keyword belongs may be displayed step by step.

사이트에 대한 검색결과부분(404)은 검색키워드로 색인된 사이트의 구체적인 정보(도 4에서 볼 수 있듯이 검색키워드로 색인된 사이트의 간단한 설명과 URL 주소, 디렉토리 등)와 함께 상기 검색키워드가 지점검색 키워드 대상에 해당되는 경우 지검검색 결과부분(405)에 상기 검색키워드의 지점정보인 지점명, 지점 주소, 지점 전화번호 등이 지점검색 결과로 제공할 수 있다. 만약 검색키워드가 지점검색 키워드 대상이 아닌 경우에는 지점검색 결과부분(405)이 포함되지 않고 검색키 워드로 색인된 사이트에 대한 검색결과부분(404)만 제공될 것이다.The search result portion 404 for the site includes the specific information of the site indexed by the search keyword (simple description of the site indexed by the search keyword and URL address, directory, etc.) as shown in FIG. If it is a keyword target, the branch search result portion 405 may provide a branch name, a branch address, a branch telephone number, etc., which are branch information of the search keyword, as a branch search result. If the search keyword is not the target site keyword, the site search result portion 405 will not be included, and only the search result portion 404 for the site indexed by the search keyword will be provided.

지점검색 결과부분(405)은 검색키워드의 본점정보도 제공할 수 있으며, 지점검색 결과는 수집한 지점정보를 이용하여 검색요청자로부터 가까운 위치 순서대로 제공할 수 있다. 검색요청자의 위치정보는 검색요청자가 현재 접속한 IP, 로그인 정보, 사용하는 브라우저 쿠키 정보 등을 이용하여 알 수 있고, 지점의 주소는 크롤된 웹데이터에서 지점의 주소 정보를 이용해서 알 수 있다.The branch search result portion 405 may also provide the main store information of the search keyword, and the branch search result may be provided in order of the position close to the search requester using the collected branch information. The location information of the search requester can be known using the IP, login information, browser cookie information used, etc., and the address of the searcher can be known using the address information of the branch in the crawled web data.

만약 검색요청자로부터 가까운 위치 순서대로 지점검색 결과를 제공할 수 없는 경우 지점 제목을 가나다순으로 정렬하여 제공할 수 있다. 도 4에서 예를 들면, 사용자가 성남시 분당구에서 접속한 경우 사용자로부터 위치적으로 가까운 "롯데백화점"의 분당점, 잠실점, 안양점 순으로 지점검색 결과가 제공될 것이다. 만약 사용자가 해외에서 접속하거나 사용자의 위치 파악이 어려운 경우처럼 위치 순서대로 정렬하기 힘든 경우 지점 제목을 가나다순으로 제공할 수 있으며, 상기 예에서는 가나다순으로 정렬하면 분당점, 안양점, 잠실점 순으로 제공될 것이다. If the branch search results cannot be provided in the order of location close to the search requester, the branch titles can be provided in alphabetical order. In FIG. 4, for example, when a user accesses from Bundang-gu, Seongnam-si, the location search results will be provided in order of Bundang, Jamsil, and Anyang of the Lotte Department Store. If it is difficult to sort in order of location, such as when a user is connected from overseas or when it is difficult to determine the location of the user, the branch titles may be provided in alphabetical order. In the above example, the branch titles may be provided in the order of Bundang, Anyang, and Jamsil. Will be.

도 5는 본 발명의 일실시예에 있어서, 지점검색 시스템의 구성을 도시한 도면이다. 지점검색 시스템(501)은 검색키워드 카운터(502), 지점검색 키워드 판단부(503), 사이트 검색부(504), 사이트 크롤부(505)와 지점 페이지지수 계산부(507), 지점 페이지지수 비교부(508), 지점정보 파싱부(509) 및 지점정보 관리부(510)로 구성되는 지점정보 수집부(506)와 검색결과 제공부(511)가 포함될 수 있다.5 is a diagram illustrating a configuration of a point search system according to an embodiment of the present invention. The branch search system 501 compares the search keyword counter 502, the branch search keyword determination unit 503, the site search unit 504, the site crawler 505, the branch page index calculator 507, and the branch page index. The branch information collecting unit 506 and the search result providing unit 511 including the unit 508, the branch information parser 509, and the branch information manager 510 may be included.

검색키워드 카운터(502)는 검색요청자로부터 검색키워드가 입력되기 전에 특 정 사용자로부터 검색키워드와 지역명이 결합한 형태가 입력되어 검색되는 경우 검색키워드 부분을 집계할 수 있다. The search keyword counter 502 may aggregate the search keyword portion when a search keyword and a region name combined form are searched by a specific user before the search keyword is input from the search requester.

지점검색 키워드 판단부(503)는 검색요청자로부터 입력된 검색키워드가 지점검색 키워드 대상인지 여부를 판단하며, 이 때 입력된 검색키워드는 지역명과 결합되지 않은 형태일 수 있다. 지점검색 키워드에 대해서 도 1과 단계(S201)에서 구체적으로 언급하였으므로 간단하게 설명하면, 특정 사용자에 의해 검색키워드와 지역명이 결합된 형태로 지점검색이 되는 경우 검색키워드 카운터(502)가 검색키워드 부분을 집계하고, 그 수치가 전체 지점검색의 소정의 비율을 초과할 때 검색요청자로부터 입력된 검색키워드를 지점검색 키워드라고 판단할 수 있다.The branch search keyword determination unit 503 determines whether the search keyword input from the search requester is the target of the branch search keyword, and the input search keyword may not be combined with the region name. 1 and step (S201), the site search keyword has been specifically described. In brief, the search keyword counter 502 is a search keyword part when the site search is performed by a specific user in combination with a search keyword and a region name. When the numerical value exceeds a predetermined ratio of the total branch search, the search keyword input from the search requester can be determined as the branch search keyword.

지점검색 키워드 판단부(503)에서 이미 지점검색 서비스가 제공되고 있는 검색키워드의 검색 빈도 측정시 학습효과 때문에 검색키워드만이 입력되는 빈도가 떨어져, 상기 검색키워드는 지점검색 키워드 대상일 가능성이 높지만 지점검색 키워드 대상이 아닌 것으로 판단될 수 있다. 그래서 상기 검색키워드에 대해 지점검색 서비스가 중단되었다가 다시 지역명과 검색키워드가 결합한 비중이 높아져 검색키워드에 대한 다시 지점검색 서비스가 재개될 수 있다. In the branch search keyword determination unit 503, the frequency of inputting only the search keyword is reduced due to the learning effect when measuring the search frequency of the search keyword that is already provided with the branch search service. It may be determined that the search keyword is not a target. As a result, the branch search service is stopped for the search keyword, and the combined ratio of the region name and the search keyword is increased, so that the branch search service for the search keyword can be resumed.

그래서 검색키워드에 대해 이미 지점검색 서비스가 제공되고 있는 경우 검색요청자로부터 검색키워드만 입력받으면 지점검색 키워드 대상 판단시 적용되는 소정의 비율에 기준 할인율을 적용할 수 있다. 이 때 기준 할인율은 검색키워드의 지점검색 가중치에 검색키워드로 검색되는 빈도를 지점검색전 전체 검색 빈도를 나눈 값을 곱하여 구한 값으로 정할 수 있다. 기준 할인율을 적용하는 경우는 다음 표 1에서 검토할 수 있다.Thus, when a branch search service is already provided for the search keyword, if only the search keyword is input from the search requester, the reference discount rate may be applied to a predetermined ratio applied when determining the target of the branch search keyword. In this case, the reference discount rate may be determined as a value obtained by multiplying the frequency of the search keyword by the search keyword by the value obtained by dividing the total search frequency before the point search. The application of the standard discount rate can be reviewed in Table 1 below.

구분division 검색 형태 분석Search form analysis 기준 할인율Standard discount rate 지점검색 서비스 중Branch Search Service 지역명 + 검색키워드Region Name + Search Keyword 미적용Unapplied 검색키워드Search keywords 적용apply 지점검색 서비스 중 아님Not a branch search service 지역명 + 검색키워드Region Name + Search Keyword 미적용Unapplied 검색키워드Search keywords 미적용Unapplied

사이트 검색부(504)는 입력된 검색키워드를 이용하여 사이트 색인 검색을 수행하며, 달리 표현하면 입력된 검색키워드로 색인된 사이트에 대해 검색할 수 있다. 만약 검색키워드가 지점검색 키워드 대상이라고 판단된 경우에는 사이트 크롤부(505)로 진행하여 지점검색 과정을 거치게 되고, 그렇지 않은 경우 검색결과 제공부(511)를 통해 지점검색 과정없이 사이트 검색 결과가 제공될 수 있다.The site search unit 504 performs a site index search using the input search keyword. In other words, the site search unit 504 may search a site indexed by the input search keyword. If it is determined that the search keyword is a target keyword for the site search keyword, the site crawler 505 proceeds to the site search process. Otherwise, the site search result is provided through the search result provider 511 without the site search process. Can be.

사이트 크롤부(505)는 검색키워드로 색인된 사이트의 지점정보를 수집하기 위해 사이트의 해당 페이지로부터 정보를 크롤할 수 있다. 검색된 사이트의 해당 사이트는 상기 검색키워드의 지점정보가 일정 부분 존재할 것이므로, 사이트를 크롤하여 지점정보를 수집하는 것이라고 할 수 있다.The site crawling unit 505 may crawl the information from the corresponding page of the site to collect the branch information of the site indexed by the search keyword. The relevant site of the searched site may be said to collect branch information by crawling the site since the branch information of the search keyword will exist in a certain part.

지점정보 수집부(506)은 지점페이지지수 계산부(507), 지점페이지지수 비교부(508), 지점정보 파싱부(509) 및 지점정보 관리부(510)으로 구성될 수 있다. 지점정보 수집부(506)은 사이트 크롤부(506)로부터 크롤된 웹데이터에 지점, 가맹점, 분점, 체인점 등의 지점을 명시하는 단어가 존재하거나 또는 지역명이 존재하는 경우 지점 정보를 수집할 수 있다.The branch information collecting unit 506 may include a branch page index calculation unit 507, a branch page index comparison unit 508, a branch information parsing unit 509, and a branch information management unit 510. The branch information collecting unit 506 may collect branch information when a word indicating a branch, an affiliated store, a branch, a chain store, or the like exists in the web data crawled from the site crawling unit 506 or a local name exists. .

지점 페이지지수 계산부(507)는 크롤한 웹데이터로부터 지역 가중치, 지점 가중치 등을 이용하여 해당 페이지와 지점 정보의 관련성을 나타내는 수치인 지점 페이지지수를 계산할 수 있다. 도 3에서 지점 페이지지지수를 계산하는 구체적인 방법을 단계(S301)에서 이미 언급하였으므로 간단하게 설명하겠다. 지점 페이지지수는 지점 가중치와 지역가중치를 각각 지점을 지칭하는 단어와 지역을 지칭하는 단어의 갯수로 곱한 수치에 해당 페이지에 표현된 모든 명사의 갯수를 지점 가중치와 지역 가중치를 더한 값에 곱한 수치로 나누면 된다. 지점 페이지지수를 계산하는 방법은 상기 언급한 방법이 아니라 다른 방법으로 구할 수도 있다.The branch page index calculation unit 507 may calculate the branch page index, which is a numerical value representing the relation between the corresponding page and the branch information, using the local weight, the branch weight, etc., from the crawled web data. Since a specific method of calculating the branch page index in FIG. 3 has already been mentioned in step S301, it will be briefly described. The branch page index is the product of the branch weight and the local weight, multiplied by the number of words for the branch and the word for the region, respectively, and the number of all nouns on the page multiplied by the point weight plus the region weight. Divided. The method of calculating the branch page index may be obtained by other methods than the above-mentioned method.

지점 페이지지수 비교부(508)는 지점 페이지지수 계산부(507)에서 구한 지점 페이지지수와 임계값을 비교할 수 있으며, 임계값을 초과하는 경우 지점정보 파싱부(509)가 크롤된 웹데이터를 각 항목별로 분리하는 파싱을 하며, 임계값을 초과하지 못하는 경우 해당 사이트의 제목과 지역명의 결합으로 다시 사이트 검색부(504)에서 재검색하여 피드백하는 과정을 거칠 수 있다. 재검색된 사이트를 크롤하여 지점 가중치와 지역 가중치를 이용하여 다시 지점 페이지지수를 구하고 지점 페이지지수 비교부에서 임계값과 비교할 수 있다.The branch page index comparison unit 508 may compare the branch page index calculated by the branch page index calculation unit 507 with a threshold value. When the branch page index comparison unit 508 exceeds the threshold value, the branch information index parsing unit 509 may crawl the web data. Parsing is performed for each item, and if the threshold value is not exceeded, the site search unit 504 may re-search and feed back to the site title and region name combination. By re-browsing the re-searched site, the branch page index can be obtained by using the branch weight and the regional weight, and the branch page index comparison unit can be compared with the threshold.

지점정보 파싱부(509)는 지점 페이지지수가 임계값을 초과하는 경우, 크롤된 웹데이터로부터 지점정보를 파싱할 수 있으며, 파싱하고자 하는 각 항목은 지점명, 지점 주소, 지점 전화번호가 일반적이고, 사이트의 내용과 구조에 따라 상기 항목은 변경될 수 있다. The branch information parsing unit 509 may parse branch information from crawled web data when the branch page index exceeds a threshold value, and each item to be parsed is a branch name, a branch address, a branch telephone number, The items may be changed according to the content and structure of the site.

지점정보 관리부(510)는 크롤된 웹데이터로부터 수집한 지점정보를 조직화할 수 있으며, 상기 조직화하는 방법은 파싱된 지점정보를 분리하여 항목별로 저장하는 방법을 포함할 수 있다. 결국 지점정보를 조직화하는 검색키워드의 지점정보를 항목별로 데이터베이스화하는 역할이라고 할 수 있다.The branch information manager 510 may organize the branch information collected from the crawled web data, and the organizing method may include a method of separating the parsed branch information and storing the parsed branch information for each item. As a result, it can be said that the branch information of the search keyword that organizes branch information is databased by item.

검색결과 제공부(511)는 검색키워드의 지점검색 결과를 제공하며, 검색키워드로 색인된 사이트의 검색결과를 함께 제공할 수 있다. 이 경우 지점검색 결과는 검색요청자의 위치 정보와 지점정보를 이용하여 가까운 위치 순서대로 정렬하여 제공할 수 있다. 만약 가까운 위치 순서대로 제공할 수 없는 경우 지점검색 결과를 지점의 제목에 대해서 가나다순으로 정렬하여 제공할 수 있다. 검색결과에 대한 구체적인 예시는 도 4에서 이미 언급하였으므로 참고할 수 있다.The search result providing unit 511 may provide a branch search result of the search keyword and may provide a search result of a site indexed with the search keyword. In this case, the branch search results may be provided in the order of the nearest position by using the position information of the search requester and the branch information. If the location can not be provided in the order of the nearest location, the results of the branch search can be provided in alphabetical order with respect to the title of the branch. Specific examples of the search results may be referred to as already mentioned in FIG. 4.

본 발명에 따른 지점검색 제공 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method for providing a point search according to the present invention can be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above embodiments, and those skilled in the art to which the present invention pertains various modifications and variations from such descriptions. This is possible.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the claims below but also by the equivalents of the claims.

본 발명에 따르면, 검색요청자로부터 입력받은 검색키워드가 지점검색 키워드 대상인지 판단하여 검색키워드로 색인된 사이트에서 지점정보를 수집함으로써 별도로 지역명을 병기하지 않고도 지점검색 결과를 제공하는 효과를 볼 수 있다.According to the present invention, by determining whether a search keyword inputted from a search requester is a target keyword for a branch search keyword, collecting branch information from a site indexed with the search keyword can provide an effect of providing a branch search result without separately writing a local name. .

본 발명에 따르면, 지역명과 검색키워드가 결합된 지점검색이 일정부분 수행된 검색키워드를 대상으로 하고, 상기 검색키워드로 색인된 사이트에서 크롤된 웹데이터에 지점을 명시하는 단어와 지역명이 존재하는 경우에 그룹화하여 지점 정보를 수집함으로써 검색키워드로 색인된 사이트와 관련도가 높고, 내용의 유사성이 큰 지점검색이 가능하다는 효과를 볼 수 있다.According to the present invention, a word and a local name for specifying a branch point in a web keyword crawled on a site indexed by the search keyword are targeted for a search keyword in which a branch search combining a region name and a search keyword is performed. By collecting the branch information by grouping in, it is possible to obtain the branch retrieval that has high relevance and high similarity to the site indexed by the search keyword.

본 발명에 따르면, 임계값을 초과하는 지점 페이지지수를 이용하여 해당 페이지에 대해서 조직화하는 과정을 거치므로 해당 페이지에 대해서 좀더 연관도가 높은 지점정보를 조직화하는 효과를 볼 수 있다.According to the present invention, since the process of organizing the corresponding page using the branch page index exceeding the threshold value, it is possible to obtain the effect of organizing more relevant branch information for the corresponding page.

Claims (38)

입력된 검색키워드를 이용하여 사이트 색인 검색을 수행하는 단계; Performing a site index search using the entered search keyword; 상기 사이트 색인 검색을 통해 검색된 사이트를 크롤(crawl)하는 단계;Crawling a site searched through the site index search; 상기 검색된 사이트에서 크롤된 웹데이터로부터 상기 검색키워드에 대한 지점(branch office)정보를 수집하는 단계; 및Collecting branch office information on the search keyword from web data crawled on the searched site; And 상기 수집된 지점정보에 따른 지점검색 결과를 제공하는 단계Providing a point search result according to the collected point information 를 포함하고,Including, 상기 지점검색 결과는,The point search results, 상기 검색키워드로 색인된 사이트 검색결과와 함께 제공되는 것을 특징으로 하는 지점검색 제공 방법.And a site search result indexed with the search keyword. 제1항에 있어서,The method of claim 1, 입력된 검색키워드를 이용하여 사이트 색인 검색을 수행하는 상기 단계는,The step of performing a site index search using the entered search keywords, 상기 검색키워드와 지역명이 결합한 형태로 검색되는 지점 검색 비율을 이용하여 상기 검색키워드가 지점검색 키워드 대상인지 여부를 판단하는 단계; 및Determining whether the search keyword is a subject of a keyword for a branch search by using a branch search ratio searched by combining the search keyword and a local name; And 상기 검색키워드가 상기 지점검색 키워드 대상으로 판단되는 경우, 입력된 검색키워드를 이용하여 사이트 색인 검색을 수행하는 단계If the search keyword is determined to be the target keyword for the site search, performing a site index search using the input search keyword 를 포함하는 지점검색 제공 방법.Point search providing method comprising a. 제2항에 있어서,The method of claim 2, 상기 검색키워드가 지점검색 키워드 대상인지 여부를 판단하는 단계는,Determining whether the search keyword is a target keyword for a branch search, 전체 지점검색에 대해 상기 검색키워드와 지역명이 결합한 형태로 검색되는 지점검색 비율이 미리 설정한 지점검색 비율의 기준치를 초과하는 경우, 상기 검색키워드를 지점검색 키워드 대상이라고 판단하는 것을 특징으로 하는 지점검색 제공 방법. In the case of the branch search rate searched in the form of combining the search keyword and the region name for the whole branch search exceeds the threshold value of a preset branch search rate, the search keyword is determined as the target of the branch search keyword. How to Provide. 제3항에 있어서,The method of claim 3, 상기 지점검색 비율은,The branch search rate is, 상기 검색키워드가 지역명과 결합한 형태로 검색되는 경우에 검색키워드 부분을 카운팅한 수치로 구할 수 있는 것을 특징으로 하는 지점검색 제공 방법.When the search keyword is searched in a form combined with the region name, the method for providing a point search, which can be obtained by counting the search keyword portion. 제3항에 있어서,The method of claim 3, 상기 검색키워드가 지점검색 키워드 대상인지 여부를 판단하는 상기 단계는,The determining of whether or not the search keyword is a target keyword for a point search is: 상기 검색키워드에 대해 지점검색 서비스가 제공 중이고 상기 검색키워드만의 형태로 검색되는 경우, 지점검색 키워드 대상 판단시 상기 전체 지점검색에 대해 상기 검색키워드와 지역명이 결합한 형태로 검색되는 지점검색 비율에 미리 설정한 기준 할인율을 적용하는 것을 특징으로 하는 지점검색 제공 방법. When a branch search service is provided for the search keyword and is searched in the form of only the search keyword, when determining the target of the branch search keyword, the branch search rate is searched in advance in the form of a combination of the search keyword and the local name for the entire branch search. Method of providing a branch search, characterized in that to apply the set standard discount rate. 제5항에 있어서,The method of claim 5, 상기 기준 할인율은,The standard discount rate is, 상기 검색키워드의 지점검색 가중치에 상기 검색키워드로 검색되는 빈도를 지점검색전 전체 검색 빈도를 나눈 값을 곱하여 구하는 것을 특징으로 하는 지점검색 제공 방법. The method of claim 1, wherein the frequency of the search keyword is calculated by multiplying the frequency searched by the search keyword by a value obtained by dividing the total search frequency before the point search. 제2항에 있어서,The method of claim 2, 상기 검색키워드가 지점검색 키워드 대상인지 여부를 판단하는 단계는,Determining whether the search keyword is a target keyword for a branch search, 상기 검색키워드가 상기 지점검색 키워드 대상이 아니라고 판단되는 경우 입력된 검색키워드를 이용하여 사이트 색인 검색을 수행하는 단계; 및Performing a site index search using the inputted search keyword when it is determined that the search keyword is not a target of the branch search keyword; And 지점검색없이 상기 사이트의 검색결과를 제공하는 단계Providing search results of the site without branch search 를 포함하는 지점검색 제공 방법.Point search providing method comprising a. 제1항에 있어서, The method of claim 1, 상기 검색된 사이트를 크롤하는 단계는,Crawling the searched site, 상기 검색키워드로 검색된 사이트 전체 범위에서 지점정보를 크롤하는 것을 특징으로 하는 지점검색 제공 방법.Point search for crawling the branch information in the entire range of the site searched by the search keyword. 제1항에 있어서,The method of claim 1, 상기 검색키워드에 대한 지점정보를 수집하는 단계는, Collecting the point information for the search keyword, 상기 크롤된 웹데이터에 지점을 명시하는 단어가 존재하거나 또는 지역명이 존재하면 지점정보를 수집하는 것을 특징으로 하고,If there is a word specifying a point in the crawled web data or a local name is characterized in that to collect branch information, 상기 지점을 명시하는 단어는,The word specifying the point is 지점, 가맹점, 분점, 대리점, 체인점 또는 매장 중 적어도 하나를 포함하는 지점검색 제공 방법.A method for providing a branch search comprising at least one of a branch, an affiliated store, a branch, an agent, a chain, or a store. 제1항에 있어서,The method of claim 1, 상기 검색키워드에 대한 지점정보를 수집하는 단계는,Collecting the point information for the search keyword, 상기 검색된 사이트에서 크롤된 웹데이터를 이용하여 지점 페이지지수를 계산하는 단계; 및Calculating a branch page index using web data crawled from the searched site; And 상기 계산한 지점 페이지지수를 미리 설정한 지점 페이지지수에 대한 임계값과 비교하는 단계Comparing the calculated point page index with a threshold for a preset point page index 를 포함하고,Including, 상기 지점 페이지지수를 계산하는 단계는,The step of calculating the branch page index, 상기 검색된 사이트에서 크롤된 웹데이터로부터 추출한 지점 가중치와 지역 가중치를 이용하여 하기 수학식 2를 통해 계산하는 것을 특징으로 하는 지점검색 제공 방법.Method for providing a point search, characterized in that calculated by the following equation 2 using the point weight and the local weight extracted from the web data crawled from the searched site. 지점 페이지지수=Branch Page Index =
Figure 112008066795184-pat00002
Figure 112008066795184-pat00002
여기서, 상기 지점 가중치는 지점 단어에 대한 가중치이고, 상기 지점을 지칭하는 단어는 지점, 분점, 대리점 및 가맹점을 포함하는 지점을 내포하는 단어이고, 상기 지역 가중치는 지역 단어에 대한 가중치이고, 상기 지역을 지칭하는 단어는 국가 행정동, 법정 동코드에서 추출된 지역명을 나타냄.Here, the branch weight is a weight for a branch word, and the word indicating the branch is a word containing a branch including a branch, a branch, an agency, and an affiliate store, and the region weight is a weight for a region word, and the region The word refers to the name of the region extracted from the national administrative and legal codes.
삭제delete 삭제delete 제10항에 있어서,The method of claim 10, 상기 임계값은,The threshold is 상기 검색키워드로 색인된 사이트의 페이지에 지점정보가 존재할 수 있는 최소의 지점 페이지지수인 것을 특징으로 하는 지점검색 제공 방법.And a minimum point page index at which point information can exist on a page of the site indexed by the search keyword. 제10항에 있어서,The method of claim 10, 상기 지점 페이지지수가 미리 설정한 지점 페이지지수에 대한 임계값을 초과하는 경우, 상기 크롤된 웹데이터로부터 지점정보를 파싱(parsing)하는 단계Parsing branch information from the crawled web data when the branch page index exceeds a threshold for a preset branch page index. 를 더 포함하는 지점검색 제공 방법.Point search providing method further comprising. 제14항에 있어서,The method of claim 14, 상기 크롤된 웹데이터로부터 지점정보를 파싱하는 상기 단계는,Parsing branch information from the crawled web data, 상기 크롤된 웹데이터에서 지점명, 지점 주소, 지점 전화번호로 파싱하는 것을 특징으로 하는 지점검색 제공 방법.Point search method for parsing from the crawled web data to a branch name, branch address, branch telephone number. 제10항에 있어서,The method of claim 10, 상기 지점 페이지지수가 미리 설정한 지점 페이지지수에 대한 임계값을 초과하지 못하는 경우, 해당 사이트의 제목과 지역명의 결합으로 된 검색키워드로 다시 사이트 색인 검색을 수행하는 단계;If the branch page index does not exceed a threshold for a preset branch page index, performing a site index search again with a search keyword that is a combination of a title and a region name of a corresponding site; 상기 검색키워드로 색인된 해당 사이트를 크롤하는 단계; 및Crawling the corresponding site indexed by the search keyword; And 상기 해당 사이트에서 크롤된 웹데이터로부터 지점 페이지지수를 다시 계산하는 단계Recalculating the branch page index from the web data crawled on the site 를 더 포함하는 지점검색 제공 방법.Point search providing method further comprising. 제10항에 있어서,The method of claim 10, 상기 크롤된 웹데이터로부터 수집한 지점정보를 조직화하는 단계Organizing branch information collected from the crawled web data; 를 더 포함하고,More, 상기 크롤된 웹데이터로부터 수집한 지점정보를 조직화하는 단계는,Organizing the branch information collected from the crawled web data, 상기 크롤된 웹데이터로부터 파싱된 지점정보를 분리하여, 항목별로 저장하는 것을 특징으로 하는 지점검색 제공 방법.The method of claim 1, wherein the parsed branch information is separated from the crawled web data and stored for each item. 삭제delete 제1항에 있어서,The method of claim 1, 상기 수집된 지점정보에 따른 지점검색 결과를 제공하는 단계는,Providing a point search result according to the collected point information, 상기 검색키워드의 본점 정보를 포함하는 지점검색 결과를 제공하는 것을 특징으로 하는 지점검색 제공 방법.The method for providing a branch search, comprising: providing a branch search result including main store information of the search keyword. 제19항에 있어서,The method of claim 19, 상기 수집된 지점정보에 따른 지점검색 결과를 제공하는 상기 단계는,The step of providing a point search results according to the collected point information, 상기 지점정보를 이용하여 상기 지점검색 결과를 검색요청자로부터 가까운 위치 순서대로 제공하는 것을 특징으로 하는 지점검색 제공 방법.The method for providing a point search, wherein the point search results are provided in the order of location close to the search requester using the point information. 제20항에 있어서,The method of claim 20, 상기 수집된 지점정보에 따른 지점검색 결과를 제공하는 상기 단계는,The step of providing a point search results according to the collected point information, 상기 지점검색 결과를 검색요청자로부터 가까운 위치 순서대로 제공할 수 없는 경우 상기 지점검색 결과를 지점의 제목에 대해서 가나다순으로 정렬하여 제공하는 것을 특징으로 하는 지점검색 제공 방법.And if the point search results cannot be provided in order of location close to the search requester, the point search results are arranged in alphabetical order with respect to the title of the point. 제1항 내지 제10항, 제13항 내지 제17항 또는 제19항 내지 제21항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.A computer-readable recording medium having recorded thereon a program for executing the method of any one of claims 1 to 10, 13 to 17, or 19 to 21. 입력된 검색키워드를 이용하여 사이트 색인 검색을 수행하는 사이트 검색부; A site search unit for performing a site index search using the input search keyword; 상기 사이트 색인 검색을 통해 검색된 사이트를 크롤하는 사이트 크롤부;A site crawler that crawls a site searched through the site index search; 상기 검색된 사이트에서 크롤된 웹데이터로부터 지점(branch office)정보를 수집하는 지점정보 수집부; 및A branch information collecting unit which collects branch office information from web data crawled in the searched site; And 상기 수집된 지점정보에 따른 지점검색 결과를 제공하는 검색결과 제공부Search result providing unit for providing a branch search results according to the collected branch information 를 포함하고,Including, 상기 지점검색 결과는,The point search results, 상기 검색키워드로 색인된 사이트 검색결과와 함께 제공되는 것을 특징으로 하는 지점검색 제공 시스템.And a site search result indexed with the search keyword. 제23항에 있어서,The method of claim 23, wherein 상기 검색키워드가 지역명과 결합한 형태로 검색되는 경우에 검색키워드 부분을 집계하는 검색키워드 카운터; 및A search keyword counter for counting a search keyword portion when the search keyword is searched in combination with a region name; And 상기 집계된 검색키워드 부분에 기초한 상기 검색키워드와 지역명이 결합한 형태로 검색되는 지점검색 비율을 이용하여 상기 검색키워드가 지점검색 키워드 대상인지 여부를 판단하는 지점검색 키워드 판단부A branch search keyword determination unit that determines whether the search keyword is the target of the branch search keyword by using the branch search ratio searched by combining the search keyword and the region name based on the aggregated search keyword portion. 를 더 포함하는 지점검색 제공 시스템.Point search providing system further comprising. 제24항에 있어서,The method of claim 24, 상기 사이트 검색부는,The site search unit, 상기 지점검색 키워드 판단부가 상기 검색키워드를 상기 지점검색 키워드 대상으로 판단하는 경우 입력된 상기 검색키워드를 이용하여 사이트 색인 검색을 수행하는 것을 특징으로 하는 지점검색 제공 시스템.And the site search keyword determining unit performs a site index search using the input search keyword when the search keyword is determined as the target of the site search keyword. 제24항에 있어서,The method of claim 24, 상기 지점검색 키워드 판단부는,The point search keyword determination unit, 전체 지점검색에 대해 상기 검색키워드와 지역명이 결합한 형태로 검색되는 지점검색 비율이 미리 설정한 지점검색 비율의 기준치를 초과하는 경우, 상기 검색키워드를 지점검색 키워드 대상이라고 판단하는 것을 특징으로 하는 지점검색 제공 시스템. If the ratio of the branch search that is searched in the form of combining the search keyword and the region name for the entire branch search exceeds the threshold value of the preset branch search ratio, the branch search is determined to be the subject of the branch search keyword. Provide system. 제26항에 있어서,The method of claim 26, 상기 지점검색 키워드 판단부는,The point search keyword determination unit, 상기 검색키워드에 대해 지점검색 서비스가 제공 중이고 상기 검색키워드만의 형태로 검색되는 경우, 지점검색 키워드 대상 판단시 전체 지점검색에 대해 상기 검색키워드와 지역명이 결합한 형태로 검색되는 지점검색 비율에 미리 설정한 기준 할인율을 적용하는 것을 특징으로 하는 지점검색 제공 시스템. When a branch search service is provided for the search keyword and the search keyword is searched only in the form of the search keyword, a predetermined value is set to the rate of the branch search which is searched by combining the search keyword and the region name for the entire branch search when determining the target of the branch search keyword. Branch search providing system, characterized in that to apply a reference discount rate. 제27항에 있어서,The method of claim 27, 상기 기준 할인율은,The standard discount rate is, 상기 검색키워드의 지점검색 가중치에 상기 검색키워드로 검색되는 빈도를 지점검색전 전체 검색 빈도를 나눈 값을 곱하여 구하는 것을 특징으로 하는 지점검색 제공 시스템. And a point search weight of the search keyword is multiplied by a value obtained by dividing the total search frequency before the point search by the frequency searched with the search keyword. 제24항에 있어서,The method of claim 24, 상기 사이트 검색부는,The site search unit, 상기 지점검색 키워드 판단부가 상기 검색키워드를 상기 지점검색 키워드 대 상이 아니라고 판단하는 경우, 입력된 상기 검색키워드를 이용하여 사이트 색인 검색을 수행하는 것을 특징으로 하고,When the site search keyword determination unit determines that the search keyword is not the target site search keyword, site index search is performed using the input search keyword. 상기 검색결과 제공부는,The search result providing unit, 지점검색 결과가 포함되지 않은 상기 검색키워드로 색인된 사이트의 검색결과를 제공하는 것을 특징으로 하는 지점검색 제공 시스템.And provide a search result of the site indexed by the search keyword that does not include the point search result. 제23항에 있어서,The method of claim 23, wherein 상기 지점정보 수집부는, The point information collecting unit, 상기 크롤된 웹데이터에 지점을 명시하는 단어가 존재하거나 또는 지역명이 존재하면 지점정보를 수집하는 것을 특징으로 하고,If there is a word specifying a point in the crawled web data or a local name is characterized in that to collect branch information, 상기 지점을 명시하는 단어는,The word specifying the point is 지점, 가맹점, 분점, 대리점, 체인점 또는 매장 중 적어도 하나를 포함하는 지점검색 제공 시스템.Branch search providing system comprising at least one of a branch, affiliated stores, branches, agents, chain stores or stores. 제23항에 있어서,The method of claim 23, wherein 상기 지점정보 수집부는, The point information collecting unit, 상기 크롤된 웹데이터를 이용하여 지점 페이지지수를 계산하는 지점 페이지지수 계산부; 및A branch page index calculator for calculating branch page indexes using the crawled web data; And 상기 계산한 지점 페이지지수를 미리 설정한 지점 페이지지수에 대한 임계값과 비교하는 지점 페이지지수 비교부A branch page index comparison unit comparing the calculated branch page index with a threshold for a preset branch page index 를 포함하고,Including, 상기 지점 페이지지수 계산부는,The point page index calculation unit, 상기 크롤된 웹데이터로부터 추출한 지점 가중치와 지역 가중치를 이용하여 하기 수학식 3을 통해 계산하는 것을 특징으로 하는 지점검색 제공 시스템.Point search system using the point weight and the local weight extracted from the crawled web data through the following equation (3). 지점 페이지지수=Branch Page Index =
Figure 112008066795184-pat00003
Figure 112008066795184-pat00003
여기서, 상기 지점 가중치는 지점 단어에 대한 가중치이고, 상기 지점을 지칭하는 단어는 지점, 분점, 대리점 및 가맹점을 포함하는 지점을 내포하는 단어이고, 상기 지역 가중치는 지역 단어에 대한 가중치이고, 상기 지역을 지칭하는 단어는 국가 행정동, 법정 동코드에서 추출된 지역명을 나타냄.Here, the branch weight is a weight for a branch word, and the word indicating the branch is a word containing a branch including a branch, a branch, an agency, and an affiliate store, and the region weight is a weight for a region word, and the region The word refers to the name of the region extracted from the national administrative and legal codes.
제31항에 있어서,The method of claim 31, wherein 상기 임계값은,The threshold is 검색키워드로 색인된 사이트의 페이지에 지점정보가 존재할 수 있는 최소의 지점 페이지지수인 것을 특징으로 하는 지점검색 제공 시스템.A branch search index providing system, characterized in that the minimum branch page index that the branch information may exist in the pages of the site indexed by the search keyword. 제31항에 있어서,The method of claim 31, wherein 상기 지점 페이지지수가 미리 설정한 지점 페이지지수에 대한 임계값을 초과하는 경우, 상기 크롤된 웹데이터로부터 지점정보를 파싱하는 지점정보 파싱부A branch information parsing unit for parsing branch information from the crawled web data when the branch page index exceeds a threshold for a preset branch page index. 를 더 포함하고, More, 상기 지점정보 파싱부는,The point information parsing unit, 상기 크롤된 웹데이터에서 지점명, 지점 주소, 지점 전화번호로 파싱하는 것을 특징으로 하는 지점검색 제공 시스템.Point search system, characterized in that parsing from the crawled web data to a branch name, branch address, branch telephone number. 제31항에 있어서,The method of claim 31, wherein 상기 지점 페이지지수 계산부는,The point page index calculation unit, 상기 지점 페이지지수가 미리 설정한 지점 페이지지수에 대한 임계값을 초과하지 못하는 경우, 해당 사이트의 제목과 지역명이 결합된 검색키워드로 색인된 사이트에서 크롤된 웹데이터를 이용하여 지점 페이지지수를 다시 계산하는 것을 특징으로 하는 지점검색 제공 시스템.If the branch page index does not exceed a threshold for a preset branch page index, the branch page index is recalculated using web data crawled from a site indexed by a search keyword combining the site title and region name. Point search providing system, characterized in that. 제31항에 있어서,The method of claim 31, wherein 상기 크롤된 웹데이터로부터 수집한 지점정보를 조직화하는 지점정보 관리부Branch information management unit for organizing the branch information collected from the crawled web data 를 더 포함하고,More, 상기 지점정보 관리부는,The branch information management unit, 상기 크롤된 웹데이터로부터 파싱된 지점정보를 분리하여, 항목별로 저장하는 것을 특징으로 하는 지점검색 제공 시스템.A system for providing a point search, wherein the parsed point information is separated from the crawled web data and stored for each item. 제23항에 있어서,The method of claim 23, wherein 상기 검색결과 제공부는,The search result providing unit, 상기 검색키워드의 본점 정보를 포함하는 지점검색 결과를 제공하는 것을 특징으로 하는 지점검색 제공 시스템.Point search providing system comprising a point search result including the main information of the search keyword. 제36항에 있어서,The method of claim 36, 상기 검색결과 제공부는,The search result providing unit, 상기 지점정보를 이용하여 상기 지점검색 결과를 검색요청자로부터 가까운 위치 순서대로 제공하는 것을 특징으로 하는 지점검색 제공 시스템.And providing the point search results in the order of location close to the search requester using the point information. 제37항에 있어서,The method of claim 37, 상기 검색결과 제공부는,The search result providing unit, 상기 지점검색 결과를 검색요청자로부터 가까운 위치 순서대로 제공할 수 없는 경우, 상기 지점검색 결과를 지점의 제목에 대해서 가나다순으로 정렬하여 제공하는 것을 특징으로 하는 지점검색 제공 시스템.And when the location search results cannot be provided in order of location close to the search requester, the location search results are arranged in alphabetical order with respect to the title of the location.
KR1020070029456A 2007-03-26 2007-03-26 Method and system for offering branch office search KR100906927B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070029456A KR100906927B1 (en) 2007-03-26 2007-03-26 Method and system for offering branch office search

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070029456A KR100906927B1 (en) 2007-03-26 2007-03-26 Method and system for offering branch office search

Publications (2)

Publication Number Publication Date
KR20080087358A KR20080087358A (en) 2008-10-01
KR100906927B1 true KR100906927B1 (en) 2009-07-10

Family

ID=40150021

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070029456A KR100906927B1 (en) 2007-03-26 2007-03-26 Method and system for offering branch office search

Country Status (1)

Country Link
KR (1) KR100906927B1 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010104871A (en) * 2000-05-16 2001-11-28 임갑철 System for internet site search service having a function of automatic sorting of search results
KR20020010221A (en) * 2000-07-27 2002-02-04 송지용 a goods and shops search from map in internet
KR20020028044A (en) * 2000-10-06 2002-04-15 김 좌우태 Database link keyword portal service method
KR20030000691A (en) * 2001-06-26 2003-01-06 (주)넷피아닷컴 System for providing nfomations related a location using keyword name and method thereof
KR20040062815A (en) * 2003-01-03 2004-07-09 정효진 Method for intermediating store at electronic commerce and computer readable record medium on which a program therefor is recorded
KR20050029152A (en) * 2005-02-04 2005-03-24 (주)엔알시스템스 System and method for interpersonal intermediating electronic commerce using the personal wed site

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010104871A (en) * 2000-05-16 2001-11-28 임갑철 System for internet site search service having a function of automatic sorting of search results
KR20020010221A (en) * 2000-07-27 2002-02-04 송지용 a goods and shops search from map in internet
KR20020028044A (en) * 2000-10-06 2002-04-15 김 좌우태 Database link keyword portal service method
KR20030000691A (en) * 2001-06-26 2003-01-06 (주)넷피아닷컴 System for providing nfomations related a location using keyword name and method thereof
KR20040062815A (en) * 2003-01-03 2004-07-09 정효진 Method for intermediating store at electronic commerce and computer readable record medium on which a program therefor is recorded
KR20050029152A (en) * 2005-02-04 2005-03-24 (주)엔알시스템스 System and method for interpersonal intermediating electronic commerce using the personal wed site

Also Published As

Publication number Publication date
KR20080087358A (en) 2008-10-01

Similar Documents

Publication Publication Date Title
KR101076894B1 (en) System and method for incorporating anchor text into ranking search results
JP4944405B2 (en) Phrase-based indexing method in information retrieval system
JP4944406B2 (en) How to generate document descriptions based on phrases
JP4976666B2 (en) Phrase identification method in information retrieval system
JP5175005B2 (en) Phrase-based search method in information search system
KR100304335B1 (en) Keyword Extraction System and Document Retrieval System Using It
US6389412B1 (en) Method and system for constructing integrated metadata
EP2289007B1 (en) Search results ranking using editing distance and document information
US7792833B2 (en) Ranking search results using language types
KR100544514B1 (en) Method and system for determining relation between search terms in the internet search system
Thelwall Extracting accurate and complete results from search engines: Case study Windows Live
US20130144834A1 (en) Uniform resource locator canonicalization
JP2005525655A (en) Document relevance ranking apparatus and method capable of dynamically setting according to area
US20100131485A1 (en) Method and system for automatic construction of information organization structure for related information browsing
US20110208715A1 (en) Automatically mining intents of a group of queries
JP2010536086A (en) User-centric information search method and system
JP2003173352A (en) Retrieval log analysis method and device, document information retrieval method and device, retrieval log analysis program, document information retrieval program and storage medium
KR100906927B1 (en) Method and system for offering branch office search
KR100667917B1 (en) A method of providing website searching service and a system thereof
KR100931772B1 (en) A method of providing website searching service and a system thereof
KR20040098889A (en) A method of providing website searching service and a system thereof
KR100942902B1 (en) A method of searching web page and computer readable recording media for recording the method program
JP2011086156A (en) System and program for tracking of leaked information
KR100610775B1 (en) A method of managing registered web sites in search engine and a system thereof
JP2001282837A (en) Information gathering device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120629

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130626

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150701

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160701

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 11