KR100943625B1 - 지역 정보와 웹사이트 정보의 통합 관리를 위한 통합데이터베이스 생성 방법 및 시스템과 그에 의해 생성된통합 데이터베이스를 이용한 검색 결과 제공 방법 - Google Patents

지역 정보와 웹사이트 정보의 통합 관리를 위한 통합데이터베이스 생성 방법 및 시스템과 그에 의해 생성된통합 데이터베이스를 이용한 검색 결과 제공 방법 Download PDF

Info

Publication number
KR100943625B1
KR100943625B1 KR1020070093835A KR20070093835A KR100943625B1 KR 100943625 B1 KR100943625 B1 KR 100943625B1 KR 1020070093835 A KR1020070093835 A KR 1020070093835A KR 20070093835 A KR20070093835 A KR 20070093835A KR 100943625 B1 KR100943625 B1 KR 100943625B1
Authority
KR
South Korea
Prior art keywords
information
integrated
website
database
field
Prior art date
Application number
KR1020070093835A
Other languages
English (en)
Other versions
KR20090028326A (ko
Inventor
강춘식
김형곤
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020070093835A priority Critical patent/KR100943625B1/ko
Publication of KR20090028326A publication Critical patent/KR20090028326A/ko
Application granted granted Critical
Publication of KR100943625B1 publication Critical patent/KR100943625B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

정보 및 웹사이트 정보를 통합하여 관리하기 위한 본 발명의 일 실시예에 따른 통합 데이터베이스 생성 방법은, 통합 대상이 되는 지역 정보 및 웹사이트 정보를 선정하는 단계; 상기 선정된 지역 정보 및 웹사이트 정보 중 어느 하나의 정보를 통합 정보로 결정하는 단계; 및 상기 결정된 통합정보를 데이터베이스화함으로써 통합 데이터베이스를 생성하는 단계를 포함한다.
이러한 본 발명에 따르면 지역 정보 및 웹사이트 정보 중 공통되는 정보들을 통합하여 통합 데이터베이스를 생성함으로써 검색 서비스 제공자는 데이터의 중복 관리를 방지할 수 있고, 사용자는 한번의 수정작업으로 웹사이트 정보와 지역 정보를 동시에 수정할 수 있다는 효과가 있다.
웹사이트 정보, 지역 정보, 검색

Description

지역 정보와 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법 및 시스템과 그에 의해 생성된 통합 데이터베이스를 이용한 검색 결과 제공 방법 {Method and System for Generating Integrated Database for Integradedly Managing Local Information and Website Information and Method for Providing Search Result Using Integrated Database}
본 발명은 검색 서비스 제공을 위한 정보 관리 방법에 관한 것으로서 보다 구체적으로 검색 서비스 제공을 위한 지역 정보 및 웹사이트 정보를 통합하여 관리하는 방법에 관한 것이다.
인터넷을 이용하여 제공되는 다양한 서비스 중 하나인 검색 서비스는 사용자가 입력하는 소정의 검색 질의어에 대해 검색을 수행한 후 검색 질의어에 상응하는 검색 결과를 사용자에게 제공하는 서비스를 의미한다.
이러한 검색 서비스의 제공을 위해 검색 서비스 제공자는 미리 웹사이트들에 대한 정보를 수집한 후 이를 색인하여 저장함으로써 데이터베이스를 구축하고, 사용자로부터 검색이 요청되는 경우 데이터베이스에 저장된 웹사이트 정보들을 검색함으로써 해당 결과를 사용자에게 제공한다.
그러나, 최근 많은 수의 웹사이트가 생성됨에 따라 검색 서비스 제공자가 저장 및 관리해야 하는 데이터의 양이 급증하게 되었고, 이와 같이 급증하는 데이터 중에서 어떠한 데이터가 가치 있는 것인지를 평가하는 것이 어렵게 되었다.
이와 같은 문제점을 해결하기 위해 검색 서비스 제공자는 사용자로부터 직접 웹사이트 정보 등록 요청을 받아 이를 검색 엔진에 등록하는 서비스와 사용자로부터 직접 업체의 지역 정보 등록 요청을 받아서 이를 검색엔진에 등록하는 서비스를 제공하게 되었다.
웹사이트 정보 등록 서비스는 도 1a에 도시된 바와 같은 인터페이스를 통해 입력된 소정 웹사이트 URL이 이미 등록된 것이 아닌 경우 별도의 인터페이스(미도시)를 제공하여 사용자가 업체의 웹사이트에 관한 추가 정보, 예컨대, 웹사이트의 카테고리 분류, 웹사이트의 설명, 업체명과 같은 웹사이트의 제목, 업체의 주소 또는 전화번호 등을 직접 입력할 수 있도록 함으로써 검색 결과에서 업체의 웹사이트에 관한 정보가 정확하게 노출되도록 하는 것을 의미한다.
한편, 지역 정보 등록 서비스는 도 1b에 도시된 바와 같은 인터페이스를 통해 입력된 소정 업체의 대표 전화번호가 이미 등록된 것이 아닌 경우 별도의 인터페이스(미도시)를 제공하여 사용자가 업체에 관한 정보, 예컨대, 업체명, 업체의 주소, 업체의 설명, 업종, 대표 이미지 등을 직접 입력할 수 있도록 함으로써 검색결과에서 사용자의 업체에 관한 정보가 정확하게 노출되도록 하는 것을 의미한다.
그러나, 이러한 종래의 웹사이트 정보 등록 서비스나 지역 정보 등록 서비스의 경우 각 업체의 웹사이트 정보와 지역 정보가 별도의 데이터베이스를 통해 관리 되고 있었다. 이로 인해 검색 서비스 제공자는 데이터를 중복적으로 관리하게 된다는 불편함이 있었고, 사용자는 자신의 업체 정보를 수정하기 원하는 경우 동일한 내용임에도 불구하고 업체의 웹사이트 정보와 지역 정보를 각각 별도로 수정하여야 한다는 불편함이 있었다.
또한, 업체 정보들이 별도의 데이터베이스에서 관리되고 있기 때문에, 검색 서비스 이용자로부터 소정 업체(예컨대, 서울특별시청)에 대한 검색이 요청되는 경우, 도 2에 도시된 바와 같이, 해당 업체에 대한 정보가 검색결과 내에서 웹사이트 정보 제공 섹션(10)과 지역 정보 제공 섹션(12)을 통해 중복되어 제공된다는 문제점도 있었다.
한편, 이와는 별도로 종래의 웹사이트 정보 등록 서비스의 경우 유료 서비스 운영되었기 때문에, 경제적 능력이 없는 중소기업 들의 경우 자신들의 웹사이트 정보를 등록할 수 없게 되어 검색의 커버리지가 감소된다는 문제점도 있었다.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 지역 정보 및 웹사이트 정보를 통합하여 관리하기 위한 통합 데이터베이스 생성 방법 및 시스템을 제공하는 것을 기술적 과제로 한다.
또한, 본 발명은 웹사이트 정보와 지역 정보를 동시에 입력받되, 입력된 정보들을 분류하여 저장할 수 있는 통합 데이터베이스 생성 방법 및 시스템을 제공하는 것을 다른 기술적 과제로 한다.
또한, 본 발명은 소정 업체에 대한 검색 요청이 수신되는 경우 검색 결과 내에서 하나의 섹션을 통해 웹사이트 정보와 지역 정보를 통합하여 제공할 수 있는 통합 데이터베이스를 이용한 검색 방법 및 시스템을 제공하는 것을 또 다른 기술적 과제로 한다.
상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 통합 데이터베이스 생성 방법은 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법으로서, 통합 대상이 되는 지역 정보 및 웹사이트 정보를 선정하는 단계; 상기 선정된 지역 정보 및 웹사이트 정보 중 어느 하나의 정보를 통합 정보로 결정하는 단계; 및 상기 결정된 통합정보를 데이터베이스화함으로써 통합 데이터베이스를 생성하는 단계를 포함한다.
이때, 상기 통합 대상이 되는 지역 정보 및 웹사이트 정보의 선정 단계에서 상기 지역 정보들과 웹사이트 정보들 간의 유사도가 임계치 이상인 지역 정보와 웹사이트 정보를 통합 대상으로 선정하는 것을 특징으로 한다.
일 실시예에 있어서, 상기 지역 정보 및 상기 웹사이트 정보는 각각 복수개의 데이터 필드로 구성되며, 상기 통합 정보 결정 단계 이전에 상기 지역 정보의 데이터 필드와 상기 웹사이트 정보의 데이터 필드 중 서로 공통되는 데이터 필드를 추출하는 단계를 더 포함할 수 있는데, 이때 상기 유사도는 상기 지역 정보 및 웹사이트 정보의 데이터 필드간 유사도를 산출하고, 산출된 각 데이터 필드간 유사도에 상기 데이터 필드별 가중치를 곱한값들을 합산함으로써 산출된다.
또한, 상기 통합 정보 결정 단계에서 상기 통합 정보는 상기 추출된 데이터 필드별로 결정하되, 상기 웹사이트 정보의 데이터 필드 및 지역 정보의 데이터 필드 중 어느 하나에 기록된 데이터를 각 필드별 통합 정보로 결정할 수 있다. 이때, 상기 공통되는 데이터 필드는 유알엘(URL: Uniform Resource Locator)필드, 전화번호 필드, 주소 필드, 제목 필드, 및 설명 필드 중 적어도 하나를 포함하는 것을 특징으로 한다.
한편, 상기 통합 데이터베이스 생성 방법은, 사용자로부터 소정 업체의 정보 등록 요청을 수신하는 단계; 및 상기 등록 요청된 소정 업체의 정보 중 제1 데이터 클래스에 속하는 정보는 상기 통합 데이터베이스에 저장하고, 제2 데이터 클래스에 속하는 정보는 상기 지역 정보가 저장되는 지역 정보 데이터베이스에 저장하고 제3 데이터 클래스에 속하는 정보는 상기 웹사이트 정보가 저장되는 웹사이트 정보 데이터베이스에 저장하는 단계를 더 포함할 수 있다.
상술한 목적을 달성하기 위한 본 발명의 다른 측면에 따른 통합 데이터베이스 생성 시스템은 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템으로서, 통합 대상이 되는 지역 정보 및 웹사이트 정보를 선정하는 통합 대상 선정부; 상기 통합 대상 선정부에 의해 선정된 지역 정보 및 웹사이트 정보 중 어느 하나의 정보를 통합 정보로 결정하는 통합 정보 결정부; 및 상기 통합 정보 결정부에 의해 결정된 통합정보를 데이터베이스화함으로써 통합 데이터베이스를 생성하는 통합 데이터베이스 생성부를 포함한다.
한편, 상술한 다른 목적을 달성하기 위한 본 발명의 일 측면에 따른 통합 데이터베이스를 이용한 검색결과 제공방법은, 검색 서비스 이용자로부터 검색 요청을 수신하는 단계; 상기 검색 요청에 포함된 검색어가 상기 통합 정보에 관련된 것인 경우 상기 통합 데이터베이스를 검색하여 검색결과를 생성하는 단계; 및 상기 검색결과를 상기 검색 서비스 이용자에게 제공하는 단계를 포함한다.
상술한 바와 같이 본 발명에 따르면, 지역 정보 및 웹사이트 정보 중 공통되는 정보들을 통합하여 통합 데이터베이스를 생성함으로써 검색 서비스 제공자는 데이터의 중복 관리를 방지할 수 있고, 사용자는 한번의 수정작업으로 웹사이트 정보와 지역 정보를 동시에 수정할 수 있다는 효과가 있다.
또한, 본 발명은 웹사이트 정보와 지역 정보를 하나의 인터페이스를 통해 동시에 입력받되, 입력된 정보들 중 사전에 정해진 정보들을 분류하여 별도로 저장함으로써 공통되는 데이터는 통합적으로 관리할 수 있다는 효과가 있다.
또한, 본 발명은 소정 업체에 대한 검색 요청이 수신되는 경우 검색 결과 내에서 하나의 섹션을 통해 웹사이트 정보와 지역 정보를 통합하여 제공함으로써 검색결과의 중복을 제거할 수 있어 검색 서비스의 퀄러티를 향상시킬 수 있다는 효과가 있다.
이하 첨부된 도면을 참조하여 본 발명의 실시예에 대해 상세히 설명한다. 먼저, 도 3을 참조하여 지역 정보와 웹사이트 정보의 통합 관리를 위해 통합 데이터베이스를 생성하는 실시예에 대해 설명한다.
도 3은 본 발명의 일 실시예에 따른 통합 데이터베이스 생성 시스템의 개략적인 블록도이다. 도시된 바와 같이, 통합 데이터 베이스 생성 시스템(14)은 웹사이트 정보 데이터베이스(16), 지역 정보 데이터베이스(18), 통합 대상 선정부(20), 데이터 필드 추출부(21), 통합 정보 결정부(22), 통합 데이터베이스 생성부(24), 및 통합 데이터베이스(26)를 포함한다.
웹사이트 정보 데이터베이스(16, 이하 '제1 DB'라 함)에는 도 1a에 도시된 인터페이스를 통해 등록 요청된 웹사이트 정보가 저장되어 있고, 지역 정보 데이터베이스(18, 이하 '제2 DB'라 함)에는 도 1b에 도시된 인터페이스를 통해 등록 요청된 지역 정보가 저장되어 있다.
일 실시예에 있어서, 상술한 제1 DB(16) 및 제2 DB(18)에 각각 저장되어 있는 웹사이트 정보와 지역 정보는 복수개의 데이터 필드들로 구성되어 있다. 예컨대, 제1 DB(16)에 저장되어 있는 웹사이트 정보는 웹사이트의 URL, 전화번호, 주 소, 업체명과 같은 웹사이트 제목, 웹사이트의 설명, 웹사이트가 속하는 카테고리 분류, 웹사이트의 소유자 정보 등의 데이터 필드로 구성된다.
한편, 제2 DB(18)에 저장되어 있는 지역 정보는 업체의 명칭, 업체의 주소 또는 전화번호, 업체의 설명, 업체의 웹사이트 URL(Uniform Resource Locator), 업종, 약도 등의 데이터 필드로 구성된다.
상술한 실시예에 있어서는 통합 데이터베이스 생성 시스템(14)이 제1 DB(16) 및 제2 DB(18)를 직접 포함하는 것으로 기재하였지만, 변형된 실시예에 있어서 통합 데이터베이스 생성 시스템에(14)은 제1 DB(16) 및 제2 DB(18)를 직접 포함하지 않고, 외부 서버(미도시)에 포함된 데이터베이스를 이용할 수도 있을 것이다.
다시 도 3을 참조하면, 통합 대상 선정부(20)는 제1 DB(16)에 저장된 웹사이트 정보들과 제2 DB(18)에 저장된 지역 정보들 중 통합 대상이 되는 웹사이트 정보와 지역 정보를 선정한다. 즉, 통합 대상 선정부(20)는 동일한 업체에 관한 정보임에도 불구하고 제1 DB(16)와 제2 DB(18)에 각각 별도로 저장되고 있었던 업체 정보(웹사이트 정보 및 지역 정보)를 통합하기 위해 통합 대상이 되는 웹사이트 정보와 지역 정보를 선정하는 것이다.
일 실시예에 있어서, 통합 대상 선정부(20)는 통합 대상을 선정함에 있어서 제1 DB(16)에 저장되어 있는 웹사이트 정보들과 제2 DB(18)에 저장되어 있는 지역 정보들간의 유사도를 산출하고, 산출된 유사도가 임계치 이상인 지역 정보와 웹사이트 정보를 통합 대상으로 선정한다. 예컨대, 웹사이트 정보와 지역 정보 간의 유사도를 산출한 결과 웹사이트 정보들 중 제1 웹사이트 정보와 지역 정보들 중 제 1 지역 정보의 유사도가 임계치 이상인 경우 제1 웹사이트 정보와 제1 지역 정보는 동일한 업체에 관한 정보를 나타내는 것으로 판단하여 통합 대상으로 선정하는 것이다.
이러한 과정에서 임계치 이상인 정보가 하나 이상인 경우, 예컨대, 제1 웹사이트 정보와의 유사도가 임계치 이상인 지역 정보가 복수개인 경우에는, 이러한 지역 정보들 중 제1 웹사이트 정보와의 유사도가 가장 높은 지역 정보를 제1 웹사이트 정보와 통합 대상이 되는 지역 정보로 선정한다.
일 실시예에 있어서, 통합 대상 선정부(20)는 웹사이트 정보의 데이터 필드들과 지역 정보의 데이터 필드들 중 사전에 정해진 데이터 필드들간의 유사도를 산출하고, 산출된 필드간 유사도에 각 필드의 가중치를 곱한 값들을 합산함으로써 웹사이트 정보와 지역 정보간의 유사도를 산출할 수 있다. 여기서, 사전에 정해진 데이터 필드란 웹사이트 정보의 데이터 필드와 지역 정보의 데이터 필드 중 서로 공통되는 필드(공통되는 필드란 각 필드에 기록되는 데이터가 공통되는 것을 의미함)를 의미하는 것으로서, 일 실시예에 있어서, URL 필드, 전화번호 필드, 주소 필드, 제목 필드, 설명 필드 중 적어도 하나를 포함한다. 여기서, 제목필드란 업체의 명칭 또는 웹사이트의 제목이 기록되는 필드를 의미한다.
서로 공통되는 데이터 필드의 추출을 위해 통합 데이터베이스 생성 시스템(10)은 데이터 필드 추출부(21)를 더 포함할 수 있다. 즉, 데이터 필드 추출부(21)는 웹사이트 정보의 데이터 필드와 지역 정보의 데이터 필드들 중 서로 공통되는 데이터 필드인 URL필드, 전화번호 필드, 주소 필드, 제목 필드, 설명 필드 중 적어도 하나를 추출하는 것이다. 상술한 실시예에 있어서 데이터 필드 추출부(21)는 URL필드, 전화번호 필드, 주소 필드, 제목 필드, 설명 필드를 추출하는 것으로 기재하였지만, 서로 공통되는 데이터가 기록되어 있는 필드라면 이에 한정되지 않고 다른 데이터 필드를 추출할 수도 있을 것이다.
따라서, 통합 대상 선정부(20)는 데이터 필드 추출부(21)에 의해 추출된 데이터 필드 간의 유사도를 산출하고, 산출된 필드간 유사도에 각 필드별로 정해져 있는 가중치를 곱한 값을 합산으로써 웹사이트 정보와 지역 정보간의 유사도를 산출하게 된다. 일 실시예에 있어서, 각 필드별 유사도는 각 필드에 기록되어 있는 데이터 스트링이 일치하는 정도를 기준으로 산출하게 되고, 각 필드별 가중치의 크기는 URL 필드, 전화번호 필드, 주소 필드, 제목 필드, 설명 필드 순으로 정해져 있다. 이러한 가중치로 순서로 인해 URL 필드에 기록된 URL데이터가 공통되는 웹사이트 정보와 지역 정보가 통합 대상으로 선정될 확률이 높아지게 된다.
이하에서는, 각 필드별 유사도 산출 방법에 대해 구체적으로 설명한다.
먼저, URL필드간 유사도의 경우, URL필드간 유사도란 웹사이트 정보의 URL필드에 기록되어 있는 URL과 지역 정보의 URL필드에 기록되어 있는 URL이 일치하는 정도를 나타내는 것으로서, URL필드의 유사도는 각 URL필드에 기록된 URL데이터를 정규화한 후 URL을 비교함으로써 결정된다.
여기서, URL데이터의 정규화는 URL에 포함되어 있는 모든 공백을 제거하고, URL의 끝에 "/"가 포함되어 있지 않은 경우 해당 URL의 끝에 "/"를 포함시키며, URL이 "http://"로 시작하지 않으면, URL의 처음에 "http://"를 붙이고, 호스트 네 임이 "www"로 시작하지 않는 경우 해당 호스트 네임이 원래 URL에 매칭되지 않으면 "www"를 붙여주는 과정을 포함한다. 이러한 과정을 통해 각 URL을 정규화한 후 각 URL 데이터를 서로 비교함으로써 유사도를 산출하는 것이다.
다음으로, 전화번호 필드간 유사도의 경우, 전화번호 필드의 유사도란 웹사이트 정보의 전화번호 필드에 기록되어 있는 전화번호와 지역 정보의 전화번호 필드에 기록되어 있는 전화번호가 일치하는 정도를 나타내는 것으로서, 전화번호의 유사도는 전화번호 데이터를 정규화한 후 각 전화번호를 비교함으로써 결정된다.
여기서, 전화번호 데이터의 정규화는 전화번호 데이터에 포함되어 있는 모든 공백을 제거하고, 전화번호 데이터에 포함된 데이터 중 숫자와 "-" 이외의 데이터는 모두 삭제하는 것을 포함한다. 이때, 필요에 따라 전화번호 데이터에 포함된 "-"도 삭제할 수 있을 것이다. 이러한 과정을 통해 전화번호 데이터를 정규화한 후 전화번호 데이터를 서로 비교함으로써 전화번호 필드의 유사도를 산출하는 것이다.
주소 필드간 유사도의 경우에도 각 필드에 기록된 주소 데이터를 정규화한 후 각 데이터를 비교함으로써 유사도를 산출하게 되는데, 주소 데이터의 정규화는 주소필드에 기록된 주소 데이터를 공백을 기준으로 분리한 다음 "읍|면|동"까지만 유효한 데이터로 간주하고 그 이후의 데이터는 제거하는 것을 의미한다. 이러한 과정을 통해 주소 데이터를 정규화한 후 주소 데이터를 서로 비교함으로써 주소 필드의 유사도를 산출한다.
제목 필드간 유사도의 경우에도 각 필드에 기록된 제목 데이터를 정규화한 후 각 데이터를 비교함으로써 유사도를 산출하게 되는데, 제목 데이터의 정규화는 제목 필드에 기록된 제목 데이터에서 모든 공백을 제거하는 것을 의미한다.
설명 필드간 유사도는 명사 추출기를 이용하여 각 설명 필드에 기재된 명사들을 추출하고 추출된 명사의 빈도수와 추출된 명사의 매칭 정도를 이용하여 결정된다. 구체적으로 추출된 모든 명사에 대해, 웹사이트 정보의 설명 필드에 기록된 소정 명사의 빈도수와 지역 정보의 설명 필드에 기록된 소정 명사의 빈도수의 합에 소정 명사의 일치도(즉, 웹사이트 정보의 설명필드에 기록된 소정 명사와 지역 정보의 설명 필드에 기록된 소정 명사가 일치하는 정도를 수치화한 것)를 곱한값을 산출하고, 이 값들을 모두 합산함으로써 설명 필드의 유사도를 산출한다.
한편, 명사 추출기를 이용하여 명사 추출과정에서 "정보", "제공" 등과 같은 모든 웹사이트나 지역 정보에 통상적으로 사용될 수 있는 단어들은 제거하는 것이 바람직하다.
통합 대상 선정부(20)는 상술한 과정을 통해 산출된 유사도가 임계치 이상인 웹사이트 정보와 지역 정보를 통합 대상으로 선정한다.
통합 정보 결정부(22)는 통합 대상 선정부(20)에 의해 선정된 지역 정보 및 웹사이트 정보 중 어느 하나의 정보를 통합 정보로 결정한다. 구체적으로, 통합 정보 결정부(22)는 데이터 필드 추출부(21)에 의해 추출된 각 데이터 필드마다 통합 정보를 결정하게 되는데, 이때 각 필드별 통합 정보는 웹사이트 정보의 데이터 필드 및 지역 정보의 데이터 필드 중 어느 하나의 데이터 필드에 기록된 데이터로 결정된다. 이하에서는 각 데이터 필드별로 통합 정보를 결정하는 방법에 대해 구 체적으로 설명한다.
먼저, URL 필드의 경우 통합 정보 결정부(22)는 웹사이트 정보의 URL필드에 기록된 데이터를 통합 정보로 결정한다. 이는 URL 데이터의 경우 웹사이트 정보에 기록된 URL 데이터가 훨씬 더 정확할 확률이 높기 때문이다.
전화번호 필드의 경우 통합 정보 결정부(22)는 웹사이트 정보의 전화번호 필드와 지역 정보의 전화번호 필드에 기록된 데이터 중 기 수집된 웹자원의 카피라이터(Copyright)부분에 기재되어 있는 전화번호 데이터와 가장 근접한 데이터를 통합 정보로 결정한다.
여기서, 웹자원이란 소정 업체명 또는 소정 업체의 URL을 검색어로 하여 웹로봇이 크롤링한 모든 HTML문서를 의미하는 것으로서, 웹자원의 카피라이터 부분에 기재된 전화번호 데이터에 근접한 데이터가 현재 많이 사용되고 있는 전화번호 데이터로 판단될 수 있기 때문에, 이러한 데이터에 근접한 데이터를 통합 정보로 결정하는 것이다. 이때, 웹사이트 정보 및 지역 정보의 전화번호 데이터가 웹자원에 기재된 전화번호 데이터에 근접한지 여부는 앞서 설명한 전화번호의 유사도 판단 방법을 이용할 수 있을 것이다.
주소 필드의 경우 통합 정보 결정부(22)는 전화번호 필드의 통합 정보 결정방법과 동일한 방법을 이용하여 통합 정보를 결정한다. 즉, 웹사이트 정보의 주소 필드와 지역 정보의 주소 필드에 기록된 데이터 중 기 수집된 웹자원의 카피라이터(Copyright)부분에 기재되어 있는 주소 데이터에 가장 근접한 데이터를 통합 정보로 결정하는 것이다.
제목 필드의 경우 통합 정보 결정부(22)는 웹사이트 정보의 제목 필드와 지역 정보의 제목 필드에 기록된 데이터 중 기 수집된 웹자원의 타이틀 태그(Title Tag)내에 기재된 단어에 근접한 데이터를 통합 정보로 결정한다. 변형된 실시예에 있어서는 웹사이트 정보의 제목 필드와 지역 정보의 제목 필드에 기록된 데이터 중 기 수집된 웹자원의 본문에 가장 많이 노출된 단어에 근접한 데이터를 제목 필드의 통합 정보로 결정할 수도 있다.
설명 필드의 경우 통합 정보 결정부(22)는 웹사이트 정보의 설명 필드와 지역 정보의 설명 필드에 기록된 데이터 중 기 수집된 웹자원의 본문에 노출된 단어들 중 상위 N개의 단어에 근접한 데이터를 설명 필드의 통합 정보로 결정할 수 있다. 예컨대, 웹사이트 정보의 설명필드에 기록된 설명 데이터 및 지역 정보의 설명 필드에 기록된 설명 데이터들 중 웹자원의 본문에 노출된 상위 N개의 단어가 더 많이 포함되어 있는 설명 데이터를 설명 필드의 통합 정보로 결정하는 것이다.
통합 데이터베이스 생성부(24, 이하 '통합 DB 생성부'라 함)는 상술한 통합 정보 결정부(22)에 의해 결정된 각 필드별 통합 정보를 데이터베이스화함으로써 통합 데이터베이스(26, 이하 '통합 DB'라 함)를 생성한다. 이때, 통합 DB 생성부(24)에 의해 생성되는 통합 DB (26)는 데이터 필드 추출부(21)에 의해 추출된 필드들로 구성되는데, 구체적으로, 도 4에 도시된 바와 같이 URL필드(26a), 전화번호 필드(26b), 주소 필드(26c), 제목 필드(26d), 설명 필드(26e)로 구성된다. 이러한 통합 DB(26)의 각 필드에는 통합 정보 결정부(22)에 의해 결정된 데이터가 기록된다.
상술한 실시예에 있어서는 제1 DB(16) 및 제2 DB(18)에 기 저장되어 있던 웹사이트 정보와 지역 정보를 통합하는 것에 대해서 설명하였고, 이하에서는 웹사이트 정보와 지역 정보를 통합 관리함에 있어서 신규 등록 정보를 처리하는 실시예에 대해서 설명하기로 한다.
종래에는 웹사이트 정보와 지역 정보가 서로 독립된 인터페이스를 통해 입력되었기 때문에, 상술한 바와 같은 데이터 통합 과정이 필요하였지만, 본 발명에서는 웹사이트 정보와 지역 정보를 입력함에 있어서, 하나의 인터페이스를 통해 동시에 입력할 수 있도록 함으로써 입력 정보들을 통합적으로 관리할 수 있다. 이를 위해 도 3에 도시된 통합 데이터베이스 생성 시스템은 도 5에 도시된 바와 같이 등록요청 수신부(28) 및 저장부(30)를 더 포함할 수 있다.
등록요청 수신부(28)는 사용자 단말기(32)를 통하여 사용자에게 소정 업체의 정보를 등록할 수 있는 인터페이스를 제공하고, 제공된 인터페이스를 통해 입력되는 업체의 정보를 수신한다. 여기서, 소정 업체의 정보란 소정 업체의 지역 정보 및 웹사이트 정보를 의미한다.
이때, 사용자에게 제공되는 인터페이스의 일 예가 도 6에 도시되어 있다. 먼저 도 6a에는 등록 인터페이스를 보여주는 도면으로서 도시된 바와 같이, 등록 인터페이스(33)는 크게 3가지 타입(34, 36, 38)의 선택 모드를 제공하는데, 제1 선택 모드(34)는 웹사이트 정보와 지역 정보를 모두 입력할 수 있는 모드로써, 사용자가 제1 선택 모드(34)를 선택하는 경우 웹사이트 URL 및 업체의 대표 전화번호를 입력할 수 있는 창(40)이 제공된다.
입력된 웹사이트 URL 및 업체의 대표 전화번호가 기 등록되지 않은 신규한 업체의 정보임이 확인된 경우 등록 요청 수신부(28)는 도 6b 내지 도 6d에 도시된 바와 같이 해당 업체의 세부 정보를 입력할 수 있는 상세 정보 입력 인터페이스(42)를 제공하는데, 이러한 상세 정보 입력 인터페이스(42)는 도 6b에 도시된 바와 같이 웹사이트 정보와 지역 정보 중 공통되는 정보를 입력할 수 있는 공통 정보 입력 창(44)과, 도 6c에 도시된 바와 같이 추가적인 웹사이트 정보 정보를 입력할 수 있는 웹사이트 정보 입력창(46)과, 도 6d에 도시된 바와 같이 추가적인 지역 정보를 입력할 수 있는 지역 정보 입력 창(48)을 포함한다. 한편, 도 6b에 도시된 상세 정보 입력 인터페이스(42)에서는 업체 정보의 등록을 요청하는 등록자 정보도 공통 정보로 간주하여 공통 정보 입력 창(44)을 통해 입력할 수 있도록 하였다.
다시 도 6a를 참조하면, 제2 선택 모드(36)는 웹사이트 정보를 입력하기 위한 모드로써, 사용자가 제2 선택 모드(36)를 선택하는 경우 웹사이트 URL을 입력할 수 있는 창(50)이 제공된다. 또한, 제3 선택 모드(38)는 지역 정보를 입력하기 위한 모드로써, 사용자가 제3 선택 모드(38)를 선택하는 경우 소정 업체의 대표 전화번호를 입력할 수 있는 창(52)이 제공된다. 사용자가 제2 또는 제3 선택 모드(36, 38)를 선택한 이후 등록 요청 수신부(28)는 상세 정보 입력 정보 인터페이스(미도시)를 제공함으로써 소정 업체의 웹사이트 정보 또는 지역 정보 중 어느 하나를 입력받게 된다.
즉, 도 6a에서 도시된 바와 같은 등록 인터페이스(33)를 통해 사용자는 제1 선택 모드(34)를 선택함으로써 종래에는 독립적으로 진행되었던 웹사이트 정보 등 록과 지역 정보 등록을 일괄적으로 처리할 수 있고, 제2 선택 모드(36) 또는 제3 선택 모드(38) 중 어느 하나를 선택함으로써 종래와 동일하게 웹사이트 정보 또는 지역 정보 중 어느 하나를 선택적으로 등록할 수도 있다.
다시 도 5를 참조하면, 저장부(30)는 등록 요청 수신부(28)에 의해 수신된 업체 정보를 분류하여 저장한다. 구체적으로, 사용자에 의해 제1 선택 모드(34)가 선택된 경우, 입력된 정보들 중 공통 정보 입력 창(40)을 통해 입력된 공통 정보들은 통합 DB(26)에 저장하고, 개별 정보 입력 창(46, 48)을 통해 입력된 정보들 중 웹사이트 정보에 관한 것은 제1 DB(16)에 저장하고, 지역 정보에 관한 것은 제2 DB(18)에 저장한다.
한편, 사용자에 의해 제2 선택 모드(36)가 선택된 경우, 입력된 정보들은 제1 DB(16)에 저장하고, 제3 선택 모드(38)가 선택된 경우 입력된 정보들은 제2 DB(18)에 저장한다.
상술한 실시예에 있어서는 제1 선택모드가 선택된 경우, 입력된 정보 중 공통 정보만을 통합 DB(26)에 저장하는 것으로 기재하였지만, 변형된 실시예에 있어서는 제1 선택모드가 선택된 경우 공통 정보는 물론 개별정보까지도 통합 DB(26)에 저장할 수도 있을 것이다.
다음으로, 상술한 통합 데이터베이스 생성 시스템을 이용하여 검색을 수행하는 실시예에 대해서 설명하기로 한다. 검색 기능을 수행하기 위해 상술한 통합 데이터베이스 생성 시스템은 도 7에 도시된 바와 같이 검색 요청 수신부(54), 검색결과 생성부(56), 및 검색결과 제공부(58)를 더 포함한다.
여기서, 도 7은 도 3에 도시된 통합 데이터베이스 생성 시스템에 검색 기능을 구현하기 위한 구성요소들을 포함시킨 것으로서, 도 7에 추가로 도시된 구성요소들을 도 5에 도시된 통합 데이터베이스 생성 시스템에 포함시킴으로써 도 5에 도시된 통합 데이터베이스 생성 시스템이 검색 기능을 수행하게 할 수 있음은 자명한 사실이다. 한편, 도 7을 설명함에 있어서, 도 3에 도시된 구성요소들과 중복되는 구성요소에 대한 상세한 설명은 생략하기로 한다.
먼저, 검색 요청 수신부(54)는 사용자 단말기(32)를 통하여 사용자로부터 검색 요청을 수신하고, 검색 결과 생성부(56)는 검색 요청에 포함된 검색어가 웹사이트 정보 및 지역 정보가 통합된 업체에 관련된 것인 경우 통합 DB(26)를 검색하여 검색결과를 생성하고, 그렇지 않은 경우 제1 DB(16) 및 제2 DB(18) 중 어느 하나의 DB를 검색하여 검색결과를 생성한다.
즉, 입력된 검색어가 웹사이트 정보 및 지역 정보가 통합된 업체에 관련된 것인 경우 검색 결과 생성부(54)는 도 8에 도시된 바와 같이 통합된 정보만이 노출되는 검색결과를 생성함으로써 검색결과의 중복을 방지하게 되는 것이다.
한편, 검색어가 웹사이트 정보 및 지역 정보가 통합된 업체에 관련된 것인 경우 통합 DB(26)에는 웹사이트 정보 및 지역 정보 중 공통되는 정보만이 통합되어 저장되어 있으므로, 본 발명의 일 실시예에 따른 통합 데이터베이스 생성 시스템(14)은 사용자의 선택에 따라 통합되지 않은 정보들을 추가로 제공할 수도 있다. 이를 위해 통합 데이터베이스 생성 시스템(14)은 사용자로부터 추가 검색 정보 제공 요청을 선택받기 위한 선택 수단을 생성하는 인터페이스 생성부(60)를 더 포함 할 수 있다.
인터페이스 생성부(60)는 추가 검색 정보 제공 요청을 선택받기 위해 예컨대, 아이콘과 같은 선택 수단을 생성하고 생성된 선택 수단을 검색결과 생성부(56)에 의해 생성된 검색결과 내에 삽입시킨다. 예컨대, 도 8에 도시된 바와 같이 해당 검색결과의 소정 영역에 선택 수단으로써 "추가 검색 정보 더보기"라는 아이콘(62)을 삽입시키는 것이다.
이후, 사용자에 의해 선택 수단이 선택되는 경우 검색 결과 생성부(56)는 이를 수신하여 제1 DB(16) 및 제2 DB(18) 중 적어도 하나를 추가로 검색함으로써 추가 검색 정보를 생성한다. 즉, 도 8과 같은 검색 결과 내에서, 사용자가 "추가 검색 정보 더보기"라는 아이콘(62)을 선택하는 경우 검색 결과 생성부(56)는 제1 DB(16) 및 제2 DB(18) 중 적어도 하나를 추가로 검색함으로써 웹사이트 또는 지역 정보에 관한 추가 검색 정보를 제공하게 되는 것이다.
검색결과 제공부(58)는 상술한 검색결과 생성부(56)에 의해 생성된 검색결과 또는 추가 검색 정보를 사용자에게 제공한다.
상술한 통합 데이터베이스 생성 시스템을 이용하여 통합 데이터베이스를 생성하는 과정을 도 9를 참조하여 구체적으로 설명한다.
먼저, 웹사이트 정보의 데이터 필드와 지역 정보의 데이터 필드 중 서로 공통되는 데이터 필드를 추출한다(제100단계). 일 실시예에 있어서, 서로 공통되는 데이터 필드는 URL필드, 전화번호 필드, 주소 필드, 제목 필드, 및 설명 필드 중 적어도 하나를 포함할 수 있다.
다음으로, 추출된 각 필드 간의 유사도를 이용하여 웹사이트 정보와 지역 정보간의 유사도를 산출한다(제110단계). 구체적으로, 웹사이트 정보와 지역 정보간의 유사도는 추출된 각 필드 간의 유사도를 산출하고, 산출된 유사도에 각 필드별 가중치를 곱한 후 이들의 값을 합산함으로써 산출된다. 예컨대, 웹사이트의 URL필드와 지역 정보의 URL필드간 유사도를 산출하고, 산출된 유사도에 URL필드의 가중치를 곱한 후 다른 필드들 간의 유사도와 가중치의 곱을 합산하는 것이다. 각 필드별 유사도 산출방법은 위에서 이미 설명하였으므로 상세한 설명은 생략하기로 한다.
일 실시예에 있어서, 각 필드별 가중치의 크기는 URL 필드, 전화번호 필드, 주소 필드, 제목 필드, 설명 필드 순일 수 있다. 이러한 가중치 크기의 순서로 인해 URL 필드에 기록된 URL데이터가 공통되는 웹사이트 정보와 지역 정보가 통합 대상으로 선정될 확률이 높아지게 된다.
다음으로, 제110단계에서 산출된 유사도가 임계치 이상인 웹사이트 정보와 지역 정보를 통합 대상으로 선정한다(제120단계). 예컨대, 웹사이트 정보와 지역 정보 간의 유사도를 산출한 결과 웹사이트 정보들 중 제1 웹사이트 정보와 지역 정보들 중 제1 지역 정보의 유사도가 임계치 이상인 경우, 제1 웹사이트 정보와 제1 지역 정보는 동일한 업체에 관한 정보를 나타내는 것으로 판단하여 통합 대상으로 선정하는 것이다.
즉, 동일한 업체에 관한 정보임에도 불구하고 제1 DB(16)와 제2 DB(18)에 각각 별도로 저장되고 있었던 웹사이트 정보 및 지역 정보를 통합 대상이 되는 웹사 이트 정보와 지역 정보로 선정하는 것이다.
다음으로, 제120단계에서 통합 대상으로 선정된 웹사이트 정보 및 지역 정보 중 어느 하나의 정보를 통합 정보로 결정한다(제130단계). 구체적으로, 통합 정보는 데이터 필드 추출부(21)에 의해 추출된 데이터 필드마다 결정되는데, 이러한 통합 정보는 웹사이트 정보의 데이터 필드 및 지역 정보의 데이터 필드 중 어느 하나의 데이터 필드에 기록된 데이터로 결정된다. 각 필드별 통합 정보 결정방법은 위에서 설명하였으므로 상세한 설명은 생략하기로 한다.
마지막으로, 각 데이터 필드마다 결정된 통합 정보를 데이터베이스화함으로써 통합 DB(26)를 생성한다(제140단계). 일 실시예에 있어서, 통합 DB (26)는 도 4에 도시된 바와 같이 URL필드(26a), 전화번호 필드(26b), 주소 필드(26c), 제목 필드(26d), 설명 필드(26e)로 구성되며, 각 필드에는 통합 정보 결정부(22)에 의해 결정된 데이터가 기록된다.
다음으로, 도 10을 참조하여 웹사이트 정보와 지역 정보의 통합 관리를 위한 신규 등록 정보를 처리하는 방법에 관하여 설명한다.
먼저, 사용자 단말기(32)를 통해 사용자에게 웹사이트 정보와 지역 정보를 일괄적으로 등록할 수 있는 등록 인터페이스를 제공한다(제150단계). 이때 사용자에게 제공되는 등록 인터페이스는 도 6a에 도시된 바와 같이, 3가지 타입(34, 36, 38)의 선택 모드를 포함하는데, 제1 선택 모드(34)는 웹사이트 정보와 지역 정보를 모두 입력할 수 있는 모드이고, 제2 선택 모드(36)는 웹사이트 정보만을 입력할 수 있는 모드이며, 제3 선택 모드(38)는 지역 정보만을 입력할 수 있는 모드이다.
이후, 등록 인터페이스(33) 상에서 사용자가 선택한 모드가 어떤 것인지를 판단하여(제160단계), 선택된 모드에 상응하는 정보 입력창을 제공한다(제170단계). 즉, 사용자가 등록 인터페이스(33)을 통해 제1 선택 모드(34)를 선택하는 경우 웹사이트 URL 및 업체의 대표 전화번호를 입력할 수 있는 창(40)을 제공하고, 제2 선택 모드(36)를 선택하는 경우 웹사이트 URL을 입력할 수 있는 창(50)을 제공하며, 제3 선택 모드(38)를 선택하는 경우 업체의 대표 전화번호를 입력할 수 있는 창을 제공한다.
다음으로, 등록 요청된 정보가 기 등록된 정보가 아닌 것으로 판단되는 경우 각 모드에 따른 상세 정보 입력 인터페이스를 제공하고(제180단계), 상세 정보 입력 인터페이스를 통해 입력된 정보를 수신한다(제190단계).
이후, 사용자에 의해 선택된 모드가 제1 선택 모드인 경우, 입력된 정보들 중 상세 정보 입력 인터페이스의 공통 정보 입력 창을 통해 입력된 공통 정보들은 통합 DB(26)에 저장하고, 개별 정보 입력 창을 통해 입력된 정보들 중 웹사이트 정보에 관한 것은 제1 DB(16)에 저장하고, 지역 정보에 관한 것은 제2 DB(18)에 저장한다(제200단계).
한편, 사용자에 의해 제2 선택 모드가 선택된 경우, 상세 정보 입력 인터페이스를 통해 입력된 정보들은 제1 DB(16)에 저장하고(제210단계), 제3 선택 모드가 선택된 경우 상세 정보 입력 인터페이스를 통해 입력된 정보들은 제2 DB(18)에 저장한다(제220단계).
이러한 과정을 통해 신규 등록 정보 처리함에 있어서 웹사이트 정보와 지역 정보를 일괄적으로 처리할 수 있어 웹사이트 정보와 지역 정보를 통합적으로 관리할 수 있음은 물론, 통합 관리를 원하지 않는 사용자에게는 기존의 방법대로 웹사이트 정보와 지역 정보를 선택적으로 등록받을 수 있다.
다음으로, 도 11을 참조하여, 통합 DB를 이용하여 검색을 수행하는 방법에 대해서 설명한다.
먼저, 사용자 단말기(32)를 통하여 사용자로부터 검색 요청이 수신되면(제230단계), 검색 요청에 포함된 검색어가 통합 정보에 관련된 것인지, 즉, 검색어가 웹사이트 정보 및 지역 정보가 통합된 업체에 관련된 것인지를 판단하여(제240단계), 관련된 것인 경우 통합 DB(26)를 검색하여 검색결과를 생성한다(제250단계).
일 실시예에 있어서, 검색결과를 생성함에 있어서, 통합 DB(26)에는 웹사이트 정보와 지역 정보 중 서로 공통되는 정보만이 통합되어 저장되어 있기 때문에, 통합되지 않은 개별 상세 정보들에 대한 추가 검색 정보 제공 여부를 사용자가 선택할 수 있도록 하기 위한 선택 수단을 생성하여(제260단계) 검색결과에 삽입하는 단계(제270단계)를 더 포함할 수 있다.
이후, 검색결과 또는 선택수단이 삽입된 검색결과를 사용자 단말기(32)를 통하여 사용자에게 제공한다(제280단계). 이와 같은 방법을 통해 입력된 검색어가 웹사이트 정보 및 지역 정보가 통합된 업체에 관련된 것인 경우 중복된 검색결과가 노출되는 것을 방지할 수 있게 된다.
이후, 사용자에 의해 검색결과에 포함된 선택 수단이 선택됨으로써 추가 검색 정보 요청이 수신되는 경우(제290단계), 제1 DB(16) 또는 제2 DB(18)를 검색하 여 추가 검색 정보를 생성하고(제300단계), 생성된 추가 검색 정보를 사용자에게 제공한다(제310단계).
한편, 제240단계에서, 검색어가 웹사이트 정보 및 지역 정보가 통합된 업체에 관련된 것이 아닌 경우 제1 DB(16) 및 제2 DB(18) 중 어느 하나의 DB를 검색하여 검색결과를 생성하고(제320단계), 생성된 검색결과를 사용자에게 제공한다(제330단계).
상술한 방법들은 다양한 컴퓨터 수단을 이용하여 수행될 수 있는 프로그램 형태로도 구현될 수 있는데, 이때 이러한 방법들을 수행하기 위한 프로그램은 하드 디스크, CD-ROM, DVD, 롬(ROM), 램, 또는 플래시 메모리와 같은 컴퓨터로 판독할 수 있는 기록 매체에 저장된다.
본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.
그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
도 1a는 웹사이트 정보를 입력하기 위한 인터페이스를 보여주는 도면.
도 1b는 지역 정보를 입력하기 위한 인터페이스를 보여주는 도면.
도 2는 웹사이트 정보 및 지역 정보에 대한 종래의 검색결과 화면을 보여주는 도면.
도 3은 본 발명의 일 실시예에 따른 통합 데이터베이스 생성 시스템의 개략적인 블록도.
도 4는 통합 데이터베이스의 데이터 구조를 보여주는 도면.
도 5는 본 발명의 다른 실시예에 따른 통합 데이터베이스 생성 시스템의 개략적인 블록도.
도 6은 본 발명의 일 실시예에 따라 웹사이트 정보와 지역 정보를 일괄적으로 등록하기 위한 인터페이스를 보여주는 도면.
도 7은 본 발명의 또 다른 실시예에 따른 통합 데이터베이스 생성 시스템의 개략적인 블록도.
도 8은 본 발명의 일 실시예에 따른 검색결과 화면을 보여주는 도면.
도 9는 본 발명의 일 실시예에 따른 통합 데이터베이스 생성 방법을 보여주는 플로우차트.
도 10은 본 발명의 일 실시예에 따라 신규 등록 정보를 처리하는 방법을 보여주는 도면.
도 11은 본 발명의 일 실시예에 따라 검색결과를 제공하는 방법을 보여주는 도면.
<도면의 주요부분에 대한 부호의 설명>
14: 통합 데이터베이스 생성 시스템 16: 웹사이트 정보 데이터베이스
18: 지역 정보 데이터베이스 20: 통합 대상 선정부
21: 데이터 필드 추출부 22: 통합 정보 결정부
24: 통합 데이터베이스 생성부 26: 통합 데이터베이스
28: 등록요청 수신부 30: 저장부
54: 검색 요청 수신부 56: 검색결과 생성부
58: 검색결과 제공부 60: 인터페이스 생성부

Claims (27)

  1. 특정 업체에 대한 정보인 지역 정보 및 특정 업체의 웹사이트에 대한 정보인 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법으로서,
    상기 지역 정보의 데이터 필드와 상기 웹사이트 정보의 데이터 필드 중 서로 공통되는 데이터 필드를 추출하는 단계;
    상기 추출된 데이터 필드 간의 유사도를 이용하여 웹사이트 정보와 지역 정보 간의 유사도를 산출하는 단계;
    상기 산출된 유사도를 이용하여 통합 대상이 되는 지역 정보 및 웹사이트 정보를 선정하는 단계;
    상기 선정된 지역 정보 및 웹사이트 정보로부터 데이터 필드별로 통합 정보를 결정하는 단계; 및
    상기 결정된 통합정보를 데이터 필드 각각에 기록하여 데이터베이스화함으로써 통합 데이터베이스를 생성하는 단계를 포함하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  2. 제1항에 있어서, 상기 통합 대상이 되는 지역 정보 및 웹사이트 정보의 선정 단계에서 상기 지역 정보들과 웹사이트 정보들 간의 유사도가 임계치 이상인 지역 정보와 웹사이트 정보를 통합 대상으로 선정하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  3. 제2항에 있어서, 상기 지역 정보 및 상기 웹사이트 정보는 각각 복수개의 데이터 필드로 구성되는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  4. 제3항에 있어서, 상기 유사도는 상기 지역 정보 및 웹사이트 정보의 데이터 필드간 유사도를 산출하고, 산출된 각 데이터 필드간 유사도에 상기 데이터 필드별 가중치를 곱한값들을 합산함으로써 산출되는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  5. 제3항에 있어서, 상기 통합 정보 결정 단계에서 상기 통합 정보는 상기 추출된 데이터 필드별로 결정하되, 상기 웹사이트 정보의 데이터 필드 및 지역 정보의 데이터 필드 중 어느 하나에 기록된 데이터를 각 필드별 통합 정보로 결정하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  6. 제5항에 있어서, 상기 공통되는 데이터 필드는 유알엘(URL: Uniform Resource Locator)필드, 전화번호 필드, 주소 필드, 제목 필드, 및 설명 필드 중 적어도 하나를 포함하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  7. 제6항에 있어서, 상기 공통되는 데이터 필드가 유알엘 필드인 경우 상기 유알엘 필드의 통합 정보는 상기 웹사이트 정보의 유알엘 필드에 기록된 데이터로 결 정하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  8. 제6항에 있어서, 상기 공통되는 데이터 필드가 주소 또는 전화번호 필드인 경우 상기 주소 또는 전화번호 필드의 통합 정보는 상기 지역 정보 및 웹사이트 정보의 주소 또는 전화번호 필드 중 수집된 웹자원의 카피라이터 부분에 기재된 주소 또는 전화번호 데이터에 근접한 데이터가 기록된 주소 또는 전화번호 필드의 데이터로 결정하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  9. 제6항에 있어서, 상기 공통되는 데이터 필드가 제목 필드인 경우 상기 제목 필드의 통합 정보는 상기 지역 정보 및 웹사이트 정보의 제목 필드 중 수집된 웹자원의 타이틀 태그 내에 포함된 단어에 근접한 데이터가 기록된 제목 필드의 데이터로 결정하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  10. 제6항에 있어서, 상기 공통되는 데이터 필드가 설명 필드인 경우 상기 설명 필드의 통합 정보는, 상기 지역 정보 및 웹사이트 정보의 설명 필드 중 수집된 웹자원에서 노출 횟수가 상위에서 미리 정해진 개수 이내의 단어들이 더 포함된 설명 필드의 데이터로 결정하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  11. 제1항에 있어서,
    사용자로부터 소정 업체의 정보 등록 요청을 수신하는 단계; 및
    상기 등록 요청된 소정 업체의 정보 중 제1 데이터 클래스에 속하는 정보는 상기 통합 데이터베이스에 저장하고, 제2 데이터 클래스에 속하는 정보는 상기 지역 정보가 저장되는 지역 정보 데이터베이스에 저장하고 제3 데이터 클래스에 속하는 정보는 상기 웹사이트 정보가 저장되는 웹사이트 정보 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 방법.
  12. 제1항에 기재된 통합 데이터베이스 생성방법에 의해 생성된 통합 데이터베이스를 이용한 검색 결과 제공 방법으로서,
    검색 서비스 이용자로부터 검색 요청을 수신하는 단계;
    상기 검색 요청에 포함된 검색어가 상기 통합 정보에 관련된 것인 경우 상기 통합 데이터베이스를 검색하여 검색결과를 생성하는 단계; 및
    상기 검색결과를 상기 검색 서비스 이용자에게 제공하는 단계를 포함하는 것을 특징으로 하는 통합 데이터베이스를 이용한 검색 결과 제공 방법.
  13. 제12항에 있어서, 상기 검색결과에 상기 통합 데이터베이스에 저장되어 있지 않은 정보의 추가 제공 요청을 위한 선택 수단을 삽입하는 단계를 더 포함하고, 상기 검색결과 제공 단계에서 상기 검색 서비스 이용자에게 상기 선택수단이 삽입된 검색결과를 제공하는 것을 특징으로 하는 통합 데이터베이스를 이용한 검색 결과 제공 방법.
  14. 제13항에 있어서, 상기 검색 서비스 이용자에 의해 상기 검색결과에 삽입된 상기 선택 수단이 선택되는 경우,
    상기 지역 정보가 저장된 지역정보 데이터베이스 및 상기 웹사이트 정보가 저장되는 웹사이트 정보 데이터베이스 중 적어도 하나를 검색하여 추가 검색 정보를 생성하는 단계; 및
    상기 추가 검색 정보를 상기 검색 서비스 이용자에게 제공하는 단계를 더 포함하는 것을 특징으로 하는 통합 데이터베이스를 이용한 검색 결과 제공 방법.
  15. 제12항에 있어서, 상기 검색 결과 생성단계에서, 상기 검색 요청에 포함된 검색어가 상기 통합 정보에 관련된 것이 아닌 경우 상기 지역 정보가 저장된 지역정보 데이터베이스 및 상기 웹사이트 정보가 저장되는 웹사이트 정보 데이터베이스를 검색하여 검색결과를 생성하는 것을 특징으로 하는 통합 데이터베이스를 이용한 검색 결과 제공 방법.
  16. 제1항 내지 제15항 중 어느 하나의 항에 기재된 방법을 수행하기 위한 프로 그램이 기록된 기록매체.
  17. 특정 업체에 대한 정보인 지역 정보 및 특정 업체의 웹사이트에 대한 정보인 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템으로서,
    상기 지역 정보의 데이터 필드와 상기 웹사이트 정보의 데이터 필드 중 서로 공통되는 데이터 필드를 추출하는 데이터 필드 추출부;
    상기 추출된 데이터 필드 간의 유사도를 이용하여 웹사이트 정보와 지역 정보 간의 유사도를 산출하고, 상기 산출된 유사도를 이용하여 통합 대상이 되는 지역 정보 및 웹사이트 정보를 선정하는 통합 대상 선정부;
    상기 산출된 유사도를 이용하여 상기 통합 대상 선정부에 의해 선정된 지역 정보 및 웹사이트 정보로부터 데이터 필드별로 통합 정보를 결정하는 통합 정보 결정부; 및
    상기 통합 정보 결정부에 의해 결정된 통합정보를 데이터 필드 각각에 기록하여 데이터베이스화함으로써 통합 데이터베이스를 생성하는 통합 데이터베이스 생성부를 포함하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  18. 제17항에 있어서, 상기 통합 대상 선정부는 상기 지역 정보들과 웹사이트 정보들 간의 유사도를 산출하고 산출된 유사도가 임계치 이상인 지역 정보와 웹사이트 정보를 통합 대상으로 선정하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  19. 제18항에 있어서, 상기 지역 정보 및 상기 웹사이트 정보는 각각 복수개의 데이터 필드로 구성되는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  20. 제19항에 있어서, 상기 유사도는 상기 지역 정보 및 웹사이트 정보의 데이터 필드간 유사도를 산출하고, 산출된 각 데이터 필드간 유사도에 상기 데이터 필드별 가중치를 곱한값들을 합산함으로써 산출되는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  21. 제19항에 있어서, 상기 통합 정보 결정부는 상기 추출된 데이터 필드별로 상기 통합 정보를 결정하되, 상기 웹사이트 정보의 데이터 필드 및 지역 정보의 데이터 필드 중 어느 하나에 기록된 데이터를 각 필드별 통합 정보로 결정하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  22. 제19항에 있어서, 상기 공통되는 데이터 필드는 유알엘 필드, 전화번호 필드, 주소 필드, 제목 필드, 및 설명 필드 중 적어도 하나를 포함하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  23. 제17항에 있어서, 상기 통합 데이터베이스 생성 시스템은
    사용자로부터 소정 업체의 정보 등록 요청을 수신하는 등록요청 수신부; 및
    상기 등록 요청된 소정 업체의 정보 중 제1 데이터 클래스에 속하는 정보는 상기 통합 데이터베이스에 저장하고, 제2 데이터 클래스에 속하는 정보는 상기 지역 정보가 저장되는 지역 정보 데이터베이스에 저장하고 제3 데이터 클래스에 속하는 정보는 상기 웹사이트 정보가 저장되는 웹사이트 정보 데이터베이스에 저장하는 저장부를 더 포함하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  24. 제17항에 있어서, 상기 통합 데이터베이스 생성 시스템은,
    검색 서비스 이용자로부터 검색 요청을 수신하는 검색 요청 수신부;
    상기 검색 요청 수신부에 의해 수신된 검색 요청에 포함된 검색어가 상기 통합 정보에 관련된 것인 경우 상기 통합 데이터베이스를 검색하여 검색결과를 생성하는 검색 결과 생성부; 및
    상기 검색결과를 상기 검색 서비스 이용자에게 제공하는 검색결과 제공부를 더 포함하는 것을 특징으로 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  25. 제24항에 있어서, 상기 통합 데이터베이스에 저장되어 있지 않은 정보의 추 가 제공 요청을 위한 선택 수단을 생성하여 상기 검색결과에 삽입시키는 인터페이스 생성부를 더 포함하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  26. 제25항에 있어서, 상기 검색 서비스 이용자에 의해 상기 검색결과에 삽입된 상기 선택 수단이 선택되는 경우,
    상기 검색결과 생성부는 상기 지역 정보가 저장된 지역정보 데이터베이스 및 상기 웹사이트 정보가 저장되는 웹사이트 정보 데이터베이스 중 적어도 하나를 검색하여 추가 검색 정보를 생성하고, 상기 검색결과 제공부는 상기 추가 검색 정보를 상기 검색 서비스 이용자에게 제공하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
  27. 제24항에 있어서, 상기 검색 결과 생성부는, 상기 검색 요청에 포함된 검색어가 상기 통합 정보에 관련된 것이 아닌 경우 상기 지역 정보가 저장된 지역정보 데이터베이스 및 상기 웹사이트 정보가 저장되는 웹사이트 정보 데이터베이스를 검색하여 검색결과를 생성하는 것을 특징으로 하는 지역 정보 및 웹사이트 정보의 통합 관리를 위한 통합 데이터베이스 생성 시스템.
KR1020070093835A 2007-09-14 2007-09-14 지역 정보와 웹사이트 정보의 통합 관리를 위한 통합데이터베이스 생성 방법 및 시스템과 그에 의해 생성된통합 데이터베이스를 이용한 검색 결과 제공 방법 KR100943625B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070093835A KR100943625B1 (ko) 2007-09-14 2007-09-14 지역 정보와 웹사이트 정보의 통합 관리를 위한 통합데이터베이스 생성 방법 및 시스템과 그에 의해 생성된통합 데이터베이스를 이용한 검색 결과 제공 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070093835A KR100943625B1 (ko) 2007-09-14 2007-09-14 지역 정보와 웹사이트 정보의 통합 관리를 위한 통합데이터베이스 생성 방법 및 시스템과 그에 의해 생성된통합 데이터베이스를 이용한 검색 결과 제공 방법

Publications (2)

Publication Number Publication Date
KR20090028326A KR20090028326A (ko) 2009-03-18
KR100943625B1 true KR100943625B1 (ko) 2010-02-24

Family

ID=40695636

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070093835A KR100943625B1 (ko) 2007-09-14 2007-09-14 지역 정보와 웹사이트 정보의 통합 관리를 위한 통합데이터베이스 생성 방법 및 시스템과 그에 의해 생성된통합 데이터베이스를 이용한 검색 결과 제공 방법

Country Status (1)

Country Link
KR (1) KR100943625B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240003774A (ko) 2022-07-01 2024-01-10 몽타 주식회사 이종 시스템 간 통합을 위한 데이터 통합 장치 및 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101902568B1 (ko) * 2011-12-09 2018-09-28 주식회사 카카오 정보 제공 시스템 및 정보 제공 방법
KR102044009B1 (ko) * 2018-09-19 2019-11-12 주식회사 카카오 정보 제공 시스템 및 정보 제공 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010084487A (ko) * 2000-02-25 2001-09-06 백합 검색사이트와 결합된 지역정보 포털사이트상의 광고방법
KR20050093309A (ko) * 2004-03-18 2005-09-23 곽현정 이메일 주소를 이용한 복수 url 접속시스템 및 방법
KR20060127646A (ko) * 2005-06-08 2006-12-13 김광윤 인터넷 기반 커뮤니티 통합관리 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010084487A (ko) * 2000-02-25 2001-09-06 백합 검색사이트와 결합된 지역정보 포털사이트상의 광고방법
KR20050093309A (ko) * 2004-03-18 2005-09-23 곽현정 이메일 주소를 이용한 복수 url 접속시스템 및 방법
KR20060127646A (ko) * 2005-06-08 2006-12-13 김광윤 인터넷 기반 커뮤니티 통합관리 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240003774A (ko) 2022-07-01 2024-01-10 몽타 주식회사 이종 시스템 간 통합을 위한 데이터 통합 장치 및 방법

Also Published As

Publication number Publication date
KR20090028326A (ko) 2009-03-18

Similar Documents

Publication Publication Date Title
US10275419B2 (en) Personalized search
CN102043833B (zh) 一种基于查询词进行搜索的方法和搜索装置
JP5256293B2 (ja) 検索結果ページ上に対話要素を含めるためのシステム及び方法
US20120117051A1 (en) Multi-modal approach to search query input
US8527487B2 (en) Method and system for automatic construction of information organization structure for related information browsing
US10606853B2 (en) Systems and methods for intelligent prospect identification using online resources and neural network processing to classify organizations based on published materials
JP5329540B2 (ja) ユーザ中心の情報探索方法、コンピュータ読み取り可能な記録媒体およびユーザ中心の情報探索システム
US20040117363A1 (en) Information processing device and method, recording medium, and program
US9165058B2 (en) Apparatus and method for searching for personalized content based on user&#39;s comment
US8799314B2 (en) System and method for managing information map
CN103226601A (zh) 一种图片搜索的方法和装置
JP2009122807A (ja) 連想検索システム
KR100943625B1 (ko) 지역 정보와 웹사이트 정보의 통합 관리를 위한 통합데이터베이스 생성 방법 및 시스템과 그에 의해 생성된통합 데이터베이스를 이용한 검색 결과 제공 방법
CN111026787A (zh) 网点检索方法、装置及系统
JP5639549B2 (ja) 情報検索装置及び方法及びプログラム
JP2018005633A (ja) 関連コンテンツ抽出装置、関連コンテンツ抽出方法及び関連コンテンツ抽出プログラム
JP3702268B2 (ja) 情報検索システム、情報検索方法およびプログラム
JP5613536B2 (ja) 利用者の要求に応じて動的にもっとも適したイメージを抽出して提供するための方法、システム及びコンピューター判読可能な記録媒体
US20140195561A1 (en) Search method and information managing apparatus
KR20040098889A (ko) 웹사이트 검색 서비스 제공 방법 및 그 시스템
KR100931772B1 (ko) 웹사이트 검색 서비스 제공 방법 및 그 시스템
KR100931775B1 (ko) 웹사이트 검색 서비스 제공 방법 및 그 시스템
KR20010082966A (ko) 관련 웹 사이트 제공 방법 및 시스템
KR101032122B1 (ko) 웹사이트 검색 기반의 사용자 검색어와 일치하는 단어의 문두표식 검색 시스템 및 그 방법
KR101138751B1 (ko) 지역정보 추출을 활용한 웹 정보 가공 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130111

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131231

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20151223

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170117

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190102

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 11