KR100814667B1 - 검색 결과를 클러스터화하기 위한 시스템 및 방법 - Google Patents

검색 결과를 클러스터화하기 위한 시스템 및 방법 Download PDF

Info

Publication number
KR100814667B1
KR100814667B1 KR1020067005695A KR20067005695A KR100814667B1 KR 100814667 B1 KR100814667 B1 KR 100814667B1 KR 1020067005695 A KR1020067005695 A KR 1020067005695A KR 20067005695 A KR20067005695 A KR 20067005695A KR 100814667 B1 KR100814667 B1 KR 100814667B1
Authority
KR
South Korea
Prior art keywords
cluster
documents
document
address
interest
Prior art date
Application number
KR1020067005695A
Other languages
English (en)
Other versions
KR20060095979A (ko
Inventor
아담 스미스
씨안핑 꺼
엘리자베스 해먼 리드
아비쉑 파마
Original Assignee
구글 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구글 인코포레이티드 filed Critical 구글 인코포레이티드
Publication of KR20060095979A publication Critical patent/KR20060095979A/ko
Application granted granted Critical
Publication of KR100814667B1 publication Critical patent/KR100814667B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

본 발명은 주소 또는 전화 번호에 의해서 클러스터화된 검색 결과를 형성하는 시스템(120)에 관한 것이다. 주소에 의해서 클러스터화하는 경우에, 상기 시스템(120)은 검색 질의를 수신하고, 적어도 부분적으로 상기 검색 질의에 기초하여 지리적 관심 지역을 식별한다. 상기 시스템(120)은 지리적 관심 지역 내에 위치하는 주소와 연관된 문서를 식별하고, 적어도 부분적으로 지리적 관심 지역에 기초하여 상기 식별된 문서들을 클러스터로 그룹화하며, 또한 이 클러스터들을 검색 결과로서 표시한다. 전화 번호에 의해서 클러스터화하는 경우에, 상기 시스템(120)은 전화 번호의 적어도 일부분을 포함하는 검색 질의를 수신하여, 상기 전화 번호의 상기 적어도 일부분과 일치하는 전화 번호와 연관된 문서를 식별한다. 상기 시스템(120)은 상기 식별된 문서들 내에 포함되어 있는 상기 전화 번호에 기초하여 상기 식별된 문서들을 그룹화하고, 상기 클러스터를 상기 검색 결과로서 표시한다.
Figure R1020067005695
검색 질의, 클러스터, 검색 결과, 지리적, 관심 지역, 주소, 전화 번호, 웹

Description

검색 결과를 클러스터화하기 위한 시스템 및 방법{SYSTEMS AND METHODS FOR CLUSTERING SEARCH RESULTS}
본 발명은 대략적으로 정보 추출 시스템에 관한 것이며, 더욱 상세하게는 주소 및/또는 전화 번호에 의해서 검색 결과를 클러스터화하기 위한 시스템 및 방법에 관한 것이다.
월드 와이드 웹(World Wide Web, 이하 "웹(web)"이라 한다)에는 방대한 양의 정보가 담겨져 있다. 그러나 상기 정보 중에서 원하는 부분을 찾아 내는 일은 어려운 일이다. 이 문제는 웹 상에서의 정보양과 웹 검색에 익숙하지 못한 다수의 새로운 사용자의 급격한 증가로 인해서 심각해지고 있다. 검색 엔진(search engine)은 사용자가 관심을 갖는 웹 문서(web document)에 대한 하이퍼링크(hyperlink)를 반환하려고 시도한다. 일반적으로, 검색 엔진은 검색 용어('검색 질의(search query)'라고 함)에 대한 사용자의 관심도를 사용자의 입력에 의해서 결정하고 있다. 검색 엔진의 목표는 검색 질의에 기초하여 사용자에게 고품질의 관련된 결과를 링크(link)로 제공하는 것이다. 전형적으로, 검색 엔진은 검색 질의 내의 용어와 미리 저장한 웹 문서의 코퍼스(corpus)를 일치시키는 것에 의해서 고품질의 링크를 제공하고 있다. 사용자의 검색 용어를 포함하고 있는 웹 문서는 "히트(hit)"라고 하며, 이 히트가 사용자에게 반환된다.
특정한 지리적 지역에 거주하는 사용자에게는 일부 웹 문서가 특별히 관심이 가는 문서일 수도 있다. 예를 들면, 지역 회사/단체의 지리적 위치 내에 위치하는 개인들에게는 지역 회사 또는 단체와 연관된 웹 문서가 가장 적절할 수 있다.
사용자가 특정한 지리적 지역 내의 회사 형태와 관련된 정보(예를 들면, 식당, 철물점, 약국 등)를 원하는 경우, 사용자는 회사 형태 및 지리적 지역과 연관된 하나 이상의 키워드(keyword)를 검색 엔진에 제공할 수 있다. 검색 엔진은 회사 형태와 연관된 웹 문서를 포함하는 검색 결과로서 반환한다.
이들 검색 결과와 관련된 한가지 문제는 비록 사용자에 의해서 식별되는 지리적 지역에 지리적으로 인접해 (또는 이웃해) 있는 지역 내에 이들 회사 또는 단체가 위치하고 있다고 하더라도, 통상적으로, 사용자에 의해서 식별되는 지리적 지역 이외의 회사 또는 단체와 연관된 웹 문서가 이들 검색 결과에 포함되어 있지 않다는 것이다. 이들 검색 결과와 관련된 다른 문제점은 이들 검색 결과가 통상적으로 동일한 회사 위치와 연관된 하나 이상의, 어떤 경우에는 다수의 웹 문서를 포함하고 있기 때문에, 관심있는 회사와 연관된 모든 웹 문서를 찾아 내기 전에 관심있는 회사와 무관한 검색 결과 내의 복수의 웹 문서를 사용자가 조사해야 할 필요가 있다는 것이다.
따라서, 지구 상에 다수의 유일한 위치(location)가 있고 또한 각각의 위치를 설명하는 0 개 내지 수백 개 사이의 웹 문서가 있다고 가정하면, 사용자에게 의 미있는 방식으로 검색 결과를 조직화하기 위한 시스템 및 방법이 필요하였다.
본 발명의 원칙과 일치하는 시스템 및 방법은 적어도 부분적으로 웹 문서 내에 포함되어 있는 주소(또는 전화 번호)에 기초하여 웹 문서를 클러스터화한다.
본 발명의 원칙과 일치하는 한 측면에 따르면, 주소(address)에 의해서 클러스터화하는 방법이 제공된다. 상기 방법은, 검색 질의를 수신하는 단계와, 적어도 부분적으로 상기 검색 질의에 기초하여 지리적 관심 지역을 식별하는 단계, 및 상기 지리적 관심 지역 내에 위치하는 주소를 포함하는 문서를 식별하는 단계를 포함할 수 있다. 상기 방법은, 또한, 적어도 부분적으로 상기 지리적 관심 지역 내에 위치하는 주소에 기초하여 상기 식별된 문서를 클러스터로 그룹화하는 단계, 및 상기 클러스터를 표시하는 단계를 포함할 수 있다.
다른 측면에 따르면, 검색 결과를 형성하기 위한 시스템이 제공된다. 상기 시스템은 프로세서, 및 문서와 이 문서 내에 포함되어 있는 주소가 연관된 정보를 저장하도록 구성된 메모리를 포함할 수 있다. 프로세서는 검색 질의를 수신하고, 적어도 부분적으로 상기 검색 질의에 기초하여 지리적 관심 지역을 결정하고, 또한 적어도 부분적으로 상기 메모리 내에 저장되어 있는 상기 정보에 기초하여 상기 지리적 관심 지역 내에 위치하는 주소를 포함하는 문서를 식별하도록 구성된다. 프로세서는, 또한, 적어도 부분적으로 상기 지리적 관심 지역 내에 위치하는 주소에 기초하여 상기 식별된 문서를 클러스터로 그룹화하고, 이 클러스터를 검색 결과로서 표시하도록 구성된다.
또 다른 측면에 따르면, 검색 결과를 형성하기 위한 방법이 제공된다. 상기 방법은 적어도 일부분의 전화 번호를 포함하는 검색 질의를 수신하는 단계, 및 상기 적어도 일부분의 전화 번호와 일치하는 전화 번호를 포함하는 문서를 식별하는 단계를 포함할 수 있다. 상기 방법은, 또한, 상기 식별된 문서 내에 포함되어 있는 상기 전화 번호에 기초하여 상기 식별된 문서를 클러스터로 그룹화하는 단계, 및 검색 결과로서 상기 클러스터를 표시하는 단계를 포함할 수도 있다.
또 다른 측면에 따르면, 검색 결과를 형성하기 위한 시스템이 제공된다. 상기 시스템은 검색 질의를 수신하기 위한 수단과, 지리적 위치를 식별하기 위한 수단과, 상기 지리적 위치의 지리적 중심을 결정하기 위한 수단, 및 지리적 관심 지역으로서 상기 지리적 중심의 특정 거리 내의 위치를 식별하기 위한 수단을 포함할 수 있다. 상기 시스템은, 또한, 상기 지리적 관심 지역 내에 위치하는 주소를 포함하는 문서를 식별하기 위한 수단, 및 적어도 부분적으로 검색 질의에 기초하여 상기 식별된 문서 중의 하나를 관련된 문서로 결정하기 위한 수단을 포함할 수 있다. 상기 관련된 문서는 검색 결과를 형성할 수 있다.
본 발명의 명세서에 합체되고 본 발명의 일부를 구성하는 첨부 도면은 본 발명의 실시예를 나타내고 있으며, 또한 발명의 상세한 설명과 함께 본 발명을 설명한다. 도면에서,
도 1은 본 발명의 원칙과 일치하는 시스템 및 방법을 구현할 수 있는 예시적인 네트워크를 나타낸 도면.
도 2는 본 발명의 원칙과 일치하는 구현례에서의 도 1의 클라이언트 및/또는 서버의 예시적인 도면.
도 3은 본 발명의 원칙과 일치하는 구현례에 따라 도 1의 서버에 의해서 사용될 수 있는 컴퓨터로 판독할 수 있는 매체의 예시적인 도면.
도 4a 및 도 4b는 본 발명의 원칙과 일치하는 구현례에 따라 주소(address)에 의해서 검색 결과를 클러스터화하기 위한 예시적인 절차의 흐름도(flow chart).
도 5는 본 발명의 원칙과 일치하는 상기 예시적인 구현례에 따른 서버의 일부를 나타낸 기능 블록도.
도 6a는 본 발명의 원칙과 일치하는 구현례에 따른 예시적인 결과 리스트를 나타낸 도면이고,
도 6b는 본 발명의 원칙과 일치하는 다른 구현례에 따른 예시적인 결과 리스트를 나타낸 도면.
이하, 첨부한 도면을 참조하여 본 발명을 상세하게 설명한다. 서로 다른 도면에서의 동일한 도면 부호는 동일하거나 유사한 요소를 나타낸다. 또한 이하의 발명의 상세한 설명은 본 발명을 제한하지 않는다.
본 발명의 원칙과 일치하는 시스템 및 방법은 특정한 지리적 위치에 연관된 정보를 찾고자 하는 사용자에게 의미가 있는 검색 결과를 제공하기 위해서 주소(또는 전화 번호)에 의해서 클러스터화된 검색 결과를 제공할 수 있다. 검색 결과는, 또한, 사용자가 관심을 갖는 지리적 위치에 지리적으로 인접해(또는 이웃해) 있는 다른 지리적 위치와 연관된 정보를 포함하고 있을 수도 있기 때문에 사용자에게 더 의미가 있을 수도 있다.
<<네트워크 구조의 예>>
도 1은 본 발명의 원칙과 일치하는 시스템 및 방법을 구현할 수 있는 네트워크(100)의 예시적인 도면이다. 네트워크(100)에는 네트워크(150)를 통해서 복수의 서버(120-140)에 접속되어 있는 복수의 클라이언트(110)가 포함될 수 있다. 네트워크(150)에는 근거리 통신망(LAN, local area network), 원거리 통신망(WAN, wide area network), 일반 전화망(PSTN, public switched telephone network)과 같은 전화망, 인트라넷(intranet), 인터넷, 메모리 장치, 다른 형태의 네트워크, 또는 네트워크의 조합이 포함될 수 있다. 두 개의 클라이언트(110)와 세 개의 서버(120-140)는 간단하게 하기 네트워크(150)에 접속된 것으로 도시되어 있다. 실제로는, 더 많거나 더 적은 클라이언트와 서버가 있을 수 있다. 또한, 일부의 경우에서, 클라이언트는 서버의 기능을 수행할 수도 있고, 서버는 클라이언트의 기능을 수행할 수도 있다.
클라이언트(11)는 클라이언트 개체(client entity)를 포함할 수 있다. 개체(entity)는 무선 전화, 개인용 컴퓨터, 개인 휴대 정보 단말기(PDA, personal digital assistant), 노트북(lap top), 또는 다른 형태의 컴퓨터 장치(computation device) 또는 통신 장치 등과 같은 장치와, 이들 장치들 중 하나 상에서 동작하는 쓰레드(thread) 또는 프로세스(process), 및/또는 이들 장치들 중 하나에 의해서 실행될 수 있는 오브젝트(object) 등으로서 정의될 수 있다. 서버(120-140)는 본 발명의 원칙과 일치하는 방식으로 문서를 수집하고, 처리하고, 검색하고, 및/또는 유지하는 서버 개체(server entity)를 포함할 수도 있다. 클라이언트(110)와 서버(120-140)는 유선, 무선, 및/또는 광(optical) 접속을 통해서 네트워크(150)에 접속될 수 있다.
본 발명의 원칙과 일치하는 일 구현례에서, 서버(120)는 클라이언트(110)에 의해서 사용 가능하게 되는 검색 엔진(125)을 선택적으로 포함할 수도 있다. 서버(120)는 문서(예를 들면, 웹 페이지(web page))를 탐색하고, 탐색된 문서의 리포지토리(repository) 내에 이들 문서들과 연관된 정보를 저장한다. 서버(130 및 140)는 서버(120)에 의해서 탐색될 수 있는 문서를 저장 또는 유지할 수도 있다. 도면에서는 서버(120-140)가 독립적인 개체로 나타나 있지만, 하나 이상의 서버(120-140)가 하나 이상의 다른 서버(102-140)의 하나 이상의 기능을 수행하도록 할 수도 있다. 두 개 이상의 서버(102-140)가 단일 서버로 구현될 수도 있고, 또한 서버(120-140) 중의 하나가 복수의 컴퓨터 장치(computing device)로 구현될 수도 있다.
<<예시적인 클라이언트/서버 아키텍처>>
도 2는 본 발명의 원칙과 일치하는 구현례에 따라 하나 이상의 클라이언트(110)와 서버(120-140)에 대응하는 클라이언트 또는 서버 개체(이하, "클라이언트/서버 개체"라 한다)의 예시적인 도면이다. 클라이언트/서버 개체는 버스(210), 프로세서(220), 주 메모리(230), 판독 전용 메모리(ROM)(240), 저장 장치(250), 하나 이상의 입력 장치(260), 하나 이상의 출력 장치(270), 및 통신 인터페이스(280)를 포함할 수 있다. 버스(210)는 클라이언트/서버 개체의 구성 요소 사이에서의 통신을 허용하는 하나 이상의 도전체(conductor)를 포함할 수 있다.
프로세서(220)는 명령(instruction)을 해석하고 실행하는 임의의 형태의 통상적인 프로세서 또는 마이크로프로세서(microprocessor)를 포함할 수도 있다. 주 메모리(230)는 정보(information)와 프로세서(220)에 의해서 실행되는 명령을 저장하는 임의 접근 기억 장치(RAM, random access memory) 또는 다른 형태의 동적인(dynamic) 저장 장치를 포함할 수 있다. ROM(204)은 정적 정보와 프로세서(220)에 의해서 사용되어지는 명령을 저장하는 통상적인 ROM 또는 다른 형태의 정적(static) 저장 장치를 포함할 수 있다. 저장 장치(250)는 자기(magnetic) 및/또는 광 기록 매체, 및 이에 대응하는 드라이브(drive)를 포함할 수 있다.
입력 장치(260)는 조작자(operator)가 정보를 클라이언트/서버 개체로 입력하도록 허용하는 키보드, 마우스, 펜(pen), 음성 인식 장치 및/또는 생체 인식(biometric) 메커니즘과 같은 하나 이상의 통상적인 메커니즘을 포함할 수 있다. 출력 장치(270)는 디스플레이, 프린터, 스피커 등을 포함하며, 조작자에게 정보를 출력하는 하나 이상의 통상적인 메커니즘을 포함할 수 있다. 통신 인터페이스(280)는 클라이언트/서버 개체가 다른 장치 및/또는 시스템과 통신할 수 있도록 하는 임의의 트랜스시버(transceiver)와 유사한 메커니즘을 포함할 수 있다. 예를 들면, 통신 인터페이스(280)는 네트워크(150)와 같은 네트워크를 통해서 다른 장치 또는 시스템과 통신하기 위한 메커니즘을 포함할 수 있다.
이하에서 상세하게 설명하는 바와 같이, 본 발명의 원칙과 일치하는 클라이언트/서버 개체는 일정한 검색과 관련된 조작을 수행한다. 클라이언트/서버 개체는 메모리(230)와 같은 컴퓨터 판독 가능한 매체 내에 포함되어 있는 소프트웨어 명령을 실행하는 프로세서(220)에 응답하여 이들 조작을 실행한다. 컴퓨터 판독 가능한 매체는 하나 이상의 물리적인 또는 논리적인 메모리 장치 및/또는 반송파(carrier wave)로서 정의될 수도 있다.
소프트웨어 명령은 데이터 저장 장치(250)와 같은 다른 컴퓨터 판독 가능한 매체로부터 또는 통신 인터페이스(280)를 통해서 다른 장치로부터 메모리(230) 내로 읽혀질 수 있다. 메모리(230) 내에 저장되어 있는 소프트웨어 명령은 프로세서(220)가 후술하는 프로세스를 수행하도록 한다. 다르게는, 소프트웨어 명령 대신에 또는 이와 협동하는 배선 회로(hardwired circuitry)를 사용하여 본 발명의 원칙과 일치되는 프로세스는 구현할 수도 있다. 따라서, 본 발명의 원칙과 일치되는 구현례는 임의의 하드웨어적인 회로(circuitry)와 소프트웨어의 특정한 조합으로 제한되지 않는다.
<<예시적인 컴퓨터 판독 가능한 매체>>
도 3은 본 발명의 원칙과 일치하는 구현례에 따라, 도 1에서의 서버(120)와 같은 서버와 연관될 수 있는 예시적인 컴퓨터 판독 가능한 매체를 나타낸 도면이다. 컴퓨터 판독 가능한 매체의 내용(content)은 서버(120)에 의해서 액세스 가능한 하나 이상의 메모리 장치 내에 물리적으로 존재하고 있을 수 있다.
컴퓨터 판독 가능한 매체는 문서 및 연관된 주소(예를 들면, 우편물 주소)에 대응하는 입력 항목을 가진 데이터베이스(300)를 포함할 수 있다. 예를 들면, 서버(120)는 하나 이상의 주소를 포함하고 있는 문서를 찾기 위해서 탐색된 문서의 리포지토리를 분석할 수도 있다. 서버(120)는 2003 년 9 월 22 일자로 출원한 발명의 명칭이 "주소의 지리적 코딩 방법(ADDRESS GEOCODING)"인 미국 특허 출원 번호 10/664,902에 설명된 것과 같은 기법을 사용하여 문서로부터 주소를 식별하고 추출할 수 있다. 다른 구현례에서는, 문서들로부터 주소들을 수동으로 추출할 수도 있다.
또 다른 구현례에서는, 문서와 연관된 주소는 다른 정보원(information source)으로부터 추정될 수도 있다. 예를 들면, 문서에 액세스하는 사람의 지리적 위치를 사용하여 문서의 주소를 추정할 수 있다. 문서에 액세스하는 사람의 지리적 위치는 그들의 IP 주소에 기초하여 결정될 수 있다. 어떤 문서에 액세스하는 대부분의 사람들이 동일한 도시(town) 내에 있다면, 문서가 이 도시와 연관된 주소를 가지고 있다고 추정할 수도 있다. 문서 내에 포함되어 있는 회사명 또한 문서의 주소를 추정하는데 사용될 수 있다. 회사명으로부터, 예를 들면 옐로 페이지(yellow page)의 데이터를 사용하여 주소를 결정할 수도 있다. 또한 문서를 호스팅(hosting)하고 있는 서버의 지리적 위치를 사용하여 문서의 주소를 추정할 수도 있다. 문서 내의 주소를 추정하기 위한 이상의 기법 및 다른 기법들은 2003 년 9 월 22 일자로 출원된 발명의 명칭이 "웹 문서의 지리적 관련도를 결정하는 방법(DETERMINING GEOGRAPHICAL RELEVANCE OF WEB DOCUMENTS)"인 미국 특허 출원 번호 10/665,359에 설명되어 있다. 어떠한 경우에라도, 서버(120)는 이들 주소들을 이용하여 데이터베이스(300)를 사용할 수 있다.
데이터베이스(300) 내의 각각의 입력 항목은 독립적으로 검색 가능할 수도 있는 문서 식별자 필드(field)(310)와 주소 필드(320)를 포함할 수 있다. 본 발명의 원칙과 일치하는 다른 구현례에서, 데이터베이스(300) 내의 입력 항목은 추가적인 주소 필드와 같은 더 많은 필드, 및/또는 전화 번호 필드와 같은 다른 필드, 및/또는 주소 필드(320) 내의 정보에 대응하는 위도와 경도 좌표용의 필드를 포함할 수도 있다.
문서 식별자 필드(310)는 문서를 유일하게 식별하는 정보를 포함할 수 있다. 일 구현례에서, 문서 식별자 필드(310)는 문서와 연관된 URL(uniform resource locator)을 포함한다. 주소 필드(320)는 대응하는 문서와 연관된 주소와 관련한 정보를 포함할 수 있다. 동일한 주소가 하나 이상의 문서와 연관될 수도 있는 것이 바람직하다. 예를 들면, 도 3에 나타낸 바와 같이 주소_K는 문서_1의 문서와 문서_2의 문서와 연관되어 있다. 즉, 0 개 내지 수백 개의 문서가 동일하게 연관된 주소를 가지고 있을 수 있다.
<<예시적인 프로세스>>
도 4a 및 도 4b는 본 발명의 원칙과 일치하는 구현례에 따라 주소(address)에 의해서 검색 결과를 클러스터화하기 위한 예시적인 절차의 흐름도이다. 프로세스는 서버(120)가 사용자로부터의 검색 질의를 수신하는 것과 함께 시작될 수 있다(단계 410)(도 4a). 예를 들면, 사용자는 클라이언트(110) 상의 통상적인 웹 브라우저(web browser) 소프트웨어를 사용하여 서버(120)의 검색 엔진(125)에 액세스 (access)할 수 있다. 이후에, 사용자는 서버(120)에 의해서 제공되는 그래픽 사용자 인터페이스(graphical user interface)를 통해서 상기 검색 질의를 입력할 수 있다.
검색 질의는 서로 다른 형태를 취할 수도 있다. 예를 들면, 검색 질의는 사용자가 관심을 가지는 회사 또는 단체와 관련된 하나 이상의 키워드를 포함할 수 있으며, 따라서 상기 회사 또는 단체가 위치하고 있는 하나 이상의 지리적 식별자를 포함할 수도 있다. 키워드는 사용자가 관심을 가지는 회사 또는 단체와 연관된 용어(term)를 포함할 수 있다. 예를 들면, 사용자가 약국(pharmacy)을 찾고자 하는 경우에, 사용자는 용어 "약국"을 키워드로서 포함시킬 수 있다. 유사하게, 사용자가 피자(pizza)를 서비스하는 식당을 찾고자 하는 경우에, 사용자는 용어 "피자"를 키워드로서 포함시킬 수 있다.
지리적 식별자에는 사용자가 관심을 갖는 회사 또는 단체의 위치를 대략적으로 식별하는 위치 한정적인 정보(location-specific information)가 포함될 수 있다. 지리적 식별자에는 관심을 갖는 회사 또는 단체와 연관된 전체 또는 일부분의 주소 또는 전체 또는 일부분의 전화 번호와 같은 정보가 포함될 수 있다. 예를 들면, 사용자는 주(state), 시(city), 우편 번호(zip code), 거리명(street name), 또는 이들 정보를 일부 조합한 것과 같은 주소 한정적인 데이터(address-specific data)를 한정할 수도 있다. 다르게는, 사용자는 지역 번호(area code), 프리픽스(prefix) 또는 이들 정보를 일부 조합한 것과 같은 전화 한정적인 데이터(telephone-specific data)를 한정할 수도 있다.
주소 한정적인 데이터와 전화 한정적인 데이터는 모두 서버(120)가 지리적 위치를 결정할 수 있는 정보를 포함하고 있다. 지리적 위치는 주, 시, 우편 번호 또는 지역 번호와 같이 광범위할 수도 있고, 거리 주소(street address)나 지역 코드 및 프리픽스와 같이 구체적일 수도 있다. 서버(120)는 지리적 위치의 지리적 중심을 결정할 수 있다(단계 420). 예를 들면, 사용자가 "팔로 알토"(Palo Alto)를 한정하면, 서버(120)는 팔로 알토의 지리적 중심을 식별할 수 있다. 마찬가지로, 사용자가 우편 번호 22030을 한정하면, 서버(120)는 이 우편 번호에 의해서 포함되어지는 지역의 지리적 중심을 식별할 수 있다. 서버(120)는 지리적 중심을 위도와 경도 좌표에 의해서 표현할 수 있다.
다른 구현례에서, 서버(120)는 사용자에 의해서 명시적으로 제공된 것 이외의 다른 정보에 기초하여 관련된 지리적 중심을 식별할 수도 있다. 예를 들면, 사용자의 IP 주소(IP address) 또는 과거의 검색 기록을 사용하여 지리적 중심을 추정할 수도 있다. 다르게는, 사용자는 사용자의 "홈"(home) 위치를 서버(120)에 등록할 수도 있다.
이후에, 서버(120)는 지리적 중심의 특정 거리 내의 위치를 포함하는 지역을 관심 지역으로서 식별할 수 있다(단계 430). 예를 들면, 서버(120)는, 실제로는, 상기 지리적 중심의 주위에 일정한 반지름(radius)을 갖는 원(circle)을 그리고, 상기 원 내부의 지역을 관심 지역으로서 식별할 수 있다. 상기 반지름은 소정의 반지름으로서, 8 킬로미터(5 마일(mile)) 내지 16 킬로미터(10 마일)일 수도 있다. 다른 구현례에서, 서버(120)는, 적어도 부분적으로 지리적 식별자의 특이성(specificity)에 기초하여 상기 반지름을 결정할 수도 있다. 예를 들면, 서버(120)는 지리적 식별자가 특정한 주소(예를 들면, 거리 주소)에 대응하는 경우에는 작은 반지름을 제공하고, 지리적 식별자가 매우 광범위한 주소(예를 들면, 주(state))에 대응하는 경우에는 더 큰 반지름을 제공할 수 있다. 또 다른 구현례에서, 서버(120)는 사용자가 상기 반지름을 한정하도록 허용할 수도 있다. 이는 매우 동적인(dynamic) 특징이다. 예를 들면, 검색 결과에 대해서 사용자가 불만이 있는 경우(예를 들면, 검색 결과가 너무 많거나 너무 적은 결과를 제공하는 경우)에, 사용자가 상기 반지름을 증가시키거나 감소시킬 수 있도록 허용될 수 있다. 또 다른 구현례에서, 상기 반지름의 크기는 사용자에 의해서 제공되는 키워드의 형태에 기초하여 동적으로 설정될 수도 있다. 예를 들면, 반지름은 식당 검색에 대해서는 8 킬로미터(5 마일)로 설정되고, 차량 판매 대리점의 검색에 대해서는 32 킬로미터(20 마일)로 설정될 수 있다.
반지름을 사용하는 대신에, 서버(120)는 관심 지역을 식별하기 위해서 운전 거리(driving distance)를 사용할 수도 있다. 다르게는, 서버(120)는 관심 지역을 식별하기 위해서 운전 경로(driving route)의 (직선 거리 또는 운전 거리 중 하나) 거리를 사용할 수도 있다. 예를 들면, 서버(120)는 "마운틴 뷰에서 샌프란시스코까지 운전할 때의 하이웨이 101 일대"(along Highway 101 when driving from Mountain View to San Francisco)를 관심 지역으로 특정할 수도 있다. 서버(120)는 관심 지역을 식별하기 위한 다른 방법을 사용할 수도 있다.
서버(120)는 관심 지역 내에 위치하는 하나 이상의 주소와 연관되 문서를 잠재적인 "히트"(hit)로 식별할 수 있다. 예를 들면, 서버(120)는 탐색된 문서의 리포지토리로부터의 문서와 이들과 관련된 주소가 일치하는 데이터베이스(300)(도 3)와 같은 데이터베이스를 사용하여 관심 지역 내에 위치하는 하나 이상의 주소와 연관된 문서를 식별할 수도 있다. 문서 식별을 용이하게 하기 위해서, 서버(120)는 관심 지역 내에 들어가는 주소에 대해서 데이터베이스(300)를 검색하고, 이후에 이들 주소와 연관된 문서를 식별할 수도 있다.
이후에, 서버(120)는 사용자에 의해서 제공되는 하나 이상이 키워드를 포함하는 잠재적인 히트(hit)가 되는 문서를 관련된 결과로서 식별할 수 있다(단계 450). 예를 들면, 서버(120)는 문서 내의 단어(word)를 분석하고, 이들 단어가 하나 이상의 키워드와 일치하는지를 결정할 수도 있다. 하나 이상의 키워드와 일치하는 단어(word)를 갖는 문서는 관련된 결과로서 분류될 수 있다.
본 발명의 원칙과 일치하는 다른 구현례에서, 단계(440) 및 단계(450)는 반대로 될 수도 있다. 예를 들면, 서버(120)는 하나 이상의 키워드와 일치하는 문서를 결정하고, 이후에 이들 문서 중의 어떤 문서가 관심 지역 내의 주소와 연관되어 있는지를 결정할 수 있다. 또 다른 구현례에서, 단계(440)와 단계(450)는 동시에 실행될 수도 있다. 이 경우에, 서버(120)는 관심 지역 내의 주소와 연관되어 있는 문서를 식별하기 위해서 두 개의 독립적으로 식별된 문서 그룹의 공통 부분을 결정할 수 있다. 어떤 경우에든, 문서 집합(set)은 관련된 결과로서 식별될 수 있다.
서버(120)는 관련된 결과에 점수를 매길 수 있다(단계 460)(도 4b). 서버(120)는 관련된 결과에 점수를 매길 때 서로 다른 인자를 사용할 수도 있다. 예를 들면, 서버(120)는 문서의 점수(score)를 결정할 때 거리 및/또는 관련도를 고려할 수도 있다. 거리(distance)는 문서의 주소가 지리적 중심으로부터 떨어진 거리를 가리킬 수도 있다. 지리적 중심에 더 가까운 주소와 연관된 문서는 지리적 중심으로부터 더 멀리 떨어진 주소와 연관된 문서 보다 더 높은 점수(score)를 받을 수 있다. 관련도는 문서가 포함하고 있는 키워드의 개수 및/또는 하나 이상의 키워드가 문서 내에 얼마나 부각되는지를 가리킬 수 있다. 하나 이상의 키워드를 모두 포함하고 있는 문서는 하나 이상의 키워드의 전부보다 적은 수를 포함하고 있는 문서 보다 더 높은 점수를 받을 수 있다. 제목 내와 같이 더 부각되는 위치에 하나 이상의 키워드를 포함하고 있는 문서는, 작은 글씨로 쓰여진, 덜 부각되는 위치에 하나 이상의 키워드를 포함하고 있는 문서 보다 더 높은 점수를 받을 수 있다.
서버(120)는 관련된 결과의 문서를 동일한 주소와 연관된 문서로 클러스터화한다(단계470). 이를 위해서, 서버(120)는 매겨진 점수에 기초하여 문서를 선택적으로 정렬(sort)할 수도 있다. 서버(120)는 문서 중의 첫번째 문서(예를 들면, 가장 높은 점수를 받은 문서)와 연관된 주소를 고려하고, 또한 상기 동일한 주소와 연관된 임의의 다른 문서가 있는지를 결정할 수 있다. 이후에, 서버(120)는 동일한 주소와 연관되는 것으로서 이들 문서를 함께 클러스터화할 수 있다. 이후에, 서버(120)는 관심 지역 내에 동일하게 위치하는 주소가 있는 경우, 또는 문서 중의 제 2 문서(예를 들면 두번재로 높은 점수를 받은 문서)와 연관된 주소가 있는 경우에 제 1 문서와 연관된 다른 주소를 고려하고, 또한 상기 동일한 주소와 연관된 임의의 다른 문서가 있는지의 여부를 결정할 수 있다. 이후에, 서버(120)는 이들 문서를 함께 클러스터화할 수 있다. 서버(120)는 클러스터가 하나의 클러스터인 경우에도(이는 문서가 다른 임의의 문서와 관련되지 않은 주소와 관련된 경우에 발생한다) 적어도 하나의 클러스터 내에 포함되어 있는 문서 전체에 대해서 마칠 때까지 클러스터화를 계속한다. 서버(120)는 이전의 정렬(sorting)(상술하였음)로부터 순서대로 정렬되지 않았다면, 이들 점수에 기초하여 각각의 클러스터 내의 문서를 정렬한다.
서버(120)는 클러스터의 순위를 매겨서 결과 리스트를 형성할 수 있다(단계 480). 서버(120)는 클러스터의 순위를 매길 때 서로 다른 인자(factor)를 사용할 수 있다. 예를 들면, 서버(120)는 클러스터의 순위를 매길 때 거리와 관련도를 고려할 수 있다. 클러스터에 대한 거리는 이 클러스터와 연관된 주소가 지리적 중심으로부터 떨어진 거리를 가리킬 수 있다. 지리적 중심에 더 가까운 주소를 갖는 클러스터는 지리적 중심으로부터 더 멀리 떨어진 주소를 갖는 클러스터 보다 더 높은 순위에 매겨질 수 있다.
클러스터에 대한 관련도(relevancy)는 클러스터 내에서 문서가 포함하고 있는 키워드의 개수 및/또는 하나 이상의 키워드가 상기 문서 내에서 얼마나 부각되는지를 가리킬 수 있다. 클러스터 내의 문서를 고려하는 경우에, 서버(120)는 클러스터 내에서 가장 잠수가 높게 매겨진 문서에 대한 소정 숫자(예를 들면, 1, 3, 전부 등)를 고려할 수 있다. 하나 이상의 키워드를 모두 포함하고 있는 문서를 갖는 클러스터는 하나 이상의 키워드의 전부보다 적은 수를 포함하고 있는 문서를 갖는 클러스터 보다 더 높은 순위가 매겨질 수 있다. 또한, 제목과 같은 더 부각되는 위치에 하나 이상의 키워드를 포함하고 있는 문서를 갖는 클러스터는, 작은 글씨로 쓰여진 덜 부각되는 위치에 하나 이상이 키워드를 포함하고 있는 문서를 갖는 클러스터보다 더 높은 순위가 매겨질 수 있다.
서버(120)는, 예를 들면 적어도 부분적으로 지리적 식별자의 특이성에 기초하여 거리 또는 관련도의 어느 한쪽에 더 많은 가중치(weight)를 부여할 수도 있다. 예를 들면, 지리적 식별자가 광범위한 경우(예를 들면, 지리적 식별자가 주(stat)나 대도시와 같은 넓은 지리적 위치에 대응하는 경우)에는, 서버(120)는 관련도에 더 높은 가중치를 부여할 수 있다. 지리적 식별자가 좁은 경우(예를 들면, 지리적 식별자가 소도시나 정확한 주소, 또는 거의 정확한 주소와 같이 작은 지리적 위치에 대응하는 경우)에는, 서버(120)는 거리(distance)에 더 높은 가중치를 부여할 수 있다.
상술한 순위 매기기 방법 대신에, 포함하고 있는 문서의 점수(score)에 기초하여 서버(120)가 클러스터의 순위를 매길 수도 있다. 클러스터의 순위를 결정하는 경우에, 서버(120)는 클러스터 내에서 가장 순위가 높은 문서의 소정 숫자(예를 들면, 1, 3, 전부 등)를 고려할 수도 있다. 서버(120)는 이들 문서의 점수를 함께 합산하거나 또는 평균화 기법(averaging technique)과 같은 다른 기법을 사용하여 클러스터의 순위를 결정할 수도 있다.
이후에, 서버(120)는 정렬하고, 사용자에게 결과 리스트를 표시한다(단계 490). 예를 들면, 서버(120)는 클러스터의 순위(rank)에 기초하여 클러스터를 정렬할 수도 있다. 이후에, 서버(120)는 각각의 클러스터에 대한 결과 출력을 생성할 수 있으며, 이 결과 출력은 사용자에게 표시될 수 있다. 클러스터에 대한 결과 출력은 제목(선택되는 경우에, 사용자가 실제 문서로 유도하도록 하는 하이퍼텍스트 링크(hypertext link)를 포함할 수 있다)과, 클러스터 내에서 가장 높은 순위가 매겨진 문서로부터의 스니펫(snippet)(즉, 발췌한 텍스트)을 포함할 수도 있다. 또한, 결과 출력은 하나 이상의 다른 다음으로 높은 순위가 매겨진 문서의 제목(예를 들면, 하이퍼텍스트 링크)을 포함할 수 있으며, 또한 가능하다면 이들 문서와 연관된 스니펫 또는 URL도 포함할 수 있다. 결과 출력은 사용자에 의해서 선택되는 경우에 클러스터 내의 나머지 문서 중의 추가적인 문서 중의 하나의 제목, 스니펫 및/또는 URL을 표시할 수 있는 "더 보기"(See More) 옵션(option)을 더 포함할 수도 있다. 서버(120)는 결과 출력과 연관된 주소에 대응하는 위치를 나타내고 있는 지도(map)와 함께 결과 출력을 표시할 수도 있다.
다른 구현례에서, 클러스터에 대한 결과 출력은, 가능하다면 클러스터와 연관된 주소와 함께 클러스터와 연관된 회사명 또는 단체명을 포함할 수도 있다. 서버(120)는 클러스터 내의 문서 중의 단어(word)를 분석하여 클러스터와 연관된 주소에 대응하는 회사 또는 단체를 결정할 수도 있다. 이 구현례에서, 결과 출력은 클러스터 내에서 가장 높은 순위가 매겨진 문서의 소정 숫자(예를 들면, 4)에 대한 제목, 스니펫, 및/또는 URL을 또한 포함할 수도 있다. 이 구현례에서, 결과 출력은 사용자에 의해서 선택되는 경우에 클러스터 내의 나머지 문서 중의 추가적인 문서 중의 하나의 제목, 스니펫 및/또는 URL을 표시할 수 있는 "더 보기"(See More) 옵션을 더 포함할 수도 있다. 서버(120)는 결과 출력과 연관된 주소에 대응하는 위치를 나타내고 있는 지도(map)와 함께 결과 출력을 표시할 수도 있다.
양호한 결과에는 지리적 식별자를 형성하는 단어(word)가 불필요하게 포함되지 않는 것이 바람직할 수 있다. 즉, 양호한 결과는 지리적 식별자의 위치와는 다른 위치(여전히 관심 지역 내이지만)와 연관될 수도 있다. 또한 결과 리스트로부터 배제되어야 하는 문서에 대해서, 이 문서가 사용자에 의해서 제공되어지는 관심 지역 내에 위치하는 주소 또는 임의의 키워드와 연관되지 않는 것이 바람직할 수 있다.
<<예>>
사용자가 팔로 알토 지역 내에서 피자를 서비스하는 식당을 검색하는 경우를 가정한다. 사용자는 통상적인 웹 브라우저 소프트웨어를 사용하여 서버에 액세스할 수 있다. 사용자는 다음과 같은 검색 질의를 제공한다고 가정한다: "pizza Palo Alto" 서버는 상기 검색 질의가, 적어도 부분적으로 하나 이상의 키워드("pizza")와 하나 이상의 지리적 식별자("Palo Alto")의 존재에 기초하여 특정 지역 내의 회사 또는 단체에 대한 검색이라고 인식할 수 있다.
도 5는 본 발명의 원칙과 일치하는 상기 예시적인 구현례에 따른 서버의 일부를 나타낸 기능 블록도이다. 서버는 팔로 알토(Palo Alto)의 지리적 중심을, 가능하다면 위도와 경도 좌표에 의해서 결정할 수 있다. 이후에, 서버는 관심 지역을 식별할 수 있다. 반지름은 16 킬로미터(10 마일(mile))로 설정되었다고 가정한다. 서버는 16 킬로미터(10 마일) 반지름을 가진 팔로 알토의 지리적 중심을 중심으로 한 원(circle) 내의 지역을 포함하도록 관심 지역을 결정할 수 있다.
서버는 잠재적인 히트(hit)로서 관심 지역 내에 위치하는 하나 이상의 주소와 연관된 문서를 식별하기 위해 탐색된 문서의 리포지토리로부터 문서를 분석할 수 있다. 잠재적인 히트에는 50 개의 문서가 포함된다고 가정한다: 문서 1 내지 문서 50 이들 문서 중의 일부는 관심 지역 내에 위치하는 하나 이상의 주소와 연관되어 있을 수 있다. 예를 들면, 문서 1은 네 개의 주소와 연관되어 있으며, 그 중에 세 개가 관심 지역 내에 위치하고 있다. 어둡게 표시한 블록(block)은 관심 지역 내에 위치하지 않은 주소를 나타낸다. 마찬가지로, 문서 2는 세 개의 주소와 연관되어 있으며, 이들 모두는 관심 지역 내에 위치하고 있다. 문서 50은 세 개의 주소와 연관되어 있으며, 그 중에 두 개는 관심 지역 내에 위치해 있다.
이후에, 서버는 문서 1 내지 문서 50 중의 어떤 문서가 키워드 "피자"(pizza)를 포함하고 있는지를 식별할 수 있다. 예를 들면, 서버는 문서 내의 단어(word)를 분석하고, 임의의 단어들이 키워드 "피자"(pizza)와 일치하는지를 결정할 수 있다. 단어 "피자"(pizza)를 포함하고 있는 문서는 관련된 결과로서 분류될 수 있다. 문서 1 내지 문서 25만 단어 "피자"(pizza)를 포함하고 있고, 따라서 관련된 결과를 형성한다고 가정한다.
서버는, 예를 들면 거리 및/또는 관련도에 기초하여 관련된 결과의 점수를 매길 수 있다. 문서 1은 팔로 알토의 지리적 중심과 가장 가까운 주소를 포함하고 있고, 또한 그 제목과 같은 부각되는 위치에 단어 "피자"(pizza)를 포함하고있다고 가정한다. 이후에, 서버는 나머지 문서들 보다 문서 1에 대한 점수를 더 높게 매길 수 있다. 또한, 문서 25는 지리적 중심으로부터 가장 멀리 떨어져 있고, 또한 매우 작은 글씨로 쓰여진 단어 "피자"(pizza)를 포함하고 있다고 가정한다. 서버는 나머지 문서들 보다 문서 25에 대한 점수를 더 낮게 매길 수 있다.
서버는 각 문서가 포함하고 있는 주소에 기초하여 문서 1 내지 문서 25를 클러스터화할 수 있다. 서버는 문서의 점수에 기초하여 문서를 정렬(sort)하고, 또한 상기 동일한 주소와 연관된 임의의 다른 문서가 있는지를 결정하기 위해서 문서 중의 하나(예를 들면, 문서 1)와 연관된 주소를 고려할 수 있다. 문서 3 및 문서 12가 동일한 주소와 연관되어 있다고 가정한다. 서버는 동일한 주소와 연관되어 있는 것으로서 문서 1, 문서 3 및 문서 12를 클러스터화한다.
이후에, 서버는 다른 주소, 예를 들면 문서 1 또는 다른 문서와 연관되어 있는 다른 주소를 고려할 수 있다. 이후에, 서버는 임의의 다른 문서가 상기 주소와 연관되어 있는지를 결정할 수 있다. 상기 주소와 연관되어 있는 몇 개의 문서가 있고, 그 중의 하나가 문서 25라고 가정한다. 이후에, 서버는 동일한 주소와 연관되는 것으로서 문서 1, 문서 2, ..., 문서 25를 클러스터화할 수 있다.
서버는 더 이상의 추가적인 클러스터가 형성되지 않을 때까지 이 프로세스를 계속할 수도 있다. 하나 이상의 문서 1 내지 문서 25에 포함된 각각의 서로 다른 주소에 대해서 하나의 클러스터만이 형성되어야 한다. 10 개의 서로 다른 주소가 있고, 따라서 10 개의 클러스터가 형성되었다고 가정한다. 도 5에 나타낸 바와 같이, 클러스터 중의 일부는 동일한 문서를 포함할 수도 있다. 예를 들면, 클러스터 1 및 클러스터 2는 모두 문서 1을 포함하고 있다.
이후에, 서버는 클러스터의 순위를 매기고 정렬하여 결과 리스트를 형성하고, 사용자에게 결과 리스트를 표시한다. 도 6a는 본 발명의 원칙과 일치하는 구현례에 따른 예시적인 결과 리스트를 나타낸 도면이다. 도 6a에 나타낸 바와 같이, 결과 리스트는 두 개의 클러스터에 대응하는 두 개의 결과 출력(610, 620)을 포함하고 있다. 결과 출력(610)은 클러스터 내의 네 개의 문서(612, 614, 616, 618)를 가리키고 있다. 문서(612)는 클러스터 내의 가장 높은 점수를 받은 문서에 대응할 수 있다. 문서(612)에 대해서, 서버는 제목(title)과 스니펫(snippet)을 포함할 수 있다. 문서(614-618)는 더 낮은 점수가 매겨진 문서와 대응할 수 있다. 도 6a에 나타낸 바와 같이, 서버는 이들 문서와 연관된 제목 및/또는 URL을 포함할 수 있다.
도 6b는 본 발명의 원칙과 일치하는 다른 구현례에 따른 예시적인 결과 리스트를 나타낸 도면이다. 도 6b에 나타낸 바와 같이, 결과 리스트는 두 개의 클러스터에 대응하는 두 개의 결과 출력(650, 660)을 포함하고 있다. 결과 출력(650)은 회사명, 및 가능하다면 클러스터(652)와 연관된 주소를 포함하고 있으며, 또한 클러스터 내의 세 개의 문서(654, 656, 658)를 가리키고 있다. 문서(654-658)는 매겨진 점수에 의해서 순서대로 정리되어 있을 수 있다. 도 6b에 나타낸 바와 같이, 서버는 이들 문서와 연관된 제목 및/또는 URL을 포함할 수 있다.
<<결론>>
본 발명의 원칙과 일치하는 시스템 및 방법은 사용자가 관심을 가지는 위치(또는 전화 번호)에 기초하여 검색 결과를 클러스터화한다. 사용자는 회사 또는 단체와 연관된 데이터를 제공하며, 또한 회사 또는 단체의 위치를 제공할 수도 있다. 사용자는 그들이 원하는 대로 넓게 또는 좁게 위치 데이터를 제공할 수 있다. 사용자들은 또한 더 많거나 더 적은 결과를 획득하기 위해서 동적으로(dynamic) 위치 데이터를 넓히거나 좁힐 수도 있다.
본 발명의 바람직한 실시예에 대해서 상술한 설명은 도면 및 발명의 상세한 설명으로 제공되지만, 이는 본 발명이 개시된 정확한 형태(form)로만 본 발명을 되거나 개시된 정확한 형태(form)로만 본 발명을 한정하고자 의도되지는 않는다. 수정 및 변경은 상술한 개시 내용을 참조하여 가능할 수 있으며, 또는 본 발명의 실시로부터 획득할 수도 있다. 예를 들면, 도 4의 (a) 및 도 4의 (b)와 관련하여 일련의 단계들을 설명하였지만, 이들 단계들의 순서는 본 발명의 원칙과 일치하는 다른 구현례(implementation)에서 수정될 수도 있다. 또한, 비종속적인 단계는 병렬적으로 수행될 수도 있다.
또한, 이상에서 설명한 클러스터화는 연관된 주소에 기초하여 문서를 그룹화하는 것으로 설명되었다. 본 발명의 원칙에 일치하는 다른 구현례에서는, 클러스터화는 연관된 전화 번호에 기초하여 문서를 그룹화하도록 수행될 수도 있다. 예를 들면, 사용자는 검색 질의 내에 전화 번호의 일부분만을 제공할 수도 있다. 서버는 이 전화 번호의 일부분과 연관되어 있으며, 또한 검색 질의 내에 포함되어 있는 임의의 키워드와 일치하는 문서를 식별할 수 있다. 이후에, 서버는 연관된 전화 번호에 기초하여 상기 문서를 클러스터와하고, 또한 사용자에게 검색 결과로서 이들 클러스터를 표시한다.
또한, 상술한 설명에서는 사용자에게 유용한 검색 결과를 생성해내는데 초점을 맞추었지만, 여기에만 국한되지 않는다. 예를 들면, 상술한 단계들은 사용자에 대한 타겟 광고를 하는데, 또는 사용자를 클러스트화하는데 사용될 수도 있다. 키워드 및 지리적 식별자는 사용자의 관심 분야와 위치를 결정하는데 사용될 수도 있다. 서버는 이들 관심 분야와 위치를 사용하여 상기 검색 결과와 함께 상기 사용자에게 표시할 광고를 식별할 수도 있다. 사용자가 팔로 알토(Palo Alto) 지역 내에서 피자를 팔고 있는 식당을 검색하는 예에서, 서버는 팔로 알토 지역(또는 관심 지역) 내의 다른 식당(아마도 피자를 팔지 않는 식당)과 관련한 광고를 사용자에게 표시할 수도 있다. 이들 또는 다른 광고는 상술한 것과 유사한 방식으로 클러스터화될 수 있다.

Claims (33)

  1. 주소에 의해서 클러스터화하는 방법에 있어서,
    하나 이상의 키워드(keyword)를 포함하는 검색 질의를 수신하는 단계와,
    하나 이상의 지리적 식별자(identifier)를 획득하는 단계와,
    적어도 부분적으로 상기 하나 이상의 지리적 식별자에 기초하여 관심 지역을 식별하고, 상기 관심 지역의 크기는 적어도 부분적으로 하나 이상의 키워드에 기초하여 동적으로 설정되는 단계와,
    상기 관심 지역 내에 위치하는 주소와 연관된 문서를 식별하는 단계와,
    상기 하나 이상의 키워드와 일치하는 상기 식별된 문서 중의 하나를 관련 문서로 결정하는 단계와,
    상기 관련 문서를, 적어도 부분적으로 상기 관련 문서와 연관된 주소에 기초하여 클러스터로 그룹화하고, 복수의 클러스터 각각은 상기 주소 중 하나에 대응하는 단계, 및
    상기 클러스터를 표시하는 단계
    를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  2. 제 1 항에 있어서,
    상기 하나 이상의 지리적 식별자는 상기 검색 질의의 일부로서 수신되는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  3. 제 1 항에 있어서,
    상기 하나 이상의 지리적 식별자는 상기 검색 질의와는 독립적으로 추론되는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  4. 제 1 항에 있어서,
    상기 하나 이상의 키워드는 회사 또는 단체와 관련되어 있는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  5. 제 4 항에 있어서,
    상기 하나 이상의 지리적 식별자는 상기 회사 또는 단체의 위치를 대략적으로 식별하는 위치 한정적인 정보를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  6. 제 1 항에 있어서,
    상기 하나 이상의 지리적 식별자는 부분적인 주소, 부분적인 전화 번호, 전체 주소, 또는 전체 전화 번호 중의 적어도 하나를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  7. 제 1 항에 있어서,
    상기 관심 지역을 식별하는 단계는,
    적어도 부분적으로 상기 하나 이상의 지리적 식별자에 기초하여 지리적 위치를 결정하는 단계와,
    상기 지리적 위치의 지리적 중심(center)를 결정하는 단계, 및
    상기 지리적 중심의 특정 거리 내의 위치를 상기 관심 지역으로 식별하고, 상기 특정 거리는 적어도 부분적으로 하나 이상의 키워드에 기초하여 동적으로 설정되는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  8. 제 7 항에 있어서,
    상기 위치를 식별하는 단계는,
    반지름(radius)을 결정하는 단계, 및
    상기 결정된 반지름을 사용하여 상기 지리적 중심을 중심으로 하는 원(circle)으로서 상기 관심 지역을 식별하는 단계를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  9. 삭제
  10. 삭제
  11. 삭제
  12. 제 1 항에 있어서,
    상기 문서를 식별하는 단계는,
    문서를, 탐색된 문서의 리포지토리로부터 상기 문서와 연관된 주소로 연관시키는 데이터 베이스에 액세스(access)하는 단계를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  13. 제 1 항에 있어서,
    거리 인자 또는 관련도 인자 중의 적어도 하나에 기초하여 상기 관련 문서를 평가하는 단계를 더 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  14. 제 13 항에 있어서,
    상기 관련 문서 중의 하나에 대한 상기 거리 인자는, 상기 관련 문서 중의 하나와 연관된 주소가 상기 관심 지역의 지리적 중심에서 나온 거리인 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  15. 제 13 항에 있어서,
    상기 관련 문서 중의 하나에 대한 상기 관련도 인자는, 상기 관련 문서 중의 하나에 존재하는 상기 하나 이상의 키워드 수, 또는 상기 하나 이상의 키워드가 상기 관련 문서 중의 하나에 얼마나 부각되는지 중의 적어도 하나인 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  16. 제 1 항에 있어서,
    상기 관련 문서를 클러스터로 그룹화하는 단계는,
    상기 관심 지역 내에 위치하는 상기 각각의 주소에 대해 별도의 하나의 클러스터를 형성하는 단계를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  17. 제 1 항에 있어서,
    상기 관련 문서를 클러스터로 그룹화하는 단계는,
    상기 관련 문서 중의 제 1 문서와 연관된 주소 중의 제 1 주소를 식별하는 단계와,
    마찬가지로 상기 제 1 주소와 연관된 상기 관련 문서 중의 하나 이상의 제 2 문서를 결정하는 단계, 및
    상기 제 1 관련 문서와 상기 하나 이상의 제 2 관련 문서를 클러스터로 그룹화하는 단계를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  18. 제 1 항에 있어서,
    상기 관련 문서를 클러스터로 그룹화하는 단계는,
    상기 관련 문서 각각을 적어도 하나의 클러스터 내로 위치시키는 단계를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  19. 제 1 항에 있어서,
    상기 관련 문서를 클러스터로 그룹화하는 단계는,
    상기 관련 문서 중의 적어도 하나를 복수의 클러스터 내로 위치시키는 단계를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  20. 제 1 항에 있어서,
    상기 클러스터를 표시하는 단계는,
    상기 클러스터 각각의 내부에서 상기 관련 문서에 대한 점수(score)를 생성하는 단계, 및
    적어도 부분적으로 상기 점수에 기초하여 상기 클러스터 각각의 내부에서 상기 관련 문서를 분류하는 단계를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  21. 제 1 항에 있어서,
    상기 클러스터를 표시하는 단계는,
    거리 인자 또는 관련도 인자 중 적어도 하나에 기초하여 상기 클러스터의 순위를 매기는 단계, 및
    적어도 부분적으로 상기 매겨진 순위에 기초하여 상기 클러스터를 분류하는 단계를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  22. 제 21 항에 있어서,
    상기 클러스터 중의 하나에 대한 상기 거리 인자는, 상기 하나의 클러스터와 연관된 주소가 상기 관심 지역의 지리적 중심에서 나온 거리인 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  23. 제 22 항에 있어서,
    상기 클러스터 중의 하나에 대한 상기 관련도 인자는, 상기 하나의 클러스터 내의 상기 관련 문서 중의 적어도 하나에 존재하는 상기 하나 이상의 키워드 수, 또는 상기 하나 이상의 키워드가 상기 하나의 클러스터 내의 상기 관련 문서 중의 적어도 하나에 얼마나 부각되는지 중의 적어도 하나인 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  24. 제 21 항에 있어서,
    상기 클러스터를 표시하는 단계는,
    적어도 부분적으로 하나 이상의 지리적 식별자의 특이성에 기초하여, 상기 거리 인자 또는 상기 관련도 인자에 서로 다르게 가중치를 주는 단계를 더 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  25. 제 1 항에 있어서,
    상기 클러스터를 표시하는 단계는,
    상기 클러스터의 각각에 대한 결과 출력을 형성하는 단계를 포함하며, 상기 결과 출력은 상기 클러스터 내의 상기 관련 문서 중의 하나에 대한 타이틀(title) 또는 스니펫(snippet) 중의 적어도 하나를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  26. 제 1 항에 있어서,
    상기 클러스터를 표시하는 단계는,
    상기 클러스터 각각에 대한 결과 출력을 형성하는 단계를 포함하며, 상기 결과 출력은 회사 또는 단체의 명칭과 상기 클러스터 내의 하나 이상의 상기 관련 문서에 대한 타이틀을 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  27. 검색 결과를 형성하기 위한 시스템에 있어서,
    하나 이상의 키워드를 포함하는 검색 질의를 수신하는 수단과,
    지리적 위치를 식별하는 수단과,
    상기 지리적 위치의 지리적 중심을 결정하는 수단과,
    상기 지리적 중심의 특정 거리 내의 위치를 지리적 관심 지역으로 식별하고, 상기 특정 거리는, 적어도 부분적으로 상기 하나 이상의 키워드에 기초하여 동적으로 설정되는 수단과,
    상기 지리적 관심 지역 내에 위치하는 주소와 연관된 문서를 식별하는 수단과,
    적어도 부분적으로 상기 검색 질의에 기초하여, 상기 식별된 문서 중의 관련된 것을 관련 문서로 결정하는 수단, 및
    적어도 부분적으로 상기 관련 문서와 연관된 주소에 기초하여 상기 관련 문서를 클러스터로 형성하고, 복수의 클러스터 각각은 상기 주소 중 하나에 대응하는 수단
    을 포함하는 것을 특징으로 하는 검색 결과를 형성하기 위한 시스템.
  28. 검색 결과를 형성하기 위한 시스템에 있어서,
    문서와 연관된 주소에 문서를 일치시키는 정보를 저장하도록 구성된 메모리, 및
    상기 메모리에 접속되는 프로세서를 포함하며, 상기 프로세서는,
    하나 이상의 지리적 식별자를 포함하는 검색 질의를 수신하고,
    적어도 부분적으로 상기 하나 이상의 지리적 식별자에 기초하여 지리적 관심 지역을 결정하고,
    적어도 부분적으로 상기 메모리 내에 저장된 상기 정보에 기초하여 상기 지리적 관심 지역 내에 위치하는 주소와 연관된 문서를 식별하고,
    적어도 부분적으로 상기 식별된 문서와 연관된 주소에 기초하여 상기 식별된 문서를 클러스터로 그룹화하고, 복수의 클러스터 각각은 상기 주소 중 하나에 대응하고,
    적어도 부분적으로 거리 인자와 관련도 인자에 기초하여 클러스터 각각에 점수를 할당하고, 적어도 부분적으로 하나 이상의 지리적 식별자의 특이성에 기초하여, 상기 거리 인자 또는 상기 관련도 인자 중 적어도 하나에 가중치를 주고,
    적어도 부분적으로, 상기 할당된 점수에 기초하여 상기 클러스터를 상기 검색 결과로서 제공하도록 구성되는 것을 특징으로 하는 검색 결과를 형성하기 위한 시스템.
  29. 주소에 의해서 클러스터화하는 방법에 있어서,
    검색 질의를 수신하는 단계와,
    적어도 부분적으로 상기 검색 질의에 기초하여 지리적 관심 지역을 식별하는 단계와,
    상기 지리적 관심 지역 내에 위치하는 주소와 연관된 문서를 식별하는 단계와,
    적어도 부분적으로 상기 식별된 문서와 연관된 주소에 기초하여 상기 식별된 문서를 클러스터로 그룹화하고, 복수의 클러스터 각각은 상기 주소 중 하나에 대응하는 단계와,
    적어도 부분적으로 거리 인자와 관련도 인자에 기초하여 클러스터 각각에 점수를 할당하고, 적어도 부분적으로 하나 이상의 지리적 식별자의 특이성에 기초하여, 상기 거리 인자 또는 상기 관련도 인자 중 적어도 하나에 가중치를 주는 단계, 및
    적어도 부분적으로 상기 할당된 점수에 기초하여 상기 클러스터를 표시하는 단계
    를 포함하는 것을 특징으로 하는 주소에 의해서 클러스터화하는 방법.
  30. 검색 결과를 형성하기 위한 방법에 있어서,
    하나 이상의 키워드와 적어도 일부분의 전화 번호를 포함하고 있는 검색 질의를 수신하는 단계와,
    적어도 부분적으로 상기 적어도 일부분의 전화 번호에 기초하여 지리적 관심 지역을 식별하고, 상기 지리적 관심 지역의 크기는, 적어도 부분적으로 하나 이상의 키워드에 기초하여 동적으로 설정되는 단계와,
    상기 지리적 관심 지역 내에 위치하는 주소와 연관된 문서를 식별하는 단계와,
    적어도 부분적으로 상기 식별된 문서와 연관된 주소에 기초하여 상기 식별된 문서를 클러스터로 그룹화하고, 복수의 클러스터 각각은 상기 주소 중 하나에 대응하는 단계, 및
    상기 클러스터를 검색 결과로서 표시하는 단계
    를 포함하는 것을 특징으로 하는 검색 결과를 형성하기 위한 방법.
  31. 제 30 항에 있어서,
    상기 적어도 일부분의 전화 번호는 상기 전화 번호와 연관된 지역 번호(area code) 또는 프리픽스(prefix) 중의 적어도 하나를 포함하는 것을 특징으로 하는 검색 결과를 형성하기 위한 방법.
  32. 검색 결과를 형성하기 위한 방법에 있어서,
    하나 이상의 키워드와 적어도 일부분의 전화 번호를 포함하는 검색 질의를 수신하는 단계와,
    상기 적어도 일부분의 전화 번호와 일치하는 전화 번호와 연관된 문서를 식별하는 단계와,
    상기 하나 이상의 키워드와 일치하는 상기 식별된 문서 중의 하나를 관련 문서로 결정하는 단계와,
    적어도 부분적으로 상기 관련 문서 내에 포함된 상기 전화 번호에 기초하여 상기 관련 문서를 클러스터로 그룹화하고, 복수의 클러스터 각각은 상기 전화 번호 중 하나에 대응하는 단계, 및
    상기 클러스터를 검색 결과로서 표시하는 단계
    를 포함하는 것을 특징으로 하는 검색 결과를 형성하기 위한 방법.
  33. 검색 결과를 형성하기 위한 방법에 있어서,
    적어도 일부분의 전화 번호를 포함하고 있는 검색 질의를 수신하는 단계와,
    상기 적어도 일부분의 전화 번호와 일치하는 전화 번호와 연관된 문서를 식별하는 단계와,
    적어도 부분적으로 상기 식별된 문서 내에 포함된 상기 전화 번호에 기초하여 상기 식별된 문서를 클러스터로 그룹화하고, 복수의 클러스터 각각은 상기 전화 번호 중 하나에 대응하는 단계, 및
    상기 클러스터를 검색 결과로서 표시하는 단계
    를 포함하는 것을 특징으로 하는 검색 결과를 형성하기 위한 방법.
KR1020067005695A 2003-09-22 2004-09-20 검색 결과를 클러스터화하기 위한 시스템 및 방법 KR100814667B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/664,929 US8346770B2 (en) 2003-09-22 2003-09-22 Systems and methods for clustering search results
US10/664,929 2003-09-22

Publications (2)

Publication Number Publication Date
KR20060095979A KR20060095979A (ko) 2006-09-05
KR100814667B1 true KR100814667B1 (ko) 2008-03-18

Family

ID=34312824

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067005695A KR100814667B1 (ko) 2003-09-22 2004-09-20 검색 결과를 클러스터화하기 위한 시스템 및 방법

Country Status (5)

Country Link
US (1) US8346770B2 (ko)
EP (1) EP1665101A1 (ko)
KR (1) KR100814667B1 (ko)
NO (1) NO337806B1 (ko)
WO (1) WO2005031614A1 (ko)

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7334195B2 (en) * 2003-10-14 2008-02-19 Microsoft Corporation System and process for presenting search results in a histogram/cluster format
US8676790B1 (en) * 2003-12-05 2014-03-18 Google Inc. Methods and systems for improving search rankings using advertising data
US7302645B1 (en) 2003-12-10 2007-11-27 Google Inc. Methods and systems for identifying manipulated articles
CA2550306A1 (en) * 2003-12-19 2005-07-14 Telcontar, Inc. Geocoding locations near a specified city
US8675995B2 (en) * 2004-07-09 2014-03-18 Terrago Technologies, Inc. Precisely locating features on geospatial imagery
US8953887B2 (en) 2004-07-09 2015-02-10 Terrago Technologies, Inc. Processing time-based geospatial data
US7657519B2 (en) * 2004-09-30 2010-02-02 Microsoft Corporation Forming intent-based clusters and employing same by search
US7831438B2 (en) * 2004-12-30 2010-11-09 Google Inc. Local item extraction
US7574530B2 (en) * 2005-03-10 2009-08-11 Microsoft Corporation Method and system for web resource location classification and detection
US7353034B2 (en) 2005-04-04 2008-04-01 X One, Inc. Location sharing and tracking using mobile phones or other wireless devices
US7424472B2 (en) * 2005-05-27 2008-09-09 Microsoft Corporation Search query dominant location detection
US7822751B2 (en) * 2005-05-27 2010-10-26 Google Inc. Scoring local search results based on location prominence
US10198521B2 (en) * 2005-06-27 2019-02-05 Google Llc Processing ambiguous search requests in a geographic information system
US7933897B2 (en) 2005-10-12 2011-04-26 Google Inc. Entity display priority in a distributed geographic information system
US20070156671A1 (en) * 2005-12-30 2007-07-05 Yip Kai K K Category search for structured documents
US7644373B2 (en) 2006-01-23 2010-01-05 Microsoft Corporation User interface for viewing clusters of images
US8122013B1 (en) 2006-01-27 2012-02-21 Google Inc. Title based local search ranking
US7606875B2 (en) * 2006-03-28 2009-10-20 Microsoft Corporation Detecting serving area of a web resource
KR100842080B1 (ko) * 2006-05-03 2008-06-30 중앙대학교 산학협력단 문서의 그룹별 분류방법
US9396269B2 (en) 2006-06-28 2016-07-19 Microsoft Technology Licensing, Llc Search engine that identifies and uses social networks in communications, retrieval, and electronic commerce
US9141704B2 (en) * 2006-06-28 2015-09-22 Microsoft Technology Licensing, Llc Data management in social networks
US8874592B2 (en) 2006-06-28 2014-10-28 Microsoft Corporation Search guided by location and context
US7650431B2 (en) * 2006-08-28 2010-01-19 Microsoft Corporation Serving locally relevant advertisements
US8666821B2 (en) 2006-08-28 2014-03-04 Microsoft Corporation Selecting advertisements based on serving area and map area
KR100868379B1 (ko) 2006-10-25 2008-11-12 활로 커뮤니케이션즈(주) 전화번호 데이터베이스를 활용한 전화번호 검색순위 및/또는 경제동향지수 제공 방법 및 시스템
US8005822B2 (en) * 2007-01-17 2011-08-23 Google Inc. Location in search queries
US20080189177A1 (en) * 2007-02-02 2008-08-07 Anderton Jared M Systems and methods for providing advertisements
US20080208847A1 (en) * 2007-02-26 2008-08-28 Fabian Moerchen Relevance ranking for document retrieval
US20090037403A1 (en) * 2007-07-31 2009-02-05 Microsoft Corporation Generalized location identification
US8825683B2 (en) * 2007-11-26 2014-09-02 Urban Mapping, Inc. Generating geographical keywords for geotargeting search engine-offered advertisements
KR100932843B1 (ko) * 2008-01-29 2009-12-21 엔에이치엔(주) 검색결과간의 연관도에 기초하여 클러스터링된 검색결과를제공하는 방법 및 시스템 그리고 검색결과를클러스터링하는 방법 및 시스템
US8051083B2 (en) * 2008-04-16 2011-11-01 Microsoft Corporation Forum web page clustering based on repetitive regions
US9092454B2 (en) * 2008-04-22 2015-07-28 Microsoft Technology Licensing, Llc Discovering co-located queries in geographic search logs
US8670617B2 (en) * 2008-05-14 2014-03-11 Terrago Technologies, Inc. Systems and methods for linking content to individual image features
US8423536B2 (en) * 2008-08-05 2013-04-16 Yellowpages.Com Llc Systems and methods to sort information related to entities having different locations
US8631007B1 (en) 2008-12-09 2014-01-14 Google Inc. Disambiguating keywords and other query terms used to select sponsored content
US20110078101A1 (en) * 2009-09-25 2011-03-31 International Business Machines Corporation Recommending one or more existing notes related to a current analytic activity of a user
US20110078160A1 (en) * 2009-09-25 2011-03-31 International Business Machines Corporation Recommending one or more concepts related to a current analytic activity of a user
US8635228B2 (en) * 2009-11-16 2014-01-21 Terrago Technologies, Inc. Dynamically linking relevant documents to regions of interest
JP2011138197A (ja) * 2009-12-25 2011-07-14 Sony Corp 情報処理装置、関連度評価方法及びプログラム
US8756231B2 (en) * 2010-01-28 2014-06-17 International Business Machines Corporation Search using proximity for clustering information
US8600875B2 (en) 2010-04-12 2013-12-03 Visa International Service Association Authentication process using search technology
US8463772B1 (en) 2010-05-13 2013-06-11 Google Inc. Varied-importance proximity values
US10037357B1 (en) 2010-08-17 2018-07-31 Google Llc Selecting between global and location-specific search results
JP4828653B1 (ja) * 2010-12-07 2011-11-30 楽天株式会社 サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
CA2760624C (en) 2010-12-07 2015-04-07 Rakuten, Inc. Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program
US8666973B2 (en) 2011-02-23 2014-03-04 Novell, Inc. Structured relevance—a mechanism to reveal how data is related
US9201964B2 (en) * 2012-01-23 2015-12-01 Microsoft Technology Licensing, Llc Identifying related entities
US9110959B2 (en) * 2012-05-03 2015-08-18 Salesforce.Com, Inc. System and method for geo-location data type searching in an on demand environment
CN103425659B (zh) * 2012-05-15 2017-06-09 阿里巴巴集团控股有限公司 基于地理位置的信息搜索方法及服务器
US8855281B2 (en) 2012-06-08 2014-10-07 International Business Machines Corporation Systems for retrieving content in a unified communications environment
US9418156B2 (en) * 2012-08-10 2016-08-16 Google Inc. Providing local data with search results
US9426232B1 (en) * 2012-08-21 2016-08-23 Google Inc. Geo-location based content publishing platform
US9462015B2 (en) * 2012-10-31 2016-10-04 Virtualbeam, Inc. Distributed association engine
US9047368B1 (en) * 2013-02-19 2015-06-02 Symantec Corporation Self-organizing user-centric document vault
US9483522B2 (en) * 2013-03-07 2016-11-01 Ricoh Company, Ltd. Form aggregation based on marks in graphic form fields
US10599738B1 (en) 2013-04-09 2020-03-24 Google Llc Real-time generation of an improved graphical user interface for overlapping electronic content
US11222084B2 (en) 2013-10-22 2022-01-11 Steven Michael VITTORIO Content search and results
WO2015061479A1 (en) 2013-10-22 2015-04-30 Vittorio Steven Michael Content and search results
US9858291B1 (en) 2013-10-30 2018-01-02 Google Inc. Detection of related local entities
US10025830B1 (en) 2013-10-30 2018-07-17 Google Llc Aggregation of disparate entity lists for local entities
US10348842B1 (en) 2013-11-19 2019-07-09 El Toro.Com, Llc Generating content based on a captured IP address associated with a visit to an electronic resource
US9515984B1 (en) 2013-11-19 2016-12-06 El Toro.Com, Llc Determining and utilizing one or more attributes of IP addresses
US10505893B1 (en) * 2013-11-19 2019-12-10 El Toro.Com, Llc Generating content based on search instances
US10333890B1 (en) 2013-11-19 2019-06-25 El Toro.Com, Llc Determining IP addresses that are associated with physical locations with new occupants and providing advertisements tailored to new movers to one or more of those IP addresses
US11586680B2 (en) * 2014-03-31 2023-02-21 International Business Machines Corporation Fast and accurate geomapping
US11250008B2 (en) * 2015-04-17 2022-02-15 Steven Michael VITTORIO Content search and results
US20160321346A1 (en) * 2015-05-01 2016-11-03 Kevin A. Li Clustering Search Results
KR101688829B1 (ko) * 2015-07-24 2016-12-22 삼성에스디에스 주식회사 사용자 패턴을 반영한 문서 제공 방법 및 그 장치
US20180225291A1 (en) * 2015-08-21 2018-08-09 Hewlett-Packard Development Company, L.P. Identifying Documents
US20170099342A1 (en) * 2015-10-04 2017-04-06 Anthony Ko-Ping Chien Dynamically Served Content
CN107305577B (zh) * 2016-04-25 2020-12-22 北京京东尚科信息技术有限公司 基于K-means的妥投地址数据处理方法和系统
US10747800B2 (en) * 2017-06-29 2020-08-18 Microsoft Technology Licensing, Llc Clustering search results in an enterprise search system
US10932118B1 (en) 2018-05-25 2021-02-23 El Toro.Com, Llc Systems, methods, and apparatuses for providing content according to geolocation
KR102185703B1 (ko) * 2019-04-05 2020-12-02 연세대학교 산학협력단 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치
US11803603B2 (en) * 2019-06-03 2023-10-31 Overwatch Systems, Ltd. Integrating platform for managing GIS data and images
US11934416B2 (en) * 2021-04-13 2024-03-19 UiPath, Inc. Task and process mining by robotic process automations across a computing environment

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0860786A2 (en) 1997-02-24 1998-08-26 International Business Machines Corporation System and method for hierarchically grouping and ranking a set of objects in a query context
US20010011270A1 (en) * 1998-10-28 2001-08-02 Martin W. Himmelstein Method and apparatus of expanding web searching capabilities
US20020078035A1 (en) * 2000-02-22 2002-06-20 Frank John R. Spatially coding and displaying information

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US87505A (en) * 1869-03-02 Improved cotton-press
US78035A (en) * 1868-05-19 H a e v b t w e b st e e
US11270A (en) * 1854-07-11 Improvement in the construction of inkstands
US6101496A (en) * 1998-06-08 2000-08-08 Mapinfo Corporation Ordered information geocoding method and apparatus
GB2356948A (en) 1999-11-30 2001-06-06 Saeed Mohamed Moghul Search system
AUPQ599700A0 (en) 2000-03-03 2000-03-23 Super Internet Site System Pty Ltd On-line geographical directory
US20010047353A1 (en) 2000-03-30 2001-11-29 Iqbal Talib Methods and systems for enabling efficient search and retrieval of records from a collection of biological data
AU2001273111A1 (en) * 2000-06-30 2002-01-14 Anthony Romito Method and apparatus for a GIS based search engine utilizing real time advertising
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US20020042789A1 (en) * 2000-10-04 2002-04-11 Zbigniew Michalewicz Internet search engine with interactive search criteria construction
KR20020046494A (ko) 2000-12-14 2002-06-21 박은수 지역단위 검색 시스템을 이용한 상거래 방법
US6868396B2 (en) 2000-12-29 2005-03-15 Nortel Networks Limited Method and apparatus for monitoring internet based sales transactions by local vendors

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0860786A2 (en) 1997-02-24 1998-08-26 International Business Machines Corporation System and method for hierarchically grouping and ranking a set of objects in a query context
US20010011270A1 (en) * 1998-10-28 2001-08-02 Martin W. Himmelstein Method and apparatus of expanding web searching capabilities
US20020078035A1 (en) * 2000-02-22 2002-06-20 Frank John R. Spatially coding and displaying information

Also Published As

Publication number Publication date
WO2005031614A1 (en) 2005-04-07
NO337806B1 (no) 2016-06-27
US20050065959A1 (en) 2005-03-24
US8346770B2 (en) 2013-01-01
NO20061794L (no) 2006-04-24
KR20060095979A (ko) 2006-09-05
EP1665101A1 (en) 2006-06-07

Similar Documents

Publication Publication Date Title
KR100814667B1 (ko) 검색 결과를 클러스터화하기 위한 시스템 및 방법
US8046371B2 (en) Scoring local search results based on location prominence
US7483881B2 (en) Determining unambiguous geographic references
US7624101B2 (en) Enhanced search results
US6934634B1 (en) Address geocoding
US8972371B2 (en) Search engine and indexing technique
US8068980B2 (en) Using boundaries associated with a map view for business location searching
JP5572596B2 (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
US20090222440A1 (en) Search engine for carrying out a location-dependent search
EP1678636A1 (en) Methods and systems for improving a search ranking using location awareness
WO2001063479A1 (en) Spatially coding and displaying information
US8996514B1 (en) Mobile to non-mobile document correlation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Publication of correction
J204 Request for invalidation trial [patent]
J301 Trial decision

Free format text: TRIAL DECISION FOR INVALIDATION REQUESTED 20080610

Effective date: 20100507

J2X1 Appeal (before the patent court)

Free format text: INVALIDATION

J302 Written judgement (patent court)

Free format text: JUDGMENT (PATENT COURT) FOR INVALIDATION REQUESTED 20100710

Effective date: 20110421

FPAY Annual fee payment

Payment date: 20130305

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140226

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150227

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160224

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170307

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190228

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20200227

Year of fee payment: 13