KR101450358B1 - 구조형 지리적 데이터 검색 - Google Patents

구조형 지리적 데이터 검색 Download PDF

Info

Publication number
KR101450358B1
KR101450358B1 KR1020097017280A KR20097017280A KR101450358B1 KR 101450358 B1 KR101450358 B1 KR 101450358B1 KR 1020097017280 A KR1020097017280 A KR 1020097017280A KR 20097017280 A KR20097017280 A KR 20097017280A KR 101450358 B1 KR101450358 B1 KR 101450358B1
Authority
KR
South Korea
Prior art keywords
structured document
data sets
metadata
data
record
Prior art date
Application number
KR1020097017280A
Other languages
English (en)
Other versions
KR20090116747A (ko
Inventor
아르템 페타코브
데이비드 미노규
알렉시 스피리도노브
Original Assignee
구글 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구글 인코포레이티드 filed Critical 구글 인코포레이티드
Publication of KR20090116747A publication Critical patent/KR20090116747A/ko
Application granted granted Critical
Publication of KR101450358B1 publication Critical patent/KR101450358B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Instructional Devices (AREA)

Abstract

데이터는 1개 이상의 데이터 소스들로부터 식별되고, 그 데이터는 적어도 1개의 구조형 문서에 연계된다. 적어도 1개의 구조형 문서 내에 포함된 데이터 세트들이 추출되고, 1개 이상의 레코드 아이템들은 검색 가능 데이터베이스에 추가되고, 1개 이상의 레코드 아이템들은 추출된 데이터 세트들에 상응한다.

Description

구조형 지리적 데이터 검색{SEARCHING STRUCTURED GEOGRAPHICAL DATA}
본 개시는 사용자 검색에 대한 결과를 제공하는 것에 관한 것이다.
일반적으로, 쿼리(query) 프로세싱 시스템들은 대량의 데이터 수집(collection)들로부터 정보를 찾아내는데 사용된다. 예시적 시스템은, 관련 웹 컨텐츠를 식별하고자 하는 사용자가 입력한 1개 이상의 사용자 검색어들(search terms)에 응답하여 관련 웹 페이지들을 식별하는 쿼리 프로세싱 시스템들을 구비한다. 웹 페이지 검색 시스템에서, 검색 결과들은 사전-저장된 웹 페이지들의 집합체(corpus)에 대하여 검색 쿼리의 검색어를 매칭(matching)시킴으로써 식별될 수 있다.
데이터 수집들은 잠재적으로(potentialiiy) 대량인 데이터를 포함할 수 있는 구조형 문서(structured document)들을 구비할 수 있고, 이 대량 데이터의 소형 서브세트(subset)는 특정 검색에 적합하다. 예시적 구조형 문서는, 예를 들어 "구글 어스(Google Earth)"와 같이, 브라우저 내에서 지리적 데이터를 디스플레이하는데 사용된 XML-기반 파일 형식(format)인 키홀 마크업 랭귀지(Keyhole Markup Language; KML) 문서이다. KML 문서는 중첩된 요소들과 속성들을 갖는 태그-기반 구조를 활용하고, 지구 표면 상의 위치에 기술적(descriptive) 텍스트, 모델들, 및 이미지들을 연계시키는데 사용될 수 있다.
웹 페이지 검색 시스템들은 쿼리의 각 용어들에 전체적으로 매칭되는 문서들을 식별하는데 정통하지만, 이들은 쿼리의 파라미터들과 의미상 매칭하는 구조형 문서들의 요소들을 식별할 수 없다. 설명의 예를 들어, 검색 시스템들은 KML 문서 내에 저장된 가장 관련성이 높은 데이터만을 반환하지 않을 수 있다. 그러므로, 사용자는 예를 들어 중첩된 요소들 및 속성들과 같은, 이들의 컨텐츠를 기반으로 구조형 문서들을 검색할 수 없다. 예를 들어, 사용자는 지리적 관심 에어리어를 지정하거나, 키워드에 기초하여 KML 파일들을 필터링하거나, 그러한 검색 쿼리들의 조합을 지정함으로써 KML 파일들의 요소들을 검색하는 것이 불가능하다.
후술하는 개시는 검색 쿼리 결과들의 식별을 허용하는 시스템, 방법, 및 컴퓨터 프로그램 제품을 설명하고 있다.
일면에 따라, 그 방법이 개시되어 있다. 그 방법은, 적어도 1개의 구조형 문서에 연계되는 데이터를 1개 이상의 데이터 소스들로부터 식별하는 단계; 적어도 1개의 구조형 문서 내에 포함된 1개 이상의 데이터 세트들을 추출하는 단계를 포함한다. 검색 가능 데이터베이스(searchable database)에 1개 이상의 레코드(record) 아이템들을 추가하는 단계로서, 1개 이상의 레코드 아이템들은 1개 이상의 추출된 데이터 세트들에 상응하는 상기 단계를 추가로 포함한다.
일면에 따르면, 그 방법은 1개 이상의 데이터 소스들로부터 데이터를 탐색하는 단계를 포함한다. 또한, 1개 이상의 데이터 소스들 중 적어도 1개는 1개 이상의 URL(Uniform Resource Locator)들을 포함할 수 있다. 일면에 따르면, 데이터는 적어도 1개의 구조형 문서이다. 데이터는 또한, 페이지 순위(rank)와 같은 메타데이터(metadata)를 포함한다. 다른 일면에 따르면, 그 방법은 1개 이상의 데이터 소스들로부터 데이터를 식별하는 단계에 이어서, 데이터에 연계된 메타데이터를 식별하는 단계를 포함할 수 있다.
또다른 일면에 따르면, 그 방법은 출력 파일을 생성하는 단계를 포함할 수 있고, 그 출력 파일은 2개 이상의 구조형 문서들에 연계된 데이터를 포함한다. 1개 이상의 데이터 세트들을 추출하는 단계는 또한, 출력 파일로부터 1개 이상의 데이터 세트들을 추출하는 단계를 포함할 수 있다. 추가로, 일면에 따르면, 적어도 1개의 구조형 문서는 2개 이상의 구조형 문서들을 포함하고, 그 방법은 2개 이상의 구조형 문서들을 병합(merge)하는 단계를 추가로 포함할 수 있다.
다른 일면에 따르면, 적어도 1개의 구조형 문서는 KML 문서를 포함한다. 추가로, 1개 이상의 데이터 세트들은 적어도 1개의 플레이스마크(placemark)를 포함할 수 있다. 그 방법은 또한, 적어도 1개의 검색 쿼리를 수취하는 단계; 및 적어도 1개의 검색 쿼리를 수취한 것에 응답하여 1개 이상의 레코드 아이템들 중 적어도 1개를 식별하는 단계를 포함할 수 있다. 또한, 적어도 1개의 구조형 문서 내에 포함된 1개 이상의 데이터 세트들을 추출하는 단계는 적어도 1개의 구조형 문서에 연계된 상황 정보(contextual information)를 1개 이상의 데이터 세트들에 연계시키는 단계를 포함할 수 있다.
이와 같이 일반적이면서 특수한 일면들은 시스템, 방법, 또는 컴퓨터 프로그램, 또는 이들을 조합한 모든 것을 사용하여 구현될 수 있다.
도 1은 예시적 구현예에 따른 검색 시스템을 나타낸다.
도 2는 예시적 구현예에 따른, 도 1의 검색 시스템 내 서버의 구성요소를 나타낸다.
도 3은 예시적 구현예에 따른 검색 시스템을 나타낸다.
도 4는 예시적 KML 파일을 나타낸다.
도 5는 구현예에 따라, 1개 이상의 데이터 소스들로부터 문서들과 메타데이터를 수집 및 병합시키는 예시적 프로세스들을 나타낸다.
도 6은 URL에 의해 인덱스(index)된 단일 파일을 구비하는 예시적 샘플 출력 파일을 나타낸다.
도 7은 구현예에 따라, 구조형 파일들의 추출에 대한 예시적 프로세스의 플로우를 나타낸다.
도 8은 단일 URL에 상응하는 다중 레코드 아이템들을 구비하는 예시적 샘플 출력 파일을 나타낸다.
도 9는 구현예에 따라, 구조형 문서 수집과 추출의 프로세스를 나타낸다.
본 발명은 모든 구현예가 아닌 일부 구현예들이 도시된 첨부 도면들을 참조하여 보다 상세하게 후술될 것이다. 실제로, 이러한 구현예들은 다른 많은 형태들로 구체화되며, 이하에 개시된 구현예들로 한정되도록 고려되어서는 안된다. 오히 려, 이러한 구현예들이 제공됨으로써 본 개시는 실시 가능이라는 법적 요구 사항을 만족시킬 수 있게 된다. 동일한 숫자는 동일한 요소를 전체에 걸쳐 참조한다.
본 발명은, 구조형 문서들의 수집과, 이 구조형 문서들 내 데이터 세트들의 추출을 허용함으로써, 각각의 데이터 세트들이 사용자 검색 쿼리에 응답하여 검색 및 탐색될 수 있는 검색 시스템을 설명한다. 예를 들어, 복수의 플레이스마크들을 가진 KML 파일은 각각의 플레이스마크들이 사용자 쿼리에 대한 검색 결과들로서 반환되는 검색 가능 레코드(searchable record)들이 되도록, 추출될 수 있다. 구조형 문서 내로부터 데이터 세트들의 추출이 실행되면, 구조형 문서에 연계된 상황 정보가 그 추출에 후속하여 유지된다.
이러한 개시는 방법, 장치(즉 시스템), 및 컴퓨터 프로그램 제품을 설명하는 블록 다이어그램과 플로우차트를 참조하여 기술된다. 블록 다이어그램과 플로우차트도의 블록들, 및 이 블록 다이어그램과 플로우차트도의 블록들 조합은 각각 컴퓨터 프로그램의 명령(instruction)들에 의해 구현될 수 있다. 이러한 컴퓨터 프로그램 명령은 범용 컴퓨터, 특수 목적 컴퓨터, 또는 그외 프로그래머블 데이터 프로세싱 장치에 로딩되어 기계를 실행시킴으로써, 컴퓨터 또는 그외 프로그래머블 데이터 프로세싱 장치 상에서의 실행되는 명령은 플로우차트 블록 또는 블록들 내에서 지정된 기능들을 구현하는 수단을 생성한다.
이러한 컴퓨터 프로그램 명령들은 컴퓨터 또는 그외 프로그래머블 데이터 프로세싱 장치들을 특정 방식으로 기능하도록 명령할 수 있는 컴퓨터 판독형 메모리 내에 저장됨으로써, 이 컴퓨터 판독형 메모리 내에 저장된 명령들이 플로우차트 블 록 또는 블록들 내에 지정된 기능(들)을 구현하는 명령 수단을 구비하는 제조 아티클(article)을 생산하도록 한다. 컴퓨터 프로그램 명령들은 컴퓨터 또는 그외 프로그래머블 데이터 프로세싱 장치에 로딩되어, 컴퓨터 또는 그외 프로그래머블 장치 상에서 일련의 동작 단계들이 수행되어 컴퓨터 구현형 프로세스가 생산되도록 하며, 이에 따라 컴퓨터 또는 그외 프로그래머블 장치 상에서 실행되는 명령들은 플로우차트 블록 또는 블록들 내에 지정된 기능(들)을 구현하는 단계들을 제공한다.
따라서, 블록 다이어그램과 플로우차트도의 블록들은, 지정된 기능들을 실행시키는 수단의 조합, 이 지정된 기능들을 실행시키는 단계들의 조합, 및 이 지정된 기능들을 실행시키는 프로그램 명령 수단을 지원한다. 블록 다이어그램과 플로우차트도의 각 블록과, 블록 다이어그램과 플로우차트도 내 블록들의 조합은 지정된 기능들이나 단계들, 또는 특수 목적 하드웨어와 컴퓨터 명령의 조합을 실행하는 특수 목적의 하드웨어-기반 컴퓨터 시스템에 의해 구현될 수 있다.
도 1을 참조하면, 예시적 구현예에 따른 검색 시스템(100)이 도시된다. 시스템(100)은 1개 이상의 네트워크들(140)을 통해 서버와 통신하는 1개 이상의 클라이언트들(115)을 구비한다. 다중 클라이언트들(115)과 단일 서버(120)가 도 1에 도시되어 있으나, 그 이상의 서버들과 그 이상 또는 이하의 클라이언트들도 가능하다. 예를 들어, 서버(120)에 의해 실행된 일부 기능들은 1개 이상의 다른 서버들에 의해 실행될 수 있고, 이로써 서버(120)는 컴퓨터 프로세서들 및/또는 서버들의 네트워크와 같은 복수의 디바이스들을 대표할 수 있다. 더욱이, 일부 구현에서, 클라이언트는 서버(120)의 기능을 실행할 수 있고, 서버(120)는 클라이언트의 기능을 실 행할 수 있다. 클라이언트(115)는, 예를 들어 개인 컴퓨터, 무선 전화기, PDA(Personal Digital Assistant), 랩탑 컴퓨터, 또는 그외 타입의 연산 또는 통신 디바이스, 이러한 디바이스들 중 하나에서 실행되는 쓰레드(thread)나 프로세스, 및/또는 이러한 디바이스들 중 하나에 의해 실행 가능한 객체와 같은 디바이스를 구비한다.
시스템(100)은 또한, 1개 이상의 네트워크들(140)을 통해 서버(120)와 통신하는 1개 이상의 데이터 소스들(105)을 구비한다. 시스템(100)에서, 서버(120)는 1개 이상의 데이터 소스들(105)로부터 데이터를 수집 및/또는 수취하고, 이 데이터를 조작하여 1개 이상의 클라이언트들(115)로부터 수취된 검색 쿼리에 대한 응답을 생성한다.
네트워크(들)(140)은 1개 이상의 LAN(Local Area Network), WAN(Wide Area Network), PSTN(Public Switched Telephone Network)과 같은 전화 네트워크, 인트라넷(intranet), 인터넷, 및/또는 그외 타입의 네트워크를 구비할 수 있다. 클라이언트들(115), 데이터 소스들(105), 및 서버(120)는 유선, 무선, 또는 광학이나 그외 연결들을 통해 네트워크(들)(140)과 연결할 수 있다. 대안적 구현예에서, 도 1에 도시된 디바이스들 중 1개 이상은 디바이스들 중 다른 1개와 직접적으로 연결된다. 예를 들어, 한 구현예에서, 클라이언트(115) 및/또는 데이터 소스들(105)은 서버(120)에 직접적으로 연결된다.
도 2는 예시적 구현예에 따른 도 1의 서버(120)를 나타낸다. 서버(120)는 버스(210), 프로세서(220), 메인 메모리(230), ROM(Read Only Memory; 240), 저장 디 바이스(250), 1개 이상의 입력 디바이스들(260), 1개 이상의 출력 디바이스들(270), 및 통신 인터페이스(280)를 구비할 수 있다. 버스(210)는 서버(120)의 요소들 사이 통신을 허용하는 1개 이상의 경로들을 구비할 수 있다.
프로세서(220)는 명령을 해석하고 실행하는 임의 타입의 기존 프로세서, 마이크로프로세서 또는 프로세싱 로직을 구비한다. 메인 메모리(230)는 프로세서(220)에 의한 실행을 위해 정보 및 명령을 저장하는 RAM(Random Access Memory) 또는 그외 타입의 동적(dynamic) 저장 디바이스를 구비할 수 있다. ROM(240)은, 예를 들어 오퍼레이팅 시스템을 포함하는, 프로세서(220)가 사용할 정적(static) 정보 및 명령을 저장하는 기존 ROM 디바이스 또는 그외 타입의 정적 저장 디바이스를 구비할 수 있다. 추가로, 저장 디바이스(250)는 자성 및/또는 광학 기록 매체 및 이에 상응하는 드라이브를 구비할 수 있다.
서버(120)는, 예를 들어 키보드, 마우스, 펜, 음성 인식 및/또는 생체 메커니즘(biometric mechanism) 등과 같이, 사용자가 정보를 서버(120)에 입력 가능하게 하는 1개 이상의 기존 메커니즘들을 갖는 입력 디바이스(260)를 구비할 수 있다. 출력 디바이스(270)는, 예를 들어 디스플레이, 프린터, 스피커 등과 같이, 정보를 사용자에게 출력시키는 1개 이상의 기존 메커니즘들을 구비한다. 통신 인터페이스(280)는 서버(120)가 다른 디바이스들 및/또는 시스템들과의 통신을 가능하게 하는 임의의 송수신기(transceiver)류 메커니즘을 구비할 수 있다. 예를 들어, 통신 인터페이스(280)는, 네트워크(들)(140)과 같이, 1개 이상의 네트워크들을 통해 다른 디바이스 또는 시스템과 통신하는 메커니즘을 구비할 수 있다.
동작에서, 서버(120)는 1개 이상의 데이터 소스들(105)로부터의 문서들 및 문서들에 연계된 데이터를 수집하여 저장하고, 이러한 문서들 및 데이터를 조작하고, 클라이언트의 검색 쿼리들에 응답하는 결과들을 식별할 수 있다. 한 구현예에서, 서버(120)는 예를 들어 메모리(230)와 같이, 컴퓨터 판독형 매체 내에 포함된 소프트웨어 명령들을 실행하는 프로세서(220)에 응답하여 이러한 동작들을 실행한다. 소프트웨어 명령들은, 예를 들어 데이터 저장 디바이스(250)와 같이, 다른 컴퓨터 판독형 매체로부터, 또는 통신 인터페이스(280)를 통해 다른 디바이스로부터 메모리(230)로 판독될 수 있다. 메모리(230) 내에 포함된 소프트웨어 명령들로 인해 프로세서(220)가 본 특허 명세서에 기술된 프로세스들을 실행하게 된다. 또한, 배선(hardwired) 회로는 소프트웨어 명령들 대신에 사용되거나 이들과 조합하여 사용됨으로써 본 개시와 일관성을 갖는 프로세스들을 구현할 수 있다. 그러므로, 구현예들은 하드웨어 회로 및 소프트웨어의 임의 특정 조합으로 제한되지 않는다.
도 3을 참조하면, 예시적 구현예에 따른 검색 시스템(300)이 도시된다. 검색 시스템(300)은 도 1에 도시된 시스템(100)과 유사하고, 1개 이상의 네트워크들(340)을 통해 서버(320)와 통신하는 1개 이상의 데이터 소스들(305)과 1개 이상의 클라이언트들(315)을 구비한다. 도 1의 시스템(100)과 마찬가지로, 데이터 소스들(305) 및/또는 클라이언트들(315)은 서버(320)에 대해 지리적으로 분산되거나 및/또는 국소(local)적으로 위치되며, 1개 이상의 네트워크들(340)을 통한 통신에 대안적으로 서버(320)와 직접 통신할 수 있다. 또한, 1개 이상의 데이터 소스들(305) 및/또는 1개 이상의 클라이언트들(315)은 서버(320)에 대해 국소적으로 위치될 수 있다.
1개 이상의 데이터 소스들(305)은 문서들에 연계된 문서들 및 문서들에 연계된 메타데이터를 구비한, 1개 이상의 데이터 저장소(repository)들, 웹 페이지들 등을 구비할 수 있다. 구현예에 따르면, 문서들은 KML 파일들과 같은 구조형 문서들을 구비할 수 있다. KML 파일은, 예를 들어 "구글 어스", "구글 맵", 및 "모바일용 구글 맵"과 같이, 브라우저 내에서 지리적 데이터를 디스플레이하는데 사용된 XML 기반 데이터 또는 파일 형식이며, 중첩된 요소들과 속성들을 갖는 태그 기반 구조를 활용한다.
KML 파일들은 지구 표면 상에서의 위치들을 기술적(descriptive) 텍스트, 모델 및 이미지들에 연계시키는데 사용될 수 있다. KML 파일 내에서, 각 지상 좌표화(georeference) 실체는 포인트들, 에어리어들, 또는 경로들로 지상 좌표화될 수 있는 플레이스마크라고 칭한다. 단순 플레이스마크를 식별하는 예시적 KML 파일(400)이 도 4에 도시되어 있다. KML 파일(400)은 일반적으로, KML 파일(400) 내 첫번째 라인에 XML 헤더(header)를 구비하고, KML 파일(400) 내 두번째 라인에 KML 네임스페이스 규정(namespace definition)을 구비하고, 그리고 이름, 설명(description), 및 포인트를 포함하는 복수의 요소들을 구비하는 적어도 1개의 플레이스마크 객체를 구비한다. 이름은 플레이스마크에 대한 레이블(label)로서 사용될 수 있고, 설명은 브라우저 내 플레이스마크에 첨부된 그래픽 형태 "풍선(balloon)"으로 나타낼 수 있고, 포인트는 플레이스마크의 위치를, 경도, 위도, 및/또는 고도, 거리 주소 등으로 지정할 수 있다. KML 파일은 다중 플레이스마크들 을 포함할 수 있고, 이 KML 파일 내 플레이스마크들은 폴더들을 둘러싸는 계층구조(hierarchy)로 구성되기도 한다. KML 파일은 또한 다른 기술적 특징들을 구비할 수 있고, 기술적 HTML을 구비하여, 링크들, 폰트 사이즈들, 스타일들, 컬러들, 텍스트 정렬 식별 등을 추가할 수 있다.
도 3을 참조하면, 1개 이상의 데이터 소스들(305)로부터의 구조형 문서들 및 메타데이터는 서버(320)에 의해 수취된다. 1개 이상의 데이터 소스들(305)은 데이터의 공적 및/또는 사적 저장소들을 구비할 수 있다. 구현예에 따르면, 문서들 및 메타데이터는 데이터 수집 모듈(325)이 데이터 소스들(305)로부터 끌어내는 데이터의 결과로서 데이터 수집 모듈(325)에 의해 수집된다. 데이터 소스들은 자동적으로 및/또는 데이터에 대해 데이터 수집 모듈(325)에 의한 요청에 의해, 문서들 및 메타데이터를 대안적으로 또는 추가적으로 데이터 수집 모듈(325)로 밀어내거나 전달한다. 예를 들어, KML 파일들 및 이들에 연계된 메타데이터는 데이터 수집 모듈(325)에 의해 수취된다. KML 파일에 연계된 메타데이터는, 여러 데이터 중, 임의의 번호 매김 방식(arbitrary numbering scheme)에 관련하여, 파일의 링크 수(또는 인기도), 파일의 다운로드 수, 및/또는 그외 메타데이터를 식별하는 파일의 상대적 순위를 확인하는 페이지 순위를 구비할 수 있다. 문서에 연계된 메타데이터는 문서 자체보다는 다른 소스로부터, 예를 들어 별개의 문서 또는 데이터베이스로부터 취할 수 있다.
본 발명은, KML 파일들과 그들에 연계된 메타데이터를 참조하여 여기에 상세히 기술되지만, 위치 이름들, 기술적 텍스트, 이미지들, 지리적 참조 사항들 등과 같은 데이터를 링크시키는데 사용되는 임의 구조형 데이터 형식과도 동작한다. 예를 들어, 1개 이상의 데이터 소스들(305)은 GeoRSS 파일들을 서버(320)에 전달할 수 있고, GeoRSS 파일들은 HTML을 포함하며 통상적으로 지리적 위치를 참조한다. KMZ 파일들과 같은 다른 파일들도 활용될 수 있다.
구조형 문서들 및 관련된 메타데이터의 수집이 완료된 후, 데이터 수집 모듈(325)은 구조형 문서들 및 메타데이터를 병합하고, 인덱스된 출력 파일을 인덱싱 모듈(indexing module; 330)에 제공한다. 인덱싱 모듈(330)은, 데이터 수집 모듈(325)로부터 수취된 인덱스된 출력 파일을 분석(parse)하여, 1개 이상의 데이터 세트들을 식별하고; 추출된 데이터 세트들에 대한 쿼리 독립형 순위(query independent rank)를 산출하고; 추출된 데이터 세트들에 상응하는 레코드 아이템들을 사용자 쿼리들에 응답하는데 사용되는 결과 저장소(335)에 저장하도록 포워드(forward)할 수 있다. 예시적 구현예에 따라, 데이터 수집 모듈(325)에 의해 생성된 KML 문서들과 메타데이터는 인덱싱 모듈(330)에 입력으로서 공급된다. 인덱싱 모듈(330)은 KML 파일들을 분석하고; 플레이스마크들을 추출하고; 각 플레이스마크에 대한 쿼리 독립형 순위를 산출하고; 사용자 검색 쿼리들에 응답하는데 사용된 검색 저장소(335)에 삽입하기 위해 각 플레이스마크를 개별적으로 제공할 수 있다.
데이터 수집 모듈(325), 인덱싱 모듈(330), 및 결과 저장소(335) 각각이 서버(320) 내부에 도시되어 있으며, 도 2에 나타난 메모리(230) 내에 저장된 소프트웨어 명령이나, 또는 서버(120)의 다른 요소들에 의해 구현될 수 있지만, 1개 이상의 데이터 수집 모듈(325), 인덱싱 모듈(330), 및/또는 결과 저장소(335)는 서 버(320) 외부에 존재할 수 있다. 예를 들어, 요소들(325, 330, 335) 중 1개 이상은 1개 이상의 별개 서버들 내에 존재할 수 있다. 또한, 요소들(325, 330, 335)은 1개 이상의 요소들 내에서 전체적으로 또는 부분적으로 조합될 수 있다. 그러므로, 도 3에 도시된 예시적 시스템(300)의 블록 다이어그램 구현예는, 여기에 설명된 기능들을 구현할 수 있는 특정 소프트웨어 및/또는 하드웨어로 한정되는 일 없이, 시스템(300)의 다양한 기능들을 나타내도록 의도된다.
다음, 도 5는 데이터 수집 모듈(325)이 1개 이상의 데이터 소스들로부터 문서들 및 메타데이터를 수집하는 것을 나타내는 예시적 기능성 블록 다이어그램 플로우차트(500)를 나타낸다. 구현예에 따르면, 데이터 수집 모듈(325)은, 예를 들어 KML 문서들과 이에 연계된 메타데이터와 같은, 구조형 문서들과 이 문서들에 연계된 임의 메타데이터를 식별하고 탐색하는 동작이 가능하다.
구현예에 따라, 데이터 수집 모듈(325)은 월드 와이드 웹("web") 상에 존재하는 구조형 문서들을 식별하는 웹 크롤 프로그램(web crawl program)을 활용할 수 있다. 웹 크롤 프로그램은 웹을 찾고(browse), 방문한 페이지들의 사본(copy)을 생성하고, 접촉한 URL들의 인덱스 또는 테이블을 생성한다. 도 5에 도시된 바와 같이, 웹 크롤 프로그램은 자신이 식별한 개별 페이지들에 연계된 URL(505)들을 생성하거나 또는 식별하는 동작이 가능하다. URL들은 구조형 문서들 및/또는 이 구조형 문서들에 연계된 메타데이터를 식별할 수 있다.
구현예에 따라, 웹 크롤 동안, 구조형 파일들은 검사되거나 및/또는 별개의 파일 형식으로 변환되어, 구조형 파일들의 컨텐츠들을 검사 및/또는 검색 가능하게 한다. 구조형 KML 파일은, KML 파일에 연계되고(및 URL에 의해 식별됨) KML 파일의 컨텐츠들을 기술하는 HTML 파일을 포함할 수 있고, HTML 파일은 KML 파일을 순위화 및/또는 인덱싱화하는데 관련될 수 있다. 도 5에 도시된 바와 같이, 메타데이터 내에 구비된 URL들은 각 구조형 문서에 대한 URL들을 포함하고, 페이지 순위 데이터베이스(535)에 포워드되며, 이 데이터베이스는 각 구조형 문서에 연계된 추가 메타데이터를 구비한다.
데이터 수집 모듈(325)은 URL(505)들을 검사하고, 관심 있는 모든 구조형 문서들, 예를 들어 모든 KML 문서들을 식별할 수 있다. 엔트리(entry)가 확인되면, 데이터 수집 모듈(325)은 식별된 URL들에 연계된 구조형 문서(520)들을, 문서 펫치(document fetch; 515)를 실행하여 탐색한다. 추가 구조형 문서들 및 메타데이터(530)는 다른 공적 및/또는 사적 데이터 저장소(525)로부터 수집될 수 있다. 각 데이터 소스는, 예를 들어 파일이 특정 사이트로부터 다운로드되는 횟수, 사용자 피드백과 같이, 특정 구조형 파일에 연계된 상이한 메타데이터(530)를 구비한다. 다른 공적 및/또는 사적 데이터 저장소(525)들로부터 수집된 각 구조형 문서에 대한 URL들은 페이지 순위 데이터베이스(535)로 포워드되고, 이 데이터베이스는 각 구조형 문서에 연계된 추가 메타데이터를 구비한다.
상술한 바와 같이, 구조형 문서를 식별하는데 있어서, 데이터 수집 모듈(325)은 발견된 구조형 파일 각각의 페이지 순위 조회를 시도할 수 있다. 구현예에 따라, 데이터 수집 모듈은 웹 크롤이나 공적 및/또는 사적 데이터 저장소에서 발견된 각 구조형 문서에 상응하는 URL들의 페이지 순위를 펫치하도록 시도함으로 써, 식별된 문서들을 페이지 순위 데이터베이스(535)에 쿼리한다. 검색 시스템은 페이지 순위를 사용하여, 사용자 쿼리들에 대한 결과들에 우선 순위를 매길 수 있다. 다른 구현예에 따라, URL들의 페이지 순위는 식별된 문서들에 대해 펫치되지 않는다. 하지만, 다른 메타데이터는, 예를 들어 1개 이상의 다른 데이터베이스들로부터, 상응하는 URL에 대해 조회될 수 있다.
URL(540)에 의해 키(key)화되고 페이지 순위 데이터베이스(535)로부터 수집된 메타데이터는 웹 크롤 및/또는 공적 또는 사적 데이터 저장소들로부터 식별된 구조형 문서들 및 메타데이터와 병합된다. 이 데이터는 중복(duplicate) 문서들을 제거하는 1개 이상의 비중복화 단계들을 거치는 것이 가능하다. 예시적 실시예에 있어서, 상이한 URL로부터 각각 다운로드된 2개의 동일한 파일들이 식별된다. 2개의 동일한 파일들 중 1개는 중복 제거(또는 비중복화) 단계에 의해 제거된다. 다른 예시적 실시예에 있어서, 특정 페이지 순위에 연계된 URL은 문서에 연계된 동일한 URL과 병합된다. 메타데이터와 문서들의 병합은 URL에 의해 유발되거나 및/또는 원시 문서 컨텐츠 상에서의 병합에 의해 일어난다.
구현예에 따라, 데이터 수집 모듈(325)은 발견된 모든 구조형 문서들 및 메타데이터를 공통 형식으로 변환하여 출력 파일(550)을 생성하게 할 수 있다. 구현예에 따라, 데이터 수집 모듈(325)의 출력은 단일의 인덱스된 출력 파일(550)이고, 이 파일 내 각 레코드는 구조형 문서, 및 레코드가 사용자 검색 쿼리에 적합한 응답인지의 여부를 식별하도록 레코드를 스코어(score)화하는데 사용될 모든 연계 메타데이터를 구비한다. 출력 파일은 URL에 의해 인덱스된 레코드들의 테이블을 구비 할 수 있고, 각 URL에 연계된 모든 정보는 그 URL에 연계된 레코드 내에 있다.
도 6은 데이터 수집 모듈(325)이 1개 이상의 데이터 소스들로부터 문서들과 메타데이터를 수집함으로써 생성한 샘플 출력 파일(600)을 나타낸다. 도시된 바와 같이, 출력 파일은 "구글 오피스(Google Office)"에 연계된 KML 파일을 식별하는 소스 URL에 관계된 레코드를 구비한다. 컨텐츠는 전세계 다른 구글 오피스들에 상응하는 복수 플레이스마크들을 구비하며, 이 플레이스마크들은 "마운틴 뷰의 본사(headquarters in Mountain View)", "뉴욕 씨티", 및 "도쿄 오피스"에 대한 이름과 좌표를 포함한다. 소스 URL에 연계된 메타데이터는 URL의 페이지 순위와, 예를 들어 파일이 가용한(available) 웹 사이트에 의해 제공된 파일의 다운로드 수를 식별한다. 메타데이터는 또한, 각 플레이스마크에 연계된, 예를 들어 URL과 같은 앵커(anchor)를 포함할 수 있다. 1개의 소스 URL만이 샘플 출력 파일(600)에 도시되어 있지만, 단일 출력 파일(550)은 2개 이상의 레코드들을 구비할 수 있다.
데이터 수집 모듈(325)에 의해 생성된 출력 파일(550)은 인덱싱 모듈(330)로 전달된다. 인덱싱 모듈(330)은 출력 파일 내의 레코드들로부터 데이터 세트들을 추출하면서 상황 정보를 보존하는 동작이 가능하다. 예를 들어, 인덱싱 모듈(330)은 상당수의 플레이스마크들을 포함한 단일 KML 파일로부터 플레이스마크들을 추출하는 동작이 가능하고, 이 추출은 예를 들어 상위 폴더들, 참조 페이지들 등과 같은, 상황 텍스트를 보존한다. 예를 들어, 런던 내 특정 호텔에 각각 연계된 복수 플레이스마크들(식별된 호텔들이 있는 상위 폴더일 수 있음)을 구비하는 KML 파일은 각 플레이스마크가 런던에 연계된 개별 검색 가능 아이템으로 되도록 추출된다.
도 7은 인덱싱 모듈(300)에 의해 인덱싱을 실행하도록 구현된 예시적 프로세스 플로우(700)를 나타낸다. 데이터 수집 모듈(325)에 의해 생성된 출력 파일(550)은 URL에 의해 인덱스된 레코드들을 구비하는 반면, 인덱싱 모듈(330)은 URL에 의해 인덱스된 각 레코드를 URL당 다중 레코드 아이템들(multiple records items per URL)로 변형시킬 수 있다. 구현예에 따라, 구조형 문서들의 인덱싱은 출력 파일(550)을 취하고; 구조형 레코드들을 분석하여 개별 데이터 세트들(예를 들어 플레이스마크들)을 추출하고(블록 710); 각 데이터 세트에 대한 쿼리 독립형 순위를 산출하고; 데이터 세트들에 상응하는 레코드 아이템들을 검색 가능 저장소(335)에 전달함으로써 구현될 수 있다. 본 발명은 KML 파일들 내의 플레이스마크들에 대해 참조되었으나, 구조형 문서들 내의 다른 데이터 세트들이 인덱싱 모듈(330)에 의해 추출될 수 있다.
구현예에 따라, 인덱싱 모듈(330)은 URL에 의해 인덱스된 레코드를 URL당 다중 레코드 아이템들로 변형시키고, 각 레코드 아이템은 문서 ID에 의해 인덱스되고, 문서 ID는 플레이스마크와 같이 레코드 아이템을 고유하게 식별하도록 인덱싱 모듈(330)에 의해 선택된 숫자이다. 구현예에 따라, 문서 ID는 레코드의 선택된 필드(field)들로부터 해쉬 값(hash value)으로서 생성될 수 있다. 예를 들어, 문서 ID는 플레이스마크의 위치를 식별하는 지리적 좌표들에 부분적으로 기반을 둔다.
추출 동안, 인덱싱 모듈(330)은 원래 레코드로부터의 상황 정보를 각 데이터 세트에 연계시킨다. 예를 들어, KML 파일로부터 추출된 각 플레이스마크는 이 상황 정보를 보존할 것이고, 이 상황 정보는 지상 좌표화 데이터와 같은, 플레이스마크 의 기술적 텍스트 및 다른 데이터에 추가하여, 구조형 파일에 상응하는 URL과 그외 메타데이터, 및 인클로징(enclosing) 폴더 각각의 이름을 구비한다. 또한, 각 플레이스마크에 대해 인덱싱 모듈(330)은 가용한 메타데이터를 기반으로 쿼리 독립형 스코어를 산출할 수 있다. 이는 다른 데이터베이스(도시하지 않음)로부터 1개 이상의 순위들을 활용할 수 있다.
인덱싱 모듈(330)은 추가로, 유사한 메타데이터를 기반으로 중복 레코드 아이템들을 제거(블록 715)하는 동작이 가능하다. 예를 들어, 중복 플레이스마크들은 위치의 특징(fingerprint)과 플레이스마크 이름을 비교한 것에 기초하여 제거된다. 가용한 메타데이터를 기반으로 가장 높은 스코어를 가진 플레이스마크가 유지된다.
인덱싱 모듈(330)은 구조형 문서들 내의 데이터 세트들을, 이 데이터 세트들이 관련된 복합 검색 결과로 클러스터링(clustering)하는 동작이 선택적으로 가능하다. 예를 들어, 데이터 세트들을 URL들에 의해 인덱스된 1개 이상의 레코드들로부터 추출하는 단계에 이어서, 1개 이상의 데이터 세트들은 단일의 복합 검색 결과로 조합되거나 또는 클러스터링되며, 단일의 복합 검색 결과에서 이 데이터 세트들은 동일한 물리적 실체(entity)를 참조한다. 이는 결과들의 다양성을 향상시키는데 유용하다. 예를 들어, 뉴욕 씨티에 대한 용어 "동상(statue)"을 가진 사용자 검색 쿼리는 가장 높은 스코어를 갖는 플레이스마크들을 변환하는데 이 플레이스마크들은 자유의 여신상을 식별하는 플레이스마크들이다. 자유의 여신상에 대한 모든 결과들을 클러스터링하는 것은 자유의 여신상에 대한 1개의 복합 결과를 제공하는 검색 결과를 허용함으로써, 다른 동상 결과들도 사용자에게 제공될 수 있다.
그러나, 임의의 실체에 연계된 모든 아이템들이 클러스터링되면, 특정 레코드 엔트리를 식별하는 능력을 감소시킬 수 있다. 그러므로, 서빙 모듈(serving module)은 적어도 부분적으로 사용자의 검색 쿼리를 기반으로 하는 동적(dynamic) 클러스터링을 실행할 수 있다. 예를 들어, 자유의 여신상 예시에 계속하여, "자유의 여신상" 및 "투어(tour)"에 대한 검색은 URL들에 의해 인덱스된 레코드들 내에 구비된 정적(static) 용어들에 추가하여, 사용자 검색 용어를 기반으로 한 클러스터링이 될 수 있다.
인덱싱 모듈(330)에 의해 식별된 레코드 아이템들은 개별적으로 리스트화되고, 사용자 쿼리들에 응답하는데 사용하기 위해 검색 가능 저장소에 제공된다(블록 720, 730). 도 6에 도시된 출력 파일(600)에 상응하는 인덱싱 모듈(330) 출력(800)의 예시는 도 8에 도시되어 있다. 단일 레코드 엔트리 내에 존재하는 것으로서 도 6에 식별된 플레이스마크들은 별개의 레코드 아이템들(805, 810, 815)로 추출되었다. 이것에 의해 사용자는 구조형 문서로부터 추출된 개별 레코드 아이템들에 연계된 컨텐츠를 검색할 수 있다.
도 9는 구현예에 따라, 구조형 문서 수집 및 추출의 프로세스를 나타낸다. 데이터는 1개 이상의 데이터 소스들로부터 수집되고(블록 905), 데이터는 1개 이상의 구조형 문서들과 이들에 연계된 메타데이터를 구비할 수 있다. 구현예에 따라, 데이터 수집은 1개 이상의 데이터 소스들(305)로부터 데이터를 수집할 수 있는 데이터 수집 모듈(325)에 의해 실현될 수 있다. 수집된 데이터로부터, 구조형 문서들과 이에 연계된 메타데이터가 식별된다(블록 910). 다음, 구조형 문서들과 이에 연 계된 메타데이터가, 예를 들어 URL에 의해 병합된다. 또한, 중복 엔트리들은 다른 키들을 기반으로, 예를 들어 문서 컨텐츠를 기반으로 병합된다(블록 920). 그 다음에 출력 파일이 생성된다(블록 930). 구현예에 따라, 구조형 데이터의 식별, 구조형 문서들과 메타데이터의 병합, 및/또는 출력 파일의 생성은 또한, 데이터 수집 모듈(325)에 의해 실행될 수 있다.
그 다음, 레코드 아이템들은 각 출력 파일 레코드로부터 데이터 세트들을 추출함으로써 출력 파일 내에서 인덱스된 각 레코드로부터 생성된다. 예를 들어, 출력 파일 레코드가 URL에 의해 인덱스된 KML 파일을 구비하는 경우, KML 파일 내의 추출된 플레이스마크들에 상응하는 레코드 아이템들이 생성될 수 있다(블록 940). 구현예에 따라, 데이터 세트들의 추출과 레코드 아이템들의 생성은 인덱싱 모듈(330)에 의해 실행될 수 있다. 추출이 완료된 후, 레코드 아이템들(또는 레코드 아이템들의 테이블)은 검색 가능 데이터베이스에 추가된다(블록 950).
상술한 설명들 및 관련 도면들에 제공된 개시 내용의 이점을 갖는 많은 변형과 다른 구현예들은 당업자가 쉽게 생각해 낼 수 있다. 그러므로, 본 발명은 개시된 특정 구현예들로 제한되지 않으며, 변형 및 다른 구현예들은 첨부된 청구항의 범위 내에 포함되도록 의도된다. 특정 용어들이 여기에 언급되었지만, 일반적이고 서술적인 의미로만 사용되며, 한정의 목적으로는 사용되지 않는다.
본 발명에 의하면, 사용자 검색에 대한 결과를 제공하는 시스템, 방법, 또는 컴퓨터 프로그램이 제공된다.

Claims (28)

  1. 구조형 문서(structured document)를 프로세서에 의해 수신하는 단계;
    상기 구조형 문서 내에 포함된 1개 이상의 데이터 세트(data set)들을 상기 프로세서에 의해 추출하는 단계;
    상기 구조형 문서에 연계된 제1 메타데이터를 1개 이상의 데이터 소스(data source)로부터 상기 프로세서에 의해 획득하는 단계-상기 구조형 문서는 상기 1개 이상의 데이터 소스들의 하나가 아님-;
    상기 구조형 문서에 상응하는 1개 이상의 레코드 아이템(record item)을 상기 프로세서에 의해 생성하는 단계―상기 레코드 아이템들 각각은, 상기 1개 이상의 데이터 세트와; 상기 구조형 문서에 대한 상기 제1 메타데이터가 상기 구조형 문서로부터 추출된 상기 1개 이상의 데이터 세트의 각각에 연계되도록 상기 구조형 문서에 연계된 상기 제1 메타데이터를 포함함―; 및
    검색 가능 데이터베이스(searchable database)에 상기 1개 이상의 레코드 아이템을 상기 프로세서에 의해 추가하는 단계를 포함하는 구조형 지리적 데이터를 검색하기 위한 컴퓨터-실행 방법.
  2. 청구항 1에 있어서,
    상기 1개 이상의 데이터 소스 중 적어도 1개는 1개 이상의 URL(Uniform Resource Locator)을 포함하는 구조형 지리적 데이터를 검색하기 위한 컴퓨터-실행 방법.
  3. 청구항 1에 있어서,
    상기 구조형 문서 자체로부터 제2 메타데이터를 상기 프로세서에 의해 획득하는 단계; 및 상기 구조형 문서로부터 획득된 상기 제2 메타데이터를, 1개 이상의 생성된 레코드 아이템의 각각에 연계시키는 단계―상기 레코드 아이템들 각각은 상기 구조형 문서로부터 추출된 상기 1개 이상의 데이터 세트에 상응함―를 더 포함하는 구조형 지리적 데이터를 검색하기 위한 컴퓨터-실행 방법.
  4. 청구항 1에 있어서,
    상기 제1 메타데이터는 적어도 1개의 페이지 순위(rank)를 포함하는 구조형 지리적 데이터를 검색하기 위한 컴퓨터-실행 방법.
  5. 청구항 1에 있어서,
    상기 구조형 문서 내에 포함된 1개 이상의 데이터 세트를 추출하는 단계는
    적어도 상기 구조형 문서에 대한 제1 메타데이터를 인덱스된 레코드(indexed record)를 포함하는 출력 파일에 병합(merge)하는 단계; 및
    상기 인덱스된 레코드들에 상응하는 1개 이상의 데이터 세트를 추출하기 위해 상기 출력 파일을 분석(parse)하는 단계를 포함하는 구조형 지리적 데이터를 검색하기 위한 컴퓨터-실행 방법.
  6. 청구항 1에 있어서,
    상기 구조형 문서는 키홀 마크업 랭귀지(Keyhole Markup Language; KML) 문서를 포함하는 구조형 지리적 데이터를 검색하기 위한 컴퓨터-실행 방법.
  7. 청구항 1에 있어서,
    상기 구조형 문서로부터 추출된 상기 1개 이상의 데이터 세트는 적어도 1개의 플레이스마크(placemark)를 포함하는 구조형 지리적 데이터를 검색하기 위한 컴퓨터-실행 방법.
  8. 청구항 1에 있어서,
    적어도 1개의 검색 쿼리를 상기 프로세서에 의해 수신하는 단계; 및
    상기 적어도 1개의 검색 쿼리에 응답하여, 상기 검색 가능 데이터베이스에서 상기 1개 이상의 레코드 아이템 중 적어도 1개를 상기 프로세서에 의해 식별하는 단계를 더 포함하는 구조형 지리적 데이터를 검색하기 위한 컴퓨터-실행 방법.
  9. 청구항 8에 있어서,
    상기 구조형 문서 내에 포함된 상기 1개 이상의 데이터 세트를 추출하는 단계는
    상기 1개 이상의 데이터 세트를 상기 구조형 문서에 연계된 상황 정보(contextual information)에 연계시키는 단계를 더 포함하는 구조형 지리적 데이터를 검색하기 위한 컴퓨터-실행 방법.
  10. 구조형 문서를 수신하는 수단;
    적어도 1개의 구조형 문서 내에 포함된 1개 이상의 데이터 세트를 추출하는 수단;
    상기 구조형 문서에 연계된 제1 메타데이터를 1개 이상의 데이터 소스로부터 획득하는 수단-상기 구조형 문서는 상기 1개 이상의 데이터 소스들의 하나가 아님-;
    상기 구조형 문서에 상응하는 1개 이상의 레코드 아이템을 생성하는 수단―상기 레코드 아이템들 각각은, 상기 1개 이상의 데이터 세트와; 상기 구조형 문서에 대한 상기 제1 메타데이터가 상기 구조형 문서로부터 추출된 상기 1개 이상의 데이터 세트의 각각에 연계되도록 상기 구조형 문서에 연계된 상기 제1 메타데이터를 포함함―; 및
    검색 가능 데이터베이스에 상기 1개 이상의 레코드 아이템을 추가하는 수단을 포함하는 시스템.
  11. 청구항 10에 있어서,
    상기 1개 이상의 데이터 소스 중 적어도 1개는 1개 이상의 URL을 포함하는 시스템.
  12. 청구항 10에 있어서,
    상기 구조형 문서 자체로부터 제2 메타데이터를 획득하는 수단; 및 상기 구조형 문서로부터 획득된 상기 제2 메타데이터를, 1개 이상의 생성된 레코드 아이템의 각각에 연계시키는 수단―상기 레코드 아이템들 각각은 상기 구조형 문서로부터 추출된 상기 1개 이상의 데이터 세트에 상응함―를 더 포함하는 시스템.
  13. 청구항 10에 있어서,
    상기 제1 메타데이터는 적어도 1개의 페이지 순위를 포함하는 시스템.
  14. 청구항 10에 있어서,
    상기 구조형 문서 내에 포함된 1개 이상의 데이터 세트를 추출하는 수단은
    적어도 상기 구조형 문서에 대한 제1 메타데이터를 인덱스된 레코드를 포함하는 출력 파일에 병합하는 수단; 및
    상기 인덱스된 레코드들에 상응하는 1개 이상의 데이터 세트를 추출하기 위해 상기 출력 파일을 분석하는 수단을 포함하는 시스템.
  15. 청구항 10에 있어서,
    상기 구조형 문서는 키홀 마크업 랭귀지 문서를 포함하는 시스템.
  16. 청구항 10에 있어서,
    상기 구조형 문서로부터 추출된 상기 1개 이상의 데이터 세트는 적어도 1개의 플레이스마크를 포함하는 시스템.
  17. 청구항 10에 있어서,
    적어도 1개의 검색 쿼리를 수신하는 수단; 및
    상기 적어도 1개의 검색 쿼리에 응답하여, 상기 검색 가능 데이터베이스에서 상기 1개 이상의 레코드 아이템 중 적어도 1개를 식별하는 수단을 더 포함하는 시스템.
  18. 청구항 10에 있어서,
    상기 구조형 문서 내에 포함된 상기 1개 이상의 데이터 세트를 추출하는 수단은
    상기 1개 이상의 데이터 세트를 상기 구조형 문서에 연계된 상황 정보에 연계시키는 수단을 더 포함하는 시스템.
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
KR1020097017280A 2007-02-05 2008-02-04 구조형 지리적 데이터 검색 KR101450358B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/671,306 US7836085B2 (en) 2007-02-05 2007-02-05 Searching structured geographical data
US11/671,306 2007-02-05
PCT/US2008/052945 WO2008097921A1 (en) 2007-02-05 2008-02-04 Searching structured geographical data

Publications (2)

Publication Number Publication Date
KR20090116747A KR20090116747A (ko) 2009-11-11
KR101450358B1 true KR101450358B1 (ko) 2014-10-14

Family

ID=39677008

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097017280A KR101450358B1 (ko) 2007-02-05 2008-02-04 구조형 지리적 데이터 검색

Country Status (9)

Country Link
US (2) US7836085B2 (ko)
EP (1) EP2118779A4 (ko)
JP (1) JP5336391B2 (ko)
KR (1) KR101450358B1 (ko)
CN (1) CN101647020B (ko)
AU (1) AU2008213993A1 (ko)
BR (1) BRPI0807172A2 (ko)
CA (1) CA2677307C (ko)
WO (1) WO2008097921A1 (ko)

Families Citing this family (153)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8468154B2 (en) * 2007-02-12 2013-06-18 Spinlet Oy Distribution system for data items
US8347202B1 (en) * 2007-03-14 2013-01-01 Google Inc. Determining geographic locations for place names in a fact repository
US8584013B1 (en) 2007-03-20 2013-11-12 Google Inc. Temporal layers for presenting personalization markers on imagery
US20080235163A1 (en) * 2007-03-22 2008-09-25 Srinivasan Balasubramanian System and method for online duplicate detection and elimination in a web crawler
US8487957B1 (en) * 2007-05-29 2013-07-16 Google Inc. Displaying and navigating within photo placemarks in a geographic information system, and applications thereof
KR101340036B1 (ko) * 2007-07-10 2013-12-10 삼성전자주식회사 전자 컨텐트 가이드 생성 방법 및 그 장치
US8195630B2 (en) * 2007-10-29 2012-06-05 Bae Systems Information Solutions Inc. Spatially enabled content management, discovery and distribution system for unstructured information management
US8490025B2 (en) * 2008-02-01 2013-07-16 Gabriel Jakobson Displaying content associated with electronic mapping systems
US8504945B2 (en) * 2008-02-01 2013-08-06 Gabriel Jakobson Method and system for associating content with map zoom function
US8249306B2 (en) * 2008-03-18 2012-08-21 Certusview Technologies, Llc Virtual white lines for delimiting planned excavation sites
US8280117B2 (en) * 2008-03-18 2012-10-02 Certusview Technologies, Llc Virtual white lines for indicating planned excavation sites on electronic images
GB2458309A (en) * 2008-03-13 2009-09-16 Business Partners Ltd Search engine
US8782564B2 (en) * 2008-03-21 2014-07-15 Trimble Navigation Limited Method for collaborative display of geographic data
US8898179B2 (en) * 2008-03-21 2014-11-25 Trimble Navigation Limited Method for extracting attribute data from a media file
US8274506B1 (en) * 2008-04-28 2012-09-25 Adobe Systems Incorporated System and methods for creating a three-dimensional view of a two-dimensional map
US9336695B2 (en) * 2008-10-13 2016-05-10 Yahoo! Inc. Method and system for providing customized regional maps
CA2691780C (en) * 2009-02-11 2015-09-22 Certusview Technologies, Llc Management system, and associated methods and apparatus, for providing automatic assesment of a locate operation
US8832565B2 (en) 2009-02-11 2014-09-09 Certusview Technologies, Llc Methods and apparatus for controlling access to a virtual white line (VWL) image for an excavation project
US20100201690A1 (en) * 2009-02-11 2010-08-12 Certusview Technologies, Llc Virtual white lines (vwl) application for indicating a planned excavation or locate path
US8458232B1 (en) * 2009-03-31 2013-06-04 Symantec Corporation Systems and methods for identifying data files based on community data
US20120011167A1 (en) * 2010-07-09 2012-01-12 Nokia Corporation Method and apparatus for aggregating and linking place data
US8965894B2 (en) * 2010-12-21 2015-02-24 Tata Consultancy Services Limited Automated web page classification
US20130067346A1 (en) * 2011-09-09 2013-03-14 Microsoft Corporation Content User Experience
FR2988881B1 (fr) * 2012-03-29 2015-12-11 Isogeo Procede d'indexation de donnees geographiques
US11871901B2 (en) 2012-05-20 2024-01-16 Cilag Gmbh International Method for situational awareness for surgical network or surgical network connected device capable of adjusting function based on a sensed situation or usage
US9146981B2 (en) * 2012-07-06 2015-09-29 International Business Machines Corporation Automated electronic discovery collections and preservations
US9053085B2 (en) * 2012-12-10 2015-06-09 International Business Machines Corporation Electronic document source ingestion for natural language processing systems
US8925099B1 (en) 2013-03-14 2014-12-30 Reputation.Com, Inc. Privacy scoring
US8781815B1 (en) * 2013-12-05 2014-07-15 Seal Software Ltd. Non-standard and standard clause detection
US9619523B2 (en) * 2014-03-31 2017-04-11 Microsoft Technology Licensing, Llc Using geographic familiarity to generate search results
US9996528B2 (en) * 2014-07-24 2018-06-12 Seal Software Ltd. Advanced clause groupings detection
US10324733B2 (en) 2014-07-30 2019-06-18 Microsoft Technology Licensing, Llc Shutdown notifications
US9787576B2 (en) 2014-07-31 2017-10-10 Microsoft Technology Licensing, Llc Propagating routing awareness for autonomous networks
US9836464B2 (en) 2014-07-31 2017-12-05 Microsoft Technology Licensing, Llc Curating media from social connections
US10678412B2 (en) 2014-07-31 2020-06-09 Microsoft Technology Licensing, Llc Dynamic joint dividers for application windows
US10592080B2 (en) 2014-07-31 2020-03-17 Microsoft Technology Licensing, Llc Assisted presentation of application windows
US10254942B2 (en) 2014-07-31 2019-04-09 Microsoft Technology Licensing, Llc Adaptive sizing and positioning of application windows
US11504192B2 (en) 2014-10-30 2022-11-22 Cilag Gmbh International Method of hub communication with surgical instrument systems
US10018844B2 (en) 2015-02-09 2018-07-10 Microsoft Technology Licensing, Llc Wearable image display system
US11086216B2 (en) 2015-02-09 2021-08-10 Microsoft Technology Licensing, Llc Generating electronic components
US9827209B2 (en) 2015-02-09 2017-11-28 Microsoft Technology Licensing, Llc Display system
US9805025B2 (en) * 2015-07-13 2017-10-31 Seal Software Limited Standard exact clause detection
US10614102B2 (en) * 2017-02-23 2020-04-07 Innoplexus Ag Method and system for creating entity records using existing data sources
US11291510B2 (en) 2017-10-30 2022-04-05 Cilag Gmbh International Method of hub communication with surgical instrument systems
US11564756B2 (en) 2017-10-30 2023-01-31 Cilag Gmbh International Method of hub communication with surgical instrument systems
US10980560B2 (en) 2017-10-30 2021-04-20 Ethicon Llc Surgical instrument systems comprising feedback mechanisms
US11311342B2 (en) 2017-10-30 2022-04-26 Cilag Gmbh International Method for communicating with surgical instrument systems
US11229436B2 (en) 2017-10-30 2022-01-25 Cilag Gmbh International Surgical system comprising a surgical tool and a surgical hub
US11510741B2 (en) 2017-10-30 2022-11-29 Cilag Gmbh International Method for producing a surgical instrument comprising a smart electrical system
US11911045B2 (en) 2017-10-30 2024-02-27 Cllag GmbH International Method for operating a powered articulating multi-clip applier
US11026687B2 (en) 2017-10-30 2021-06-08 Cilag Gmbh International Clip applier comprising clip advancing systems
US11317919B2 (en) 2017-10-30 2022-05-03 Cilag Gmbh International Clip applier comprising a clip crimping system
US11801098B2 (en) 2017-10-30 2023-10-31 Cilag Gmbh International Method of hub communication with surgical instrument systems
US11786251B2 (en) 2017-12-28 2023-10-17 Cilag Gmbh International Method for adaptive control schemes for surgical network control and interaction
US11744604B2 (en) 2017-12-28 2023-09-05 Cilag Gmbh International Surgical instrument with a hardware-only control circuit
US11376002B2 (en) 2017-12-28 2022-07-05 Cilag Gmbh International Surgical instrument cartridge sensor assemblies
US11672605B2 (en) 2017-12-28 2023-06-13 Cilag Gmbh International Sterile field interactive control displays
US10943454B2 (en) 2017-12-28 2021-03-09 Ethicon Llc Detection and escalation of security responses of surgical instruments to increasing severity threats
US11109866B2 (en) 2017-12-28 2021-09-07 Cilag Gmbh International Method for circular stapler control algorithm adjustment based on situational awareness
US11266468B2 (en) 2017-12-28 2022-03-08 Cilag Gmbh International Cooperative utilization of data derived from secondary sources by intelligent surgical hubs
US11832899B2 (en) 2017-12-28 2023-12-05 Cilag Gmbh International Surgical systems with autonomously adjustable control programs
US11419630B2 (en) 2017-12-28 2022-08-23 Cilag Gmbh International Surgical system distributed processing
US10987178B2 (en) 2017-12-28 2021-04-27 Ethicon Llc Surgical hub control arrangements
US11969216B2 (en) 2017-12-28 2024-04-30 Cilag Gmbh International Surgical network recommendations from real time analysis of procedure variables against a baseline highlighting differences from the optimal solution
US11273001B2 (en) 2017-12-28 2022-03-15 Cilag Gmbh International Surgical hub and modular device response adjustment based on situational awareness
US11132462B2 (en) 2017-12-28 2021-09-28 Cilag Gmbh International Data stripping method to interrogate patient records and create anonymized record
US11364075B2 (en) 2017-12-28 2022-06-21 Cilag Gmbh International Radio frequency energy device for delivering combined electrical signals
US11896443B2 (en) 2017-12-28 2024-02-13 Cilag Gmbh International Control of a surgical system through a surgical barrier
US11311306B2 (en) 2017-12-28 2022-04-26 Cilag Gmbh International Surgical systems for detecting end effector tissue distribution irregularities
US20190201118A1 (en) 2017-12-28 2019-07-04 Ethicon Llc Display arrangements for robot-assisted surgical platforms
US11069012B2 (en) 2017-12-28 2021-07-20 Cilag Gmbh International Interactive surgical systems with condition handling of devices and data capabilities
US11571234B2 (en) 2017-12-28 2023-02-07 Cilag Gmbh International Temperature control of ultrasonic end effector and control system therefor
US11864728B2 (en) 2017-12-28 2024-01-09 Cilag Gmbh International Characterization of tissue irregularities through the use of mono-chromatic light refractivity
US11076921B2 (en) 2017-12-28 2021-08-03 Cilag Gmbh International Adaptive control program updates for surgical hubs
US11903601B2 (en) 2017-12-28 2024-02-20 Cilag Gmbh International Surgical instrument comprising a plurality of drive systems
US10966791B2 (en) 2017-12-28 2021-04-06 Ethicon Llc Cloud-based medical analytics for medical facility segmented individualization of instrument function
US11234756B2 (en) 2017-12-28 2022-02-01 Cilag Gmbh International Powered surgical tool with predefined adjustable control algorithm for controlling end effector parameter
US11464535B2 (en) 2017-12-28 2022-10-11 Cilag Gmbh International Detection of end effector emersion in liquid
US11589888B2 (en) 2017-12-28 2023-02-28 Cilag Gmbh International Method for controlling smart energy devices
US11844579B2 (en) 2017-12-28 2023-12-19 Cilag Gmbh International Adjustments based on airborne particle properties
US11324557B2 (en) 2017-12-28 2022-05-10 Cilag Gmbh International Surgical instrument with a sensing array
US11160605B2 (en) 2017-12-28 2021-11-02 Cilag Gmbh International Surgical evacuation sensing and motor control
US11013563B2 (en) 2017-12-28 2021-05-25 Ethicon Llc Drive arrangements for robot-assisted surgical platforms
US11410259B2 (en) 2017-12-28 2022-08-09 Cilag Gmbh International Adaptive control program updates for surgical devices
US11969142B2 (en) 2017-12-28 2024-04-30 Cilag Gmbh International Method of compressing tissue within a stapling device and simultaneously displaying the location of the tissue within the jaws
US11045591B2 (en) 2017-12-28 2021-06-29 Cilag Gmbh International Dual in-series large and small droplet filters
US11308075B2 (en) 2017-12-28 2022-04-19 Cilag Gmbh International Surgical network, instrument, and cloud responses based on validation of received dataset and authentication of its source and integrity
US11304699B2 (en) 2017-12-28 2022-04-19 Cilag Gmbh International Method for adaptive control schemes for surgical network control and interaction
US11818052B2 (en) 2017-12-28 2023-11-14 Cilag Gmbh International Surgical network determination of prioritization of communication, interaction, or processing based on system or device needs
US11419667B2 (en) 2017-12-28 2022-08-23 Cilag Gmbh International Ultrasonic energy device which varies pressure applied by clamp arm to provide threshold control pressure at a cut progression location
US11771487B2 (en) 2017-12-28 2023-10-03 Cilag Gmbh International Mechanisms for controlling different electromechanical systems of an electrosurgical instrument
US11202570B2 (en) 2017-12-28 2021-12-21 Cilag Gmbh International Communication hub and storage device for storing parameters and status of a surgical device to be shared with cloud based analytics systems
US11100631B2 (en) 2017-12-28 2021-08-24 Cilag Gmbh International Use of laser light and red-green-blue coloration to determine properties of back scattered light
US11678881B2 (en) 2017-12-28 2023-06-20 Cilag Gmbh International Spatial awareness of surgical hubs in operating rooms
US11446052B2 (en) 2017-12-28 2022-09-20 Cilag Gmbh International Variation of radio frequency and ultrasonic power level in cooperation with varying clamp arm pressure to achieve predefined heat flux or power applied to tissue
US11304763B2 (en) 2017-12-28 2022-04-19 Cilag Gmbh International Image capturing of the areas outside the abdomen to improve placement and control of a surgical device in use
US11432885B2 (en) 2017-12-28 2022-09-06 Cilag Gmbh International Sensing arrangements for robot-assisted surgical platforms
US11602393B2 (en) 2017-12-28 2023-03-14 Cilag Gmbh International Surgical evacuation sensing and generator control
US11423007B2 (en) 2017-12-28 2022-08-23 Cilag Gmbh International Adjustment of device control programs based on stratified contextual data in addition to the data
US11147607B2 (en) 2017-12-28 2021-10-19 Cilag Gmbh International Bipolar combination device that automatically adjusts pressure based on energy modality
US11253315B2 (en) 2017-12-28 2022-02-22 Cilag Gmbh International Increasing radio frequency to create pad-less monopolar loop
US10892995B2 (en) 2017-12-28 2021-01-12 Ethicon Llc Surgical network determination of prioritization of communication, interaction, or processing based on system or device needs
US11056244B2 (en) * 2017-12-28 2021-07-06 Cilag Gmbh International Automated data scaling, alignment, and organizing based on predefined parameters within surgical networks
US11832840B2 (en) 2017-12-28 2023-12-05 Cilag Gmbh International Surgical instrument having a flexible circuit
US11540855B2 (en) 2017-12-28 2023-01-03 Cilag Gmbh International Controlling activation of an ultrasonic surgical instrument according to the presence of tissue
US11291495B2 (en) 2017-12-28 2022-04-05 Cilag Gmbh International Interruption of energy due to inadvertent capacitive coupling
US10758310B2 (en) 2017-12-28 2020-09-01 Ethicon Llc Wireless pairing of a surgical device with another device within a sterile surgical field based on the usage and situational awareness of devices
US11696760B2 (en) 2017-12-28 2023-07-11 Cilag Gmbh International Safety systems for smart powered surgical stapling
US11096693B2 (en) 2017-12-28 2021-08-24 Cilag Gmbh International Adjustment of staple height of at least one row of staples based on the sensed tissue thickness or force in closing
US11051876B2 (en) 2017-12-28 2021-07-06 Cilag Gmbh International Surgical evacuation flow paths
US11633237B2 (en) 2017-12-28 2023-04-25 Cilag Gmbh International Usage and technique analysis of surgeon / staff performance against a baseline to optimize device utilization and performance for both current and future procedures
US11278281B2 (en) 2017-12-28 2022-03-22 Cilag Gmbh International Interactive surgical system
US11659023B2 (en) 2017-12-28 2023-05-23 Cilag Gmbh International Method of hub communication
US11857152B2 (en) 2017-12-28 2024-01-02 Cilag Gmbh International Surgical hub spatial awareness to determine devices in operating theater
US11896322B2 (en) 2017-12-28 2024-02-13 Cilag Gmbh International Sensing the patient position and contact utilizing the mono-polar return pad electrode to provide situational awareness to the hub
US11304745B2 (en) 2017-12-28 2022-04-19 Cilag Gmbh International Surgical evacuation sensing and display
US11464559B2 (en) 2017-12-28 2022-10-11 Cilag Gmbh International Estimating state of ultrasonic end effector and control system therefor
US11786245B2 (en) 2017-12-28 2023-10-17 Cilag Gmbh International Surgical systems with prioritized data transmission capabilities
US11166772B2 (en) 2017-12-28 2021-11-09 Cilag Gmbh International Surgical hub coordination of control and communication of operating room devices
US11179208B2 (en) 2017-12-28 2021-11-23 Cilag Gmbh International Cloud-based medical analytics for security and authentication trends and reactive measures
US11666331B2 (en) 2017-12-28 2023-06-06 Cilag Gmbh International Systems for detecting proximity of surgical end effector to cancerous tissue
US11257589B2 (en) 2017-12-28 2022-02-22 Cilag Gmbh International Real-time analysis of comprehensive cost of all instrumentation used in surgery utilizing data fluidity to track instruments through stocking and in-house processes
US11304720B2 (en) 2017-12-28 2022-04-19 Cilag Gmbh International Activation of energy devices
US11559308B2 (en) 2017-12-28 2023-01-24 Cilag Gmbh International Method for smart energy device infrastructure
US11576677B2 (en) 2017-12-28 2023-02-14 Cilag Gmbh International Method of hub communication, processing, display, and cloud analytics
US11559307B2 (en) 2017-12-28 2023-01-24 Cilag Gmbh International Method of robotic hub communication, detection, and control
US11937769B2 (en) 2017-12-28 2024-03-26 Cilag Gmbh International Method of hub communication, processing, storage and display
US11389164B2 (en) 2017-12-28 2022-07-19 Cilag Gmbh International Method of using reinforced flexible circuits with multiple sensors to optimize performance of radio frequency devices
US11179175B2 (en) 2017-12-28 2021-11-23 Cilag Gmbh International Controlling an ultrasonic surgical instrument according to tissue location
US11424027B2 (en) 2017-12-28 2022-08-23 Cilag Gmbh International Method for operating surgical instrument systems
US11317937B2 (en) 2018-03-08 2022-05-03 Cilag Gmbh International Determining the state of an ultrasonic end effector
US11529187B2 (en) 2017-12-28 2022-12-20 Cilag Gmbh International Surgical evacuation sensor arrangements
US11284936B2 (en) 2017-12-28 2022-03-29 Cilag Gmbh International Surgical instrument having a flexible electrode
US11399858B2 (en) 2018-03-08 2022-08-02 Cilag Gmbh International Application of smart blade technology
US11337746B2 (en) 2018-03-08 2022-05-24 Cilag Gmbh International Smart blade and power pulsing
US11259830B2 (en) 2018-03-08 2022-03-01 Cilag Gmbh International Methods for controlling temperature in ultrasonic device
US11166716B2 (en) 2018-03-28 2021-11-09 Cilag Gmbh International Stapling instrument comprising a deactivatable lockout
US10973520B2 (en) 2018-03-28 2021-04-13 Ethicon Llc Surgical staple cartridge with firing member driven camming assembly that has an onboard tissue cutting feature
US11278280B2 (en) 2018-03-28 2022-03-22 Cilag Gmbh International Surgical instrument comprising a jaw closure lockout
US11207067B2 (en) 2018-03-28 2021-12-28 Cilag Gmbh International Surgical stapling device with separate rotary driven closure and firing systems and firing member that engages both jaws while firing
US11219453B2 (en) 2018-03-28 2022-01-11 Cilag Gmbh International Surgical stapling devices with cartridge compatible closure and firing lockout arrangements
US11096688B2 (en) 2018-03-28 2021-08-24 Cilag Gmbh International Rotary driven firing members with different anvil and channel engagement features
US11589865B2 (en) 2018-03-28 2023-02-28 Cilag Gmbh International Methods for controlling a powered surgical stapler that has separate rotary closure and firing systems
US11090047B2 (en) 2018-03-28 2021-08-17 Cilag Gmbh International Surgical instrument comprising an adaptive control system
US11471156B2 (en) 2018-03-28 2022-10-18 Cilag Gmbh International Surgical stapling devices with improved rotary driven closure systems
US11298130B2 (en) 2019-02-19 2022-04-12 Cilag Gmbh International Staple cartridge retainer with frangible authentication key
US11317915B2 (en) 2019-02-19 2022-05-03 Cilag Gmbh International Universal cartridge based key feature that unlocks multiple lockout arrangements in different surgical staplers
US11751872B2 (en) 2019-02-19 2023-09-12 Cilag Gmbh International Insertable deactivator element for surgical stapler lockouts
US11357503B2 (en) 2019-02-19 2022-06-14 Cilag Gmbh International Staple cartridge retainers with frangible retention features and methods of using same
US11369377B2 (en) 2019-02-19 2022-06-28 Cilag Gmbh International Surgical stapling assembly with cartridge based retainer configured to unlock a firing lockout
USD950728S1 (en) 2019-06-25 2022-05-03 Cilag Gmbh International Surgical staple cartridge
USD952144S1 (en) 2019-06-25 2022-05-17 Cilag Gmbh International Surgical staple cartridge retainer with firing system authentication key
USD964564S1 (en) 2019-06-25 2022-09-20 Cilag Gmbh International Surgical staple cartridge retainer with a closure system authentication key

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001065410A2 (en) 2000-02-28 2001-09-07 Geocontent, Inc. Search engine for spatial data indexing
US6366934B1 (en) 1998-10-08 2002-04-02 International Business Machines Corporation Method and apparatus for querying structured documents using a database extender
US20020143659A1 (en) 2001-02-27 2002-10-03 Paula Keezer Rules-based identification of items represented on web pages
JP2004234288A (ja) * 2003-01-30 2004-08-19 Nippon Telegr & Teleph Corp <Ntt> Web検索方法及び装置、Web検索プログラム並びにそのプログラムを記録した記録媒体

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6424980B1 (en) 1998-06-10 2002-07-23 Nippon Telegraph And Telephone Corporation Integrated retrieval scheme for retrieving semi-structured documents
EP1171828A1 (en) * 1999-01-08 2002-01-16 Micro-Integration Corporation Search engine database and interface
JP2000322420A (ja) * 1999-05-07 2000-11-24 Hitachi Ltd 空間データ登録方法および検索方法
EP1221078A1 (en) 1999-09-15 2002-07-10 Siemens Corporate Research, Inc. Method and system for selecting and automatically updating arbitrary elements from structured documents
US6480837B1 (en) * 1999-12-16 2002-11-12 International Business Machines Corporation Method, system, and program for ordering search results using a popularity weighting
US20050010494A1 (en) * 2000-03-21 2005-01-13 Pricegrabber.Com Method and apparatus for Internet e-commerce shopping guide
JP4199671B2 (ja) * 2002-03-15 2008-12-17 富士通株式会社 地域情報検索方法及び地域情報検索装置
JP2003296341A (ja) * 2002-04-03 2003-10-17 Nissan Motor Co Ltd データベース生成方法、データベース生成プログラム、データ構造、データベース生成システム、検索システム、及び検索方法
US6950815B2 (en) 2002-04-23 2005-09-27 International Business Machines Corporation Content management system and methodology featuring query conversion capability for efficient searching
US8214391B2 (en) * 2002-05-08 2012-07-03 International Business Machines Corporation Knowledge-based data mining system
US7111000B2 (en) 2003-01-06 2006-09-19 Microsoft Corporation Retrieval of structured documents
KR100677116B1 (ko) * 2004-04-02 2007-02-02 삼성전자주식회사 사이클릭 레퍼런싱 방법/장치, 파싱 방법/장치 및 그방법을 수행하는 프로그램이 기록된 컴퓨터 판독가능한기록매체
US20070078850A1 (en) * 2005-10-03 2007-04-05 Microsoft Corporation Commerical web data extraction system
US20070203891A1 (en) * 2006-02-28 2007-08-30 Microsoft Corporation Providing and using search index enabling searching based on a targeted content of documents
US20070276845A1 (en) * 2006-05-12 2007-11-29 Tele Atlas North America, Inc. Locality indexes and method for indexing localities
US20080228675A1 (en) * 2006-10-13 2008-09-18 Move, Inc. Multi-tiered cascading crawling system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366934B1 (en) 1998-10-08 2002-04-02 International Business Machines Corporation Method and apparatus for querying structured documents using a database extender
WO2001065410A2 (en) 2000-02-28 2001-09-07 Geocontent, Inc. Search engine for spatial data indexing
US20020143659A1 (en) 2001-02-27 2002-10-03 Paula Keezer Rules-based identification of items represented on web pages
JP2004234288A (ja) * 2003-01-30 2004-08-19 Nippon Telegr & Teleph Corp <Ntt> Web検索方法及び装置、Web検索プログラム並びにそのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
CN101647020A (zh) 2010-02-10
US8200704B2 (en) 2012-06-12
WO2008097921A1 (en) 2008-08-14
US20110060749A1 (en) 2011-03-10
BRPI0807172A2 (pt) 2014-05-13
AU2008213993A1 (en) 2008-08-14
US7836085B2 (en) 2010-11-16
CA2677307C (en) 2015-04-14
JP2010518495A (ja) 2010-05-27
EP2118779A4 (en) 2013-07-17
EP2118779A1 (en) 2009-11-18
JP5336391B2 (ja) 2013-11-06
CN101647020B (zh) 2012-11-28
US20080189249A1 (en) 2008-08-07
KR20090116747A (ko) 2009-11-11
CA2677307A1 (en) 2008-08-14

Similar Documents

Publication Publication Date Title
KR101450358B1 (ko) 구조형 지리적 데이터 검색
JP5256293B2 (ja) 検索結果ページ上に対話要素を含めるためのシステム及び方法
US8055674B2 (en) Annotation framework
US8386453B2 (en) Providing search information relating to a document
US7765209B1 (en) Indexing and retrieval of blogs
US7310633B1 (en) Methods and systems for generating textual information
JP2003173280A (ja) データベース生成装置、データベース生成方法及びデータベース生成プログラム
Alonso et al. Clustering of search results using temporal attributes
US20110252313A1 (en) Document information selection method and computer program product
US8447748B2 (en) Processing digitally hosted volumes
JP2004086845A (ja) 電子文書情報拡充装置、方法及びプログラム、並びに、電子文書情報拡充プログラムを記録した記録媒体
EP1410265A2 (en) Information retrieval using enhanced document vectors
JP4057962B2 (ja) 質問応答装置、質問応答方法及びプログラム
CN114117242A (zh) 数据查询方法和装置、计算机设备、存储介质
Qiu et al. Detection and optimized disposal of near-duplicate pages
JP2000322167A (ja) データ管理システムおよびデータ属性表示方法
CN116910054A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
JP2000148766A (ja) インターネット情報取得方法及び装置
TW201131388A (en) Domain metadata retrieval method and its system
Chen et al. A novel approach of table detection and analysis for semantic annotation
JP2004258832A (ja) 文書検索システムおよび文書検索方法
DESHMUKH et al. Tactful Management Research Journal
Arotaritei Data mining in metadata repositories
Xufa Semi-structured Data Extraction and Schema Knowledge Mining
JP2007109067A (ja) 情報統合方法及び装置及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170927

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180927

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190925

Year of fee payment: 6