CN101128823A - 根据地理关联索引文档 - Google Patents

根据地理关联索引文档 Download PDF

Info

Publication number
CN101128823A
CN101128823A CNA2005800486502A CN200580048650A CN101128823A CN 101128823 A CN101128823 A CN 101128823A CN A2005800486502 A CNA2005800486502 A CN A2005800486502A CN 200580048650 A CN200580048650 A CN 200580048650A CN 101128823 A CN101128823 A CN 101128823A
Authority
CN
China
Prior art keywords
document
geographic area
search
index
location identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800486502A
Other languages
English (en)
Inventor
丹尼尔·艾尼奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN101128823A publication Critical patent/CN101128823A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

局部搜索引擎通过对每一文档,索引共同定义总的地理区域的多个位置标识符,有效地索引与地理区域有关的文档。当创建该索引时,搜索引擎可以确定在与文档有关的地理区域周围的地理区域的集合以及将地理区域的集合的坐标与文档索引关联。

Description

根据地理关联索引文档
技术领域
在此所述的实现涉及搜索引擎,以及更具体地说,涉及局部搜索引擎能有效地检索与地理区域相关的文档的技术。
背景技术
万维网(“Web”)包含大量信息。然而,定位信息的所需部分是困难的。由于环球网上的信息量以及环球网搜索不熟练的新用户的数量日益快速增加,使这一问题更加复杂。
搜索引擎试图返回指向用户感兴趣网页的超链接。通常,搜索引擎根据用户输入的搜索词语(称为搜索查询)来确定用户的兴趣。搜索引擎的目标是基于搜索查询向用户提供高质量的相关结果(例如,网页)。通常,搜索查询通过将搜索查询中的词语与预先存储的网页语料库相匹配来实现这一目标。包含用户搜索词语的网页是“命中页”并作为链接返回给用户。
为了提高返回给用户的网页的相关性和质量,搜索引擎可能尝试排序命中页的列表,使得最相关和/或最高质量的页位于返回给用户的命中页列表的最上部。例如,搜索引擎可以对每一命中页指定等级或分值,其中,将分值设计成对应于网页的相关性或重要性。
局部搜索引擎是尝试返回在指定地理区域内的相关网页和/或企业登记信息的搜索引擎。对局部搜索,用户可以输入搜索查询并指定将执行搜索查询的地理区域。局部搜索引擎可以向用户返回相关结果,诸如属于该该地理区域的相关网页或该地理区域中的企业登记信息。
对于一些局部搜索引擎,感兴趣的局部地理区域是由离起始位置特定距离或半径范围内地区域,诸如离邮政编码区或街道地址几英里限定的区域。理想地,局部搜索引擎应当有效地定位和返回在期望地理区域中的相关结果。
发明内容
本发明的一个方面是针对索引文档的方法。该方法包括确定与文档相关的位置,确定环绕与该文档有关的该位置的位置集,以及索引该文档使得包括对该位置和位置集的引用(reference)。
本发明的另一方面针对索引文档的另一方法。该方法包括识别与第一地理区域有关的文档,确定环绕第一地理区域的地理区域集,将对第一地理区域和地理区域集的引用与文档关联,以及利用相关的引用索引该文档。
本发明的另一方面针对执行搜索的方法。该方法包括接收与地理区域有关的搜索查询,确定与地理区域有关的位置标识符,以及基于搜索查询和位置标识符与文档索引的比较,执行与该搜索查询有关的文档的搜索。
附图说明
包含并构成该说明书的一部分的附图示例说明本发明的实施例,并结合该说明书说明本发明。在图中:
图1是可以实现符合本发明的原理的系统和方法的网络的示例图;
图2是图1所示的客户机或服务器的示例图;
图3A和3B是示例说明分层三角网格(HTM)的图;
图4是示例说明符合用于索引具有地理相关性的文档的本发明的方面的示例性操作的流程图;
图5是示例说明图4所示的操作的图;
图6A和6B示例说明具有地理相关性的示例性文档。
图7是示例说明具有地理相关性的另一示例性文档的图。
图8是示例说明根据符合本发明各方面的实现,在处理局部搜索查询中的搜索引擎的示例性操作的流程图;
图9是示例说明在根据符合本发明各方面的另一实现,处理局部搜索查询中的搜索引擎的示例性操作的流程图;
图10是用来示例说明图9所示的动作的示例性HTM网格(grid)的图;以及
图11和12是可以呈现给用户的局部搜索用户界面的示例图。
具体实施方式
本发明的下文的详细描述参考附图。详细描述不限制本发明。
概述
局部搜索引擎可以对局部搜索查询生成限制到期望地理区域的结果。例如可以通过距指定点或地区的某一距离(例如20英里)限定地理区域。通过基于文档的内容以及基于多个位置标识符来索引地理相关文档,从而有效地生成搜索结果。在一个实现中,位置标识符定义规则间隔的地理区域,并且索引文档以使得选择对每一文档索引的多个位置标识符,从而定义与该文档有关的区域周围的预定范围。这种文档索引技术允许按地理区域有效地搜索。
示例性网络概述
图1是可以实现与本发明的原理一致的系统和方法的网络100的示例图。网络100可以包括经网络140,连接到服务器120的客户机110。网络140可以包括局域网(LAN)、广域网(WAN)、电话网络,诸如公用交换电话网(PSTN)、内联网、互联网或网络的组合。为简化起见,将两个客户机110和一个服务器120示例为连接到网络140。实际上,可以有更多客户机和/或服务器。同时,在一些实例中,客户机可以执行服务器的功能以及服务器可以执行客户机的功能。
客户机110可以包括设备,诸如无线电话、个人计算机、个人数字助理(PDA)、膝上型计算机或另一类型的计算或通信设备、在这些设备的一个上运行的线程或进程和/或可由这些设备的一个执行的对象。服务器120可以包括处理、搜索和/或维护文档的服务器设备。客户机110和服务器120可以经有线、无线或光学连接,连接到网络140。
服务器120可以包括可由客户机110使用的搜索引擎125。搜索引擎125可以是基于查询的文档搜索引擎。可以将搜索引擎125特别地设计成返回地理区域局部的结果。搜索引擎125可以基于在数据库135中存储的文档来响应用户搜索查询。在数据库135中存储的文档通常可以包括确定为与特定地理区域有关的文档。这些文档可以包括例如位于特定地址的企业的企业登记信息或以某些方式与地理区域有关的Web文档(例如,提供局部餐馆评论的Web文档)。
文档(document),作为在此所使用的词语,广义地解释为包括任何机器可读和机器可存储工作产品。文档可以是电子邮件、企业登记信息、Web站点、文件、文件组合、嵌有至其他文件的链接的一个或多个文件、新闻组帖子等等。在互联网的环境下,常见文档是网页。网页通常包括内容以及可以包括嵌入信息(诸如元信息、超级链接等等)和/或嵌入指令(诸如Javascript等等)。
示例性客户机/服务器体系结构
图2是根据与本发明的原理一致的实现、称为计算设备200的客户机100或服务器120的示例图。计算设备200可以包括总线210、处理器220、主存储器230、只读存储器(ROM)240、存储设备250、输入设备260、输出设备270和通信接口280。总线210可以包括允许计算设备200的部件间的通信的路径。
处理器220可以包括可以解释和执行指令的任何类型的传统处理器、微处理器或处理逻辑。主存储器230可以包括随机存取存储器
(RAM)或存储用于由处理器220执行的信息和指令的另一类型的动态存储设备。ROM 240可以包括传统的ROM设备或存储由处理器220使用的静态信息和指令的另一类型的静态存储设备。存储设备250可以包括磁性和/或光记录介质及其相应的驱动器。
输入设备260可以包括允许用户将信息输入到计算设备200的传统机制,诸如键盘、鼠标、输入笔、语音识别和/或生物识别机制等等。输出设备270可以包括将信息输出给用户的传统的机制,包括显示器、打印机、扬声器等等。通信接口280可以包括允许计算设备200与其他设备和/或系统通信的任何收发信机型机制。例如,通信接口280可以包括用于经网络,诸如网络140与另一设备或系统通信的机制。
搜索引擎125可以存储在计算机可读介质,诸如存储器230中。计算机可读介质可以定义为一个或多个物理或逻辑存储器设备和/或载波。定义搜索引擎125的软件指令可以从另一计算机可读介质(诸如存储器设备250),或经通信接口280,从另一设备读入存储器230。包含在存储器230中的软件指令使处理器220执行稍后所述的过程。另外,代替和/或组合软件指令,可以使用硬布线电路以便实现与本发明一致的过程。因此,与本发明的原理一致的实现可以不限于硬件电路和软件的任何特定组合。
位置标识符
数据库135中的文档可以分别与地理区域关联。地理区域可以由与该文档相关联的位置标识符指定。在一种实现中,使用分层网络,诸如非常公知的分层三角网格(HTM)模型,从地表的模型导出位置标识符。为读者方便,现在简单地描述HTM模型。
分层三角网格(HTM)是将球体,诸如地球的表面划分成球面三角的划分方案。这种分层方案和细分不是精确、而是粗略的等面积。
图3A是示例说明将球体300(例如地表)初始细分成八个区并标识为区域N0,N1,N2,N3和S0,S1,S2,S3的图示。在图3A中,仅标记区域N0,N1,S0和S1。其他区域对应于球体的“后半部分”。这些细分是八个最大的等大小的球面三角形。通过连接相邻边的边中点,每一细分可以进一步细分成三角形。图3B是示例说明下一细分等级的图。如图3B所示,细分N0进一步细分成四个细分,标记为细分N00、N01、N02和N03。尽管通过球体上的弧实际形成每一细分,为简化起见,图3B中的细分示为三角形的线段。随着细分的尺度减小,每一细分将在形状方面更接近三角形。
细分克看作具有八个根节点(N0,N1,N2,N3,S0,S1,S2和S3)的树结构中的子节点,以及其中,每一根节点可以具有四个子节点。细分可以持续到任何等级。在所示的命名方案中,对每一后续级,通过将另外的字符添加到细分标签上来命名细分。例如,假定节点N201102。其中N2是指根名,以及五个后继的数字(01102)表示在每一级选择哪一三角形。这些细分标签可以用作数据库135中与地理相关文档有关的位置标识符。
本领域的普通技术人员知道,不同于HTM的地球表面建模技术,或HTM的不同实现克用来实现数据库135中存储的位置标识符。例如,能另外使用的其他可能的细分建模技术包括HEALPix(分层等面积同纬度像素化)、C-Keys、UTM(通用横轴墨卡托)和其他各种区域网格(诸如英国国家网格)。
数据库135的索引
图4是符合本发明各方面的用于索引具有地理相关性的文档示例性操作的流程图。
如所述,数据库135可以包括文档的索引,诸如地理相关Web文档和企业登记信息。索引可以是在文档中找到的词语的索引以及可以形成为倒排索引结构,用来对每一词语存储包含该词语的所有文档的列表。
可以识别地理相关文档(动作401)。地理相关文档,如在此所使用的,通常是指以某些方式被确定为与地理位置有特定关联的任何文档。例如,企业登记信息,诸如黄页登记信息,可以分别视为与由企业的地址定义的地理区域有关的地理相关文档。其他文档,诸如Web文档可以具有特定地理相关性。例如,企业可以具有主页,可以是谈论或评论该企业的文档的主题,或可以由按一些其他方式与企业关联的网页提及。以各种方式,诸如由邮政地址或由其他地理信号确定文档有关的特定地理位置。
接着,与地理相关文档有关的地理区域可以映射到其相应的位置标识符(动作402)。换句话说,确定与该文档有关的HTM标识符(例如N201102)。可以在例如将邮政地址位置(或纬度/经度特定位置)与适当的HTM标识符对应的预定查找表中查找文档的邮政地址或纬度/经度位置,执行该映射。
可以确定用于该文档的另外的位置标识符。特别地,也可以确定预定范围内对应于周围区域的位置标识符(动作403)。图5是示例说明动作403的示例性实现的图。在该例子中,假定将预定范围选择为1英里,由圆圈530所示。网格500表示在特定网格级,诸如每一三角区表示HTM网格中近似1平方英里的网格级的一部分。假定文档与三角地理区域510内的企业505有关。如由圆圈530所示,区域520-1至520-12至少部分落在区域510的一英里范围内。因此,在区域510的中心的约一英里内的地理区域包括由各区域510和520限定的地理区域(在图5中用粗体表示)。
返回到图4,搜索引擎125可以索引每一地理相关文档,就象该文档包括与该文档的区域和在动作403中识别的周围区域的位置标识符(动作404)。在图5的例子中,例如,可以索引文档以使得用于所有区域510和520-1至520-12的HTM标识符包括在该文档的索引中。在一种实现中,位置标识符可以与用来指示它们不是原始文档文本的一部分的数据库135中的特定标签相关联。
图6A和6B是示例说明克使用图4所示的操作在数据库135中进行索引的示例性文档的图。图6A示例说明用于假想的餐馆“Gino’sPizza”的企业登记信息605。搜索引擎125可以索引文档605的文本以及位置标识符,还可以索引与该文档有关的其他信息。在该例子中,可以通过该文档索引类别信息610和位置标识符615。第一位置标识符,HTM区域N201301可以指Gino’s Pizza所位于的特定地理区域(例如图5的例子中的区域510),而其余位置标识符可以指N201301周围的地理区域(例如图5的例子中的各区域520)。
图6B示例说明包括Ginp’s Pizza的评论的假想网页620。网页620可以被确定为地理相关的,因为它主要与特定地理位置的企业有关。因此,网页620也可以与Gino’s Pizza相同的地理区域关联。因此,按照与企业登记信息605关联并由其索引的位置标识符615类似的方式,位置标识符625可以与网页620关联并由其索引,从而可以将多个位置标识符与文档620关联。
为便于说明,图5、6A和6B所示的示例性HTM区域指第五级子节点。实际上,指适合于提供局部搜索结果的区域的HTM区域将倾向于处于更低节点级。
图7是示例说明使用图4所示的操作来索引另一示例性文档的图。除了不是仅使用一个集合而是确定对应于两个不同预定范围的两个位置标识符集,图7的文档与图6的文档是相同的。在该例子中,位置标识符710可以是当预定范围为1英里时确定的位置标识符的集合。可以基于用于预定范围的另一值,诸如五英里,选择被标记为位置标识符720的位置标识符的第二集合。因此,存在除710外的更多位置标识符720,并且位置标识符710是位置标识符720的子集。可以通过该文档独立地索引两个位置标识符的集合。
在一种实现中,在索引期间,通过将标签追加到两个位置标识符的集合,可以相互区分集合710和720中的位置标识符。在该例子中,标签“:1”追加到位置标识符710来表示它们对应于1英里标识符以及将标签“:5”追加到位置标识符720来表示它们对应于五英里标识符。
搜索引擎的操作
图8是示例说明在处理局部搜索查询中,搜索引擎125的示例性操作的流程图。搜索引擎125可以从用户接收搜索查询(动作801)。搜索查询可以是局部查询以及可以与地理区域有关。例如,用户可以搜索“咖啡店”并指定位置是“Poughkeepsie,NY”区域。搜索引擎125可以将由用户输入的区域转换成具有当创建在数据库135中存储的文档索引时使用的位置标识符格式的一个或多个位置标识符(例如HTM标识符)。接着,位置标识符可以追加到搜索查询(动作802)。例如,如果搜索查询是“咖啡店”以及将相应的位置标识符确定为N03013,修改的搜索查询可以是“咖啡店N03013”。在基于不同预定范围识别不同位置标识符集的实现中,修改的搜索查询可以包括对应于将搜索的范围的位置标识符。例如,修改的搜索查询“咖啡店N03013:5”可以用于五英里半径内的局部搜索。
然后,以传统的方式,可以使用修改的搜索查询来获得搜索结果(动作803)。例如,搜索引擎125可以从包含搜索查询中词语的文档索引识别文档。或者,搜索引擎125可以识别包含搜索词语的同义词的文档。因为修改的搜索查询包括对应于搜索区中心的位置标识符,并且索引地理相关文档以包括在预定范围内的所有区域的位置标识符,搜索结果将限于预定搜索范围内的文档。因此,对示例性搜索“咖啡店N03013:5”,搜索结果将是Poughkeepsie,NY的五英里内、与咖啡店有关的文档,诸如咖啡店企业登记信息。
然后,可以将在动作803中获得的搜索结果返回到用户(动作804)。在一个实现中,该结果可以显示为与用户查询有关的企业登记信息的排名的列表。每一登记信息可以包含信息,诸如用于与企业登记信息有关的企业的地址信息、该企业的电话号码、企业更多信息的链接、企业方位的链接和/或一个或多个提及该企业的Web文档的链接。
图9是示例说明当所选择的搜索范围与预定索引范围不匹配时,在处理局部搜索查询中,搜索引擎125的示例性操作的流程图。搜索引擎125可以从用户接收搜索查询(动作901)。搜索查询可以是局部搜索,以及可以与地理区域有关,以及包括用户想搜索的范围的表示。例如,用户可以搜索“咖啡店”,指定其位置是“Poughkeepsie,NY”区,以及指定用户希望三英里的搜索半径。
假定由用户选择的三英里搜索范围不是数据库135中特有索引的范围。可以确定最接近但不是大于用户所选择范围的预索引范围(动作902)。假定在该例子中,最接近预索引范围为1英里。即,将位置标识符集合添加到用于1英里范围的索引。接着,搜索引擎125可以定位在与该搜索有关的地理区域的二英里(三英里-一英里)内的区域集(动作903)。图10是示例说明动作902和903的示例性HTM网格1000的图。假定区域1010是与该搜索有关的区域,内虚线圈表示一英里半径,以及外虚线圈表示两英里半径。因此,对该例子,在动作903中,搜索引擎125可以定位包括在外圈内的区域集。
然后,可以通过把在动作903中识别的位置标识符追加到搜索查询,作为逻辑OR操作,以此修改搜索查询(动作904)。在上述例子中,其中,初始搜索查询是“咖啡店”,修改的搜索查询可以是“咖啡店”加上对应于落在图10中的外虚线圈内的三角形区域的所有位置标识符的逻辑OR列表。然后,使用该修改的搜索查询,将搜索查询应用于在动作902中确定的预索引位置标识符的传统的方式获得搜索结果(动作905)。由此,可以将上述“咖啡店”搜索应用于一英里预索引位置标识符。
然后,将在动作905中获得的搜索结果返回到用户(动作906)。在一种实现中,可以将该结果显示为与用户查询有关的企业登记信息的排名列表。
作为图9所示的技术的另一可能变形,代替具有多个位置标识符的预索引文档,可以仅通过与文档有关的位置标识符来索引每一文档。然后,如在动作903中执行的,可以规范化搜索查询,其中,该范围在整个搜索区内。即,该搜索可以包括搜索范围内的所有位置标识符的逻辑OR连接。这种变形减少索引大小以及可以允许在查询时,更灵活选择区域大小和形状,但增加查询复杂度。
示例性用户界面
图11和12是根据符合本发明的原理的实现可以呈现给用户的局部搜索用户界面的示例图。如图11所示,可以呈现与局部搜索有关的用户界面。局部搜索用户界面可以允许用户搜索特定位置的企业登记信息。为帮助用户搜索,用户界面可以提供“What”字段和“Where”字段。例如,用户可以在“What”字段中输入企业名称(例如“Pizza Hut”)或企业类型(例如Pizza餐馆)。用户可以在“Where”字段中输入位置名称(例如Albany,NY)。假定该例子,用户在该用户界面的What字段中输入“孕妇装”以及在Where字段中输入“Fairfax,VA”。
用上述方式,搜索引擎125可以基于搜索词语“孕妇装”和“Fairfax,VA”执行搜索以便识别与涉及“Fairfax,VA”位置中的搜索词语“孕妇装”有关的企业有关的文档以及在搜索结果的列表中包括所识别的文档。可以从与特定地理区域,诸如离在“Where”字段中输入的位置的估计中心15英里的默认区域有关的文档选择所识别的文档。
如图12进一步所示,局部搜索用户界面可以向用户呈现搜索结果。用户可以通过从范围1205选择不同搜索范围,修改所搜索的区域。选择不同范围可以导致使用被选范围执行另一搜索。
结论
局部搜索引擎通过对每一文档索引共同定义总的地理区域的多个位置标识符,有效地索引与地理区域有关的文档。当使用该索引来响应单个搜索查询时,可以仅通过将位置标识符添加到搜索查询,可有效地搜索总的地理区域。
对于本领域的普通技术人员而言,很显然,如上所述,在图中所示的实现中,本发明可以用软件、固件、硬件的许多不同形式实现。用来实现符合本发明各方面的实际软件代码或专用控制硬件不限制本发明。因此,在没有提及专用软件代码的情况下,描述这些方面的操作和属性-应理解到本领域的普通技术人员能根据在此的描述,设计软件和控制硬件来实现这些方面。
本发明的优选实施例的上述描述提供示例说明和描述,但不意在穷举或将本发明限制到在此公开的具体形式。根据上述教导的启示,改进和改型是可能的,或可以从本发明的实施中获得改进和改型。例如,尽管按特定顺序描述了上述许多操作,但可以同时或以不同顺序执行许多操作。
另外,本发明的某些部分描述为执行一个或多个功能的“引擎”。引擎可以包括硬件,诸如专用集成电路或现场可编程门阵列、软件或硬件和软件的组合。
不应当将本申请中的元件、动作或指令视为本发明的关键或必要特征,除非明确地那样描述。同时,如在此所使用的,不加数量限制的项表示一个或多个项。在仅期望一项的情况下,使用词语“一个”或类似的语言。另外,短语“基于”意图是指“至少部分基于”,除非明确地表述。本发明的范围由权利要求及其等效描述限定。

Claims (24)

1.一种用于索引文档的方法,包括:
确定与该文档相关联的位置;
确定在与该文档相关联的该位置周围的多个位置;以及
索引该文档使得包括对所述位置和该位置周围的所述多个位置的引用。
2.如权利要求1所述的方法,其中,通过定义网格中地理区域的位置标识符来指定对所述位置和该位置周围的所述多个位置的引用。
3.如权利要求2所述的方法,其中,所述位置标识符包括用于分层三角网格中的节点的标签。
4.如权利要求1所述的方法,其中,所述文档是企业登记信息。
5.如权利要求1所述的方法,其中,所述文档是地理相关性网页文档。
6.如权利要求1所述的方法,其中,在所述位置周围的所述多个位置包括在与该文档相关联的该位置的预定距离范围内的地理区域。
7.如权利要求1所述的方法,其中,通过位置标识符引用在该位置周围的所述多个位置,该方法进一步包括:
确定多个位置标识符集,每一所述集与不同大小的地理区域相关联。
8.一种搜索引擎,包括:
用于存储文档索引的装置;
用于确定与文档相关联的位置的装置;
用于确定在与该文档相关联的该位置周围的多个位置的装置;以及
用于索引该文档以使得在该文档索引中包括对所述位置和所述多个位置的引用的装置。
9.一种用于索引文档的方法,包括:
识别具有与第一地理区域的相关性的文档;
确定在该第一地理区域周围的地理区域集;以及
将对所述第一地理区域和所述地理区域集的引用与该文档相关联;以及
利用所述相关联的引用来索引文档。
10.如权利要求9所述的方法,进一步包括:
把对所述第一地理区域和所述地理区域集的引用确定为对应于分层三角网格中的节点的位置标识符。
11.如权利要求9所述的方法,进一步包括:
把在该第一地理区域周围的地理区域集确定为该第一地理区域的预定范围内的所述地理区域集。
12.如权利要求11所述的方法,进一步包括:
把在该第一地理区域周围的第二地理区域集确定为该第一地理区域的第二预定范围内的所述地理区域集。
13.如权利要求12所述的方法,进一步包括:
把对所述第二地理区域集的引用与该文档相关联。
14.如权利要求9所述的方法,进一步包括:
通过将所述引用插入索引中来索引该文档,就象所述引用是该文档中的词语一样。
15.如权利要求9所述的方法,其中,该文档是企业登记信息。
16.如权利要求9所述的方法,其中,该文档是地理相关网页文档。
17.一种计算机可读介质,包含由处理器执行的编程指令,该计算机可读介质包括:
用于识别具有与第一地理区域的相关性的文档的编程指令;
用于确定在该第一地理区域周围的地理区域集的编程指令;以及
用于把对该第一地理区域和该地理区域集的引用与包括该文档的词语的索引相关联的编程指令。
18.一种执行搜索的方法,包括:
接收与地理区域相关联的搜索查询;
确定与该地理区域相关联的位置标识符;以及
基于所述搜索查询和所述位置标识符与文档索引的比较,执行与该搜索查询有关的文档搜索。
19.如权利要求18所述的方法,进一步包括:
把通过该搜索确定的相关文档传送给用户。
20.如权利要求18所述的方法,其中,所述文档标识符引用分层三角网格中的节点。
21.如权利要求18所述的方法,其中,接收所述搜索查询包括接收由用户输入的搜索词语和地理描述词语。
22.如权利要求18所述的方法,进一步包括:
接收期望搜索区的表示;
确定该期望搜索区和以前索引的搜索区之间的差异;
基于该差异,确定位置标识符的集合;以及
基于所述搜索查询和所述位置标识符的集合,执行该搜索。
23.一种搜索系统,包括:
搜索引擎,用于:
接收包括搜索词语和期望地理区域的表示的搜索查询;
确定与该期望地理区域相关联的位置标识符;
通过将所述位置标识符追加到所述搜索查询来修改该搜索查询;以及
基于所修改的搜索查询与将多个位置标识符与索引中的每一地理相关文档关联的文档索引的比较,执行与该搜索查询有关的文档的搜索。
24.如权利要求23所述的搜索系统,其中,与所述索引中的每一地理相关文档有关的多个位置标识符定义了相应的地理区域。
CNA2005800486502A 2004-12-30 2005-12-30 根据地理关联索引文档 Pending CN101128823A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/024,790 2004-12-30
US11/024,790 US7801897B2 (en) 2004-12-30 2004-12-30 Indexing documents according to geographical relevance

Publications (1)

Publication Number Publication Date
CN101128823A true CN101128823A (zh) 2008-02-20

Family

ID=36117643

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800486502A Pending CN101128823A (zh) 2004-12-30 2005-12-30 根据地理关联索引文档

Country Status (7)

Country Link
US (2) US7801897B2 (zh)
EP (1) EP1839212A1 (zh)
JP (2) JP2008527503A (zh)
KR (2) KR100935628B1 (zh)
CN (1) CN101128823A (zh)
CA (1) CA2593420A1 (zh)
WO (1) WO2006074054A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112204340A (zh) * 2018-03-06 2021-01-08 南俄勒冈大学 使用离散全球网格系统进行位置表示的系统和方法
CN115269500A (zh) * 2022-08-01 2022-11-01 生态环境部卫星环境应用中心 生态环境数据的存储方法、检索方法及电子设备

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711146B2 (en) * 1999-02-22 2004-03-23 Genesys Telecommunications Laboratories, Inc. Telecommunication system for automatically locating by network connection and selectively delivering calls to mobile client devices
EP1269357A4 (en) * 2000-02-22 2005-10-12 Metacarta Inc SPANISH CODING AND DISPLAYING INFORMATION
US7693752B2 (en) 2004-05-26 2010-04-06 Hothand, Inc. Mobile commerce framework
US7801897B2 (en) * 2004-12-30 2010-09-21 Google Inc. Indexing documents according to geographical relevance
US20060218138A1 (en) * 2005-03-25 2006-09-28 Microsoft Corporation System and method for improving search relevance
US20060218114A1 (en) * 2005-03-25 2006-09-28 Microsoft Corporation System and method for location based search
US7599916B2 (en) * 2005-04-20 2009-10-06 Microsoft Corporation System and method for personalized search
US20060271582A1 (en) * 2005-05-25 2006-11-30 Caterpillar Inc. System and method for analyzing raw data files
WO2007002800A2 (en) 2005-06-28 2007-01-04 Metacarta, Inc. User interface for geographic search
WO2007030897A1 (en) * 2005-09-17 2007-03-22 Telezygology Inc. Location sensitive documents
EP1994478A2 (en) 2006-02-10 2008-11-26 Metacarta, Inc. Systems and methods for spatial thumbnails and companion maps for media objects
US20080010605A1 (en) * 2006-06-12 2008-01-10 Metacarta, Inc. Systems and methods for generating and correcting location references extracted from text
US20080040336A1 (en) * 2006-08-04 2008-02-14 Metacarta, Inc. Systems and methods for presenting results of geographic text searches
US9286404B2 (en) * 2006-06-28 2016-03-15 Nokia Technologies Oy Methods of systems using geographic meta-metadata in information retrieval and document displays
US9721157B2 (en) 2006-08-04 2017-08-01 Nokia Technologies Oy Systems and methods for obtaining and using information from map images
US11341202B2 (en) * 2006-10-04 2022-05-24 Craxel, Inc. Efficient method of location-based content management and delivery
DE112006004182A5 (de) 2006-10-18 2009-09-24 Siemens Aktiengesellschaft Verfahren und System zum Steuern einer elektrischen Anlage
WO2008055234A2 (en) * 2006-10-31 2008-05-08 Metacarta, Inc. Systems and methods for predictive models using geographic text search
US8484222B1 (en) 2006-12-01 2013-07-09 Google Inc. Method and apparatus for identifying a standalone location
US8688368B2 (en) * 2007-04-09 2014-04-01 Microsoft Corporation Image-based localization for addresses
WO2008128133A1 (en) * 2007-04-13 2008-10-23 Pelago, Inc. Location-based information determination
US20080270375A1 (en) * 2007-04-27 2008-10-30 France Telecom Local news search engine
IES20070382A2 (en) * 2007-05-28 2008-10-29 Chad Gilmer A method and apparatus for providing an on-line directory service
US8880583B2 (en) * 2007-06-08 2014-11-04 Nixle, Llc System and method for permitting geographically-pertinent information to be ranked by users according to users' geographic proximity to information and to each other for affecting the ranking of such information
US8060535B2 (en) * 2007-08-08 2011-11-15 Siemens Enterprise Communications, Inc. Method and apparatus for information and document management
CN101661461B (zh) * 2008-08-29 2016-01-13 阿里巴巴集团控股有限公司 确定文档中核心地理信息的方法、系统
EP2194466A1 (de) 2008-11-28 2010-06-09 SEARCHTEQ GmbH Verfahren und Vorrichtung zum Indexieren von Daten in einer Suchmaschine oder einer Datenbank für eine geschwindigkeitsoptimierte radiusabhängige Umkreissuche
US20100250562A1 (en) * 2009-03-24 2010-09-30 Mireo d.o.o. Recognition of addresses from the body of arbitrary text
US8521680B2 (en) * 2009-07-31 2013-08-27 Microsoft Corporation Inferring user-specific location semantics from user data
AU2010282212B2 (en) 2009-08-11 2016-08-04 Someones Group Intellectual Property Holdings Pty Ltd Navigating a network of options
US9563850B2 (en) * 2010-01-13 2017-02-07 Yahoo! Inc. Method and interface for displaying locations associated with annotations
US8898173B1 (en) * 2010-05-14 2014-11-25 Google Inc. Ranking location search results based on multiple distance measures
CN102456046B (zh) * 2010-10-25 2015-05-20 国际商业机器公司 对文档中的地理位置数据进行处理的方法和系统
US20120116872A1 (en) 2010-11-05 2012-05-10 At&T Intellectual Property I, L.P. Selecting Advertisements from One or More Databases for Sending to a Publisher
US10565610B2 (en) 2010-12-10 2020-02-18 Yellowpages.Com Llc Ranking advertisements selected from one or more databases by georelevance
US8352480B2 (en) * 2010-12-20 2013-01-08 Nokia Corporation Methods, apparatuses and computer program products for converting a geographical database into a map tile database
US8930391B2 (en) 2010-12-29 2015-01-06 Microsoft Corporation Progressive spatial searching using augmented structures
US8949277B1 (en) * 2010-12-30 2015-02-03 Google Inc. Semantic geotokens
WO2012117103A2 (en) * 2011-03-03 2012-09-07 Nhumi Technologies Ag System and method to index and query data from a 3d model
JP5639549B2 (ja) * 2011-08-22 2014-12-10 日本電信電話株式会社 情報検索装置及び方法及びプログラム
US8666989B1 (en) * 2011-12-02 2014-03-04 Google Inc. Adaptive distributed indexing of local adverts
US9706352B2 (en) * 2012-01-06 2017-07-11 Google Inc. System and method for determining a boundary of a geographic area
US8958817B1 (en) 2012-01-19 2015-02-17 Google Inc. Weighted-distance spatial indexing
JP5801243B2 (ja) * 2012-04-05 2015-10-28 日本電信電話株式会社 特徴キーワード推薦装置及び方法及びプログラム
WO2014003735A1 (en) * 2012-06-27 2014-01-03 Empire Technology Development Llc Determining reliability of online post
US10831725B2 (en) 2013-03-15 2020-11-10 Factual, Inc. Apparatus, systems, and methods for grouping data records
GB201306937D0 (en) * 2013-04-17 2013-05-29 Tomtom Int Bv Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
US9542377B2 (en) * 2013-05-06 2017-01-10 Dropbox, Inc. Note browser
US9407767B2 (en) 2013-07-31 2016-08-02 Yp Llc Systems and methods for tracking calls responsive to advertisements using back channel messaging and data channel communications
US8812647B1 (en) 2014-04-03 2014-08-19 Yp Intellectual Property Llc Centralized publisher management
US11138243B2 (en) * 2014-03-06 2021-10-05 International Business Machines Corporation Indexing geographic data
CN106156195B (zh) * 2015-04-20 2019-06-18 阿里巴巴集团控股有限公司 基于位置信息的搜索方法及其系统
US10469246B2 (en) 2016-02-29 2019-11-05 Craxel, Inc. Efficient encrypted data management system and method
US11140128B2 (en) * 2018-10-05 2021-10-05 Palo Alto Research Center Incorporated Hierarchical geographic naming associated to a recursively subdivided geographic grid referencing
US11669411B2 (en) 2020-12-06 2023-06-06 Oracle International Corporation Efficient pluggable database recovery with redo filtering in a consolidated database
CN113916197B (zh) * 2021-09-08 2023-08-25 中国科学院国家天文台 一种天球观测面积的预估方法及天球观测系统
WO2023140966A1 (en) 2022-01-18 2023-07-27 Craxel, Inc. Organizing information using hierarchical data spaces
US11740788B2 (en) 2022-01-18 2023-08-29 Craxel, Inc. Composite operations using multiple hierarchical data spaces

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040139049A1 (en) * 1996-08-22 2004-07-15 Wgrs Licensing Company, Llc Unified geographic database and method of creating, maintaining and using the same
US7197500B1 (en) * 1996-10-25 2007-03-27 Navteq North America, Llc System and method for use and storage of geographic data on physical media
US5968109A (en) * 1996-10-25 1999-10-19 Navigation Technologies Corporation System and method for use and storage of geographic data on physical media
US5893093A (en) * 1997-07-02 1999-04-06 The Sabre Group, Inc. Information search and retrieval with geographical coordinates
US6026398A (en) * 1997-10-16 2000-02-15 Imarket, Incorporated System and methods for searching and matching databases
US6363392B1 (en) 1998-10-16 2002-03-26 Vicinity Corporation Method and system for providing a web-sharable personal database
US6701307B2 (en) * 1998-10-28 2004-03-02 Microsoft Corporation Method and apparatus of expanding web searching capabilities
JP2000250842A (ja) 1999-03-02 2000-09-14 Mitsubishi Electric Corp 情報検索システムおよび情報検索方法
JP2000293099A (ja) 1999-04-09 2000-10-20 Toyota Motor Corp 地図データベース
EP1072987A1 (en) 1999-07-29 2001-01-31 International Business Machines Corporation Geographic web browser and iconic hyperlink cartography
JP2001184359A (ja) 1999-12-24 2001-07-06 Sumitomo Denko Systems Kk 地図検索装置、地図検索方法及び地図検索制御プログラムを記録した記録媒体
JP2001216320A (ja) 2000-02-03 2001-08-10 Forseti Llc インターネットによるサービス提供エリア検索システム
JP2001331501A (ja) 2000-05-22 2001-11-30 Minolta Co Ltd ショップ検索システム、ショップ検索方法および表示制御方法
FI112308B (fi) * 2000-09-14 2003-11-14 Nokia Corp Protokollan käsittelyn jakaminen
US6954764B2 (en) * 2000-09-25 2005-10-11 Oracle International Corp. Region modeling of mobile services
US7685224B2 (en) * 2001-01-11 2010-03-23 Truelocal Inc. Method for providing an attribute bounded network of computers
CA2335445A1 (en) 2001-02-09 2002-08-09 Lasoo Inc. Internet search tool using geographically selective features
WO2002065337A1 (en) * 2001-02-12 2002-08-22 Dxs Limited Information repository
JP2002236732A (ja) 2001-02-13 2002-08-23 Intec Inc 宅配仲介システム
JP2002312367A (ja) 2001-04-12 2002-10-25 Js4 Kk 駐車場情報提供サーバおよびそれを用いた駐車場情報提供システム
US20020156779A1 (en) * 2001-09-28 2002-10-24 Elliott Margaret E. Internet search engine
JP2003242151A (ja) 2002-02-13 2003-08-29 Mitsubishi Electric Corp 地点情報検索方法及び装置
WO2003079229A1 (fr) 2002-03-15 2003-09-25 Fujitsu Limited Procédé et dispositif de recherche d'informations de régions
US6694323B2 (en) * 2002-04-25 2004-02-17 Sybase, Inc. System and methodology for providing compact B-Tree
US6993538B2 (en) * 2003-01-28 2006-01-31 Microsoft Corporation System and process for identifying objects and/or points nearby a given object or point
JP3860797B2 (ja) 2003-02-19 2006-12-20 株式会社エヌ・ティ・ティ・ドコモ 情報提供サーバ
JP2004280659A (ja) 2003-03-18 2004-10-07 Kddi Corp 住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置
CA2436312C (en) * 2003-08-01 2011-04-05 Perry Peterson Close-packed, uniformly adjacent, multiresolutional, overlapping spatial data ordering
US7454428B2 (en) * 2003-10-29 2008-11-18 Oracle International Corp. Network data model for relational database management system
US7155336B2 (en) * 2004-03-24 2006-12-26 A9.Com, Inc. System and method for automatically collecting images of objects at geographic locations and displaying same in online directories
US7231405B2 (en) * 2004-05-08 2007-06-12 Doug Norman, Interchange Corp. Method and apparatus of indexing web pages of a web site for geographical searchine based on user location
WO2005114484A1 (en) * 2004-05-19 2005-12-01 Metacarta, Inc. Systems and methods of geographical text indexing
US20060041375A1 (en) * 2004-08-19 2006-02-23 Geographic Data Technology, Inc. Automated georeferencing of digitized map images
US7801897B2 (en) * 2004-12-30 2010-09-21 Google Inc. Indexing documents according to geographical relevance

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112204340A (zh) * 2018-03-06 2021-01-08 南俄勒冈大学 使用离散全球网格系统进行位置表示的系统和方法
US11536853B2 (en) 2018-03-06 2022-12-27 Southern Oregon University Systems and methods for location representation using a discrete global grid system
CN115269500A (zh) * 2022-08-01 2022-11-01 生态环境部卫星环境应用中心 生态环境数据的存储方法、检索方法及电子设备

Also Published As

Publication number Publication date
CA2593420A1 (en) 2006-07-13
KR20070092758A (ko) 2007-09-13
US9189496B2 (en) 2015-11-17
US20100250552A1 (en) 2010-09-30
KR100935628B1 (ko) 2010-01-07
EP1839212A1 (en) 2007-10-03
JP5296147B2 (ja) 2013-09-25
KR20090100458A (ko) 2009-09-23
JP2011238248A (ja) 2011-11-24
WO2006074054A1 (en) 2006-07-13
JP2008527503A (ja) 2008-07-24
US20060149774A1 (en) 2006-07-06
US7801897B2 (en) 2010-09-21

Similar Documents

Publication Publication Date Title
CN101128823A (zh) 根据地理关联索引文档
CN101128824B (zh) 位置提取
CN101223526B (zh) 基于位置重要性对本地搜索结果评分
CN106599278B (zh) 应用搜索意图的识别方法及装置
Sharma et al. A comparative analysis of web page ranking algorithms
CA2628930C (en) System and method for information retrieval from object collections with complex interrelationships
CN101128822A (zh) 权威性文档识别
CN102687138A (zh) 搜索建议聚类和呈现
Satpal et al. Web information extraction using markov logic networks
CN104216942A (zh) 查询建议模板
CN103339624A (zh) 支持地理结构数据的交互式模糊搜索的高效前缀搜索算法
CN101228524A (zh) 将地图浏览有关的边界用于企业位置搜索
Ashokkumar et al. Intelligent optimal route recommendation among heterogeneous objects with keywords
CN105183733A (zh) 一种文本信息的匹配、业务对象的推送方法和装置
US20120011463A1 (en) Method and System for Enabling Location Entry
CN101165688A (zh) 知识系统中资源之间的时间关联方法和系统
CN104123366A (zh) 一种搜索方法及搜索服务器
CN107710201A (zh) 存储数据和从位向量搜索索引取回数据
JP2012533819A (ja) 文書インデックス化およびデータクエリングのための方法およびシステム
CN107851108A (zh) 使用位向量搜索索引的匹配文档
CN109992590B (zh) 交通网络中带数字属性的近似空间关键字查询方法及系统
CN108475266A (zh) 用来移除匹配文档的匹配修复
CN102254025A (zh) 信息回忆检索方法
Lee et al. Research Trend Analysis for Sustainable QR code use-Focus on Big Data Analysis.
Zhang et al. An automatic approach to extracting geographic information from Internet

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20080220