CN101529372B - 计算机实现的确定关于企业的信息的方法和计算机系统 - Google Patents

计算机实现的确定关于企业的信息的方法和计算机系统 Download PDF

Info

Publication number
CN101529372B
CN101529372B CN2007800386683A CN200780038668A CN101529372B CN 101529372 B CN101529372 B CN 101529372B CN 2007800386683 A CN2007800386683 A CN 2007800386683A CN 200780038668 A CN200780038668 A CN 200780038668A CN 101529372 B CN101529372 B CN 101529372B
Authority
CN
China
Prior art keywords
information
enterprise
fragment
lacks
street
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007800386683A
Other languages
English (en)
Other versions
CN101529372A (zh
Inventor
钱江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN101529372A publication Critical patent/CN101529372A/zh
Application granted granted Critical
Publication of CN101529372B publication Critical patent/CN101529372B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Abstract

本地搜索服务器从客户端接收对关于企业的信息的查询。本地搜索服务器在本地信息数据库中搜索关于企业的信息并且向请求该信息的客户端报告关于企业的信息。有时,数据库缺少完整的企业信息。例如,数据库可能缺少企业的街道门牌号。本地搜索服务器通过与搜索引擎接口连接并且搜索所库存关于企业的文档来获得缺少的信息。本地搜索服务器接收来自文档的文本片段。本地搜索服务器对文本片段应用一个或更多试探以确定缺少的信息。缺少的信息被保存在本地信息数据库中。

Description

计算机实现的确定关于企业的信息的方法和计算机系统
相关申请引用
本专利要求关于2006年9月8日申请的美国临时申请60/825,088以及2007年5月22日申请的美国实用新型专利申请11/752,191的优先权,在此通过引用包含其内容。 
技术领域
本发明一般地涉及计算机化的信息检索,并且特别地涉及用于提供关于在特定地理区域内的企业和其他实体的信息的系统。
背景技术
本地搜索服务允许用户搜索她或他的本地地理区域内的企业。经常地,用户将提供描述企业名称或类型的搜索查询。作为响应,本地搜索服务返回匹配搜索查询的一个或更多企业的列表。本地搜索服务也返回关于匹配企业的其他信息,如地址和显示其位置的地图。本地搜索服务使用地理编码过程生成地图。地理编码过程接受描述位置的输入字符串,并且返回该位置的纬度和经度。
在一些地理区域,如中国农村,地址信息难以获得。企业登记数据(例如“黄页”数据)可以从商业数据供应商获得,但是这些数据往往缺少街道门牌号和/或其他信息。因此,本地搜索服务难以响应于搜索查询提供完整地址和地图。
在一个本地搜索服务中,当要进行地理编码的地址包括街道但是缺少街道门牌号时,地理编码过程计算街道的中点并且返回中点的纬度和经度。随后本地搜索服务显示出显示街道中点的地图。然而,对于长街道该技术存在误导,因为中点实际上可能离地图上应该显示的企业有很远的距离。
相应地,现有技术需要更有效的方法来确定企业和其他实体的完整地址信息。
发明内容
通过一种用于确定关于企业的信息的方法、系统和计算机程序产品满足上述和其他需要。该方法的一个实施例包括接收关于企业的信息的查询,并且识别本地信息数据库中缺少的关于企业的信息。该方法从由文档库所库存的并且包含关于企业的信息的文档获得文本片段。该方法进一步分析片段以确定本地信息数据库中缺少的关于企业的信息。
系统和计算机程序产品的实施例包括查询模块,用于接收关于企业的信息的查询,以及本地搜索模块,用于与本地信息数据库接口连接并且识别数据库中缺少的关于企业的信息。系统和计算机程序产品进一步包括搜索引擎接口模块,用于从由文档库所库存的并且包含关于企业的信息的文档获得文本片段,以及片段分析模块,用于分析片段以确定本地信息数据库中缺少的关于企业的信息。
附图说明
图1是根据本发明一个实施例的计算环境的高级方框图。
图2是一个高级方框图,示出了根据一个实施例用作如图1的环境中示出的客户端、本地搜索服务器、数据供应商和/或文档库的典型计算机的功能性视图。
图3是示出根据一个实施例在本地搜索服务器内的模块的高级方框图。
图4是示出根据一个实施例由地址完成模块执行的步骤的流程图。
图5是示出根据一个实施例由本地搜索服务器在响应于用户查询时执行的步骤的流程图。
附图仅为阐释的目的示出本发明一个实施例。本领域的普通技术人员将从以下描述理解:在不背离本文所描述的本发明原则的前提下,可以采用本文所示结构和方法的替代实施例。
具体实施方式
I.概述
图1是根据本发明一个实施例的计算环境100的高级方框图。图1示出连接到网络114的客户端110和本地搜索服务器112。数据供应商116和文档库118也连接到网络114。尽管图1仅示出单一的客户端110,实施例可以具有数千或数百万与服务器交互的客户端。同样,在网络114上可以有数千或数百万文档库118。也可以有多个数据供应商116和/或本地搜索服务器112。为了使本说明书简单清楚,每种实体仅示出一个。
客户端110表示为了执行本地信息搜索并且作为响应而获得信息,由最终用户使用的经由网络114与服务器112接口连接的装置。在一个实施例中,客户端110是具有标准联网功能性的计算机。在一些实施例中,客户端110是移动设备如便携式计算机、移动电话、个人数字助理(PDA)、便携式电子邮件设备、手持式游戏设备、汽车导航系统或具有等效功能性的其他类型设备。客户端110使用标准联网技术与服务器112通信,包括使用计算机和/或移动电话通信协议的有线和/或无线网络链路。
客户端110包括用于向服务器112提交请求并且用于向最终用户提供所接收的信息的功能性。在一些实施例中,客户端110包括用于输入请求的键盘以及用于查看信息的显示设备。在其他实施例中,客户端110包括用于执行这些任务的另外的和/或不同的功能性,如基于触摸屏的输入设备和/或音频输出设备。
在一个实施例中,客户端110包括允许其使用标准因特网通信技术与服务器112交换消息的web浏览功能性。例如,客户端110可以执行web浏览器如MICROSOFT INTERNET 
Figure G2007800386683D00031
为移动设备优化的浏览器如OPERA MOBILETM和OPERA MINITM,以及/或者允许最终用户检索并且显示来自web服务器和网络114上其他计算机系统的内容的另外的浏览器。
数据供应商116包括由商业数据供应商或其他类似实体操作的服务 器计算机。在一个实施例中,数据供应商116向本地搜索服务器112提供关于在特定地理区域内的企业和其他实体的登记数据(例如“黄页”数据)。登记数据可以包括一些企业的完整地址和其他企业的部分地址。
文档库118存储可以经由网络114访问的电子文档。文档包括任何机器可读数据,其包括文本、图形、多媒体内容等的任何组合。文档可以用标记语言如超文本标记语言(HTML)即web页面编码,用解释语言(例如JavaScript)或任何其他计算机可读或可执行格式编码。由文档库118存储的文档典型地由统一资源定位符(URL)或任何其他适当形式的标识和/或位置标识。在一个实施例中,文档库118是由网络服务器操作的网络站点。图1示出的单一文档库118表示可经由网络114访问的大量网络站点和网页。
本地搜索服务器112从客户端110接收查询并且作为响应提供信息。在一个实施例中,查询针对在特定地理区域内的企业的信息。本地搜索服务器112向客户端110提供满足该查询的关于企业的信息。关于企业的信息可以包括,例如,地址或其他位置信息、营业时间、电话号码、对企业的编辑评论、用户提交的企业评级等。另外,本地搜索服务器112的一个实施例向客户端提供显示企业位置的地图。
有时,本地搜索服务器112缺少企业的完整地址信息。服务器112可以具有其从数据供应商116获得的一般地址信息,如企业名称及其城市、城区和街道,但是缺少具体的街道地址(门牌号)或确定企业准确位置并在地图上显示企业所需的其他数据。本地搜索服务器112识别其缺少完整地址数据的企业并且尝试确定企业的完整地址。本地搜索服务器112的一个实施例分析存储在文档库118上的文档以确定企业的完整地址。该分析可以独立于任何从客户端110接收的请求而执行。例如,在使本地搜索服务器112上的信息对于客户端可用之前,作为预处理步骤而执行分析。一旦确定企业的完整地址,本地搜索服务器112存储该地址并且响应于客户端的请求而提供该地址。
本文使用的术语“企业”包括商业和非商业实体,包括传统地不被认为是企业的实体如学校、图书馆、医院等。为简单清楚起见,在文中 所有这些实体都被称为“企业”。类似地,本文使用了术语“本地”,因为本地搜索服务器112接收的查询经常限于特定的地理区域如街区、城区、城市、州、省和/或国家。然而,对于最终用户而言查询不需要是“本地的”并且可以跨越一个或更多地理区域。
网络114表示客户端110、本地搜索服务器112、文档库118和数据供应商116之间的通信通道。在一个实施例中,网络114是因特网。网络114也可以使用不一定是因特网的部分的专用或私有通信链路。在一个实施例中,网络114使用标准通信技术和/或协议。这样,网络114可以包括使用如以太网、802.11、综合业务数字网(ISDN)、数字用户线(DSL)、异步转移模式(ATM)等技术的链路,以及使用移动电话通信技术的链路。类似地,网络114上使用的网络协议可以包括多协议标签交换(MPLS)、传输控制协议/网际协议(TCP/IP)、超文本传输协议(HTTP)、简单邮件传输协议(SMTP)、文件传输协议(FTP)、短消息服务(SMS)协议等。通过网络114交换的数据可以使用包括HTML、可扩展标记语言(XML)、可扩展超文本标记语言(XHTML)、压缩HTML(cHTML)等的技术和/或格式表示。另外,所有或一些链路可以使用如加密套接字协议层(SSL)、通过SSL的HTTP(HTTPS)和/或虚拟专用网(VPN)的传统加密技术加密。在其他实施例中,另外地或替代上述内容,客户端110和路由服务器112使用定制和/或专用数据通信技术。
II.系统体系结构
图2是一个高级方框图,示出根据一个实施例用作如图1的环境100中示出的客户端110、本地搜索服务器112、数据供应商116和/或文档库118的典型计算机200的功能性视图。示出了连接到总线204的至少一个处理器202。连接到总线204的还有内存206,存储设备208,键盘210,图形适配器212,指示设备214和网络适配器216。显示器218连接到图形适配器212。
处理器202可以是任何一种通用处理器,如INTELx86兼容的CPU。 在一个实施例中,存储设备208是硬盘驱动器,但是也可以是能够存储数据的任何其他设备,如可写光盘(CD)或DVD,或固态存储设备。内存206可以是,例如,固件、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)和/或RAM,并且保存由处理器202使用的指令和数据。指示设备214可以是鼠标、追踪球或其他类型的指示设备,并且与键盘210联合使用以向计算机系统200输入数据。图形适配器212在显示器218上显示图像和其他信息。网络适配器216将计算机200连接到网络114。
如现有技术已知的,计算机200适于执行计算机程序模块。本文使用的术语“模块”指用于提供特定功能性的计算机程序逻辑和/或数据。模块可以以硬件、固件和/或软件实现。在一个实施例中,模块形成计算机程序产品并被存储在诸如存储设备208的计算机可读存储介质上,被载入内存206,并且由处理器202执行。
图1的实体所使用的计算机200的类型可以根据实施例和实体所采用的处理功率而不同。例如,客户端110典型地比本地搜索服务器112需要的处理功率更少。这样,客户端110可以是标准个人计算机系统或手持式电子设备。相比而言,本地搜索服务器112可以包括功率更强大的计算机和/或共同工作的多台计算机以提供本文所描述的功能性。同样,计算机200可以缺少上述的一些组件。例如,作为客户端110的移动电话可以缺少指示设备,并且作为本地搜索服务器112的计算机可以缺少键盘和显示器。
图3是示出根据一个实施例在本地搜索服务器112内的模块的高级方框图。其他实施例具有与图3所示相比不同的和/或另外的模块。而且,其他实施例以不同的方式在模块间分配功能性。
本地信息数据库310存储关于在一个或更多地理区域内的企业的信息。信息可以包括,例如,完全的名称、完整的地址和企业的电话号码。另外,信息可以包括到企业的web页面以及关于企业的其他页面的链接、最终用户提供的评级和评论、营业时间、接受的支付形式、照片、菜单、是否有停车位等。
查询模块311从客户端110和/或另一个实体接收搜索查询。在一个 实施例中,查询描述需要其信息的企业的名称和/或类型。查询也可以规定其他搜索参数,如搜索所限定的地理区域,企业的部分地址等。查询模块311的一个实施例采用传统的解析技术以解析查询,提取搜索词,并且将词的特征确定为可能的企业名称、地理区域和/或其他识别符。本地搜索模块312在本地信息数据库310上执行对客户端查询所请求信息的查询并且作为响应接收满足查询的一个或更多企业的列表,还有关于于企业的另外的信息。
报告模块313向客户端110的最终用户报告关于企业的信息。在一个实施例中,报告模块313报告由本地搜索模块312从本地信息数据库310检索到的关于企业的信息。例如,由报告模块313生成的报告可以包括列出满足由查询模块311接收的搜索查询的关于企业的信息的web页面。另外,报告可以包括关于从列出的企业中选择的一个或更多企业的详细信息。
在一个实施例中,来自报告模块313的报告包括显示企业位置的地图。报告模块313的一个实施例使用地理编码模块314将企业地址转化为相应的纬度和经度(和/或其他适于地图显示的表示)。报告模块313生成在纬度/经度上突出显示位置的地图,并且将地图作为报告的部分提供。这样报告模块313在地图上显示企业的准确位置。
如上文所描述,在本地信息数据库310中关于本地企业的信息可能初始地缺少至少一些企业的完整信息。典型地,用于初始地填充数据库310的来自数据供应商116的数据包含较多关于知名企业的信息,以及较少关于较不知名企业的信息(例如部分地址)。在一些地理区域如中国的一些地区,难以从任何数据供应商获得包括街道门牌号的完整地址。这样,本地信息数据库310可能初始地缺少在那些地区的很多企业的完整信息。
地址完成模块316确定在本地信息数据库310中所识别的企业所缺少的地址信息。一般地,地址完成模块316确定企业足够的地址信息,以使企业的位置可以被显示在地图上,允许计算企业的行车路线等等。本文所描述的“完整”地址不需要企业的彻底完全的地址信息。一些信 息可以缺少,如企业在高层建筑中的楼层。
在一个实施例中,地址完成模块316与本地搜索服务器内的与查询相关的模块异步地操作。例如,在数据库响应于查询被使用前,地址完成模块316可以作为向本地信息数据库310中添加地址信息的预处理步骤的部分而操作。类似地,在数据库响应于查询被使用的同时,地址完成模块316可以作为向数据库310添加地址信息的背景过程而操作。在另一个实施例中,地址完成模块316实时执行以确定响应于查询所生成的结果列表中所识别的企业地址信息。
图3示出地址完成模块316内的多个模块。其他实施例具有与图3所示相比不同的和/或另外的模块。而且,其他实施例以不同的方式在模块间分配功能性。在一些实施例中地址完成模块316本身在本地搜索服务器112以外的服务器上执行。例如,地址完成模块316可以在一个或更多其他服务器上执行以更新本地信息数据库310。
搜索引擎接口模块318执行对文档库118的关于描述企业的文档的搜索。在一个实施例中,搜索引擎接口模块318与美国加利福尼亚州芒廷维尤市的谷歌公司提供的搜索引擎接口连接。搜索引擎接口模块318促使搜索引擎搜索包含与企业的已知地址信息(或已知地址信息的子集)匹配的词的文档。搜索引擎返回满足查询的文档的文本片段。这些片段包括文档中的在搜索词附近出现的文本。
在一个实施例中,搜索引擎接口模块318过滤具有不完整地址的企业,以将某些企业排除在地址完成过程之外。地址完成过程不用于某些类型的企业,如停车场。另外,搜索引擎接口模块318对现有地址信息做预处理,以扩展并且/或者优化搜索。在一个实施例中,搜索引擎接口模块318确定是否企业的已知地址信息描述城市内的城区。如果是这样,搜索引擎接口模块318通过包括城市名扩展搜索查询。根据实施例,可以包括城市名而不是城区名,或者城市名可以是另外的查询词。
片段分析模块320分析由搜索引擎接口模块318接收的文档的片段,以识别缺少的企业地址信息。片段分析模块320的一个实施例对片段应用一个或更多的各种试探,以识别缺少的信息。在给定情况中应用 的试探可以取决于如搜索结果所用的语言,所搜索的缺少的地址信息的类型,企业的类型之类的因素,和/或其他因素。
片段分析模块320的一个实施例将片段中的信息标准化为规范格式。如果有多种方式描述街道地址,街道地址被标准化为一种规范格式。例如,在中国,门牌号可以用数字形式,并且用中文字符形式表示。片段分析模块320的一个实施例将这种地址标准化为数字形式。
在分析单独的片段以识别街道名称或地址的其他成分时,片段分析模块320的一个实施例确定企业名称是否在片段中出现在地址之前。只有出现在企业名称之后的地址被认为是可能的正确地址。
而且,相较于不太精确的信息,片段分析模块320的一个实施例倾向于更精确的信息。例如,如果在一个片段中找到两个匹配街道并且只有第二匹配有门牌号,片段分析模块320将第二匹配街道作为企业地址。相反地,如果单个片段包含精确度相同的两个不同地址(例如,两个不同的街道门牌号),片段分析模块320的一个实施例倾向于片段中出现的第一地址。另外,如果片段包含多个不同地址,片段分析模块320的一个实施例倾向于更频繁出现的地址和/或在片段中比其他地址出现得早的地址。如果有多个具有不一致的地址信息的片段,相较于来自具有其他标题的文档的片段,片段分析模块320的一个实施例倾向于来自具有包括企业名称的标题的文档的片段。类似地,如果片段在地址中包括交叉路口,片段分析模块320的一个实施例倾向于有街道门牌号的街道并且使用该街道和门牌号作为地址。如果片段包括交叉街道但是缺少街道门牌号,片段分析模块320的一个实施例根据交叉街道推断街道门牌号。
地址完成模块316的一个实施例也包括客户端查询模块324。在地址完成模块316接收到查询时实时操作的实施例中,该模块324向客户端110的最终用户查询地址完成信息。有时最终用户知道企业的完整地址。相应地,客户端查询模块324与最终用户交互以获得地址。在一个实施例中,客户端查询模块324向最终用户查询实际街道门牌号或其他地址信息。在另一个实施例中,客户端查询模块324使用另一技术向最 终用户查询,如要求最终用户识别企业临近的交叉街道。例如,客户端查询模块324可以向最终用户提供一系列web页面、弹出窗口和/或其他UI工具以向最终用户查询并且作为响应接收信息。
而且,地址完成模块316的一个实施例包括数据供应商接口模块322用于与一个或更多数据供应商116接口连接以获得缺少的企业地址信息。有时,一个数据供应商116所没有的地址信息,可以从替代的数据供应商116得到。数据供应商接口模块322的一个实施例尝试从一个或多个替代的数据供应商116获得地址信息。
III.过程/例子
图4是示出根据一个实施例由地址完成模块316执行的步骤的流程图。其他实施例执行与图中所示相比另外的和/或不同的步骤。另外,其他实施例以不同的顺序执行步骤并且/或者同时地执行多个步骤。
地址完成模块316接收410不完整的企业地址。例如,可以从本地信息数据库310或数据供应商116接收不完整的地址。地址完成模块316根据企业的类型和/或其他因素过滤412地址信息。现有地址信息可能指示企业是停车场或者没使用地址完成的其他类型企业。因此,地址完成模块316跳过地址处理。
如果处理未被跳过,地址完成模块316根据企业现有地址信息形成查询414。地址完成模块316可以通过添加另外的词如包含在已知地址信息中提及的城区的名称而优化并且/或者扩展查询。地址完成模块316执行查询416以搜索在网络114上的文档库118中包含关于企业的信息的文档。
地址完成模块316分析由搜索引擎返回的文档的片段以确定企业的完整地址。在一个实施例中,该分析涉及解析418片段以识别其中包含的名称、门牌号、街道名称等。另外,片段中的信息如门牌号,被标准化为规范格式。
地址完成模块316的一个实施例选择420在所返回的片段中最频繁出现的地址信息。例如,如果已知地址信息缺少企业的街道地址,地址 完成模块316选择在所返回的片段中最频繁出现的街道门牌号。类似地,一个实施例选择420出现在来自具有最相关标题的文档的片段中的地址信息。例如,如果web页面标题包含搜索其地址信息的企业名称,则该标题/web页面比其他标题/web页面更相关。地址完成模块316因此使用来自更相关页面的地址信息。如果出现在片段中的地址包括街道名称和地址,以及交叉街道名称,地址完成模块316的一个实施例选择422有街道门牌号的街道并且使用其作为地址信息。如果片段包括交叉街道但是缺少街道门牌号,地址完成模块316根据交叉街道推断422街道门牌号。
地址完成模块316存储424从分析本地信息数据库310中的片段而确定的完整地址信息。如果426数据库310有更多不完整企业地址,地址完成模块316处理下一个。否则,过程结束428。
图5是示出根据一个实施例由本地搜索服务器112在响应于用户查询时执行的步骤的流程图。其他实施例执行与图中所示相比另外的和/或不同的步骤。另外,其他实施例以不同的顺序执行步骤并且/或者同时地执行多个步骤。在一个实施例中,本地搜索服务器112同时地服务于数千或数百万客户端110,并且同时地执行步骤的很多个实例。
初始地,本地搜索服务器112从客户端110和/或另一个实体接收510查询。本地搜索服务器112在本地信息数据库310上执行512对与查询匹配的企业的搜索。假设,或者因为从数据供应商116接收了完整信息,或者因为地址完成模块316确定了完整地址,本地信息数据库310包含与查询匹配的企业的完整地址信息。
本地搜索服务器112向地理编码器模块314提供514完整地址,地理编码器模块314随后将地址转换为等效的纬度和经度。本地搜索服务器112使用地理编码器模块314的输出以生成516显示企业位置的地图。服务器112向客户端110报告查询结果,包括地图。
例如,假设本地信息数据库310包含标题为“Wal-Mart”的条目,并且该条目包含地址信息“Freeport Road,Pittsburgh PA”。本地搜索服务器112的一个实施例使用搜索引擎以搜索来自文档库118的具有词 “Wal-Mart”,“Freeport”,“Road”,“Pittsburgh”和“PA”的文档,以确定完整地址。作为响应,搜索引擎返回片段:
Wal-Mart Store 877 Freeport Road,Pittsburgh,PA 15238.Wal-MartSuper Center 250 Summit Park Drive,Pittsburgh,PA 15275.Select from thelistings above
本地搜索服务器112使用试探以解析该片段并且确定“877”是在Freeport Road,Pittsburgh PA的Wal-Mart商场的街道门牌号。响应于来自客户端110的查询,本地搜索服务器112使用地理编码器模块314以生成准确标识商场位置的地图并且将该结果报告给客户端。
在其他实施例中,本文所描述的技术可用于本地搜索以外的目的。例如,该技术可以被用于生成一般事实库的事实,该库存储来自由文档库118提供的文档的信息。另外,该技术可用于获得地址信息以外的信息。
以上描述是为了阐释某些实施例的操作并且不是为了限制本发明的范围。本发明的范围仅受到权利要求书的限制。本领域普通技术人员从上文讨论可以理解很多变形并且其仍被本发明的主旨和范围所包括。

Claims (18)

1.一种计算机实现的确定关于企业的信息的方法,包括:
识别本地信息数据库中缺少的关于所述企业的信息;
从由文档库所库存的多个文档中获得文本片段,每个片段包含根据关于所述企业的信息确定的搜索词,以及在所述搜索词附近出现的文档部分;
分析所述片段以确定缺少的关于所述企业的信息;并且
将所确定的信息存储在所述本地信息数据库中。
2.根据权利要求1的方法,其中所述缺少的信息是所述企业的街道门牌号。
3.根据权利要求1的方法,其中所述本地信息数据库包括描述所述企业所在城市城区的已知信息,并且其中获得文本片段包括:
搜索包含具有所述企业所在城区的城市的名称的文档。
4.根据权利要求1的方法,其中分析所述片段包括:
确定文档是否在其标题中包含具有所述企业的名称的片段;以及
响应于肯定的判断结果,从其标题中具有所述企业的名称的文档的片段中获得所述缺少的信息。
5.根据权利要求1的方法,其中所述片段包含按照顺序排列的多个词,所述片段的至少一个词是所述企业的名称,并且其中分析所述片段包括:
从所述片段的在所述排列中位于所述企业名称之后的词中获得所述缺少的信息。
6.根据权利要求1的方法,其中分析所述片段包括:
将所述片段中的信息标准化为规范格式。
7.根据权利要求1的方法,进一步包括:
接收对关于所述企业的信息的查询。
8.根据权利要求7的方法,其中所述对关于所述企业的信息的查询是从客户端接收的,并且进一步包括:
向所述客户端报告所述本地信息数据库中包含的关于所述企业的信息和所确定的缺少的信息。
9.根据权利要求1的方法,其中所述片段包括所述缺少的信息的多个出处,并且其中分析所述片段包括:
识别比所述缺少的信息的其他出处更精确的所述缺少的信息的某个出处;以及
从所述具有更精确信息的所述某个出处中获得所述缺少的信息。
10.根据权利要求1所述的方法,其中所述缺少的信息包括所述企业的街道门牌号,并且其中分析所述片段包括:
识别片段内引用的交叉街道,所述交叉街道包括具有相关联的街道门牌号的第一街道和缺少相关联的街道门牌号的第二街道;以及
选择与所述第一街道相关联的街道门牌号作为所述企业的街道门牌号。
11.根据权利要求1的方法,其中所述缺少的信息包括所述企业的街道的门牌号,并且其中分析所述片段包括:
识别片段内引用的交叉街道;以及
响应于所述交叉街道,推断所述企业的街道门牌号。
12.一种用于确定关于企业的信息的计算机系统,包括
本地搜索装置,用于与本地信息数据库接口连接并且识别所述数据库中缺少的关于所述企业的信息;
搜索引擎接口装置,用于从由文档库所库存的多个文档中获得文本片段,每个片段包含根据关于所述企业的信息确定的搜索词,以及在所述搜索词附近出现的文档部分;
片段分析装置,用于分析所述片段以确定缺少的关于所述企业的信息;以及
完成装置,用于将所确定的信息存储在所述本地信息数据库中。
13.根据权利要求12的计算机系统,其中所述本地信息数据库包括描述所述企业所在城市城区的已知信息,并且其中所述搜索引擎接口装置适于促使搜索引擎搜索包含具有所述企业所在城区的城市的名称的文档。
14.根据权利要求12的计算机系统,其中所述片段分析装置进一步适于:
确定文档是否在其标题中包含具有所述企业的名称的片段;以及
响应于肯定的判断结果,从其标题中具有所述企业的名称的文档的片段中获得所述缺少的信息。
15.根据权利要求12的系统,其中所述片段包含按照顺序排列的多个词,所述片段的至少一个词是所述企业的名称,并且其中所述片段分析装置进一步适于:
从所述片段的在所述排列中位于所述企业名称之后的词中获得所述缺少的信息。
16.根据权利要求12的计算机系统,其中所述片段分析装置进一步适于将所述片段中的信息标准化为规范格式。
17.根据权利要求12的计算机系统,进一步包括:
查询装置,用于接收对关于所述企业的信息的查询。
18.根据权利要求14的计算机系统,其中所述对关于所述企业的信息的查询是从客户端接收的,并且进一步包括:
报告装置,用于向所述客户端报告所述本地信息数据库中包含的关于所述企业的信息和所确定的缺少的信息。
CN2007800386683A 2006-09-08 2007-05-25 计算机实现的确定关于企业的信息的方法和计算机系统 Expired - Fee Related CN101529372B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US82508806P 2006-09-08 2006-09-08
US60/825,088 2006-09-08
US11/752,191 US20080065694A1 (en) 2006-09-08 2007-05-22 Local Search Using Address Completion
US11/752,191 2007-05-22
PCT/US2007/069756 WO2008030644A2 (en) 2006-09-08 2007-05-25 Local search using address completion

Publications (2)

Publication Number Publication Date
CN101529372A CN101529372A (zh) 2009-09-09
CN101529372B true CN101529372B (zh) 2011-07-27

Family

ID=39157915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800386683A Expired - Fee Related CN101529372B (zh) 2006-09-08 2007-05-25 计算机实现的确定关于企业的信息的方法和计算机系统

Country Status (3)

Country Link
US (1) US20080065694A1 (zh)
CN (1) CN101529372B (zh)
WO (1) WO2008030644A2 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0619558A2 (pt) * 2005-12-07 2011-10-04 Networks In Motion Inc dispositivo eletrÈnico portátil e método para apresentar informações
US20080065605A1 (en) * 2006-09-08 2008-03-13 Group 1 Software Inc. Rich browser-based interface for address standardization and geocoding
US20090106681A1 (en) * 2007-10-19 2009-04-23 Abhinav Gupta Method and apparatus for geographic specific search results including a map-based display
US7991664B1 (en) * 2008-01-17 2011-08-02 Intuit Inc. Method and system for mapping business transactions
US9177068B2 (en) * 2008-08-05 2015-11-03 Yellowpages.Com Llc Systems and methods to facilitate search of business entities
US8306973B2 (en) * 2009-04-06 2012-11-06 Google Inc. Method for generating location targeted, keyword-triggered, ads and generating user recallable layer-based ads
US8255379B2 (en) 2009-11-10 2012-08-28 Microsoft Corporation Custom local search
CN103136247B (zh) 2011-11-29 2015-12-02 阿里巴巴集团控股有限公司 属性数据区间划分方法及装置
US9390174B2 (en) 2012-08-08 2016-07-12 Google Inc. Search result ranking and presentation
US9222777B2 (en) 2012-09-07 2015-12-29 The United States Post Office Methods and systems for creating and using a location identification grid
US20150134483A1 (en) * 2013-11-14 2015-05-14 Richard Barenblatt System and methods for property mortgage matching and coordination
US11562040B2 (en) * 2014-09-25 2023-01-24 United States Postal Service Methods and systems for creating and using a location identification grid
US10210215B2 (en) 2015-04-29 2019-02-19 Ebay Inc. Enhancing search queries using user implicit data
TWI659369B (zh) * 2017-07-12 2019-05-11 金腦數位股份有限公司 訊息處理裝置
CN109710628B (zh) * 2018-12-29 2023-12-26 深圳巨湾科技有限公司 信息处理方法及装置、系统、计算机及可读存储介质
CN111538914B (zh) * 2019-02-01 2023-05-30 阿里巴巴集团控股有限公司 地址信息的处理方法和装置
CN110502696A (zh) * 2019-08-05 2019-11-26 上海掌门科技有限公司 一种信息流分发的方法与设备
KR102597616B1 (ko) * 2021-07-23 2023-11-02 주식회사 에스투더블유 전자 상거래에서의 이상 거래 탐지를 위한 클러스터링 방법 및 시스템
CN115858418B (zh) * 2023-02-09 2023-05-05 成都有为财商教育科技有限公司 一种数据缓存的方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1363069A (zh) * 1999-05-20 2002-08-07 伊夫色什有限公司 信息管理、检索和显示系统以及相关方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5210868A (en) * 1989-12-20 1993-05-11 Hitachi Ltd. Database system and matching method between databases
US7376636B1 (en) * 2002-06-07 2008-05-20 Oracle International Corporation Geocoding using a relational database
US20050149507A1 (en) * 2003-02-05 2005-07-07 Nye Timothy G. Systems and methods for identifying an internet resource address
US7373244B2 (en) * 2004-04-20 2008-05-13 Keith Kreft Information mapping approaches
US20060149800A1 (en) * 2004-12-30 2006-07-06 Daniel Egnor Authoritative document identification

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1363069A (zh) * 1999-05-20 2002-08-07 伊夫色什有限公司 信息管理、检索和显示系统以及相关方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Lin et al..SERGEANT:A Fremework for Building More Flexible Web Agents by Exploiting a Search Engine.《Web Inteligence and Agent System》.2005,第3卷(第1期),1-15. *

Also Published As

Publication number Publication date
US20080065694A1 (en) 2008-03-13
WO2008030644A3 (en) 2008-12-04
CN101529372A (zh) 2009-09-09
WO2008030644A2 (en) 2008-03-13

Similar Documents

Publication Publication Date Title
CN101529372B (zh) 计算机实现的确定关于企业的信息的方法和计算机系统
CN110008300B (zh) Poi别名的确定方法、装置、计算机设备和存储介质
JP5856618B2 (ja) 地理空間データベース統合方法、およびデバイス
CN103004102B (zh) 地理定位系统及方法
JP4199671B2 (ja) 地域情報検索方法及び地域情報検索装置
CN1766880B (zh) 用于提供地理搜索功能的系统和方法
US7650329B2 (en) Method and system for generating a search result list based on local information
CN101452453B (zh) 一种输入法网址导航的方法和一种输入法系统
CN110019616B (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
WO2009061399A1 (en) Method for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
JP5291751B2 (ja) 曖昧な場所に基づくルーティング情報提供
JP4950508B2 (ja) 施設情報管理システム、施設情報管理装置、施設情報管理方法および施設情報管理プログラム
US20100114854A1 (en) Map-based websites searching method and apparatus therefor
JP2006318373A (ja) タスク選択支援サーバ、及び、タスク選択支援方法
JP2009531773A (ja) ウェブリソースのサービスエリアの検出
KR102073983B1 (ko) 전자지도 기반 인테리어 시공사례 광고 서비스 방법 및 그 시스템
US20090276398A1 (en) Search server
JP2007323394A (ja) メタ検索システム及びメタ検索方法とこれに用いるユーザ端末及びプログラム
US8060535B2 (en) Method and apparatus for information and document management
US20020099533A1 (en) Data processing system for searching and communication
KR101248186B1 (ko) 검색 결과 페이지에서 개별 컨텐츠를 이용하여 블로그를 생성하는 검색 시스템 및 검색 방법
JP2010511249A (ja) アグリゲーション・シンジケーション・プラットフォーム
CN101145936A (zh) 一种在Web页面中添加标签的方法及其系统
KR100465246B1 (ko) 키워드 검색방식에 의한 전자지도 검색과 검색엔진이 채용된 업종 등 지역생활정보 제공방법
KR101352259B1 (ko) 일반 pc 및 모바일 단말을 위한 광고 제공 방법 및 그 방법을 지원하기 위한 모바일 광고 데이터베이스 구축 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110727

Termination date: 20150525

EXPY Termination of patent right or utility model