CN101019119B - 基于名称的url输入 - Google Patents

基于名称的url输入 Download PDF

Info

Publication number
CN101019119B
CN101019119B CN2005800306694A CN200580030669A CN101019119B CN 101019119 B CN101019119 B CN 101019119B CN 2005800306694 A CN2005800306694 A CN 2005800306694A CN 200580030669 A CN200580030669 A CN 200580030669A CN 101019119 B CN101019119 B CN 101019119B
Authority
CN
China
Prior art keywords
document
search results
user
relevant
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005800306694A
Other languages
English (en)
Other versions
CN101019119A (zh
Inventor
约翰·皮斯特罗
王学福
西蒙·佟
布瑞恩·哈甘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN101019119A publication Critical patent/CN101019119A/zh
Application granted granted Critical
Publication of CN101019119B publication Critical patent/CN101019119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

允许用户输入将描述特定网站的自然语言词语输入到浏览器的地址字段中来代替常规的URL的方法和系统。这些词语被评估以确定它们是否以较高的似然度对应于特定的网站。如果是这样的话,则可以立即访问该网站。如果不是,则可以由浏览器显示基于这些词语的搜索结果列表。

Description

基于名称的URL输入
技术领域
与本发明的原则一致的方案整体上涉及文档浏览和搜索,更具体地说,涉及使用搜索引擎来辅助文档浏览。
背景技术
万维网(World Wide Web,“web”)包含大量的信息。然而,定位这些信息中所需的部分信息可能是具有挑战性的。由于万维网上的信息量以及对于网络搜索缺乏经验的新用户数量快速增加,该问题变得更加复杂。
当在网上进行导航时,用户经常键入指向他们希望访问的特定网络文件的统一资源定位符(URL,Uniform Resource Locator)。URL通常必须以对应于所述网络文件的精确预定义字符串被输入。这对用户来说可能是很不方便且难以使用的。
发明内容
一方面是一种显示与搜索结果相关的第一文档的方法,所述方法包括:接收一个或多个词语;基于所述词语开始搜索,以得到搜索结果及相应的相关性评分;基于所述搜索结果中的一个文档是否与比和搜索结果相关的下一个最高的相关性评分高出一个特定的差值的相关性评分相关联,确定是否将所述搜索结果中的文档归类为非常相关的文档;当确定所述搜索结果包含所述非常相关的文档时,显示所述非常相关的文档;以及当确定所述搜索结果不包含所述非常相关的文档时,显示指向对应于所述搜索结果的多个文档的链接。
另一方面所涉及的是一种返回用户试图访问的特定文档的方法,所述方法包括:从用户接收搜索请求;基于所述搜索请求执行对网络文档的数据库的搜索,以得到搜索结果;根据网络文档的位置在所述搜索结果的定级列表中是否是第一来确定所述搜索结果是否包含用户试图访问的特定文档,该特定文档的观测到的历史点击通过率比点击通过率门限更高,并具有比搜索结果中相关性评分次高的搜索结果的相关性评分更高的相关性评分;当确定所述搜索结果包含用户试图访问的特定文档时,将指向所述特定文档的链接返回给所述用户,以立即显示所述特定文档给所述用户;当确定所述搜索结果不包含用户试图访问的特定文档时,返回多个相关文档链接以显示给所述用户。
另一方面涉及一种用于显示相关结果的设备,所述设备包括:用于由浏览器接收一个或多个词语的装置;用于基于所述词语开始搜索以得到搜索结果的装置;用于当所述搜索结果包含相关结果时,显示对应于所述相关结果的文档的装置,其中根据与搜索结果中的一个文档相关的历史点击通过率是否比搜索结果中的其它文档的历史点击通过率高一个门限量而将该文档识别为相关的;以及用于当所述搜索结果不包含相关结果时,显示对应于指向所述搜索结果的多个文档的链接的装置。
另一方面涉及一种显示与搜索结果相关的第一文档的方法,所述方法包括:经由浏览器的地址栏接收一个或多个词语;确定所述被接收的词语是否代表有效的统一资源定位符;当所述词语代表有效的统一资源定位符时,获取对应于所述词语的文档;当所述词语不代表有效的统一资源定位符时,基于所述词语开始搜索以得到搜索结果;当所述搜索结果包含第一文档时,显示对应于指向第一文档的链接的视觉线索,其中根据第一文档的相关性评分比搜索结果中的所有其它文档的相关性评分均高出一个门限量来识别所述第一文档;以及当所述搜索结果中不包含第一文档时,显示指向对应于所述搜索结果的多个文档的链接。
附图说明
附图被并入并构成了本说明书的一部分,对本发明进行了描述,并且与说明书一起解释了本发明。在附图中,
图1是示出了一个示例性系统的示图,其中与本发明一致的构思可以被实现;
图2是示出了一个文档的示图,该文档包含了响应搜索请求而显示的指向网络文档的链接;
图3是示出了与本发明的一个方面一致的搜索引擎的操作的流程图;
图4是概念性示出了判断一个文档是否与用户搜索请求非常相关的方框图;
图5是网络浏览器的图形用户界面的示例性示图;
图6A是示出了与本发明的一个方面一致的搜索引擎和客户的操作的流程图;
图6B是示出了用于判断用户输入的词语是否是有效的URL的示例性操作的流程图;以及
图7和8是与网络浏览器相结合的图形用户界面的示例性示图。
具体实施方式
以下对本发明的详细说明参照了附图。这些详细说明并非对本发明进行限制。相反,本发明的保护范围由所附的权利要求及其等价物来限定。
概述
传统上,当在网站上进行导航时,用户可以从事先设定的“书签”列表中选择,或者将URL或其它预定的短语键入到其浏览器的地址栏中。与下述本发明的各个方面一致,用户也可以简单地输入自然语言搜索请求。例如,为了访问IBM或Lands End公司的主页,用户可以简单地输入“ibm”或“lands end”,而不是“www.ibm.com”或“www.landsend.com”。如果能够以可接受的确定性判断出用户想要访问的特定网站,则该用户将被直接指引到该网站。
系统概述
图1是示出了一个示例性系统的示图,其中与本发明一致的构思可以被实现。该系统包括多个客户端设备102、一个服务器设备110和一个网络101,该网络例如可包括互联网。每个客户端设备102分别包括一个如随机访问存储器的计算机可读存储器109,它与处理器108相耦合。客户端设备102也可包括若干附加的外部或内部设备,例如但不限于鼠标、CD-ROM、键盘以及显示器。
通过客户端设备102,用户105可以通过网络101相互通信,并且与连接到网络101的诸如服务器设备110的其它系统和设备通信。
类似客户端设备102,服务器设备110可以包括连接到计算机可读存储器112的处理器111。服务器设备110可以额外包括一个辅助存储元件,如数据库130。
客户处理器108和服务器处理器111可以是任何已知的计算机处理器。通常,客户端设备102可以是连接到网络的任意类型的计算平台,并且与诸如数字助理或“智能”移动电话或寻呼机的应用程序进行交互。服务器110尽管被描述为单一计算机系统,但也可以实现为计算机处理器的网络。
存储器112包含搜索引擎程序120。搜索引擎程序120响应于来自用户105的搜索请求定位相关信息。特别地,用户105将搜索请求发送至服务器设备110,它通过向用户105返回一个相关信息列表来做出响应。典型地,用户105请求服务器设备110定位涉及特定主题的页面,这些页面被存储在连接到网络101的其它设备或系统中。搜索引擎120包括文档定位符121和定级组件(ranking component)122。通常,文档定位符121寻找其内容与一条用户搜索请求相匹配的一组文档。定级组件122可以基于相关性为被定位的文档组进行定级,并且可以为每个文档生成一个表示相关性水平的相关性评分(relevancescore)。搜索引擎120然后可以返回一个链接列表,这些链接指向由文档定位符121所确定的文档组。这个链接列表可以基于由定级组件122所确定的相关性评分被排序(sort)。
文档定位符121可以通过将用户搜索请求中的词语与本集中的文档进行比较,对来自存储在数据库130中的文档本集(corpus)的文档进行初始定位。通常,为网络文件编制索引和搜索经过索引的网络文件本集以返回一组包含所搜索的词语的文档的过程是本领域中所公知的。因此,文档定位符121的这种功能在这里将不再说明。
定级组件122通过给由文档定位符121识别出的文档组定级,从而辅助搜索引擎120将相关文档返回给用户。这种定级可以是赋数值的形式,被称为相关性评分,对应于由文档定位符121识别出的每个文档所计算出的相关性。作为替代,定级组件122和文档定位符121的功能可以被组合,以使得文档定位符121产生一组分别具有等级值的相关文档。
如在这里所使用的,文档被广泛地解释为包含任何机器可读和机器可存储的工作产品。文档可以是电子邮件、文件、文件的结合、嵌入式链接到其它文件的一个或多个文件,等等。在互联网的情况下,通常的文档是网页。网页通常包括内容,并且可包括嵌入的信息(诸如元信息、超级链接等等)和/或嵌入的指令(诸如Javascript等)。
搜索引擎120的操作
与本发明的一方面相一致,由搜索引擎120返回的网络文件组的链接除了描述该网络文档的文本片断外,还可包括通知用户该网络文档可能与用户的搜索请求相关的视觉线索(visual cue)。该视觉线索可包括图形信息,通过它用户可以很快并且容易地验证该链接是否是用户想要定位的链接。在本发明的一方面中,对应于被确定为与用户搜索请求“高度相关”(即,关于该文档是用户最有兴趣观看的文档具有很高的置信度)的文档的链接与该视觉线索一起被显示。
图2是说明文档200的示图,它包含响应于搜索请求而可以在客户端设备102上显示给用户的网络文档的链接。该文档可响应于用户搜索请求由搜索程序120生成,并且可以在一个客户端设备102上由网络浏览器显示。
在图2所示的示例性文档中,用户输入的搜索请求201是“stanford”。文档200包括至网络文档的多个链接210、211、212、213和214,诸如搜索引擎120确定可能与搜索请求201相关的网页。除了所返回的链接210-214外,文档200还可包含其它信息,如总目录215和对应于搜索请求201的当前事件/新闻链接216。
用户可以选择链接210-214中的任意一个,从而指引网络浏览器返回这些链接所指向的网络文档。链接210-214中的每一个例如也可包括描述被链接的网络文档的文本220的片断,以及网络文档被归类的目录221的说明。
与本发明的一方面相一致,链接210-214中的一个或多个可以包括对应于该链接的视觉线索230。在图2中所示的示例中,视觉线索230被小型化(“缩略图”),给出对应于链接210的网页。在该示例中,搜索请求201是“stanford”。搜索引擎120确定出对“stanford”来说被最高地定级的链接是到斯坦福大学(stanford.edu)的链接。相应地,搜索引擎120在文档200中包括视觉线索230。
在一些实施方式中,当某链接被确定为与搜索请求“非常相关”时,搜索引擎120可以只显示视觉线索230,这里“非常相关”由确定关联性的客观标准来定义。例如,假设大部分的“stanford”搜索请求最终导致用户选择stanford.edu链接。在这种情况下,搜索引擎120可能会意识到stanford.edu是非常相关的链接,因此将视觉线索230包括在文档200中。
通过将视觉线索230与非常相关的链接包括在一起,用户可以学会将该视觉线索与搜索引擎120确信与用户意图相匹配的链接联系起来。一旦用户开始信任视觉线索230,视觉线索即允许用户更快地转到相关搜索结果的主页上,因为他们将不必要读取相应的片断220。因此这可能导致用户“达到满意的时间”的减少以及随之对搜索引擎满意度的增加。
图3是说明与本发明的一方面相一致的搜索引擎程序120的操作的流程图。搜索引擎程序120可以通过接收来自用户105中的一个用户的搜索请求开始(动作301)。基于该搜索请求,文档定位符121可以生成至与该搜索请求相关的文档的链接组(动作302)。该链接组可以基于为每个文档返回的来自定级组件122的相关量度被排序(动作303)。
搜索引擎程序120可以确定是否有任何由文档定位符121返回的链接与“非常相关”的文档相关联(动作304)。被确定为非常相关的文档可以与诸如视觉线索230的视觉线索相关联(动作305)。然后服务器设备110可以将该链接组返回给输入该搜索请求的用户(动作306)。被返回的链接组可以作为网络文档被传输,该网络文档的格式与文档200相似,并且可以特别地包括与非常相关的文档相关联的视觉线索230。
图4是概念上说明由搜索引擎程序120确定文档是否非常相关的方框图。
一个特定的文档D是否非常相关可能取决于多个参数。在一个实施方式中,这些参数可以由搜索引擎程序120计算出来,并且在图4中被显示为组件401-404。这些组件包括文档D在文档定级列表中的位置(组件401),与文档定级列表中的其它文档相比的观测到的历史用户点击通过率(click through rate)(组件402),与文档定级列表中的其它文档的相关性评分有关的文档的相关性评分(组件403),以及文档是否被检测为色情文档(组件404)。
组件401可以直接基于从定级组件122返回的被排序的链接组而被确定。一般而言,在经过排序的列表顶部的文档与列表中下方的文档相比更可能是非常相关的文档。
响应于所返回的链接组中的链接,组件402可以基于其它用户的历史点击通过率。例如,搜索引擎程序120可以计算文档D和所返回的链接组中每个其它文档之间的比率。该比率可以对每个其它文档E被计算:
D ^ E ^ - - - ( 1 )
其中
Figure B2005800306694D00072
表示用户已选择的文档D的总次数,
Figure B2005800306694D00073
表示用户已选择的文档E的总次数。这样,对每个文档E,该比率给出了文档D相对于文档E的普及性(popularity)。在用于测量历史点击通过率的等式(1)表示的可选实施方式中,
Figure B2005800306694D00074
可以被定义为表示用户对于特定请求Q已选择文档D的总次数,
Figure B2005800306694D00075
可以被定义为用户对于请求Q点击任意文档的总次数。组件403可以像从定级组件122被返回一样,将文档D的相关性评分与每个文档E的相关性评分相关联。例如,组件403可以存储文档D的相关性评分和其它文档的相关性评分之间的差别。
组件404可以存储文档D是否是色情文档的判断。该判断例如可以基于关键字比较、域名匹配、人工输入的信息等做出。
基于由组件401-404存储的一个或多个参数,判别组件410确定是否将文档D归类为非常相关的。该归类可以基于多种函数,它们使用由组件401-404存储的参数。在一个实施方式中,判别组件410当以下条件成立时确定文档D是非常相关的:(1)文档D的位置在结果的定级列表中是第一(基于组件401确定),(2)文档D具有高点击通过率,其可以由预先选择的点击通过门限被确定(基于组件402确定),以及(3)文档D的相关性评分显著高于所返回的文档组中的下一个最高的相关性评分(基于组件403确定)。在一些实施方式中,判别组件410可以额外地要求(4)文档D未被归类为色情文档(基于组件404确定)。高点击通过率(2)的具体门限值和相关性评分(3)之间的差可以由本领域普通技术人员经由试错法技术来确定。
基于组件401-404中的一个或多个,其它函数可以被判别组件410所使用,以确定文档是否是非常相关的。例如,可以在文档D的点击通过率应该有多高以及文档D的相关性评分应该有多高之间取折衷。文档D的高相关性评分一般很好地表明了文档D是一个好的结果。因此,当文档D具有高相关性评分并且在定级列表中处于第一的位置时,判别组件410可以接受文档D适中的点击通过率,并且仍然将该文档归类为非常相关的。另一方面,如果文档D的相关性评分较低,判别组件410在将该文档归类为非常相关的之前可能要求高得多的点击通过率并且文档处于第一的位置。可以对点击通过率以及文档D和定级列表中处于第二位置的文档之间的差别做出类似的折衷。一般而言,本领域普通技术人员会认识到,基于与组件401-404相关联的参数或者基于其它参数的其它函数可以被用来确定文档是否是非常相关的,或者更一般地说,被用来生成测量高度相关的文档的置信水平的值。特别地,响应于用搜索结果或其它文档列表的呈现(present),观测到的历史点击通过率可以更一般地被定义为与记录用户选择(“点击”)的日志相关的任何参数。
此外,本领域普通技术人员会认识到,可以对以上讨论的为所选择的文档显示视觉线索的技术进行多种修改。例如,不是实时地给出缩略图,这些缩略图可对于具有高点击通过率的文档被预先给出。这样,可能与视觉线索一起显示的文档可以很快地被返回给用户,而不需要首先生成缩略图。此外,除了缩略图之外的视觉线索可以被呈现给用户。例如,其它形式的突出显示(highlighting),诸如标识(logo)、被设计得醒目的形成对比的文本字体(例如,由大小、颜色或粗细进行对比的文本)、形成对比的背景、或者文本标签,都可以被用来代替缩略图。
另外,除了以上所述的参数之外的其他参数可以被判别组件410所使用。例如,与点击通过率相关的参数可以被定义为在提交请求之后用户已选择文档D的次数与该请求被提交的次数之间的历史比率。
还有另一个可以被判别组件410使用的参数是基于连接网络文档的超连接的文本。特别地,该参数可以基于指向文档D的链接的数目,其中描述该链接的文本与搜索请求相匹配。该数目可以与指向所返回的文档组(其中链接的文本与搜索请求相匹配)中的其它文档的链接数目进行比较。
通过名称浏览
上述技术的另一个实施例可涉及允许用户“通过名称浏览”。一般而言,被认为是非常相关的文档可以被认为是用户想要访问的真实目标文档。相应地,浏览器可以立即访问该文档,而不是返回搜索结果给用户。
图5是网络浏览器500的图形用户界面的示例性示图。网络浏览器500可以是多种已知的网络浏览器中的任一种,例如来自微软公司的IE浏览器。网络浏览器500可以包括多个工具栏,这些工具栏被设计用来帮助用户浏览网络。例如,一个标准工具栏510可包括若干图形按钮,例如向前按钮511、回退按钮512以及刷新按钮513。工具栏510上按钮的操作一般是众所周知的,不再详细说明。地址工具栏520可包括地址字段521,用户可以通过它输入希望浏览器所指向的位置。也可以包括其他工具栏,如第三方工具栏530。工具栏530可以是被设计用来帮助用户使用搜索引擎的工具栏。
常规地,当用户希望观看一个特定的网站时,该用户将在地址字段521中输入网站的URL(统一资源定位符),或者从事先已保存的网站列表(“书签”)中选择。网络文档的URL是指适用通用格式的文档:<协议>://<服务器>.<域名>/<路径名>。例如,URL“http://www.nps.gov/”指定了将使用HTTP协议访问在主域“nps.gov”中的服务器(计算设备)“www”。没有指定路径名,服务器“www”可通过返回一个默认网页来对其做出响应,如该网站的主页。使用某些浏览器,可能不要求用户输入协议字段,因为浏览器可能会假设用户想要使用HTTP协议。
输入用户想要访问的网站的完整URL对用户来说可能不太方便。例如,指向关于大峡谷的国家公园服务(National Park Service)的主页的URL“http://www.nps.gov/grca”对于用户键入来说不如更自然的语言请求“grand canyon”容易或可记忆。这种不方便对于那些使用不用英文字母书写的语言的人来说更为明显。对URL进行解析的域名系统(DNS)当初仅仅被设计为用英文字母来工作。因此,如果用户想要访问例如内容是使用汉字来表示的中文网站时,用户仍需要用英文字符输入URL。
图6A是说明与本发明的一方面相一致的搜索引擎120和客户端设备102的操作的流程图。浏览器500的用户可以在浏览器500的地址字段521中输入词语(动作601)。这些词语可以是自然语言词语,用户相信它们描述了用户想要访问的特定网站。这些词语不需要是URL的格式,并且可以用非英文字符(例如,中文或日语字符集,或其它双字节字符)输入。例如,如果用户想要访问关于大峡谷的国家公园服务的网页,用户可以简单地输入词语“grand canyon”。作为另外的示例,要访问IBM或Lands End公司的主页,用户可以简单地分别输入“ibm”或“lands end”,以分别代替“www.ibm.com”或“www.landsend.com”。
用户输入的词语可以被检查,以确定它们是否构成由浏览器识别的有效的URL或其它定位符(例如对本地文件的参考)。这种检查可以由浏览器、浏览器扩展(例如,工具栏530)或其它在客户端设备102上执行的程序(process)来执行。有效的URL可以根据这些词语是否以URL的格式被组织的来确定,如“www.ibm.com”。另外,在某些实施方式中,用户输入的词语可能会有机会使用普通的DNS查找系统来解析。如果这些词语没有在设定的期限内被解析为互联网地址,或者很清楚浏览器500不能解析这些词语,则这些词语被确定为没有构成有效的URL。
定义了有效的URL的词语被照常处理,以获取所指示的网页(动作603)。然而,没有定义有效URL的词语可能会被当作搜索请求来对待,并且被发送给搜索引擎120(动作604)。搜索请求可以由搜索引擎120以与参照图3所讨论的处理相同的方式处理。更具体地,搜索引擎可以生成相关的链接,并确定是否有任何被链接的文档是“非常相关的”(动作605和606)。在该实施例的情况下,“非常相关”可以被定义为:搜索引擎所确定的文档可以以合理的确定性被认为是用户想要访问的文档。可以基于一些或者所有之前针对图4所讨论的因素来做出这种判断。因此,例如文档的定级评分、与文档相关联的点击日志(例如历史点击通过率)、以及文档的相关性评分可以被检查。由这些因素中的一个或多个可以确定文档中是否有一个是非常相关的。
如果在所生成的相关链接列表中有一个文档被确定是非常相关的,则该文档的URL可以被回传给客户端设备102(动作607)。然后浏览器500可以立即显示该文档(动作608)。图7是在词语“grandcanyon”被输入到地址栏521中之后网络浏览器500的图形用户界面的示例性示图。如图所示,服务器设备110可能已经确定网页“http://www.nps.gov/grca/”是非常相关的文档。该文档的URL可以相应地被放置在地址栏521中,并访问和显示相应文档的内容。
如果没有文档被确定为非常相关,服务器110可以将相关文档的列表返回给客户端设备102(动作609)。然后客户端设备102可以将该列表作为搜索结果列表显示给用户(动作610)。图8是在词语“grandcanyon snowshoeing mice”被输入到地址栏521中之后网络浏览器500的图形用户界面的示例性示图。对于这些词语,可以确定没有网页足够相关到被确定为用户想要访问的网页。相反,标准的搜索结果页,包括链接和描述这些链接的片断,可以被显示给用户。如果希望的话,用户可以选择一个结果链接来访问该特定网页。
图6B是说明确定用户输入的词语是否是有效的URL(动作602)的示例性操作的流程图。词语是否是“有效的URL”可以更一般地被考虑为是否这些词语是有效的浏览器地址栏输入。如果是这样的话,则允许浏览器照常进行处理。如果不是,则可以执行动作604-610。图6B的操作是基于使用Microsoft IE网络浏览器的示例性实施方式。使用其它浏览器的实施方式可能会不同。
词语可以首先被检查,以确定它们是否定义了浏览器将显示的有效操作系统文件(动作650)。在某些版本的IE中,用户可以将文件名(例如,诸如“C:\My Documents\myfile.txt”的本地文件名)键入到浏览器地址栏中。作为响应,浏览器可以显示该文件。如果这些词语定义了有效的文件,则文档可以被浏览器正常访问(动作603)。否则,接下来可以确定这些词语是否是为该浏览器定义的“搜索捷径”。某些浏览器,例如IE,允许用户定义“搜索捷径”词语,浏览器可以将其解释为命令,以在特定的搜索引擎上执行搜索。例如,用户可以将字母“g”定义为表示在Google搜索引擎上执行搜索。通过在地址栏中键入“g Labrador Retriever dog”,用户指示浏览器返回来自Google搜索引擎对搜索请求“Labrador Retriever dog”的结果。接下来可以确定用户输入的这些词语是否是搜索捷径(动作655)。如果是这样的话,则文档可以被浏览器正常访问(动作603)。
接下来可以确定用户输入的这些词语是否定义了统一命名协定(universal naming convention,UNC)(动作660)。UNC路径是访问在某些Microsoft操作系统中共享的网络的标准方式。用户有时在IE地址栏中输入这种路径。如果这些词语是有效的UNC路径,这些词语可以照常由浏览器来处理(动作603)。接下来可以确定这些词语是否被格式化为URL(动作665)。如果是这样的话,文档可以由浏览器正常访问(动作603)。
接下来,可以确定这些词语是否是双字节字符(动作670)。如果是这样的话,这些词语被认为不是有效的URL,并且处理继续进行到动作604。接下来,可以确定这些词语是否包括间隔符号(动作675)。如果是这样的话,这些词语被认为不是有效的URL,并且处理继续进行到动作604。接下来,可以咨询本地DNS系统以确定这些词语是否定义了有效的DNS输入(动作680)。确定这些词语是否是有效的DNS输入可以基于DNS系统做出响应的超时时间(timeout period)。如果在超时时间内从DNS系统接收到了有效响应,则用户路由至DNS输入(动作685)。否则,处理继续进行到动作604。
以上说明的概念允许用户输入将特定网站描述为浏览器的地址字段的自然语言词语而不是常规的URL。这些词语被评估以确定它们是否以较高的似然度(likelihood)对应于特定的网站。如果是这样的话,则该网站可以被立即访问。如果不是,则可以由浏览器显示基于这些词语的搜索结果列表。这些概念对于非英语用户尤其有用。这些用户可以使用他们本国的书写字符集来输入词语。这些词语当被写出时可以由搜索引擎进行评估,如果合适,对应于非英文字符词语的英文字符版URL可以被返回并被自动访问。
结论
对本领域普通技术人员来说很明显,在附图所示的实施方式中,如上所述的本发明的各个方面可以通过软件、固件和硬件等很多不同的形式被实现。用于实现与本发明一致的各方面的实际软件代码或专用控制硬件并非对本发明进行限制。因此,这些方面的操作和过程并没有参照具体的软件代码来说明——可以理解,本领域普通技术人员能够设计软件并控制硬件,以基于这里的说明来实现这些方面。
本发明的优选实施例的上述描述提供了解释和说明,但并不意味着穷尽本发明或将其限制为所公开的具体方式。根据以上指导的修改和改动都是可能的,或者可以从本发明的实践来获得。
在本申请的说明中使用的单元、过程或指令不应该被解释为对本发明是关键的或必需的,除非明确地说明是这样。同样,如这里所使用的,冠词“a”意味着包括一个或多个项。当意指只有一项时,使用了词语“one”或类似的表述。此外,短语“基于”意指“至少部分地基于”,除非明确地声明是其它意思。

Claims (22)

1.一种显示与搜索结果相关的第一文档的方法,所述方法包括:
接收一个或多个词语;
基于所述词语开始搜索,以得到搜索结果及相应的相关性评分;
基于所述搜索结果中的一个文档是否与比和搜索结果相关的下一个最高的相关性评分高出一个特定的差值的相关性评分相关联,确定是否将所述搜索结果中的文档归类为非常相关的文档;
当确定所述搜索结果包含非常相关的文档时,显示所述非常相关的文档;以及
当确定所述搜索结果不包含所述非常相关的文档时,显示指向对应于所述搜索结果的多个文档的链接。
2.权利要求1所述的方法,还包括:
确定所述接收的词语是否代表有效的定位符;以及
当所述词语代表有效的定位符时,获取对应于该定位符的文档。
3.权利要求2所述的方法,其中确定所述词语是否代表有效的定位符是基于确定所述词语是否包括统一资源定位符。
4.权利要求2所述的方法,其中确定所述词语是否代表有效的定位符是基于对使用域名系统查找来解析所述词语的浏览器的分析。
5.权利要求1所述的方法,其中所述词语经由浏览器的地址栏被接收。
6.权利要求1所述的方法,其中指向所述多个文档的链接中的每一个分别与从所述多个文档的内容中导出的说明性文本片断在视觉上相关联。
7.权利要求1所述的方法,其中确定所述搜索结果是否包含非常相关的文档的步骤还包括:
还基于与包含在对应于所述搜索结果的文档的点击日志中的信息有关的参数来确定所述搜索结果是否包含所述第一文档。
8.权利要求7所述的方法,其中所述点击日志包括对应于所述搜索结果的文档的观测到的历史点击通过率。
9.权利要求8所述的方法,其中所述观测到的历史点击通过率作为表示用户已选择所述非常相关的文档的总次数与用户已选择对应于搜索结果的多个文档中的第二文档的总次数的比率被计算。
10.权利要求1所述的方法,其中所述词语是由用户输入的访问网站的自然语言请求。
11.权利要求1所述的方法,其中所述词语用非英语字符集被输入。
12.一种返回用户试图访问的特定文档的方法,所述方法包括:
从用户接收搜索请求;
基于所述搜索请求执行对网络文档的数据库的搜索,以得到搜索结果;
根据网络文档的位置在所述搜索结果的定级列表中是否是第一来确定所述搜索结果是否包含用户试图访问的特定文档,该特定文档的观测到的历史点击通过率比点击通过率门限更高,并具有比搜索结果中相关性评分次高的搜索结果的相关性评分更高的相关性评分;
当确定所述搜索结果包含用户试图访问的特定文档时,将指向所述特定文档的链接返回给所述用户,以立即显示所述特定文档给所述用户;
当确定所述搜索结果不包含用户试图访问的特定文档时,返回多个相关文档链接以显示给所述用户。
13.权利要求12所述的方法,其中执行对所述数据库的搜索包括获取多个相关文档链接。
14.权利要求12所述的方法,其中所述搜索请求是用非英语字符集表示的。
15.权利要求12所述的方法,其中所述观测到的历史点击通过率作为表示用户已选择第一个文档的总次数与用户已选择第二个文档的总次数的比率被计算。
16.一种用于显示相关结果的设备,所述设备包括:
用于由浏览器接收一个或多个词语的装置;
用于基于所述词语开始搜索以得到搜索结果的装置;
用于当所述搜索结果包含相关结果时,显示对应于所述相关结果的文档的装置,其中根据与搜索结果中的一个文档相关的历史点击通过率是否比搜索结果中的其它文档的历史点击通过率高一个门限量而将该文档识别为相关的;以及
用于当所述搜索结果不包含相关结果时,显示对应于指向所述搜索结果的多个文档的链接的装置。
17.权利要求16所述的设备,其中所述链接包括从对应于所述链接的文档内容中导出的说明性文本片断。
18.权利要求16所述的设备,其中与一个文档相关的历史点击通过率被定义为用户在发出请求后已选择该文档的次数与发出请求的次数之间的历史比率。
19.权利要求16所述的设备,其中与一个文档相关的历史点击通过率作为用户已选择该文档的次数与用户已选择另一文档的次数之间的比率来计算。
20.一种显示与搜索结果相关的第一文档的方法,所述方法包括:
经由浏览器的地址栏接收一个或多个词语;
确定所述被接收的词语是否代表有效的统一资源定位符;
当所述词语代表有效的统一资源定位符时,获取对应于所述词语的文档;
当所述词语不代表有效的统一资源定位符时,基于所述词语开始搜索以得到搜索结果;
当所述搜索结果包含第一文档时,显示对应于指向第一文档的链接的视觉线索,其中根据第一文档的相关性评分比搜索结果中的所有其它文档的相关性评分均高出一个门限量来识别所述第一文档;以及
当所述搜索结果中不包含第一文档时,显示指向对应于所述搜索结果的多个文档的链接。
21.权利要求20所述的方法,还包括基于搜索结果中的第一文档的历史点击通过率与搜索结果中的其它文档的历史点击通过率的比较来判断最为相关的第一文档,当所述搜索结果包括最为相关的第一文档时,显示对应于指向第一文档的链接的视觉线索。
22.权利要求20所述的方法,其中显示视觉线索的步骤只有在确定所述第一文档不是色情文档时才被执行。
CN2005800306694A 2004-07-14 2005-07-13 基于名称的url输入 Active CN101019119B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US58754804P 2004-07-14 2004-07-14
US60/587,548 2004-07-14
US10/953,497 2004-09-30
US10/953,497 US7401072B2 (en) 2003-06-10 2004-09-30 Named URL entry
PCT/US2005/024909 WO2006019852A1 (en) 2004-07-14 2005-07-13 Named url entry

Publications (2)

Publication Number Publication Date
CN101019119A CN101019119A (zh) 2007-08-15
CN101019119B true CN101019119B (zh) 2010-10-06

Family

ID=34973217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800306694A Active CN101019119B (zh) 2004-07-14 2005-07-13 基于名称的url输入

Country Status (5)

Country Link
US (3) US7401072B2 (zh)
EP (2) EP1769404A1 (zh)
KR (1) KR20070047304A (zh)
CN (1) CN101019119B (zh)
WO (1) WO2006019852A1 (zh)

Families Citing this family (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7401072B2 (en) * 2003-06-10 2008-07-15 Google Inc. Named URL entry
US7505964B2 (en) 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
KR100452086B1 (ko) * 2003-12-22 2004-10-13 엔에이치엔(주) 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법
KR100452085B1 (ko) * 2004-01-14 2004-10-12 엔에이치엔(주) 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법
KR101374651B1 (ko) * 2005-03-18 2014-03-17 써치 엔진 테크놀로지스, 엘엘씨 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진
US20060248060A1 (en) * 2005-04-13 2006-11-02 Silverberg Marc E Search results web page with provisions for e-mailing individual search results
US8438499B2 (en) 2005-05-03 2013-05-07 Mcafee, Inc. Indicating website reputations during user interactions
US7562304B2 (en) 2005-05-03 2009-07-14 Mcafee, Inc. Indicating website reputations during website manipulation of user information
US8566726B2 (en) * 2005-05-03 2013-10-22 Mcafee, Inc. Indicating website reputations based on website handling of personal information
US9384345B2 (en) 2005-05-03 2016-07-05 Mcafee, Inc. Providing alternative web content based on website reputation assessment
US8200696B2 (en) * 2005-05-26 2012-06-12 International Business Machines Corporation Presenting multiple possible selectable domain names from a URL entry
US20070094071A1 (en) * 2005-10-21 2007-04-26 Microsoft Corporation Pushing content to browsers
US8533199B2 (en) * 2005-12-14 2013-09-10 Unifi Scientific Advances, Inc Intelligent bookmarks and information management system based on the same
US8701196B2 (en) 2006-03-31 2014-04-15 Mcafee, Inc. System, method and computer program product for obtaining a reputation associated with a file
CN101075234A (zh) * 2006-05-17 2007-11-21 联发博动科技(北京)有限公司 一种wap浏览器输入方法及系统
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US9110975B1 (en) 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US7966309B2 (en) 2007-01-17 2011-06-21 Google Inc. Providing relevance-ordered categories of information
US7966321B2 (en) 2007-01-17 2011-06-21 Google Inc. Presentation of local results
US8005822B2 (en) * 2007-01-17 2011-08-23 Google Inc. Location in search queries
US8938463B1 (en) 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
US8694374B1 (en) 2007-03-14 2014-04-08 Google Inc. Detecting click spam
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US8359309B1 (en) * 2007-05-23 2013-01-22 Google Inc. Modifying search result ranking based on corpus search statistics
US8694511B1 (en) 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US8201081B2 (en) * 2007-09-07 2012-06-12 Google Inc. Systems and methods for processing inoperative document links
US7752285B2 (en) * 2007-09-17 2010-07-06 Yahoo! Inc. Shortcut sets for controlled environments
US8195634B2 (en) * 2007-09-28 2012-06-05 Microsoft Corporation Domain-aware snippets for search results
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
US20090228840A1 (en) * 2008-03-08 2009-09-10 Jason Edward Stach Systems and methods for improving web browsing efficiency
US20090241018A1 (en) * 2008-03-18 2009-09-24 Cuill, Inc. Apparatus and method for displaying search results with configurable columns and textual summary lengths
US8312022B2 (en) * 2008-03-21 2012-11-13 Ramp Holdings, Inc. Search engine optimization
US8396865B1 (en) * 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
US8455990B2 (en) * 2009-02-25 2013-06-04 Conexant Systems, Inc. Systems and methods of tamper proof packaging of a semiconductor device
US8140526B1 (en) * 2009-03-16 2012-03-20 Guangsheng Zhang System and methods for ranking documents based on content characteristics
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US20100262624A1 (en) * 2009-04-14 2010-10-14 Microsoft Corporation Discovery of inaccessible computer resources
US8214366B2 (en) * 2009-11-17 2012-07-03 Glace Holding Llc Systems and methods for generating a language database that can be used for natural language communication with a computer
US8275788B2 (en) * 2009-11-17 2012-09-25 Glace Holding Llc System and methods for accessing web pages using natural language
US9805020B2 (en) 2009-04-23 2017-10-31 Deep Sky Concepts, Inc. In-context access of stored declarative knowledge using natural language expression
US8972445B2 (en) 2009-04-23 2015-03-03 Deep Sky Concepts, Inc. Systems and methods for storage of declarative knowledge accessible by natural language in a computer capable of appropriately responding
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
US8615514B1 (en) 2010-02-03 2013-12-24 Google Inc. Evaluating website properties by partitioning user feedback
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US10311114B2 (en) 2010-06-17 2019-06-04 Google Llc Displaying stylized text snippets with search engine results
US8635205B1 (en) * 2010-06-18 2014-01-21 Google Inc. Displaying local site name information with search results
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US20130018915A1 (en) * 2010-07-16 2013-01-17 Onuka Kalu Kalu Mobile wireless communications device with search shortcut and related methods
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
US8977624B2 (en) 2010-08-30 2015-03-10 Microsoft Technology Licensing, Llc Enhancing search-result relevance ranking using uniform resource locators for queries containing non-encoding characters
US8769429B2 (en) 2010-08-31 2014-07-01 Net-Express, Ltd. Method and system for providing enhanced user interfaces for web browsing
EP2641146A4 (en) 2010-11-20 2017-05-03 Nuance Communications, Inc. Performing actions on a computing device using a contextual keyboard
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
US9165082B2 (en) * 2011-01-21 2015-10-20 Microsoft Technology Licensing, Llc Direct navigation through browser address bar
US20120191744A1 (en) * 2011-01-21 2012-07-26 Microsoft Corporation Detecting search mode in a browser navigation bar
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US9858343B2 (en) 2011-03-31 2018-01-02 Microsoft Technology Licensing Llc Personalization of queries, conversations, and searches
US8732569B2 (en) 2011-05-04 2014-05-20 Google Inc. Predicting user navigation events
US9064006B2 (en) * 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US9454962B2 (en) 2011-05-12 2016-09-27 Microsoft Technology Licensing, Llc Sentence simplification for spoken language understanding
US9223897B1 (en) * 2011-05-26 2015-12-29 Google Inc. Adjusting ranking of search results based on utility
US8788711B2 (en) 2011-06-14 2014-07-22 Google Inc. Redacting content and inserting hypertext transfer protocol (HTTP) error codes in place thereof
US9769285B2 (en) 2011-06-14 2017-09-19 Google Inc. Access to network content
US8745212B2 (en) 2011-07-01 2014-06-03 Google Inc. Access to network content
US8650139B2 (en) 2011-07-01 2014-02-11 Google Inc. Predicting user navigation events
US10742591B2 (en) 2011-07-06 2020-08-11 Akamai Technologies Inc. System for domain reputation scoring
US11201848B2 (en) * 2011-07-06 2021-12-14 Akamai Technologies, Inc. DNS-based ranking of domain names
US9843601B2 (en) 2011-07-06 2017-12-12 Nominum, Inc. Analyzing DNS requests for anomaly detection
US8566696B1 (en) 2011-07-14 2013-10-22 Google Inc. Predicting user navigation events
US8744988B1 (en) 2011-07-15 2014-06-03 Google Inc. Predicting user navigation events in an internet browser
US8600921B2 (en) 2011-09-15 2013-12-03 Google Inc. Predicting user navigation events in a browser using directed graphs
US8655819B1 (en) 2011-09-15 2014-02-18 Google Inc. Predicting user navigation events based on chronological history data
US9104664B1 (en) 2011-10-07 2015-08-11 Google Inc. Access to search results
CN103034665B (zh) * 2011-10-10 2016-01-06 阿里巴巴集团控股有限公司 信息查询方法和装置
US9584579B2 (en) 2011-12-01 2017-02-28 Google Inc. Method and system for providing page visibility information
US9031929B1 (en) 2012-01-05 2015-05-12 Google Inc. Site quality score
US8793235B2 (en) 2012-01-19 2014-07-29 Google Inc. System and method for improving access to search results
US9304985B1 (en) 2012-02-03 2016-04-05 Google Inc. Promoting content
US9471551B1 (en) * 2012-02-03 2016-10-18 Google Inc. Promoting content
US9378191B1 (en) 2012-02-03 2016-06-28 Google Inc. Promoting content
CN104428767B (zh) * 2012-02-22 2018-02-06 谷歌公司 用于识别相关实体的方法、系统和装置
US9424353B2 (en) 2012-02-22 2016-08-23 Google Inc. Related entities
US9946792B2 (en) 2012-05-15 2018-04-17 Google Llc Access to network content
US8996513B2 (en) * 2012-07-24 2015-03-31 Microsoft Technology Licensing, Llc Providing an interface to access website actions
US8887239B1 (en) 2012-08-08 2014-11-11 Google Inc. Access to network content
CN102867056A (zh) * 2012-09-18 2013-01-09 王楚云 关键词搜索方法及系统
US9141722B2 (en) 2012-10-02 2015-09-22 Google Inc. Access to network content
US9207777B2 (en) 2012-11-01 2015-12-08 Blackberry Limited Electronic device with predictive URL domain key function
KR102024791B1 (ko) * 2012-11-13 2019-09-24 엘지전자 주식회사 이동 단말기 및 그것의 제어 방법
CN103841122B (zh) 2012-11-20 2017-07-28 阿里巴巴集团控股有限公司 目标对象信息推荐方法、服务器及客户端
US10164989B2 (en) 2013-03-15 2018-12-25 Nominum, Inc. Distinguishing human-driven DNS queries from machine-to-machine DNS queries
US9183499B1 (en) 2013-04-19 2015-11-10 Google Inc. Evaluating quality based on neighbor features
CN104182402A (zh) * 2013-05-22 2014-12-03 腾讯科技(深圳)有限公司 浏览器界面地址栏输入控制方法及系统
CN104021067B (zh) * 2014-05-28 2017-11-14 广东欧珀移动通信有限公司 移动终端的滑动性能检测方法、装置及移动终端
US10423704B2 (en) * 2014-12-17 2019-09-24 International Business Machines Corporation Utilizing hyperlink forward chain analysis to signify relevant links to a user
US9727218B2 (en) 2015-01-02 2017-08-08 Microsoft Technology Licensing, Llc Contextual browser frame and entry box placement
CN105721224B (zh) * 2016-03-31 2019-04-19 网易(杭州)网络有限公司 统一资源定位符处理方法、装置和系统
CN108090004B (zh) * 2016-11-21 2020-03-13 英业达科技有限公司 硬件资源共用系统及连线桥接平台的操作方法
CN107193870B (zh) * 2017-04-12 2020-12-04 广东万丈金数信息技术股份有限公司 网页内容的提取方法和系统
CN109725784B (zh) * 2017-10-30 2022-04-12 华为技术有限公司 信息显示方法及终端设备
CN109376121B (zh) * 2018-08-10 2021-07-02 南京华讯方舟通信设备有限公司 一种基于ElasticSearch全文检索的文件索引系统及方法
CN110008309B (zh) * 2019-03-21 2021-03-30 腾讯科技(深圳)有限公司 一种短语挖掘方法及装置
US20210158209A1 (en) * 2019-11-27 2021-05-27 Amazon Technologies, Inc. Systems, apparatuses, and methods of active learning for document querying machine learning models
US11475067B2 (en) 2019-11-27 2022-10-18 Amazon Technologies, Inc. Systems, apparatuses, and methods to generate synthetic queries from customer data for training of document querying machine learning models
US11425075B2 (en) * 2020-07-29 2022-08-23 Vmware, Inc. Integration of client applications with hosted applications
US11868341B2 (en) * 2020-10-15 2024-01-09 Microsoft Technology Licensing, Llc Identification of content gaps based on relative user-selection rates between multiple discrete content sources

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5764906A (en) * 1995-11-07 1998-06-09 Netword Llc Universal electronic resource denotation, request and delivery system
US6012053A (en) * 1997-06-23 2000-01-04 Lycos, Inc. Computer system with user-controlled relevance ranking of search results
CN1389811A (zh) * 2002-02-06 2003-01-08 北京造极人工智能技术有限公司 搜索引擎的智能化搜索方法

Family Cites Families (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5659732A (en) 1995-05-17 1997-08-19 Infoseek Corporation Document retrieval over networks wherein ranking and relevance scores are computed at the client for multiple database documents
US6067552A (en) * 1995-08-21 2000-05-23 Cnet, Inc. User interface system and method for browsing a hypertext database
US5983220A (en) 1995-11-15 1999-11-09 Bizrate.Com Supporting intuitive decision in complex multi-attributive domains using fuzzy, hierarchical expert models
US5873107A (en) 1996-03-29 1999-02-16 Apple Computer, Inc. System for automatically retrieving information relevant to text being authored
US5920859A (en) * 1997-02-05 1999-07-06 Idd Enterprises, L.P. Hypertext document retrieval system and method
US5864846A (en) * 1996-06-28 1999-01-26 Siemens Corporate Research, Inc. Method for facilitating world wide web searches utilizing a document distribution fusion strategy
US5920854A (en) * 1996-08-14 1999-07-06 Infoseek Corporation Real-time document collection search engine with phrase indexing
US5944793A (en) * 1996-11-21 1999-08-31 International Business Machines Corporation Computerized resource name resolution mechanism
US5774888A (en) * 1996-12-30 1998-06-30 Intel Corporation Method for characterizing a document set using evaluation surrogates
US6285999B1 (en) * 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US6112202A (en) * 1997-03-07 2000-08-29 International Business Machines Corporation Method and system for identifying authoritative information resources in an environment with content-based links between information resources
US5879332A (en) 1997-03-26 1999-03-09 Ethicon Endo-Surgery, Inc. Trocar having protector with flexible end
US5970505A (en) * 1997-03-31 1999-10-19 Sun Mirosystems, Inc. Linking related data in a document set including a plurality of books written by different groups of authors in a computer network
US5983218A (en) * 1997-06-30 1999-11-09 Xerox Corporation Multimedia database for use over networks
US6006217A (en) * 1997-11-07 1999-12-21 International Business Machines Corporation Technique for providing enhanced relevance information for documents retrieved in a multi database search
US5987457A (en) * 1997-11-25 1999-11-16 Acceleration Software International Corporation Query refinement method for searching documents
US6094649A (en) * 1997-12-22 2000-07-25 Partnet, Inc. Keyword searches of structured databases
IL123129A (en) 1998-01-30 2010-12-30 Aviv Refuah Www addressing
US6151624A (en) 1998-02-03 2000-11-21 Realnames Corporation Navigating network resources based on metadata
US6101503A (en) * 1998-03-02 2000-08-08 International Business Machines Corp. Active markup--a system and method for navigating through text collections
US6006225A (en) 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6167370A (en) * 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
US6189002B1 (en) * 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US7225182B2 (en) 1999-05-28 2007-05-29 Overture Services, Inc. Recommending search terms using collaborative filtering and web spidering
US6990628B1 (en) * 1999-06-14 2006-01-24 Yahoo! Inc. Method and apparatus for measuring similarity among electronic documents
US6601061B1 (en) * 1999-06-18 2003-07-29 Surfwax, Inc. Scalable information search and retrieval including use of special purpose searching resources
US6591261B1 (en) * 1999-06-21 2003-07-08 Zerx, Llc Network search engine and navigation tool and method of determining search results in accordance with search criteria and/or associated sites
US6356908B1 (en) 1999-07-30 2002-03-12 International Business Machines Corporation Automatic web page thumbnail generation
US6665838B1 (en) * 1999-07-30 2003-12-16 International Business Machines Corporation Web page thumbnails and user configured complementary information provided from a server
US6606615B1 (en) * 1999-09-08 2003-08-12 C4Cast.Com, Inc. Forecasting contest
US6697799B1 (en) * 1999-09-10 2004-02-24 Requisite Technology, Inc. Automated classification of items using cascade searches
US20030050927A1 (en) 2001-09-07 2003-03-13 Araha, Inc. System and method for location, understanding and assimilation of digital documents through abstract indicia
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US6839702B1 (en) * 1999-12-15 2005-01-04 Google Inc. Systems and methods for highlighting search results
US7130808B1 (en) * 1999-12-29 2006-10-31 The Product Engine, Inc. Method, algorithm, and computer program for optimizing the performance of messages including advertisements in an interactive measurable medium
US6571239B1 (en) 2000-01-31 2003-05-27 International Business Machines Corporation Modifying a key-word listing based on user response
US6564208B1 (en) 2000-02-24 2003-05-13 Inktomi Corporation Delivering non-default items in association with search results
US7747465B2 (en) * 2000-03-13 2010-06-29 Intellions, Inc. Determining the effectiveness of internet advertising
US6499029B1 (en) * 2000-03-29 2002-12-24 Koninklijke Philips Electronics N.V. User interface providing automatic organization and filtering of search criteria
WO2001075728A1 (en) * 2000-03-30 2001-10-11 I411, Inc. Methods and systems for enabling efficient retrieval of data from data collections
US6915308B1 (en) * 2000-04-06 2005-07-05 Claritech Corporation Method and apparatus for information mining and filtering
US6564201B1 (en) * 2000-04-25 2003-05-13 Cook-Hurlbert, Inc. Expert designer system virtual plug-in interface
US7062561B1 (en) * 2000-05-23 2006-06-13 Richard Reisman Method and apparatus for utilizing the social usage learned from multi-user feedback to improve resource identity signifier mapping
CN1527976A (zh) * 2000-05-30 2004-09-08 ������ɽ���� 提供知识服务的分布式监视网络
US6640218B1 (en) * 2000-06-02 2003-10-28 Lycos, Inc. Estimating the usefulness of an item in a collection of information
US20030204536A1 (en) * 2000-06-30 2003-10-30 Keskar Dhananjay V. Technique for automatically associating desktop data items
FR2813306B1 (fr) * 2000-08-23 2005-10-21 Sanofi Synthelabo Aminoalkybenzoyl-benzofurannes ou benzothiophenes, leur procede de preparation et les compositions les contenant
US7451099B2 (en) * 2000-08-30 2008-11-11 Kontera Technologies, Inc. Dynamic document context mark-up technique implemented over a computer network
US20020099605A1 (en) 2000-10-06 2002-07-25 Searchcactus, Llc Search engine with demographic-based advertising
GB2368414B (en) 2000-10-27 2002-09-11 One Stop To Ltd Searching procedures
US6807536B2 (en) * 2000-11-16 2004-10-19 Microsoft Corporation Methods and systems for computing singular value decompositions of matrices and low rank approximations of matrices
US6526440B1 (en) * 2001-01-30 2003-02-25 Google, Inc. Ranking search results by reranking the results based on local inter-connectivity
US7502994B2 (en) * 2001-02-05 2009-03-10 Omniture, Inc. Web page link-tracking system
US7627596B2 (en) * 2001-02-22 2009-12-01 International Business Machines Corporation Retrieving handwritten documents using multiple document recognizers and techniques allowing both typed and handwritten queries
US20030018659A1 (en) * 2001-03-14 2003-01-23 Lingomotors, Inc. Category-based selections in an information access environment
US7499948B2 (en) * 2001-04-16 2009-03-03 Bea Systems, Inc. System and method for web-based personalization and ecommerce management
US20020165856A1 (en) * 2001-05-04 2002-11-07 Gilfillan Lynne E. Collaborative research systems
US20020165860A1 (en) * 2001-05-07 2002-11-07 Nec Research Insititute, Inc. Selective retrieval metasearch engine
US7194483B1 (en) * 2001-05-07 2007-03-20 Intelligenxia, Inc. Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information
US20030236701A1 (en) * 2001-05-15 2003-12-25 Netcentives, Inc. Method and system for affiliate tracking
US7672894B2 (en) * 2001-07-20 2010-03-02 Shopzilla, Inc. Automated bidding system for use with online auctions
US7337396B2 (en) 2001-08-08 2008-02-26 Xerox Corporation Methods and systems for transitioning between thumbnails and documents based upon thumbnail appearance
US20040205454A1 (en) * 2001-08-28 2004-10-14 Simon Gansky System, method and computer program product for creating a description for a document of a remote network data source for later identification of the document and identifying the document utilizing a description
US20030046389A1 (en) * 2001-09-04 2003-03-06 Thieme Laura M. Method for monitoring a web site's keyword visibility in search engines and directories and resulting traffic from such keyword visibility
US20030120641A1 (en) * 2001-11-19 2003-06-26 Stephen Pelletier Method and apparatus for dynamic database creation and interactive analysis
US20030126461A1 (en) * 2001-12-28 2003-07-03 John Barker Audio/visual URL icon
US7567953B2 (en) * 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
US7296016B1 (en) * 2002-03-13 2007-11-13 Google Inc. Systems and methods for performing point-of-view searching
US20040078211A1 (en) * 2002-03-18 2004-04-22 Merck & Co., Inc. Computer assisted and/or implemented process and system for managing and/or providing a medical information portal for healthcare providers
KR100491254B1 (ko) 2002-05-15 2005-05-25 엔에이치엔(주) 웹사이트 디렉토리나 웹페이지에 대해 설명하는 단어들에하이퍼링크를 적용하는 검색 시스템 및 방법
US7188117B2 (en) * 2002-05-17 2007-03-06 Xerox Corporation Systems and methods for authoritativeness grading, estimation and sorting of documents in large heterogeneous document collections
US7167871B2 (en) * 2002-05-17 2007-01-23 Xerox Corporation Systems and methods for authoritativeness grading, estimation and sorting of documents in large heterogeneous document collections
US7599911B2 (en) * 2002-08-05 2009-10-06 Yahoo! Inc. Method and apparatus for search ranking using human input and automated ranking
US20040044571A1 (en) * 2002-08-27 2004-03-04 Bronnimann Eric Robert Method and system for providing advertising listing variance in distribution feeds over the internet to maximize revenue to the advertising distributor
KR20040048103A (ko) 2002-12-02 2004-06-07 엔에이치엔(주) 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법
US6947930B2 (en) * 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
US7401072B2 (en) * 2003-06-10 2008-07-15 Google Inc. Named URL entry
US7836391B2 (en) 2003-06-10 2010-11-16 Google Inc. Document search engine including highlighting of confident results
US7505964B2 (en) * 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US7130819B2 (en) * 2003-09-30 2006-10-31 Yahoo! Inc. Method and computer readable medium for search scoring
US7346615B2 (en) * 2003-10-09 2008-03-18 Google, Inc. Using match confidence to adjust a performance threshold
US20050097089A1 (en) * 2003-11-05 2005-05-05 Tom Nielsen Persistent user interface for providing navigational functionality
US20050137939A1 (en) * 2003-12-19 2005-06-23 Palo Alto Research Center Incorporated Server-based keyword advertisement management
US20050149851A1 (en) * 2003-12-31 2005-07-07 Google Inc. Generating hyperlinks and anchor text in HTML and non-HTML documents
WO2005091175A1 (en) * 2004-03-15 2005-09-29 Yahoo! Inc. Search systems and methods with integration of user annotations
US7289985B2 (en) * 2004-04-15 2007-10-30 Microsoft Corporation Enhanced document retrieval
US7689458B2 (en) * 2004-10-29 2010-03-30 Microsoft Corporation Systems and methods for determining bid value for content items to be placed on a rendered page
US20060122976A1 (en) * 2004-12-03 2006-06-08 Shumeet Baluja Predictive information retrieval
US20060167842A1 (en) * 2005-01-25 2006-07-27 Microsoft Corporation System and method for query refinement
US20060265508A1 (en) * 2005-05-02 2006-11-23 Angel Franklin J System for administering a multiplicity of namespaces containing state information and services
US20070038508A1 (en) * 2005-08-10 2007-02-15 Microsoft Corporation Normalized click-through advertisement pricing
US7769751B1 (en) * 2006-01-17 2010-08-03 Google Inc. Method and apparatus for classifying documents based on user inputs
US7457802B2 (en) * 2006-12-14 2008-11-25 Jason Coleman Internet searching enhancement method for determining topical relevance scores
US7925644B2 (en) * 2007-03-01 2011-04-12 Microsoft Corporation Efficient retrieval algorithm by query term discrimination
US20080306819A1 (en) * 2007-06-08 2008-12-11 Yahoo! Inc. System and method for shaping relevance scores for position auctions
US8447760B1 (en) * 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5764906A (en) * 1995-11-07 1998-06-09 Netword Llc Universal electronic resource denotation, request and delivery system
US6012053A (en) * 1997-06-23 2000-01-04 Lycos, Inc. Computer system with user-controlled relevance ranking of search results
CN1389811A (zh) * 2002-02-06 2003-01-08 北京造极人工智能技术有限公司 搜索引擎的智能化搜索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CN 1389811 A,说明书第2页最后1段.
US 6012053 A,说明书第13栏第12-17行、附图7.

Also Published As

Publication number Publication date
US7401072B2 (en) 2008-07-15
US20090006389A1 (en) 2009-01-01
EP2450811A1 (en) 2012-05-09
KR20070047304A (ko) 2007-05-04
US9256694B2 (en) 2016-02-09
US20050240576A1 (en) 2005-10-27
US10002201B2 (en) 2018-06-19
US20160012112A1 (en) 2016-01-14
CN101019119A (zh) 2007-08-15
EP1769404A1 (en) 2007-04-04
WO2006019852A1 (en) 2006-02-23

Similar Documents

Publication Publication Date Title
CN101019119B (zh) 基于名称的url输入
US10372738B2 (en) Speculative search result on a not-yet-submitted search query
CN102122295B (zh) 用于执行文档搜索的方法、服务器设备和系统
US9367588B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US9146999B2 (en) Search keyword improvement apparatus, server and method
US8452793B2 (en) Query refinement based on user selections
US10460327B2 (en) Systems and methods for persistent context-aware guides
US8554786B2 (en) Document information management system
US8978033B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
US20130254189A1 (en) Using Anchor Text to Provide Context
US20180004850A1 (en) Method for inputting and processing feature word of file content
US20060277189A1 (en) Translation of search result display elements
KR20080024208A (ko) 검색 결과를 제공하기 위한 시스템 및 방법
US20120036144A1 (en) Information and recommendation device, method, and program
KR20090006464A (ko) 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체
JP2008520047A (ja) リンクされた用語を含むアクティブな要約を表示する検索システム
KR20090003739A (ko) 태그 정보를 이용하여 사용자 취향정보를 수집하는 단말기기, 그 방법 및 기록매체
KR20040087205A (ko) 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템
WO2014012443A1 (zh) 参考文件导引信息的输入和处理方法
US8694887B2 (en) Dynamic contextual shortcuts
KR100546074B1 (ko) 석재입찰검색시스템
JP5108707B2 (ja) 検索サーバ装置、検索方法及びプログラム
Huang et al. The Methodology of Manual Assessment in the Evaluation of Link Discovery
KR20010016484A (ko) 인터넷 주소체계의 경로를 이용한 검색서비스 방법
KR20040086732A (ko) 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google limited liability company

Address before: American California

Patentee before: GOOGLE Inc.

CP01 Change in the name or title of a patent holder