CN105900081B - 基于自然语言处理的搜索 - Google Patents

基于自然语言处理的搜索 Download PDF

Info

Publication number
CN105900081B
CN105900081B CN201380073339.8A CN201380073339A CN105900081B CN 105900081 B CN105900081 B CN 105900081B CN 201380073339 A CN201380073339 A CN 201380073339A CN 105900081 B CN105900081 B CN 105900081B
Authority
CN
China
Prior art keywords
search
query
tree
knowledge graph
computers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380073339.8A
Other languages
English (en)
Other versions
CN105900081A (zh
Inventor
李光华
戴维·弗朗索瓦·忽恩
黄彦来
高源�
柴颖
马尼施·拉伊·贾殷
张勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN105900081A publication Critical patent/CN105900081A/zh
Application granted granted Critical
Publication of CN105900081B publication Critical patent/CN105900081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems

Abstract

提供了用于基于自然语言处理的搜索的方法、系统以及计算机可读介质。在某些实施例中,搜索系统可解析接收到的搜索查询并构建结构化搜索。在某些实施例中,构建结构搜索包括基于接收的搜索查询来构建短语树,并且基于短语树和存储在诸如知识图中的数据结构中的数据来构建查询树。在某些实施例中,使用查询树从数据结构检索搜索结果。在某些实施例中,搜索系统使用查询树和数据结构中的关系来识别过滤方面并过滤搜索结果。

Description

基于自然语言处理的搜索
技术领域
本公开涉及处理搜索查询。用于处理搜索查询的常规技术包括关键字搜索和词匹配。
发明内容
提供了用于基于自然语言处理的搜索的方法、系统以及计算机可读介质。
在某些实施方式中,将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词。识别与所述一个或多个搜索单元中的每个相对应的知识图的元素。通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成短语树。以与短语树相同的拓扑来生成查询树,其中至少部分地基于短语树和知识图来定义查询树的节点和边。至少部分地基于第一查询树从知识图检索搜索结果。
在某些实施方式中,至少部分地基于第一搜索查询来生成第一查询树,其中第一查询树的节点和边与知识图的元素相关联。至少部分地基于第一查询树从知识图检索第一搜索结果。将该第一搜索结果提供给用户。接收过滤查询,其中过滤查询涉及第一搜索结果的精化。至少部分地基于第一搜索查询和过滤查询生成第二搜索查询,其中第二查询树包括与知识图的元素相关联的一个或多个节点和边。比较第一查询树和第二查询树。基于该比较,确定搜索过滤器。至少部分地基于第一搜索结果和搜索过滤器来提供第二搜索结果。
在某些实施方式中,从知识图向用户提供第一搜索结果。接收过滤查询,其中过滤查询涉及第一搜索结果的精化。识别与过滤查询相关联的知识图中的一个或多个元素。映射在与过滤查询相关联的知识图中的一个或多个元素与第一多个搜索结果中的每个相应搜索结果之间的一个或多个关系。基于该一个或多个关系,确定搜索过滤器。至少部分地基于第一搜索结果和搜索过滤器来提供第二搜索结果。
在某些实施方式中,提供了包括一个或多个处理器的系统。该系统可将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词。该系统可识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素。该系统可通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成短语树。该系统可以与短语树相同的拓扑来生成查询树,其中至少部分地基于短语树和知识图来定义查询树的节点和边。该系统可至少部分地基于第一查询树从知识图检索搜索结果。
在某些实施方式中,提供了包括一个或多个处理器的系统。该系统可至少部分地基于第一搜索查询来生成第一查询树,其中第一查询树的节点和边与知识图的元素相关联。该系统可至少部分地基于第一查询树从知识图检索第一搜索结果。该系统可将第一搜索结果提供给用户。该系统可接收过滤查询,其中过滤查询涉及第一搜索结果的精化。该系统可至少部分地基于第一搜索查询和过滤查询生成第二查询树,其中该第二查询树包括与知识图的元素相关联的一个或多个节点和边。该系统可比较第一查询树和第二查询树。基于该比较,系统可确定搜索过滤器。该系统可至少部分地基于第一搜索结果和搜索过滤器来提供第二搜索结果。
在某些实施方式中,提供了包括一个或多个处理器的系统。该系统可将来自知识图的第一搜索结果提供给用户。该系统可接收过滤查询,其中过滤查询涉及第一搜索结果的精化。该系统可识别与过滤查询相关联的知识图中的一个或多个元素。该系统可映射在与第一过滤查询相关联的知识图中的一个或多个元素与第一多个搜索结果中的每个相应搜索结果之间的一个或多个关系。基于所述一个或多个关系,该系统可确定搜索过滤器。该系统可至少部分地基于第一搜索结果和搜索过滤器来提供第二搜索结果。
在某些实施方式中,提供了一种其上记录有计算机程序指令的非瞬时计算机可读介质。该指令包括将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词。该指令包括识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素。该指令包括通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成短语树。该指令包括以与短语树相同的拓扑来生成查询树,其中至少部分地基于短语树和知识图来定义查询树的节点和边。该指令包括至少部分地基于第一查询树从知识图检索搜索结果。
在某些实施方式中,提供了一种其上记录有计算机程序指令的非瞬时计算机可读介质。指令包括至少部分地基于第一搜索查询来生成第一查询树,其中第一查询树的节点和边与知识图的元素相关联。指令包括至少部分地基于第一查询树从知识图检索第一搜索结果。指令包括将第一搜索结果提供给用户。指令包括接收过滤查询,其中过滤查询涉及第一搜索结果的精化。指令包括至少部分地基于第一搜索查询和过滤查询生成第二查询树,其中该第二查询树包括与知识图的元素相关联的一个或多个节点和边。比较第一查询树和第二查询树。指令包括基于该比较来确定搜索过滤器。指令包括至少部分地基于第一搜索结果和搜索过滤器来提供第二搜索结果。
在某些实施方式中,提供了一种其上记录有计算机程序指令的非瞬时计算机可读介质。
指令包括将来自知识图的第一搜索结果提供给用户。指令包括接收过滤查询,其中,过滤查询涉及第一搜索结果的精化。指令包括识别与过滤查询相关联的知识图中的一个或多个元素。指令包括映射在与过滤查询相关联的知识图中的一个或多个元素与第一多个搜索结果中的每个相应搜索结果之间的一个或多个关系。指令包括基于所述一个或多个关系来确定搜索过滤器。指令包括至少部分地基于第一搜索结果和搜索过滤器来提供第二搜索结果。
附图说明
图1示出了根据本公开的某些实施方式的信息流图;
图2示出了根据本公开的某些实施方式的包含节点和边的说明性知识图部分;
图3示出了根据本公开的某些实施方式的另一说明性知识部分;
图4示出了根据本公开的某些实施方式的另一说明性知识部分;
图5示出了根据本公开的某些实施方式的包括用于将搜索查询分割的说明性步骤的流程图;
图6示出了根据本公开的某些实施方式的说明性自然语言处理;
图7示出了根据本公开的某些实施方式的说明性树拓扑;
图8示出了根据本公开的某些实施方式的说明性短语树;
图9示出了根据本公开的某些实施方式的说明性查询树;
图10示出了根据本公开的某些实施方式的包括用于生成查询树的说明性步骤的流程图;
图11示出了根据本公开的某些实施方式的具有搜索过滤器的说明性用户界面;
图12示出了根据本公开的某些实施方式的说明性过滤查询树;
图13示出了根据本公开的某些实施方式的具有已过滤结果的说明性用户界面;
图14示出了根据本公开的某些实施方式的包括用于对搜索结果进行过滤的说明性步骤的流程图;
图15示出了根据本公开的某些实施方式的包括用于提供已过滤搜索结果的说明性步骤的流程图;
图16示出了根据本公开的某些实施方式的可用来实现搜索系统的某些或所有特征的说明性计算机系统;以及
图17是根据本公开的某些实施方式的用户设备的框图。
具体实施方式
在某些实施方式中,搜索系统可基于接收的搜索查询从数据结构或其它索引提供搜索结果。例如,因特网搜索引擎可从基于来自因特网的数据构建的索引检索网页链接。在某些实施方式中,自然语言搜索查询可能没有检索到相关搜索结果,因为其没有用正在搜索的数据结构或索引的知识结构化。在某些实施方式中,搜索系统可解释自然语言搜索查询并基于该解释来构建结构化搜索,其中使用结构化查询来搜索数据结构或索引。
在某些实施方式中,搜索系统提供许多结果。在某些实施方式中,对搜索结果进行过滤或精化是基于搜索结果的内容、接收到附加搜索查询或其它技术。在某些实施方式中,可能期望为用户提供针对各方面的过滤器种类,因为用户可能不知道最有用的过滤器。在某些实施方式中,搜索系统可例如从用户接收第二搜索查询。第二搜索查询用来搜索可以应用于搜索结果的过滤器,在某些实施方式中,基于数据结构中的数据之间的关系来识别和应用过滤器。
以下描述和附图1=17提供了搜索系统的某些实施方式的附加细节和特征。
图1示出了根据本公开的某些实施方式的信息流图100。信息流图包括处理块108、查询快102、数据结构块104、内容块106和搜索结果块110。在某些实施方式中,搜索系统基于在查询块102中接收到的查询来使用来自数据结构块104、内容块106、未示出的其它源或其任何组合的信息来生成到搜索结果块110的输出。
查询块102包括提供给处理块108的搜索查询。在某些实施方式中,搜索查询是从用户接收到的查询。在某些实施方式中,搜索查询指向因特网搜索、文本搜索、图像搜索、数据库搜索、任何其它适当索引的搜索、任何其它适当的内容集合的搜索或其任何组合。在某些实施方式中,使用搜索查询来查询数据结构,诸如数据结构块104、内容块106的网页、任何其它适当数据或其任何组合。在某些实施方式中,搜索查询是基于文本的、基于图像的、基于音频的、任何其它适当格式或其任何组合。在示例中,搜索查询是对网页的基于文本的搜索。在另一示例中,搜索查询是对图像的基于图像的搜索。在某些实施方式中,从例如日历程序或web浏览器的其它应用、从任何其它适当源或其任何组合接收搜索查询。例如,搜索查询可包括从日历应用接收到的数据。
在某些实施方式中,可在搜索查询块102中检索可在处理块108中检索、可在任何其它适当过程、或者其任何组合中检索与搜索查询相关的搜索结果。在示例中,由处理块108来确定来自诸如数据结构块104的数据结构的搜索结果。在另一示例中,可由处理块108来检索来自内容块106的搜索的搜索结果。在某些实施方式中,从存储在数据结构104中的数据检索生成搜索结果。
数据结构块104包括包含结构化或另外组织的信息的数据结构。在某些实施方式中,从数据结构块104检索搜索结果。在某些实施方式中,基于存储在数据结构块104中的数据来确定度量。在某些实施方式中,数据结构块104包含数据图、数据库、索引、任何其它适当内容集合或其任何组合。在示例中,数据结构块104包括作为节点和边存储在图形结构中的数据集合。在某些实施方式中,数据结构块104包括知识图。在某些实施方式中,知识图包括以包含节点和边的图组织的数据。知识图的数据可包括关于东西与概念之间的关系的状态,并且那些语句可表示为图的节点和边。知识图的节点每个包含一条或多条数据,并且边表示在边连接的节点中包含的数据之间的关系。下面在图2-4中描述知识图的特定实施方式。
内容块106包括网站及其它适当内容。在示例中,内容块106包括因特网上的网页,包含文本、图像、视频、链接、其它适当内容或其任何组合。在某些实施方式中,内容块106包括来自数据库、私用内部网、公共网络、私用网络、任何其它适当的信息集合或其任何组合的信息。
在某些实施方式中,处理块108包括索引、列表、表或基于内容块106的内容确定的其它适当数据。在示例中,处理块108包括来自内容块106的网页的索引,其可用于例如搜索。
处理块108包括用于处理搜索查询、对搜索结果进行过滤、确定搜索过滤器的处理步骤、其它适当处理步骤或其任何组合,在某些实施方式中,下面参考图10、14和15的流程图来描述由处理块108执行的步骤。在某些实施方式中,处理块108包括用于解析从查询快102接收到的搜索查询的步骤。在数据结构块104中识别与解析的查询相关联的元素。使用已解析的查询和已识别的数据结构元素来构建结构化搜索。在某些实施方式中,将结构化搜索称为查询树。在某些实施方式中,使用查询树来从数据结构块104、内容块106、从任何其它适当源或其任何组合检索搜索结果。
在示例中,查询块102可包含查询[汤姆汉克斯影视]。在某些实施方式中,处理块108将查询划分成[汤姆汉克斯]和[影视]。在某些实施方式中,搜索系统识别与每个搜索单元相关联的数据结构块104的元素。在某些实施方式中,基于术语“汤姆汉克斯”和“影视”和数据结构块104的所识别的元素来生成查询树。
在某些实施方式中,处理块108包括用于确定搜索过滤器的处理步骤。在某些实施方式中,基于接收到的过滤查询、即旨在精化搜索结果的第二搜索词语来生成搜索过滤器。在某些实施方式中,搜索系统可使用在检索搜索结果时定义的查询树来确定搜索过滤器。在某些实施方式中,基于如在数据结构块104中定义的搜索结果与接收的过滤查询之间的关系来确定搜索过滤器。在某些实施方式中,使用过滤器来精化搜索结果,并且将结果输出到搜索结果块110。
搜索结果块110包括处理块108的输出。在某些实施方式中,搜索结果包括存储在数据结构块104中的数据的搜索结果、内容块106的索引、任何其它适当内容的搜索或其任何组合。在某些实施方式中,例如使用计算机的显示屏和/或扬声器来向用户呈现搜索结果块110的搜索结果。在某些实施方式中,使用由处理块108确定的搜索过滤器来精化和/或更新所显示的搜索结果。在某些实施方式中,基于其相关性来呈现搜索结果。在某些实施方式中,呈现技术可包括视觉技术、音频技术、任何其它适当技术或其任何组合。
以下描述和附图2-4描述了在本文中称为知识图的可用于本公开的某些实施方式的说明性数据结构。在某些实施方式中,知识图是包括在数据结构块104中的数据的特定实施方式。将理解的是知识图仅仅是可被搜索系统使用的数据结构的示例,并且可使用任何适当的数据结构。
在某些实施方式中,可使用任何一个或多个数据结构化技术在数据库中组织数据。例如,可在包含用边连接的节点的图中组织数据。在某些实施方式中,数据可包括关于东西与概念之间的关系的语句,并且那些语句可表示为图的节点和边。该节点每个包含一条或多条数据,并且边表示包含在边连接的节点中的数据之间的关系。在某些实施方式中,图包括由边连接的一个或多个节点对。在某些实施方式中,边和因此的图可以是有向的、无向的或两者。在示例中,有向边形成单向连接。在示例中,无向边形成双向连接。在示例中,可将有向和无向边两者的组合包括在同一图中。节点可包括任何适当的数据或数据表示。边可描述数据之间的任何适当关系。在某些实施方式中,对边进行标记或注释,使得其包括节点之间的连接以及关于该连接的描述性信息两者。可用不同的边将特定节点连接到一个或多个其它节点或其本身,使得形成扩展图。为了明了起见,在本文中将基于直接地上文描述的结构的图称为知识图。在某些实施方式中,知识图可对表示信息和在搜索中提供信息有用。
图2示出了根据本公开的某些实施方式的包含节点和边的说明性知识图部分200。说明性知识图部分200包括节点202、204、206和208。知识图部分200包括连接节点202和节点204的边210。知识图部分200包括连接节点202和206的边212。知识图部分200包括连接节点204和节点208的边214。知识图部分200包括连接节点202和节点208的边216和边218。知识图部分200包括将节点208连接到其本身的边220。可将边和一个或两个不同节点的每个上述群组称为三元组或3元组。如所示,节点202被边直接地连接到三个其它节点,而节点204和208被边直接地连接到两个其它节点。节点206被边直接地连接到仅一个其它节点,并且在某些实施方式中,将节点206称为末端节点。如所示,节点202和208被两个边连接,指示节点之间的关系由超过一个性质定义。如所示,节点208被边220连接至其本身,指示节点可与其本身相关。虽然说明性知识图部分200包含未被标记为有向的边,但将理解的是边每个可以是单向的或双向的。将理解的是图的此示例仅仅是示例,并且可采用任何适当尺寸或布置的节点和边。
一般地,可将知识图中的节点分组成多个种类。节点可表示实体引用、组织数据,诸如实体类型和性质、字面值以及其它节点之间的关系的模型。
在某些实施方式中,用任何适当技术来创建、定义、重新定义、改变或者另外生成实体类型、性质及其它适当内容。例如,内容可通过手动用户输入、通过对用户交互的自动响应、通过从外部源导入数据、通过任何其它适当技术或其任何组合来生成。例如,如果在知识图中未表示用于一般搜索的词语,则可添加表示该节点的一个或多个节点。在另一示例中,用户可手动地添加信息和组织结构。
知识图的节点可表示实体。实体是东西或概念,其是单个的、独有的、很好地定义的且可辨别的。例如,实体可以是人、地点、项目、思想、抽象概念、实体元件、其它适当东西或其任何组合。将理解的是在某些实施方式中,知识图包含实体引用而不是实体的物理实施例。例如,实体可以是乔治华盛顿的物理实施例,而实体引用是指代乔治华盛顿的抽象概念。在另一示例中,实体“纽约城市”指代物理城市,并且知识图使用例如由数据结构中的元素、实体的名称、任何其它适当元素或其任何组合表示的物理城市的概念。在适当的情况下,基于上下文,将理解的是本文所使用的术语实体可对应于实体引用,并且本文所使用的术语实体引用可对应于实体。
节点是唯一的,因为没有两个节点指代同一东西或概念。一般地,实体包括在语言上用名词表示的东西或概念。例如,色彩“蓝色”、城市“旧金山”以及想象动物“独角兽”每个都可以是实体。实体引用一般地指代实体的概念。例如,实体引用“纽约城市”指代物理城市,并且知识图使用例如数据结构中的元素、实体的名称、任何其它适当元素或其任何组合表示的物理城市的概念。
可将表示组织数据的节点包括在知识图中。这些在本文中可称为实体类型节点。如本文所使用的,实体类型节点可指代知识图中的节点,而实体类型可指代实体类型节点所表示的概念。实体类型可以是实体引用的定义特性。例如,可用下面进一步讨论的“是”边或链路将实体类型节点Y连接到实体节点X,使得图表示信息“实体X是类型Y”的信息。例如,可将实体引用节点“乔治华盛顿”连接到实体类型节点“总统”。可将实体引用节点连接到多个实体类型节点,可将例如“乔治华盛顿”连接到实体类型节点“人”和实体类型节点“军事指挥官”。在另一示例中,可将实体类型节点“城市”连接到实体引用节点“纽约城市”和“旧金山”。在另一示例中,概念“高人”可以任何方式作为知识图中的实体类型节点而存在,虽然是不完全地定义,例如知识图可能不一定包括“高”的严格定义.在某些实施方式中,实体类型节点“高人”及其它实体类型节点的存在可基于用户交互。
在某些实施方式中,实体类型节点可包括或连接到关于以下的数据:与该实体类型节点相关联的性质列表、实体类型节点所属于的域、描述、值、任何其它适当信息或其任何组合。域指代相关实体类型的集合。例如,域“电影”可包括例如实体类型“演员”、“导演”、“拍电影位置”、“影视”、任何其它适当实体类型或其任何组合。在某些实施方式中,实体与在多于一个域中的类型相关联。例如,实体引用节点“本杰明·富兰克林”可与域“政体”中的实体类型节点“政治家”以及域“企业”中的实体类型节点“发明家”相连。
在某些实施方式中,还可将与实体引用节点或实体类型节点相关联的性质表示为节点。例如,可将表示性质“人口”或“位置”的节点连接到实体类型节点“城市”。将实体类型和其性质的组合和/或布置称为模式。在某些实施方式中,将模式存储在与实体类型节点相关联的表或其它适当数据结构中,在某些实施方式中,知识图可以是自定义或自展输入引导式的,使得其包括定义节点、边以及图本身的概念的特定节点和边。例如,知识图可包含连接到性质节点的实体引用节点“知识图”,所述性质节点描述诸如“具有节点”和“具有边”之类的知识图性质。
可通过定义关系的边使在某些实施方式中称为字面值的特定值与末端节点中的特定实体引用相关联。字面值可指代信息的值和/或串。例如,字面值可包括日期、名称和/或数字。在示例中,可由用性质“具有人口”注释的边将实体引用节点“旧金山”连接到包含字面值“815,000”的末端节点。在某些实施方式中,末端节点可包含到长文本串和存储于在知识图外部的一个或多个文档中的其它信息的引用或链接。在某些实施方式中,将字面值存储为知识图中的节点。在某些实施方式中,将字面值存储在知识图中,但是不分配唯一识别引用,如下所述,并且其不能与多个实体相关联,在某些实施方式中,字面值类型节点可定义字面值类型,例如“日期/时间”、“数字”或“GPS坐标”。
在某些实施方式中,将边和两个节点的分组称为三元组。该三元组表示节点之间或者在某些实施方式中节点与其本身之间的关系。在某些实施方式中,对更高阶关系建模,诸如四元或n元关系,其中,n是大于2的整数。在某些实施方式中,将对该关系进行建模的信息存储在节点中,其可称为媒介节点。在示例中,将信息“人X捐赠工艺品Y给博物馆Z”存储在将实体引用节点连接到X、Y和Z的媒介节点中,其中,每个边识别每个相应连接的实体引用节点的角色。
在某些实施方式中,知识图可包括用于词语和/或实体的区别和消歧的信息。如本文所使用的,区别指代其中多个名称与单个实体引用相关联的多对一情况。如本文所使用的,消歧指代其中同一名称与多个实体相关联的一对多情况。在某些实施方式中,可为节点分配唯一识别引用。在某些实施方式中,唯一识别引用可以是字母数字串、名称、数字、二进制代码、任何其它适当标识符或其任何组合。唯一识别引用可允许系统向具有相同或类似文本标识符的节点分配唯一引用。在某些实施方式中,在区别、消歧或两者中使用唯一标识符及其它技术。
在区别的实施方式中,节点可与多个词语或区别别名相关联,其中词语与同一实体引用相关联。例如,词语“乔治华盛顿”、“乔治华盛顿”、“总统华盛顿”和“总统乔治华盛顿”可全部与单个实体引用相关联,例如知识图中的节点。这可提供知识图中的区别和简化。
在消歧的某些实施方式中,用其唯一识别引用、用知识图中的关联节点、用任何其它适当信息或其任何组合来定义具有相同或类似名称的多个节点。例如,可存在与城市“费城”相关的实体引用节点、与电影“费城”相关的实体引用节点和与奶油干酪品牌“费城”相关的实体引用节点。这些节点中的每一个可具有唯一识别引用,例如存储在数字,用于知识图内的消歧。在某些实施方式中,由多个节点之间的连接和关系来提供知识图中的消歧。例如,可将城市“纽约”与州“纽约”消歧,因为城市被连接到实体类型“城市”且州被连接到实体类型“州”。将理解的是更复杂的关系也可以定义节点并将其消歧。例如,可通过关联类型、通过与之相连的其它实体、通过特定性质、通过其名称、通过任何其它适当信息或其任何组合来定义节点。这些连接可在消歧时有用,例如可将被连接到节点“美国”的节点“Georgia”理解成表示美国的州,同时可将连接到节点“亚洲”和“东欧”的节点“Georgia”理解成表示东欧的国家。
在某些实施方式中,节点可包括或连接到定义一个或多个属性的数据。该属性可定义节点的特定性质。节点的该特定属性可取决于节点表示什么。在某些实施方式中,实体引用节点可包括或连接到:唯一识别引用、与节点相关联的实体类型列表、用于节点的区别别名列表、与实体引用相关联的数据、实体的文本描述、到实体的文本描述的链接、其它适当信息或其任何组合。如上所述,节点可包含到长文本串和存储于在知识图外部的一个或多个文档中的其它信息的引用或链接。在某些实施方式中,存储技术可取决于特定信息。例如,可将唯一识别引用存储在节点内,可将短信息串作为字面值存储在末端端子中,并且可将实体的长描述存储在被链接到知识图中的引用的外部文档中。
知识图中的边可表示定义两个节点之间的关系的语义连接。该边可表示前置词语句,诸如“是”、“具有”、“是类型”、“具有性质”、“具有值”、任何其它适当语句或其任何组合。例如,可用“出生日期”边将特定人的实体引用节点连接到包含他或她的特定出生日期的字面值的末端节点。在某些实施方式中,由实体引用的边连接定义的性质可涉及连接到该实体引用的类型的节点。例如,可将实体类型节点“影视”连接到实体引用节点“演员”和“导演”,并且可用边性质“具有演员”将特定电影连接到表示特定演员的实体引用节点。
在某些实施方式中,节点和边定义实体类型节点与其性质之间的关系,因此定义模式。例如,边可将实体类型节点连接到与性质相关联的节点,可将其称为性质节点。可将该类型的实体连接到定义那些性质的特定值的节点。例如,可将实体类型节点“人”连接到性质节点“出生日期”和节点“高度”。此外,可将节点“出生日期”连接到字面值类型节点“日期/时间”,指示与“出生日期”相关联的字面值包括日期/时间信息。被“是”边连接到实体类型节点“人”的实体引用节点也可被边“具有出生日期”连接到字面值“1732年2月22日”。在某些实施方式中,将实体引用节点“乔治华盛顿”连接到“出生日期”性质节点。将理解的是在某些实施方式中,使用相同的技术对模式和数据两者进行建模并存储在知识图中。这样,模式和数据两者可被相同的搜索技术访问。在某些实施方式中,将模式存储在单独的表格、图、列表、其它数据结构或其任何组合中。还将理解的是可用节点、边、字面值、任何其它适当的数据或其任何组合对性质进行建模。
例如,可用“是”边将实体引用节点“乔治华盛顿”连接到表示“人”的实体类型节点,因此指示实体引用的实体类型,并且还可用边“具有生日”连接到字面值“1732年2月22日”,因此定义实体引用的性质。这样,知识图通过连接到其它节点来定义与特定实体引用相关联的实体类型和性质两者,在某些实施方式中,“1732年2月22日”可以是节点,使得其被连接到在那天发生的其它事件。在某些实施方式中,还可将日期连接到年节点、月节点以及日节点。将理解的是可将此信息存储在字面值、节点、末端节点、互连实体的任何适当组合、任何其它适当布置或其任何组合中。
图3示出了根据本公开的某些实施方式的说明性知识图部分300。知识图部分300包括与“乔治华盛顿”节点302所表示的实体引用“乔治华盛顿”相关的信息。“乔治华盛顿”节点302被具有语义内容“是”的“是”边314连接到“美国总统”实体类型节点304,使得由节点302和304及边314定义的3元组包含信息“乔治华盛顿是美国总统”。同样地,用“托马斯杰斐逊”节点310、“是”边320和“美国总统”节点304来表示信息“托马斯杰斐逊是美国总统”。知识图部分300包括实体类型节点“人”324以及“美国总统”节点304。部分地用来自“人”节点324的连接来定义人类型。例如,用节点330和边332将类型“人”定义为具有性质“出生日期”,并且用节点334和边336定义为具有性质“性别”。这些关系部分地定义与实体类型“人”相关联的模式。
“乔治华盛顿”节点302在知识图部分300中示出为是实体类型“人”和“美国总统”,并且因此被连接到包含与那些类型相关联的值的节点。例如,用“具有性别”边318将“乔治华盛顿”节点302连接到“男性”节点306,因此指示“乔治华盛顿具有性别“男性””。此外,可将“男性”节点306连接到“性别”节点334,指示“男性是性别类型”。同样地,用“具有出生日期”边316将“乔治华盛顿”节点302连接到“1732年2月22日”节点308,因此指示“乔治华盛顿具有出生日期1732年2月22日”。还可用“具有就职日期”边330将“乔治华盛顿”节点302连接到“1789”节点328。
知识图部分300还包括被“是”边320连接到实体类型“美国总统”节点304且被“是”边328连接到“人”实体类型节点324的“托马斯杰斐逊”节点310。因此,知识图部分300指示“托马斯杰斐逊”具有实体类型“美国总统”和“人”。在某些实施方式中,将“托马斯杰斐逊”节点310连接到图3中未示出的节点,其引用其出生日期、性别以及就职日期。
将理解的是知识图部分300仅仅是示例,并且其可包括未示出的节点和边。例如,可将“美国总统”节点304连接到所有美国总统。还可将“美国总统”节点304连接到与实体类型相关的性质,诸如任期的持续时间,例如“4年”、任期极限,例如“2个任期”、办公室位置,例如“华盛顿D.C.”、任何其它适当数据或其任何组合。例如,“美国总统”节点304被“具有性质”边340连接到“就职日期”节点338,部分地定义用于类型“美国总统”的模式。同样地,可将“托马斯杰斐逊”节点310连接到包含与其所示的实体类型节点“美国总统”和“人”相关的其它信息的任何适当数目的节点以及未示出的其它实体类型节点,诸如“发明家”、“副总统”和“作家”。在另一示例中,可用类型“人”将“人”节点324连接到知识图中的所有实体。在另一示例中,可用年“1789”的性质将“1789”节点328连接到知识图中的所有事件。“1789”节点328是1789年所独有的,并且用其唯一识别引用与例如图3中未示出的题为“1789”的书消歧。在某些实施方式中,将“1789”节点328连接到实体类型节点“年”。
图4示出了根据本公开的某些实施方式的另一说明性知识图部分400。知识图部分400包括“加利福尼亚”节点402,其也可与区别别名相关联,例如“CA”、“Calif”、“金州”、任何其它适当的区别别名或其任何组合。在某些实施方式中,将这些区别存储在“加利福尼亚”节点402中。加利福尼亚被“是”边404连接到“美国州”实体类型节点406。“纽约”节点410和“德克萨斯”节点414也分别地被“是”边408和412连接到“美国州”节点406。“加利福尼亚”节点402被“具有首府城市”边420连接到“萨克拉曼多”节点422,指示“加利福尼亚的首府城市是萨克拉曼多”的信息。萨克拉曼多节点422进一步被“是”边424连接到“城市”实体类型节点426。同样地,“德克萨斯”节点414被“具有城市”边420连接到“休斯顿”节点428,其进一步被“是”边340连接到“城市”实体类型节点426。“加利福尼亚”节点402被“具有人口”边416连接到包含字面值“37,691,912”的节点418。在示例中,可由知识图基于外部网站或其它数据源来周期性地自动更新特定值“37,691,912”。知识图部分400可包括未示出的其它节点。例如,可将“美国州”实体类型节点406连接到定义该类型的性质的节点,诸如“人口”和“首府城市”。这些类型—性质关系可用来定义知识图部分400中的其它关系,诸如“具有人口”边416将实体引用节点“加利福尼亚”402与包含定义加利福尼亚的人口的字面值的末端节点418相连。
将理解的是虽然下面的图3的知识图部分300和图4的知识图部分400示出了知识图的部分,但可将所有信息包含在单个图内,并且在本文中所示的这些选择仅仅是示例。在某些实施方式中,可针对不同的各域、针对不同的各实体类型或者根据任何其它适当的界定特性保持单独的知识图。在某些实施方式中,根据尺寸约束来保持单独的知识图。在某些实施方式中,针对所有实体和实体类型保持单个知识图。
可使用任何适当的软件构造来实现知识图。在示例中,使用其中每个节点是具相关联的函数和变量的对象的面向对象构造来实现知识图。在本文中,边可以是具相关联的函数和变量的对象。在某些实施方式中,将包含在知识图中的数据、被知识图的节点指向的数据或两者跨位于被任何适当网络架构耦合的一个或多个地理位置上的一个或多个服务器而存储在任何适当的一个或多个数据储存库中。
图5示出了根据本公开的某些实施方式的包括用于将搜索查询分割的说明性步骤的流程图500。在某些实施方式中,可将接收的搜索请求分割一次或多次。
步骤510包括接收搜索请求512,其包括串[词1词2词3词4词5词6词7词8词9]。在某些实施方式中,搜索系统将此搜索请求分割成例如两个较短的搜索查询。将理解的是在某些实施方式中,该系统不需要将接收的搜索请求512分割,并且因此使用接收的搜索请求作为已分割的搜索查询522。
步骤520包括包含串[词1词2词3]的已分割的搜索查询522和包含串[词4词5词6词7词8词9]的已分割的搜索查询524。在某些实施方式中,系统将搜索查询分割为例如使将被系统单独地分析的概念分离。将理解的是可将接收的搜索请求分割成任何适当数目的搜索查询。还将理解的是步骤520是可选的,并且不需要将接收的搜索查询分割。还将理解的是搜索查询可包括接收的搜索查询的所有词和/或元素。还将理解的是分割可重叠,是非连续的,并且是非邻近的,使得来自接收的搜索查询的任何适当词和/或元素可用来形成已分割的搜索查询。例如,可以不在任何搜索查询中使用接收的搜索请求中的词。在另一示例中,可在两个已分割的搜索查询中使用接收的搜索请求中的特定词。
步骤530包括搜索查询532。在某些实施方式中,基于步骤520中的分割来生成已分割的搜索查询532。在所示示例中,搜索查询532对应于已分割的搜索查询522。
步骤540图示出搜索查询532到包括串[词1]的第一搜索单元542和到包括串[词2词3]的第二搜索单元544的解析。如本文所使用的,解析是指将搜索查询划分和/或分段成搜索单元,其对应于例如知识图中的实体。例如,可将查询[汤姆汉克斯影视]解析成搜索单元[汤姆汉克斯]和[影视]。将理解的是可使用搜索查询到搜索单元的任何适当解析。
在某些实施方式中,接收的搜索请求到一个或多个搜索已分割的搜索查询的分割和/或搜索查询到一个或多个搜索单元的解析包括任何适当的处理技术。例如,处理可包括下面描述的自然语言处理、关键字匹配、聚合用户选择数据、预定参数、任何其它适当的处理技术或其任何组合。在某些实施方式中,将搜索查询和/或搜索单元与知识图或其它适当数据结构中的数据相比较。在某些实施方式中,生成用于将搜索查询分割的分割和/或用于解析搜索单元的划分的多个布置,对于每个确定分值,并且基于分值来选择最佳布置和/或划分。例如,可以4种方式来解析步骤530的搜索查询:[词1|词2词3]、[词1词2|词3]、[词1|词2|词3]以及[词1词2词3],其中,“|”字符表示已解析的搜索单元之间的划分。在本示例中,可在知识图中识别与已解析的搜索单元相关联的实体,并且可基于流行度或任何其它适当度量来选择搜索单元的最佳解析。例如,在串是[汤姆汉克斯影视]的情况下,搜索系统可识别知识图中的[汤姆汉克斯]实体引用的存在,并且使用该信息来将搜索查询解析为[汤姆汉克斯|影视]而不是识别用于“汤姆”和“汉克斯”的单独相关实体。
图6示出了根据本公开的某些实施方式的说明性自然语言处理图600。在某些实施方式中,搜索系统使用自然语言处理来将搜索查询解析成一个或多个搜索单元。在某些实施方式中,搜索单元是词或短语。在示例中,搜索查询可包括图5的搜索查询532,并且可用自然语言处理来解析成图5的搜索单元542和544。
在某些实施方式中,图600示出了搜索查询[在2010中的汤姆汉克斯影视]的自然语言处理。在某些实施方式中,搜索系统可将查询划分成搜索单元[汤姆汉克斯]604、[影视]602、[在……中]606和[2010]608。在某些实施方式中,搜索系统可基于短语词典、搜索历史、用户偏好、预定参数、系统设置、任何其它适当参数或其任何组合来划分搜索查询。
在某些实施方式中,搜索系统可确定每个搜索单元的语音部分。例如,搜索系统可确定[影视]602是普通名词,[汤姆汉克斯]604是专有名词,[在……中]是介词,并且[2010]608是数字。将理解的是语音符号的此特定部分仅仅是示例性的,并且可使用任何适当的标识和符号。
在某些实施方式中,搜索系统可确定搜索查询中的搜索单元的语义函数和/或依赖性。例如,搜索系统可确定[影视]602是查询的根,[汤姆汉克斯]604是名词修饰词,因为其对根进行修饰,[在……中]606是介词,并且[2010]608是介词的对象。在某些实施方式中,搜索系统可如图600中所示地分配搜索单元之间的有向关系。例如,[在……中]606和[汤姆汉克斯]604可以是根[影视]602的子节点,并且2010可以是[在……中]606的子节点。在某些实施方式中,自然语言处理图600的箭头指示依赖性。在某些实施方式中,可使用自然语言处理来识别知识图中的相关实体,可使用来自知识图的信息,可以任何适当方式与知识图相关,可使用来自图1的数据结构块104的数据,或其任何组合。还将理解的是搜索系统可在不依赖于知识图的情况下执行自然语言处理。
图7示出了根据本公开的某些实施方式的说明性树形拓扑。在某些实施方式中,搜索系统生成可与搜索单元相关的一个或多个拓扑。例如,搜索系统生成具有与自然语言处理所识别的搜索单元相同数目的节点的拓扑。在某些实施方式中,树形拓扑可包括由自然语言处理识别的依赖性的树形拓扑。在某些实施方式中,随机地生成树形拓扑。在某些实施方式中,节点的数目可不等于搜索单元的数目。例如,搜索系统可在确定节点的数目时省略冠词“一”和“该”。
图7的树形拓扑示出了四节点树的四个可能布置。树形拓扑700示出了具有三个子节点的根节点。树形拓扑710示出了线性拓扑。树形拓扑720示出了具有两个分支的根节点。第一分支包括具有相对于根的孙节点的子节点。第二分支包括子节点。树形拓扑730示出了具有两个分支的根节点。第一分支包括子节点。第二分支包括具有相对于根的孙节点的子节点。
在某些实施方式中,搜索系统用搜索单元来扩增各种树形拓扑的节点。在某些实施方式中,搜索系统对于每个拓扑生成分值并基于那些分值来选择期望的拓扑。搜索系统可基于知识图中的数据、基于自然语言处理、基于任何其它适当技术或其任何组合来生成分值和/或选择拓扑。
在某些实施方式中,基于树形拓扑中的节点与知识图中的数据之间的关系来生成分值。例如,如果用搜索单元来扩增树形拓扑指示在知识图中不具有相应连接的两个搜索单元之间的连接,则可为该拓扑分配相对低的分值。例如,如果扩增树形拓扑导致[汤姆汉克斯]与[影视]之间的连接,并且在知识图中在[汤姆汉克斯]实体引用与[影视类型]之间存在相应连接,则可以为该树形拓扑分配相对高的分值。在本示例中,如果树形拓扑的特定扩增导致对于其而言在知识图中不存在相应连接的两个实体引用之间的连接,例如[汤姆汉克斯]和[美国总统],则可以为该拓扑分配较低的分值。在某些实施方式中,基于连接强度或其它置信度度量来确定用于拓扑的分值。例如,连接[汤姆汉克斯]-[影视]和[汤姆汉克斯]-[2010]可两者都存在于知识图中,然而,该系统可确定[汤姆汉克斯]-[影视]连接更强。此确定可基于连接的唯一性,例如,可将许多人-类型实体引用连接到节点[2010],同时将相对小的数目的人-类型实体引用连接到[影视],指示到电影的连接更强。在另一示例中,[影视]和[汤姆汉克斯]可共享相对大数目的相互知识图连接,而[2010]和[汤姆汉克斯]共享相对少的相互连接。
在另一示例中,使用自然语言处理来对树形拓扑进行评分和选择。在某些实施方式中,自然语言处理可对应于在图6的自然语言处理图600中描述的处理。例如,如果将语音的部分分配给树形拓扑,其导致更加有逻辑性或语法上正确的语言,则该拓扑可接收到较高的分值。在示例中,将根与介词的对象相连、因此导致词语[在2010中的影视]的介词[在……中]可接收到比将根与名词修饰词相连、因此导致词语[在汤姆汉克斯中的影视]的介词[在……中]高的分值。在另一示例中,该系统可确定将介词放置为没有任何孙节点的子节点的树形拓扑将导致语法上不正确的结构,诸如[影视汤姆汉克斯在……中]。在某些实施方式中,系统可基于自然语言处理对自然语言查询[在2010中的汤姆汉克斯影视]确定树形拓扑730是期望的拓扑。
图8示出了根据本公开的某些实施方式的说明性短语树800。在某些实施方式中,可通过向树形拓扑分配搜索单元来生成短语树。在某些实施方式中,如相对于图7所述地选择树形拓扑。例如,可向树形拓扑730分配图600的搜索单元以生成短语树800。搜索单元[影视]被分配给根节点802。搜索单元[汤姆汉克斯]被分配给子节点804。搜索单元[在……中]被分配给边806。搜索单元[2010]被分配给孙节点808。将理解的是在某些实施方式中,树形拓扑的节点可与短语树中的边或节点、例如边806相关联。在某些实施方式中,由自然语言处理识别的依赖性与短语树的结构相关。将理解的是这仅仅是示例性的,并且在某些实施方式中可使用其它技术。
将理解的是短语树800仅仅是示例性的,并且可基于任何适当的搜索查询来生成任何适当的树。还将理解的是在某些实施方式中,查询树是理论构造,并且搜索系统在依赖于短语树所描述的关系的同时不使用如图8中所示的图形表示。
图9示出了根据本公开的某些实施方式的说明性查询树。在某些实施方式中,搜索系统基于一个或多个短语树来生成一个或多个查询树。在某些实施方式中,查询树将具有与相应短语树相同的拓扑。在某些实施方式中,搜索系统识别与分配给短语树的每个搜索单元相关联的知识图中的数据。该搜索系统通过将知识图数据或对数据的引用放置在与短语树上的相关搜索单元的位置相对应的查询树上的位置上来生成查询树。
查询树900包括与图8的短语树800相关的查询树。查询树900包括“类型:电影”根节点902。在某些实施方式中,根节点902对应于图8的“影视”根节点802。在某些实施方式中,搜索系统可基于知识图中的数据来识别搜索单元[影视]与知识图实体类型“电影”相关。搜索系统可构建查询树,其中,根节点与知识图的“电影”实体引用相关联。在某些实施方式中,查询树还可包括与相关知识图节点、串、值、节点关系信息、任何其它适当信息或其任何组合相关联的唯一识别引用。
查询树900包括通过“性质:主演的电影”边904连接到根节点902的“实体:汤姆汉克斯”节点906。类似于根节点,可基于与短语树节点804相关联的识别知识图数据来分配节点906。查询树900包括通过“性质:发行日期”边908连接到根节点902的“值:2010”节点910。节点910可与例如包含知识图中的字面值“2010”的末端节点相关联。将理解的是查询树900仅仅是示例性的,并且可基于任何适当的搜索查询来生成任何适当的查询树。
在某些实施方式中,搜索系统可基于流行度、系统设定、用户偏好、预定参数、排名列表、与其它搜索单元的关系、任何其它适当信息或其任何组合来识别相关知识图数据。例如,搜索系统可由于与演员相关联的聚合流行度分值而向节点906分配著名演员“汤姆汉克斯”而不是地震学家“汤姆汉克斯”。在某些实施方式中,可由于搜索查询中的词“影视”而选择演员“汤姆汉克斯”。在某些实施方式中,用于“汤姆汉克斯地震学家”的搜索查询可导致搜索单元“汤姆汉克斯”与知识图中的地震学家“汤姆汉克斯”相关联。在其中“汤姆汉克斯”是唯一搜索单元的另一示例中,搜索系统可依赖于流行度分值。
在某些实施方式中,搜索系统可基于与查询树节点相关的知识图节点之间的知识图中的关系来向查询树的边分配信息。例如,搜索系统可识别知识图中的“汤姆汉克斯”实体引用和知识图中的“电影”实体类型。搜索系统可确定知识图节点中的关系是“主演的电影”。搜索分配可向查询树的边904分配“主演的电影”。在某些实施方式中,可基于知识图关系、知识图性质、搜索单元、相关搜索查询、用户输入、用户偏好、系统设定、预定参数、任何其它适当信息或其任何组合来分配查询树的边。
在某些实施方式中,可基于多个短语树来生成多个查询树。在某些实施方式中,可对多个树形拓扑生成查询树。在某些实施方式中,可基于在知识图的节点之间识别的关系来选择拓扑。因此,如果查询树的拓扑要求在知识图中的不相关或者弱相关的两个节点之间分配关系,则搜索系统可认为树形拓扑不如其中非相关节点在树的单独分支上的拓扑那么合适。在某些实施方式中,搜索系统向每个生成的查询树分配分值并选择具有最期望分值的树。在某些实施方式中,该分值是基于关联节点之间的知识图中的关系、聚合用户选择数据、系统设定、预定参数、任何其它适当信息或其任何组合。例如,可向包括边性质的查询树分配较高分值,所述边性质与一般地被较少访问和/或不那么流行的性质相比在知识图中一般地被更多地访问和/或更加流行。在另一示例中,边性质包括对查询树的分值有贡献的排名。
图10示出了根据本公开的某些实施方式的包括用于生成查询树的说明性步骤的流程图1000。在某些实施方式中,流程图1000的步骤可与图5-9中所示的技术相关。
在步骤1002中,搜索系统解析第一搜索查询以识别搜索单元。在某些实施方式中,搜索系统如图5的流程图500中所示地解析搜索查询。在某些实施方式中,将接收的搜索请求分割成多个搜索查询。在某些实施方式中,将搜索查询解析成一个或多个搜索单元。在某些实施方式中,搜索单元包括一个或多个词。例如,搜索单元可以是单个词,诸如[影视],或者是短语,诸如[汤姆汉克斯]。在某些实施方式中,可通过使搜索查询的部分与知识图中的节点匹配来识别搜索单元。在示例中,可将搜索查询[最佳购买]识别为与电子商店[最佳购买]、单个知识图节点相关,并且可将其识别为与用于“最佳”和“购买”的两个单独知识图节点相关。在某些实施方式中,搜索系统基于聚合用户选择数据、用户输入、系统给设定、任何其它适当信息或其任何组合来确定分割。在某些实施方式中,搜索系统向用户呈现多个可能搜索单元以用于精化和/或选择。在某些实施方式中,搜索系统使用搜索单元的多个组合来执行流程图1000的后续步骤,并且基于例如查询树或搜索结果来选择搜索单元组合。在某些实施方式中,解析搜索查询包括自然语言处理,诸如图6的图600中所示的处理。
在步骤1004中,搜索系统识别对应于搜索单元的知识图的元素。例如,搜索系统可识别与在步骤1002中识别的搜索单元相对应的知识图中的节点或边。在某些实施方式中,识别对应节点或边包括识别类似或匹配文本、类似或匹配的相关性质、任何其它适当技术或其任何组合。例如,可将搜索查询[影视]识别为对应于知识图节点[电影]。在某些实施方式中,识别多个可能对应节点,并且基于聚合的用户选择数据、匹配的接近度、知识图中的相关节点、其它搜索单元、用户输入、预定参数、系统设定、任何其它适当信息或其任何组合从多个可能中选择节点。
在步骤1006中,搜索系统生成拓扑。在某些实施方式中,生成拓扑包括确定树形拓扑,诸如图7中所示的那些。在某些实施方式中,拓扑包括节点和边的布置。在某些实施方式中,节点的数目与搜索单元的数目相同。在某些实施方式中,搜索系统生成多个拓扑。在某些实施方式中,搜索系统在后续处理步骤中选择多个拓扑中的一个,诸如在从每个树形拓扑生成查询树之后。在某些实施方式中,拓扑的特定布置至少部分地基于自然语言处理或用于识别搜索单元之间的依赖性和关系的任何其它适当技术。在某些实施方式中,节点的数目可与搜索单元的数目相同。在某些实施方式中,可基于那些单元的内容根据搜索单元的数目来调整节点的数目。例如,诸如“一”和“该”之类的冠词可以不用来确定节点的数目。
在步骤1008中,搜索系统生成短语树。在某些实施方式中,图8的短语树800是在步骤1008中生成的短语树的示例。在某些实施方式中,步骤1008的短语树可包括在步骤1006中生成的树形拓扑。在某些实施方式中,搜索系统将在步骤1002中识别的搜索单元分配给在步骤1006中生成的树形拓扑的节点。在某些实施方式中,将树形拓扑的节点分配给短语树的边。例如,如图8的短语树800中所示,将搜索单元[在……中]分配给边。在某些实施方式中,可通过将不同布置的搜索单元分配给树形拓扑的节点来生成多个短语树。同样地,基于多个树形拓扑来生成多个短语树。在某些实施方式中,基于知识图中的数据、自然语言处理、用户输入、系统设置、诸如查询树生成之类的短语树的进一步处理、预定参数、任何其它适当信息或其任何组合从多个短语树中选择短语树。
在步骤1010中,搜索系统生成查询树。在某些实施方式中,使用在步骤1008中生成的短语树和与在步骤1004中识别的搜索单元相对应的知识图的元素来生成查询树。在某些实施方式中,图9的查询树900是在步骤1010中生成的查询树的示例。在某些实施方式中,在步骤1010中生成的查询树可具有与在步骤1008中生成的短语树相同的拓扑。在某些实施方式中,搜索系统可从知识图向查询树的节点分配数据。在某些实施方式中,来自知识图的数据是被识别为与分配给相同位置上的短语树的节点的搜索单元相对应的数据。因此,可将生成查询树视为用其对应的知识图元素来替换分配给短语树的节点的搜索单元。
在某些实施方式中,如针对图9的查询树900所述地将信息分配给查询树的边。在某些实施方式中,可基于知识图中的对应节点之间的关系来识别查询树的节点之间的关系。例如,如果对应于查询树中的两个节点的节点在知识图中被特定性质连接,则可向连接那些节点的查询树边分配该性质。在某些实施方式中,可基于知识图数据、搜索单元、搜索查询、用户输入、系统设置、聚合用户选择数据、任何其它适当偏好或其任何组合来分配查询树边。在某些实施方式中,查询树的节点与来自知识图的任何适当数据相关联,例如实体节点、实体类型节点、字面值、串或其任何组合。在某些实施方式中,基于步骤1006的多个树形拓扑和/或步骤1008的多个短语树来生成多个查询树。可基于如上所述的分值、用户输入、任何其它适当技术或其任何组合从多个查询树中选择查询树。
在某些实施方式中,查询树包括对应于短语树节点的子树,使得查询树包括比其对应短语树多的节点。在示例中,短语树节点“火山”对应于查询树中的子树,其包括被边“性质:Mountain_Type”连接到子节点“实体:火山”的子树根类型节点“类型:山”。在某些实施方式中,通过查找也对应于类型的实体列表来识别子树。例如,“火山”可以是类型“山”的实体,并且也可以是用于实体“Mt.Fuji”和“Mt.Vesuvius”的类型。
在步骤1012中,搜索系统使用查询树来检索搜索结果,在某些实施方式中,搜索系统可使用查询树从知识图中检索搜索结果。例如,搜索系统可从知识图中检索具有与查询树所描述的关系匹配的关系的实体。在某些实施方式中,搜索系统可使用查询树来从因特网、从数据库、从信息列表、从任何其它适当数据或数据结构或其任何组合检索搜索结果。在示例中,搜索系统可识别具有与查询树所映射的那些类似的关系的知识图的一部分,并且识别与包括在映射关系中的实体相关的实体。在图9的查询树900的示例中,搜索系统可识别与实体类型电影相关联的知识图的实体,其被性质“主演的电影”连接到实体引用“汤姆汉克斯”且被性质发行日期连接到值“2010”。将理解的是,按照任何适当的顺序用任何适当的技术来执行映射和比较。
将理解的是,在流程图1000中所列的特定步骤仅仅是示例性的,并且可对步骤进行添加、去除、改变、另外适当地修改或其任何组合。
图11示出了根据本公开的某些实施方式的具有搜索过滤器的说明性用户界面1100,在某些实施方式中,用户界面1100包括相对于流程图1000的步骤呈现的内容。在某些实施方式中,用户界面1100包括相对于接收到搜索过滤器呈现的内容。
用户界面1100包括搜索查询输入1102、显示选项栏1104、移动菜单1106、比较菜单1108、过滤搜索查询输入1110、搜索结果标题1112、搜索结果数目1114、第一搜索结果1116、第二搜索结果1118、第三搜索结果1120、第四搜索结果1122、第五搜索结果1124、初始版本过滤器1126、流派过滤器1134以及评级过滤器1138。搜索查询输入1102可接收包括期望搜索查询的用户输入。例如,搜索系统可通过在搜索查询输入1102中接收到的文本输入来接收搜索查询[在2010中的汤姆汉克斯影视]。搜索系统可通过任何适当的技术响应于接收的搜索查询来确定一组搜索结果。例如,搜索系统可生成查询树并从知识图检索搜索结果,如上所述。在另一示例中,搜索系统可执行因特网、索引、数据库的搜索、执行任何其它适当搜索或其任何组合。搜索系统可呈现例如五个搜索结果。可与搜素结果标题1112[在2010中有汤姆汉克斯的影视]一起呈现搜索结果。在某些实施方式中,例如在使用查询树来检索搜索结果的情况下,搜索结果标题1112可基于查询树。在某些实施方式中,搜索查询标题1112可基于接收的搜索查询、其它系统设置、偏好、输入或其任何组合。在某些实施方式中,可省略搜索结果标题1112。在某些实施方式中,搜索结果数目1114指示呈现的搜索结果的数目。在某些实施方式中,可省略搜索结果数目1114。
在某些实施例中,可以基于聚合用户选择数据、搜索结果的固有顺序、与如在诸如知识图之类的数据结构中定义的搜索结果相关的顺序、通过对每个搜索结果计算特定于域的度量并将其组合成排名分值而确定的顺序、通过系统设置、通过任何其他适当技术或其任何组合来将用户界面1100中的搜索结果排序。
在某些实施方式中,显示选项栏1104接收指示期望的呈现技术的输入。例如,可将搜索结果呈现为列表、网格、时间线、地图、任何其它适当技术或其任何组合。在某些实施方式中,接收显示选项栏1104中的技术中的一个的选择可促使搜索结果的呈现被重配置。
在某些实施方式中,移动菜单1106包括下拉菜单或任何其它适当布置,包括到搜索结果的相关集合的链接,在某些实施方式中,基于知识图中的数据、用户输入、聚合用户选择数据、流行度、用户偏好、系统设置、预定参数、任何其它适当信息或其任何组合来识别其它集合。在某些实施方式中,比较菜单1108接收指示期望比较搜索结果的集合的输入。例如,搜索系统可将当前呈现的一组搜索结果与先前呈现的一组搜索结果相比较和/或对先前呈现的一组搜索结果呈现当前呈现的一组搜索结果。例如,该系统可呈现两组的组合,可呈现两组的重叠元素,可呈现任何其它适当组合或其任何组合。
在某些实施方式中,过滤搜索查询输入1110从用户接收与呈现的一组搜索结果的期望过滤和/或精化相关的输入。例如,在搜索结果是在2010年发行的一组影视的情况下,接收的过滤器[喜剧]可指示仅呈现具有性质[喜剧]的呈现的该组中的影视。在某些实施方式中,过滤索查询输入1110是文本框。在某些实施方式中,过滤索查询输入1110包括搜索按钮。在某些实施方式中,通过接收指示搜索按钮的输入、接收输入键输入、接收鼠标点击、接收任何其它适当输入或其任何组合来出发过滤。
初始发行过滤器1126可按其初始发行日期来过滤搜索结果。在某些实施方式中,在接收的查询中识别对一组搜索结果的特定性质的限制。在某些实施方式中,呈现与该限制有关的搜索过滤器。例如,在搜索查询是针对2010年的影视的情况下,可呈现用于影视发行日期的过滤器。在某些实施方式中,过滤器的内容是基于被用作过滤器的信息类型。在示例中,日期过滤器包括时间线,并且种类过滤器包括复选框列表。初始发行过滤器1126包括时间线1130。时间线1130包括日期指示符1128,呈现所选日期的范围。时间线1130包括滑块1136,其可接收指示包括的日期范围的期望重配置的输入。在某些实施方式中,基于接收的搜索查询来选择最初选择的日期或其它适当过滤器。例如,可在接收到搜索查询之后选择日期范围2010,并且该系统可基于接收到初始发行过滤器1126的输入而呈现其它年或年范围。将理解的是用影视的初始发行进行的过滤仅仅是示例性的,并且可使用搜索结果的任何适当结合的任何适当过滤器。
流派过滤器1134可包括流派的集合,作为单独过滤方面而呈现,诸如[动作]和[冒险]。在某些实施方式中,呈现与搜索结果相关的一个或多个过滤器,虽然在接收的搜索查询中未指示。例如,在搜索结果是影视的集合的情况下,可自动地呈现流派过滤器。在未示出的另一示例中,在搜索结果是城市的集合的情况下,可自动地呈现用于那些城市位于其中的国家的过滤器。在某些实施方式中,过滤器可包括复选框或其它指示符,使得可选择一个或多个过滤方面。在某些实施方式中,配置过滤器使得只能选择一个过滤方面。
在某些实施方式中,过滤器可在折叠和/或收缩的视图中,并且搜索系统可接收输入以呈现该过滤器的更多部分。例如,可使评级过滤器1138折叠,并且搜索系统可接收箭头1140的输入,指示扩展该过滤器的呈现的期望。将理解的是,箭头1140仅仅是示例性的,并且可使用任何适当指示符,诸如加号或下拉栏。
图12示出了根据本公开的某些实施方式的说明性过滤查询树1200.在某些实施方式中,搜索系统基于接收的过滤查询来过滤搜索结果。可例如在图11的过滤搜索查询框1110中接收过滤查询。在某些实施方式中,搜索系统基于原始搜索查询和过滤查询的组合如上所述地生成查询树。例如,如果原始搜索查询是[在2010中的汤姆汉克斯影视]且过滤查询是[喜剧],则搜索系统可基于[在2010中的汤姆汉克斯影视喜剧]来生成短语树。在某些实施方式中,搜索系统可比较基于原始搜索查询的查询树和基于组合的新查询树,并基于该比较来确定用于搜索结果的过滤器。
过滤查询树1200包括根节点1202“电影”、被边1204“主演的电影”连接到根节点1202的子节点1206“汤姆汉克斯”、被边1208“发行日期”连接到根节点1202的子节点1210“2010”以及被边1212“流派”连接到根节点1202的子节点1214“喜剧”。在某些实施方式中,使用流程图1000的步骤来生成过滤查询树1200。在某些实施方式中,搜索系统将包括原始搜索结果的查询树部分地用于过滤查询的消歧。例如,在生成查询树时识别的关系可帮助基于查询树中的相关词语的存在而在java编程语言、爪哇岛以及用于咖啡的口语之间将对[Java]的搜索消歧。将理解的是,在某些实施方式中,该系统执行所有处理步骤以生成查询树,但是向先前已知的查询树添加新节点。
在某些实施方式中,将过滤查询树1200与针对最初接收到的搜索结果生成的查询树相比较。例如,在原始搜索查询是[在2010中的汤姆汉克斯影视]且过滤查询是[喜剧]的情况下,将过滤查询树1200与查询树900相比较。在某些实施方式中,相对于查询树900来识别过滤查询树1200中的附加节点。例如,可识别附加子节点1214“喜剧”并用作过滤查询。在本示例中,对现有的一组搜索结果进行过滤以仅呈现满足具有喜剧流派的过滤条件的那些。
将理解的是,过滤查询树和查询树的上述示例仅仅是示例性的。搜索系统可使用涉及查询树、短语树、索引、数据库、列表、知识图、任何其它适当信息或其任何组合的任何适当的布置、数目、配置和/或技术来识别过滤查询。在示例中,搜索系统可基于过滤查询来识别多于一个附加节点。在示例中,搜索系统可基于过滤查询来生成多个查询树,并且将那些中的每一个单独地与原始查询树相比较。
图13示出了根据本公开的某些实施方式的具有已过滤的搜索结果的说明性用户界面1300。在某些实施方式中,用户界面1300包括基于图11的用户界面1100的呈现内容响应于接收[喜剧]过滤查询而呈现的内容。在某些实施方式中,可至少部分地基于图12的过滤查询树1200来确定用户界面1300的内容。用户界面1300包括搜索查询标题1312。在某些实施方式中,搜索查询标题1312包括与过滤搜索查询树相关的信息,诸如图12的过滤搜索查询树1200。在某些实施方式中,用搜索结果数目1314来指示搜索结果的数目。例如,在图11中的用户界面1100中呈现的原始的一组搜索结果包含五个影视的情况下,在过滤该影视以仅呈现喜剧流派的影视之后,搜索系统仅呈现两个影视。
在某些实施方式中,流派过滤器1310呈现流派的列表。指示符1318指示选择了喜剧流派。在某些实施方式中,基于知识图中的相关实体识别过滤器中的其它方面。在某些实施方式中,搜索系统基于在过滤查询框中接收到用户输入[喜剧]而自动地呈现并选择流派过滤器1310中的戏剧过滤方面。
将理解的是,在接收到与该过滤器相关的过滤查询之前可呈现或者可不呈现过滤器及其各方面。例如,在呈现用于[流派]和[初次发行]的过滤器的情况下,搜索系统可接收用于[法国]的过滤器,并且搜索系统可确定该过滤查询与起源的国家相关,并且在自动地选择方面[法国]的情况下呈现用于起源的国家的过滤。在某些实施方式中,基于呈现的搜索结果、搜索查询、过滤查询、知识图中的关系和其它数据、系统设置、预定参数、聚合用户选择数据、任何其它适当信息或其任何组合来确定特定呈现过滤器和那些过滤方面。
图14示出了根据本公开的某些实施方式的包括用于对搜索结果进行过滤的说明性步骤的流程图1400。在某些实施方式中,流程图1400包括将通过生成诸如图12的过滤查询树1200之类的过滤查询树来识别搜索结果过滤器的步骤。
在步骤1402中,搜索系统生成第一查询树。在某些实施方式中,如图10的步骤1010中所述地生成第一查询树。在示例中,解析搜索查询以识别搜索单元。基于搜索单元和树形拓扑来生成短语树。使用短语树和来自与每个相应搜索元素相关联的知识图的数据来生成查询树。
在步骤1404中,搜索系统提供第一组搜索结果。在某些实施方式中,如图10的步骤1012中所述地检索第一组搜索结果。在示例中,使用在步骤1402中生成的查询树来识别知识图中的搜索结果。在另一示例中,使用查询树来生成web搜索查询。
在步骤1406中,搜索系统接收过滤查询。在某些实施方式中,在显示屏上呈现的第二选择框中接收过滤查询。在示例中,在图11的过滤搜索查询输入1110中接收过滤查询。在某些实施方式中,在与接收原始搜索查询相同的搜索框中、在第二搜索框中、用任何其它适当输入方法或其任何组合来接收过滤查询。过滤查询可包括文本、图像、语音输入、任何其它适当过滤搜索或其任何组合。
在步骤1408中,搜索系统生成第二查询树。在某些实施方式中,搜索系统如图12的过滤查询树1200中所述地生成查询树。在示例中,搜索系统基于原始搜索查询和过滤搜索查询的级联来生成查询树。在另一示例中,搜索系统基于过滤搜索查询和原始搜索查询的解析来生成过滤搜索查询。
在步骤1410中,搜索系统基于第一和第二查询树的比较来确定搜索过滤器。在某些实施方式中,搜索系统将在步骤1402中生成的第一查询树与在步骤1408中生成的过滤查询树相比较。在某些实施方式中,如针对图12的过滤查询树1200所述地比较查询树。在某些实施方式中,搜索系统识别在原始查询树中不存在的在过滤查询树中存在的节点或其它内容,因此识别附加节点和/或内容。将理解的是此比较仅仅是示例性的,并且可使用原始和过滤查询树之间的任何适当比较。例如,在某些实施方式中使用第二查询树作为过滤器。
在步骤1412中,搜索系统基于过滤器提供第二搜索结果。在某些实施方式中,基于在步骤1410中识别的附加节点来确定搜索过滤器。在某些实施方式中,搜索过滤器仅基于第二查询树。在某些实施方式中,过滤器包括可与知识图中的数据相关联的上下文信息。在示例中,基于查询树中的其它影视相关数据,可将过滤查询[喜剧]识别为与影视[喜剧]的流派相关。在另一示例中,基于查询树中的其它书籍相关数据,可将过滤查询[2010]识别为与书籍出版年份[2010]相关。在某些实施方式中,搜索系统可识别过滤方面及其它相关过滤器两者。例如,在已在步骤1410中识别的附加节点与知识图中的实体类型相关联的情况下,可将该类型的其它实体提供为过滤方面。例如,在查询涉及影视的情况下,可由搜索系统将对[德语]的搜索识别为指示语言为德语的电影。搜索系统可识别其它影视语言,诸如法语、英语以及西班牙语,并且可将该附加语言呈现为可选过滤方面。在示例中,搜索系统可如图13的用户界面1300中所示地呈现过滤器,其具有语言列表且自动地选择“德语”。
在某些实施方式中,搜索系统不在步骤1412中自动地更新搜索结果且仅呈现所识别的过滤器。例如,搜索系统可呈现[喜剧]及图11的流派过滤器1134中的其它流派过滤器,但是在未接收到进一步用户输入的情况下可不更新搜索结果。
将理解的是,在流程图1400中所列的特定步骤仅仅是示例性的,并且可对步骤进行添加、去除、改变、另外适当地修改或其任何组合。
图15示出了根据本公开的某些实施方式的包括用于提供已过滤的搜索结果的说明性步骤的流程图1500。在某些实施方式中,流程图1500包括用以通过映射接收的过滤查询与搜索结果之间的关系来确定过滤查询的步骤。在某些实施方式中,流程图1500描述了用于确定过滤器的在图14的流程图1400中所述的技术的替选技术。将理解的是搜索系统可使用流程图1500的技术、图14的流程图1400的技术、任何其它适当技术或其任何组合来确定过滤器。
在步骤1502中,搜索系统提供第一组搜索结果。在某些实施方式中,如图10的步骤1012中所述地检索第一组搜索结果。在某些实施方式中,搜索系统可使用任何适当的搜索技术来提供第一组搜索结果。例如,搜索系统可使用查询树、关键字搜索、web搜索、任何其它适当搜索或其任何组合。
在步骤1504中,搜索系统接收过滤查询。在某些实施方式中,在显示屏上呈现的第二选择框中接收过滤查询。在示例中,在图11的过滤搜索查询输入1110中接收过滤查询。在某些实施方式中,在与接收原始搜索查询相同的搜索框中、在第二搜索框中、用任何其它适当输入方法或其任何组合来接收过滤查询。过滤查询可包括文本、图像、语音输入、任何其它适当过滤搜索或其任何组合。
在步骤1506中,搜索系统识别与过滤查询相关联的知识图中的元素。知识图中的元素可包括节点、边、末端节点、字面值、实体、实体类型、任何其它适当的知识图数据或其任何组合。在某些实施方式中,搜索系统识别知识图中、任何其它适当数据结构中或其任何组合的元素。在某些实施方式中,搜索系统识别与接收的查询相关联的知识图中的节点。例如,在接收的查询是文本串[喜剧]的情况下,搜索系统可识别与流派“喜剧”相关联的知识图中的节点。
在步骤1508中,搜索系统映射知识图中的元素与搜索结果之间的关系。在某些实施方式中,该组搜索结果中的每个搜索结果与知识图中的实体引用相关联。在某些实施方式中,搜索系统映射在步骤1506中识别的知识图的元素与每个相应搜索结果之间的关系。例如,在所识别的元素是与影视流派“喜剧”相关联的节点且搜索结果全部是类型“电影”的情况下,搜索系统可识别到接收的过滤查询指示针对具有流派“喜剧”的电影的搜索结果进行过滤的意图。将理解的是,搜索系统可映射过滤查询与搜索结果之间的任何适当关系,并且可基于该映射来确定任何适当的过滤器。
在步骤1510中,搜索系统基于知识图中的元素与搜索结果之间的关系来确定过滤器。在某些实施方式中,搜索系统如针对图13的用户界面1300所述地呈现过滤器和所选过滤方面。在某些实施方式中,还提供了相关过滤方面。
在步骤1512中,搜索系统基于过滤器提供第二组搜索结果。在某些实施方式中,搜索系统将呈现的搜索结果重配置成仅包括满足过滤准则的那些。在示例中,响应于在图11的过滤搜索查询输入1110中接收到过滤查询[喜剧]而呈现用于图13的用户界面1300的结果。
将理解的是在流程图1500中所列的特定步骤仅仅是示例性的,并且可对步骤进行添加、去除、改变、另外适当地修改或其任何组合。
以下描述和附图16-17描述了可在本公开的某些实施方式中使用的说明性计算机系统。将理解的是,可在任何适当的计算机或计算机组合上实现知识图和关联技术。
图16示出了根据本公开的某些实施方式的说明性计算机系统。系统1600可包括一个或多个用户设备1602。在某些实施方式中,用户设备1602可包括智能电话、平板计算机、台式计算机、膝上型计算机、个人数字助理、PDA、便携式音频播放器、便携式视频播放器、移动游戏设备、能够提供内容的其它适当用户设备或其任何组合。
可直接地通过连接1606、通过无线中继器1610、用耦合到网络1604的任何其它适当方式或用其任何组合将用户设备1602耦合到网络1604。网络1604可包括因特网、计算机和服务器的离散网络、本地网络、公共内部网、私用内部网、其它耦合的计算系统或其任何组合。
可用有线连接1606将用户设备1602耦合到网络1604。连接1606可包括以太网硬件,同轴电缆硬件、DSL硬件、T-1硬件、光纤硬件、模拟电话线硬件、能够通信的任何其它适当有线硬件或其任何组合。连接1606可包括传输技术,包括TCP/IP传输技术、IEEE 1702传输技术、以太网传输技术、DSL传输技术、光纤传输技术、ITU-T传输技术、任何其它适当传输技术或其任何组合。
可用无线连接1608将用户设备1602无线地耦合到网络1604。在某些实施方式中,无线中继器1610通过无线连接1608从用户设备1602接收所发射的信息并通过连接1612将其与网络1604进行传送。无线中继器1610通过连接1612从网络1604接收信息并通过无线连接1608将其与用户设备1602进行传送。在某些实施方式中,无线连接1608可包括蜂窝式电话传输技术、码分多址或CDMA传输技术、全球移动通信系统或GSM传输技术、通用分组无线电服务或GPRS传输技术、卫星传输技术、红外传输技术、蓝牙传输技术、Wi-Fi传输技术、WiMax传输技术、任何其它适当传输技术或其任何组合。
连接1612可包括以太网硬件,同轴电缆硬件、DSL硬件、T-1硬件、光纤硬件、模拟电话线硬件、无线硬件、能够通信的任何其它适当硬件或其任何组合。连接1612可包括有线传输技术,包括TCP/IP传输技术、IEEE 1702传输技术、以太网传输技术、DSL传输技术、光纤传输技术、ITU-T传输技术、任何其它适当传输技术或其任何组合。连接1612可包括无线传输技术,包括蜂窝式电话传输技术、码分多址或CDMA传输技术、全球移动通信系统或GSM传输技术、通用分组无线电服务或GPRS传输技术、卫星传输技术、红外传输技术、蓝牙传输技术、Wi-Fi传输技术、WiMax传输技术、任何其它其它适当传输技术或其任何组合。
无线中继器1610可包括任何数目的蜂窝式电话收发机、网络路由器、网络交换机、通信卫星、用于从用户设备1602向网络1604传送信息的其它设备或其任何组合。将理解的是,连接1606、无线连接1608和连接1612的布置仅仅是说明性的,并且系统1600可包括将用户设备1602耦合到网络1604的任何适当数目的任何适当设备。还将理解的是,可将任何用户设备1602通信地与任何用户设备、远程服务器、本地服务器、任何其它适当处理设备或其任何组合耦合,并且可使用如上所述的任何适当技术耦合。
在某些实施方式中,可将任何适当数目的远程服务器1614、1616、1618、1620耦合到网络1604。远程服务器可以是通用的、专用的或其任何组合。可将一个或多个搜索引擎服务器1622耦合到网络1604。在某些实施方式中,搜索引擎服务器1622可包括知识图,可包括被配置成访问知识图的处理设备,可包括被配置成接收与知识图相关的搜索查询的处理设备,可包括任何其它适当信息或设备或其任何组合。可将一个或多个数据库服务器1624耦合到网络1604。在某些实施方式中,数据库服务器1624可存储知识图。在某些实施方式中,在存在超过一个知识图的情况下,可在数据库服务器1624中包括多于一个,可用任何适当技术将其跨任何适当数目的数据库服务器和通用服务器分布或其任何组合。还将理解的是,系统可使用任何适当数目的通用、专用、存储、处理、搜索、任何其它适当服务器或任何组合。
图17是根据本公开的某些实施方式的图16的说明性计算机系统的用户设备的框图。用户设备1602可包括输入/输出设备1702和处理设备1704。输入/输出设备1702可包括显示器1706、触摸屏1708、按钮1710、加速度计1712、全球定位系统或GPS接收机1736、相机1738、键盘1740、鼠标1742以及包括扬声器1714和麦克风1716的音频设备1734。在某些实施方式中,图17中所示的设备可表示包括在智能电话用户设备中的设备。将理解的是,包括在说明性计算机系统中的特定设备可取决于用户设备的类型。例如,台式计算机的输入/输出设备1702可包括键盘1740和鼠标1742,并且可省略加速度计1712和GPS接收机1736。将理解的是,用户设备1602可省略任何适当的所示元件,并且可包括未示出的设备,诸如媒体驱动器、数据存储、通信设备、显示设备、处理设备、任何其它适当设备或其任何组合。
在某些实施方式中,显示器1706可包括液晶显示器、发光二极管显示器、有机发光二极管显示器、非晶有机发光二极管显示器、等离子体显示器、阴极射线管显示器、投影仪显示器、能够显示内容的任何其它适当类型的显示器或其任何组合。可由显示控制器1718或由处理设备1704中的处理器1704、由在显示器1706内部的处理设备、由其它控制设备或由其任何组合来控制显示器1706。在某些实施方式中,显示器1706可显示来自知识图的数据。
触摸屏1708可包括能够感测压力输入、电容输入、电阻输入、压电输入、光输入、声输入、任何其它适当输入或其任何组合的传感器。触摸屏1708可以能够接收基于触摸屏的手势。接收的手势可包括关于触摸屏1708的表面上的一个或多个位置、手势的压力、手势的速度、手势的持续时间、由手势在其表面上跟踪的路径的方向、设备相对于手势的运动、关于手势的其它适当信息或其任何组合的信息。在某些实施方式中,触摸屏1708可以是光学透明的,并且位于显示器1706上面或下面。可将触摸屏1708耦合到显示控制器1718、传感器控制器1720、处理器1724、任何其它适当控制器或其任何组合并由其控制。在某些实施方式中,触摸屏1708可包括能够接收例如用来识别知识图中的数据的搜索查询的虚拟键盘。
在某些实施例中,由触摸屏1708接收到的手势可促使由显示器1706基本上同时地、例如紧随其后或以短的延迟显示对应的显示元素。例如,当手势是手指或触笔沿着触摸屏1708的表面的移动时,搜索系统可促使在显示器1706上显示指示手势路径的任何适当厚度、色彩或图案的可见线。在某些实施方式中,例如,使用鼠标的台式计算机,可使用在显示屏上显示的鼠标指针来完全或部分地替换触摸屏的功能。
按钮1710可以是一个或多个机电按钮机构、滑动机构、开关机构、摇杆机构、拨动机构、其它适当机构或其任何组合。可将按钮1710作为触摸屏的预定义区域(例如软键)包括在触摸屏1708中。可将按钮1710作为由搜索系统定义且由显示器1706指示的触摸屏的区域包括在触摸屏1708中。按钮1710的激活可向传感器控制器1720、处理器1724、显示控制器1720、任何其它适当处理设备或其任何组合发送信号。按钮1710的激活可包括从用户接收按下手势、滑动手势、触摸手势、按压手势、基于时间的手机,例如基于推动的持续时间、任何其它适当手势或其任何组合。
加速度计172可以能够接收关于用户设备1602的运动特性、加速度特性、定向特性、倾斜特性及其它适当特性或其任何组合的信息。加速度计1712可以是机械器件、微机电或MEMS器件、纳米机电或NEMS器件、固态器件、任何其它适当传感器件或其任何组合。在某些实施方式中,加速度计1712可以是3轴压电微机电集成电路,其被配置成通过感测内部结构的电容的变化来感测加速度、定向或其它适当特性。可将加速度计1712耦合到触摸屏1708,使得由加速度计1712相对于手势接收到的信息至少部分地被处理设备1704用来解释手势。
全球定位系统或GPS接收机1736可以能够从全球定位卫星接收信号。在某些实施方式中,GPS接收机1736可从沿地球轨道运行的一个或多个卫星接收信息,该信息包括与卫星有关的时间、轨道及其它信息。此信息可用来计算用户设备1602在地球表面上的位置。GPS接收机1736可包括未示出的气压计,以改善位置的准确度。GPS接收机1736可从其它有线和无线通信源接收关于用户设备1602的位置的信息。例如,可代替GPS数据或除此之外使用附近蜂窝电话塔的身份和位置来确定用户设备1602的位置。
相机1738可包括用以检测光的一个或多个传感器。在某些实施方式中,相机1738可接收视频图像、静止图像或两者。相机1738可包括电荷耦合设备或CCD传感器、互补金属氧化物半导体或CMOS传感器、光电池传感器、IR传感器、任何其它适当传感器或其任何组合。在某些实施方式中,相机1738可包括能够产生光以照亮物体的器件,例如LED灯。相机1738可将由一个或多个传感器捕捉的信息传送至传感器控制器1720、处理器1724、任何其它适当设备或其任何组合。相机1738可包括透镜、滤波器及其它适当光学设备。将理解的是,用户设备1602可包括任何适当数目的相机1738。
音频设备1734可包括用于使用声波或压力波来接收和发射信息的传感器和处理设备。扬声器1714可包括响应于信号而产生声波的设备。在某些实施方式中,扬声器1714可包括电声换能器,其中,电磁体被耦合到隔膜以响应于电信号而产生声波。麦克风1716可包括电声设备以将声信号转换成电信号。在某些实施方式中,电容器式麦克风可使用隔膜作为电容器的一部分,使得声波引发设备中的电容变化,其可被用户设备1602用作输入信号。
扬声器1714和麦克风1716可包含在用户设备1602,可以是通过任何适当的有线或无线连接耦合到用户设备1602的远程设备或其任何组合。
可将音频设备1734中的扬声器1714和麦克风1716耦合到处理设备1704中的音频控制器1722。控制器可发送和从音频设备1734接收信号,并在将与输入信号有关的信号发射到处理器1724之前执行预处理和滤波步骤。可将扬声器1714和麦克风直接耦合到处理器1724。从音频设备1734到处理设备1704的连接可以是有线、无线、用于传送信息的其它适当布置或其任何组合。
用户设备1602的处理设备1704可包括显示控制器1718、传感器控制器1720、音频控制器1722、处理器1724、存储器1726、通信控制器1728以及电源1732。
处理器1724可包括用以解释从例如触摸屏1708和麦克风1716到用户设备1602的信号输入的电路。处理器1724可包括用以控制到显示器1706和扬声器1714的输出的电路。处理器1724可包括用以执行计算机程序的指令的电路。在某些实施方式中,处理器1724可以是能够执行计算机程序的指令的集成电子电路,并且包括多个输入端和输出。
可将处理器1724耦合到存储器1726。存储器1726可包括随机存取存储器或RAM、闪存、可编程只读存储器或PROM、可擦可编程序只读存储器或EPROM、磁硬盘驱动器、盒式磁带、磁软盘光学CD-ROM盘、CD-R盘、CD-RW盘、DVD盘、DVD+R盘、DVD-R盘、任何其它适当存储介质或其任何组合。
可将如上文已描述的显示控制器1718、传感器控制器1720以及音频控制器1722的功能完全或部分地实现为用户设备1602中的分立部件,完全或部分地集成到处理器1724中,部分地或完全组合到组合控制单元中,或者其任何组合。
可将通信控制器1728耦合到用户设备1602的处理器1724。在某些实施方式中,通信控制器1728可使用天线1730来传送射频信号。在某些实施方式中,通信控制器1728可使用未示出的有线连接来传送信号。由通信控制器1728传送的有线和无线通信可使用以太网、调幅、调频、位流、码分多址或CDMA、全球移动通信系统或GSM、通用分组无线电服务或GPRS、卫星、红外、蓝牙、Wi-Fi、WiMax、任何其它适当通信配置或其任何组合。通信控制器1728的功能可完全地或部分地实现为用户设备1602中的分立部件,可完全地或部分地包括在处理器1724中或其任何组合。在某些实施方式中,通信控制器1728可与诸如网图16的网络1604之类的网络通信,并且可从存储在例如图16的数据库1624中的知识图接收信息。
可将电源1732耦合到处理器1724和用户设备1602的其它部件。电源1732可包括锂聚合物电池、锂离子电池、NiMH电池、碱性电池、铅酸电池、燃料电池、太阳电池板、热电发生器、任何其它适当电源或其任何组合。电源1732可包括到电功率源的硬接线连接,并且可包括电气设备以将电功率源输入的电压、频率以及相位转换成适合于用户设备1602的功率。在电源1732的某些实施方式中,壁装插座可提供1620伏、60Hz交流电或AC。包括在电源1732中的变压器、电阻器、电感器、电容器、晶体管及其它适当电子部件的电路可将来自壁装插座电源的1620V AC转换成0Hz的5伏,例如直流。在电源1732的某些实施方式中,包括锂金属氧化物阴极和基于石墨的阳极的离子电池可向用户设备1602的部件供应3.7V。电源1732可完全地或部分地集成到用户设备1602中,或者可充当独立设备。电源1732可直接地对用户设备1602供电,可通过对电池充电来对用户设备1602供电,可用任何其它适当方式来提供功率,或其任何组合。
前述内容仅仅说明本公开的原理,并且在不脱离本公开的范围的情况下可由本领域的技术人员进行各种修改。上述实施方式是出于说明而非限制的目的提出的。本公开该还可采取除在本文中明确地描述的那些之外的许多形式。因此,应强调的是,本公开不限于明确地公开的方法、系统以及装置,而是旨在包括在所附权利要求的精神内的其变化和修改。

Claims (81)

1.一种用于自然语言处理的方法,包括:
使用一个或多个计算机将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词;
使用一个或多个计算机来识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素;
使用一个或多个计算机通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成所述短语树;
使用一个或多个计算机以与所述短语树相同的拓扑来生成查询树,其中至少部分地基于所述短语树和所述知识图来定义所述查询树的节点和边;以及
使用一个或多个计算机至少部分地基于所述查询树从知识图检索搜索结果。
2.根据权利要求1所述的方法,其中,生成所述查询树包括将搜索单元映射到相对应的拓扑的节点和边的知识图元素。
3.根据权利要求1所述的方法,进一步包括将接收的搜索请求分割以生成包括至少所述第一搜索查询的一个或多个搜索查询。
4.根据权利要求1所述的方法,其中,生成短语树包括生成包括一个或多个拓扑的多个短语树。
5.根据权利要求1所述的方法,其中,确定查询树包括:
生成包括一个或多个拓扑的多个查询树;
向所述多个查询树中的每一个分配分值;以及
至少部分地基于所述分值从所述多个查询树中选择查询树。
6.根据权利要求5所述的方法,其中,所述分值至少部分地基于用户交互。
7.根据权利要求5所述的方法,其中,所述分值至少部分地基于所述知识图中的数据。
8.根据权利要求1所述的方法,其中,确定查询树包括向用户提供多个查询树并接收与所述多个查询树中的一个的期望选择有关的用户输入。
9.根据权利要求1所述的方法,其中,解析第一搜索查询包括使用自然语言处理。
10.根据权利要求1所述的方法,进一步包括使用显示屏来呈现所述搜索结果。
11.一种用于自然语言处理的方法,包括:
使用一个或多个计算机至少部分地基于第一搜索查询来生成第一查询树,其中所述第一查询树的节点和边与知识图的元素相关联;
使用一个或多个计算机至少部分地基于所述第一查询树从所述知识图检索第一搜索结果;
使用一个或多个计算机向用户提供所述第一搜索结果;
使用一个或多个计算机接收过滤查询,其中所述过滤查询与所述第一搜索结果的精化相关;
使用一个或多个计算机至少部分地基于所述第一搜索查询和所述过滤查询来生成第二查询树,其中所述第二查询树包括与知识图的元素相关联的一个或多个节点和边;
使用一个或多个计算机来比较所述第一查询树和所述第二查询树;
基于所述比较,使用一个或多个计算机来确定搜索过滤器;以及
使用一个或多个计算机至少部分地基于所述第一搜索结果和所述搜索过滤器来提供第二搜索结果。
12.根据权利要求11所述的方法,其中,生成查询树进一步包括:
使用一个或多个计算机将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词;
使用一个或多个计算机来识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素;
使用一个或多个计算机通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成所述短语树;以及
使用一个或多个计算机以与所述短语树相同的拓扑来生成查询树,其中至少部分地基于所述短语树和所述知识图来定义所述查询树的节点和边。
13.根据权利要求12所述的方法,其中,生成所述查询树包括将搜索单元映射到相对应的拓扑的节点和边的知识图元素。
14.根据权利要求11所述的方法,其中,接收过滤查询包括在文本输入框中接收文本过滤查询。
15.根据权利要求11所述的方法,其中,提供所述第一搜索结果包括在显示屏上呈现链接。
16.根据权利要求11所述的方法,其中,比较所述第一查询树和所述第二查询树包括识别未被包括在所述第一查询树中而包括在所述第二查询树中的数据。
17.根据权利要求11所述的方法,其中,提供第二搜索结果包括提供到所述搜索过滤器的链接。
18.根据权利要求11所述的方法,其中,提供到所述搜索过滤器的链接包括提供到一个或多个相关搜索过滤器的链接。
19.一种用于自然语言处理的方法,包括:
使用一个或多个计算机将来自知识图的第一多个搜索结果提供给用户;
使用一个或多个计算机接收过滤查询,其中所述过滤查询与所述第一多个搜索结果的精化相关;
使用一个或多个计算机识别与所述过滤查询相关联的所述知识图中的一个或多个元素;
使用一个或多个计算机来映射在与所述过滤查询相关联的所述知识图中的所述一个或多个元素与第一多个搜索结果中的每个相应搜索结果之间的一个或多个关系;
基于所述一个或多个关系,使用一个或多个计算机来确定搜索过滤器;
使用一个或多个计算机至少部分地基于所述第一多个搜索结果和所述搜索过滤器来提供第二多个搜索结果。
20.根据权利要求19所述的方法,其中,提供第一多个搜索结果进一步包括使用查询树来识别搜索结果。
21.根据权利要求20所述的方法,其中,生成查询树进一步包括:
使用一个或多个计算机将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词;
使用一个或多个计算机来识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素;
使用一个或多个计算机通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成所述短语树;以及
使用一个或多个计算机以与所述短语树相同的拓扑来生成查询树,其中至少部分地基于所述短语树和所述知识图来定义所述查询树的节点和边。
22.根据权利要求21所述的方法,其中,生成所述查询树包括将搜索单元映射到相对应的拓扑的节点和边的知识图元素。
23.根据权利要求19所述的方法,其中,接收过滤查询包括在文本输入框中接收文本过滤查询。
24.根据权利要求19所述的方法,其中,提供所述第一多个搜索结果包括在显示屏上呈现链接。
25.根据权利要求19所述的方法,其中,提供第二多个搜索结果包括提供到所述搜索过滤器的链接。
26.根据权利要求19所述的方法,其中,提供到所述搜索过滤器的链接包括提供到一个或多个相关搜索过滤器的链接。
27.根据权利要求19所述的方法,其中,映射一个或多个关系进一步包括识别所述知识图中的在与所述过滤查询相关联的所述知识图中的所述一个或多个元素与所述第一多个搜索结果中的每个相应搜索结果之间的连接。
28.一种用于自然语言处理的系统,包括:
数据库,包括知识图;以及
一个或多个计算机,被配置成执行操作,包括:
将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词,
识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素,
通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成所述短语树,
以与所述短语树相同的拓扑生成查询树,其中至少部分地基于所述短语树和所述知识图来定义所述查询树的节点和边,以及
至少部分地基于所述查询树从知识图检索搜索结果。
29.根据权利要求28所述的系统,其中,生成所述查询树包括将搜索单元映射到相对应的拓扑的节点和边的知识图元素。
30.根据权利要求28所述的系统,其中,所述一个或多个计算机被配置成执行操作,所述操作进一步包括将接收的搜索请求分割以生成包括至少所述第一搜索查询的一个或多个搜索查询。
31.根据权利要求28所述的系统,其中,生成短语树包括生成包括一个或多个拓扑的多个短语树。
32.根据权利要求28所述的系统,其中,所述一个或多个计算机被配置成执行操作,所述操作进一步包括:
生成包括一个或多个拓扑的多个查询树;
向所述多个查询树中的每一个分配分值;以及
至少部分地基于所述分值从所述多个查询树中选择查询树。
33.根据权利要求32所述的系统,其中,所述分值至少部分地基于用户交互。
34.根据权利要求32所述的系统,其中,所述分值至少部分地基于所述知识图中的数据。
35.根据权利要求28所述的系统,其中,确定查询树包括向用户提供多个查询树并接收与所述多个查询树中的一个的期望选择有关的用户输入。
36.根据权利要求28所述的系统,其中,解析第一搜索查询包括使用自然语言处理。
37.根据权利要求28所述的系统,其中,所述一个或多个计算机进一步被配置成执行操作,所述操作包括使用显示屏来呈现所述搜索结果。
38.一种用于自然语言处理的系统,包括:
数据库,包括知识图;以及
一个或多个计算机,被配置成执行操作,所述操作包括:
至少部分地基于第一搜索查询来生成第一查询树,其中所述第一查询树的节点和边与知识图的元素相关联,
至少部分地基于所述第一查询树从所述知识图检索第一搜索结果,
向用户提供所述第一搜索结果,
接收过滤查询,其中所述过滤查询与所述第一搜索结果的精化相关,
至少部分地基于所述第一搜索查询和所述过滤查询生成第二查询树,其中所述第二查询树包括与知识图的元素相关联的一个或多个节点和边,
比较所述第一查询树和所述第二查询树,
基于所述比较,确定搜索过滤器,以及
至少部分地基于所述第一搜索结果和所述搜索过滤器来提供第二搜索结果。
39.根据权利要求38所述的系统,其中,所述一个或多个计算机被配置成执行操作,所述操作进一步包括:
将第一搜索查询解析成一个或多个搜索单元,其中,搜索单元包括一个或多个词,
识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素;
通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成所述短语树;以及
与所述短语树相同的拓扑来生成查询树,其中至少部分地基于所述短语树和所述知识图来定义所述查询树的节点和边。
40.根据权利要求39所述的系统,其中,生成所述查询树包括将搜索单元映射到相对应的拓扑的节点和边的知识图元素。
41.根据权利要求38所述的系统,其中,接收过滤查询包括在文本输入框中接收文本过滤查询。
42.根据权利要求38所述的系统,其中,提供所述第一搜索结果包括在显示屏上呈现链接。
43.根据权利要求38所述的系统,其中,比较所述第一查询树和所述第二查询树包括识别未被包括在所述第一查询树中而包括在所述第二查询树中的数据。
44.根据权利要求38所述的系统,其中,提供第二搜索结果包括提供到所述搜索过滤器的链接。
45.根据权利要求38所述的系统,其中,提供到所述搜索过滤器的链接包括提供到一个或多个相关搜索过滤器的链接。
46.一种用于自然语言处理的系统,包括:
数据库,包括知识图;以及
一个或多个计算机,被配置成执行操作,所述操作包括:
将来自知识图的第一多个搜索结果提供给用户,
接收过滤查询,其中所述过滤查询涉及所述第一多个搜索结果的精化,
识别与所述过滤查询相关联的所述知识图中的一个或多个元素,
映射在与所述过滤查询相关联的所述知识图中的所述一个或多个元素与所述第一多个搜索结果中的每个相应搜索结果之间的一个或多个关系,
基于所述一个或多个关系,确定搜索过滤器,以及
至少部分地基于所述第一多个搜索结果和所述搜索过滤器来提供第二多个搜索结果。
47.根据权利要求46所述的系统,其中,提供第一多个搜索结果进一步包括使用查询树来识别搜索结果。
48.根据权利要求47所述的系统,其中,所述一个或多个计算机被配置成执行操作,所述操作进一步包括:
将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词,
识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素;
通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成短语树;以及
以与所述短语树相同的拓扑来生成查询树,其中,至少部分地基于所述短语树和所述知识图来定义所述查询树的节点和边。
49.根据权利要求48所述的系统,其中,生成所述查询树包括将搜索单元映射到相对应拓扑的节点和边的知识图元素。
50.根据权利要求46所述的系统,其中,接收过滤查询包括在文本输入框中接收文本过滤查询。
51.根据权利要求46所述的系统,其中,提供所述第一多个搜索结果包括在显示屏上呈现链接。
52.根据权利要求46所述的系统,其中,提供第二多个搜索结果包括提供到搜索过滤器的链接。
53.根据权利要求46所述的系统,其中,提供到搜索过滤器的链接包括提供到一个或多个相关搜索过滤器的链接。
54.根据权利要求46所述的系统,其中,所述一个或多个计算机被配置成执行操作,所述操作进一步包括识别所述知识图中的在与所述过滤查询相关联的所述知识图中的所述一个或多个元素与所述第一多个搜索结果中的每个相应搜索结果之间的连接。
55.一种非瞬时计算机可读介质,所述计算机可读介质上记录有计算机程序指令,所述计算机程序指令用于:
使用一个或多个计算机将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词;
使用一个或多个计算机来识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素;
使用一个或多个计算机通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成所述短语树;
使用一个或多个计算机以与所述短语树相同的拓扑来生成查询树,其中至少部分地基于所述短语树和所述知识图来定义所述查询树的节点和边;以及
使用一个或多个计算机至少部分地基于所述查询树从知识图检索搜索结果。
56.根据权利要求55所述的非瞬时计算机可读介质,其中,生成所述查询树包括将搜索单元映射到相对应拓扑的节点和边的知识图元素。
57.根据权利要求55所述的非瞬时计算机可读介质,进一步包括将接收的搜索请求分割以生成包括至少所述第一搜索查询的一个或多个搜索查询。
58.根据权利要求55所述的非瞬时计算机可读介质,其中,生成短语树包括生成包括一个或多个拓扑的多个短语树。
59.根据权利要求55所述的非瞬时计算机可读介质,其中,确定查询树包括:
生成包括一个或多个拓扑的多个查询树;
向所述多个查询树中的每一个分配分值;以及
至少部分地基于所述分值从所述多个查询树中选择查询树。
60.根据权利要求59所述的非瞬时计算机可读介质,其中,所述分值至少部分地基于用户交互。
61.根据权利要求59所述的非瞬时计算机可读介质,其中,所述分值至少部分地基于所述知识图中的数据。
62.根据权利要求55所述的非瞬时计算机可读介质,其中,确定查询树包括向用户提供多个查询树并接收与所述多个查询树中的一个的期望选择有关的用户输入。
63.根据权利要求55所述的非瞬时计算机可读介质,其中,解析第一搜索查询包括使用自然语言处理。
64.根据权利要求55所述的非瞬时计算机可读介质,进一步包括使用显示屏来呈现所述搜索结果。
65.一种非瞬时计算机可读介质,所述计算机可读介质上记录有计算机程序指令,所述计算机程序指令用于:
使用一个或多个计算机至少部分地基于第一搜索查询来生成第一查询树,其中所述第一查询树的节点和边与知识图的元素相关联;
使用一个或多个计算机至少部分地基于所述第一查询树从所述知识图检索第一搜索结果;
使用一个或多个计算机向用户提供所述第一搜索结果;
使用一个或多个计算机接收过滤查询,其中所述过滤查询与所述第一搜索结果的精化相关;
使用一个或多个计算机至少部分地基于所述第一搜索查询和所述过滤查询来生成第二查询树,其中所述第二查询树包括与知识图的元素相关联的一个或多个节点和边;
使用一个或多个计算机来比较所述第一查询树和所述第二查询树;
基于所述比较,使用一个或多个计算机来确定搜索过滤器;以及
使用一个或多个计算机至少部分地基于所述第一搜索结果和所述搜索过滤器来提供第二搜索结果。
66.根据权利要求65所述的非瞬时计算机可读介质,其中,生成查询树进一步包括:
使用一个或多个计算机将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词;
使用一个或多个计算机来识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素;
使用一个或多个计算机通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成所述短语树;以及
使用一个或多个计算机以与所述短语树相同的拓扑来生成查询树,其中至少部分地基于所述短语树和所述知识图来定义所述查询树的节点和边。
67.根据权利要求66所述的非瞬时计算机可读介质,其中,生成所述查询树包括将搜索单元映射到相对应的拓扑的节点和边的知识图元素。
68.根据权利要求65所述的非瞬时计算机可读介质,其中,接收过滤查询包括在文本输入框中接收文本过滤查询。
69.根据权利要求65所述的非瞬时计算机可读介质,其中,提供第一搜索结果包括在显示屏上呈现链接。
70.根据权利要求65所述的非瞬时计算机可读介质,其中,比较所述第一查询树和所述第二查询树包括识别未被包括在所述第一查询树中而包括在所述第二查询树中的数据。
71.根据权利要求65所述的非瞬时计算机可读介质,其中,提供第二搜索结果包括提供到所述搜索过滤器的链接。
72.根据权利要求65所述的非瞬时计算机可读介质,其中,提供到所述搜索过滤器的链接包括提供到一个或多个相关搜索过滤器的链接。
73.一种非瞬时计算机可读介质,所述计算机可读介质记录有计算机程序指令,所述计算机程序指令用于:
使用一个或多个计算机将来自知识图的第一多个搜索结果提供给用户;
使用一个或多个计算机接收过滤查询,其中所述过滤查询与所述第一多个搜索结果的精化相关;
使用一个或多个计算机识别与所述过滤查询相关联的知识图中的一个或多个元素;
使用一个或多个计算机来映射在与所述过滤查询相关联的所述知识图中的所述一个或多个元素与第一多个搜索结果中的每个相应搜索结果之间的一个或多个关系;
基于所述一个或多个关系,使用一个或多个计算机来确定搜索过滤器;
使用一个或多个计算机至少部分地基于所述第一多个搜索结果和所述搜索过滤器来提供第二多个搜索结果。
74.根据权利要求73所述的非瞬时计算机可读介质,其中,提供第一多个搜索结果进一步包括使用查询树来识别搜索结果。
75.根据权利要求74所述的非瞬时计算机可读介质,其中,生成查询树进一步包括:
使用一个或多个计算机将第一搜索查询解析成一个或多个搜索单元,其中搜索单元包括一个或多个词;
使用一个或多个计算机来识别与所述一个或多个搜索单元中的每一个相对应的知识图的元素;
使用一个或多个计算机通过将所述一个或多个搜索单元中的每一个分配给短语树的节点或边来生成所述短语树;以及
使用一个或多个计算机以与所述短语树相同的拓扑来生成查询树,其中至少部分地基于所述短语树和所述知识图来定义所述查询树的节点和边。
76.根据权利要求75所述的非瞬时计算机可读介质,其中,生成所述查询树包括将搜索单元映射到相对应的拓扑的节点和边的知识图元素。
77.根据权利要求73所述的非瞬时计算机可读介质,其中,接收过滤查询包括在文本输入框中接收文本过滤查询。
78.根据权利要求73所述的非瞬时计算机可读介质,其中,提供所述第一多个搜索结果包括在显示屏上呈现链接。
79.根据权利要求73所述的非瞬时计算机可读介质,其中,提供第二多个搜索结果包括提供到所述搜索过滤器的链接。
80.根据权利要求73所述的非瞬时计算机可读介质,其中,提供到所述搜索过滤器的链接包括提供到一个或多个相关搜索过滤器的链接。
81.根据权利要求73所述的非瞬时计算机可读介质,其中,映射一个或多个关系进一步包括识别所述知识图中的在与所述过滤查询相关联的所述知识图中的所述一个或多个元素与所述第一多个搜索结果中的每个相应搜索结果之间的连接。
CN201380073339.8A 2013-02-19 2013-02-19 基于自然语言处理的搜索 Active CN105900081B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2013/071652 WO2014127500A1 (en) 2013-02-19 2013-02-19 Natural language processing based search

Publications (2)

Publication Number Publication Date
CN105900081A CN105900081A (zh) 2016-08-24
CN105900081B true CN105900081B (zh) 2020-09-08

Family

ID=51390462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380073339.8A Active CN105900081B (zh) 2013-02-19 2013-02-19 基于自然语言处理的搜索

Country Status (3)

Country Link
EP (1) EP2959405A4 (zh)
CN (1) CN105900081B (zh)
WO (1) WO2014127500A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016119874A1 (en) * 2015-01-30 2016-08-04 Longsand Limited Selecting an entity from a knowledge graph when a level of connectivity between its neighbors is above a certain level
US10628490B2 (en) * 2015-11-05 2020-04-21 Microsoft Technology Licensing, Llc Techniques for digital entity correlation
CN106250393B (zh) * 2016-07-13 2017-08-25 广州安望信息科技有限公司 一种基于知识图谱的短文本理解方法及装置
CN107729336B (zh) * 2016-08-11 2021-07-27 阿里巴巴集团控股有限公司 数据处理方法、设备及系统
US10789425B2 (en) * 2017-06-05 2020-09-29 Lenovo (Singapore) Pte. Ltd. Generating a response to a natural language command based on a concatenated graph
US10776409B2 (en) 2017-06-21 2020-09-15 International Business Machines Corporation Recommending responses to emergent conditions
AU2018358041B2 (en) 2017-10-31 2024-01-04 Yext, Inc. Knowledge search engine platform for enhanced business listings
US10977303B2 (en) * 2018-03-21 2021-04-13 International Business Machines Corporation Image retrieval using interactive natural language dialog
US10956487B2 (en) 2018-12-26 2021-03-23 Industrial Technology Research Institute Method for establishing and processing cross-language information and cross-language information system
CN109670033B (zh) * 2019-02-01 2021-01-12 海信视像科技股份有限公司 内容的检索方法、装置、设备及存储介质
CN111753198B (zh) * 2020-06-22 2024-01-12 北京百度网讯科技有限公司 信息推荐方法和装置、以及电子设备和可读存储介质
CN112905848A (zh) * 2021-02-10 2021-06-04 北京有竹居网络技术有限公司 信息查询方法、装置、电子设备、存储介质及程序产品
CN113822057B (zh) * 2021-08-06 2022-10-18 北京百度网讯科技有限公司 地点信息确定方法、装置、电子设备以及存储介质
US20230252309A1 (en) * 2022-02-07 2023-08-10 International Business Machines Corporation Building knowledge graphs based on partial topologies formulated by users

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923565A (zh) * 2009-06-12 2010-12-22 国际商业机器公司 用于查询树导航的方法和系统
WO2012091539A1 (en) * 2010-12-28 2012-07-05 Mimos Berhad A semantic similarity matching system and a method thereof

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999005621A1 (en) * 1997-07-22 1999-02-04 Microsoft Corporation System for processing textual inputs using natural language processing techniques
EP1225517B1 (en) * 2001-01-17 2006-05-17 International Business Machines Corporation System and methods for computer based searching for relevant texts
US7483894B2 (en) * 2006-06-07 2009-01-27 Platformation Technologies, Inc Methods and apparatus for entity search
US7774198B2 (en) * 2006-10-06 2010-08-10 Xerox Corporation Navigation system for text
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US8548980B2 (en) * 2007-12-28 2013-10-01 Sybase Inc. Accelerating queries based on exact knowledge of specific rows satisfying local conditions
CN101630314B (zh) * 2008-07-16 2011-12-07 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
CN102591952A (zh) * 2011-12-28 2012-07-18 用友软件股份有限公司 基于语义的数据查询装置和基于语义的数据查询方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923565A (zh) * 2009-06-12 2010-12-22 国际商业机器公司 用于查询树导航的方法和系统
WO2012091539A1 (en) * 2010-12-28 2012-07-05 Mimos Berhad A semantic similarity matching system and a method thereof

Also Published As

Publication number Publication date
EP2959405A4 (en) 2016-10-12
CN105900081A (zh) 2016-08-24
WO2014127500A1 (en) 2014-08-28
EP2959405A1 (en) 2015-12-30

Similar Documents

Publication Publication Date Title
US11868357B2 (en) Search result ranking and presentation
CN105900081B (zh) 基于自然语言处理的搜索
US11928168B2 (en) Question answering using entity references in unstructured data
CN108959394B (zh) 聚类的搜索结果
US10108700B2 (en) Question answering to populate knowledge base
US20160063106A1 (en) Related Entity Search
US10235423B2 (en) Ranking search results based on entity metrics
CN104937587B (zh) 基于组合查询提供搜索结果
US10055462B2 (en) Providing search results using augmented search queries
US20160117349A1 (en) Collective reconciliation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

GR01 Patent grant
GR01 Patent grant