CN112052314A - 用于提供建议以完成查询的方法和系统 - Google Patents

用于提供建议以完成查询的方法和系统 Download PDF

Info

Publication number
CN112052314A
CN112052314A CN202010252235.5A CN202010252235A CN112052314A CN 112052314 A CN112052314 A CN 112052314A CN 202010252235 A CN202010252235 A CN 202010252235A CN 112052314 A CN112052314 A CN 112052314A
Authority
CN
China
Prior art keywords
query
user
entity
entities
related entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010252235.5A
Other languages
English (en)
Inventor
C·贝勒
C·阿克曼
K·萨默斯
R·海伊
D·麦克奎尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN112052314A publication Critical patent/CN112052314A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

提供了用于标识与查询相关的实体的实施例。从用户接收至少一个查询。至少一个查询与至少一个实体相关联。分析至少一个查询的结果以标识相关实体。基于每个相关实体的相关性得分和信息增强得分来分析相关实体以生成相关实体的排名。基于相关实体的排名来向用户提供至少一个相关实体。

Description

用于提供建议以完成查询的方法和系统
技术领域
本发明总体上涉及计算系统,并且更具体地涉及用于提供建议以完成查询会话的各种实施例。
背景技术
计算系统(和/或搜索算法)通常用于在各种语料库(一个或多个语料库)(诸如一个或多个基于文本的文档、电子表格等)中搜索对实体(例如,个人/人、组织、物体、场所等)的名称(或其他标识术语)的引用(或提及)。在某些系统中,结果以文档“集群”(例如,“仓(bin)”数据结构)提供给用户,其可以包括实体名称和文档集合(和/或来自文档的摘录),文档集合包括对实体的引用(或提及),也许还包括对被确定为与目标(或预期)实体相关的实体的引用(或提及)。
在某些情况下,用户考虑可以被视为形成“网络”(即,相关实体群组)的一组特定个人。但是,用户可能没有意识到可能被视为网络的一部分的某些实体,并且因此可能不会明确地搜索它们。
发明内容
提供了用于由处理器标识与查询相关的实体的各种实施例。从用户接收至少一个查询。至少一个查询与至少一个实体相关联。分析至少一个查询的结果以标识相关实体。基于每个相关实体的相关性得分和信息增强得分来分析相关实体以生成相关实体的排名。基于相关实体的排名来向用户提供至少一个相关实体。
除了前述示例性实施例,还提供了各种其他系统和计算机程序产品实施例,并且提供了相关的优点。提供了前述“发明内容”以便以简化的形式介绍一些概念,这些概念将在下面的“具体实施方式”中进一步描述。本“发明内容”既不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。所要求保护的主题不限于解决“背景技术”中指出的任何或所有缺点的实现。
附图说明
为了容易理解本发明的优点,将通过参考附图中示出的特定实施例来对以上简要描述的本发明进行更具体的描述。应当理解,这些附图仅描绘了本发明的典型实施例,因此不应当被视为对本发明的范围的限制,将通过使用附图以附加的特征和细节来描述和解释本发明,在附图中:
图1是描绘根据本发明的实施例的示例性计算节点的框图;
图2是描绘根据本发明的实施例的示例性云计算环境的附加框图;
图3是描绘根据本发明的实施例的抽象模型层的附加框图;
图4示出了根据本发明的实施例的可以与用于计算相关实体的相关性得分的方法相关联的伪代码的示例;
图5示出了根据本发明的实施例的可以与用于计算相关实体的对照相关性得分的方法相关联的伪代码的示例;
图6是根据本发明的实施例的计算环境的框图;以及
图7是根据本发明的实施例的用于标识与查询相关的实体的示例性方法的流程图。
具体实施方式
如上所述,计算系统(和/或搜索算法)通常用于在各种语料库(一个或多个语料库)(诸如一个或多个基于文本的文档、电子表格等)中搜索对实体(例如,个人/人、组织、物体、场所等)的名称(或其他标识术语)的引用(或提及)。在某些系统中,结果以文档“集群”(例如,“仓”数据结构)提供给用户,其可以包括实体名称和文档集合(和/或来自文档的摘录),文档集合包括对实体的引用(或提及),也许还包括对被确定为与目标(或预期)实体相关的实体的引用(或提及)。
在某些情况下,用户考虑可以被视为形成“网络”(即,相关实体群组)的一组特定个人。但是,用户可能没有意识到可能被视为网络的一部分的某些实体,并且因此可能不会明确地搜索它们。
例如,考虑一种情况,其中用户(或分析人员)正在语料库中查询(或搜索)关于电视节目中的几个角色的信息,而不是该节目中的主要角色的信息。理想地,该系统将能够向用户警告可能想要考虑也搜索主要角色(和/或自动发起对主要角色的搜索)。但是,同时,该系统能够确定丢失的实体对用户是否“明显”将是有帮助的。也就是说,即使确定丢失的实体与用户的显式查询非常相关,提供丢失的实体作为所建议的查询对用户也可能是无益的(例如,用户故意从查询中省略了该实体,因为用户已经知道该实体)。
为了解决现有技术中的这些需求和/或缺点,在本文中描述的一些实施例中,方法和/或系统向用户提供所建议的查询(或查询的目标实体)(即,以帮助完成查询会话)。特别地,这些方法/系统可以生成被确定为与用户相关但对用户不明显的实体的列表。所建议的实体可以从来自用户的历史中的单个查询会话(或一个查询或预定义数目的先前查询)或定义的时间窗口(或时间范围)的特定用户(用户群组)的一组查询及其结果中得出。所建议的实体还可以从作为查询响应的一部分而返回的一组相关实体中得出。在一些实施例中,为每个相关实体计算相关性得分和信息增强(或信息性)得分,这些得分用于确定每个相关实体对用户而言有多相关和有用(和/或每个相关实体有多明显),并且可能对相关实体进行排名。
例如,在一些实施例中,监测和/或跟踪用户的查询(或(多个)查询会话),诸如针对可以与用户的查询相关的实体(或目标实体),如下面更详细地描述的。对于被确定为相关(例如,跨用户的多个查询相关并且尚未被明确查询)的实体(例如,每个实体),确定该实体与用户(和/或用户的一个查询/多个查询)的相关性(或相干性)(例如,计算相关性或相干性得分)。相关性的确定可以基于例如与用户相关联的信息(例如,用户的简档和/或用户的认知简档中的类别、主题等)和/或搜索结果中对实体的引用次数。
在一些实施例中,另外确定实体(例如,每个实体)是否可能对用户已经很明显和/或已知并且由于某种原因而未被明确查询(而不是未知的)(例如,计算信息增强(或“信息性”)得分)。如果确定实体与用户(和/或用户的查询)相关并且不太可能对用户很明显,则可以推荐(或建议)实体作为附加目标查询(和/或可以自动发起对该实体的搜索)。这样,在一些实施例中,可以提供被确定为相关但对用户不明显的实体的列表。
在一些实施例中,用户最初通过例如输入(或提供)要在语料库中搜索的一个或多个实体名称来使用检索系统(或搜索模块)执行至少一个搜索(例如,多个搜索/查询)。在某些实施例中,系统在预定的时间窗口或时间范围(和/或特定数目的先前查询)内跟踪或监测用户的查询(以及所返回的结果)。基于查询,系统标识一个或多个“相关实体”。在一些实施例中,相关实体可以是被确定为与目标实体(或多个实体)具有关系(和/或在“网络”内)的实体。该过程可以包括标识语料库中对目标实体的引用(或提及),并且分析引用和/或相应文档(例如,利用自然语言处理(NLP)技术和/或搜索与文档相关联的数据,诸如标签、注释、元数据等)。该系统可以跟踪(和/或存储)被确定为与用户的查询的结果和/或目标实体相关的所有实体的列表(例如,在时间范围内)。
然后,系统评估每个相关实体以确定它们是否对用户既相关又“有信息”(和/或确定每个相关实体对用户的相关性和信息性如何)。在一些实施例中,相关实体的相关性可以基于例如与用户相关联的信息(例如,与用户相关联的类别、主题等和/或用户的认知简档)来确定。这样可以用于确定每个实体的相关性得分。
在一些实施例中,相关实体的信息性基于“对照相关性(或相干性)”得分来确定(或近似、计算等),该得分可以经由随机查询的长度匹配会话来确定(例如,由用户在该时间范围内但是对随机目标实体执行的数目相同的查询)。这样,可以为每个相关实体确定信息增强(或信息性)得分(例如,相关性得分与对照相关性得分的比率)。
作为另一示例,信息性可以使用相关实体的出现(或引用/提及)的简单计数来计算(即,而不是计算对照相关性得分)。例如,实体的信息性可以是用户的查询的实体引用除以相等数目的随机查询中该实体的引用的计数的比率。
在一些实施例中,本文中描述的方法和/或系统利用认知分析。认知分析可以包括关于例如内容(例如,语料库内)和发送到用户和/或其他可用数据源和/或由用户和/或其他可用数据源接收的通信来对自然语言分类,分析语气和分析情绪(例如,扫描关键字、关键词等)。在一些实施例中,使用自然语言处理(NLP)、梅尔频率倒谱系数(MFCC)(例如,用于音频内容)和/或基于区域的卷积神经网络(R-CNN)像素映射(例如,用于图像/视频),如通常所理解的。这样,应当理解,本文中描述的方法/系统可以应用于除基于文本的(或字母数字)内容以外的内容,还可以应用于音频内容和/或图像/视频(例如,在音频和/或视频文件中引用的实体)。
本文中描述的过程可以利用与用户(例如,提供搜索查询的用户)和/或内容(例如,语料库内的(多个)文档、(多个)文件等)相关联的各种信息或数据源。关于用户,数据源可以包括例如与用户相关联的任何可用数据源。例如,在一些实施例中,可以生成(多个)用户的简档(例如,认知简档)。可以用于为(多个)用户生成认知简档的数据源可以包括系统可访问的(也许在用户的许可或授权下)与用户相关联的任何适当的数据源。这样的数据源的示例包括但不限于通信会话和/或其内容(或通信)(例如,电话呼叫、视频呼叫、文本消息、电子邮件、亲自/面对面对话等)、用户的简档(或关于用户的基本信息)(例如,职务、工作场所、在当前职位的时间长度、家庭角色等)、时间表或日历(即,在其上列出的项、时间范围等)、项目(例如,过去、当前或将来的工作相关项目)、位置(例如,先前和/或当前位置和/或相对于其他用户的位置)、社交媒体活动(例如,帖子、反应、评论、群组等)、浏览历史(例如,访问的网页)和在线购买。(多个)认知简档可以用于例如确定或指定用户的预期目标实体,以及确定/标识与目标实体相关的实体。
这样,在一些实施例中,如本领域技术人员通常理解的,本文中描述的方法和/或系统可以利用“认知分析”、“认知系统”、“机器学习”、“认知建模”、“预测分析”和/或“数据分析”。通常,这些过程可以包括例如接收和/或检索一个或多个系统的多组输入和相关联的输出并且处理数据(例如,使用计算系统和/或处理器)以生成或提取对应于、控制和/或估计(多个)系统的操作的模型、规则等,或者关于本文中描述的实施例,搜索、发现和/或标识与用户的查询相关和/或提供关于用户的查询的信息的实体,如本文中描述的。利用模型,可以预测系统的性能(或操作)(例如,利用/基于新的输入)和/或可以通过研究(多个)输入的变化如何影响(多个)输出来优化系统的性能。还可以利用从用户和/或管理员接收(或由用户和/或管理员提供)的反馈,这可以允许在持续使用的情况下进一步提高系统性能。
应当理解,本文中描述的实施例可以应用于对任何类型的实体(和/或任何类型的实体的名称/标识术语)的查询。也就是说,尽管本文中描述的一些实施例是关于个人(例如,个人的名/姓、昵称等)描述的,但是本文中描述的方法/系统可以应用于其他类型的实体,诸如组织、对象、场所等(和/或其名称/标识术语)。
还应当理解,如本文中使用的,术语“计算节点”(或简称为“节点”)可以是指计算设备(诸如移动电子设备或台式计算机)和/或应用(诸如聊天机器人、电子邮件应用、社交媒体应用、网络浏览器等)。换言之,如本文中使用的,计算节点的示例包括例如计算设备(诸如移动电话、平板设备、台式计算机)或其他设备(诸如拥有和/或以其他方式与个人(或用户)和/或由个人在这样的计算设备上利用的各种应用相关联的设备(IoT设备))。
特别地,在一些实施例中,提供了一种用于由处理器标识与查询相关的实体的方法。从用户接收至少一个查询。至少一个查询与至少一个实体相关联。分析至少一个查询的结果以标识相关实体。基于每个相关实体的相关性得分和信息增强得分来分析相关实体以生成相关实体的排名。基于相关实体的排名来向用户提供至少一个相关实体。
至少一个查询可以包括在时间范围内接收的多个查询。每个相关实体的相关性得分可以基于与用户相关联的信息。
每个相关实体的信息增强得分可以基于相应实体的相关性得分与利用至少一个随机查询而确定的相应实体的对照相关性得分的比率。每个相关实体的信息增强得分可以基于至少一个查询的结果中对相应实体的引用次数与至少一个随机查询的结果中对相应实体的引用次数的比率。
对至少一个查询的结果的分析可以利用自然语言处理技术来执行。至少一个实体中的每个实体和每个相关实体可以包括个人、组织和场所中的至少一项。
首先应当理解,尽管本公开包括关于云计算的详细描述,但其中记载的技术方案的实现却不限于云计算环境,而是能够结合现在已知或以后开发的任何其它类型的计算环境(诸如蜂窝网络)而实现。
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的交互就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
特征包括:
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理PDA)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
服务模型如下:
软件即服务(SaaS):向消费者提供的能力是使用提供者在云基础架构上运行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
平台即服务(PaaS):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
基础架构即服务(IaaS):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其他基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络组件(例如主机防火墙)可能具有有限的控制权。
部署模型如下:
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全要求、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构。
现在参考图1,示出了云计算节点的示例的示意图。云计算节点10仅是合适的云计算节点的一个示例,而非旨在暗示对本文中描述的本发明的实施例的使用范围或功能的任何限制。无论如何,云计算节点10(和/或本文中描述的一个或多个处理器)能够被实现和/或执行(或引起或启用)以上阐述的任何功能。
在云计算节点10中,存在可以与很多其他通用或专用计算系统环境或配置一起操作的计算机系统/服务器12。可以适合与计算机系统/服务器12一起使用的公知的计算系统、环境和/或配置的示例包括但不限于个人计算机系统、服务器计算机系统、瘦客户机、胖客户机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、小型计算机系统、大型计算机系统、以及包括上述任何系统或设备的分布式云计算环境等。
计算机系统/服务器12可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括执行特定的任务或者实现特定的抽象数据类型的例程、程序、目标程序、组件、逻辑、数据结构等。计算机系统/服务器12可以在通过通信网络链接的远程处理设备执行任务的分布式云计算环境中实施。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
如图1所示,云计算节点10中的计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是能够被计算机系统/服务器12访问的任意可获得的介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,其它硬件和/或软件模块可以与计算机系统/服务器12一起操作,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在本发明的上下文中,并且如本领域技术人员将理解的,图1中描绘的各种组件可以位于例如个人计算机系统、服务器计算机系统、瘦客户机、胖客户机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、移动电子设备(诸如移动(或蜂窝和/或智能)电话、个人数据助理(PDA)、平板计算机、可穿戴技术设备、膝上型计算机、手持游戏机、便携式媒体播放器等)、以及车辆(诸如汽车、飞机、船只等)中的计算系统。但是,在某些实施例中,图1中描绘的一些组件可以位于例如卫星(诸如全球定位系统(GPS)卫星)中的计算设备中。例如,与示出的实施例的机制相关联的一些处理和数据存储能力可以经由本地处理组件在本地发生,而相同的组件经由网络连接到位于远程的分布式计算数据处理和存储组件以完成本发明的各种目的。再次,如本领域普通技术人员将理解的,本说明旨在仅传达可以是共同完成各种发明方面的分布式计算组件的整个连接网络的子集。
现在参考图2,描绘了说明性云计算环境50。如图所示,云计算环境50包括一个或多个云计算节点10,由云消费者使用的本地计算设备可以与这些云计算节点10通信,例如蜂窝(或移动)电话或PDA54A、台式计算机54B、膝上型计算机54C和车辆计算系统(例如,集成在汽车、飞机、船只等)54N。
仍然参考图2,节点10可以彼此通信。它们可以在一个或多个网络中物理或虚拟地分组(图中未示出),诸如如上所述的私有云、共同体云、公共云或混合云或者其组合。这允许云计算环境50提供基础架构即服务、平台即服务和/或软件即服务,而云的消费者无需在本地计算设备上保持资源。应当理解,图2所示的类型的计算设备54A-N仅仅是示意性的,并且云计算节点10和云计算环境50可以通过任何类型的网络和/或网络可寻址连接来与任何类型的计算设备通信(例如,使用网络浏览器)。
现在参考图3,其中显示了云计算环境50(图2)提供的一组功能抽象层。首先应当理解,图3所示的组件、层以及功能都仅仅是示意性的,本发明的实施例不限于此。如图3所示,提供下列层和对应功能:
设备层55包括物理和/或虚拟设备、嵌入式和/或独立的电子设备、传感器、致动器和其他对象以在云计算环境50中执行各种任务。设备层55中的每个设备包含到其他功能抽象层的联网能力,从而可以向其提供从设备获取的信息,和/或可以向设备提供来自其他抽象层的信息。在一个实施例中,包括设备层55在内的各种设备可以包含统称为“物联网”(IoT)的实体网络。如本领域普通技术人员将理解的,这样的实体网络允许数据的相互通信、收集和分发以实现各种各样的目的。
所示出的设备层55包括传感器52、致动器53、具有集成处理、传感器和联网电子设备的“学习”恒温器56、相机57、可控家用插座/插座58、和可控电气开关59,如图所示。其他可能的设备可以包括但不限于各种其他传感器设备、联网设备、电子设备(诸如远程控制设备)、其他致动器设备(即,所谓的“智能”家电,诸如冰箱、洗衣机/干衣机或空调单元)、以及各种其他可能的互连设备/对象。
硬件和软件层60包括硬件和软件组件。硬件组件的例子包括:主机61;基于RISC(精简指令集计算机)体系结构的服务器62;服务器63;刀片服务器64;存储设备65;网络和网络组件66。软件组件的例子包括:网络应用服务器软件67以及数据库软件68。
虚拟层70提供一个抽象层,该层可以提供下列虚拟实体的例子:虚拟服务器71、虚拟存储72、虚拟网络73(包括虚拟私有网络)、虚拟应用和操作系统74,以及虚拟客户端75。
在一个示例中,管理层80可以提供下述功能:资源供应功能81:提供用于在云计算环境中执行任务的计算资源和其它资源的动态获取;计量和定价功能82:在云计算环境内对资源的使用进行成本跟踪,并为此提供帐单和发票。在一个例子中,该资源可以包括应用软件许可。安全功能:为云的消费者和任务提供身份认证,为数据和其它资源提供保护。用户门户功能83:为消费者和系统管理员提供对云计算环境的访问。服务水平管理功能84:提供云计算资源的分配和管理,以满足必需的服务水平。服务水平协议(SLA)计划和履行功能85:为根据SLA预测的对云计算资源未来需求提供预先安排和供应。
工作负载层90提供可以利用云计算环境的功能的示例。可以从该层提供的工作负载和功能的示例包括:映射和导航91;软件开发和生命周期管理92;虚拟教室教育传输93;数据分析处理94;交易处理95;并且,在本发明的所示实施例的上下文中,用于标识与查询相关的实体(和/或用户提供查询)的各种工作负载和功能96。如本领域普通技术人员将理解的,工作负载和功能96还可以与诸如硬件和软件60、虚拟化70、管理80和其他工作负载90中的各种抽象层的其他部分(诸如数据分析处理94)相结合来工作以完成本发明的所示实施例的各种目的。
如前所述,在一些实施例中,用于向用户提供所建议的查询(或查询的目标实体)和/或标识与用户的查询相关(和/或与(多个)用户进行的实体搜索相关)的实体的方法和/或系统。特别地,这些方法/系统可以生成被确定为与用户相关但对用户不明显的实体的列表。所建议的实体可以从来自用户的历史中的单个查询会话(或一个查询或预定义数目的先前查询)或定义的时间窗口(或时间范围)的特定用户(用户群组)的一组查询及其结果中得出。所建议的实体还可以从作为查询响应的一部分而返回的一组相关实体中得出。在一些实施例中,为每个相关实体计算相关性得分和信息增强(或信息性)得分,这些得分用于确定每个相关实体对用户而言有多相关和有用(和/或每个相关实体有多明显),并且可能对相关实体进行排名。
在一些实施例中,用户最初通过例如输入(或提供)要在语料库(例如,一个或多个文档,诸如基于文本的文档、非结构化数据、网页、电子表格等)中搜索的一个或多个实体名称来使用检索系统(或搜索模块)执行至少一个搜索(例如,多个搜索/查询)。如通常所理解的,系统可以使用诸如字符串搜索算法等任何合适的搜索算法来在语料库中搜索(多个)实体名称。另外,如通常所理解的,本文中描述的实施例可以利用任何合适的解决方案来解决由用户提供的实体名称中的打字和拼写错误(和/或替代拼写),诸如字符串度量和字符串匹配。在某些实施例中,系统在预定的时间窗口或时间范围(和/或特定数目的先前查询)内跟踪或监测用户的查询。基于查询,系统标识一个或多个相关实体(即,与目标实体/实体相关)。
在一些实施例中,相关实体可以是被确定为与目标实体(或多个目标实体)具有关系(和/或在“网络”内)的实体。该过程可以包括标识语料库中对目标实体的引用(或提及),并且分析引用和/或相应文档。相关实体的标识可以通过例如扫描与文档相关联的数据(诸如元数据、标签、注释等)(例如,其可以由用户手动输入/添加)来执行。例如,如果目标实体是职业运动员,则被确定为包括对运动员的引用(或提及)的文档还可以包括列出了与目标实体在相同的(多个)团队中的其他运动员、教练等的注释。
此外,可以利用自然语言处理(NLP)技术,诸如扫描关键字、关键词等,其可以指示实体与目标实体(或查询的主题)相关和/或在网络中。例如,再次以目标实体是职业运动员为例,可以利用NLP来确定诸如“John Doe,他在主教练Joe Smith的带领下……”等短语指示Joe Smith与目标实体(即John Doe)相关。
如上所述,在一些实施例中,系统跟踪被确定为与用户的查询的结果和/或目标实体相关的所有实体(例如,在时间范围内)。然后,系统评估每个相关实体以确定它们是否对用户既相关又有信息(和/或确定每个相关实体对用户的相关性和信息性如何)。
在一些实施例中,相关实体的相关性可以基于例如与用户相关联的信息来确定。例如,用户可以具有用户简档(例如,经由向系统注册、社交媒体简档等),该用户简档包括与该用户相关联的类别、主题、标签、兴趣等。另外,如上所述,(也)可以利用用户的认知简档。与用户相关联的这样的信息可以用于对相关实体进行分类,以及确定每个相关实体的相关性得分。相关性得分(也)可以基于在搜索结果中标识的对相关实体的引用次数(例如,在包括对目标实体的引用的文档中引用相关实体的次数)。
在一些实施例中,系统利用相关实体的相关性得分来生成(或创建)有序列表(例如,从最相关到最不相关)。然而,如上所述,如果用户已经意识到与用户高度相关的相关实体,则它们可能不是有价值的和/或有信息的建议。这样,在一些实施例中,系统实际上通过例如确定每个相关实体的信息增强(或信息性)得分来“惩罚”被确定为非信息性的实体(例如,因为它们是明显的建议、“常识”等)。
在一些实施例中,相关实体的信息性基于“对照相关性”得分来确定(或近似、计算等),该得分可以经由随机查询的长度匹配的会话来确定。也就是说,对照相关性得分可以通过在时间范围内但针对随机目标实体(例如,从用户的先前查询中选择的随机目标实体)执行由用户执行的相同数目的查询来确定。具体地,如果在该“对照”会话中确定相关实体高度相干,则可以将其视为语料库中与很多实体相关的“背景”实体,并且因此,它对用户不是非常有信息和/或有用。这样,可以为每个相关实体确定信息增强(或信息性)得分。信息增强得分可以被确定为相关性得分与对照相关性得分的比率(或相关性得分除以对照相关性得分),反之亦然。
然而,在一些实施例中,信息性得分可以使用相关实体的出现(或引用/提及)的简单计数(或数目)来计算。例如,实体的信息性得分可以被计算为用户的查询的结果中相关实体的引用次数(其可以被视为相关性得分)除以相等数目的随机查询中该实体的引用次数(其可以被视为对照相关性得分),反之亦然(或其比率,如上所述)。
然后可以将搜索结果提供给用户。例如,可以生成(一个或多个)所建议的实体和/或用于查询的主题的列表并且将其提供给用户(例如,经由电子通信、弹出窗口等)。作为一个示例,可以基于递减的信息性(或信息性得分)对实体进行排名(或列出)。作为另一示例,可以按照与用户的相关性降序的顺序列出所建议的实体,其中信息性得分低于预定阈值的实体从列表中被过滤掉或省略。在一些实施例中,如果没有任何相关实体高于预定阈值,则什么都不返回(即,不提供所建议的实体和/或用于查询的主题)。然后,用户可以使用所建议的实体来发起新的查询,和/或这样的搜索可以自动发起。
图4和5示出了可以与本文中描述的一些实施例可以利用的方法相关联的伪代码的示例。特别地,图4示出了可以与用于维护每个相关实体的相关性的运行计数的方法相关联的伪代码400的示例。应当注意,在图4中,maxRel(E,R)返回结果R中与实体E的简档类别相关的所计算的最高相关性。图5示出了可以与用于计算相关实体的对照相关性的方法相关联的伪代码500的示例。
图6示出了可以在其中实现本文中描述的实施例的示例性计算环境600。在所描绘的环境中,计算环境600包括计算设备602、搜索模块604和语料库606。
计算设备(或节点)602可以是可以由用户(或个人)608利用以例如发起对语料库606的搜索的任何合适的计算设备,诸如上述计算设备(例如,台式PC、移动电子设备等),如本文中描述的。然而,应当理解,本文中描述的方法可以由计算设备(或系统)发起(例如,响应于先前事件而自动发起,基于调度,等等)。
搜索模块604可以包括(和/或由其实现)任何合适的计算设备或系统,诸如上述计算设备或系统,并且可以被配置为执行语料库的搜索和/或任何相关过程(例如,认知分析)并且将搜索结果610返回给用户608(例如,经由计算设备602),如上所述。语料库606可以包括可以由计算设备602和/或搜索模块604访问和/或可搜索的任何类型的适当的文档、文件、数据库等中的一个或多个,诸如非结构化文档、网站/网页、文字处理文档、电子表格、电子通信(例如,电子邮件、文本消息等)、音频/视频文件等。在一些实施例中,计算设备602、搜索模块604和/或者语料库606可以被集成到通用计算设备中和/或在本地实现。例如,搜索模块604可以集成在计算设备602内。但是,在一些实施例中,图6所示的组件可以彼此远离并且可以经由任何合适的通信网络(例如,互联网)进行可操作的通信。
转到图7,提供了用于标识与查询(和/或用户)相关的实体的示例性方法700的流程图。方法700可以由例如图6中的搜索模块604和/或计算设备602执行。方法700开始(步骤702),其中例如语料库(例如,一个或多个文档)可以由计算设备/系统和/或搜索模块“访问”,如上所述。
从用户接收至少一个查询(步骤704)。至少一个查询与至少一个实体相关联(例如,至少一个查询包括搜索一个或多个实体的请求)。至少一个查询可以包括在一个时间范围内接收的多个查询。至少一个查询的结果可以基于与用户相关联的信息(例如,用户简档和/或用户的认知简档内的信息)。
分析至少一个查询的结果以标识相关实体(步骤706)。对至少一个查询的结果的分析可以利用例如自然语言处理技术来执行。在一些实施例中,利用与结果相关联的信息(例如,文档标签/注释、元数据等)。至少一个实体中的每个实体和每个相关实体可以包括个人、组织和场所中的至少一项。
基于每个相关实体的相关性得分和信息增强得分来分析相关实体以生成相关实体的排名(步骤708)。每个相关实体的相关性得分可以例如基于与用户相关联的信息(例如,用户简档和/或用户的认知简档内的信息)和/或至少一个查询的结果中对相应相关实体的引用次数。每个相关实体的信息增强得分可以基于至少一个查询的结果中对相应实体的引用次数与至少一个随机查询的结果中对相应实体的引用次数的比率。
基于相关实体的排名向用户提供至少一个相关实体(步骤710)。例如,可以生成(一个或多个)所建议的实体和/或用于查询的主题的列表并且将其提供给用户(例如,经由电子通信、弹出窗口等)。作为一个示例,可以基于递减的信息增强得分来对实体进行排名(或列出)。作为另一示例,可以按照与用户的相关性降序的顺序列出所建议的实体,其中信息增强得分低于预定阈值的实体从列表中被过滤掉或删除。
方法700结束于(步骤712),其中例如,用户接受搜索的结果。在一些实施例中,用户可以提供反馈(例如,通过指示所建议的实体/查询中的哪个(如果有的话)是不合适的),该反馈可以被用来随着时间的推移改善系统的性能。然后,用户可以利用结果来执行附加查询(例如,针对所建议的实体),或者这样的搜索可以被自动发起。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括其上具有用于引起处理器执行本发明的各方面的计算机可读程序指令的计算机可读存储介质。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明的操作的计算机可读程序指令可以是汇编程序指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者用一种或多种编程语言(包括诸如SMALLTALK、C++等面向对象的编程语言、以及诸如“C”编程语言或类似编程语言等常规过程编程语言)的任何组合编写的源代码或目标代码。计算机可读程序指令可以完全在用户的计算机上执行,部分地在用户的计算机上执行,作为独立软件包执行,部分地在用户的计算机上并且部分地在远程计算机上执行,或者完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到用户的计算机,或者可以与外部计算机建立连接(例如,使用互联网服务提供商通过互联网)。在一些实施例中,包括例如可编程逻辑电路系统、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路系统可以通过利用计算机可读程序指令的状态信息个性化电子电路系统来执行计算机可读程序指令,以执行本发明的方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

Claims (16)

1.一种用于由处理器标识与查询相关的实体的方法,包括:
从用户接收至少一个查询,其中所述至少一个查询与至少一个实体相关联;
分析所述至少一个查询的结果以标识相关实体;
基于所述相关实体中的每个相关实体的相关性得分和信息增强得分来分析所述相关实体以生成所述相关实体的排名;以及
基于所述相关实体的所述排名向所述用户提供所述相关实体中的至少一个相关实体。
2.根据权利要求1所述的方法,其中所述至少一个查询包括在时间范围内接收的多个查询。
3.根据权利要求1所述的方法,其中所述相关实体中的每个相关实体的所述相关性得分基于与所述用户相关联的信息。
4.根据权利要求3所述的方法,其中所述相关实体中的每个相关实体的所述信息增强得分基于相应实体的所述相关性得分与利用至少一个随机查询而确定的所述相应实体的对照相关性得分的比率。
5.根据权利要求1所述的方法,其中所述相关实体中的每个相关实体的所述信息增强得分基于所述至少一个查询的所述结果内对相应实体的引用次数与至少一个随机查询的结果内对所述相应实体的引用次数的比率。
6.根据权利要求1所述的方法,其中对所述至少一个查询的所述结果的所述分析利用自然语言处理技术而被执行。
7.根据权利要求1所述的方法,其中所述至少一个实体中的每个实体和所述相关实体中的每个相关实体包括个人、组织和场所中的至少一项。
8.一种用于标识与查询相关的实体的系统,包括:
处理器,执行存储在存储器设备中的指令,其中所述处理器:
从用户接收至少一个查询,其中所述至少一个查询与至少一个实体相关联;
分析所述至少一个查询的结果以标识相关实体;
基于所述相关实体中的每个相关实体的相关性得分和信息增强得分来分析所述相关实体以生成所述相关实体的排名;以及
基于所述相关实体的所述排名向所述用户提供所述相关实体中的至少一个相关实体。
9.根据权利要求8所述的系统,其中所述至少一个查询包括在时间范围内接收的多个查询。
10.根据权利要求8所述的系统,其中所述相关实体中的每个相关实体的所述相关性得分基于与所述用户相关联的信息。
11.根据权利要求10所述的系统,其中所述相关实体中的每个相关实体的所述信息增强得分基于相应实体的所述相关性得分与利用至少一个随机查询而确定的所述相应实体的对照相关性得分的比率。
12.根据权利要求8所述的系统,其中所述相关实体中的每个相关实体的所述信息增强得分基于所述至少一个查询的所述结果内对相应实体的引用次数与至少一个随机查询的结果内对所述相应实体的引用次数的比率。
13.根据权利要求8所述的系统,其中对所述至少一个查询的所述结果的所述分析利用自然语言处理技术而被执行。
14.根据权利要求8所述的系统,其中所述至少一个实体中的每个实体和所述相关实体中的每个相关实体包括个人、组织和场所中的至少一项。
15.一种具有存储在其中的计算机可读程序代码部分的非暂态计算机可读存储介质,其中所述计算机可读程序由一个或多个处理器执行以执行根据权利要求1至7中任一项所述的方法中的步骤。
16.一种计算机系统,包括被配置为执行根据权利要求1至7中任一项所述的方法中的步骤的模块。
CN202010252235.5A 2019-06-05 2020-04-01 用于提供建议以完成查询的方法和系统 Pending CN112052314A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/432,732 2019-06-05
US16/432,732 US11288320B2 (en) 2019-06-05 2019-06-05 Methods and systems for providing suggestions to complete query sessions

Publications (1)

Publication Number Publication Date
CN112052314A true CN112052314A (zh) 2020-12-08

Family

ID=73609194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010252235.5A Pending CN112052314A (zh) 2019-06-05 2020-04-01 用于提供建议以完成查询的方法和系统

Country Status (2)

Country Link
US (1) US11288320B2 (zh)
CN (1) CN112052314A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102349072A (zh) * 2009-01-30 2012-02-08 谷歌公司 识别查询方面
CN104484339A (zh) * 2014-11-21 2015-04-01 百度在线网络技术(北京)有限公司 一种相关实体推荐方法和系统
CN104969212A (zh) * 2013-01-30 2015-10-07 奎克西公司 基于实体来执行应用搜索
CN105493082A (zh) * 2013-06-29 2016-04-13 微软技术许可有限责任公司 利用实体扩展的人搜索
CN107533558A (zh) * 2015-05-15 2018-01-02 谷歌公司 脉络化知识面板
CN107943919A (zh) * 2017-11-21 2018-04-20 华中科技大学 一种面向会话式实体搜索的查询扩展方法
CN108038204A (zh) * 2017-12-15 2018-05-15 福州大学 针对社交媒体的观点检索系统及方法
CN108701161A (zh) * 2016-03-04 2018-10-23 微软技术许可有限责任公司 为搜索查询提供图像

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693829B1 (en) * 2005-04-25 2010-04-06 Google Inc. Search engine with fill-the-blanks capability
US8195655B2 (en) * 2007-06-05 2012-06-05 Microsoft Corporation Finding related entity results for search queries
WO2009039392A1 (en) * 2007-09-21 2009-03-26 The Board Of Trustees Of The University Of Illinois A system for entity search and a method for entity scoring in a linked document database
US9727842B2 (en) * 2009-08-21 2017-08-08 International Business Machines Corporation Determining entity relevance by relationships to other relevant entities
US8463769B1 (en) * 2009-09-16 2013-06-11 Amazon Technologies, Inc. Identifying missing search phrases
US8959079B2 (en) * 2009-09-29 2015-02-17 International Business Machines Corporation Method and system for providing relationships in search results
US20120317088A1 (en) * 2011-06-07 2012-12-13 Microsoft Corporation Associating Search Queries and Entities
US8856099B1 (en) * 2011-09-27 2014-10-07 Google Inc. Identifying entities using search results
US9477758B1 (en) * 2011-11-23 2016-10-25 Google Inc. Automatic identification of related entities
US9665643B2 (en) * 2011-12-30 2017-05-30 Microsoft Technology Licensing, Llc Knowledge-based entity detection and disambiguation
CN104428767B (zh) * 2012-02-22 2018-02-06 谷歌公司 用于识别相关实体的方法、系统和装置
US9116982B1 (en) * 2012-04-27 2015-08-25 Google Inc. Identifying interesting commonalities between entities
US20160063106A1 (en) * 2012-08-08 2016-03-03 Google Inc. Related Entity Search
US9280595B2 (en) * 2012-08-30 2016-03-08 Apple Inc. Application query conversion
US9336311B1 (en) * 2012-10-15 2016-05-10 Google Inc. Determining the relevancy of entities
WO2014089776A1 (en) * 2012-12-12 2014-06-19 Google Inc. Ranking search results based on entity metrics
US20160224621A1 (en) * 2013-03-13 2016-08-04 Google Inc. Associating A Search Query With An Entity
US9355140B1 (en) 2013-03-13 2016-05-31 Google Inc. Associating an entity with a search query
US20140365454A1 (en) 2013-06-06 2014-12-11 Microsoft Corporation Entity relevance for search queries
US10496649B1 (en) * 2013-06-22 2019-12-03 Google Llc Personalized suggestions based on past queries
US9436946B2 (en) * 2013-07-31 2016-09-06 Google Inc. Selecting content based on entities present in search results
US9418103B2 (en) * 2013-12-06 2016-08-16 Quixey, Inc. Techniques for reformulating search queries
US9836554B2 (en) * 2014-04-30 2017-12-05 Excalibur Ip, Llc Method and system for providing query suggestions including entities
US20170364519A1 (en) * 2016-06-15 2017-12-21 International Business Machines Corporation Automated Answer Scoring Based on Combination of Informativity and Specificity Metrics
US10474704B2 (en) * 2016-06-27 2019-11-12 International Business Machines Corporation Recommending documents sets based on a similar set of correlated features
GB2572541A (en) * 2018-03-27 2019-10-09 Innoplexus Ag System and method for identifying at least one association of entity
US10885045B2 (en) * 2019-03-07 2021-01-05 Wipro Limited Method and system for providing context-based response for a user query

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102349072A (zh) * 2009-01-30 2012-02-08 谷歌公司 识别查询方面
CN104969212A (zh) * 2013-01-30 2015-10-07 奎克西公司 基于实体来执行应用搜索
CN105493082A (zh) * 2013-06-29 2016-04-13 微软技术许可有限责任公司 利用实体扩展的人搜索
CN104484339A (zh) * 2014-11-21 2015-04-01 百度在线网络技术(北京)有限公司 一种相关实体推荐方法和系统
CN107533558A (zh) * 2015-05-15 2018-01-02 谷歌公司 脉络化知识面板
CN108701161A (zh) * 2016-03-04 2018-10-23 微软技术许可有限责任公司 为搜索查询提供图像
CN107943919A (zh) * 2017-11-21 2018-04-20 华中科技大学 一种面向会话式实体搜索的查询扩展方法
CN108038204A (zh) * 2017-12-15 2018-05-15 福州大学 针对社交媒体的观点检索系统及方法

Also Published As

Publication number Publication date
US20200387549A1 (en) 2020-12-10
US11288320B2 (en) 2022-03-29

Similar Documents

Publication Publication Date Title
US10042892B2 (en) Question answer system using physical distance data
US10055410B1 (en) Corpus-scoped annotation and analysis
US11409775B2 (en) Recommending documents sets based on a similar set of correlated features
US11775839B2 (en) Frequently asked questions and document retrieval using bidirectional encoder representations from transformers (BERT) model trained on generated paraphrases
US11630833B2 (en) Extract-transform-load script generation
US11250204B2 (en) Context-aware knowledge base system
US9282155B2 (en) Smart posting with data analytics and semantic analysis to improve a message posted to a social media service
US20230100501A1 (en) Dynamically generated knowledge graphs
US11275777B2 (en) Methods and systems for generating timelines for entities
US20230076923A1 (en) Semantic search based on a graph database
US20220335270A1 (en) Knowledge graph compression
US11651013B2 (en) Context-based text searching
US9965558B2 (en) Cross-channel social search
US11170010B2 (en) Methods and systems for iterative alias extraction
AU2021260520B2 (en) Cached updatable top-K index
US20220207038A1 (en) Increasing pertinence of search results within a complex knowledge base
US11157532B2 (en) Hierarchical target centric pattern generation
US11275800B2 (en) Gauging credibility of digital content items
US11288320B2 (en) Methods and systems for providing suggestions to complete query sessions
US11037104B2 (en) System, method and computer program product for remarketing an advertised resume within groups
US11436288B1 (en) Query performance prediction for multifield document retrieval
US11222057B2 (en) Methods and systems for generating descriptions utilizing extracted entity descriptors
US20190164066A1 (en) Dynamic run-time corpus builder

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination