CN102279871B - 基于词法和本体概念重排搜索结果 - Google Patents

基于词法和本体概念重排搜索结果 Download PDF

Info

Publication number
CN102279871B
CN102279871B CN201110165186.2A CN201110165186A CN102279871B CN 102279871 B CN102279871 B CN 102279871B CN 201110165186 A CN201110165186 A CN 201110165186A CN 102279871 B CN102279871 B CN 102279871B
Authority
CN
China
Prior art keywords
concept
search
search results
inquiry
leading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110165186.2A
Other languages
English (en)
Other versions
CN102279871A (zh
Inventor
V·瓦德拉曼尼
M·斯里坎斯
A·斯里瓦斯塔瓦
T·纳杰姆
A·C·萨瑞德兰
J·米奇利
M·A·阿里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US12/796,127 external-priority patent/US9177057B2/en
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN102279871A publication Critical patent/CN102279871A/zh
Application granted granted Critical
Publication of CN102279871B publication Critical patent/CN102279871B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及基于词法和本体概念重排搜索结果。通过采用来自元数据库的概念图提供了搜索结果重排。当接收到搜索查询时,分析搜索查询的查询上下文以标识搜索查询的主导概念。通过标识概念图内的主导概念并且标识与概念图内的主导概念具有强关系的附加概念,来扩展主导概念。分析搜索查询的一组搜索结果以确定每个搜索结果到扩展概念的关系强度。搜索结果基于每个搜索结果到扩展概念的关系强度、以及每个扩展概念到主导概念的关系强度来重排序。

Description

基于词法和本体概念重排搜索结果
技术领域
本发明涉及计算机搜索,尤其涉及搜索结果的重排。
背景技术
搜索引擎可用于为搜索查询提取web结果、新闻以及其他感兴趣的文档。当搜索门户希望以有意义的方式呈现这些结果时,这些门户通常不知道这些文档对于它们的用户上下文的相对重要性。可用文档、新闻文章以及其他文档被排列,但不必要考虑主导的话题上下文。这具有减低和用户上下文有关的关键结果项的重要性的无意效果。
发明内容
提供本发明内容是为了以简化的形式介绍将在以下具体实施方式中进一步描述的一些概念。本发明内容不旨在标识所要求保护的主题的关键特征或本质特征,也不旨在用于帮助确定所要求保护的主题的范围。
本发明的各实施例涉及提供搜索结果的改进的相关性。当接收到搜索查询时,分析搜索查询的查询上下文以标识搜索查询的一个或多个主导概念。然后使用来自元数据库的概念图来扩展主导概念以标识多个扩展的概念。分析搜索查询的搜索结果以标识每个搜索结果包括扩展的概念的程度。搜索结果基于每个搜索结果到扩展概念的关系强度、以及每个扩展概念到查询上下文的主导概念的关系强度来重排序。
附图说明
下面参考附图详细描述本发明,附图中:
图1是适用于实现本发明的各实施例的示例性计算环境的框图;
图2是示出其中可以使用本发明各实施例的示例性系统的框图;
图3是示出根据本发明一实施例的用于标识查询上下文的主导概念、并且使用元数据库来扩展所述概念的方法的流程图;
图4是示出根据本发明的一实施例的用于采用元数据库来标识搜索查询的扩展概念的方法的流程图;
图5是示出根据本发明的一实施例的用于使用扩展概念来排序搜索结果的方法的流程图;以及
图6是示出根据本发明的一实施例的用于使用扩展概念来分析和排序搜索结果的方法的流程图。
具体实施方式
此处用细节来描述本发明的主题以满足法定要求。然而,该描述本身并非旨在限制本专利的范围。相反,发明人设想所要求保护的主题还可结合其他当前或未来技术按照其他方式来具体化,以包括不同的步骤或类似于本文中所描述的步骤的步骤组合。此外,尽管术语“步骤”和/或“框”可在此处用于指示所采用的方法的不同元素,但除非而且仅当明确描述了各个步骤的顺序,否则该术语不应被解释为意味着此处公开的各个步骤之中或之间的任何特定顺序。
如前所述,本发明的各实施例一般针对通过处理相关概念的搜索查询和结果,来为搜索查询的上下文改进搜索结果的相关性。按照本发明各实施例,可以分析搜索查询来标识查询上下文。也可以标识查询上下文内的主导概念。可以使用来自元数据库的概念图来扩展主导概念以标识扩展的概念。概念图将概念表示为节点,将概念间的关系表示为节点间的边。可以通过分析电子文档的语料库来提取概念和关系,从而构建概念图。概念图中的概念包括具有相关联的表面形式或字符串的词法概念、以及具有和图中其他概念的语义关系的本体概念。此外,概念图可以包括表示每个概念之间的关系强度的数据。
可以通过确定概念图内主导概念的位置、并且标识和主导概念具有关系的概念,从而从概念图中标识扩展的概念。扩展概念可以基于从概念图确定的、每个概念与主导概念的关系强度来选择。
扩展概念可用于分析搜索查询的一组搜索结果并对其进行重排。特别是,可以分析每个搜索结果以确定搜索结果是否包含每个扩展概念。可以在每个搜索结果和每个扩展概念之间确定关系强度。然后基于每个搜索结果到每个扩展概念的关系强度、以及每个扩展概念到搜索查询的主导概念的关系强度,对搜索结果进行重排。
因而,在一方面,本发明的实施例针对一种用于重排多个搜索结果的计算机实现的方法。该方法包括接收搜索查询并且从搜索查询中标识一个或多个主导概念。该方法还包括用和元数据库中的一个或多个主导概念具有关系的多个扩展概念来扩展一个或多个主导概念。该方法还包括接收多个经排序的搜索结果,使用扩展概念分析搜索结果,以及基于扩展概念重排搜索结果。该方法还包括提供经重排的搜索结果以呈现给终端用户。
在另一实施例中,本发明的一方面涉及存储计算机可使用指令的一个或多个计算机可读介质,当这些指令由一个或多个计算设备使用时,使该一个或多个计算设备执行一种方法。该方法包括接收搜索查询并且标识所述搜索查询的查询上下文。该方法还包括分析查询上下文以标识一个或多个主导概念。该方法还包括:标识概念图内一个或多个主导概念的每一个的位置、并且标识和概念图内的一个或多个主导概念具有关系的多个附加概念。该方法还包括:向每个附加概念分配第一权重,表示每个附加概念到概念图内的一个或多个主导概念的关系强度。该方法还包括:基于所分配的权重选择附加概念的一个子集以提供一组扩展概念。该方法还包括接收多个搜索结果并且分析每个搜索结果以确定每个搜索结果是否包括扩展概念中的一个或多个。该方法还包括向每个搜索结果分配一个或多个第二权重,表示每个搜索结果到扩展概念的关系强度。该方法还包括:基于第一权重和第二权重的组合来排序搜索结果,并且提供经排序的搜索结果供呈现给终端用户。
本发明的又一实施例针对一种包括一个或多个处理器和存储计算机可使用组件的一个或多个计算机可读介质的系统。计算机可使用组件包括查询上下文分析组件、查询扩展组件、搜索结果分析组件以及搜索结果排序组件。查询上下文分析组件分析接收到的搜索查询的查询上下文以标识搜索查询的一个或多个主导概念。查询扩展组件使用来自元数据库的概念图将一个或多个主导概念扩展为多个扩展概念。搜索结果分析组件分析多个搜索结果以确定每个搜索结果到扩展概念的关系强度。搜索结果排序组件基于每个搜索结果到扩展概念的关系强度、以及每个扩展概念到一个或多个主导概念的关系强度来排序多个搜索结果。
在简要描述了本发明各实施例的概览之后,以下描述可实现本发明的各实施方式的示例性操作环境,以便为本发明各方面提供通用上下文。首先具体参考图1,示出了用于实现本发明的各实施方式的示例性操作环境,并将其概括地指定为计算设备100。计算设备100只是合适的计算环境的一个示例,并且不旨在对本发明的使用范围或功能提出任何限制。也不应该将计算设备100解释为对所示出的组件的任何一个或组合有任何依赖性或要求。
本发明可以在由计算机或诸如个人数据助理或其他手持式设备之类的其他机器执行的计算机代码或机器可使用指令(包括诸如程序模块之类的计算机可执行指令)的一般上下文中描述。一般而言,包括例程、程序、对象、组件、数据结构等的程序模块指的是执行特定任务或实现特定抽象数据类型的代码。本发明可以在各种系统配置中实施,这些系统配置包括手持式设备、消费电子产品、通用计算机、专用计算设备等等。本发明也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实施。
参考图1,计算设备100包括直接或间接耦合以下设备的总线110:存储器112、一个或多个处理器114、一个或多个呈现组件116、输入/输出端口118、输入/输出组件120、和说明性电源122。总线110表示一条或多条总线(诸如地址总线、数据总线、或其组合)。虽然为了清楚起见利用线条示出了图1的各个框,但实际上,这些框表示逻辑组件而不一定是实际组件。例如,可以认为诸如显示设备的呈现组件是I/O组件。而且,处理器具有存储器。可以认识到,这是本领域的特性,并且重申,图1的图示只是例示可结合本发明的一个或多个实施例来使用的示例性计算设备。诸如“工作站”、“服务器”、“膝上型计算机”、“手持式设备”等分类之间没有区别,它们全部都被认为是在图1的范围之内的并且被称为“计算设备”。
计算设备100通常包括各种计算机可读介质。计算机可读介质可以是可由计算机设备100访问的任何可用介质,且包括用任何方法或技术实现以存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的易失性和非易失性介质、可移动和不可移动介质。计算机可读介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、盒式磁带、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并且可由计算设备100访问的任何其它介质。上述的任意组合也应包含在计算机可读介质的范围内。
存储器112包括易失性和/或非易失性存储器形式的计算机存储介质。存储器可以是可移动的、不可移动的、或其组合。示例性硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。计算设备100包括从诸如存储器112或I/O组件120等各种实体读取数据的一个或多个处理器。呈现组件116向终端用户或其他设备呈现数据指示。示例性呈现组件包括显示设备、扬声器、打印组件、振动组件等等。
I/O端口118允许计算设备100逻辑上耦合至包括I/O组件120的其他设备,其中的一些设备可以是内置的。说明性组件包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪、打印机、无线设备等等。
现参考图2,提供了示出在其中可以采用本发明的各实施方式的示例性系统200的框图。应当理解,此处所描述的这一和其他安排仅作为示例来阐明。除了所示的安排和元素之外,或作为其替代,可使用其他安排和元素(例如,机器、接口、功能、次序、以及功能组等),并且可完全省略某些元素。此外,此处所描述的许多元素是可以实现为分立或分布式组件或结合其他组件来实现的、以及以任何合适的组合和在任何合适的位置的功能实体。此处被描述为由一个或多个实体执行的各种功能可由硬件、固件和/或软件来执行。例如,各种功能可由执行存储在存储器中的指令的处理器来执行。
除了未示出的其他组件之外,系统200包括用户设备202、搜索引擎204和重排序引擎206。图2中所示的组件的每一个可以包括在任何类型的计算设备上,诸如例如参考图1描述的计算设备100。各组件可以经由网络208彼此通信,网络208包括但不限于一个或多个局域网(LAN)和/或广域网(WAN)。这样的联网环境常见于办公室、企业范围计算机网络、内联网和因特网中。应理解,可在本发明范围内的系统200内采用任何数量的用户设备、重排序引擎和搜索引擎。它们各自可包括单个设备或在分布式环境中协作的多个设备。例如,重排序引擎206可包括安排在分布式环境中共同提供此处描述的重排序引擎206的功能的多个设备。另外,未示出的其他组件还可被包括在系统200中并且在某些实施方式中可以排除图2所示的组件。
按照本发明的各实施例,重排序引擎206一般用于标识搜索查询的主导概念,使用元数据库218来扩展主导概念,并且基于到扩展概念的关系强度来重排序搜索结果。如图2所示,重排序引擎206一般包括查询上下文分析组件210、查询扩展组件212、搜索结果分析组件214和搜索结果排序组件216。
在操作中,重排序组件206可以接收搜索查询。在一些实施例中,搜索查询可由采用诸如用户设备202等用户设备的终端用户提交。例如,终端用户可以使用用户设备202上的web浏览器来访问搜索输入网页并输入搜索查询。作为另一示例,用户可以经由搜索引擎工具栏所提供的搜索输入框来输入搜索查询,搜索引擎工具栏位于例如web浏览器、用户设备202的桌面、或其他位置内。本领域技术人员将认识到,在本发明的各实施方式的范围内还可以使用各种其他方法来提供搜索查询。在其他实施例中,可以提供API,其允许应用程序提交由重排序引擎206所接收的搜索查询。例如,应用程序可以驻留在向重排序引擎206提交搜索查询的用户设备202或其他第三方设备上。
当重排序引擎206接收搜索查询时,查询上下文分析组件210分析搜索查询以标识查询上下文。查询上下文可以包括关于搜索查询的各种信息。例如,搜索查询可以包括由终端用户输入的搜索项,查询上下文包括那些搜索项。在其他情况下,搜索查询可以包括空查询,其中终端用户未提供搜索项。查询上下文还可以包括其他信息,诸如例如,提交搜索查询的时间、或者提交搜索查询的终端用户的位置。在本发明各实施例中,与搜索查询有关的各种附加信息可由查询上下文分析组件210标识为查询上下文的一部分。
查询上下文分析组件210也可以基于查询上下文来标识搜索查询的一个或多个主导概念。每个主导概念可以是搜索查询相关的一个特定的话题或实体,诸如人、地方或事物。主导概念不仅仅是来自搜索查询的项,而是表示由查询上下文的分析而确定的搜索查询的主焦点。在一些实施例中,可以通过结合来自元数据库218的概念分析查询上下文,来标识主导概念。特别是,元数据库218可以包括概念图等。概念图可以存储和概念以及概念间的关系有关的数据。概念可以由概念图中的节点来表示,节点间的边可以表示概念间的关系。此外,边可以标识概念间的关系强度。可以通过分析诸如万维网上可用的文档等电子文档的语料库来构建元数据库218所存储的数据,包括概念图,从而标识文档内的概念以及概念间的关系。基于对文档的改变以及新文档的添加,数据可以是动态的。例如,概念图可以基于在新闻文章被发布时从所述文章收集的概念来更新。由此,概念图和元数据库不是域受限的。
查询扩展组件212通过用来自元数据库218的扩展概念的集合来扩展搜索查询的主导概念从而进行操作。按照本发明的一些实施例,这可以包括在元数据库218的概念图中标识每个主导概念的位置。标识与概念图中的主导概念具有关系的其他概念。此外,从概念图确定概念到主导概念的关系强度。在各实施例中,可以为每个概念确定表示所述概念到主导概念的关系强度的权重、排名或其他分数。概念权重、排名或分数可用于确定将哪些概念选择作为供进一步分析的扩展概念。例如,在一些实施例中,可以选择最上面的N个概念作为扩展概念。在其他实施例中,可以选择具有超过一预定阈值的权重、排名或其他分数的概念作为扩展概念。
可以采用扩展概念来重排一组搜索结果。在本发明各实施例中,可以以多种不同的方式将要被重排的搜索结果提供给重排序引擎206。在一些实施例中,搜索引擎204提供一组经排序的搜索结果。搜索结果可以使用初始搜索查询并且基于搜索引擎204对可搜索内容220的底层搜索算法来选择和排序,所述可搜索内容220可以包括搜索系统索引。在一些情况下,搜索结果也可以初始地部分基于为查询上下文标识的主导概念和/或扩展概念来选择。
可搜索内容220可以包括多个不同的源,诸如一般web文档、新闻文档、照片、TWITTER源等。由此,在一些实施例中,接收到的搜索查询可以包括对应于不同源的单独的搜索结果集合。例如,接收到的搜索结果可以包括一组一般web文档、一组新闻文档、一组照片、一组TWITTER源等。
按照各实施例,搜索引擎204和重排序引擎206两者可由单个搜索系统提供者来提供,使得搜索引擎204和重排序引擎206共同用于从终端用户接收搜索查询并且返回经重排的搜索结果。在其他实施例中,搜索引擎204可由与重排序引擎206的提供者分开的搜索系统提供者来提供。由此,重排序引擎可以接收初始搜索查询以及用于重排的一组搜索结果,作为来自搜索引擎204的输入。在进一步的实施例中,图2中未示出的其他组件可以向重排序引擎206提供搜索查询和该组搜索结果,用于重排搜索结果。
搜索结果分析组件214使用扩展概念来分析该组搜索结果。按照一些实施例,搜索结果分析组件214分析每个搜索结果以标识搜索结果是否包含扩展概念。分析可以对搜索结果标题、搜索结果片段、搜索结果所引用的文档、或与搜索结果相关联的其他文本或元数据来执行。可以为每个搜索结果和每个扩展概念分配表示扩展概念到搜索结果的关系强度的权重、排名或其他分数。
搜索结果排序组件216使用搜索结果/扩展概念权重、排名或分数以及扩展概念/主导概念对的权重、排名或分数,来排序搜索结果。特别是,搜索结果/扩展概念对的权重、排名或分数表示每个搜索结果到扩展概念的关系强度,扩展概念/主导概念的权重、排名或分数表示每个扩展概念到主导概念的关系强度。在一些实施例中,搜索结果可以包括在被接收时可由搜索结果排序组件216用来或不用来确定搜索结果排名的初始排名。搜索结果可以被提供给终端用户,并且按照搜索结果排序组件216所确定的排名来呈现。
转向图3,提供了示出根据本发明的一实施例的用于采用元数据库来标识搜索查询的扩展概念的方法300的流程图。最初,如在框302所示,接收搜索查询。在一些实施例中,搜索查询可由终端用户提交。例如,终端用户可以采用web浏览器来访问搜索输入网页并输入搜索查询。作为另一示例,终端用户可以经由搜索引擎工具栏所提供的搜索输入框来输入搜索查询,搜索引擎工具栏位于例如web浏览器、终端用户设备的桌面、或其他位置内。本领域技术人员将认识到,终端用户还可以采用各种其它方法来提供搜索查询。在进一步的实施例中,可以提供API,其允许任一应用查询查询系统以接收使用本发明各实施例重排的搜索结果的列表。
在接收搜索查询后,分析搜索查询的查询上下文,如框304所示。特别是,查询上下文包括关于搜索查询的信息。在一些实例中,搜索查询包括由终端用户输入的搜索项,查询上下文包括那些搜索项。在其他情况下,搜索查询可以包括空查询,其中终端用户未提供搜索项。查询上下文还可以包括其他信息,诸如例如,提交搜索查询的时间、或者提交搜索查询的终端用户的位置。在本发明各实施例中,可以将关于搜索查询的各种附加信息标识为查询上下文的一部分。
如框306所示,从查询上下文标识一个或多个主导概念。每个主导概念可以是搜索查询相关的一个特定的话题或实体,诸如人、地方或事物。主导概念不仅仅是来自搜索查询的项,而是表示由查询上下文的分析而确定的搜索查询的主焦点。
在一些实施例中,可以通过结合来自元数据库的概念图分析查询上下文,来标识主导概念。如上所述,概念图可以包括概念以及概念间的关系的集合。概念被表示为概念图内的节点,概念间的关系被表示为节点间的边。通过使用查询上下文,可以将来自概念图的概念标识为搜索查询的主导概念。
在进一步的实施例中,可以为特定类型的搜索预定义主导概念。例如,当终端用户首次访问金融门户或金融搜索联合过程时而终端用户不提交搜索查询时,该门户或搜索联合过程可以自动地提供诸如金融相关新闻等多个搜索结果。金融门户或搜索联合过程用来访问这种搜索结果的搜索查询可以被视为空查询,因为终端用户未提供任何搜索项。在这种情况下,查询上下文可以将搜索查询标识为由金融门户或金融搜索联合过程生成,并且可以标识与金融有关的一个或多个缺省主导概念。
如框308所示,为查询上下文标识的主导概念用来自元数据库的附加概念来扩展。可以采用多种方法来用来自元数据库的附加概念来扩展主导概念。图4中示出使用元数据库来扩展主导概念的一种示例性方法400。如框402所示,该过程包括标识概念图内的主导概念。此外,如框404所示,在概念图内标识与主导概念具有关系的其他概念。如框406所示,基于到概念图内每一个主导概念的关系强度,向每一个附加概念分配权重或其他类型的分数。
在框408基于分配给每个概念的权重来选择一组扩展的概念。在一些实施例中,选择具有最大权重(即表示到主导概念的最强关系)的预定数量的扩展概念。例如,可以在框408选择最上面N个概念。在其他实施例中,在框408选择具有超过预定阈值的权重的所有概念。例如,可由系统提供者预定义一阈值,该阈值表示到主导概念的充分关系强度。权重超过该阈值的任何概念会被认为可用于进一步评估。相反,不具有到主导概念的充分关系(即不超过阈值)的概念会被排除。用于确定从概念图选择哪些概念的任何或全部这样的变化方式都可被构想在本发明各实施例的范围内。
接着参考图5,提供了示出根据本发明的一实施例的、用于使用扩展概念来重排搜索结果的方法500的流程图。如框502所示,接收到给定搜索查询的一组搜索结果。搜索结果可以从单个源或从多个源获得。例如,搜索结果可以包括一般web搜索结果、新闻结果、图像结果、视频结果、TWITTER搜索结果等等。
在一些实施例中,可以通过使用初始搜索查询进行搜索来获得一组搜索结果。可以采用搜索引擎的本机搜索技术和算法来执行搜索以选择和排序该组搜索结果。在一些实施例中,在选择初始搜索结果集合时,可以采用为搜索查询标识的主导概念和/或扩展概念。在进一步的实施例中,可以提供一组经排序的搜索结果作为搜索查询的一部分。例如,可以提供API,其允许应用程序通过提供一组搜索结果供使用本发明各实施例来重排,来查询系统。
如框504所示,使用为搜索查询标识的扩展概念来分析搜索结果。扩展概念已经使用诸如上面参照图3描述的方法来标识。搜索结果基于扩展概念在框506被排序。根据本发明的各实施例,可以使用多种不同的方法来分析和排序搜索结果。
图6示出使用扩展概念来分析和重排搜索结果的一种示例性的方法600。如框602所示,分析每一个搜索结果来标识扩展概念是否出现在每个搜索结果中。这可以包括分析搜索结果标题、搜索结果片段和/或搜索结果所引用的文档的部分。如框604所示,基于该分析,向每个扩展概念的每个搜索结果分配一权重或其他分数。给定搜索结果和扩展概念的权重表示搜索结果到扩展概念的关系强度。权重可以例如通过确定扩展概念出现在搜索结果中的次数来导出。作为另一例子,可以通过标识搜索结果中的概念并且使用来自元数据库的概念图来确定那些概念到扩展概念的关系强度,来导出权重。可以采用多种附加方法来为给定的搜索结果和扩展概念对分配权重。
作为框604处分析的结果,搜索结果对于每一个扩展概念会有一个相关联的权重。如框606所示,这些权重对于每个搜索结果总计并且用来排序搜索结果。在各实施例中,搜索结果/扩展概念权重结合被分配给每个扩展概念的权重一起使用,被分配给每个扩展概念的权重表示每个扩展概念到来自查询上下文的主导概念的关系强度。
在一些实施例中,搜索结果具有初始排名。例如,可以通过使用搜索查询来执行一般web搜索来获得搜索结果,搜索查询为搜索结果提供排名。在本发明各实施例中,基于搜索结果/扩展概念权重以及扩展概念/主导概念权重,初始排名或者可以被丢弃或者可以结合排名一起使用。
作为使用权重的替换,在一些实施例中可以采用排名或其他分数。例如,可以为每个扩展概念排序搜索结果,使得搜索结果基于搜索结果到每个扩展概念的关系强度来排序。每个扩展概念也可以对于来自查询上下文的主导概念被排序,使得扩展概念基于到主导概念的关系强度被排序。排序可以总计以确定搜索结果的总排序。
返回图5,在基于搜索结果到扩展概念的关系强度以及扩展概念到来自查询上下文的主导概念的关系强度对搜索结果进行排序之后,提供搜索结果供呈现给终端用户,如框508所示。搜索结果按照在框506确定的排名来呈现。例如,搜索结果可以在基于排名排序的列表中呈现。在一些实施例中,一个或多个最高排名的搜索结果可以在显著位置中呈现,而其他搜索结果被置于较不显著的位置中。例如,较高排名的搜索结果可以在搜索结果页面上呈现,而较低排名的搜索结果可以在各种选项卡中提供并且在终端用户选择这些选项卡之前不呈现。在从多个源获得搜索结果的实施例中,可以在分开的组中提供搜索结果。例如,可以在一个组中提供一般web搜索结果,可以在另一个组中提供新闻搜索结果,等等。
可以理解,本发明的各实施例针对通过处理来自查询上下文的主导概念来从概念图标识扩展概念、并且使用扩展概念来重排搜索结果,从而改进搜索结果的相关性。
参考各具体实施方式描述了本发明,各具体实施方式在所有方面都旨在是说明性的而非限制性的。在不偏离本发明范围的情况下,各替换实施方式对于本发明所属领域的技术人员将变得显而易见。
从前面的描述可以看出,本发明很好地适用于实现上文所阐述的所有目的和目标,并且具有对于该系统和方法是显而易见且固有的其他优点。也可理解特定的特征和子组合是有用的,并且可以加以利用而无需参考其他特征和子组合。这由权利要求所构想的,并在权利要求的范围内。

Claims (15)

1.一种用于重排多个搜索结果的计算机实现的方法,所述方法包括:
接收搜索查询;
标识来自所述搜索查询的一个或多个主导概念,其中,所述一个或多个主导概念是所述搜索查询相关的话题或实体;
用和元数据库中的一个或多个主导概念具有关系的多个扩展概念来扩展所述一个或多个主导概念;
接收多个经排序的搜索结果;
使用所述扩展概念来分析所述搜索结果,包括标识每个搜索结果到每个扩展概念的关系强度;
基于所述扩展概念来重排所述搜索结果,包括基于每个搜索结果到每个扩展概念的关系强度以及每个扩展概念到一个或多个主导概念的关系强度来重排搜索结果;以及
提供经重排的搜索结果供呈现给终端用户。
2.如权利要求1所述的计算机实现的方法,其特征在于,所述搜索查询包括一个或多个搜索项,所述一个或多个主导概念至少部分基于所述一个或多个搜索项来标识。
3.如权利要求2所述的计算机实现的方法,其特征在于,通过使用元数据库来分析所述一个或多个搜索项,来标识所述一个或多个主导概念。
4.如权利要求2所述的计算机实现的方法,其特征在于,通过除一个或多个搜索项之外使用查询上下文信息,来标识所述一个或多个主导概念。
5.如权利要求1所述的计算机实现的方法,其特征在于,通过在万维网上可用的电子文档中标识概念和概念间的关系来构建元数据库,所述元数据库在新内容被发布在万维网上时动态地更新。
6.如权利要求1所述的计算机实现的方法,其特征在于,所述多个经排序的搜索结果包括来自多个源的多个单独的搜索结果集合,其中所述多个源包括从以下中选择的一个或多个:一般web搜索结果、新闻和照片。
7.一种用于提供多个搜索结果的方法,包括:
接收搜索查询;
标识所述搜索查询的查询上下文;
分析查询上下文以标识一个或多个主导概念,其中,所述一个或多个主导概念是所述搜索查询相关的话题或实体;
标识概念图内的所述一个或多个主导概念的每一个的位置;
标识与概念图内的一个或多个主导概念具有关系的多个附加概念;
向每个附加概念分配第一权重,表示每个附加概念到概念图内的一个或多个主导概念的关系强度;
基于所分配的权重选择附加概念的一个子集以提供一组扩展概念;
接收多个搜索结果;
分析每个搜索结果以确定每个搜索结果是否包括扩展概念中的一个或多个;
向每个搜索结果分配一个或多个第二权重,表示每个搜索结果到扩展概念的关系强度;
基于第一权重和第二权重的组合来排序搜索结果;以及
提供经排序的搜索结果供呈现给终端用户。
8.如权利要求7所述的方法,其特征在于,所述搜索查询包括一个或多个搜索项,所述查询上下文包括所述一个或多个搜索项。
9.如权利要求8所述的方法,其特征在于,所述查询上下文包括除所述一个或多个搜索项之外的信息。
10.如权利要求7所述的方法,其特征在于,所述搜索查询包括空查询。
11.如权利要求7所述的方法,其特征在于,通过使用概念图来分析查询上下文,来标识所述一个或多个主导概念。
12.如权利要求7所述的方法,其特征在于,通过在万维网上可用的电子文档中标识概念和概念间的关系来构建概念图,所述概念图在新内容被发布在万维网上时动态地更新。
13.如权利要求7所述的方法,其特征在于,所述多个搜索结果包括来自多个源的多个单独的搜索结果集合,其中所述多个源包括从以下中选择的一个或多个:一般web搜索结果、新闻和照片。
14.一种包括一个或多个处理器和存储计算机可使用组件的一个或多个计算机可读介质的系统,所述计算机可使用组件包括:
查询上下文分析组件,其分析接收到的搜索查询的查询上下文以标识搜索查询的一个或多个主导概念,其中,所述一个或多个主导概念是所述搜索查询相关的话题或实体;
查询扩展组件,其使用来自元数据库的概念图将一个或多个主导概念扩展为多个扩展概念;
搜索结果分析组件,其分析多个搜索结果以确定每个搜索结果到扩展概念的关系强度;以及
搜索结果排序组件,其基于每个搜索结果到扩展概念的关系强度、以及每个扩展概念到一个或多个主导概念的关系强度来排序多个搜索结果。
15.一种用于提供多个搜索结果的系统,包括:
用于接收搜索查询的装置;
用于标识所述搜索查询的查询上下文的装置;
用于分析查询上下文以标识一个或多个主导概念的装置,其中,所述一个或多个主导概念是所述搜索查询相关的话题或实体;
用于标识概念图内的所述一个或多个主导概念的每一个的位置的装置;
用于标识与概念图内的一个或多个主导概念具有关系的多个附加概念的装置;
用于向每个附加概念分配第一权重,表示每个附加概念到概念图内的一个或多个主导概念的关系强度的装置;
用于基于所分配的权重选择附加概念的一个子集以提供一组扩展概念的装置;
用于接收多个搜索结果的装置;
用于分析每个搜索结果以确定每个搜索结果是否包括扩展概念中的一个或多个的装置;
用于向每个搜索结果分配一个或多个第二权重,表示每个搜索结果到扩展概念的关系强度的装置;
用于基于第一权重和第二权重的组合来排序搜索结果的装置;以及
用于提供经排序的搜索结果供呈现给终端用户的装置。
CN201110165186.2A 2010-06-08 2011-06-07 基于词法和本体概念重排搜索结果 Active CN102279871B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/796,127 US9177057B2 (en) 2010-06-08 2010-06-08 Re-ranking search results based on lexical and ontological concepts
US12/796,127 2010-06-08

Publications (2)

Publication Number Publication Date
CN102279871A CN102279871A (zh) 2011-12-14
CN102279871B true CN102279871B (zh) 2016-12-14

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1829989A (zh) * 2003-07-30 2006-09-06 Google公司 利用知识条目关联信息理解知识条目含义的方法与系统
US7536413B1 (en) * 2001-05-07 2009-05-19 Ixreveal, Inc. Concept-based categorization of unstructured objects

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7536413B1 (en) * 2001-05-07 2009-05-19 Ixreveal, Inc. Concept-based categorization of unstructured objects
CN1829989A (zh) * 2003-07-30 2006-09-06 Google公司 利用知识条目关联信息理解知识条目含义的方法与系统

Similar Documents

Publication Publication Date Title
CN102822815B (zh) 用于利用浏览器历史进行动作建议的方法和系统
CN100504866C (zh) 一种综合搜索结果的排序系统及方法
CN101523338B (zh) 应用来自用户的反馈来改进搜索结果的搜索引擎
JP5801291B2 (ja) 検索結果のマージ
CN104199833B (zh) 一种网络搜索词的聚类方法和聚类装置
WO2011080899A1 (ja) 情報推薦方法
US20110264651A1 (en) Large scale entity-specific resource classification
CN105786977A (zh) 基于人工智能的移动搜索方法和装置
Budikova et al. Evaluation platform for content-based image retrieval systems
WO2009009192A2 (en) Adaptive archive data management
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
JP2013531289A (ja) 検索におけるモデル情報群の使用
US20100010982A1 (en) Web content characterization based on semantic folksonomies associated with user generated content
US20180060427A1 (en) Navigating a Taxonomy Using Search Queries
US8538941B2 (en) Visual information search tool
US9552415B2 (en) Category classification processing device and method
CN109977318B (zh) 书籍搜索方法、电子设备及计算机存储介质
Nawazish et al. Integrating “Random Forest” with Indexing and Query Processing for Personalized Search
US7827164B2 (en) System for obtaining, managing and providing retrieved content and a system thereof
CN105975508B (zh) 个性化元搜索引擎检索结果合成排序方法
Zhou et al. Evaluating large-scale distributed vertical search
CN116431895A (zh) 安全生产知识个性化推荐方法及系统
CN102279871B (zh) 基于词法和本体概念重排搜索结果
KR101592670B1 (ko) 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법
Huang et al. Rough-set-based approach to manufacturing process document retrieval

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20150730

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

GR01 Patent grant