CN102591985A - 与搜索框关联的查询重构 - Google Patents

与搜索框关联的查询重构 Download PDF

Info

Publication number
CN102591985A
CN102591985A CN2012100070607A CN201210007060A CN102591985A CN 102591985 A CN102591985 A CN 102591985A CN 2012100070607 A CN2012100070607 A CN 2012100070607A CN 201210007060 A CN201210007060 A CN 201210007060A CN 102591985 A CN102591985 A CN 102591985A
Authority
CN
China
Prior art keywords
user
query
user inquiring
query word
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100070607A
Other languages
English (en)
Other versions
CN102591985B (zh
Inventor
G.库马兰
T.戈瓦尼
A.M.迪里耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102591985A publication Critical patent/CN102591985A/zh
Application granted granted Critical
Publication of CN102591985B publication Critical patent/CN102591985B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供方法以及其上包含有计算机可执行指令的计算机存储媒介,它们便于与搜索框关联地重构用户查询。接收具有多个词的用户查询,确定所接收的用户查询满足一个阈值。基于所接收的用户查询,确定第一个重构的用户查询的集合。所述第一个重构的用户查询的集合包括多个成员查询。所述多个成员查询可包含一个或多个建议的查询词变更和/或一个或多个建议的查询词删除。所述成员查询在呈现给用户之前可被分类成多个组和/或被分级。还可以呈现选择选项,供用户用于输入附加的查询词。

Description

与搜索框关联的查询重构
背景技术
用户在搜索引擎的搜索框中输入各种查询。当输入这些查询时,搜索引擎可生成关于用户当前在搜索框中输入的查询的建议。例如,建议的查询可由提供自动建议功能的搜索引擎生成,所述自动建议功能在用户在词(term)的开始处输入字符的时候完成词中未输入的字符。这种自动建议功能呈现词的多种变体,以及呈现用于完成未完成的查询的多种选项。在为完成词的字符而呈现多个变体的过程中,查询被“扩展”,并且用户可在利用自动建议功能生成的扩展的查询中进行选择。
在一些实例中,当搜索引擎为输入的词呈现扩展的查询时,搜索引擎另外也基于该扩展的查询向用户生成和显示搜索结果。尽管这些搜索结果可能与用户最终提交的完整的查询相关或可能不相关,提供查询词的自动建议完成和查询结果的自动生成的组合来辅助用户检索最相关的搜索结果。然而,在另一些实例中,在搜索框中输入具有多个词的长的查询的用户可能不利用自动建议功能来完成单独的词,并且也可以在完成用户想要的搜索之前不利用查询结果的显示。
发明内容
提供本发明内容部分旨在以简化的形式介绍精选的原理,该精选的原理将在后面的具体实施方式中进一步阐述。本发明内容部分并非意在标识要求保护的主题的关键技术特征或必要技术特征,也并非意在用来帮助确定要求保护的主题的范围。
本发明的实施例是关于与搜索框关联的查询重构(reformulation)。区别于扩展未完成的任意长度的查询的自动建议特征,查询重构是指对包含用户已经输入的多个词的用户查询进行重构。在实施例中,查询重构对包含满足一个阈值的特定数量的词的查询执行。当已经接收到满足一个阈值的多个词的用户查询时,确定重构的用户查询集合。重构的用户查询在生成满足用户查询的搜索结果之前与接收初始的用户查询的搜索框关联地呈现。
重构的用户查询集合包含一个或多个成员查询。所述成员查询包括对重构的用户查询的一个或多个建议,例如建议的查询词变更和/或建议的查询词删除。在一个实施例中,重构的用户查询在呈现给用户之前被分级(rank)。例如,已分级的建议的查询词变更及已分级的建议的查询词删除可以以与用户原始查询最相关的顺序呈现给用户。在另一个实施例中,重构的用户查询被分类成多个组,然后再与所述组关联地呈现给用户。例如,重构的用户查询集合中的成员查询可被分组为建议的查询词变更和建议的查询词删除。
在进一步的实施例中,重构的用户查询集合中的成员查询与搜索框相关联地呈现给用户用于选择。基于用户对建议的查询词变更或建议的查询词删除进行的选择,生成满足所选择的成员查询的查询结果。在一个实施例中,为用户提供选择选项来输入与原始的用户查询相关联的附加的词。当已经接收到附加的词时,第二个重构的用户查询集合可以生成。可替换地,满足包含原始用户查询的词和用户输入的附加的词的新的用户查询的查询结果。
附图说明
下面参考附图详细描述本发明的实施例,其中:
图1是适于用来实现本发明实施例的示例计算环境的框图;
图2是根据本发明实施例确定的重构的用户查询的示意显示;及
图3-8是示出根据本发明实施例重构用户查询的方法的流程图。
具体实施方式
在此以特异性描述本发明的主题以满足法定要求。然而,描述本身并非旨在限制本专利的范围。相反,发明人也预计到要求保护的主题也可能以其它方式实施,以便结合其它现有的或将来的技术包含不同的步骤或者类似于此文件所描述的步骤的组合。此外,尽管这里可能用词“步骤”和/或“框”来示意所采用的方法的不同的要素,但是这些词不应解释为暗含了此处公开的各个步骤间的特定顺序,除非有个别步骤的顺序是被明确描述了的。
本发明的实施例一般针对的是与搜索框关联地重构用户查询。更确切地,重构的用户查询响应于满足阈值的用户查询而被确定。在一些实施例中,向用户呈现重构的用户查询集合中的成员查询。基于用户对成员查询之一的选择,生成满足所选的成员查询的查询结果。
在实施例中,重构的用户查询包括建议的查询词变更和建议的查询词删除。建议的查询词变更是指输入的用户查询的重构版本,其中至少其中一个词被替换成另一个词。例如,查询“verizon wireless phone(verizon无线电话)”的重构版本可包括建议的查询词变更“verizon DSL phone(verizon DSL电话)”,在建议的查询词变更中将词“wireless”替换成“DSL”。在一些实施例中,查询词变更包括替换一个词和/或包含多于一个词的短语。建议的查询词删除是指至少一个词被删除的输入的用户查询的重构版本。例如,针对原始查询“verizon wireless phone”的建议的查询词删除可包括“                                                
Figure 2012100070607100002DEST_PATH_IMAGE001
”,删除了词“verizon”。
重构的用户查询可以被分级,分类成多个组,和/或呈现给用户用于选择。基于用户对重构的用户查询的选择,提供满足所选的重构的用户查询的大量查询结果。可替换地,基于用户对重构的用户查询的选择,可生成第二个重构的用户查询集合。在一个实施例中,给用户提供选择选项来输入一个或多个附加的词。原始用户查询的词和附加输入的词可用于生成第二个重构的用户查询集合。 此外,可生成满足原始用户查询的词和附加输入的词的大量查询结果。
相应地,本发明的一个实施例针对的是一个或多个存储计算机可用的指令的计算机可读的媒介,所述计算机可用的指令在被一个或多个计算设备使用时将导致一个或多个计算设备执行查询重构方法。所述方法包括:接收与搜索框关联的第一用户查询,所述第一用户查询包括多个词;确定所接收的第一用户查询满足一个阈值;基于所述接收的第一用户查询,确定第一个重构的用户查询集合,其中,第一集合包括一个或多个与搜索框关联的成员查询,进一步地,其中所述一个或多个成员查询包括至少下述之一:(1)一个或多个建议的查询词变更,其中所述一个或多个建议的查询词变更的每一个是根据替换接收的第一用户查询中的至少一个词来确定的;及(2)一个或多个建议的查询词删除,其中所述一个或多个建议的查询词删除的每一个是根据删除接收的第一用户查询中的至少一个词来确定的。
在另一个实施例中,本发明针对的是由一个或多个服务器设备执行的重构用户查询的方法。所述方法包括:接收与搜索框关联的第一用户查询,所述第一用户查询包括多个词;确定第一用户查询的多个词满足一个阈值;确定与搜索框关联的第一组多个重构的用户查询,所述第一组多个重构的用户查询包括:(1)一个或多个查询词变更,其中所述一个或多个查询词变更的每一个是根据替换接收的第一用户查询中的至少一个词来确定的;及(2)一个或多个查询词删除,其中所述一个或多个查询词删除的每一个是根据删除接收的第一用户查询中的至少一个词来确定的;将第一组多个重构的用户查询中的每一个归类到一个或多个组,所述一个或多个组包括:(1)一个或多个查询词变更;以及(2)一个或多个查询词删除。
本发明进一步的实施例针对的是存储在一个或多个计算机存储媒介上的可由计算设备执行的图形用户界面。所述图形用户界面包括:接收用户查询的搜索框,所述用户查询具有多个词;以及下述部分的一个或多个:(1)与搜索框关联显示一个或多个查询词变更的部分,其中所述一个或多个查询词变更中的每一个是根据替换接收到的用户查询中的至少一个词来确定的;及(2)与搜索框关联显示一个或多个查询词删除的部分,其中所述一个或多个查询词删除中的每一个是根据删除接收到的第一用户查询中的至少一个词来确定的。
在描述了本发明的实施例的概述之后,下面将描述可以实现本发明实施例的示例操作环境,以提供本发明各个方面的一般上下文。首先特别参见图1,用于实现本发明实施例的示例操作环境被示出,并被一般指定为计算设备100。所述计算设备100只是一个合适的计算环境的例子,并非意在暗示对本发明用途或功能的范围的任何限制。该计算设备100也不应被解释为对图示组件的任何一个组件或其结合有任何依赖或要求。
本发明可以在计算机代码或机器可用的指令的一般上下文中描述,包括可由计算机或其它机器执行的诸如程序模块之类的计算机可执行指令,所述其它机器例如是个人数据助理或其它手持设备。一般来说,程序模块包括例程、程序、对象、组件、数据结构等,是指执行特定任务或实现特定抽象数据类型的代码。本发明的实施例可通过多种系统配置实现,包括手持设备、消费电子设备、通用计算机、更专业的计算设备等。本发明的实施例也可在分布式计算环境中实施,在分布式计算环境中,任务由通过通信网连接的远程处理设备执行。
继续参考图1,所述计算设备100包括直接或间接耦合以下设备的总线110:存储器 112、一个或多个处理器114、一个或多个呈现组件116、输入/输出(I/O)端口118、I/O组件120,以及示例性的电源122。总线110代表可以是一个或多个总线的任何总线(如地址总线、数据总线、或其组合)。尽管为了清楚起见,图1中各个方框用实线表示,实际上,这些方框代表逻辑组件,而不一定是实际的组件。例如人们可以认为诸如显示设备之类的呈现组件是I/O组件。同样,处理器含有存储器。发明人认识到这就是本领域的本质,并反复重申图1的图只是可用于本发明一个或多个实施例的示例计算设备的图示。对“工作站”、“服务器”、“膝上型电脑”、“手持设备”等这些类别不做区分,因为所有这些都预期在图1的范围内,并且均称作“计算设备”。
所述计算设备100典型地包括各种计算机可读媒介。计算机可读媒介可以是可由计算机设备100访问的任何可用媒介,包括以任何方法或技术实现以用于存储信息的易失和非易失的媒介,可移除和不可移除媒介,所述信息例如是计算机可读指令、数据结构、程序模块或其它数据。计算机可读媒介包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术,CD-ROM、数字多功能盘(DVD)或其它光盘存储器,磁带盒、磁带、磁盘存储器或其它磁性存储设备,或任何其它可用于存储期望的信息并可被所述计算机设备100访问的媒介。上述的任意组合也包含在计算机可读媒介的范围内。
存储器112包括易失和/或非易失存储器形式的计算机存储媒介。所述存储器可以是可移除的、不可移除的或者其组合。示例性的硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。所述计算设备100包括一个或多个从各种实体读取数据的处理器,所述实体例如是存储器112或I/O组件120。呈现组件116将数据指示呈现给用户或其它设备。示例性的呈现组件包括显示设备、扬声器、打印组件、振动组件等。
所述I/O端口118允许所述计算设备100与其它设备逻辑耦合,所述其它设备包括I/O组件120,其中一些可以是内嵌的。示例性的组件包括麦克风、操纵杆、游戏垫、圆盘式卫星电视天线、扫描仪、打印机、无线设备等。
如前所述,本发明的实施例所针对的是重构与搜索框关联的用户查询。重构的用户查询是指这样的用户查询,其中一个或多个词从原始提交的用户查询被变更、替换、删除、去除、拼写和/或语法错误纠正,和/或以其它方式改变。重构的用户查询从包含多个词的用户查询确定。基于满足一个预定的阈值的多个词,确定重构的用户查询集合。在一个实施例中,用于确定重构的用户查询集合的阈值要求所述用户查询包含三个或以上的词。例如,根据要求原始提交的用户查询中有三个词的阈值,虽然用户查询“wireless phone”并不触发重构的用户查询的生成,但是查询“verizon wireless phone”却触发。在实施例中,包含多于三个词的用户查询称作“长的”用户查询。所述“长的”用户查询可满足用于确定重构的用户查询集合的阈值。
确定多个重构的用户查询利用多种来源。在实施例中,重构的用户查询使用变更服务、查询和会话日志、和/或变更评分来确定。变更服务提供对原始用户查询中的词和/或短语(包括多于一个的词)的可能的变更的列表,以及提供建议的变更的相关性的置信度的指示。查询和会话日志是指提供从过去提交的用户查询和过去的用户交互期间检索的数据的来源。变更评分是指根据所确定的重构的用户查询将提供相关结果的置信度分配给重构的用户查询的分数。正如下面将进一步详述的那样,重构的用户查询也可使用特异性评分、逆文档频率(inverse document frequency)和信息增益来确定。
决定将哪个重构的用户查询呈现给用户也利用了多种来源,包括查询和会话日志、查询质量预测、变更评分、建议词源,和/或web文档中心。查询质量预测是指响应于特定的用户查询检索的结果的质量,这在专利申请号为12/969,140、标题为“Classifying Results of Search Queries(分类搜索查询的结果)”、代理案号为331078.01/MFCP.157702、2010年12月15日提交的美国专利申请中详细全面地描述了,该申请通过引用结合到本文中。建议词源是指从中检索建议词的多种来源的使用。web文档中心提供关于响应于特定查询而检索的网页的内容的信息。例如,如果用户查询 “verizon wireless phone”和重构的用户查询“cingular wireless phone”检索相似内容的查询结果,则可以确定,重构的用户查询中的替换的词是一个合适的重构候选,比如是建议的查询词变更。
使用这些来源的一个或多个,对重构的用户查询的每一个类型生成分数,包括建议的查询词变更和建议的查询词删除。例如,重构的用户查询集合可包含一个或多个建议的查询词变更 (也可被称作重构的用户查询集合中的“成员查询”)。所述建议的查询词变更可用所列出的来源的一个或多个进行评分,所述来源例如是查询和会话日志、查询质量预测、变更评分和/或建议词源。类似地,包含建议的查询词删除的重构的用户查询集合的成员查询可使用上面所列的各种来源,包括查询和会话日志、查询质量预测和/或变更评分,来进行评分。
为每个重构的用户查询生成的分数用来给重构的用户查询分级。这种分级可用被训练用来对重构的用户查询的重要性和/或相关性进行预测的机器学习模型来完成。按照重构的用户查询的重要性和/或相关性对该重构的用户查询进行分级是指将最可能生成响应于用户想要的查询的结果的那些重构的查询列入优先地位。例如,分级可以确定将包含三个词的查询的第一个词替换掉的建议的查询词变更与用户想要的查询是最相关的。因此,第一个词替换掉的建议的查询词变更可被列在呈现给用户的多个成员查询的顶部附近。
在一个实施例中,重构的用户查询可使用被训练用来预测哪些词的变体(建议的查询词变更或建议的查询词删除)提供与原始用户查询最相关的搜索结果的机器学习模型来分级。在进一步的实施例中,使用额外的工具来增强机器学习模型的准确性,如随机飞行(random flight)、变更评分、位置偏差,诸如此类。要理解的是,使用机器学习模型对重构的用户查询分级,以及随后确定给用户呈现重构的用户查询的顺序并不限于一个信息来源或一种数据生成方法。
在实施例中,重构的用户查询根据分级呈现给用户。例如,分级较高的重构的用户查询在分级较低的重构的用户查询的上面呈现。在进一步的实施例中,除了基于分配的分数的分级,用户查询可根据重构的用户查询的类型所固有的个别逻辑呈现给用户。例如,一个建议的查询词变更逻辑可按照替换的词的顺序呈现成员查询,例如第一个词被替换掉的成员查询列在第二个词被替换掉的成员查询之上。如下面将详述的,建议的查询词变更可基于一个相关的逻辑呈现给用户,而建议的查询词删除可基于不同的相关逻辑呈现给用户。因此,尽管可使用类似的来源来基于提交的用户查询生成重构的用户查询,但是确定显示哪些建议的查询词变更和哪些查询词删除可以利用不同的逻辑。
如图2所示,示例性的显示200图解了与搜索框210关联的重构的用户查询的呈现。在图2中,用户查询212满足要求用户查询中有三个及以上词的阈值。在另一些实施例中,用于确定重构的用户查询的阈值可以要求用户查询中有不同数量的词。如图示的实施例中所示的,建议的查询词变更214包括一组成员查询216,而建议的查询词删除 218包括一组成员查询220。
建议的查询词变更214包含作为进行过词替换的重构的用户查询的成员查询216。如图2所示,每个成员查询216包括原始用户查询212中至少一个被更改和/或被另一个词替换的词。在一个实施例中,成员查询216使用变更服务确定,所述变更服务生成用于重构提交的用户查询的可能的变更的列表。变更服务提供的建议可基于频繁检测到被一起用来检索的相同或相近的词而生成,例如词“cingular wireless phone”“sprint wireless phone”及“AT&T wireless phone”。在实施例中,变更服务可使用多种数据源,例如点击率、查询频率、查询置信度、过去的用户查询、会话日志,诸如此类,来决定建议哪些查询词变更。变更服务也可基于特定的变更的成员查询很可能提供与用户期望的查询相关的结果的置信度来提供建议的查询变更的列表。在另一些实施例中,变更服务之外的来源可在变更服务的基础上被额外地使用或作为变更服务的替换而使用。例如,查询日志数据可被独立地搜索以生成针对建议的查询词变更214的成员查询216。
建议的查询词删除218包括成员查询220,它是删除了词的重构的用户查询。如图2所示,每一个成员查询220从原始用户查询212中删除和/或去除了至少一个词。在一个实施例中,成员查询 220是基于用户搜索词的频率来确定的。搜索频率可由多种来源确定,包括查询和会话日志。例如,如果用户输入“v wireless phone”的查询,最有可能从查询中删除的候选词会是词“v”,因为词“v”并不常被搜索,因此并不会给用户查询带来很多辨别力(discriminative power)。换言之,一个词可以从用户查询中删除是因为它对于整个用户查询来说所展示出低特异性等级,而该查询中的其它词可以展示出较高等级的特异性。在一些实施例中,一开始提交的用户查询212中的个别词被根据其辨别力进行评估,然后这被用来确定成员查询 220。辨别力可基于查询频率,或可基于其它数据源,如点击率及其它搜索日志数据。
在进一步的实施例中,在确定成员查询220的时候,使用词的特异性评分来确定将哪个词从用户查询212中删除和/或去除。特异性评分是指一个词的特异性的程度。在实施例中,词t的“特异性”或“选择偏好”被定义为查询语言的unigram模型(一元模型)和包含t的查询的次语言(sub-language)的unigram模型之间的发散度(divergence)。这样,在确定成员查询220的时候,可使用基于这种特异性的评分来确定从用户查询212中去除和/或删除哪个词。
类似地,在进一步的实施例中,可使用词的逆文档频率来确定是否应当从用户查询212中将其去除和/或删除。词的逆文档频率是指因特网上出现该词的文档数除一的方程式。这样,较低的逆文档频率评分与特异性较低的查询词相关,这进一步意味着,该词是作为建议的查询词删除218中的成员查询220的一部分而进行删除和/或去除的较好候选。
在另一个实施例中,变更服务被用来为建议的查询词删除218确定成员查询 220。例如,变更服务可以在用户查询212中检测某些短语,例如短语“wireless phone”。这种短语检测然后可用来为检测到的短语生成逆文档频率。这也可被称为因特网上的bigram(二元)或词对的频率检测,在进一步的实施例中,可使用信息博弈来确定用户查询212中的词与因特网上的其它文档匹配得如何,这进而可被用来确定去除哪些词。
建议的查询词附加222提供附加的查询224,包含原始用户查询226及表明用户想要在原始用户查询226中增加附加的词的选择选项228。在一个实施例中,用户可选中选择选项228来表明用户想输入附加的查询词。当选中了这个选择选项228时,用户输入的附加的查询词可自动填充搜索框210。可替换地,附加的查询词可在附加的文本输入框中输入,所述附加的文本框基于对选择选项228的选择而被呈现给用户。当用户输入与查询词附加222相关联的附加词时,建议的查询词变更 214的成员查询216和建议的查询词删除218的成员查询220保持不动,这样用户在确定向原始用户查询212中增加哪个词时可查看每个部分的成员查询216和220。
在一个实施例中,已经输入了附加的词后,使用新的用户查询(包含原始用户查询212以及与查询词附加222关联地增加的附加词)来检索满足新的用户查询的多个查询结果。在另一个实施例中,新的用户查询填充搜索框210,为新的用户查询生成新的成员查询集合216和220。
现在参考图3,提供描述用于与搜索框关联地重构用户查询的方法300的流程图。在方框310中接收用户查询。所述用户查询包括多个词。在方框312中确定用户查询满足阈值。如前所述,可设置阈值,确定何时生成重构的用户查询。例如,包含三个及以上的词的用户查询可以满足给定的阈值,并因此触发重构的用户查询的确定。基于方框312的确定结果,在方框314中,确定多个重构的用户查询。所述多个重构的用户查询可包含一个或多个建议的查询词变更和/或一个或多个建议的查询词删除。
现在转到图4,提供描述用于与搜索框关联地重构用户查询的方法400的流程图。在方框410中接收用户查询,在方框412中确定该用户查询满足阈值。根据满足方框412的所述阈值,在方框414中确定第一个重构的用户查询的集合。方框414中确定的第一个集合包括多个成员查询。这里使用的词“第一集合”不应被解释为将该方法限制为只确定单个集合。因此,可确定多个集合,所述多个集合具有多个成员查询。在方框416中,将方框414中确定的多个成员查询呈现给用户。每个呈现的成员查询都是可以选择的。在方框418中,接收用户对可选的成员查询中的一个的选择。之后,在方框420中生成满足所选的成员查询的多个查询结果。
现在参见图5,提供描述用于与搜索框关联地重构用户查询的方法500的流程图。在方框510中接收用户查询,在方框512中确定该用户查询满足阈值。在方框514中,确定第一个重构的用户查询的集合。所述第一集合包括基于在方框510中接收到的用户查询重构的多个成员查询。例如,如图2所示,可使用针对“verizon wireless phone”的原始用户查询212来生成第一个重构的用户查询集合,其既包括建议的查询词变更214也包括建议的查询词删除218。
在方框516中,将第一集合中的所述多个成员查询呈现给用户,其中每个成员查询都是可以选择的。在方框518中,接收用户对成员查询之一的选择。在方框520中,确定第二个重构的用户查询的集合。所述第二个重构的用户查询集合包括多个成员查询。方框514中确定的第一成员查询集合是基于方框510中接收的原始用户查询而确定的,而第二个重构的用户查询的集合是基于方框518中选择的成员查询的。
现在参考图6,提供描述用于与搜索框关联地重构用户查询的方法600的流程图。在方框610中接收用户查询,该用户查询具有多个查询词。在方框612中,确定所述接收到的用户查询中的多个词满足阈值。在方框614中,确定第一重构的用户查询的集合。所述第一集合包括多个在方框616中呈现给用户的成员查询。同样在方框616中呈现的是选择选项,供用户用于输入与方框610接收到的用户查询有关的附加词。例如,如图2所示,选择选项228指示用户输入与原始用户查询212关联的附加查询词。
在方框618中,接收用户对成员查询中的一个的选择。例如,如图2所示,这可包括对多个建议的查询词变更214的成员查询216的选择,或对多个建议的查询词删除218的成员查询220的选择。基于在方框618中做出的选择,在方框620中确定满足所选的成员查询的多个查询结果。可替换地,在方框622中,确定第二个重构的用户查询集合,包括基于在方框618所选的成员查询生成的多个成员查询。
在方框624中,基于在方框616中呈现的选择选项,用户输入附加的词。在方框626中,响应于所述用户输入的附加词,确定第二个重构的用户查询集合。可替换地,在方框628中,可以生成满足原始用户查询的词和附加输入的词的多个查询结果。如前面参考图2所述的,在一个实施例中,这些附加的词基于选择选项228的选择而输入。在一个实施例中,基于对选择选项的选择,可出现附加的文本框。之后用户可将附加的词输入到这个附加文本框中。在另一个实施例中,选中了选择选项之后,可以提示用户向与原始用户查询相同的搜索框210来输入附加词。
现在转到图7,提供描述用于与搜索框关联地重构用户查询的方法700的流程图。在方框710中,接收用户查询。在方框712中确定所述用户查询满足阈值。在方框714中,确定第一个重构的用户查询的集合。所述第一个重构的用户查询的集合包括多个成员查询,例如一个或多个建议的查询词变更和/或一个或多个建议的查询词删除。在方框716中,多个成员查询被分类成多个组。将多个成员查询分类成多个组是指基于所确定的重构的用户查询的类型对成员查询进行分组。例如,建议的查询词变更的类别包括基于成员查询中的一个词被更改和/或替换成不同的词而被分组到一起的一个或多个成员查询。此外,建议的查询词删除的类别包括基于成员查询中的一个词被去除和/或删除而分组到一起的一个或多个成员查询。如前面所讨论的,可使用多个来源来获得方框714中确定的第一个重构的用户查询集合。这样,第一集合中的多个成员查询在方框716中被分组,以助于在方框718中呈现给用户。在实施例中,在方框716中分类成多个组以及在方框718中呈现给用户的成员查询包括建议的查询词变更和建议的查询词删除二者或之一。
最后参考图8,提供描述用于与搜索框关联地重构用户查询的方法800的流程图。在方框810中接收用户查询,并且在方框812中确定所述接收到的用户查询满足阈值。在方框814中,确定第一个重构的用户查询的集合。所述第一个重构的用户查询的集合包括多个成员查询。在方框816中,所述多个成员查询被分级。如之前所提到的,用户查询使用被训练用来预测重构的用户查询的重要性和/或相关性的机器学习模型来分级。在一个实施例中,机器学习模型被训练用来预测原始用户查询的哪些变体(建议的查询词变更和建议的查询词删除)提供最相关的搜索结果。其它工具,如随机飞行(random flight)、变更评分、位置偏差等也被使用以增加机器学习模型的准确性。
可以理解的是,本发明的实施例提供与搜索框关联地重构用户查询的方法。本发明已关于特定的实施例描述,这些实施例预定在所有方面都是示意性的而不是限制性的。在不偏离本发明的范围的情况下,替代实施例对于本发明所属领域的技术人员而言将变得明显可见。
由上可见,本发明适合实现上面设立的所有目标和目的,以及所述系统和方法中显而易见的、固有的其它优势。要理解的是,某些特征及子组合具有实用性,可以无需参照其他特征和子组合使用。这已被权利要求所预期并且在权利要求的范围之内。

Claims (16)

1.一种查询重构方法,所述方法包括:
接收(310)与搜索框关联的第一用户查询,所述第一用户查询包含多个词; 
确定(312)所接收的第一用户查询满足阈值;以及
基于该所接收的第一用户查询,确定(314)第一重构的用户查询集合,其中该第一集合包括一个或多个与搜索框关联的成员查询,进一步地,其中所述一个或多个成员查询包括下述至少一个:
(1)一个或多个建议的查询词变更,其中所述一个或多个建议的查询词变更的每一个根据替换所述接收的第一用户查询中的至少一个词而确定;及
(2)一个或多个建议的查询词删除,其中所述一个或多个建议的查询词删除的每一个根据删除所述接收的第一用户查询中的至少一个词而确定。
2.如权利要求1所述的方法,其中确定所述第一重构的用户查询集合包括对该第一集合中的一个或多个成员查询分级。
3.如权利要求1所述的方法,其中所述方法进一步包括:
在确定满足一个或多个成员查询的多个查询结果之前将所述一个或多个成员查询呈现给用户,所述一个或多个成员查询的每一个都是可选择的且与搜索框关联地呈现,其中所述一个或多个成员查询被分类成一个或多个组,所述一个或多个组的每一个包括:
(1)所述一个或多个建议的查询词变更;以及
(2)所述一个或多个建议的查询词删除。
4.如权利要求3所述的方法,其中所述方法进一步包括:
接收用户对所述可选的一个或多个成员查询之一的选择;以及
响应于所述用户选择,确定满足所选的成员查询的多个查询结果。
5.如权利要求3所述的方法,其中所述方法进一步包括:
接收用户对所述可选的一个或多个成员查询之一的选择;以及
响应于所述用户的选择,确定第二重构的用户查询集合,其中该第二集合包括一个或多个与搜索框关联的成员查询,进一步地,其中所述一个或多个成员查询包括下述至少之一:
(1)一个或多个建议的查询词变更,其中所述一个或多个建议的查询词变更的每一个根据替换所选的成员查询中的至少一个词而确定;及
(2)一个或多个建议的查询词删除,其中所述一个或多个建议的查询词删除的每一个根据删除所选的成员查询中的至少一个词而确定。
6.如权利要求5所述的方法,其中确定所述第二重构的用户查询集合包括对所述第二集合的一个或多个成员查询分级。
7.如权利要求5所述的方法,其中所述第二集合的所述一个或多个成员查询被分类成一个或多个组,所述一个或多个组的每一个包括:
(3)所述一个或多个建议的查询词变更;及
(4)所述一个或多个建议的查询词删除。
8.如权利要求3所述的方法,其中所述方法进一步包括:
呈现选择选项供用户用于输入一个或多个附加的查询词,所述一个或多个附加的查询词被添加到所述接收的第一用户查询。
9.如权利要求8所述的方法,其中所述方法进一步包括:
接收用户输入的一个或多个附加的查询词;
接收第二用户查询,所述第二用户查询包括所述接收的第一用户查询和所述用户输入的一个或多个附加的查询词;以及
确定满足接收到的所述第二用户查询的多个查询结果。
10.如权利要求8所述的方法,其中所述方法进一步包括:
接收第二用户查询,所述第二用户查询包括所述第一用户查询和所述用户输入的一个或多个附加的查询词;以及
确定第三重构的用户查询的集合,其中所述第三集合包括一个或多个与搜索框关联的成员查询,进一步地,其中所述一个或多个成员查询包括下述至少之一:
(1)一个或多个建议的查询词变更,其中所述一个或多个建议的查询词变更的每一个根据替换接收到的第二用户查询中的至少一个词而确定;及
(2)一个或多个建议的查询词删除,其中所述一个或多个建议的查询词删除的每一个根据删除接收到的第二用户查询中的至少一个词而确定。
11.一种由一个或多个用于重构用户查询的服务器设备执行的方法,所述方法包括:
接收(710)与搜索框关联的第一用户查询,所述第一用户查询包含多个词;
确定(712)所接收的第一用户查询的多个词满足阈值;
确定(714)第一组多个与搜索框关联的重构的用户查询,所述第一组多个重构的用户查询包括:
(1)一个或多个查询词变更,其中所述一个或多个查询词变更的每一个根据替换所述接收的第一用户查询中的至少一个词而确定;及
(2)一个或多个查询词删除,其中所述一个或多个查询词删除的每一个根据删除所述接收的第一用户查询中的至少一个词而确定;
将所述第一组多个重构的用户查询的每一个分类(716)成一个或多个组,所述一个或多个组包括:
(3)所述一个或多个查询词变更;以及
(4)所述一个或多个查询词删除。
12.如权利要求11所述的方法,其中所述方法进一步包括:
在确定满足所述第一组多个重构的用户查询中的一个或多个重构的用户查询的多个查询结果之前,向用户呈现所述第一组多个重构的用户查询,所述第一组多个重构的用户查询的每一个都是可选择的并与搜索框关联地呈现。
13.如权利要求所述的方法12,其中所述方法进一步包括:
呈现选择选项以供用户用于输入一个或多个附加的查询词,所述一个或多个附加的查询词被添加到所述接收的第一用户查询。
14.如权利要求13所述的方法,其中所述方法进一步包括:
接收用户输入的一个或多个附加的查询词;
接收第二用户查询,所述第二用户查询包括所述接收的第一用户查询和所述用户输入的一个或多个附加的查询词;以及
基于所述第二用户查询,确定第二组多个重构的用户查询,所述第二组多个重构的用户查询包括:
(1)一个或多个查询词变更,其中所述一个或多个查询词变更的每一个根据替换所述第二用户查询中的至少一个词而确定;及
(2)一个或多个查询词删除,其中所述一个或多个查询词删除的每一个根据删除所述第二用户查询中的至少一个词而确定,
将所述第二组多个重构的用户查询指示的每一个分类成一个或多个组,所述一个或多个组包括:
(3)所述一个或多个查询词变更;以及
(4)所述一个或多个查询词删除。
15.存储在一个或多个计算机存储媒介上并可被计算设备执行的图形用户界面,所述图形用户界面包括:
用于接收用户查询的搜索框(210),所述用户查询具有多个词;以及
一个或多个下述部分:
(1)显示与搜索框关联的一个或多个查询词变更的部分(214),其中所述一个或多个查询词变更的每一个根据替换接收到的用户查询中的至少一个词而确定;
(2)显示与搜索框关联的一个或多个查询词删除的部分(218),其中所述一个或多个查询词删除的每一个根据删除接收到的第一用户查询中的至少一个词而确定;及
(3)为用户提供选择选项来输入与搜索框关联的一个或多个附加的查询词的部分(222),所述一个或多个附加的查询词添加到所述接收到的用户查询中。
16.一个或多个存储计算机可用指令的计算机可读媒介,所述计算机可用指令在被一个或多个计算设备使用时,导致所述一个或多个计算设备执行如权利要求1-14中任何一个所述的方法。
CN201210007060.7A 2011-01-11 2012-01-11 与搜索框关联的查询重构 Active CN102591985B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/004,673 US20120179705A1 (en) 2011-01-11 2011-01-11 Query reformulation in association with a search box
US13/004673 2011-01-11

Publications (2)

Publication Number Publication Date
CN102591985A true CN102591985A (zh) 2012-07-18
CN102591985B CN102591985B (zh) 2016-03-30

Family

ID=46456062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210007060.7A Active CN102591985B (zh) 2011-01-11 2012-01-11 与搜索框关联的查询重构

Country Status (2)

Country Link
US (1) US20120179705A1 (zh)
CN (1) CN102591985B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325047A (zh) * 2018-11-22 2019-02-12 北京明朝万达科技股份有限公司 一种交互式ElasticSearch深度分页查询方法和设备
CN113761009A (zh) * 2021-11-09 2021-12-07 深圳市明源云科技有限公司 人员选择方法、系统、装置和计算机可读存储介质

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8370319B1 (en) * 2011-03-08 2013-02-05 A9.Com, Inc. Determining search query specificity
US8898182B2 (en) 2011-04-27 2014-11-25 International Business Machines Corporation Methods and arrangements for providing effective interactive query suggestions without query logs
US8620902B2 (en) * 2011-06-01 2013-12-31 Lexisnexis, A Division Of Reed Elsevier Inc. Computer program products and methods for query collection optimization
CN103106220B (zh) * 2011-11-15 2016-08-03 阿里巴巴集团控股有限公司 一种搜索方法、搜索装置及一种搜索引擎系统
US10311096B2 (en) * 2012-03-08 2019-06-04 Google Llc Online image analysis
WO2014014374A1 (en) * 2012-07-19 2014-01-23 Yandex Europe Ag Search query suggestions based in part on a prior search
US9449079B2 (en) 2013-06-28 2016-09-20 Yandex Europe Ag Method of and system for displaying a plurality of user-selectable refinements to a search query
US10007719B2 (en) * 2015-01-30 2018-06-26 Microsoft Technology Licensing, Llc Compensating for individualized bias of search users
US10007730B2 (en) 2015-01-30 2018-06-26 Microsoft Technology Licensing, Llc Compensating for bias in search results
RU2632269C2 (ru) * 2015-09-24 2017-10-03 Общество С Ограниченной Ответственностью "Яндекс" Способ, сервер и электронное устройство создания предложений для поискового запроса
US20170277737A1 (en) 2016-03-23 2017-09-28 Ebay Inc. Compact index document generation for smart match autocomplete system
US20170308583A1 (en) * 2016-04-20 2017-10-26 Facebook, Inc. Suggested Queries Based on Interaction History on Online Social Networks
US11295861B2 (en) * 2017-02-03 2022-04-05 Koninklijke Philips N.V. Extracted concept normalization using external evidence
RU2711103C2 (ru) 2017-12-27 2020-01-15 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса
JP7154253B2 (ja) * 2020-05-12 2022-10-17 ヤフー株式会社 情報処理装置、情報処理方法及びプログラム
US11556550B2 (en) * 2021-04-15 2023-01-17 RELX Inc. Methods and systems for no fail searching

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101128818A (zh) * 2004-12-29 2008-02-20 奥尔有限公司 向信息源路由查询以及对查询结果进行分类和筛选
CN101176058A (zh) * 2005-03-29 2008-05-07 谷歌公司 使用已知高级查询的查询修订
CN101361068A (zh) * 2005-11-22 2009-02-04 谷歌公司 从用户日志推断搜索类别同义词

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003212463A1 (en) * 2002-03-01 2003-09-16 Paul Jeffrey Krupin A method and system for creating improved search queries
US7844589B2 (en) * 2003-11-18 2010-11-30 Yahoo! Inc. Method and apparatus for performing a search
US7865495B1 (en) * 2004-10-06 2011-01-04 Shopzilla, Inc. Word deletion for searches
US7620628B2 (en) * 2004-12-06 2009-11-17 Yahoo! Inc. Search processing with automatic categorization of queries
US8438142B2 (en) * 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US8195660B2 (en) * 2007-06-29 2012-06-05 Intel Corporation Method and apparatus to reorder search results in view of identified information of interest
WO2009036372A2 (en) * 2007-09-14 2009-03-19 Google Inc. Suggesting alterntive queries in query results
US8583670B2 (en) * 2007-10-04 2013-11-12 Microsoft Corporation Query suggestions for no result web searches
US8655862B1 (en) * 2007-10-17 2014-02-18 Google Inc. System and method for query re-issue in search engines
US7984004B2 (en) * 2008-01-17 2011-07-19 Microsoft Corporation Query suggestion generation
US20090248647A1 (en) * 2008-03-25 2009-10-01 Omer Ziv System and method for the quality assessment of queries
US8255414B2 (en) * 2010-09-15 2012-08-28 Yahoo! Inc. Search assist powered by session analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101128818A (zh) * 2004-12-29 2008-02-20 奥尔有限公司 向信息源路由查询以及对查询结果进行分类和筛选
CN101176058A (zh) * 2005-03-29 2008-05-07 谷歌公司 使用已知高级查询的查询修订
CN101361068A (zh) * 2005-11-22 2009-02-04 谷歌公司 从用户日志推断搜索类别同义词

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325047A (zh) * 2018-11-22 2019-02-12 北京明朝万达科技股份有限公司 一种交互式ElasticSearch深度分页查询方法和设备
CN113761009A (zh) * 2021-11-09 2021-12-07 深圳市明源云科技有限公司 人员选择方法、系统、装置和计算机可读存储介质

Also Published As

Publication number Publication date
CN102591985B (zh) 2016-03-30
US20120179705A1 (en) 2012-07-12

Similar Documents

Publication Publication Date Title
CN102591985A (zh) 与搜索框关联的查询重构
US11275895B1 (en) Generating author vectors
CN102725759B (zh) 用于搜索结果的语义目录
US8335787B2 (en) Topic word generation method and system
CN102542052B (zh) 优先散列索引
CN1871603B (zh) 处理查询的系统和方法
JP5984917B2 (ja) 提案される語を提供するための方法および装置
CN100483408C (zh) 在多个文档之间建立链接结构的方法和装置
CN102567461B (zh) 用于大文档索引的匹配漏斗
CN102999625A (zh) 一种检索请求语义扩展方法
US20100191758A1 (en) System and method for improved search relevance using proximity boosting
CN101241512A (zh) 一种重新定义查询词的搜索方法及装置
US10803380B2 (en) Generating vector representations of documents
US9767409B1 (en) Latent feature based tag routing
CN110427483B (zh) 文本摘要评测方法、装置、系统及评测服务器
CN1295705A (zh) 基于语言模型的信息检索和语音识别
CN104838375A (zh) 搜索结果基于意图的呈现
CN102646108A (zh) 使用主题意识文件评级器的信息检索
CN105095210A (zh) 一种筛选推广关键词的方法和装置
CN103902697A (zh) 组合搜索方法、客户端和服务器
CN111813930B (zh) 相似文档检索方法及装置
US10460229B1 (en) Determining word senses using neural networks
CN102567441A (zh) 提供与用户会话相关的情境提示
CN112269816A (zh) 一种政务预约事项相关性检索方法
CN111400584A (zh) 联想词的推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150615

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150615

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

C14 Grant of patent or utility model
GR01 Patent grant