CN106489146B - 使用会话信息的查询重写 - Google Patents

使用会话信息的查询重写 Download PDF

Info

Publication number
CN106489146B
CN106489146B CN201580035103.4A CN201580035103A CN106489146B CN 106489146 B CN106489146 B CN 106489146B CN 201580035103 A CN201580035103 A CN 201580035103A CN 106489146 B CN106489146 B CN 106489146B
Authority
CN
China
Prior art keywords
search
query
candidate query
candidate
rewrite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580035103.4A
Other languages
English (en)
Other versions
CN106489146A (zh
Inventor
马尔钦·M·诺瓦克-普日戈兹基
贝沙德·贝扎迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Priority to CN201911180100.6A priority Critical patent/CN111061848B/zh
Publication of CN106489146A publication Critical patent/CN106489146A/zh
Application granted granted Critical
Publication of CN106489146B publication Critical patent/CN106489146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/156Query results presentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

包括编码在计算机存储介质上的用于自然语言处理的计算机程序的方法、系统和设备。所述方法中的一个包括:在用户会话期间,从用户接收搜索查询;获得在所述用户会话期间接收的所述用户的多个先前搜索查询;生成多个候选查询重写,其中,所述候选查询重写是从所述用户的所述搜索查询和所述多个先前搜索查询取得的;对每个候选查询重写进行评分,其中,对每个候选重写进行评分包括基于对响应于所述候选查询重写的搜索结果的分析来确定每个候选查询重写的质量;选择具有满足阈值的分值的候选查询重写;以及提供响应于所选择的候选查询重写的搜索结果。

Description

使用会话信息的查询重写
技术领域
本说明书涉及自然语言处理。
背景技术
互联网提供对诸如图像文件、音频文件、视频文件和网页的各式各样的资源的访问。搜索系统可响应于用户提交的查询识别资源并且以对用户可用的方式提供关于资源的信息。用户可浏览(例如选择)搜索结果,以获得感兴趣的信息。
发明内容
总体上,本说明书中描述的主题的一个创新性方面可在包括以下动作的方法中实施:在用户会话期间从用户接收搜索查询;获得在所述用户会话期间接收的所述用户的多个先前搜索查询;生成多个候选查询重写,其中,所述候选查询重写是从所述用户的所述搜索查询和所述多个先前搜索查询取得的;对每个候选查询重写进行评分,其中,对每个候选重写进行评分包括基于对响应于所述候选查询重写的搜索结果的分析来确定每个候选查询重写的质量;选择具有满足阈值的分值的候选查询重写;以及提供响应于所选择的候选查询重写的搜索结果。这个方面的其他实施例包括对应的计算机系统、设备和记录在一个或多个计算机存储装置上的计算机程序,其均被配置成执行所述方法的动作。对于被配置成执行特定操作或动作的一个或多个计算机的系统,意指系统已经使其上安装有软件、固件、硬件、或其组合,在操作时使得系统执行操作或动作。对于将被配置成执行特定操作或动作的一个或多个计算机程序,意指一个或多个程序包括指令,所述指令在由数据处理设备执行时使得所述设备执行操作或动作。
以上和其他实施例可均可选地单独或组合地包括以下特征中的一个或多个。特别地,一个实施例组合地包括以下特征。生成所述多个候选查询重写还包括将所述搜索查询与所述多个搜索查询中的每个先前搜索查询串接。每个先前搜索查询包括时间戳,并且其中,对所述候选查询重写进行评分包括部分基于对应先前查询的过去时间为所述候选重写赋予权重。生成所述多个候选查询重写还包括从来自多个用户的查询集中识别与所述搜索查询相似的查询。对每个候选查询重写进行评分还包括基于来自多个用户的查询集来确定每个候选查询重写的流行度的度量。对每个候选查询重写进行评分还包括确定所述搜索查询是否包括特定类型的指代词项。候选查询重写的分值响应于确定候选查询重写包括特定类型的实体而增加。对每个候选查询重写进行评分还包括确定所述搜索查询是否包括与特定实体高度相关的词项。候选查询重写的分值响应于确定候选查询重写包括与所述查询词项高度相关的实体而增加。基于对响应于候选查询重写的搜索结果的分析来确定每个候选查询重写的质量包括获得响应于每个候选查询重写的搜索结果并且确定所述搜索结果的质量。
本说明书中描述的主题可在特定实施例中实现,以实现以下优点中的一个或多个。使用先前用户会话查询来重写查询增加了响应于用户意图返回搜索结果的可能性。
在附图和以下的描述中阐述了本说明书的主题的一个或多个实施例的细节。根据描述、附图和权利要求书,主题的其他特征、方面和优点将变得显而易见。
附图说明
图1是示例搜索用户界面中的搜索会话的图示。
图2是示例系统的框图。
图3是用于查询重写的示例处理的流程图。
各个图中的相似参考标号和名称指示相似的元件。
具体实施方式
使用查询重写来提高返回与用户预期查询最相关的搜索结果的可能性。之前在特定搜索会话中录入的搜索查询可用于搜索会话的当前搜索查询的查询重写。例如,用户可提交与会话的之前录入的搜索查询中的一个相关的当前查询。搜索系统可确定哪个先前搜索查询与当前查询相关并且在查询重写中使用该先前查询。然后,搜索系统可使用重写的查询来确定一个或多个搜索结果以提供给用户。
图1是示例搜索用户界面中的搜索会话的图示。搜索系统提供在用户装置106上显示的搜索用户界面102a。用户界面102a包括用于接收查询的搜索框104a。查询可以是用户装置的用户输入的文本查询或者使用用户装置的麦克风录入的语音查询。
在用户会话中,搜索系统在时间T1从用户装置106接收第一查询。特别地,用户提供搜索查询[Mudville Stadium(马德维体育场)]。在启动搜索时,搜索系统识别响应于第一查询的资源的搜索结果。搜索系统提供供在用户界面102a上显示的响应于查询[Mudville Stadium]的搜索结果110。例如,搜索结果110可包括搜索系统响应于第一查询而确定的指向特定资源的链接。
在用户会话中的时间T2,搜索系统在用户界面102b的搜索框104b中接收来自用户装置106的第二查询。特别地,用户提供搜索查询[Mudville nine(马德维九)]。在启动搜索时,搜索系统识别响应于第二查询的资源的搜索结果并且提供供在用户界面102b中显示的搜索结果112。
在用户会话中的时间T3,搜索系统在用户界面102c的搜索框104c中接收来自用户装置106的第三查询。特别地,用户提供搜索查询[Barack Obama(巴拉克·奥巴马)]。在启动搜索时,搜索系统识别响应于第二查询的资源的搜索结果并且提供供在用户界面102c中显示的搜索结果114。
在用户会话中的时间T4,搜索系统在用户界面102d的搜索框104d中接收来自用户装置106的第四查询。特别地,用户提供搜索查询[What is the capacity(容量多大)]。搜索系统确定第四查询与用户会话中的早期查询相关。特别地,搜索系统确定查询[What isthe capacity]与第一查询[Mudville Stadium]相关。以下描述用于确定当前接收到的查询与用户会话中的早期查询相关的技术。
响应于确定第四查询与用户会话中的第一查询相关,搜索系统将第四查询重写为[What is the capacity of Mudville Stadium(马德维体育场容量多大)]。在使用可在搜索框104e中显示的重写查询来启动搜索时,搜索系统识别响应于该重写查询的资源的搜索结果并且提供供在用户界面102e中显示的搜索结果116。
图2是示例系统200的框图。系统200提供与所提交查询相关的搜索结果,如可在互联网、内联网、或另一个客户端和服务器环境中实现的。系统200是可实现下述的系统、组件和技术的信息检索系统的示例。
用户202可通过客户端装置204与搜索系统214交互。例如,客户端204可以是通过局域网(LAN)或广域网(WAN)(例如,互联网)与搜索系统214耦合的计算机。在一些实现方式中,搜索系统214和客户端装置204可以是一个机器。例如,用户可将桌面搜索应用安装到客户端装置204上。客户端装置204通常将包括随机存取存储器(RAM)206和处理器208。
用户202可向搜索系统214内的搜索引擎230提交查询210。当用户202提交查询210时,通过网络向搜索系统214传送查询210。搜索系统214可被实现为例如通过网络彼此耦合的一个或多个位置的一个或多个计算机上运行的计算机程序。
搜索系统214还包括索引数据库222和搜索引擎230。搜索系统214通过生成搜索结果228来对输入查询进行响应,该搜索结果228以可向用户202呈现的形式(例如,作为在客户端装置204上运行的web浏览器中将显示的搜索结果网页)通过网络传送到客户端装置204。
当搜索引擎230接收到查询时,搜索引擎230识别匹配或响应于查询210的资源。搜索引擎230将总体上包括:索引引擎220,其将语料库(例如,内容的集或知识库)中发现的资源(例如,网页、图像、或互联网上的新闻文章)编索引;索引数据库222,其存储索引信息;以及排名引擎252(或其他软件),其用于将匹配查询210的资源排名。可使用传统技术执行对资源的索引和排名。搜索引擎130可通过网络向客户端装置204传送搜索结果228,以便向用户202呈现。
搜索系统230还包括会话日志254。会话日志254保持在用户会话(包括用户202的用户会话)期间提交的查询的日志。可按多种不同方式来定义会话。例如,会话可包括在自初始查询起的指定时间范围内提交的查询,例如,在第一查询的1个小时内提交的所有查询。会话还可包括在特定浏览器会话期间提交的查询,例如,在浏览器应用正在客户端装置204上运行时提交的查询。会话可与特定用户标识符或与装置标识符关联。
搜索系统230还包括查询重写引擎256。查询重写引擎256可基于各种标准来重写接收到的查询。特别地,如在本说明书中描述的,查询重写引擎256可使用用户会话期间提交的查询的日志,基于会话日志254中的相关查询来确定接收到的查询210是否应该被重写。
图3是查询重写的示例过程300的流程图。为方便起见,过程300将被描述为由位于一个或多个位置的一个或多个计算机的系统执行,并且根据本说明书被适宜编程。例如,被适宜编程的搜索系统(例如,图2的搜索系统214)可执行过程300。
系统接收搜索查询(302)。用户可输入搜索查询到搜索用户界面。例如,用户可使用搜索界面专用的搜索应用或浏览器应用来访问搜索用户界面。搜索查询可以是包括多个先前搜索查询的用户搜索会话的部分。接收到的搜索查询可隐含地参考用户会话的先前查询。例如,接收到的查询q:[What is the capacity]可参照关于建筑物或设施的早期查询。类似地,接收到的查询q:[when is the next game(下场比赛什么时候)]可参考关于特定运动队的早期查询。
系统获得在用户会话期间输入的先前搜索查询(304)。先前搜索查询可从例如识别为属于一个或多个特定会话的查询的查询日志取得。例如,所获得的先前查询可以是:
q1:[Mudville Stadium]
q2:[Mudville nine]
q3:[Barack Obama]
在一些实现方式中,系统确定在获得先前搜索查询之前是否满足阈值标准。例如,系统可应用一个或多个触发规则。这些规则可包括例如确定接收到的查询是否包括指示上下文意图(例如,使用查询中的代词或其他指代词项)的一个或多个词项或者接收到的查询是否是重复查询。
用户会话的每个先前搜索查询还具有与接收到搜索查询的时间对应的关联时间戳。因此,可通过形式的元组(查询,时间戳)表示每个先前搜索查询,使得先前搜索查询可被表示为(q1,t1)、…、(qn,tn),其中,n等于先前搜索查询的次数。
系统针对接收到的搜索查询来生成候选重写(306)。在一些实现方式中,通过将每个相应的先前搜索查询与接收到的搜索查询组合来生成候选重写。在某些其他实现方式中,可使用自然语言信息来生成候选重写。此外,可使用与先前搜索查询和搜索查询中的一个或多个相似的搜索查询来生成候选重写。
可根据将先前搜索查询和接收到的搜索查询组合的功能和输出候选重写来生成候选重写。特别地,元组(查询,时间戳)的集可被表示为先前搜索查询的集合Q={(q1,t1,…,(qn,tn))}。例如,对于Q和接收到的搜索查询q中的每个元素,函数可被定义为:C((qi,ti),q)→{(qi,ti),q,r1),…,((qi,ti),q,r{Nqi})},其取输入对(查询、时间戳)和接收到的搜索查询q,并且生成Nqi个重写r,其中,Nqi是整数。
该函数的一个示例是将每个先前搜索查询与接收到的搜索查询串接,其生成Nqi重写,其中,每个重写是接收到的搜索查询和之前搜索查询中的一个的组合。例如,在以上示例中,搜索查询和接收到的搜索查询[What is the capacity]在串接函数下的候选重写将是:
r1:[Mudville Stadium what is the capacity],
r2:[Mudville nine what is the capacity],以及
r3:[Barack Obama what is the capacity]。
在一些实现方式中,可使用另外的信息来扩展所生成的候选重写。例如,可使用搜索查询相似度来生成语法,该语法包括与先前搜索查询和接收到的搜索查询相似的搜索查询。因此,对于与先前搜索查询qi和接收到的搜索查询q具有指定程度的相似度(例如,使用合适的相似度度量)的所有查询,所有新对的串接是输出集合Q={C((q1,t1),q)+C((q2,t2),q)…}。
在一些实现方式中,系统基于由用户集输入到搜索系统的相似搜索查询(例如,基于搜索查询日志)来识别相似的搜索查询。例如,如果用户输入相似搜索查询[Mudvillestadium capacity(马德维体育场容量)]在搜索查询日志中达预定次数(即,搜索查询足够普遍),则记录的搜索查询可用作候选重写。
在一些实现方式中,基于使用具有或不具有停止词(例如,a、the)的相同词项或使用查询中的相似类型的词项的查询来识别相似搜索查询。例如,基于公共查询词项的使用,查询[Mudville stadium what is the capacity]可相似于查询[What is the capacityof Mudville stadium]和[Mudville stadium capacity]。在某些其他实现方式中,可使用特定查询模式来识别相似查询。例如,查询日志可指示[x capacity]是公共查询模式,其中,X是stadium(体育场)/building(建筑)/等。因此,如果当前查询是[capacity]并且之前查询中的一个识别与stadium关联的实体,则可使用该模式来生成候选。
在某些其他实现方式中,系统可使用自然语言信息来生成相似搜索查询。例如,在当前搜索查询中使用代词可指示该代词可被特定实体取代。可在先前搜索查询中识别实体并且将它们代入当前搜索查询中,作为候选重写。例如,如果当前接收到的搜索查询是[howold is he(他多大)],则代词“he(他)”指示对象是人实体。如果先前搜索查询中的一个是[Barack Obama],则可将该实体代入以生成候选重写[how old is Barack Obama(巴拉克·奥巴马多大)]。类似地,如果当前接收到的搜索查询是[where is it(它在哪)],则自然语言分析暗示“it(它)”表示地点或物实体。因此,如果先前搜索查询中的一个是[GoldenGate Bridge year built(金门大桥建造年份)],则可将该实体代入以生成候选重写[where is Golden Gate Bridge(金门大桥在哪)]。
系统对每个候选重写进行评分(308)。系统根据一个或多个标准对候选重写进行评分。这一个或多个标准可包括:(i)与相应候选重写关联的先前搜索查询的时间戳,(ii)基于候选重写的查询结果的质量度量,(iii)查询重写的流行度,(iv)指代词项的使用,和(v)一般随特定查询词项出现的实体。基于这一个或多个标准,可定义评分函数S,使得对于候选集合Q而言,评分函数S((qi,ti),q,r)→R在给定输入(qi,ti)和q的情况下指派候选重写的评分。
如上所述,用户会话的每个先前搜索查询包括指示接收到先前搜索查询的时间的时间戳。可使用时间戳对候选重写进行评分。特别地,系统可基于先前搜索查询过去时间或类似地较近先前查询的提高来提供评分中的惩罚权重。因此,先前搜索查询越久,接收到的搜索查询指的是该先前搜索查询的可能性越低。例如,可在时间T1接收搜索查询[BarackObama]并且可在随后时间T3接收搜索查询[Bill Clinton(比尔·克林顿)]。对于在时间T5接收到的搜索查询[how old is he],可相对于候选重写[how old is Bill Clinton(比尔·克林顿多大)]不利地为候选重写[how old is Barack Obama]赋予权重。
可使用质量度量作为对于每个候选重写的评分中的因素。质量度量基于候选重写的搜索查询结果。特别地,可将候选重写提交到搜索引擎。可分析每个候选重写的结果,以确定质量度量。分析可包括以下中的一个或多个:确定所返回的搜索结果的数量、确定用户选择搜索结果的频率、或与特定搜索结果关联的质量分值。在对候选重写进行评分时在给定质量度量因素的情况下,具有较大质量度量的候选重写可被赋予更大的权重。
可使用查询重写的流行度作为对于每个候选重写的评分中的因素。查询重写的流行度是在搜索查询的集中出现多少次候选重写的度量。例如,通过针对用户的集检验搜索查询日志,可确定出现每个候选重写的相对频率。在对候选重写进行评分时在给定流行度因素的情况下,以较高频率出现的候选重写可被赋予更大权重。
指代词项的使用可用作对于每个候选重写的评分中的因素。特别地,当前搜索查询可具有清楚的指代词项,例如,第三人称代词或诸如“it”或“there”的其他指代词项,并且会话中的先前搜索查询具有特定类型的相应实体(例如,人、地点)。在对候选重写进行评分时,将指代词项与特定引用类型的对应实体组合的候选重写可被赋予更大权重。
一般随特定搜索查询词项出现的实体的识别可用作对于每个候选重写的评分中的因素。特别地,特定词项可与搜索查询中的特定实体高度相关。例如,词项“capacity”可与类型“sports facility(运动设施)”的实体高度相关,词项“lyrics(歌词)”可与类型“song(歌曲)”的实体高度相关,并且词项“date of birth(生日)”可与类型“人”的实体高度相关。接收到的搜索查询可包括在包括特定实体类型的搜索查询中(例如,在查询日志中)相关的词项。如果在用户会话的先前用户搜索查询中还出现特定实体类型的实体,则在对候选重写进行评分时,利用这些实体生成的候选重写可被赋予更大权重。
该系统确定是否满足阈值分值(310)。在一些实现方式中,确定最高评分的候选重写并且将其与阈值分值进行比较。响应于确定最高评分的候选重写不满足阈值分值(310的“否”分支),系统基于用户会话的先前搜索查询在不进行重写的情况下获得响应于接收到的查询的搜索结果(312)。可将搜索结果提供到用户装置,以便在用户搜索界面中呈现。
响应于确定最高评分的候选重写确实满足阈值分值(310的“是”分支),该系统选择候选重写(314)来重写接收到的搜索查询并且获得响应于经重写的搜索查询的搜索结果。可将搜索结果提供到用户装置,以便在用户搜索界面中呈现。
本说明书中描述的主题和功能操作的实施例可用数字电子电路、有形实施的计算机软件或固件、包括本说明书中公开的结构及其结构等同物的计算机硬件、或其中一个或多个的组合实现。本说明书中描述的主题的实施例可被实现为一个或多个计算机程序,即,编码在有形非暂时性存储介质上供数据处理设备执行或用于控制数据处理设备的操作的计算机程序指令的一个或多个模块。计算机存储介质可以是机器可读存储装置、机器可读存储基板、随机或串行存取存储器装置、或其中一个或多个的组合。可供选择地或另外地,程序指令可被编码在人为生成的传播信号(例如,机器生成的电、光学、或电磁信号),生成该传播信号是为了编码传输到合适的接收器设备以供数据处理设备执行的信息。
术语“数据处理设备”是指数据处理硬件并且涵盖用于处理数据的所有种类的设备、装置和机器,包括(举例来说)可编程处理器、计算机、或多个处理器或计算机。设备还可以是,或者还包括,专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件之外,设备还可以可选地包括创建计算机程序的执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或其中一个或多个的组合的代码。
还可被称为或描述为程序、软件、软件应用、模块、软件模块、脚本、或代码的计算机程序可用任何形式的编程语言来编写,编程语言包括编译或翻译语言、或声明式或过程化语言;并且它可按任何形式进行部署,包括被部署为独立程序或模块、组件、子例程、或适用于计算环境的其他单元。程序可以但不需要对应于文件系统中的文件。程序可被存储在保持其他程序或数据的文件的一部分(例如,存储在标记语言文档中的一个或多个脚本)中、在专用于所考虑程序的单个文件中、或在多个协调文件(例如,存储一个或多个模块、子程序、或代码的部分的文件)中。计算机程序可被部署成在一个计算机上或位于一个地点或分布于多个地点并且通过数据通信网络互连的多个计算机上执行。
可通过执行一个或多个计算机程序以通过对输入数据操作并且生成输出来执行功能的一个或多个可编程计算机来执行本说明书中描述的过程和逻辑流。还可通过专用逻辑电路(例如,FPGA或ASIC)或通过专用逻辑电路和一个或多个编程计算机的组合来执行过程和逻辑流。
适用于执行计算机程序的计算机可以基于通用或专用微处理器或这二者、或任何其他种类的中央处理单元。通常,中央处理单元将从只读存储器或随机存取存储器或这二者接收指令和数据。计算机的基本元件是用于执行或实行指令的中央处理单元和用于存储指令和数据的一个或多个存储器装置。中央处理单元和存储器可被作为专用逻辑电路的补充或者被并入专用逻辑电路中。通常,计算机还将包括用于存储数据的一个或多个大容量存储装置(例如,磁盘、磁-光盘、或光盘),或者可操作地耦合以从一个或多个大容量存储装置接收数据,或者将数据传递到一个或多个大容量存储装置,或者这二者。然而,计算机不需要具有这些装置。此外,计算机可内置于另一个装置,例如,移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制台、全球定位系统(GPS)接收器、或便携式存储装置(例如,通用串行总线(USB)闪存驱动器),这仅仅是几个例子。
适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器装置,包括(举例来说)半导体存储器装置,例如,EPROM、EEPROM和闪存存储器装置;磁盘,例如,内部硬盘或可移除盘;磁-光盘;CD-ROM和DVD-ROM盘。
对本说明书中描述的各种系统或其一些部分的控制可在计算机程序产品中实现,该计算机程序产品包括存储在一个或多个非暂时性机器可读存储介质上并且可在一个或多个处理装置上执行的指令。本说明书中描述的系统或其一些部分均可被实现为设备、方法、或电子系统,其可包括一个或多个处理装置和用于存储可执行指令的存储器以执行本说明书中描述的操作。
为了提供与用户的交互,本说明书中描述的主题的实施例可在具有用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)和用户可借此向计算机提供输入的键盘和指示装置(例如,鼠标或跟踪球)的计算机上实现。也可使用其他种类的装置提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感官反馈,例如,视觉反馈、听觉反馈、或触觉反馈;可以包括声学、语言、或触觉输入的任何形式接收来自用户的输入。另外,计算机可通过将文档发送到供用户使用的装置并且从其接收文档,例如,通过响应于从用户装置上的web浏览器接收的请求将网页发送到web浏览器,来与用户交互。
本说明书中描述的主题的实施例可在计算系统中实现,该计算系统包括后端组件,例如作为数据服务器;或包括中间件组件,例如应用服务器;或包括前端组件,例如,具有用户通过其可与本说明书中描述的主题的实现方式交互的图形用户界面或web浏览器的客户端计算机;或一个或多个这些后端、中间件、或前端组件的任何组合。系统的组件可通过任何形式或介质的数字数据通信(例如,通信网络)来互连。通信网络的示例包括局域网(LAN)和广域网(WAN),例如,互联网。
计算系统可包括客户端和服务器。客户端和服务器通常彼此远离并且通常通过通信网络交互。凭借在相应计算机上运行并且彼此具有客户端-服务器关系的计算机程序,产生客户端和服务器的关系。在一些实施例中,例如,出于向与充当客户端的用户装置交互的用户显示数据并且从该用户接收用户输入的目的,服务器将数据(例如,HTML页)传送到用户装置。例如,可在服务器从用户装置接收在用户装置处生成的数据,例如用户交互的结果。
虽然本说明书包含许多具体实现方式细节,但这些不应该被理解为限制任何发明的范围或可要求保护的范围,而非理解为对于可以是特定发明的特定实施例所特定的特征的描述。在单独实施例的背景下在本说明书中描述的某些特征还可组合地在单个实施例中实现。相反地,在单个实施例的背景下描述的各种特征还可单独在多个实施例中或以任何合适的子组合实现。此外,虽然特征可在以上描述为作用于某些组合并甚至初始地被如此要求保护,但要求保护的组合中的一个或多个特征可在某些情况下被从组合中删除,并且要求保护的组合可涉及子组合或子组合的变型。
类似地,虽然在附图中以特定次序描绘了操作,但这不应该被理解为需要以所示出的特定次序或以顺序次序来执行这些操作,或者执行所有例示的操作,来实现所期望的结果。在某些情形下,多任务和并行处理可以是有利的。此外,上述实施例中的各种系统模块和组件的分离不应该被理解为需要所有实施例中的这种分离,并且应该理解,所描述的程序组件和系统可通常一起被集成在单个软件产品中或封装在多个软件产品中。
在本说明书中,将广义地使用术语“引擎”来表示可执行一个或多个特定功能的基于软件的系统或子系统。通常,引擎将被实现为安装在一个或多个位置的一个或多个计算机上的一个或多个软件模块或组件。在某些情况下,一个或多个计算机将被专用于特定引擎;在其他情况下,多个引擎可被安装在相同的一个计算机或多个计算机上并且在其上运行。
已经描述了主题的特定实施例。其他实施例在随附权利要求书的范围内。例如,在权利要求书中阐述的动作可按不同次序执行并且仍然实现所期望结果。作为一个示例,附图中描绘的过程不一定需要所示出的特定次序或顺序次序来实现所期望结果。在某些情况下,多任务和并行处理可以是有利的。

Claims (20)

1.一种用于提供搜索结果的方法,包括:
在用户会话期间从用户接收搜索查询;
获得在所述用户会话期间接收的所述用户的多个先前搜索查询;
生成多个候选查询重写,其中,所述候选查询重写是从所述用户的所述搜索查询和所述多个先前搜索查询取得的;
对每个候选查询重写进行评分,其中,对每个候选查询重写进行评分包括将包括质量度量的多个评分因素应用于每个候选查询重写,并且其中,所述质量度量是基于对响应于所述候选查询重写的搜索结果的分析;
响应于确定分值满足阈值,选择最高评分候选查询重写;以及
提供响应于所选择的候选查询重写的搜索结果。
2.根据权利要求1所述的方法,其中,生成所述多个候选查询重写还包括将所述搜索查询与所述多个先前搜索查询中的每个先前搜索查询串接。
3.根据权利要求2所述的方法,其中,每个先前搜索查询包括时间戳,并且其中,对所述候选查询重写进行评分包括部分地基于对应先前查询的过去时间为候选重写赋予权重。
4.根据权利要求1所述的方法,其中,生成所述多个候选查询重写还包括从来自多个用户的查询集中识别与所述搜索查询相似的查询。
5.根据权利要求1所述的方法,其中,将多个评分因素应用于每个候选查询重写还包括基于来自多个用户的查询集来确定每个候选查询重写的流行度的度量。
6.根据权利要求1所述的方法,其中,将多个评分因素应用于每个候选查询重写还包括确定所述搜索查询是否包括特定类型的指代词项。
7.根据权利要求6所述的方法,其中,候选查询重写的分值响应于确定所述候选查询重写包括特定类型的实体而增加。
8.根据权利要求1所述的方法,其中,将多个评分因素应用于每个候选查询重写还包括确定所述搜索查询是否包括与特定实体高度相关的词项。
9.根据权利要求8所述的方法,其中,候选查询重写的分值响应于确定所述候选查询重写包括与所述查询词项高度相关的实体而增加。
10.根据权利要求1所述的方法,其中,基于对响应于所述候选查询重写的搜索结果的分析来确定每个候选查询重写的质量包括获得响应于每个候选查询重写的搜索结果并且确定所述搜索结果的质量。
11.一种用于提供搜索结果的系统,包括:
用户装置;以及
一个或多个计算机,所述一个或多个计算机被配置成与所述用户装置交互并且执行包括以下的操作:
在用户会话期间从所述用户装置的用户接收搜索查询;
获得在所述用户会话期间接收的所述用户的多个先前搜索查询;
生成多个候选查询重写,其中所述候选查询重写是从所述用户的所述搜索查询和所述多个先前搜索查询取得的;
对每个候选查询重写进行评分,其中,对每个候选查询重写进行评分包括将包括质量度量的多个评分因素应用于每个候选查询重写,并且其中,所述质量度量是基于对响应于所述候选查询重写的搜索结果的分析;
响应于确定分值满足阈值,选择最高评分候选查询重写;以及
将响应于所选择的候选查询重写的搜索结果提供到所述用户装置。
12.根据权利要求11所述的系统,其中,生成所述多个候选查询重写还包括将所述搜索查询与所述多个先前搜索查询中的每个先前搜索查询串接。
13.根据权利要求12所述的系统,其中,每个先前搜索查询包括时间戳,并且其中,对所述候选查询重写进行评分包括部分地基于对应先前查询的过去时间为候选重写赋予权重。
14.根据权利要求11所述的系统,其中,生成所述多个候选查询重写还包括从来自多个用户的查询集中识别与所述搜索查询相似的查询。
15.根据权利要求11所述的系统,其中,将多个评分因素应用于每个候选查询重写还包括基于来自多个用户的查询集合来确定每个候选查询重写的流行度的度量。
16.根据权利要求11所述的系统,其中,将多个评分因素应用于每个候选查询重写还包括确定所述搜索查询是否包括特定类型的指代词项。
17.根据权利要求16所述的系统,其中,候选查询重写的分值响应于确定所述候选查询重写包括特定类型的实体而增加。
18.根据权利要求11所述的系统,其中,将多个评分因素应用于每个候选查询重写还包括确定所述搜索查询是否包括与特定实体高度相关的词项。
19.根据权利要求11所述的系统,其中,基于对响应于所述候选查询重写的搜索结果的分析来确定每个候选查询重写的质量包括获得响应于每个候选查询重写的搜索结果并且确定所述搜索结果的质量。
20.一个或多个非暂时性计算机可读存储介质,所述计算机可读存储介质编码有指令,所述指令在由一个或多个计算机执行时使得所述一个或多个计算机执行包括以下的操作:
在用户会话期间从用户接收搜索查询;
获得在所述用户会话期间接收的所述用户的多个先前搜索查询;
生成多个候选查询重写,其中,所述候选查询重写是从所述用户的所述搜索查询和所述多个先前搜索查询取得的;
对每个候选查询重写进行评分,其中,对每个候选查询重写进行评分包括将包括质量度量的多个评分因素应用于每个候选查询重写,并且其中,所述质量度量是基于对响应于所述候选查询重写的搜索结果的分析;
响应于确定分值满足阈值,选择最高评分候选查询重写;以及
提供响应于所选择的候选查询重写的搜索结果。
CN201580035103.4A 2014-09-15 2015-09-09 使用会话信息的查询重写 Active CN106489146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911180100.6A CN111061848B (zh) 2014-09-15 2015-09-09 用于提供搜索结果的方法、系统和介质

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/486,879 2014-09-15
US14/486,879 US9547690B2 (en) 2014-09-15 2014-09-15 Query rewriting using session information
PCT/US2015/049212 WO2016044028A1 (en) 2014-09-15 2015-09-09 Query rewriting using session information

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201911180100.6A Division CN111061848B (zh) 2014-09-15 2015-09-09 用于提供搜索结果的方法、系统和介质

Publications (2)

Publication Number Publication Date
CN106489146A CN106489146A (zh) 2017-03-08
CN106489146B true CN106489146B (zh) 2019-12-24

Family

ID=54147355

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201911180100.6A Active CN111061848B (zh) 2014-09-15 2015-09-09 用于提供搜索结果的方法、系统和介质
CN201580035103.4A Active CN106489146B (zh) 2014-09-15 2015-09-09 使用会话信息的查询重写

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201911180100.6A Active CN111061848B (zh) 2014-09-15 2015-09-09 用于提供搜索结果的方法、系统和介质

Country Status (4)

Country Link
US (2) US9547690B2 (zh)
CN (2) CN111061848B (zh)
DE (1) DE112015004203T5 (zh)
WO (1) WO2016044028A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9852188B2 (en) * 2014-06-23 2017-12-26 Google Llc Contextual search on multimedia content
US11042590B2 (en) * 2015-10-05 2021-06-22 Verizon Media Inc. Methods, systems and techniques for personalized search query suggestions
US11836169B2 (en) * 2015-10-05 2023-12-05 Yahoo Assets Llc Methods, systems and techniques for providing search query suggestions based on non-personal data and user personal data according to availability of user personal data
US11899728B2 (en) * 2015-10-05 2024-02-13 Yahoo Assets Llc Methods, systems and techniques for ranking personalized and generic search query suggestions
US9684693B1 (en) 2016-04-05 2017-06-20 Google Inc. On-device query rewriting
US11086866B2 (en) * 2016-04-15 2021-08-10 Verizon Media Inc. Method and system for rewriting a query
CN109948014A (zh) * 2017-08-24 2019-06-28 阿里巴巴集团控股有限公司 一种搜索方法和服务器
US10387576B2 (en) * 2017-11-30 2019-08-20 International Business Machines Corporation Document preparation with argumentation support from a deep question answering system
US11210286B2 (en) 2017-12-28 2021-12-28 Microsoft Technology Licensing, Llc Facet-based conversational search
US11567980B2 (en) 2018-05-07 2023-01-31 Google Llc Determining responsive content for a compound query based on a set of generated sub-queries
KR102508338B1 (ko) 2018-05-07 2023-03-10 구글 엘엘씨 제2 세션 인터럽트 중단시 제1 자동화 어시스턴트 세션 자동 재개 여부 결정
US10791411B2 (en) * 2019-01-10 2020-09-29 Qualcomm Incorporated Enabling a user to obtain a suitable head-related transfer function profile
CN109857926A (zh) * 2019-03-05 2019-06-07 百度在线网络技术(北京)有限公司 用于呈现信息的方法和装置
US11868355B2 (en) * 2019-03-28 2024-01-09 Indiavidual Learning Private Limited System and method for personalized retrieval of academic content in a hierarchical manner
US11698904B2 (en) * 2019-09-05 2023-07-11 Home Depot Product Authority, Llc Query rewrite for low performing queries based on customer behavior
US11422995B1 (en) * 2021-02-11 2022-08-23 Talenya Ltd. Enhanced database and user interface incorporating predicted missing data
US11947535B2 (en) * 2021-05-04 2024-04-02 Bank Of America Corporation Multicomputer system with machine learning engine for query optimization and dynamic data reorganization
CN113505194B (zh) * 2021-06-15 2022-09-13 北京三快在线科技有限公司 改写词生成模型的训练方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1750002A (zh) * 2005-10-26 2006-03-22 孙斌 提供搜索结果的方法
CN102542012A (zh) * 2010-12-15 2012-07-04 微软公司 分类搜索查询的结果
US8688667B1 (en) * 2011-02-08 2014-04-01 Google Inc. Providing intent sensitive search results

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010037359A1 (en) * 2000-02-04 2001-11-01 Mockett Gregory P. System and method for a server-side browser including markup language graphical user interface, dynamic markup language rewriter engine and profile engine
US7536382B2 (en) 2004-03-31 2009-05-19 Google Inc. Query rewriting with entity detection
US20060064411A1 (en) 2004-09-22 2006-03-23 William Gross Search engine using user intent
US20070168854A1 (en) 2006-01-18 2007-07-19 De Marcken Carl G User interface for presentation of solutions in multi-passenger multi-route travel planning
US7552112B2 (en) 2006-09-18 2009-06-23 Yahoo! Inc. Discovering associative intent queries from search web logs
US7840538B2 (en) 2006-12-20 2010-11-23 Yahoo! Inc. Discovering query intent from search queries and concept networks
US20090043749A1 (en) 2007-08-06 2009-02-12 Garg Priyank S Extracting query intent from query logs
JP2010033664A (ja) * 2008-07-29 2010-02-12 Hitachi-Lg Data Storage Inc 光ディスク装置のトレイ及びこれを備えた光ディスク装置
CN101887436B (zh) * 2009-05-12 2013-08-21 阿里巴巴集团控股有限公司 一种检索方法和装置
US20100312778A1 (en) * 2009-06-08 2010-12-09 Yumao Lu Predictive person name variants for web search
US8442987B2 (en) 2010-08-19 2013-05-14 Yahoo! Inc. Method and system for providing contents based on past queries
JP5100820B2 (ja) * 2010-11-25 2012-12-19 株式会社東芝 問合せ式変換装置、方法およびプログラム
US9507861B2 (en) 2011-04-01 2016-11-29 Microsoft Technolgy Licensing, LLC Enhanced query rewriting through click log analysis
US20120290575A1 (en) 2011-05-09 2012-11-15 Microsoft Corporation Mining intent of queries from search log data
US8954465B2 (en) 2012-05-22 2015-02-10 Google Inc. Creating query suggestions based on processing of descriptive term in a partial query
US10275485B2 (en) 2014-06-10 2019-04-30 Google Llc Retrieving context from previous sessions

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1750002A (zh) * 2005-10-26 2006-03-22 孙斌 提供搜索结果的方法
CN102542012A (zh) * 2010-12-15 2012-07-04 微软公司 分类搜索查询的结果
US8688667B1 (en) * 2011-02-08 2014-04-01 Google Inc. Providing intent sensitive search results

Also Published As

Publication number Publication date
CN106489146A (zh) 2017-03-08
CN111061848B (zh) 2021-11-05
DE112015004203T5 (de) 2017-08-10
US10387437B2 (en) 2019-08-20
CN111061848A (zh) 2020-04-24
WO2016044028A1 (en) 2016-03-24
US20170124091A1 (en) 2017-05-04
US20160078086A1 (en) 2016-03-17
US9547690B2 (en) 2017-01-17

Similar Documents

Publication Publication Date Title
CN106489146B (zh) 使用会话信息的查询重写
US8615514B1 (en) Evaluating website properties by partitioning user feedback
US9679027B1 (en) Generating related questions for search queries
US9031970B1 (en) Query autocompletions
US8812520B1 (en) Augmented resource graph for scoring resources
US9378247B1 (en) Generating query refinements from user preference data
US8832096B1 (en) Query-dependent image similarity
US8600968B2 (en) Predictively suggesting websites
US8359309B1 (en) Modifying search result ranking based on corpus search statistics
US9922122B2 (en) Providing remedial search operation based on analysis of user interaction with search results
US8548981B1 (en) Providing relevance- and diversity-influenced advertisements including filtering
US8359326B1 (en) Contextual n-gram analysis
EP3128448A1 (en) Factorized models
US8380707B1 (en) Session-based dynamic search snippets
CN102625936A (zh) 来自文档的查询建议
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
KR20120091035A (ko) 쿼리 제안들로서 사용자 입력에 관련된 답변 상자들을 선택 및 제시하기 위한 프레임워크
US10691679B2 (en) Providing query completions based on data tuples
JP2013529805A5 (ja) 検索方法、検索システム及びコンピュータプログラム
US9984155B2 (en) Inline discussions in search results around real-time clusterings
KR20190022687A (ko) 컨텍스트 정보 제공 시스템 및 방법
US9195944B1 (en) Scoring site quality
WO2014093808A2 (en) Utilizing keystroke logging to determine items for presentation
RU2713608C2 (ru) Верификация контента собственного приложения
US9811592B1 (en) Query modification based on textual resource context

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

GR01 Patent grant
GR01 Patent grant