CN117396862A - 用于理解对助理的用户意图的基于搜索结果的触发 - Google Patents
用于理解对助理的用户意图的基于搜索结果的触发 Download PDFInfo
- Publication number
- CN117396862A CN117396862A CN202280038133.0A CN202280038133A CN117396862A CN 117396862 A CN117396862 A CN 117396862A CN 202280038133 A CN202280038133 A CN 202280038133A CN 117396862 A CN117396862 A CN 117396862A
- Authority
- CN
- China
- Prior art keywords
- query
- user
- intent
- user intent
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004044 response Effects 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000009471 action Effects 0.000 claims abstract description 12
- 230000015654 memory Effects 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 24
- 238000004891 communication Methods 0.000 claims description 3
- 230000001755 vocal effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000870566 Astronium fraxinifolium Species 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
Abstract
用于向模糊查询递送相关响应的方法(200)包括从与用户(10)相关联的用户设备(110)接收请求来自数字助理服务(160)的信息或由数字助理服务执行动作的查询(120)。当查询的用户意图未解析时,该方法还包括从搜索引擎(164)检索针对查询的当前趋势搜索结果,并且基于搜索结果来解析查询的用户意图。该方法还包括基于解析的用户意图生成对查询的响应(122)。该响应包括从与解析的用户意图相关联的特定意图垂直或由数字助理服务履行动作获得的信息。
Description
技术领域
本公开涉及用于理解对助理的用户意图的基于搜索结果的触发。
背景技术
用户可以查询在计算设备上执行的数字助理以获得关于主题/实体的信息和事实或者帮助用户完成特定任务。数字助理可能要求用户能够提供足够的信息来引导数字助理朝向用户感兴趣的特定信息定位。如果查询没有被充分定制,或者如果用户除了简单地指定与查询相关的实体之外没有以附加信息的方式提供太多,则数字助理可以提示用户消除模糊的问题以进一步缩小查询并获得用户意图。另外,数字助理可以通过提供必须动态更新的默认响应来依赖于针对缺乏用户意图的模糊查询的预定查询解释。
发明内容
本公开的一个方面提供了一种用于向模糊查询递送相关响应的计算机实现的方法。所述计算机实现的方法在数据处理硬件上施行时使数据处理硬件执行操作,所述操作包括:从与用户相关联的用户设备接收请求来自数字助理服务的信息的查询;以及当查询的用户意图未解析时:从搜索引擎检索针对查询的当前趋势搜索结果;基于搜索结果来解析查询的用户意图;以及基于所解析的用户意图生成对查询的响应,所述响应包括从与所解析的用户意图相关联的特定意图垂直(vertical)获得的信息。
本公开的实施方式可以包括以下可选特征中的一个或多个。在一些实施方式中,操作还包括响应于接收到查询:对查询执行查询解释以确定用户意图是否模糊;以及当用户意图模糊时,确定查询的用户意图是未解析的。在这些实施方式中,对查询执行查询解释以确定用户意图是否模糊包括:处理查询以确定查询的一个或多个可能的用户意图中的每个的相应分数,并且当针对查询的一个或多个可能的用户意图中的每个确定的相应分数未能满足置信度阈值时,确定用户意图模糊。执行查询解释还可以包括:当针对查询的一个或多个可能的用户意图中的一个的相应分数满足置信度阈值时,确定用户意图是明确的。
在一些示例中,基于搜索结果来解析查询的用户意图包括:识别从搜索引擎检索的针对查询的当前趋势搜索结果的处于第一位置的搜索结果,确定与处于第一位置的搜索结果相关联的搜索结果类型或实体中的至少一个,以及基于与处于第一位置的搜索结果相关联的搜索结果类型或实体中的至少一个来解析用户意图。实体可以包括但不限于人、地点、事物等。所解析的用户意图可以包括寻求新闻的用户意图、旅行/交通相关的用户意图、寻求音乐的用户意图、自动命令意图和寻求娱乐的用户意图中的一个。与所解析的用户意图相关联的特定意图垂直可以包括一个或多个用户偏好的信息源。
用户设备可以包括智能扬声器、智能显示器或移动计算设备。查询可以包括由用户经由在用户设备上施行的可听用户接口输入的口头查询或由用户经由在用户设备上施行的图形用户接口输入的键入查询。操作还可以包括向用户设备提供对查询的响应,用户设备被配置为输出响应的音频表示或图形表示中的至少一个。
本公开的另一方面提供了一种系统,该系统包括数据处理硬件和与数据处理硬件通信并且存储指令的存储器硬件,该指令在数据处理硬件上施行时使数据处理硬件执行操作。所述操作包括:从与用户相关联的用户设备接收请求来自数字助理服务的信息的查询;以及当所述查询的用户意图未解析时:从搜索引擎检索针对查询的当前趋势搜索结果;基于搜索结果来解析查询的用户意图;以及基于所解析的用户意图来生成对查询的响应,所述响应包括从与所解析的用户意图相关联的特定意图垂直获得的信息。
该方面可以包括以下可选特征中的一个或多个。本公开的实施方式可以包括以下可选特征中的一个或多个。在一些实施方式中,操作还包括响应于接收到查询:对查询执行查询解释以确定用户意图是否模糊;以及当用户意图模糊时,确定查询的用户意图是未解析的。在这些实施方式中,对查询执行查询解释以确定用户意图是否模糊包括处理查询以确定查询的一个或多个可能的用户意图中的每个的相应分数,并且当针对查询的一个或多个可能的用户意图中的每个确定的相应分数未能满足置信度阈值时,确定用户意图模糊。执行查询解释还可以包括:当针对查询的一个或多个可能的用户意图中的一个的相应分数满足置信度阈值时,确定用户意图是明确的。
在一些示例中,基于搜索结果来解析查询的用户意图包括:识别从搜索引擎检索的针对查询的当前趋势搜索结果的处于第一位置的搜索结果,确定与处于第一位置的搜索结果相关联的搜索结果类型或实体中的至少一个,以及基于与处于第一位置的搜索结果相关联的搜索结果类型或实体中的至少一个来解析用户意图。实体可以包括但不限于人、地点、事物等。所解析的用户意图可以包括寻求新闻的用户意图、旅行/交通相关的用户意图、寻求音乐的用户意图、自动命令意图和寻求娱乐的用户意图中的一个。与所解析的用户意图相关联的特定意图垂直可以包括一个或多个用户偏好的信息源。
用户设备可以包括智能扬声器、智能显示器或移动计算设备。查询可以包括由用户经由在用户设备上施行的可听用户接口输入的口头查询或由用户经由在用户设备上施行的图形用户接口输入的键入查询。操作还可以包括向用户设备提供对查询的响应,用户设备被配置为输出响应的音频表示或图形表示中的至少一个。
在附图和以下描述中阐述了本公开的一个或多个实施方式的细节。根据说明书和附图以及权利要求,其他方面、特征和优点将是显而易见的。
附图说明
图1是当针对数字助理服务的查询模糊时用于解析查询的用户意图的示例系统的示意图。
图2是用于向模糊查询递送相关响应的方法的操作的示例布置的流程图。
图3是可以用于实现本文描述的系统和方法的示例计算设备的示意图。
各个附图中相同的附图标记表示相同的元件。
具体实施方式
用户可以查询在计算设备上施行的数字助理接口以获得关于主题/实体的信息和事实或者帮助用户完成特定任务。用户可以类似地查询数字助理接口,请求数字助理执行动作/操作。数字助理可能要求用户能够提供足够的信息来引导数字助理朝向用户感兴趣的特定信息定位(或识别特定动作)。如果查询没有被充分定制,或者如果用户除了简单地指定与查询相关的实体之外没有以附加信息的方式提供太多,则数字助理可以提示用户回答消除模糊的问题以进一步缩小查询并获得用户意图。用户可能由于在接收到响应之前必须回答消除模糊的问题而引起的附加时间而被打扰。另外,数字助理可以通过提供必须动态更新的默认响应来依赖于针对缺乏用户意图的模糊查询的预定查询解释。数字助理服务的管理员及时地更新用于模糊查询的预定解释是乏味的过程,使得难以针对潜在无限数量的可能的模糊查询不断地维持准确的解释。本文的实现方式涉及通过参考与查询120相关的当前趋势搜索结果来使得模糊查询消除模糊,以便解析/提取上下文相关的用户意图。如将变得显而易见的,搜索结果可以允许数字助理服务动态地查明针对模糊查询的相关用户意图,并且无需要求用户提供附加信息(例如,回答消除模糊的问题或重新定制查询)。
图1是包括与用户10相关联的用户设备110的示例系统100,用户10能够通过网络130向分布式系统(例如,云计算平台)140传送查询120(例如,也称为客户端内容/数据)。分布式系统140可以具有远离用户设备110的本地资源的可缩放/弹性资源142(例如,存储抽象)。资源142包括硬件资源144(例如,数据处理硬件)、存储资源146(例如,存储器硬件)和/或软件资源148(例如,基于web的应用或应用编程接口(API))。在一些示例中,分布式系统140施行数字助理服务(DAS)160,并且用户10使用用户设备110(例如,使用数字助理接口114或web浏览器应用116)与DAS160对接。
用户设备110可以是能够与分布式系统140通信的任何计算设备或数据处理硬件。用户设备110的一些示例包括但不限于台式计算设备、移动计算设备,诸如膝上型计算机、平板计算机、智能电话、智能电视、机顶盒、智能扬声器/显示器、智能电器、车辆娱乐系统和可穿戴计算设备(例如,头戴式耳机和/或手表)。作为计算设备,用户设备110包括数据处理硬件111和被配置为与数据处理硬件111通信以施行各种过程的存储器硬件113。这里,图1描绘了用户设备110使用数据处理硬件111来施行应用114、116(例如,已经下载并存储在存储器硬件113中的应用)。例如,用户设备110施行接口114或web浏览器应用116以与由DAS160提供并且经由接口114或web浏览器应用116可访问用户设备110的基于web的服务通信。
用户10可以向DAS160发出查询120以获得关于主题/实体的信息和事实和/或对DAS160请求执行动作/操作。例如,请求信息的查询120可以包括“Who is Michael Jackson(谁是迈克尔杰克逊)”,而请求执行动作/操作的查询可以包括“Play Michael Jackson(播放迈克尔杰克逊)”。接口114可以包括与DAS160相关联的图形用户接口。在一些示例中,接口114包括用于允许用户10向DAS160发出查询120并且向查询120输出从DAS160返回的响应122的可听用户接口或图形/可听用户接口的组合。因此,用户10可以经由接口114输入口头或键入的查询120,并且用户设备110可以将查询120发送到DAS 160以处理查询120并返回响应122。在具有图形和可听能力两者的用户接口114的情况下,由DAS返回的响应122可以是多模态响应122,其可以并入多个同步输出模态。在非限制性示例中,包含多个同步输出模态的多模态响应可以包括多媒体分量,诸如包括音频和视觉轨道两者的视频,以及诸如来自DAS160的传达关于返回响应122的一般信息的合成语音的其他分量。当说出查询120时,用户设备110可以对与查询相对应的音频数据执行语音识别以获得转录(transcription),并且通过网络130将查询120的转录传输到DAS160。可选地,用户设备110可以将与口头查询120相对应的音频数据传输到在分布式系统140上施行以获得查询120的转录的服务器侧语音辨识器。
在所示的示例中,DAS160包括查询解释器162,其被配置为通过对查询120执行查询解释来处理查询120。查询解释器162可以确定用户意图是否可以被解析,使得查询120是明确的。如本文所使用的,明确查询是指查询中明显地指定用户意图的查询,或者可以以足够的置信度合理地推断。用户意图可以是多个预定义意图中的一个,其可以对应于信息寻求意图以及与动作请求相关的意图。例如,预定义意图可以包括新闻寻求意图、交通/旅行相关意图、音乐寻求意图、娱乐相关意图、家庭/办公室/汽车自动命令意图等。查询解释器162可以生成与意图相关联的分数。意图的分数可以指示查询120要获得满足意图的信息的置信度(例如,概率或其他可能性程度)。因此,查询解释器162可以输出针对查询120的可能意图的概率分布。当意图的分数满足置信度阈值时,查询解释器162可以确定查询160的用户意图被解析,使得DAS160可以访问适当的意图垂直(vertical)以获得响应于查询120的信息。
否则,当用户意图未解析时,例如,当针对可能意图生成的分数都不满足置信度阈值时,DAS160将查询120视为模糊的。在DAS120确定查询120的用户意图是未解析/模糊的场景中,DAS160可以简单地提供默认响应。例如,如果查询120仅包括实体指定术语“TigerWoods”,则查询解释器162将不能确定用户意图是否是查看Tiger Woods打高尔夫的流行视频(例如,You Tube)、用户意图是否是新闻寻求以获得关于高尔夫球手Tiger Woods的当前趋势新闻、或一些其他用户意图,因为用户意图在查询120中不是明显的。在该示例中,由DAS120提供的默认响应可以包括关于高尔夫球手Tiger Woods的一些一般传记性信息。然而,如果在加利福尼亚的Tiger Wood的车祸之后不久提供查询120,则存在用户想要查明关于车祸的新闻的强烈可能性,其中传达关于Tiger Woods的传记性信息的默认响应对用户几乎没有价值。
本文的实施方式涉及利用与查询120相关的当前趋势搜索结果,以便在查询解释器162确定查询120模糊时解析/提取用户意图。因此,DAS160可以使用解析的用户意图来生成对查询120的上下文相关响应122,由此响应122包括从与解析的用户意图相关联的特定意图垂直获得的信息。在所示的示例中,响应于查询解释器162确定查询的用户意图未解析,DAS160可以调用搜索模块(例如,搜索引擎)164来进行与模糊查询120相关的搜索。这里,查询120可以包括指定用于由搜索引擎164用作搜索项的实体/主题以进行搜索的一个或多个项。在进行搜索之后,搜索模块164可以向用户意图解析器166输出针对查询120的当前趋势搜索结果的列表。这里,用户意图解析器166可以识别在从搜索模块164检索的当前趋势搜索结果的处于第一位置的搜索结果,确定与处于第一位置的搜索结果相关联的搜索结果类型,然后基于与处于第一位置的搜索结果相关联的搜索结果类型来解析/提取用户意图。“搜索结果类型”可以指响应垂直,诸如传记、新闻、音乐、交通/旅行。例如,应用以上示例,与查询“Tiger Woods”相关的当前趋势搜索结果的处于第一位置的搜索结果将与在汽车事故之后不久的新闻寻求的搜索结果类型相关联。这样,意图解析器166将用户意图解析为新闻寻求以提示履行168查询并生成新闻寻求响应,而不是包含用于Tiger Woods的传记性信息的默认响应。因此,DAS160处的履行168通过利用当前趋势搜索结果来生成并递送在真实世界的场境中对查询120的更相关的响应122。
值得注意的是,如果搜索模块164在汽车事故Tiger Woods之前的某个时间执行与模糊查询120相关的相同搜索,则处于第一位置的搜索结果将可能与传记性相关搜索结果类型相关联。在这种情况下,意图解析器166将用户意图解析为与传记性相关,并且由此通过生成与包含Tiger Woods的传记性信息的默认响应相同的响应来引起查询120的履行168。因此,DAS160可以将基于当前趋势搜索结果动态地改变的上下文相关的响应122递送到模糊查询120。
有趣的是,当基于当前趋势搜索结果来解析用户意图时,DAS160不简单地回复到提供当前趋势搜索结果的处于第一位置的搜索结果。相反,DAS160从与该搜索结果相关联的搜索结果类型解析用户意图,然后将解析的用户意图与模糊查询的默认解释交叉引用,以确定在现实世界的场境中对查询120的最相关响应122。这里,最相关的响应122将包括从与针对特定用户策划的解析的用户意图相关联的特定意图垂直获得的信息。也就是说,特定意图垂直可以包括与处于第一位置的搜索结果相关联的搜索结果类型相关的一个或多个信息源,然而,与同样与该搜索结果类型相关的其他信息源相比,用户可能更偏好这些信息源。与不同意图垂直相关联的这些用户偏好信息源可以先前由用户指定和/或基于用户10与DAS160之间的过去交互来学习。此外,用于意图垂直的用户偏好信息源可以存储在与用户相关联并且可访问DAS160的用户简档中。例如,在以上示例中,用于特定用户的新闻寻求用户意图可以包括仅从由用户偏好指定的特定新闻源访问信息的履行,其中这些新闻源可以不同于提供当前趋势搜索结果的第一位置的搜索结果的新闻源。这里,用户10可能更偏好从他/她的本地报纸接收新闻,而提供处于第一位置的搜索结果的新闻源可能包括国家新闻集团。
在解析的用户意图是音乐寻求的另一示例中,与音乐寻求用户意图相关联的特定意图垂直可以包括用户用于收听音乐的偏好的音乐流服务。在该示例中,作为音乐寻求的搜索结果类型可以包括处于第一位置的搜索结果,该处于第一位置的搜索结果包括用于从搜索引擎164默认的不同音乐流服务流式传输的音乐的可听回放的链接。
附加地或替代地,DAS160可以确定是否最近从与其他用户相关联的其他用户设备接收到类似查询。如本文所使用的,类似查询可以包括指定与未解析查询相同的实体的类似项。这些类似的查询可以明显地传达用户意图,或者用户意图可能已经被解析。这里,查询解析器166可以确定类似查询中是否存在最近尖峰,并且识别由阈值数量的类似查询共享的共同用户意图。因此,查询解析器166可以通过从在DAS160处从其他用户接收的类似查询的最近尖峰中提取由阈值数量的查询共享的公共用户意图来解析用户意图。
图2是用于向模糊查询递送相关响应的方法200的操作的示例布置的流程图。在操作202处,方法200包括从与用户10相关联的用户设备110接收请求来自数字助理服务(DAS)160的信息的查询120。当查询120的用户意图未解析时,执行操作204-208。在操作204处,方法200包括从搜索引擎164检索针对查询120的当前趋势搜索结果。在操作206处,方法200包括基于搜索结果来解析查询的用户意图。在操作208处,方法200包括基于解析的用户意图生成对查询120的响应122。这里,响应122包括从与所解析的用户意图相关联的特定意图垂直获得的信息。
DAS160可以包括查询解释器162,其对接收到的查询执行查询解释以确定用户意图是否模糊,并且当用户意图模糊时确定查询120的用户意图是未解析的。在一些示例中,查询解释器162处理查询120以确定查询的一个或多个可能的用户意图中的每个的相应分数,并且当针对查询的一个或多个可能的用户意图中的每个确定的相应分数未能满足置信度阈值时,确定用户意图模糊。
在一些实施方式中,基于搜索结果解析查询的用户意图包括:识别从搜索引擎检索的针对查询的当前趋势搜索结果的处于第一位置的搜索结果,确定与处于第一位置的搜索结果相关联的搜索结果类型,以及基于与处于第一位置的搜索结果相关联的搜索结果类型来解析用户意图。解析的用户意图可以包括寻求新闻的用户意图、旅行/交通相关的用户意图、寻求音乐的用户意图和寻求娱乐的用户意图中的一个。与所解析的用户意图相关联的特定意图垂直可以包括一个或多个用户偏好的信息源。
用户设备可以包括智能扬声器或智能显示器。另外,用户设备可以包括移动计算设备,诸如但不限于智能电话、平板电脑或膝上型电脑。查询可以包括由用户经由在用户设备上施行的图形用户接口14输入的键入查询,或者查询可以包括由用户经由在用户设备上施行的可听用户接口输入的口头查询。
软件应用(即,软件资源)可以指使得计算设备执行任务的计算机软件。在一些示例中,软件应用可以被称为“应用”、“app”或“程序”。示例应用包括但不限于系统诊断应用、系统管理应用、系统维护应用、文字处理应用、电子表格应用、消息传送应用、媒体流应用、社交网络应用和游戏应用。
非暂时性存储器可以是用于临时或永久地存储程序(例如,指令序列)或数据(例如,程序状态信息)以供计算设备使用的物理设备。非暂时性存储器可以是易失性和/或非易失性可寻址半导体存储器。非易失性存储器的示例包括但不限于闪存和只读存储器(ROM)/可编程只读存储器(PROM)/可擦除可编程只读存储器(EPROM)/电可擦除可编程只读存储器(EEPROM)(例如,通常用于固件,诸如引导程序)。易失性存储器的示例包括但不限于随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、相变存储器(PCM)以及磁盘或磁带。
图3是可以用于实现本文档中描述的系统和方法的示例计算设备300的示意图。计算设备300旨在表示各种形式的数字计算机,诸如膝上型计算机、台式计算机、工作站、个人数字助理、服务器、刀片服务器、大型机和其他适当的计算机。这里所示的组件、它们的连接和关系及其功能仅仅是示例性的,并不意味着限制本文档中描述和/或要求保护的发明的实施方式。
计算设备300包括处理器310、存储器320、存储设备330、连接到存储器320和高速扩展端口350的高速接口/控制器340、以及连接到低速总线370和存储设备330的低速接口/控制器360。组件310、320、330、340、350和360中的每一个使用各种总线互连,并且可以安装在公共母板上或适当地以其他方式安装。处理器310可以处理用于在计算设备300内执行的指令,包括存储在存储器320中或存储设备330上的指令,以在外部输入/输出设备(诸如耦合到高速接口340的显示器380)上显示图形用户接口(GUI)的图形信息。在其他实施方式中,可以适当地使用多个处理器和/或多个总线以及多个存储器和存储器类型。此外,可以连接多个计算设备300,其中每个设备提供必要操作的部分(例如,作为服务器组、一组刀片服务器或多处理器系统)。
存储器320在计算设备300内非暂时性地存储信息。存储器320可以是计算机可读介质、易失性存储器单元或非易失性存储器单元。非暂时性存储器320可以是用于临时或永久地存储程序(例如,指令序列)或数据(例如,程序状态信息)以供计算设备300使用的物理设备。非易失性存储器的示例包括但不限于闪存和只读存储器(ROM)/可编程只读存储器(PROM)/可擦除可编程只读存储器(EPROM)/电可擦除可编程只读存储器(EEPROM)(例如,通常用于固件,诸如引导程序)。易失性存储器的示例包括但不限于随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、相变存储器(PCM)以及磁盘或磁带。
存储设备330能够为计算设备300提供大容量存储。在一些实施方式中,存储设备330是计算机可读介质。在各种不同的实现中,存储设备330可以是软盘设备、硬盘设备、光盘设备、或磁带设备、闪存或其他类似的固态存储设备、或设备阵列,包括存储区域网络或其他配置中的设备。在另外的实施方式中,计算机程序产品被有形地体现在信息载体中。计算机程序产品包含指令,所述指令在被执行时执行一种或多种方法,诸如上述那些方法。信息载体是计算机或机器可读介质,诸如存储器320、存储设备330或处理器310上的存储器。
高速控制器340管理用于计算设备300的带宽密集型操作,而低速控制器360管理较低带宽密集型操作。这种职责分配仅仅是示例性的。在一些实施方式中,高速控制器340耦合到存储器320、显示器380(例如,通过图形处理器或加速器)和高速扩展端口350,高速扩展端口350可以接受各种扩展卡(未示出)。在一些实施方式中,低速控制器360耦合到存储设备330和低速扩展端口390。可以包括各种通信端口(例如,USB、蓝牙、以太网、无线以太网)的低速扩展端口390可以例如通过网络适配器耦合到一个或多个输入/输出设备,诸如键盘、定点设备、扫描仪或诸如交换机或路由器的网络设备。
计算设备300可以以多种不同的形式实现,如图所示。例如,它可以被实现为标准服务器300a或以一组这样的服务器300a实现多次,实现为膝上型计算机300b,或者实现为机架服务器系统300c的一部分。
本文描述的系统和技术的各种实施方式可以在数字电子和/或光学电路、集成电路、专门设计的ASIC(专用集成电路)、计算机硬件、固件、软件和/或其组合中实现。这些各种实施方式可以包括在可编程系统上可执行和/或可解释的一个或多个计算机程序中的实施方式,该可编程系统包括至少一个可编程处理器,该可编程处理器可以是专用的或通用的,被耦合以从存储系统、至少一个输入设备接收数据和指令,并且向存储系统、至少一个输出设备发送数据和指令。
这些计算机程序(也称为程序、软件、软件应用或代码)包括用于可编程处理器的机器指令,并且可以以高级过程和/或面向对象的编程语言和/或汇编/机器语言来实现。如本文所使用的,术语“机器可读介质”和“计算机可读介质”是指用于向可编程处理器提供机器指令和/或数据的任何计算机程序产品、非暂时性计算机可读介质、装置和/或设备(例如,磁盘、光盘、存储器、可编程逻辑器件(PLD)),包括接收机器指令作为机器可读信号的机器可读介质。术语“机器可读信号”是指用于向可编程处理器提供机器指令和/或数据的任何信号。
本说明书中描述的过程和逻辑流程可以由一个或多个可编程处理器(也称为数据处理硬件)执行,该可编程处理器执行一个或多个计算机程序以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路(例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路))执行。适合于执行计算机程序的处理器例如包括通用和专用微处理器以及任何种类的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括或可操作地耦合以从用于存储数据的一个或多个大容量存储装置接收数据或将数据传送到用于存储数据的一个或多个大容量存储装置或两者,所述一个或多个大容量存储装置例如磁性、磁光盘或光盘。然而,计算机不需要具有这样的设备。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动盘;磁光盘;以及CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
为了提供与用户的交互,本公开的一个或多个方面可以在具有用于向用户显示信息的显示设备(例如,CRT(阴极射线管)、LCD(液晶显示器)监视器或触摸屏)和可选地用户可以通过其向计算机提供输入的键盘和指向设备(例如,鼠标或轨迹球)的计算机上实现。其他类型的设备也可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感觉反馈,例如视觉反馈、听觉反馈或触觉反馈;并且可以以任何形式接收来自用户的输入,包括声学、语音或触觉输入。另外,计算机可以通过向用户使用的设备发送文档和从该设备接收文档来与用户交互;例如,通过响应于从web浏览器接收的请求将网页发送到用户的客户端设备上的web浏览器。
已经描述了多种实施方式。然而,应当理解,在不脱离本公开的精神和范围的情况下,可以进行各种修改。因此,其他实现在所附权利要求的范围内。
Claims (28)
1.一种计算机实现的方法(200),所述方法当在数据处理硬件(144)上执行时使得所述数据处理硬件(144)执行用于递送相关查询响应的操作,所述操作包括:
从与用户(10)相关联的用户设备(110)接收请求来自数字助理服务(160)的信息或动作的执行的查询(120);
确定所述查询(120)的用户意图未解析;以及
基于确定所述查询(120)的用户意图未解析:
从搜索引擎(164)检索针对所述查询(120)的当前趋势搜索结果;
基于所述搜索结果解析所述查询(120)的用户意图;以及
基于所解析的用户意图来生成对所述查询(120)的响应(122),所述响应(122)包括:
从与所解析的用户意图相关联的特定意图垂直获得的信息;或者
履行由所述数字助理服务(160)执行的动作。
2.根据权利要求1所述的方法(200),其中,所述操作进一步包括响应于接收到所述查询(120):
对所述查询(120)执行查询解释以确定所述用户意图是否模糊;以及
当所述用户意图模糊时,确定所述查询(120)的所述用户意图是未解析的。
3.根据权利要求2所述的方法(200),其中,对所述查询(120)执行查询解释以确定所述用户意图是否模糊包括:
处理所述查询(120)以确定所述查询(120)的一个或多个可能的用户意图中的每个的相应分数;以及
当针对所述查询(120)的所述一个或多个可能的用户意图中的每个确定的所述相应分数未能满足置信度阈值时,确定所述用户意图模糊。
4.根据权利要求3所述的方法(200),其中,执行查询解释进一步包括:当针对所述查询(120)的所述一个或多个可能的用户意图中的一个的所述相应分数满足所述置信度阈值时,确定所述用户意图是明确的。
5.根据权利要求1-4中的任一项所述的方法(200),其中,基于所述搜索结果解析所述查询(120)的所述用户意图包括:
识别从所述搜索引擎(164)检索的针对所述查询(120)的当前趋势搜索结果的处于第一位置的搜索结果;
确定与处于所述第一位置的所述搜索结果相关联的搜索结果类型或实体中的至少一个;以及
基于与处于所述第一位置的所述搜索结果相关联的所述搜索结果类型或所述实体中的至少一个,解析所述用户意图。
6.根据权利要求1-5中的任一项所述的方法(200),其中,所解析的用户意图包括寻求新闻的用户意图、旅行/交通相关的用户意图、寻求音乐的用户意图、自动命令意图和寻求娱乐的用户意图中的一个。
7.根据权利要求1-6中的任一项所述的方法(200),其中,与所解析的用户意图相关联的所述特定意图垂直包括一个或多个用户偏好的信息源。
8.根据权利要求1-7中的任一项所述的方法(200),其中,所述用户设备(110)包括智能扬声器。
9.根据权利要求1-7中的任一项所述的方法(200),其中,所述用户设备(110)包括智能显示器。
10.根据权利要求1-7中的任一项所述的方法(200),其中,所述用户设备(110)包括移动计算设备。
11.根据权利要求1-10中的任一项所述的方法(200),其中,所述查询(120)包括由所述用户(10)经由在所述用户设备(110)上执行的可听用户接口(114)输入的口头查询(120)。
12.根据权利要求1-10中的任一项所述的方法(200),其中,所述查询(120)包括由所述用户(10)经由在所述用户设备(110)上执行的图形用户接口(114)输入的键入查询。
13.根据权利要求1-12中的任一项所述的方法(200),其中,所述操作进一步包括向所述用户设备(110)提供对所述查询(120)的所述响应(122),所述用户设备(110)被配置为输出所述响应(122)的音频表示或图形表示中的至少一个。
14.一种计算机实现的方法(200),所述方法当在数据处理硬件(144)上执行时使得所述数据处理硬件(144)执行用于递送相关查询响应的操作,所述操作包括:
从与用户(10)相关联的用户设备(110)接收请求来自数字助理服务(160)的信息或通过所述数字助理服务(160)的动作的执行的查询(120);
确定所述查询(120)的用户意图未解析;以及
基于确定所述查询(120)的用户意图未解析:
确定是否存在来自其他用户的请求来自所述数字助理服务(160)的信息的类似查询的最近尖峰;
当存在类似查询中的最近尖峰时,基于类似查询中的最近尖峰来解析所述查询(120)的用户意图;以及
基于所解析的用户意图来生成对所述查询(120)的响应(122),所述响应(122)包括:
从与所解析的用户意图相关联的特定意图垂直获得的信息;或者
履行由所述数字助理服务(160)执行的动作。
15.根据权利要求14所述的方法(200),其中,基于所述类似查询的最近尖峰来解析所述查询(120)的所述用户意图包括通过从来自其他用户的所述类似查询的最近尖峰中提取由阈值数量的最近查询共享的公共用户意图来解析所述用户意图。
16.一种系统(100),包括:
数据处理硬件(144);以及
与所述数据处理硬件(144)通信的存储器硬件(146),所述存储器硬件(146)存储当在所述数据处理硬件(144)上执行时使所述数据处理硬件(144)执行操作的指令,所述操作包括:
从与用户(10)相关联的用户设备(110)接收请求来自数字助理服务(160)的信息或由所述数字助理服务(160)执行动作的查询(120);
确定所述查询(120)的用户意图未解析;以及
基于确定所述查询(120)的用户意图未解析:
从搜索引擎(164)检索针对所述查询(120)的当前趋势搜索结果;
基于所述搜索结果解析所述查询(120)的用户意图;以及
基于所解析的用户意图来生成对所述查询(120)的响应(122),所述响应(122)包括:
从与所解析的用户意图相关联的特定意图垂直获得的信息;或者
履行由所述数字助理服务(160)执行的动作。
17.根据权利要求16所述的系统(100),其中,所述操作进一步包括响应于接收到所述查询(120):
对所述查询(120)执行查询解释以确定所述用户意图是否模糊;以及
当所述用户意图模糊时,确定所述查询(120)的所述用户意图是未解析的。
18.根据权利要求17所述的系统(100),其中,对所述查询(120)执行查询解释以确定所述用户意图是否模糊包括:
处理所述查询(120)以确定所述查询(120)的一个或多个可能的用户意图中的每个的相应分数;以及
当针对所述查询(120)的所述一个或多个可能的用户意图中的每个确定的所述相应分数未能满足置信度阈值时,确定所述用户意图模糊。
19.根据权利要求18所述的系统(100),其中,执行查询解释进一步包括:当针对所述查询(120)的所述一个或多个可能的用户意图中的一个的所述相应分数满足所述置信度阈值时,确定所述用户意图是明确的。
20.根据权利要求16-19中的任一项所述的系统(100),其中,基于所述搜索结果解析所述查询(120)的所述用户意图包括:
识别从所述搜索引擎(164)检索的针对所述查询(120)的当前趋势搜索结果的处于第一位置的搜索结果;
确定与处于所述第一位置的所述搜索结果相关联的搜索结果类型或实体中的至少一个;以及
基于与处于所述第一位置的所述搜索结果相关联的所述搜索结果类型或所述实体中的至少一个,解析所述用户意图。
21.根据权利要求16-20中的任一项所述的系统(100),其中,所解析的用户意图包括寻求新闻的用户意图、旅行/交通相关的用户意图、寻求音乐的用户意图、自动命令意图和寻求娱乐的用户意图中的一个。
22.根据权利要求16-21中的任一项所述的系统(100),其中,与所解析的用户意图相关联的所述特定意图垂直包括一个或多个用户偏好的信息源。
23.根据权利要求16-22中的任一项所述的系统(100),其中,所述用户设备(110)包括智能扬声器。
24.根据权利要求16-22中的任一项所述的系统(100),其中,所述用户设备(110)包括智能显示器。
25.根据权利要求16-22中的任一项所述的系统(100),其中,所述用户设备(110)包括移动计算设备。
26.根据权利要求16-25中的任一项所述的系统(100),其中,所述查询(120)包括由所述用户(10)经由在所述用户设备(110)上执行的可听用户接口(114)输入的口头查询(120)。
27.根据权利要求16-25中的任一项所述的系统(100),其中,所述查询(120)包括由所述用户(10)经由在所述用户设备(110)上执行的图形用户接口(114)输入的键入查询。
28.根据权利要求16-27中的任一项所述的系统(100),其中,所述操作进一步包括向所述用户设备(110)提供对所述查询(120)的所述响应(122),所述用户设备(110)被配置为输出所述响应(122)的音频表示或图形表示中的至少一个。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/333,074 US20220382819A1 (en) | 2021-05-28 | 2021-05-28 | Search Results Based Triggering For Understanding User Intent On Assistant |
US17/333,074 | 2021-05-28 | ||
PCT/US2022/072606 WO2022251869A1 (en) | 2021-05-28 | 2022-05-27 | Search results based triggering for understanding user intent on assistant |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117396862A true CN117396862A (zh) | 2024-01-12 |
Family
ID=82156652
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280038133.0A Pending CN117396862A (zh) | 2021-05-28 | 2022-05-27 | 用于理解对助理的用户意图的基于搜索结果的触发 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220382819A1 (zh) |
EP (1) | EP4341830A1 (zh) |
JP (1) | JP2024521189A (zh) |
KR (1) | KR20240011892A (zh) |
CN (1) | CN117396862A (zh) |
WO (1) | WO2022251869A1 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8745081B2 (en) * | 2012-03-13 | 2014-06-03 | Yahoo! Inc. | Personalization of news articles based on news sources |
US8825585B1 (en) * | 2014-03-11 | 2014-09-02 | Fmr Llc | Interpretation of natural communication |
US9967619B2 (en) * | 2014-12-01 | 2018-05-08 | Google Llc | System and method for associating search queries with remote content display |
US10467509B2 (en) * | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10762903B1 (en) * | 2017-11-07 | 2020-09-01 | Amazon Technologies, Inc. | Conversational recovery for voice user interface |
-
2021
- 2021-05-28 US US17/333,074 patent/US20220382819A1/en not_active Abandoned
-
2022
- 2022-05-27 EP EP22732883.8A patent/EP4341830A1/en active Pending
- 2022-05-27 JP JP2023573250A patent/JP2024521189A/ja active Pending
- 2022-05-27 CN CN202280038133.0A patent/CN117396862A/zh active Pending
- 2022-05-27 KR KR1020237044137A patent/KR20240011892A/ko unknown
- 2022-05-27 WO PCT/US2022/072606 patent/WO2022251869A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022251869A1 (en) | 2022-12-01 |
KR20240011892A (ko) | 2024-01-26 |
JP2024521189A (ja) | 2024-05-28 |
US20220382819A1 (en) | 2022-12-01 |
EP4341830A1 (en) | 2024-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11709829B2 (en) | Retrieving context from previous sessions | |
US20210089548A1 (en) | Predicting intent of a search for a particular context | |
US11074038B2 (en) | Using user input to adapt search results provided for presentation to the user | |
US9721018B2 (en) | System and method for displaying of most relevant vertical search results | |
WO2018149115A1 (zh) | 用于提供搜索结果的方法和装置 | |
US8521766B1 (en) | Systems and methods for providing information discovery and retrieval | |
US9336277B2 (en) | Query suggestions based on search data | |
EP3089159B1 (en) | Correcting voice recognition using selective re-speak | |
WO2018045646A1 (zh) | 基于人工智能的人机交互方法和装置 | |
US11829433B2 (en) | Contextual deep bookmarking | |
CN118740774A (zh) | 使用有作用域的搜索和对话接口的控制系统 | |
US20140201240A1 (en) | System and method to retrieve relevant multimedia content for a trending topic | |
US10453477B2 (en) | Method and computer system for performing audio search on a social networking platform | |
EP3832492A1 (en) | Method and apparatus for recommending voice packet, electronic device, and storage medium | |
US20180285444A1 (en) | Rewriting contextual queries | |
US9811592B1 (en) | Query modification based on textual resource context | |
US9916831B2 (en) | System and method for handling a spoken user request | |
CN112236765A (zh) | 基于生成的子查询的集合确定复合查询的响应内容 | |
CN110741362A (zh) | 音频查询的重叠处理的协调 | |
US20230186908A1 (en) | Specifying preferred information sources to an assistant | |
CN117396862A (zh) | 用于理解对助理的用户意图的基于搜索结果的触发 | |
US10445384B2 (en) | System and method for determining a search response to a research query | |
US20210109965A1 (en) | Method and apparatus for recommending speech packet, and storage medium | |
CN116431781A (zh) | 问答方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |