CN102737096A

CN102737096A - 基于位置的会话理解

Info

Publication number: CN102737096A
Application number: CN2012100874209A
Authority: CN
Inventors: L·P·赫克; M·金达昆塔; D·米特比; L·施蒂费尔曼
Original assignee: Microsoft Corp
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2011-03-31
Filing date: 2012-03-29
Publication date: 2012-10-17
Anticipated expiration: 2032-03-29
Also published as: CN102737104B; EP2691876A2; CN102737099B; KR101922744B1; JP2017123187A; WO2012135791A2; JP6305588B2; WO2012135783A2; KR20140025361A; WO2012135210A3; JP6105552B2; WO2012135218A3; EP2691885A4; CN106383866B; CN102750271A; CN102750271B; CN102750311A; EP2691885A1; EP2691876A4; KR20140025362A

Abstract

可以提供基于位置的会话理解。当从用户接收到查询时，可以生成与该查询相关联的环境上下文。可以根据该环境上下文来解释该查询。可以执行经解释的查询，并且将与所述查询相关联的至少一个结果提供给用户。

Description

基于位置的会话理解

技术领域

本申请涉及环境上下文，特别是基于位置的会话理解。

背景技术

基于位置的会话理解可以提供一种利用环境上下文来改进查询执行和结果的机制。传统的语音识别程序不具有利用从一个用户到另一个用户的信息(例如语音发言、地理数据、某些位置的声学环境、从特定位置做出的典型查询)来改进来自新的和/或现有用户的新的查询的质量和准确度的技术。在一些情况中，必须在没有采用类似的、潜在相关的查询来帮助理解的这样的益处的情况下来做出语音到文本的转换。

语音到文本转换(即语音识别)可包括将讲出的短语转换成可由计算系统处理的文本短语。可在现代的基于统计数据的语音识别算法中使用声学建模和/或语言建模。在很多常规的系统中广泛地使用隐马尔可夫模型(HMM)。HMM可包括可输出符号或数量的序列的统计数据模型。HMM可用于语音识别，因为语音信号可被视为分段平稳信号或短时平稳信号。在短时间(例如10毫秒)中，语音可被近似为平稳过程。因此出于很多随机的目的，语音可被认为是马尔可夫模型。

发明内容

提供本发明内容以便以简化形式介绍将在以下具体实施方式中进一步描述的一些概念。此发明内容不旨在标识所要求保护的主题的关键特征或必要特征。本发明内容也不旨在用于限制所要求保护的主题的范围。

以上概括描述和以下详细描述两者都提供了示例，并且只是说明性的。因此，以上概括描述和以下详细描述不应当被认为是限制性的。此外，除了本文中所阐述的那些特征或变体以外，还可以提供其他特征或变体。例如，实施例可涉及具体实施方式中所描述的各种特征组合和子组合。

附图说明

合并在本公开中并构成其一部分的附图示出本发明的实施例。在附图中：

图1是操作环境的框图；

图2是用于提供基于位置的会话理解的方法的流程图；以及

图3是包括计算设备的系统的框图。

具体实施方式

以下详细描述参考各个附图。只要可能，就在附图和以下描述中使用相同的附图标记来指示相同或相似的元件。尽管可能描述了本发明的实施例，但修改、改编、以及其他实现是可能的。例如，可对附图中所示的元件进行置换、添加、或修改，并且可通过对所公开的方法置换、重新排序、或添加阶段来修改本文中所描述的方法。因此，以下详细描述并不限制本发明。相反，本发明的正确范围由所附权利要求书定义。

可以提供基于位置的会话理解。例如，可以提供一种语音到文本的系统，该系统将来自多个用户的信息相互关联以便改进会话的准确度以及经转换的语句中所包括的查询的结果。根据本发明的实施例，个人助理程序可以从多个位置处的用户接收基于语音的查询。可以对每个查询分析声学和/或环境特性，并且可以将这样的特性存储起来并与从其接收该查询的位置相关联。例如，从地铁站处的用户接收到的查询可以检测离开瓷砖墙的声学回声和/或人群或地铁列车的背景环境声音的存在。随后，可知道这些特性在将来被用于过滤出来自该位置的查询，以允许这些查询的转换更加准确。根据本发明的实施例，可以例如通过用户的全球定位系统(GPS)的位置、与用户相关联的区域代码、与用户相关联的邮政编码和/或用户在地标(例如火车站、体育场、博物馆、办公楼等)的接近度来定义位置。

处理该查询可以包括根据声学模型来改写查询。例如，该声学模型可以包括在特定位置处公知存在的背景声音。应用声学模型可以允许通过忽略不相关的声音来更加准确地转换查询。声学模型还允许对与该查询相关联的任何结果的显示进行改变。例如，在特定的嘈杂环境中，可以在屏幕上而不是通过音频来显示结果。环境上下文还可以与理解模型相关联以帮助语音到文本的转换。例如，理解模型可以包括隐马尔可夫模型(HMM)。环境上下文还可以与语义模型相关联以帮助执行查询。例如，语义模型可以包括本体论(ontology)。本体论在相关的申请S/N___/___，___，在2011年_____日申请，并且名为“查询、会话和搜索的个性化”，通过引用整体结合于此。

而且，所述查询的主题可以被用于改进将来的查询的结果。例如，如果在地铁站的用户查询“何时有下一班？”，个人助理程序可以通过几个查询的过程来确定该用户想要知道何时下一班列车将到达。这可以通过要求对来自第一用户的查询进行分类并存储该分类以在将来使用来完成。在另一个示例，如果一个用户查询“何时有下一班？”，而另一个用户查询“何时有下一班列车？”，则程序可以将这些查询相关联，并做出这两个用户都在请求相同的信息的假设。

图1是用于提供基于位置的会话理解的操作环境100的框图。操作环境100可以包括口述对话系统(SDS)110，该系统包括个人助理程序112、语音到文本转换器114以及上下文数据库116。个人助理程序112可以通过网络120从位于第一位置140处的第一多个用户130(A)-(C)以及位于第二位置160处的第二多个用户150(A)-(C)接收查询。上下文数据库116可以操作用于存储与从例如第一多个用户130(A)-(C)和/或第二多个用户150(A)-(C)之类的用户处所接收的查询相关联的上下文数据。上下文数据可以包括声学和/或环境特性以及查询上下文信息，例如查询主题、查询的时间/日期、用户细节和/或从其做出查询的位置。根据本发明的实施例，网络120可包括，例如，私人数据网络(例如以太网)、蜂窝数据网络和/或诸如因特网的公共网络。

代理可以与口述对话系统(SDS)相关联。这样的系统允许人们通过他们的声音与计算机交互。驱动该SDS的主组件可以包括对话管理器：该组件管理与用户的基于对话的会话。对话管理器可通过多个输入源的组合来确定用户的意图，诸如语音识别和自然语言理解组件输出、来自先前对话轮次的上下文、用户上下文、和/或从知识库(例如搜索引擎)返回的结果。在确定意图后，对话管理器可采取动作，诸如向用户显示最终结果和/或继续与用户的对话以满足他们的意图。口述对话系统可以包括多个会话理解模型，例如与位置相关联的声学模型和/或用于处理基于语音的输入的语音语言理解模型。

图2是阐明与本发明用于提供基于位置的会话理解的实施例相一致的方法200中涉及的各一般阶段的流程图。方法200可使用计算设备300来实现，这将在下面参考图3予以更详细描述。在下文中将更详细地描述实现方法200的各阶段的方式。方法200可开始于起始框205并继续至阶段210，在那里计算设备300可接收来自一位置处的用户的基于语音的查询。例如，用户130(A)可以通过诸如蜂窝电话之类的设备向SDS 110发送查询。

方法200可从阶段210前进至阶段215，其中计算设备300可确定与该位置相关联的环境上下文是否存在于存储器存储中。例如，SDS 110可以标识从其处接收到查询的位置(例如第一位置140)并确定与该位置相关联的环境上下文是否存在于上下文数据库116中。

如果不存在与该位置相关联的上下文，则方法200前进到阶段220，在那，计算设备300可以标识基于语音的查询中的至少一个声学干扰。例如，SDS 110可以分析该查询的音频，并标识诸如与用户130(A)周围的大量人群和/或经过的列车相关联的背景噪声。

随后，方法200前进到阶段225，在那，计算设备300可以标识与基于语音的查询相关联的至少一个主题。例如，如果该查询包括“何时下一班到达？”，则当该用户处于火车站时，SDS 110可以标识列车时刻表作为该查询的主题。

随后，方法200可以前进到阶段230，在那，计算设备300可以创建与该位置相关联的新的环境上下文以存储在存储器存储中。例如，SDS 110可以将所标识的声学干扰以及查询主题以与用户位置相关联的形式存储在上下文数据库116中。

如果与该位置相关联的上下文存在，方法200可以前进到阶段235，在那计算设备300可以加载与该位置相关联的环境上下文。例如，SDS 110可以如上所述从上下文数据库116加载环境上下文。

在阶段240处创建了上下文或在阶段235处加载了上下文之后，方法200随后可以前进到阶段240，在那，计算设备300可以根据环境上下文将基于语音的查询转换为基于文本的查询。例如，SDS 110可以通过应用过滤器以移除与环境上下文相关联的至少一个声学干扰来将基于语音的查询转换为基于文本的查询。

方法200随后可以前进到阶段245，在那，计算设备300可以根据环境上下文执行基于文本的查询。例如，SDS 110可以在搜索域(例如列车时刻表)内执行与至少一个主题相关联的查询(例如“何时下一班到达？”)，该主题与环境上下文相关联。

随后，方法200前进到阶段250，在那，计算设备300可以将所执行的基于文本的查询的至少一个结果提供给用户。例如，SDS 110可以将结果传送给与用户130(A)相关联的设备(例如蜂窝电话)以供显示。方法200然后可在阶段255结束。

根据本发明的实施例可包括用于提供基于位置的会话理解的系统。该系统可包括存储器存储、以及耦合到该存储器存储的处理单元。处理单元操作上可用于接收来自用户的查询，生成与查询相关联的环境上下文，根据环境上下文解释该查询，执行所解释的查询以及将查询的至少一个结果提供给用户。查询可以包括，例如，处理单元操作上可以转换成计算机可读的文本的语音查询。根据本发明的实施例，语音到文本的转换可以利用隐马尔可夫模型算法，该算法包括用于各种与理解模型相关联的最可能的词语的统计权重和/或与语义模型相关联的语义概念。处理单元操作上可用于例如根据从该位置接收的至少一个先前的查询来增加至少一个预期的词语的统计权重，并将该统计权重存储作为环境上下文的一部分。

环境上下文可以包括与从其处接收查询的位置相关联的声学模型。处理单元操作上可根据至少一个背景声音来改写查询，所述背景声音基于声学模型得自基于语音的查询。例如，可以知道背景声音(例如列车汽笛)存在于从给定位置(例如火车站)接收的语音查询中。可以对背景声音进行检测和测量以查找音调、振幅以及其它声学特性。可以将查询改写为忽略这样的声音，并且，可以计算并存储所述声音以应用于来自该位置的将来的查询。处理单元在操作上还可以从第二用户接收第二基于语音的查询，并且根据经更新的声学模型来改写该查询以得到相同的背景声音。处理单元在操作上还可以聚集与来自多个用户的多个查询相关联的环境上下文并存储与该位置相关联的所聚集的环境上下文。

根据本发明的实施例可包括用于提供基于位置的会话理解的系统。该系统可包括存储器存储、以及耦合到该存储器存储的处理单元。处理单元操作上可从一个位置处的用户接收基于语音的查询，加载与该位置相关联的环境上下文，根据环境上下文将基于语音的查询转换为文本，根据环境上下文执行经转换的查询并将与所执行的查询相关联的至少一个结果提供给用户。环境上下文可以包括，例如，至少一个先前查询的时间、至少一个先前查询的日期、至少一个先前查询的主题、包括本体论的语义模型、理解模型以及该位置的声学模型。处理单元操作上可以根据与该位置相关联的已知声学干扰来改写查询。处理单元在操作上还可以存储多个环境上下文，所述环境上下文与根据从多个用户接收的多个查询所聚集的多个位置相关联。处理单元还可用于从用户接收对经转换的文本的校正并根据所述校正更新环境上下文。处理单元操作上还可从第二位置处的用户接收第二基于语音的查询，加载与该第二位置相关联的第二环境上下文，根据第二环境上下文将第二基于语音的查询转换为文本，根据第二环境上下文执行经转换的查询并将与所执行的查询相关联的至少一个第二结果提供给用户。

根据本发明的又一实施例可包括用于提供知晓上下文的环境的系统。该系统可包括存储器存储、以及耦合到该存储器存储的处理单元。处理单元操作上可以从一位置处的用户接收基于语音的查询并确定与该位置相关联的环境上下文是否存在于存储器存储中。响应于确定不存在环境上下文，处理单元操作上可以标识基于语音的查询中的至少一个声学干扰，标识与基于语音的查询相关联的至少一个主题并创建与该位置相关联的新的环境上下文以供存储在存储器存储中。响应于确定存在环境上下文，处理器单元操作上可以加载该环境上下文。处理单元随后在操作上可以根据环境上下文将基于语音的查询转换为基于文本的查询，其中，在操作上根据环境上下文将基于语音的查询转换为基于文本的查询包括在操作上应用过滤器以移除与环境上下文相关联的至少一个声学干扰，根据环境上下文执行基于文本的查询，其中在操作上根据环境上下文执行基于文本的查询包括在操作上执行查询，其中至少一个声学干扰与声学模型相关联，并且其中至少一个所标识的主题与语义模型相关联，所述语义模型与环境上下文相关联，并且将所执行的基于文本的查询的至少一个结果提供给用户。

图3是包括计算设备300的系统的框图。按照本发明的一实施例，上述存储器存储和处理单元可在诸如图3的计算设备300之类的计算设备中实现。可使用硬件、软件或固件的任何合适的组合来实现存储器存储和处理单元。例如，存储器存储和处理单元可用计算设备300或结合计算设备300的其他计算设备318中的任一个来实现。根据本发明的实施例，上述系统、设备和处理器是示例，而其他系统、设备和处理器可包括上述存储器存储和处理单元。此外，计算设备300可包括用于如上所述的系统100的操作环境。系统100可在其他环境中操作，并且不限于计算设备300。

参考图3，根据本发明的一实施例的系统可包括计算设备，诸如计算设备300。在基本配置中，计算设备300可包括至少一个处理单元302和系统存储器304。取决于计算设备的配置和类型，系统存储器304可包括，但不限于，易失性存储器(例如，随机存取存储器(RAM))、非易失性存储器(例如，只读存储器(ROM))、闪存、或任何组合。系统存储器304可以包括操作系统305、一个或多个编程模块306，且可以包括个人助理程序112。例如，操作系统305可适用于控制计算设备300的操作。此外，本发明的实施例可结合图形库、其他操作系统、或任何其他应用程序来实践，并且不限于任何特定应用或系统。该基本配置在图3中由虚线308内的那些组件示出。

计算设备300可具有附加特征或功能。例如，计算设备300还可包括附加数据存储设备(可移动和/或不可移动)，诸如例如，磁盘、光盘、或磁带。这些附加存储在图3中由可移动存储309和不可移动存储310示出。计算机存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块、或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。系统存储器304、可移动存储309和不可移动存储310都是计算机存储介质(即，存储器存储)的示例。计算机存储介质可包括，但不限于，RAM、ROM、电可擦除只读存储器(EEPROM)、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光存储、磁带盒、磁带、磁盘存储或其他磁性存储设备、或者可用于存储信息且可由计算设备300访问的任何其他介质。任何此类计算机存储介质可以是设备300的一部分。计算设备300还可以具有输入设备312，如键盘、鼠标、笔、声音输入设备、触摸输入设备等。还可包括诸如显示器、扬声器、打印机等输出设备314。上述设备是示例，并且可使用其他设备。

计算设备300还可包含可允许设备300诸如通过分布式计算环境中的网络(例如，内联网或因特网)来与其他计算设备318进行通信的通信连接316。通信连接316是通信介质的一个示例。通信介质通常由诸如载波或其他传输机制之类的已调制数据信号中的计算机可读指令、数据结构、程序模块、或其他数据来体现，并且包括任何信息传送介质。术语“已调制数据信号”可以描述以对该信号中的信息进行编码的方式设定或者改变其一个或多个特征的信号。作为示例而非限制，通信介质包括诸如有线网络或直接线连接等有线介质，以及诸如声学、射频(RF)、红外线和其他无线介质等无线介质。如此处所使用的术语“计算机可读介质”可包括存储介质和通信介质两者。

如上所述，可在系统存储器304中存储包括操作系统305在内的多个程序模块和数据文件。当在处理单元302上执行时，编程模块306(例如，个人助理程序112)可执行各过程，包括例如，如上所述的方法200的各阶段中的一个或多个。上述过程是一个示例，且处理单元302可执行其他过程。根据本发明的实施例可使用的其他编程模块可包括电子邮件和联系人应用、文字处理应用、电子表格应用、数据库应用、幻灯片演示应用、绘图或计算机辅助应用程序等。

一般而言，根据本发明的实施例，程序模块可包括可执行特定任务或可实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。此外，本发明的实施例可用其他计算机系统配置来实践，包括手持式设备、多处理器系统、基于微处理器的系统或可编程消费电子产品、小型机、大型计算机等。本发明的实施例还可在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实践。在分布式计算环境中，程序模块可位于本地和远程存储器存储设备两者中。

此外，本发明的实施例可在包括分立电子元件的电路、包含逻辑门的封装或集成电子芯片、利用微处理器的电路、或在包含电子元件或微处理器的单个芯片上实践。本发明的实施例还可使用能够执行诸如例如，AND(与)、OR(或)和NOT(非)的逻辑运算的其他技术来实践，包括但不限于，机械、光学、流体和量子技术。另外，本发明的实施例可在通用计算机或任何其他电路或系统中实践。

例如，本发明的实施例可被实现为计算机过程(方法)、计算系统、或诸如计算机程序产品或计算机可读介质之类的制品。计算机程序产品可以是计算机系统可读并对用于执行计算机过程的指令的计算机程序编码的计算机存储介质。计算机程序产品还可以是计算系统可读并对用于执行计算机过程的指令的计算机程序编码的载体上的传播信号。因此，本发明可以硬件和/或软件(包括固件、常驻软件、微码等)来体现。换言之，本发明的实施例可采用其上包含有供指令执行系统使用或结合其使用的计算机可使用或计算机可读程序代码的计算机可使用或计算机可读存储介质上的计算机程序产品的形式。计算机可使用或计算机可读介质可以是可包含、存储、通信、传播、或传输程序以供指令执行系统、装置或设备使用或结合其使用的任何介质。

计算机可使用或计算机可读介质例如可以是、但不限于电、磁、光、电磁、红外、或半导体系统、装置、设备或传播介质。更具体的计算机可读介质示例(非穷尽列表)，计算机可读介质可包括以下：具有一条或多条导线的电连接、便携式计算机盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤、以及便携式压缩盘只读存储器(CD-ROM)。注意，计算机可使用或计算机可读介质甚至可以是其上打印有程序的纸张或另一合适的介质，因为程序可经由例如对纸张或其他介质的光学扫描而电子地捕获，随后如有必要被编译、解释、或以其他合适的方式处理，并且随后存储在计算机存储器中。

以上参考例如根据本发明的实施例的方法、系统和计算机程序产品的框图和/或操作示图描述了本发明的实施例。框中所注明的各功能/动作可按不同于任何流程图所示的次序出现。例如，取决于所涉及的功能/动作，连续示出的两个框实际上可基本同时执行，或者这些框有时可按相反的次序执行。

尽管已描述了本发明的特定实施例，但也可能存在其他实施例。此外，虽然本发明的实施例被描述为与存储在存储器和其他存储介质中的数据相关联，但是数据还可被存储在其他类型的计算机可读介质上或从其读取，诸如辅助存储设备(像硬盘、软盘、或CD-ROM)、来自因特网的载波、或其他形式的RAM或ROM。此外，所公开的方法的各步骤可以任何方式修改，包括通过对各步骤重新排序和/或插入或删除步骤，而不背离本发明。

包括此处所包括的代码中的版权在内的所有权利都归属于申请人并且是本申请人的财产。本申请人保持并保留此处所包括的代码中的所有权利，并且授予仅关于所授权专利的再现且未出于其他目的再现该材料的许可。

尽管本说明书包括示例，但本发明的范围由所附权利要求书来指示。此外，尽管用对结构特征和/或方法动作专用的语言描述了本说明书，但权利要求书并不限于以上所描述的特征或动作。相反，以上所描述的特定特征和动作是作为本发明的实施例的示例来公开的。

Claims

1.一种用于提供基于位置的会话理解的方法(200)，所述方法(200)包括：

从用户(130(A)-(C)、150(A)-(C))接收(210)查询；

生成(220，225，230)与所述查询相关联的环境上下文；

根据所述环境上下文来解释(240)所述查询；

执行(245)经解释的查询；以及

将所述查询的至少一个结果提供(250)给所述用户(130(A)-(C)、150(A)-(C))。

2.如权利要求1所述的方法(200)，其特征在于，解释(240)所述查询包括：根据从所述位置(140、160)处接收的至少一个先前的查询来改写至少一个会话理解模型，并且其中所述至少一个会话理解模型包括与从其处接收所述查询的位置(140、160)相关联的声学模型。

3.如权利要求2所述的方法(200)，其特征在于，解释(240)所述查询还包括：根据至少一个背景声音来改写所述查询，根据所述声学模型将所述背景声音与所述查询相关联，并且其中，在所述查询中测量所述背景声音。

4.如权利要求3所述的方法(200)，其特征在于，还包括将所述背景声音作为与所述位置相关联的声学特性来存储。

5.如权利要求1所述的方法(200)，其特征在于，还包括：

聚集与来自多个用户(130(A)-(C)、150(A)-(C))的多个查询相关联的环境上下文；

存储与所述位置相关联的经聚集的环境上下文；

从第二用户(130(A)-(C)，150(A)-(C))接收(210)第二基于语音的查询；以及

根据经聚集的环境上下文来解释(240)所述第二基于语音的查询。

6.如权利要求5所述的方法(200)，其特征在于，其中，解释(240)所述查询包括：根据与从所述位置接收的查询相关联的经聚集的环境上下文来增加至少一个预期语义概念的统计权重。

7.一种存储一组指令的计算机可读介质，所述一组指令在被执行时执行一种用于提供基于位置的会话理解的方法(200)，由所述一组指令执行的方法(200)包括：

从一位置处的用户(130(A)-(C)、150(A)-(C))接收(210)基于语音的查询；

加载(235)与所述位置相关联的环境上下文；

根据所述环境上下文将所述基于语音的查询转换(240)为文本；

根据所述环境上下文来执行(245)经转换的查询；

将与所执行的查询相关联的至少一个结果提供(250)给所述用户(130(A)-(C)、150(A)-(C))。

8.如权利要求7所述的计算机可读介质，其特征在于，还包括：

从所述用户(130(A)-(C)、150(A)-(C))接收对经转换的文本的校正；以及

根据所述校正来更新所述环境上下文，其中更新所述环境上下文包括修改与所述校正的至少一个词语相关联的概率以应用于将来的查询。

9.如权利要求7所述的计算机可读介质，其特征在于，还包括：

从第二位置处的用户(130(A)-(C)、150(A)-(C))接收(210)第二基于语音的查询；

加载(235)与所述第二位置相关联的第二环境上下文；

根据所述第二环境上下文将所述第二基于语音的查询转换(240)为文本；

根据所述第二环境上下文来执行(245)经转换的查询；

将与所执行的查询相关联的至少一个第二结果提供(250)给所述用户(130(A)-(C)、150(A)-(C))。

10.一种用于提供基于位置的会话理解的系统，所述系统包括：

存储器存储(304)；以及

耦合到所述存储器存储(304)的处理单元(302)，其中所述处理单元(302)可用于：

从一位置处的用户(130(A)-(C)、150(A)-(C))接收(210)基于语音的查询，

确定(215)与所述位置(140、160)相关联的环境上下文是否存在于所述存储器存储中，

响应于确定(215)不存在所述环境上下文：

标识(220)所述基于语音的查询中的至少一个声学干扰；

标识(225)与所述基于语音的查询相关联的至少一个主题；以及

创建(230)与所述位置(140、160)相关联的新的环境上下文以存储在所述存储器存储中，其中，所述至少一个声学干扰与声学模型相关联，并且其中，所述至少一个所标识的主题与语义模型相关联，

响应于确定(215)存在所述环境上下文，加载(235)所述环境上下文，

根据所述环境上下文将所述基于语音的查询转换(240)为基于文本的查询，其中，在操作上根据所述环境上下文将所述基于语音的查询转换为基于文本的查询包括在操作上根据与所述环境上下文相关联的至少一个声学干扰来改写所述查询，

根据所述环境上下文执行(245)基于文本的查询，其中，在操作上根据所述环境上下文执行基于文本的查询包括在操作上根据与所述环境上下文相关联的所述语义模型来执行所述查询，以及

将所执行的基于文本的查询的至少一个结果提供(250)给所述用户(130(A)-(C)、150(A)-(C))。