CN104572258A

CN104572258A - 用于在车载计算机系统处处理多个音频流的方法和设备

Info

Publication number: CN104572258A
Application number: CN201410551103.7A
Authority: CN
Inventors: J.L.霍尔德伦; X.赵; G.塔尔瓦
Original assignee: GM Global Technology Operations LLC
Current assignee: GM Global Technology Operations LLC
Priority date: 2013-10-18
Filing date: 2014-10-17
Publication date: 2015-04-29
Also published as: DE102014114604A1; US9286030B2; US20150110287A1; DE102014114604B4

Abstract

提供一种用于在车辆车载的计算机系统处处理多个音频流的方法。所述方法从车辆内的多个位置接收所述多个音频流；将所述多个音频流中的每个进行排序，以获得排序结果；以及根据排序结果完成与所述多个音频流中的每个有关的任务。

Description

用于在车载计算机系统处处理多个音频流的方法和设备

技术领域

本文所述的主题的实施例总体上涉及音频处理。更具体地，所述主题的实施例涉及处理在车辆车载的计算机系统处接收的多个音频流。

背景技术

许多车辆具有车载计算机系统，提供功能、信息和/或娱乐性能。这种车载计算机系统可包括配置成识别来自于用户的语音命令的语音识别特征，从而任务命令可以在不需要用户将其注意力放在计算机系统上的情况下执行。用户可以用语言表达命令，且车载计算机系统完成与所接收命令相对应的任务。这种命令可包括与免提呼叫（蓝牙）、GPS导航、收音机调谐/音量调节、互联网应用和各种媒介/娱乐性能有关的功能。

常规方法使用位于车辆驾驶员座椅附近的一个或多个麦克风，假定所有命令将来自于驾驶员，因而所有语音命令将来自于驾驶员。然而，随着车载计算机系统的性能扩展，命令可包括除了驾驶员之外的其他乘员希望启动的任务。例如，坐在车辆后座的乘员可能希望使用系统的媒介/娱乐或互联网性能，例如播放DVD或访问软件应用。在该情况下，乘员将不能使用语音识别来启动这种任务，因为没有用于接收乘员语音数据的麦克风。此外，位于驾驶员附近的麦克风通常执行音频滤波算法，以用于识别来自于驾驶员的语音数据和滤波（例如，废弃）所有其它音频数据的目的。

因此，期望给车辆乘员提供将语音命令提交给车载计算机系统以便执行的能力。此外，本发明的其它期望特征和特性从后面的详细描述和所附权利要求书结合附图以及前述技术领域和背景技术将显而易见。

发明内容

提供一种用于处理在车载计算机系统处同时接收的多个音频流的音频处理系统。所述音频处理系统包括：音频检测模块，所述音频检测模块配置成接收车辆中的多个音频流且在所述多个音频流之间进行区分，所述多个音频流中的每个都包括要由车载计算机系统执行的任务；排序模块，所述排序模块配置成确定与所接收的音频流有关的多个任务的处理顺序；以及处理模块，所述处理模块配置成根据处理顺序来处理和执行所述多个任务。

提供一种非暂态计算机可读存储介质，包括存储在其上的指令，其中，所述指令在由处理器执行时执行方法。响应于车载计算机系统处接收的音频数据，所述方法从所接收的音频数据提取多个音频流；以及确定用于在车载计算机系统处处理所述多个音频流中的每个的次序。

方案1. 一种用于在车辆车载的计算机系统处处理多个音频流的方法，所述方法包括：

从车辆内的多个位置接收所述多个音频流；

将所述多个音频流中的每个进行排序，以获得排序结果；以及

根据排序结果完成与所述多个音频流中的每个有关的任务。

方案2. 根据方案1所述的方法，还包括：

确定所述多个音频流中的每个的时间顺序；

其中，排序步骤根据所述多个音频流中的每个的时间顺序来执行。

方案3. 根据方案2所述的方法，还包括：

执行所述多个音频流中的每个的时间排列，以获得结果；

其中，确定时间顺序的步骤使用时间排列的结果来执行。

方案4. 根据方案1所述的方法，还包括：

识别与所述多个音频流有关的多个任务，其中，所述多个任务中的每个与所述多个音频流中的相应一个有关；以及

其中，排序步骤根据所述多个任务中的每个的重要性水平来执行。

方案5. 根据方案4所述的方法，其中，识别步骤使用自动语音识别算法执行。

方案6. 根据方案1所述的方法，其中：

接收步骤包括使用多个麦克风接收所述音频流中的每个，所述多个麦克风中的每个与车辆内的所述多个位置中的相应一个有关，且所述多个位置包括至少第一排和第二排；

第一排与所述多个麦克风中被调谐为一组预定的第一排乘员的第一子组有关；以及

第二排与所述多个麦克风中被调谐为一组预定的第二排乘员的第二子组有关。

方案7. 根据方案1所述的方法，还包括：

识别与所述多个音频流中的一个有关的任务，其中，所述多个音频流中的所述一个与所述多个位置中的一个有关；

产生任务的命令选项列表；以及

将命令选项列表呈现给所述多个位置中的所述一个处的乘员。

方案8. 根据方案7所述的方法，其中，命令选项列表包括与所述多个位置中的所述一个有关的多个预定任务命令。

方案9. 根据方案7所述的方法，还包括：

确定与所述多个音频流中的一个有关的任务的重要性水平；

其中，呈现步骤根据任务的重要性水平执行。

方案10. 一种用于处理在车载计算机系统处同时接收的多个音频流的音频处理系统，所述音频处理系统包括：

音频检测模块，所述音频检测模块配置成接收车辆中的多个音频流且在所述多个音频流之间进行区分，所述多个音频流中的每个都包括要由车载计算机系统执行的任务；

排序模块，所述排序模块配置成确定与所接收的音频流有关的多个任务的处理顺序；以及

处理模块，所述处理模块配置成根据处理顺序来处理和执行所述多个任务。

方案11. 根据方案10所述的音频处理系统，还包括：

时间排列模块，所述时间排列模块配置成执行所接收的多个音频流中的每个的时间排列，以确定所接收的多个音频流中的每个的时间顺序；

其中，排序模块根据所述多个音频流中的每个的时间顺序来确定处理顺序。

方案12. 根据方案10所述的音频处理系统，还包括：

语音识别模块，所述语音识别模块配置成识别所述多个音频流中的每个内包括的语音且基于所识别语音来识别与所述多个音频流中的每个有关的任务；

其中，排序模块还配置成确定任务的重要性水平且根据重要性水平来确定处理顺序。

方案13. 根据方案10所述的音频处理系统，其中，所述多个音频流中的子组在限定频率范围内。

方案14. 根据方案13所述的音频处理系统，其中，限定频率范围与车辆中的限定位置有关。

方案15. 根据方案10所述的音频处理系统，还包括：

通信模块，所述通信模块配置成将与所述多个音频流有关的音频数据传输给远程服务器；

其中，区分所述多个音频流和确定处理顺序的步骤在远程服务器处执行。

方案16. 一种非暂态计算机可读存储介质，包括存储在其上的指令，其中，所述指令在由处理器执行时执行方法，所述方法包括：

响应于车载计算机系统处接收的音频数据，

从所接收的音频数据提取多个音频流；以及

确定用于在车载计算机系统处处理所述多个音频流中的每个的次序。

方案17. 根据方案16所述的非暂态计算机可读存储介质，其中，由指令执行的方法还包括：

确定所述多个音频流中的每个的重要性水平，其中，处理所述多个音频流中的每个的次序根据重要性水平来确定。

方案18. 根据方案16所述的非暂态计算机可读存储介质，其中，由指令执行的方法还包括：

确定与所述多个音频流中的每个有关的位置，其中，处理所述多个音频流中的每个的次序根据位置来确定。

方案19. 根据方案16所述的非暂态计算机可读存储介质，其中，由指令执行的方法还包括：

确定与所述多个音频流中的每个有关的时间顺序，其中，处理所述多个音频流中的每个的次序根据时间顺序来确定。

方案20. 根据方案16所述的非暂态计算机可读存储介质，其中，由指令执行的方法还包括：

识别与所述多个音频流中的一个有关的任务，其中，所述多个音频流中的所述一个与车辆的多个位置中的一个有关；

产生任务的命令选项列表；以及

将命令选项列表呈现给车辆的所述多个位置中的所述一个处的乘员。

本发明内容被提供用来以简单的形式介绍在下文详细描述中进一步描述的构思的选择。本发明内容不旨在确认所要求保护主题的关键特征或实质特征，也不旨在用于帮助确定所要求保护主题的范围。

附图说明

当结合以下附图考虑时，可以通过参考详细描述和权利要求来获得对主题的更完全的理解，在所有附图中，相同的附图标记指代类似的元件。

图1是根据一些实施例的包括车载计算机系统的车辆的功能框图；

图2是图示根据一些实施例的用于从车辆中的限定位置接收音频数据以便处理的系统的简图；

图3是图示根据一些实施例的用于在车载计算机系统处处理多个音频流的方法的流程图；

图4是图示根据一些实施例的用于识别与每个音频流有关的任务命令的方法的流程图。

具体实施方式

以下详细描述本质上仅仅是说明性的并且不旨在限制主题的实施例或者这些实施例的应用和使用。如本文所使用的，词语“示例性”的意思是“用作示例、实例或例子”。本文作为示例性的任何实施方式不必理解为相比于其它实施方式是优选的或有利的。此外，不旨在受限于在前述技术领域、背景技术、发明内容或随后具体实施方式中所提出的任何明示或暗示的理论。

本文阐述的主题涉及用于处理在车载计算机系统处同时接收的多个音频流的方法和设备。通常，系统同时（且在一些实施例中，从车辆的不同位置）接收两个或更多音频数据流。系统识别与每个音频流有关的任务，且设定每个任务的优先级。系统然后根据其优先级处理每个任务。

现在参考附图，图1是根据一些实施例的包括车载计算机系统102的车辆100的功能框图。车载计算机系统102可以使用车辆100车载的任何数量（包括仅仅一个）的电子控制模块实施。车辆100可以是多种不同类型的机动车（轿车、货车、卡车、摩托车、运动型多功能车辆、有蓬货车等）、飞行工具（例如，飞机、直升机等）、船舶（小船、大船、快艇等）、货车、全地形车辆（雪上汽车、四轮车等）、军用车辆（Humvees（高机动性多用途轮驱载具）、坦克、卡车等）、抢险救援车（消防车、带梯卡车、警车、紧急医疗服务车和救护车等）、航天器、气垫船等中的任一种。

车载计算机系统102配置成接收和处理音频流，包括同时接收的多个音频流。车载计算机系统102可包括但不限于：处理器结构104、系统存储器106、用户接口108、音频检测模块110、通信模块112、语音识别模块114和排序模块116。车载计算机系统102的这些元件和特征可以彼此操作性地相关联，彼此联接，或以其他方式配置成在需要时彼此协作，以支持期望功能－具体地，同时接收和处理多个音频流，如本文所述。为了便于说明和清楚，这些元件和特征的各个物理、电气和逻辑联接和互连在图1中未示出。此外，应当理解的是，车载计算机系统102的实施例将包括协作以支持期望功能的其它元件、模块和特征。为了简单起见，图1仅仅图示涉及处理多个音频流的技术的某些元件，如下文更详细所述。

处理器结构104可以使用一个或多个通用处理器、内容可寻址存储器、数字信号处理器、专用集成电路、场可编程栅极阵列、任何合适的可编程逻辑装置、分立门或晶体管逻辑、分立硬件部件或设计成执行本文所述功能的任何组合来实施或执行。具体地，处理器结构104可以实现为一个或多个微处理器、控制器、微控制器或状态机。此外，处理器结构104可以实施为计算装置的组合（例如数字信号处理器和微处理器的组合）、多个微处理器、一个或多个微处理器与数字信号处理器芯结合、或任何其它这种配置。

系统存储器106可以使用适合于实施例的任何数量的装置、部件或模块实现。此外，车载计算机系统102可包括适合于特定实施例的集成在其中的系统存储器106和/或操作性地联接到其上的系统存储器106。实践中，系统存储器106可以实现为RAM存储器、闪存存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可拆卸盘、或本领域已知的任何其它形式的存储介质。在某些实施例中，系统存储器106包括硬盘，其还可以用于支持车载计算机系统102的功能。系统存储器106可以联接到处理器结构104，从而处理器结构104可以从系统存储器106读取信息且将信息写到系统存储器106。在可选方案中，系统存储器106可以集成到处理器结构104。作为示例，处理器结构104和系统存储器106可以位于适当设计的专用集成电路（ASIC）中。

用户接口108可包括允许用户与车载计算机系统102交互的各种特征或者与所述特征协作。因此，用户接口108可包括各种人机接口，例如键区、键、键盘、按钮、开关、旋钮、触摸板、操纵杆、指示装置、虚拟写字板、触摸屏、多个麦克风、或允许用户选择选项、输入信息或以其他方式控制车载计算机系统102的操作的任何装置、部件或功能。例如，用户接口108可以通过操作者操控，以手动地从用于车载计算机系统102的命令选项呈现列表选择。

音频检测模块110适当地配置成使用车辆100中的多个位置处的多个音频输入端口，例如麦克风，以检测和接收音频数据。一个或多个音频输入端口位于驾驶员座椅、前排乘员座椅、第二排车辆座椅中的各个位置、可能的第三排车辆座椅中的各个位置等等处。多个音频输入端口的定位将取决于车辆100的大小，这影响车辆座椅的数量和/或位于车辆100内的车辆座椅的排数。在某些实施例中，音频输入端口定位成接收各个车辆座椅处的音频数据，且在一些实施例中，音频输入端口定位成接收整排车辆座椅的音频数据。在示例性实施例中，两种方案的组合用于车辆100内的音频输入端口设置。

每个音频输入端口（或者音频输入端口组）配置成接收在一个位置范围或区域内可听到的音频信号，且将音频信号从一个位置传输给分配给该特定音频输入端口的专用音频流缓冲器。每个位置，不管是使用一个还是多于一个音频输入端口，将音频信号传输给用于该特定位置的一个音频流缓冲器。例如，在位于驾驶员座椅处的音频输入端口（或多个端口）处接收的音频数据将驾驶员座椅音频数据传输给驾驶员座椅音频数据缓冲器。驾驶员座椅音频数据缓冲器仅仅接收驾驶员座椅音频数据。因而，系统从车辆100中的每个位置接收各个音频流，以便处理，且每个位置与专用于该特定位置的音频流缓冲器相关联。

此外，每个音频输入端口可以基于其位置调谐以接收限定频率范围内的音频信号。例如，位于第二或第三排处的音频输入端口可以被调谐以接收更高频率，因为儿童更可能坐在第二或第三排，且儿童的声音往往处于频谱的较高端。具体地，前座音频输入端口可以配置成接收高达7 kHz的频率，而后座音频输入端口可配置成接收高达8kHz的频率。在一些实施例中，每个音频输入端口都可以经由车载计算机系统102的用户接口108通过车辆100的驾驶员或乘员调谐。

每个音频输入端口，在被调谐以接收限定频率范围内的音频信号时，技术上接收所有输入信号，但是内部音频处理算法可编程为滤波掉可应用频率范围之外的所有音频。使用位于第二排处的被调谐以接收与儿童声音有关的较高频率的音频输入端口的先前示例，成人男性声音将可能落入可应用频率范围之外，且将被滤波出第二排的音频流。该滤波作为内部软件算法的功能进行。

通信模块112适当地配置成在车载计算机系统102和一个或多个远程服务器之间传送数据。在某些实施例中，通信模块112实施为车载通信或远程信息处理系统，例如可通过OnStar®公司商业获得和销售的OnStar®模块，这是本申请的转让者（General Motors Company, 当前位于Detroit, Michigan）的子公司。在通信模块112是OnStar®模块的实施例中，内部收发器可能能够提供双向移动电话语音和数据通信，实施为码分多址（CDMA）。在一些实施例中，可以使用其它3G技术来实施通信模块112，包括但不限于：通用移动通信系统（UMTS）宽带CDMA（W-CDMA）、增强型数据速率GSM演进（EDGE）、增强型EDGE、高速分组接入（HSPA）、CDMA2000等等。在一些实施例中，可以使用4G技术来实施通信模块112，单独或者与3G技术结合，包括但不限于：增强型高速分组接入（HSPA+）、长期演进（LTE）和/或长期演进升级版（LTE-A）。如下文更详细所述，通过通信模块112传输给远程服务器的数据可包括但不限于：所接收的音频数据（独立音频流的形式或其它形式）、处理所接收的音频数据的请求等等。通过通信模块112接收的数据可包括但不限于：提取的语音数据、识别的任务命令、处理可应用任务命令的优先级顺序、以及与车载计算机系统102兼容的其它相关数据。

语音识别模块114配置成分析每个接收的音频流以确定在每个音频流内包含的语音数据。每个音频流包括语音数据，其可以转换为用于启动车载计算机系统102功能的一个或多个表达任务命令。例如，与车载计算机系统102的功能有关的用户任务通过用户大声说的叙述或任务命令来执行。包括表达任务命令和任何背景噪音的音频数据通过位于用户附近的一个或多个音频输入端口接收。每个音频输入端口滤波外来音频数据（例如，背景噪音）以识别和获取可应用语音数据。

一旦已经识别语音数据，自动语音识别（ASR）算法识别语音数据内的词语，以确定要由车载计算机系统102完成的可应用任务。语音命令可启动车载计算机系统102内的任何数量的限定任务。要由车载计算机系统102完成的具体任务可以基于任何数量的因素指定为“更可能”由具体车辆座椅和/或排车辆座椅执行，所述因素可包括：先前命令历史、所讨论位置的最可能乘员、所讨论位置可用的被限制数量的车载计算机系统性能等等。

通过ASR算法确定的可应用任务可包括多个假设，且每个假设可以按照特定假设正确的统计概率排序。例如，如果车辆驾驶员语音请求来自于艺术家A的流音乐，ASR算法识别由驾驶员说的词语，且呈现可选择选项给驾驶员，可包括艺术家A、艺术家B和艺术家C。呈现给驾驶员的所有假设在该情况下具有类似的发音姓名，且是可应用音频流的解释的可能。在某些实施例中，仅仅具有高于预定阈值的统计概率的假设呈现给驾驶员，在其它实施例中，预定数量的选项呈现给驾驶员，而与统计概率无关。此外，假设可以作为可视显示器上的用户可选择选项列表呈现给驾驶员，或者假设可以可听地呈现给驾驶员。

音频检测模块110和语音识别模块114还配置成并行地接收和分析所述多个音频流。常规系统通常仅仅接收和处理前排位置（例如，驾驶员座椅）中的音频数据，需要一次处理仅仅一个音频流。然而，在本文所述的系统中，音频检测模块110能够同时从车辆100中的多个位置接收音频数据，且语音识别模块114配置成同时分析和识别与每个音频流有关的用户表达任务命令。在具有同时处理多个音频流的该能力的车辆100中，坐在车辆100中的各个位置处的乘员可同时使用语音命令来执行由车载计算机系统102执行的任务。

排序模块116配置成设定车载计算机系统102处接收的每个音频流的优先级。每个音频流的分配优先级形成每个音频流被进一步处理的顺序。在某些实施例中，排序模块116根据其由音频检测模块110接收的时间顺序来设定每个音频流的优先级。在一些实施例中，排序模块116确定与每个音频流有关的任务命令的重要性水平，且根据所确定的重要性水平来设定每个音频流的优先级。

为了基于时间顺序来设定音频流的优先级，排序模块116执行音频流的时间排列以确定每个音频流被接收的时间顺序。通常，时间排列使用已知的时间排列算法执行，可包括但不限于：循环法（Round Robin）、先到先得（First-Come First-Served）（FCFS）、先进先出（FIFO）、时间分割等等。在此，车载计算机系统102的内部时钟用作时间排列的参考，且排序模块116确定标记每个音频流开始的时间点。每个音频流的该开始点是比较点，且是确定时间顺序的点。具有在时间上比第二音频流的开始点更早的开始点的第一音频流被确定为具有最高的优先级，且第一个被处理。

为了基于重要性水平设定音频流的优先级，与每个音频流有关的具体任务被识别，如上文关于语音识别模块114所述。排序模块116然后在系统存储器106中存储的次序表处执行查询，以确定每个识别任务的重要性水平。次序表是包含与可以由车载计算机系统102执行的每个任务有关的预定优先级信息的数据库。与最大重要性水平有关的任务被确定为具有最高优先级，且第一个被处理。与第二大重要性水平有关的任务被确定为具有最二高优先级，且第二个被处理。确定每个任务的重要性水平的该过程继续，直到所有任务已经被分配优先级，且然后每个任务被相应地处理。

次序表中存储的数据还可以在冲突的情况下使用，而与用于确定执行与所接收音频流有关的任务的优先级的正常方案无关。例如，当排序模块116根据被接收的时间顺序来排序每个音频流时，可能发生在时间上来说准确的同一时刻接收的音频流之间的冲突。在该情况下，排序模块116对与每个相应音频流有关的每个识别任务进行查询。每个识别任务的优先级水平存储在次序表中，且排序模块116获取并应用该信息。具有最高优先级的识别任务第一个完成，具有较低优先级的识别任务第二个完成。

当排序模块116根据所确定的重要性水平来设定每个音频流的优先级时，也可能发生冲突，且次序表可以用于解决这些冲突。例如，排序模块116可使用次序表确定识别任务A和识别任务B具有相同的重要性水平。在该情况下，排序模块116然后识别任务A和任务B的音频流所源于的车辆相关位置。如果与任务A有关的音频流源于驾驶员座椅且与任务B有关的音频流源前乘员座椅，那么每个位置（列举在次序表中）的优先级用于确定处理音频流的优先级。通常，车辆中的驾驶员座椅位置识别为具有最高优先级的位置，因而任务A将具有比任务B更高的处理优先级。

除了确定重要性水平的上述实施例之外，可存在其它选项：任何任务可以被指定为具有最高优先级，以在处理优先级方面“胜过”所有其它任务。这种任务可包括紧急任务，例如启动免提电话呼叫或使用车辆远程信息处理模块；依驾驶员而定的任务，例如请求导航路线；等等。在一些实施例中，该指定在设计时发生且存储在系统存储器106内的次序表中。此外，在某些实施例中，指定的高优先级任务可以通过用户使用用户接口108来选择或取消选择，从而用户可以个人配置他/她的语音响应系统以适合他/她的需要。

图2是图示用于从车辆202中的限定位置接收音频数据以便处理的系统200的实施例的简图。应当注意的是，系统200可以使用图1所示的车载计算机系统102实施。在该方面，系统200更详细地示出了车载计算机系统102的某些元件和部件。如图所示，车辆202的限定位置包括驾驶员座椅204、乘员座椅206、第二排第一座椅208、第二排第二座椅210、第三排第一座椅212和第三排第二座椅214。在该实施例中，车辆202的每个座椅将依座椅而定的音频流传输给音频流缓冲器228。例如，驾驶员座椅音频流216传输给音频流缓冲器228-A，而乘员座椅音频流218传输给音频流缓冲器228-B。音频流缓冲器228-A配置成仅仅接收来自于驾驶员座椅204的音频数据，且音频流缓冲器228-B配置成仅仅接收来自于乘员座椅206的音频数据。实现该限制音频传输的常用技术包括但不限于波束成形和/或音频预处理技术。

在所示的实施例中，每个音频流传输给独立的音频流缓冲器228，且每个音频流缓冲器228接收来自于车辆202中的一个限定位置的音频流。每个音频流缓冲器配置成积聚音频数据帧，且经由取样或其它模拟-数字转换方案来数字化音频数据。每个接收音频流然后从每个音频流缓冲器228传输以便排序230。排序230的过程在上文关于排序模块（图1中作为附图标记114示出）描述，且在此将不重复描述。在排序230之后，对每个音频流以排序230期间确定的顺序进行进一步处理232。

图3是图示在车载计算机系统处处理多个音频流的过程300的实施例的流程图。结合本文所述的过程300执行的各个任务可以通过软件、硬件、固件或其任何组合来执行。为了说明目的，过程300的描述可以涉及在上文结合图1-2所述的元件。实践中，所述过程的各部分可以通过所述系统的不同元件执行，例如系统固件、车载计算机系统内的逻辑或系统中的其它逻辑。应当理解的是，所述过程可包括任何数量的附加或可选任务，附图所示的任务不需要以所示顺序执行，且所述过程可以包含到更复杂的程序或具有本文未详细描述的附加功能的过程中。此外，附图所示的任务中的一个或多个可以从所述过程的实施例省去，只要预期总体功能保持完好无损即可。

为了便于说明和清楚，该示例假定过程300通过从车辆的限定位置接收多个音频流（步骤302）开始。当用户表达（即，大声说）由车载计算机系统执行任务的命令时，所述多个音频流中的每个从坐在车辆限定位置中的用户接收。

在某些实施例中，车辆中的限定位置可包括车辆的各个座椅，如图2所示。在一些实施例中，车辆中的限定位置可包括车辆中的具体排车辆座椅。在其它实施例中，限定位置可包括车辆的“前部”或“后部”的指定，其中，车辆前部指的是包括驾驶员座椅的那一排，车辆后部指的是车辆中除了包括驾驶员座椅的那一排之外的任何位置。某些示例性实施例可包括用于限定车辆位置的前述方案中的任一个和/或全部的组合。

一旦已经接收所述多个音频流（步骤302），过程300识别与每个音频流有关的任务（步骤304）。识别任务对应于车载计算机系统的功能，且通常，用户已经大声说命令，以便用于指令车载计算机系统执行任务的目的。如前文所述，任务可包括车载计算机系统能够进行的任何功能，包括但不限于：免提呼叫和相关任务、娱乐功能（例如，播放CD或DVD）、控制车载收音机、媒介/娱乐功能、互联网访问、车辆远程信息处理系统性能（例如，OnStar®功能）等等。

在某些实施例中，单个任务基于用户的表达语音来识别。在其它实施例中，多个可能任务可基于表达语音来识别。识别多于一个可能任务的该步骤在图4中更详细描述。

在识别与每个音频流有关的任务（步骤304）之后，过程300排序每个识别任务（步骤306）以确定处理所有识别任务的顺序。例如，当接收音频流A和音频流B时，车载计算机系统识别任务A（通过分析音频流A识别）和任务B（通过分析音频流B识别）。任务A和任务B然后以确定的处理顺序放置，或者换句话说，每个任务分配处理优先级。

任务的优先级可以根据相关音频流被接收的相同时间顺序或者根据任务本身的预定重要性水平来分配。在某些实施例中，每个任务的重要性水平可对应于具有不同重要性程度的标尺上的点，其中，标尺以最不重要的点开始且以最重要的点结束。在一些实施例中，重要性水平可包括作为高优先级任务或低优先级任务的简单指定。在一些实施例中，可以实施前述优先级分配的组合。在另外的实施例中，某些任务可以指定为具有“最高”优先级，表示该任务将在任何其它任务之前处理。通常，指定为“最高”优先级的任务包括紧急任务、依驾驶员而定的任务等等。

在已经排序每个任务（步骤306）之后，过程300开始根据其分配的优先级完成每个任务（步骤308）。虽然在车载计算机系统处接收多个音频流，但是过程300可在车载计算机系统处或者在远程服务器处开始进一步处理。更具体地，识别与每个音频流有关的任务（步骤304）和排序每个识别任务（步骤306）的步骤可以在远程服务器处执行，且结果传送回到车载计算机系统，以完成识别任务。

图4是图示识别与每个音频流（图3中作为附图标记304示出）有关的任务命令的过程400的实施例的流程图。过程400通过滤波所接收的音频数据以提取语音数据（步骤402）开始。通常，任何接收的音频数据是独立音频流的形式，每个音频流从车辆中的限定位置传输。（该构思参考图2图示和描述，且在此将不再重复描述。）音频流包括语音数据和可能的外来背景噪音；外来背景噪音使用熟知的技术滤波，包括波束成形技术和音频预处理技术。

接下来，过程400识别语音数据中存在的词语（步骤404）。过程400启动自动语音识别（ASR）算法以识别在麦克风或用于接收音频数据的其它语音检测装置的位置中由用户表达的语音。过程400可启动多个线程来执行每个接收音频流的语音识别且存储结果。

一旦已经识别语音数据中存在的词语（步骤404），过程400就基于所识别的词语（例如，步骤404中存储的结果）和音频数据的位置来确定一组可能的假设任务（步骤406）。车辆中的每个位置与可由该位置的乘员启动以由车载计算机系统完成的一组任务有关。例如，可能与前排或驾驶员座椅位置有关的任务可包括请求来自于车载计算机系统的导航路线。与后座乘员有关的可能任务可包括流线化蓝牙音频或选择DVD节段以便查看。基于音频数据的位置的该组可能任务基于在所讨论的位置中具有功能的一组限制任务。

此外，该组可能任务通过语音数据中的识别词语和在这些词语与和车载计算机系统有关的可能命令对比时的统计上可能的选项来影响。例如，如果用户请求车载计算机系统播放艺术家John Doe的流音频，那么系统可识别与播放艺术家John Doe的流音频、播放艺术家Jack Doe的流音频和播放艺术家John Toe的流音频有关的任务。基于语音数据中的识别词语，每个假设或选项与它是正确选项的统计概率有关。每个选项的统计概率确定哪些选项呈现给用户。使用先前示例，识别词语表示播放艺术家Jack Doe的流音频的统计概率将比识别词语表示播放艺术家John Doe的流音频的统计概率低很多。当统计概率低于预定阈值时，该选项不呈现给用户。

在基于识别词语和音频数据的位置确定该组可能任务（步骤406）之后，过程400将该组可能任务呈现给用户（步骤408），作为可选择的命令选项。在某些实施例中，可选择的命令选项的可视表示经由用户接口（图1中的附图标记108）呈现。在一些实施例中，可选择的命令选项使用可听语音技术呈现，例如语音合成或文本-语音技术。呈现可选择的命令选项的选项可由用户配置。

在多个音频流同时处理的情况下，每个音频流将基于该音频流所源于的位置且基于由该位置中的乘员表达的词语具有其自己的一组可能任务。在某些实施例中，每组命令选项根据音频流第一次接收的时间顺序呈现给每个对应乘员。在其它实施例中，每组命令选项根据与由乘员请求的任务有关的重要性水平呈现给每个对应乘员。

例如，乘员A可坐在驾驶员座椅中且乘员B可坐在同一车辆的后座中。乘员A开始表达车载计算机系统的语音命令以产生有助于他驾驶的导航路线。当乘员A仍在说话时，乘员B开始表达播放特定无线电台的语音命令。在该示例中，源于驾驶员座椅的音频流（乘员A对导航路线的请求）将在任何选项将呈现给乘员B之前可能产生要呈现给乘员A以供选择的一组可能任务。乘员A在乘员B之前表达他的请求且如果过程400基于时间顺序排序请求，那么乘员A将第一个呈现有可选择选项。如果过程400基于重要性水平排序请求，在该情况下两个因素将可应用：首先，导航路线的请求可具有比娱乐功能（例如播放无线电台）更高的优先级；第二，乘员A处于驾驶员座椅中而乘员B处于后座中，且依驾驶员而定的任务可具有比与车辆中的其它位置有关的任务更高的优先级。

接下来，过程400接收用户输入以确定可应用任务命令（步骤410）。用户可以通过按压按钮、经由触摸屏致动选择、转动旋钮或可由车载计算机系统识别的表示选择的其它物理动作来提供输入。在某些实施例中，用户可以语音地确认选择，过程400将重复接收音频流、识别音频流中的词语以及相应地进行的过程。

在本文可以按照功能和/或逻辑块部件并且参照可由各种计算部件或装置执行的操作、处理任务和功能的符号表示来描述技术和工艺。这种操作、任务和功能有时称为计算机执行的、计算机化的、软件实施的或者计算机实施的。实践中，一个或多个处理器装置可以通过操控表示系统存储器中的存储器位置处的数据位的电信号以及信号的其它处理来实现所述操作、任务和功能。数据位被保持的存储器位置是具有与数据位相对应的特定电、磁性、光学或组织属性的物理位置。应当理解的是，在图中示出的各种块部件可以由构造成执行具体功能的任意数量的硬件、软件和/或固件部件来实现。例如，系统或部件的实施例可以采用各种集成电路部件，例如存储器元件、数字信号处理元件、逻辑元件、查询表等，其可以在一个或更多微处理器或其它控制装置的控制下执行多种功能。

虽然已经在前文详细描述中呈现了至少一个示例性实施例，但是应当认识到存在大量变型。还应当认识到，本文描述的示例性实施例或多个实施例绝不旨在限制所要求保护主题的范围、可应用性或构造。相反，前文的详细描述将为本领域技术人员提供用于实施所述实施例或多个实施例的便利途径。应当理解，在不偏离由权利要求限定的范围的情况下可以对元件的功能和设置做出各种改变，其包括在提交本专利申请时的已知等价物和可预见的等价物。

Claims

1.一种用于在车辆车载的计算机系统处处理多个音频流的方法，所述方法包括：

从车辆内的多个位置接收所述多个音频流；

根据排序结果完成与所述多个音频流中的每个有关的任务。

2.根据权利要求1所述的方法，还包括：

确定所述多个音频流中的每个的时间顺序；

3.根据权利要求2所述的方法，还包括：

执行所述多个音频流中的每个的时间排列，以获得结果；

其中，确定时间顺序的步骤使用时间排列的结果来执行。

4.根据权利要求1所述的方法，还包括：

5.根据权利要求4所述的方法，其中，识别步骤使用自动语音识别算法执行。

6.根据权利要求1所述的方法，其中：

7.根据权利要求1所述的方法，还包括：

产生任务的命令选项列表；以及

8.根据权利要求7所述的方法，其中，命令选项列表包括与所述多个位置中的所述一个有关的多个预定任务命令。

9.一种用于处理在车载计算机系统处同时接收的多个音频流的音频处理系统，所述音频处理系统包括：

10.一种非暂态计算机可读存储介质，包括存储在其上的指令，其中，所述指令在由处理器执行时执行方法，所述方法包括：

响应于车载计算机系统处接收的音频数据，

从所接收的音频数据提取多个音频流；以及