CN101313482A

CN101313482A - 确定音频设备的质量

Info

Publication number: CN101313482A
Application number: CNA2006800431557A
Authority: CN
Inventors: A·W·卡兰茨; W·L·隆尼
Original assignee: Microsoft Corp
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2005-11-17
Filing date: 2006-10-30
Publication date: 2008-11-26
Anticipated expiration: 2026-10-30
Also published as: KR20080077085A; EP1913708A1; EP1913708B1; JP5053285B2; CN101313482B; US20070112563A1; WO2007061584A1; EP1913708A4; JP2009518662A; ES2421927T3

Abstract

确定计算机系统中的特定音频设备配置的质量。存储于计算设备上的存储器中的模范样本音频文件通过与计算机系统相连接的扬声器被播放。由此产生的声音被与计算机系统相连接的扩音器捕获并生成捕获的音频信号。该捕获的音频信号与样本音频信号进行相关以确定该捕获的音频信号的保真度。该捕获的音频信号与样本音频信号进行相关的算法可考虑音频信号的音量和频率特性。计算出设备质量得分并且计算机系统可自动选择最优的音频设备配置。

Description

确定音频设备的质量

背景

采用连网的计算设备进行实时通信正变得越来越流行。这可采取例如互联网语音传输协议(VOIP)电话、启用音频的聊天程序、web视频会议、以及音频和视频流等形式。提供最高质量的音频和/或视频体验会是提供实时通信音频客户端的许多公司之间的重要区分要素。在许多情况下，用户拥有能够用于通信会话的多个音频设备。实时音频客户端通常要求用户选择并配置音频设备以用来进行通话。然而，音频客户端不能保证所选音频设备会带来有质量的通信体验，或甚至不能指示所选设备是否提供了最佳配置选项。

本说明书中的此背景一节所包括的信息仅出于技术参考的目的而被包括于此，并且不应被视为限定本发明的范围的主题。

概述

此处所描述和请求保护的技术针对计算机系统中的特定音频输出或输入设备或其组合的质量的自动检测。存储于计算设备的存储器中的模范样本音频文件通过与该计算机系统相连的扬声器输出设备被播放。由此产生的声音被与该计算机系统相连的扩音器输入设备捕获并转换以生成一个捕获的音频信号，供计算机系统录音和处理。该捕获的音频信号与样本音频信号进行相关，以确定捕获的音频信号的保真度。

用于将捕获的音频信号与样本音频信号进行相关的算法在将捕获的音频信号与样本音频信号作比较时会考虑例如以下因素中的一个或多个：相对的能级或强度、存在的频率的范围、失真水平和信噪比。其它音频质量因素可另外地或替换地被用来计算样本音频信号与捕获的音频信号之间的相对音频质量。可计算设备质量得分来向用户提供不同音频设备配置之间的相对评价的简单指示。当自动比较完所有可能的设备组合并激活具有最高设备质量得分的配置后，计算机系统可自动选择出一对最优的音频输入和输出设备。

在某些实现中，制品被提供为计算机程序产品。计算机程序产品的一个实现提供计算机系统可读的并且对计算机程序进行编码的计算机程序存储介质。计算机程序产品的另一个实现还可以以计算机数据信号被提供，该计算机数据信号通过计算机系统体现在载波中并对计算机程序进行编程。提供本概述以便以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并非意在确定所请求保护的主题的关键特征或必要特征，也并不用来限制所请求保护的主题的范围。所请求保护的主题的其它特征、细节、用途以及优点，随着各种实施例和实现进一步在附图中示出并在所附权利要求中被定义，将从下面的各种实施例和实现的更具体的书面详细描述中变得显而易见。

附图简述

图1示出具有多个附连的音频设备的示例性个人计算机系统。

图2示出计算机系统中用于确定音频设备配置的质量的示例性模块。

图3示出由模块执行的用来确定音频设备质量的一系列示例性操作。

图4示出被执行来确定音频设备质量得分的另一系列示例性操作。

图5示出用于进行实时通信会话以及其它音频输入和输出功能的示例性计算机系统。

详细描述

此处描述的技术实现提供对与计算机系统相关联的音频设备配置的质量的自动确定。此技术帮助进行实时通信会话以及其它音频环境会话的计算机系统的用户确保被选择进行这种会话的设备包括尽可能最佳的音频质量配置。例如，当进行音频会议(例如使用个人计算机系统的VOIP电话呼叫)时，必须要有音频输入设备(例如扩音器)和音频输出设备(例如一个或多个扬声器)两者才能进行通信会话。如果所选扩音器和各扬声器中的任一个或两者均没有被适当地配置或者组合在一起时运行差，则由于不佳的音频质量，用户会有令人沮丧的通信体验。此处所描述的系统和方法自动帮助计算机系统的用户来提供关于音频输入和输出设备的最优配置的信息，以便在通信会话期间最大化音频体验的质量。

计算机系统的用户可能会面对能被用来通信会话的各种可任选音频设备。例如，计算机系统可具有任意一个或多个内置扩音器、具有内置扩音器的显示器、具有内置扩音器的web摄像头、具有手持听筒和喇叭扩音器选项的VOIP电话、具有扩音器和头戴受话器的头戴式耳机、内置扬声器、具有内置扬声器和外置扬声器的显示器、以及与具有扬声器的独立家庭音频系统的连接。

例如，图1示出配备有各种音频外围设备的示例性个人计算机系统100。典型的个人计算机系统100可包括计算机102和与计算机102相连的视频监视器104、键盘108和鼠标108。计算机102可具有用于产生声音的内置扬声器118。视频监视器104还可配有一对扬声器110。此外，个人计算机系统100的用户还可给计算机102附上一组外置扬声器112。个人计算机系统100还可包括用于进行网络视频会议的视频摄像机与扩音器114的组合。用户还可附连组合了耳机扬声器和扩音器的头戴式耳机116以用于参加VOIP或网络视频会议。

在一个示例性音频配置中，计算机系统可自动选择并激活设备的最佳配置以用于期望的音频会话。样本音频文件可通过与计算机系统相连的扬声器设备输出。该样本音频文件可被存储在与计算机系统相关联的存储器中，或可通过网络从远程计算机系统访问。该样本音频文件可被转换成模拟信号并被传输至扬声器。或者，可根据一指令集来同时生成音频信号。在扬声器是数字的，即扬声器具有模数转换器的情况下，该样本音频文件可被直接传输至扬声器。扬声器将模拟音频信号转换成声学能量以在空气中产生声波。

在扬声器播放样本音频文件的同一时间段内执行测试来记录扩音器所接收的声音。包括对应于样本音频文件的声音的任何声波被扩音器拾取，并同样地被转换成模拟音频信号。该模拟音频信号被计算机系统转化成数字数据格式。或者，在数字扩音器的情况下，声波可直接被转换成用于输入到计算机的数字信号。

如果需要，被扩音器捕获的音频数据以及样本音频文件被转换成一共同的数据格式。然后，来自捕获的声音的音频数据与来自模范音频样本文件的音频数据相比较，以确定捕获的音频数据的总体质量和保真度。捕获的音频数据与模范音频样本进行相关的算法会比较几个因素，包括例如相对的能级或强度、存在的频率的范围、失真水平和信噪比。可基于这些因素来计算一设备质量得分，并向用户提供对音频设备配置的质量的简单指示。

当自动比较完所有可能的设备组合并激活具有最高设备质量得分的配置后，计算机系统可自动选择出一对最优的音频输入和输出设备。或者，可确定与计算机系统相连的音频设备(例如扩音器和扬声器)的质量，并报告用户。然后，用户可手动选择音频设备的另一个配置用于测试，并基于各自的质量得分最终为音频会话选择最佳配置。

图2示出具有用于实现质量确定技术的组件和模块的示例性计算机系统200。两个示例性外围设备，扩音器202和扬声器204，与计算机系统200相连。扩音器202作为音频捕获模块206的输入设备与计算机系统200相连。扬声器204作为音频呈现模块208的输出设备与计算机系统200相连。

扩音器202可以是内置于计算机系统200的硬件设备，或者是通过有线或无线连接与计算机系统200相连的外部设备。类似地，扬声器204可以是内置于计算机系统200的硬件设备，或者是通过有线或无线连接与计算机系统200相连的外部设备。扬声器204可以是单个喇叭、一对喇叭、或是多个喇叭的系统，例如在“环绕”配置中。或者，扩音器202和扬声器204可被组合于一单个设备，例如电话手持听筒或头戴式耳机中。

如图2所示，自动设备配置检测功能由例如虚线210所示出的在计算机系统200的内核和用户模式两者内都具有资源的计算机系统200的资源和指令层的组合来实现。在其它操作系统和计算环境中，这种组件和模块可在软件体系结构的其它层上被控制。内核管理包括处理器、存储器、低层硬件接口的机器硬件资源，并通过例如设备驱动程序、存储器管理例程、调度器和系统调用来控制例如用户模式组件等其它软件组件访问这些资源的方式。

音频捕获模块206和音频呈现模块208两者均驻留在内核中。音频捕获模块206将扩音器202转换的模拟音频信号从声波转换成数字数据信号，例如脉冲编码调制(PCM)、压缩盘原始(CDR)数据或其它常见的数据格式，以供计算机系统200的进一步处理。PCM数据可具有各种质量，例如，PCM 16、PCM 32或PCM 48。音频呈现模块208将例如波形音频(WAV)格式、MPEG1、数字声音模块(DSM)格式或其它常见的数据格式等数字音频文件转换成模拟音频信号，以供扬声器204进行声学转换。

其它功能在用户模式中被实现为操作扩音器202和音频捕获模块206所接收的音频数据以及其它数据的软件处理例程。质量检测模块212包括样本音频文件214、信号处理器216以及信号相关和质量管理模块218。样本音频文件214可被质量检测模块212执行的操作访问，并被传输至音频呈现模块208和信号处理器216中的任一个或两者。样本音频文件214作为输出至扬声器204的模范音频样本被传输至音频呈现模块208，以便进行对扬声器204和扩音器202的质量配置测试。

样本音频文件214可以是一个数字音频文件，例如WAV文件，它被选作为所产生的声音的特征。例如，样本音频文件214可产生包括通过扩音器202能容易检测到的特定频率范围的声音，或者产生能提供对扬声器204和扩音器202的组合的频率响应的较好指示的声音。样本音频文件214可另外被选择用来产生对用户悦耳的声音(例如，音乐序列)，或提供对用户有价值的信息(例如，配置指令或广告)。

从扩音器202所接收的音频信号还从音频捕获模块206传输至信号处理216模块。信号处理器216可处理来自音频捕获模块206的音频信号和样本音频文件214中的任一个或两者，以便将音频信号转换成一共同数据格式，以供音频信号的比较为目的。音频信号(和其它数字数据信号)可被转化成任何格式并以该格式存储。例如，如果来自音频捕获模块206的音频信号是PCM格式的，而音频样本文件214是WAV格式的，则信号处理器216可将音频样本文件214转换成PCM格式。或者，信号处理器可将来自音频捕获模块206的音频信号转换成WAV格式。在又一个实例中，当第三种格式，例如音频互换文件格式(AIFF)，能帮助质量检测模块212进行进一步处理时，来自音频捕获模块206的音频信号和音频样本文件214两者均可被信号处理器216转换成这种格式。

一旦信号处理器216处理了来自音频捕获模块206的音频信号和样本音频文件214中的任一个或两者，信号相关和质量测量模块218就将捕获的音频信号与样本音频文件214作比较，以确定质量测量值。来自音频捕获模块206的音频信号与样本音频文件214的比较有益于确定对音频设备配置的质量的客观测量。

在质量评估之前，信号相关和质量测量模块218可辨别扩音器202拾取的声音是由扬声器产生的还是仅仅是扩音器202所处环境的环境声音。该信号相关功能力求不断比较来自扩音器202的捕获的音频信号的窗口或快照，以标识捕获的音频信号与样本音频文件214之间的合理相关，从而确保相关的音频数据被比较。

在对应于扬声器204播放样本音频文件214的那段时间的特定时间窗口期间内捕获和记录来自扩音器202的音频信号可帮助信号相关功能。因此，信号相关和质量检测模块218将对应于来自音频捕获模块206的音频信号的数据的例如频率、强度和时序等特性与来自音频样本文件214的数据作比较，以确定是否存在数据的匹配。如果数据确实相关，则如图3和图4在此处进一步描述的，信号相关和质量检测模块218对捕获的数据进行质量分析并生成用于特定音频设备配置的质量得分。

如图2所示，计算机系统200还包括在用户模式内运行的音频应用程序222。音频应用程序222可以是被用户例示的、将控制正被配置的例如扩音器202和扬声器204等输入和输出设备的软件程序。示例性音频应用程序可以是VOIP客户端和启用音频的聊天程序。或者，音频应用程序222可仅仅是一个音频设备配置程序，例如，被例示来安装新的音频设备或优化以前安装的音频设备的特性的“向导”程序。

“音频设备质量测量”220应用程序接口(API)用作质量检测模块212中的信号相关和质量测量模块218之间的接口，以向音频应用程序222传输带有配置质量得分的数据。音频应用程序222可采用来自音频设备质量测量API220的数据来向用户传送关于音频设备配置的信息。例如，如果该指示表示由扬声器204产生的并在扩音器202处被捕获的声音强度为弱，则音频应用程序222警示用户例如通过增加扬声器204上的输出音量或通过移动来进行故障检修。或者，音频应用程序222可推荐用户选择另一个扬声器选项，例如，从外部扬声器设置切换为内置于附连的监视器的替换扬声器，以便确定该替换扬声器是否带来更好的质量。在一个示例性形式中，音频应用程序222可通过图形用户界面(GUI)中的消息向用户提供警示(例如，可在显示监视器上展示一“弹出”窗口)。

第二API，即音频设备选择API 224，也与音频应用程序222接口，并且还与扩音器202和扬声器204通过其与计算机系统200连接的输入和输出端口接口。(尽管没有在图2中示出，但音频应用程序222可另外与带有独立API的音频呈现模块208接口，以便在扬声器204上产生来自由音频应用程序222进行的通信会话(例如，VOIP电话呼叫)的声音)。音频设备选择API 224激活与所选扩音器202和扬声器204配置相连接的输入端口或输出端口。例如，用户的计算机系统200可具有多个扩音器202，例如，集成于显示监视器的第一扩音器和集成于web摄像头的第二扩音器，以及具有多个扬声器204，例如，与计算机系统200线连的第一组扬声器和集成于显示监视器的第二组扬声器。

音频应用程序222可询问用户喜欢用哪个扩音器或哪组扬声器以用于音频通信目的。音频应用程序222可通过音频设备选择API 224打开和关闭适当的数据端口来激活期望的扩音器202和扬声器204的组合。音频应用程序222还可调用音频设备选择API 224来自动循环于与计算机系统200相连接的任何可用设备中，以便找到具有最高质量得分的音频设备配置。

图3示出由计算机系统执行来执行自动质量检测功能的一系列示例性操作。在图2的计算机系统200的示例性配置的上下文中，信号相关和质量测量模块被配置成为与计算机系统连接的每一可能的扩音器/扬声器配置确定客观的质量等级。尽管是在图2的计算机系统的上下文中描述的，但应该理解的是，此处描述的操作可以由除计算机系统200之外的任何系统来执行。此外，所描述的操作中的任何一个操作可由硬件、软件、固件或任何其组合来执行。

一开始，在选择操作302中，音频应用程序或者自动选择或者提示用户选择初始音频设备配置以用于例如音频通信会话等音频会话。这样的提示或者请求可通过显示监视器上的GUI消息来展示。一旦选择了配置，播放操作304使得样本音频文件被传输至音频呈现设备以便通过所选扬声器回放。

捕获操作306记录被扩音器拾取的声波，这包括由扬声器产生的与样本音频文件相关的声音。该声波被扩音器转换为模拟信号，该模拟信号被音频捕获模块进一步转换为数字音频格式。在转换操作308中，该样本音频文件还可被信号处理器访问并被转换成能容易与捕获的音频数据的格式作比较的数据格式。例如，如果捕获的音频数据是PMC格式的，而样本音频文件是WAV格式的，则可将样本音频文件从WAV转换成PMC。在替换操作中(图3中未示出)，信号处理器可将捕获的音频数据转换成样本音频文件的格式。在又一个替换操作中(图3中未示出)，捕获的音频数据和样本音频文件两者的数据格式可被转换成第三个共同的格式。

一旦样本音频文件和捕获的音频数据都是一个共同格式，则第一分析操作310分析对应于经转换的样本文件的音频信号的频率范围和能级。第二分析操作312类似地分析对应于捕获的音频数据的音频信号的频率范围和能级。第二分析操作312可对捕获的音频数据的窗口或快照进行连续分析，以帮助相关操作314。

相关操作314标识捕获的音频信号的每一窗口的频率范围和能级与转换的样本文件的频率范围和能级的合理相关，以确保相关的音频数据在质量确定过程中被比较。换言之，相关过程试图鉴别出捕获的音频信号中是被扬声器播放的样本音频文件的录音的那部分。音频信号的频率范围和能级不需要完全一致，但只需合理地接近即可。被认为是合理接近的差值的阈值或范围可以是预先确定的或是用户可设置的。相关操作314可以通过从对应于扬声器播放样本音频文件的那个时间段的特定时间段内选择窗口来缩小用来查看相关的捕获的音频信号的窗口。

一旦识别出捕获的音频信号和样本音频文件之间的相关，计算操作316计算例如特定扩音器/扬声器的组合等音频设备配置的音频质量得分。音频质量得分是基于样本音频文件产生的音频信号的音频质量与扩音器捕获的音频信号之间的保真度因素。保真度因素可包括音频信号之间的相对能量、频率范围的相似度、信号失真以及信噪比。图3更详细地描述了一个示例性计算操作。

查询操作318可自动确定是否存在另外的设备配置。如果是，则计算机系统返回至选择操作302来选择扩音器和扬声器的替换配置用于质量分析。计算机系统标识每一个功能性的、附连的扬声器和扩音器设备，并在每个可能的扩音器和扬声器对中循环迭代，以执行图3中枚举的质量测试过程。

或者，查询操作318可通过GUI询问用户是否希望确定其它设备配置的质量。如果是，则计算机系统返回至选择操作302来选择扩音器和扬声器的替换配置，以用于质量分析。如果用户不希望确定其它设备配置的质量或者计算机自动确定不存在其它配置，则展示/选择操作320或者(例如，通过GUI消息)向用户展示所分析的每个设备配置的音频质量得分，或者基于音频质量得分的比较自动选择最佳设备配置，或者进行以上两者。

图4示出用于计算音频设备配置的质量得分的示例性过程。这些操作可在例如图2的计算机系统200中的质量检测模块212的信号相关和质量测量模块218内发生。如图4所示，接收操作402通过音频捕获模块和信号处理器接收来自扩音器的捕获的音频信号数据。捕获的音频信号数据在第一确定操作404中被分析，在该第一确定操作中，测量捕获的音频信号的音量特性，例如音量强度、信噪比、动态范围以及总谐波失真。接着，第二确定操作406检查捕获的音频信号的频率特性，例如频率范围(例如，捕获的音频信号中存在的最高和最低频率)、频率成份(例如，捕获的音频信号中存在的明显不同的频率)以及强度(例如，捕获音频信号在特定频率上的强度)。

一旦确定了捕获的音频信号的音量和频率特性，在相关操作408中，它们与样本音频文件的对应的音量和频率特性进行相关。可以与对捕获的音频信号的分析同时地对对应于样本音频文件的样本音频信号执行相同的音量和频率分析，以便提供用于相关操作的值。或者，由于样本音频文件被预先选择并且已知，所以样本音频文件的音量和频率特性可以仅是存储器中保存的数据并可用于比较操作。然后，在计算操作410中，分析相关数据以找出捕获的音频信号和样本音频文件之间的保真度。

在计算操作410中，可使用“最小平方”法来确定样本音频文件的原始信号与捕获的音频信号之间的相对保真度。最小平方法是一种数学优化方法，它试图通过尝试最小化一数据与一预测值之差(称为残差)的平方和来找出一组数据(在此例中即捕获的音频信号)与一预测值(在此例中即样本音频文件)之间的“最佳配合”。捕获的音频信号的保真度受音频配置质量的影响，例如扬声器和扩音器中的每一个的频率响应、扩音器的灵敏度、扬声器的音量、扩音器和扬声器的互相之间的物理放置、音频设备所处的物理环境以及环境噪声。

然后，在计算操作412中，计算对应于用于经确定和比较的每一个音量和频率特性的保真度的最小平方差的值，并且该值被认为是特定音频设备配置的音频质量得分。基于特定特性对音频质量的贡献的重要性，每个特性被分配一个不同的权重，或按照该权重来缩放。该音频质量得分被保存并与其它可用音频设备配置的音频质量得分作比较，并且具有最高音频质量得分的配置被自动选择或推荐用户在计算机系统中操作它以用于通信会话或针对于特定音频应用程序。

或者，或除此之外，可展示对应于最高音频质量得分的最前面的一组音频配置。此外，可向用户展示指示某种音频设备配置最适合于特定环境或最适合特定用户的反馈。例如，一种音频设备配置可能很适用于户外，而另一种更适当计算设备位于小区域时使用。作为另一个示例，一种音频设备配置可能更适合产生较高频率范围的声音的女性嗓音，而另一种配置可能更适合产生较低频率范围的声音的男性嗓音。

图5示出可被用来通过网络进行实时通信会话并且此处所描述的质量测量技术可在其中操作的示例性计算系统500。在一个实现中，计算系统500可由台式或膝上型计算机来实施，尽管其它实现，例如视频游戏控制台、机顶盒、便携式游戏系统、个人数字助理以及移动电话，可包含所描述的技术。计算机系统500通常包括至少一个处理单元502和存储器504。取决于计算机系统500的确切配置及类型，存储器504可以是易失性的(例如，RAM)、非易失性的(例如，ROM和闪存)或两者的某一组合。如虚线506所示出的，计算机系统500的最基本配置仅需包括处理单元502和存储器504。

计算机系统500还可包括用于存储器存储或检索的其它设备。这些设备可以是可移动存储设备508或不可移动存储设备510，例如用于在磁或光介质上的存储器存储和检索的磁盘驱动器、磁带驱动器和光驱动器。存储介质可包括易失性和非易失性介质，可移动和不可移动两者，并且可用多种配置中的任何一种来提供，例如，可被用来存储数据并能被处理单元502访问的RAM、ROM、EEPROM、闪存、CD-ROM、DVD或其它光存储介质、磁带盒、磁带、磁盘或其它磁存储设备或任何其它存储器技术或介质。信息可被存储于采用存储例如计算机可读指令、数据结构和程序模块等数据的任何方法或技术的存储介质上。

计算机系统500还可具有允许系统500与其它设备通信的一个或多个通信接口512。通信接口可与局域网(LAN)、广域网(WAN)、电话网络、电缆网络、因特网、直接线连接、例如射频、红外、微波、或声学等无线网络、或允许设备间的数据传输的其它网络相连。数据一般通过例如载波或其它传输介质等已调制数据信号通过网络发送至通信介质512或从通信介质512发送。已调制数据信号是以在该信号中编码数据的方式设置或改变特性的电磁信号。

计算机系统500还可具有各种数据设备514和输出设备516。示例性输入设备514可包括键盘、鼠标、手写板、触摸屏设备、扫描仪、视觉输入设备和扩音器或其它声音输入设备。示例性输出设备516可包括显示监视器、打印机和扬声器。这样的输入设备514和输出设备516可与计算机系统500集成，或者它们可以通过有线或无线(例如，通过蓝牙协议)与计算机系统500连接。这些集成的或外围输入和输出设备一般是公知的，并且不在此处做进一步讨论。在一种实现中，实现用于确定音频质量(包括例如样本音频文件)的方法或模块的程序指令被包含于存储器504和存储设备508和510中，并被处理单元502执行。例如音频呈现模块和音频捕获模块执行的其它功能可被计算机系统500的非易失性存储器504中的操作系统执行。

此处描述的技术被实现为一个或多个系统中的逻辑操作和/或模块。逻辑操作可被实现为在一个或多个计算机系统中执行的由处理器实现的步骤序列，以及被实现为在一个或多个计算机系统内的互连机器或电路模块。同样，关于由模块执行或实现的操作，提供各种组件模块的描述。所得的实现是选择的问题，并取决于实现所述技术的底层系统的性能要求。因此，组成此处所描述的技术的实施例的逻辑操作以不同的方式称为操作、步骤、对象或模块。此外，应该理解，逻辑操作可按任何顺序执行，除非明确申明或者权利要求语言固有地需要的特定顺序。

以上说明书、示例和数据提供对本发明的示例性实施例的结构和使用的描述。尽管以上以一定的具体程度或者参考了一个或多个单独实施例，但本领域的技术人员可在不脱离本发明的精神和范围的情况下枚举出所公开的实施例的各种更改。特别是，应该理解，所描述的技术可独立于个人计算机被采用。由此，可预期到其它实施例。希望的是，在以上描述中所包含的以及在附图中所显示的所有内容应该被解释为仅是说明具体实施例的，而不是限制。在不脱离所附权利要求中所定义的本发明的基本要素的情况下可在细节或结构上作出改变。

Claims

1.一种用于确定包括与计算机系统(200，500)相连接的扩音器(202)和扬声器(204)的音频设备配置的质量的方法，所述方法包括：

通过所述扬声器(202)输出(304)从存储于所述计算机系统(200，500)的存储器(504)中的样本音频文件(214)产生的样本声音；

通过所述扩音器(202)捕获(306)所述样本声音来产生捕获的音频信号；

分析(310)所述捕获的音频信号的音频特性；

将所述捕获的音频信号的音频特性与对应于所述样本音频文件的样本音频信号的已知特性进行相关(314)；以及

基于对应于所述音频设备配置的相关的音频特性来计算(306)质量测量值。

2.如权利要求1所述的方法，其特征在于，所述方法还包括将所述扩音器捕获的所述样本声音转换(308)成捕获的音频信号。

3.如权利要求1所述的方法，其特征在于，所述方法还包括向所述计算机系统的用户展示(320)对所述质量测量值的指示。

4.如权利要求1所述的方法，其特征在于，所述分析操作还包括处理所述样本音频信号与所述捕获的音频信号中的至少一个，以将所述样本音频信号、所述捕获的音频信号或这两个信号转换成一共同的格式(308)。

5.如权利要求1所述的方法，其特征在于，所述分析操作还包括分析所述捕获的音频信号的频率范围和能级中的至少一个(310)。

6.如权利要求1所述的方法，其特征在于，所述计算操作还包括计算所述相关的音频特性的最小平方值(410)。

7.如权利要求1所述的方法，其特征在于，所述计算操作还包括将加权因子应用于所述相关的音频特性。

8.如权利要求1所述的方法，其特征在于，或者所述扬声器(204)包括多个扬声器，或者所述扩音器(202)包括多个扩音器，或这两者均包括多个扬声器和扩音器，由此引入多个音频设备配置，并且其中，所述方法还包括：

为所述多个音频设备配置中的每一个在权利要求1的操作中迭代循环(318)。

9.如权利要求8所述的方法，其特征在于，所述方法还包括在多个音频设备配置中选择具有所述多个音频设备配置的每一个的质量测量值中最高质量测量值的一个音频设备配置(320)。

10.一种具有用于执行实现如权利要求1所述的方法的计算机过程的计算机可执行指令的计算机可读介质。

11.一种用于确定包括与计算机系统(200，500)相连接的扩音器(202)和扬声器(204)的音频设备配置的质量的方法，所述方法包括：

通过所述扩音器捕获(306，402)所述样本声音以产生捕获的音频信号；

确定所述捕获的音频信号的音量特性(312，404)；

确定所述捕获的音频信号的频率特性(312，406)；

确定对应于所述样本音频文件的样本音频信号的音量特性(310)；

确定所述样本音频信号的频率特性(310)；

基于所述捕获的音频信号的音量特性和频率特性与所述样本音频信号的音量特性和频率特性的分别比较，计算所述音频设备配置的保真度测量值(316)。

12.如权利要求11所述的方法，其特征在于，所述音量特性包括音量强度、信噪比、动态范围和总谐波失真中的至少一个(404)。

13.如权利要求11所述的方法，其特征在于，所述频率特性包括频率范围、频率成分和频率强度中的至少一个(406)。

14.如权利要求11所述的方法，其特征在于，所述计算操作还包括将加权因子应用于所述频率特性、所述音量特性、或这两者中的一个或多个。

15.如权利要求11所述的方法，其特征在于，所述计算操作还包括相应地计算(410)所述捕获的音频信号的音量特性和频率特性与所述样本音频信号的音量特性和频率特性之间的最小平方值。

16.如权利要求11所述的方法，其特征在于，或者所述扬声器(204)包括多个扬声器，或者所述扩音器(202)包括多个扩音器，或这两者均包括多个扬声器和扩音器，由此引入多个音频设备配置，并且其中，所述方法还包括：为所述多个音频设备配置中的每一个在权利要求11的操作中迭代循环(318)。

17.如权利要求16所述的方法，其特征在于，所述方法还包括在多个音频设备配置中选择具有所述多个音频设备配置中的每一个的保真度测量值中最高保真度测量值的一个音频设备配置(320)。

18.一种具有用于执行实现如权利要求11所述的方法的计算机过程的计算机可执行指令的计算机可读介质。

19.一种确定音频设备配置的质量的计算机系统(200，500)，所述计算机系统包括：

处理器(502)；

所述处理器(502)可访问的、并存储样本音频文件(214)的存储器(504)；

受所述处理器(502)控制、并能够输出从所述样本音频文件(214)产生的样本声音的扬声器(204，516)

受所述处理器(502)控制、并能够接收所述样本声音来产生捕获的音频信号的扩音器(202，514)，其中所述扬声器(204)和扩音器(202)一起构成所述音频设备配置；以及

受所述处理器(502)控制的质量检测模块(218)，所述质量检测模块访问所述存储器中的所述样本音频文件，

产生来自所述样本音频文件的样本音频信号，

接收来自所述扩音器的所述捕获的音频信号，

分析所述捕获的音频信号的音频特性，

将所述捕获的音频信号的音频特性与所述样本音频信号的已知特性进行相关，以及

基于对应于所述音频设备配置的所述相关的音频特性来计算质量测量值。

20.如权利要求19所述的计算机系统(200，500)，其特征在于，

或者所述扬声器(204)包括多个扬声器，或者所述扩音器(202)包括多个扩音器，或这两者均包括多个扬声器和扩音器，由此引入多个音频设备配置；并且所述计算机系统(200，500)还包括：

适用于在用于所述样本声音的输出和所述样本声音的接收的每个音频设备配置中自动迭代循环的设备选择模块(224)。