CN101371249B - 用于测试应用程序在测试平台上的音频性能的方法和系统 - Google Patents

用于测试应用程序在测试平台上的音频性能的方法和系统 Download PDF

Info

Publication number
CN101371249B
CN101371249B CN2007800022884A CN200780002288A CN101371249B CN 101371249 B CN101371249 B CN 101371249B CN 2007800022884 A CN2007800022884 A CN 2007800022884A CN 200780002288 A CN200780002288 A CN 200780002288A CN 101371249 B CN101371249 B CN 101371249B
Authority
CN
China
Prior art keywords
data
test
audio
voice data
descriptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007800022884A
Other languages
English (en)
Other versions
CN101371249A (zh
Inventor
G·帕伦特
K·E·史蒂文森
S·I·德罗恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101371249A publication Critical patent/CN101371249A/zh
Application granted granted Critical
Publication of CN101371249B publication Critical patent/CN101371249B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

经由音频数据的捕捉,提供对应用程序跨平台的音频性能的自动化测试。音频数据可包括来自声卡的输出声音或呈现前的缓冲数据等等。处理音频数据以产生描述性数据,它包括以至少第一分辨率和第二分辨率描述音频数据的数据。该描述性数据用于比较数据样本并且描述二或多个数据样本的相似性程度。该比较允许对音频性能是否令人满意作出判断。

Description

用于测试应用程序在测试平台上的音频性能的方法和系统
背景
软件通常被开发为与多种多样的硬件和系统软件一起使用。这些系统之间的差别具有产生兼容性问题的可能。针对这些问题进行测试是保证整体系统完整性和避免用户投诉所必不可少的。
可使用测试人员来捕捉兼容性问题。这涉及在不同系统配置上运行软件以及人工检查结果。这不仅是一项单调、耗时且资源密集的过程,而且结果也会受到主观与人为误差的损害。
测试自动化已经证明能降低成本并提高图形测试的准确性。例如,可使用自动化工具来执行屏幕捕捉以及对在多个平台上呈现的相同图形数据进行图象比较。这允许测试者使用标准测量方法快速确定不同输出的正确性。
尽管存在粗糙的自动化音频测试方法,但这些方法唯一能做的只是确定音频输出的存在性。仍需要人工测试来确定音频输出是否得到正确的处理。尽管人的耳朵能相对较好地捕捉某些音频缺陷诸如爆音,但它们在其它方面是不足的,诸如精确的音调/音高差异、细微的时间差别或者准确地分析复杂的嘈杂声音。另外,如前所述,这样的人工测试是单调、耗时和资源密集的,并且容易因主观和人为误差而引起错误。
因而,需要改进的音频测试自动化技术以便不仅确定是否生成了音频输出,而且还评估它是否被正确生成。该技术将改进测试结果质量,并且降低人工测试的资源成本。
概述
通过分析输出数据确定应用程序音频质量。在本发明的一个实施例中,正在测试的应用程序运行于各种系统上,并且从每一运行收集音频输出。在替换实施例中,从有可能使用不同的声音呈现技术的同一系统收集多个样本。所收集的输出可以是各种格式的,并且可包括来自硬件处理之前和之后两者的信息。
在一些实施例中,将所收集的样本与假设为理想状态的其它收集样本相比较。或者,在一些实施例中,将所收集的样本与本发明呈现的理想状态的版本相比较。为了执行该比较,所收集的音频样本针对格式进行正则化,然后分解成子带。可使用小波来进行这个分解过程。较低的子带通常用于确定两个声音的整体相似性,而较高的子带通常用于时间分辨率。在一些实施例中,当执行比较时,用相对测试重要性来对这些子带加权。加权方案可对逐个样本改变。
在本概述中仅描述本发明的部分实施例。本发明的其它实施例、优点和新颖特征通过下面本发明的详细描述并结合所包括的附图考虑会变得显然。
附图简述
上述概述以及下面较佳实施例的详细描述在结合附图阅读时能得到更好的理解。为了说明本发明,这些附图示出本发明的示例性构造;然而,本发明不限于所公开的特定方法与手段。在附图中:
图1是在其中可实现本发明诸方面的示例性计算环境的框图;
图2是按照本发明一个实施例从测试平台收集音频数据的框图;
图3是按照本发明一个实施例具体描述该过程的流程图;以及
图4是按照本发明一个实施例的系统的框图。
详细描述
示例性计算环境
图1示出在其中可实现本发明各方面的示例性计算环境。计算系统环境100只是合适的计算环境的一个示例,并非要对本发明的使用范围或功能提出任何限制。也不应将计算环境100解释为具有对示例性计算环境100中例示的任一组件或组件组合有任何依赖性或要求。
本发明可与众多其它通用或专用计算系统环境或配置一起运行。可适于与本发明一起使用的众所周知的计算系统、环境和/或配置的示例包括但不限于,个人计算机、服务器计算机、手持或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费者电子产品、网络PC、小型机、大型机、嵌入式系统、包括任何上述系统或设备的分布式计算环境,等等。
本发明可在由计算机执行的诸如程序模块的计算机可执行指令的一般上下文中描述。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。本发明也可在分布式计算环境中实践,在其中任务是由通过通信网络或其它数据传输介质链接的远程处理设备执行的。在分布式计算环境中,程序模块和其它数据可位于包括存储器存储设备在内的本地和远程两者的计算机存储介质中。
参考图1,用于实现本发明的示例性系统包括计算机110形式的通用计算设备。计算机110的组件可以包括,但不限于,处理单元120、系统存储器130和将包括系统存储器在内的各种系统组件耦合至处理单元120的系统总线121。处理单元120可代表多个逻辑处理单元诸如在多线程处理器上支持的逻辑处理单元。系统总线121可以是任意若干类型的总线结构,包括存储器总线或存储器控制器、外围总线和使用各种总线体系结构中的任一种的局部总线。作为示例而非限制,这样的体系结构包括工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)局部总线以及外围组件互连(PCI)总线(也称为夹层(Mezzanine)总线)。系统总线121也可以实现为点对点连接、开关网络等等通信设备。
计算机110一般包括各种计算机可读介质。计算机可读介质可以是计算机110可访问的任何可用介质,并且包括易失性与非易失性、可移动与不可移动介质两者。作为示例而非限制,计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质包括易失性和非易失性、可移动与不可移动介质,它们是以存储如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术实现的。计算机存储介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术,CDROM、数字多功能盘(DVD)或其它光盘存储,磁带盒、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并且可由计算机110访问的任何其它介质。通信介质一般具体化成经调制的数据信号诸如载波或其它传输机制中的计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。术语“经调制的数据信号”指一种信号,其一或多个特征以将信息编码在该信号中的方式被设置或改变。作为示例但非限制,通信介质包括线接介质如线接网络或直接线连接,以及无线介质如声音、RF、红外线和其它无线介质。任何上述各项的组合也应当包括在计算机可读介质的范围内。
系统存储器130包括易失性和/或非易失性存储器形式的计算机存储介质,诸如只读存储器(ROM)131和随机存取存储器(RAM)132。基本输入/输出系统133(BIOS),包含帮助计算机110内的诸组件例如在启动时传送信息的基本例程,通常存储在ROM 131中。RAM 132通常包含处理单元120可以立即访问和/或目前正在操作的数据和/或程序模块。作为示例而非限制,图1例示操作系统134、应用程序135、其它程序模块136和程序数据137。
计算机110还可包含其它可移动/不可移动、易失性/非易失性计算机存储介质。仅作为示例,图1例示读写不可移动、非易失性磁介质的硬盘驱动器140,读写可移动非易失性磁盘152的磁盘驱动器151以及读写诸如CD ROM或其它光介质的可移动非易失性光盘156的光盘驱动器155。可以在示例性操作环境下使用的其它可移动/不可移动、易失性/非易失性计算机存储介质包括,但不限于,盒式磁带、闪存卡、数字多功能盘、数字录像带、固态RAM、固态ROM等。硬盘驱动器141通常由诸如接口140的不可移动存储器接口连接至系统总线121,而磁盘驱动器151和光盘驱动器155通常由诸如接口150的可移动存储器接口连接至系统总线121。
上述且在图1所示的这些驱动器及其相关联的计算机存储介质为计算机110提供了对计算机可读指令、数据结构、程序模块和其它数据的存储。在图1中,例如,硬盘驱动器141例示为存储操作系统144、应用程序145、其它程序模块146和程序数据147。注意,这些组件可以与操作系统134、应用程序135、其它程序模块136和程序数据137相同或不同。操作系统144、应用程序145、其它程序模块146和程序数据147在这里给出不同的数字是要说明至少它们是不同的副本。用户可通过输入设备诸如键盘162和定点设备161(通常指鼠标、轨迹球或触摸板)将命令和信息输入至计算机20。其它输入设备(未示出)可包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪等等。这些和其它输入设备通常通过耦合至系统总线的用户输入接口160连接至处理单元120,但可通过其它接口和总线结构诸如并行端口、游戏端口或通用串行总线(USB)来连接。系统可包含一或多个音频接口197,它们可连接至一或多个扬声器198。音频接口可包括将数据返回至系统的反馈回路。监视器191或其它类型的显示设备也经由接口诸如视频接口190连接至系统总线121。除了监示器以外,计算机还可包括其它外围输出设备诸如打印机196,它们可通过输出外围接口195来连接。
计算机110可在使用至一或多个远程计算机如远程计算机180的逻辑连接的网络化环境中运行。远程计算机180可以是个人计算机、服务器、路由器、网络PC、对等设备或其它普通网络节点,并且一般包括上面相对于计算机110所述的许多或全部组件,尽管在图1中仅示出一个存储器存储设备181。图1所示的逻辑连接包括局域网(LAN)171和广域网(WAN)173,但还可包括其它网络。这类联网环境在办公室、企业级计算机网络、内联网和因特网中是常见的。
当在LAN联网环境中使用时,计算机110通过网络接口或适配器170连接到LAN 171。当在WAN联网环境中使用时,计算机110通常包括调制解调器172或用于在诸如因特网等WAN 173上建立通信的其它装置。调制解调器172可以是内置或外置的,它可以通过用户输入接口160或其它合适的机制连接至系统总线121。在网络化环境中,相对于计算机110描述的程序模块或其部分可以存储在远程存储器存储设备中。作为示例而非限制,图1将远程应用程序185例示为驻留在存储器设备181上。将了解到,所示的网络连接是示例性的,并且可使用其它在计算机之间建立通信链接的手段。
音频输出的自动化比较
图2是从测试平台收集音频数据的框图。如图2所示,要测试的应用程序210在测试平台200上运行。应用程序经由声音系统250生成声音输出270。如参考图1所示和所述,可使用扬声器198来产生声音输出270。在一些平台中,声卡可以是声音系统250的一部分;声卡包括存储器和处理功能。声音系统250输出声道数据260。该声道数据通常是模拟音频(波形)数据。声道数据260包括一或多个声道的数据;每一声道具有用于该声道的独立的模拟音频数据。
如所述的,在声道数据260中可以有一个声道的数据,或者可以有多于一个声道的数据。例如,如果正在输出单耳输出,则声道数据260中只包括单个声道。如果正在输出立体声输出,则声道数据260中将包括两个声道。可提供更多的声道,例如用于环绕声。使声道数据260可用于扬声器198,后者使用声道数据260来产生声音输出270。
另外,如图2所示,应用程序210利用硬件抽象层230。硬件抽象层230允许应用程序210委托在测试平台上产生声音输出270时涉及的一些任务。例如,硬件抽象层230可提供应用程序编程接口(API),应用程序210可使用这些API来管理声音系统250或扬声器198,而不是要求应用程序直接进行管理。代之以使用对硬件抽象层230的音频调用220,以便指导声音输出270的产生。硬件抽象层230使用音频调用220来产生用于声音系统250的输入数据240。
尽管图2示出具有硬件抽象层230、声音系统250和扬声器198的测试平台200,但至少因为两个原因,测试平台可包括所有、部分这些项,或者不包括它们。首先,在平台操作的正常过程中,应用程序210在产生声音输出270时可不使用部分或全部这些项目。例如,应用程序可直接控制扬声器,在该情形中,声道数据260将直接从应用程序210产生。其次,测试平台可不包括每个应用程序210在产生声音输出270时正常使用的全部组件。如将描述的,音频数据捕捉280从应用程序210与最终声音输出270之间的一或多个点捕捉音频数据。在一个示例中,音频数据捕捉280捕捉对硬件抽象层230的音频调用220,而不捕捉用于声音系统250的输入数据240或任何其它音频数据。在该情形中,在测试平台中,不需要实际存在声音系统250或扬声器198,只要这些组件的缺少不会干扰应用程序210对测试数据的执行。
更一般地,尽管图2示出并描述了来自应用程序210的特定音频数据流,但无论真正的音频数据流(包括接收与发出音频数据的中间元件)是什么,都可以实践本发明。
音频数据捕捉280在从应用程序210至声音输出280的音频数据流中任意点处捕捉音频数据。因而,如所示的,音频数据捕捉280可捕捉音频调用220、用于声音系统的输入数据240、声道数据260和/或声音输出280。另外,在应用程序210与声音的最终输出之间存在其它音频数据流的情况下,音频数据捕捉280可捕捉音频数据中的任一个。
可通过对中间元件的修改来执行音频数据捕捉280。例如,可修改硬件抽象层230以执行硬件抽象层230的正常功能并且捕捉音频调用220和/或用于声音系统250的输入数据240。可替换地或者另外,可通过以任意方式监视这些元件之间的通信来执行音频数据捕捉280。可通过反馈回路来执行对声音输出270的音频数据捕捉280。
一旦音频数据捕捉280已经捕捉了音频数据,即可执行所捕捉的音频数据与目标数据的比较。图3是按照本发明一个实施例详述该过程的流程图。如在图3可见,在第一步骤300中,要测试的应用程序在测试平台上运行。在一个实施例中,应用程序210以一组特定的测试输入来运行。在步骤310,捕捉来自正在运行的应用程序的音频数据。如上详述,该音频数据可在应用程序的任意阶段发现。
产生描述性数据
在第二步骤320,产生描述音频数据的描述性数据。描述性数据以允许进行比较的形式描述由音频数据(不论发现音频数据是什么形式的)最终产生的每一音频声道。
产生描述性数据的一种方式是使用小波。在所捕捉的音频数据上使用小波,例如使用离散小波变换(DWT)。如果所捕捉的音频数据不是描述音频信号的形式,则首先将所捕捉的音频数据转换成描述音频信号的形式。因而,如果例如所捕捉的音频数据由对硬件抽象层230的音频调用220组成,则将所捕捉的音频数据转换成描述音频信号的形式,诸如与声道数据260相似(或等效)的声道数据的声道形式或者实际记录的声音数据如声音输出270的形式。
当所捕捉的音频数据是音频信号(波形)形式时,按照本发明的一个使用DWT的实施例执行下列步骤。最终结果是从所捕捉的音频数据产生子带。这些步骤对将接受比较的每一音频声道执行。首先,在音频信号数据上运行所使用的高通或低通滤波器。这些滤波器是从作为变换基础的小波得到的。滤波器将数据分为两个相等部分,即高通部分与低通部分。该过程递归地继续,其中每一低通部分运行通过高通和低通滤波器,直至只剩一个低通样本为止。这有效地将音频信号数据划分成log2(n)个系数子带,其中n是音频数据中的样本数。(注意,n必须是2的幂。在一些实施例中,如果音频数据中样本数不是2的幂,则添加哑数据至音频数据以创建正确数量的样本。在一些实施例中,哑数据是零数据。)
每一递增的子带包含前一子带两倍数量的系数。最高频率的子带包含n/2个样本,其中n是波形中的原样本数。如果需要,原波形(音频信号数据)可以准确地从这log2(n)个系数子带重构。
DWT的结果是最低子带,它对应于在仅使用一个小波来重构整个波形时能最佳符合原波形的小波系数。第二最低子带对应于两个小波的两个系数,在这些小波被添加至第一小波时,将最佳符合原波形。任何及所有后续的子带可视为保存这样的小波的系数,如果将它们添加至由之前的子带重构的结果,则可以用于重构出原波形。因而,为了使用第四子带重构原波形,执行使用第一、第二和第三子带的波形重构,然后添加从第四子带构造的波形。因而,每一子带N的系数是描述使用子带1至N-1波形重构与使用子带1至N波形重构之间差异的一种方法。
在比较之前,可能需要对子带进行重要性滤波。这有效地从子带中移除低于某一阈值且因而与大于该阈限的值相比对整个声音的贡献较小的任何系数。按照一些实施例,执行以下步骤来完成重要性滤波:(1)在音频样本上执行DWT;(2)将低于指定阈值t的任何系数设置为0;(3)从DWT系数重构波形。
因而,使用DWT,创建至少两个子带。这些子带以至少一种分辨率的第一描述性数据(第一子带)以及第二分辨率的第二描述性数据(第二子带)来描述音频数据中的数据。
尽管在此将DWT示为产生以至少两种分辨率描述音频数据的数据的方法,但存在产生不同分辨率的数据的其它方法。例如,存在DWT的变化方案诸如分组化离散小波变换。另外,可使用不同基小波用于DWT。另外,可使用快速傅立叶变换(FFT)将数据分成不同的频率,其中较低频率可视为声音的较低分辨率描述,而较高频率可视为声音的较高分辨率描述。
描述性数据与目标数据的比较
如图3所示,按照本发明的一个实施例的最后步骤即步骤330是描述性数据与目标数据的比较。为了执行比较,数据必须相似。因而,目标数据在各种实施例中可以是波形形式的音频数据、可以导出波形的音频数据或者描述波形的描述性数据(例如子带数据)。然而,如果目标数据不是与该描述性数据相同形式的描述性数据形式,则必须执行一或多个中间步骤,以便用与产生来自测试平台的音频数据的描述性数据相似的方式产生以至少两种分辨率描述目标数据的目标描述性数据。
在一个实施例中,目标数据是应用程序210应当在测试状态中产生的数据。例如,当应用程序已经在一特定平台上得到验证(例如由测试人员)时,测试数据可从该平台上的执行提取。在一替换实施例中,一组平台都运行应用程序210,并且从每一平台收集音频数据。随后在音频数据上执行某种求平均方法。这提供平均的音频输出。随后将平均音频输出用作目标数据,以便确定组中每一个别平台的性能(或另一平台的性能)。在针对平均音频输出对组中一个别平台进行测试的情形中,将来自测试平台的音频数据一定程度地包括在测试平台要对其进行比较的测试数据(平均音频输出)中。
在一些实施例中,确定每一分辨率的描述性数据与目标数据之间的相似性。在一些实施例中,基于每一分辨率的相似性建立比较分数。在确定比较分数时,可对不同的分辨率不同地加权。在一些实施例中,建立通过阈值,并且如果比较分数超过相似性的通过阈值,则认为应用程序210具有可接受的音频性能。
在一个实施例中,比较结果在数字零与一之间,它描述目标波形与音频数据波形的相似程度。用户指定一个容限。该容限是导致通过的两个系数之间的最大百分比增量。对于来自音频数据的子带中的每一系数,将该系数与目标数据的相同子带中的对应系数相比较。如果百分比差低于容限t,则将该系数标记为通过。通过系数的数量与该子带的总系数数量相比构成该子带的总体一致性。因而,例如,按照上述DWT的第四子带包含十六个系数。将来自描述性数据(从音频数据得到)的第四子带的每一系数与来自从目标波形得到的第四子带的对应系数相比较。在这16对系数之中,如果12对通过(其差异小于容限t),且4对未通过(其差异大于容限t),则计算出一致性率为75%。一旦计算出每一子带的一致性百分比,则可将它们加权并组合在一起以形成整个样本的一个一致性率。
为了确定加权,可使用两个假设。通常,较高频率的子带主要是高频噪声并且对于整体波形没有重要的贡献。这假设还没有对波形进行重要性滤波以移除该噪声。如果滤波已经进行,则较高频率的子带可能全部具有系数0。通常,低频子带是近似波形的非常粗糙的形状并且不考虑声音的中范围的细微变化。因而,按照一个实施例,基于以log2(n)/2子带为中心的高斯分布将权重分配给子带一致性率。该加权的结果是将重要性移至较低子带的一致性值,且因此,对更大体的波形而非声音的细微变化给予较大的权重。
然而,应当注意,在一些情形中,这些假设并不成立。因此,且为了比较声音的不同方面,应当使用不同的加权方案。
为了相互比较两个音频样本,必须将它们同步以在完全相同的点开始。按照一些实施例,通过使用非常大的值对音频数据和目标数据两者进行重要性滤波,并且从经过重要性滤波的数据重构波形并搜索第一个非零值来完成同步。这被假设为音频数据与目标数据两者中的相同位置,并且该位置用于同步音频数据与目标数据以进行比较。
图4是按照本发明的一个实施例的系统的框图。如图4所示,按照本发明的一个实施例的系统包括用于存储来自测试平台的音频数据的存储400。处理器410用于将音频数据变换成描述性数据。如上所述,在一个实施例中,该描述性数据包括来自DWT的、以不同分辨率描述数据的子带数据。比较器420用于比较该描述性数据与目标描述性数据。
结论
应当注意,仅为说明提供了上面的示例,并且决不应将它们解释为对本发明的限制。尽管已经参考各种实施例描述了本发明,但应当理解,在本文中使用的词语是描述性和说明性词语,而不是限制性词语。而且,尽管本文此处已经参考特定的方法、材料和实施例描述了本发明,但本发明不应受限于本文所公开的细节;相反,本发明延及所有在功能上等价的结构、方法和用途,诸如在所附权利要求书的范围内的结构、方法和用途。本领域的技术人员在受益于本说明书的教导之后,可实现对其的众多修改方案并且在不脱离本发明的范围和精神的情况下对其各方面作出改变。

Claims (15)

1.一种用于测试应用程序在测试平台上的音频性能的方法,包括:
在所述测试平台上运行(300)所述应用程序;
从所述应用程序在所述测试平台上的所述运行捕捉(310)音频数据;
使用所述音频数据计算(320)描述性数据,所述描述性数据包括使用至少第一分辨率和第二分辨率描述所述音频数据的数据;以及
通过以下步骤来同步所述描述性数据和目标数据:
对所述描述性数据和所述目标数据进行重要性滤波以得到重要的滤波后数据;
从所述重要的滤波后数据重构波形;
在所重构的波形中搜索第一个非零值;以及
假设所述第一个非零值在所述描述性数据和所述目标数据中的相同位置;以及
在将其同步后,比较(330)所述描述性数据与所述目标数据。
2.如权利要求1所述的用于测试应用程序在测试平台上的音频性能的方法,其特征在于,在所述测试平台上运行所述应用程序的所述步骤包括对在所述测试平台上运行的所述应用程序提供预先指定的测试输入。
3.如权利要求1所述的用于测试应用程序在测试平台上的音频性能的方法,其特征在于,计算所述描述性数据的所述步骤包括:
计算至少有两个子带的组,每一所述子带描述所述音频数据。
4.如权利要求3所述的用于测试应用程序在测试平台上的音频性能的方法,其特征在于,来自所述组中的第一子带以所述第一分辨率描述所述音频数据,来自所述组中的第二子带以所述第二分辨率描述所述音频数据。
5.如权利要求3所述的用于测试应用程序在测试平台上的音频性能的方法,其特征在于,所述子带是使用离散小波变换计算的。
6.如权利要求1所述的用于测试应用程序在测试平台上的音频性能的方法,其特征在于,比较所述描述性数据与所述目标数据的所述步骤包括:
计算至少两个中间比较值,每一所述比较值指示在特定分辨率处所述音频数据与所述目标数据的相似性;以及
计算最终比较值,所述最终比较值基于所述中间比较值。
7.如权利要求6所述的用于测试应用程序在测试平台上的音频性能的方法,其特征在于,所述计算最终比较值的步骤包括对所述中间比较值中的至少第一个进行与对所述中间比较值中的至少第二个所进行的不同的加权。
8.如权利要求1所述的用于测试应用程序在测试平台上的音频性能的方法,其特征在于,音频数据包括如由所述应用程序为经由声音系统呈现而创建的缓冲声音数据。
9.一种用于音频性能测试的系统,包括:
用于存储音频数据的存储器(400),所述音频数据是通过在测试平台上运行应用程序而得到的;
用于计算有关所述音频数据的特性的描述性数据的处理器(410),所述描述性数据包括使用至少第一分辨率和第二分辨率描述所述音频数据的数据,所述处理器用于连接至所述存储器;以及
用于比较同步后的描述性数据与目标描述性数据的比较器(420),其中所述描述性数据和所述目标描述性数据通过以下步骤而被同步:
对所述描述性数据和所述目标描述性数据进行重要性滤波以得到重要的滤波后数据;
从所述重要的滤波后数据重构波形;
在所重构的波形中搜索第一个非零值;以及
假设所述第一个非零值在所述描述性数据和所述目标描述性数据中的相同位置;以及
所述比较器用于连接至所述处理器,并且其中所述目标描述性数据是从目标数据计算得到的,所述目标数据包括通过在多个平台上运行所述应用程序或在使用多种不同声音呈现技术的一个平台上运行所述应用程序而得到的数据的平均。
10.如权利要求9所述的用于音频性能测试的系统,其特征在于,所述处理器计算至少有两个子带的组,每一所述子带描述所述音频数据。
11.如权利要求10所述的用于音频性能测试的系统,其特征在于,来自所述组中的第一子带以所述第一分辨率描述所述音频数据,来自所述组中的第二子带以所述第二分辨率描述音频数据。
12.如权利要求10所述的用于音频性能测试的系统,其特征在于,所述子带是使用离散小波变换计算的。
13.如权利要求9所述的用于音频性能测试的系统,其特征在于,所述比较器计算至少两个中间比较值,每一所述比较值指示在特定分辨率处所述音频数据与所述目标数据的相似性;以及计算最终比较值,所述最终比较值基于所述中间比较值。
14.如权利要求13所述的用于音频性能测试的系统,在最终比较值的所述计算中,所述比较器对所述中间比较值中的至少第一个进行与对所述中间比较值中的至少第二个所进行的不同的加权。
15.如权利要求9所述的用于音频性能测试的系统,其特征在于,所述音频数据包括如所述应用程序为经由声音系统呈现而创建的缓冲声音数据。
CN2007800022884A 2006-01-11 2007-01-03 用于测试应用程序在测试平台上的音频性能的方法和系统 Expired - Fee Related CN101371249B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/329,429 US7698144B2 (en) 2006-01-11 2006-01-11 Automated audio sub-band comparison
US11/329,429 2006-01-11
PCT/US2007/000155 WO2007081738A2 (en) 2006-01-11 2007-01-03 Automated audio sub-band comparison

Publications (2)

Publication Number Publication Date
CN101371249A CN101371249A (zh) 2009-02-18
CN101371249B true CN101371249B (zh) 2010-08-18

Family

ID=38233802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800022884A Expired - Fee Related CN101371249B (zh) 2006-01-11 2007-01-03 用于测试应用程序在测试平台上的音频性能的方法和系统

Country Status (6)

Country Link
US (1) US7698144B2 (zh)
EP (1) EP1971936A4 (zh)
JP (1) JP2009523261A (zh)
KR (1) KR20080091447A (zh)
CN (1) CN101371249B (zh)
WO (1) WO2007081738A2 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103267568B (zh) * 2013-05-29 2015-06-10 哈尔滨工业大学 一种汽车电子控制单元的声音在线检测方法
CN103699470A (zh) * 2013-12-04 2014-04-02 四川长虹电器股份有限公司 一种测试数据自动存储方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1438767A (zh) * 2002-02-16 2003-08-27 三星电子株式会社 利用小波包变换压缩音频信号的方法和装置
WO2004051202A2 (en) * 2002-11-29 2004-06-17 Research In Motion Limited Method of audio testing of acoustic devices

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0647375B1 (en) 1992-06-24 1998-10-14 BRITISH TELECOMMUNICATIONS public limited company Method and apparatus for objective speech quality measurements of telecommunication equipment
KR970004856B1 (ko) 1994-06-24 1997-04-04 삼성전기 주식회사 편파특성을 개선시킨 저잡음 주파수 변환기(lnb)
WO1997015914A1 (en) * 1995-10-23 1997-05-01 The Regents Of The University Of California Control structure for sound synthesis
KR0180304B1 (ko) * 1995-12-30 1999-04-01 김광호 반도체 테스터의 오디오 신호 발생 제어회로 및 그 방법
US6417435B2 (en) * 2000-02-28 2002-07-09 Constantin B. Chantzis Audio-acoustic proficiency testing device
WO2006049353A1 (en) * 2004-11-01 2006-05-11 Samsung Electronics Co., Ltd. The test system and method of the electric device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1438767A (zh) * 2002-02-16 2003-08-27 三星电子株式会社 利用小波包变换压缩音频信号的方法和装置
WO2004051202A2 (en) * 2002-11-29 2004-06-17 Research In Motion Limited Method of audio testing of acoustic devices

Also Published As

Publication number Publication date
CN101371249A (zh) 2009-02-18
US7698144B2 (en) 2010-04-13
WO2007081738A2 (en) 2007-07-19
JP2009523261A (ja) 2009-06-18
EP1971936A2 (en) 2008-09-24
WO2007081738A3 (en) 2007-09-13
KR20080091447A (ko) 2008-10-13
EP1971936A4 (en) 2012-02-29
US20070162285A1 (en) 2007-07-12

Similar Documents

Publication Publication Date Title
US8457768B2 (en) Crowd noise analysis
JP3130926B2 (ja) 信号認識システムと方法
US9093120B2 (en) Audio fingerprint extraction by scaling in time and resampling
USRE44248E1 (en) System for transferring personalize matter from one computer to another
US20200236068A1 (en) Evaluating retraining recommendations for an automated conversational service
JP2007065659A (ja) オーディオ信号からの特徴的な指紋の抽出とマッチング
JP2010519832A (ja) 放送データを監視および認識するためのシステムおよび方法
US20140140517A1 (en) Sound Data Identification
CN107591167B (zh) 一种实现车载多媒体音频兼容性自动检测的方法及系统
US12106766B2 (en) Systems and methods for pre-filtering audio content based on prominence of frequency content
US7478004B2 (en) Method for testing a connection between an audio receiving device and a motherboard
US20230125150A1 (en) Augmentation of testing or training sets for machine learning models
CN118506846A (zh) 一种硬盘测试装置、系统及方法
CN101371249B (zh) 用于测试应用程序在测试平台上的音频性能的方法和系统
JP2019066339A (ja) 音による診断装置、診断方法、および診断システム
CN105678557A (zh) 模型生成方法及装置、服务质量的评估方法及装置
JP6216809B2 (ja) パラメータ調整システム、パラメータ調整方法、プログラム
CN111868821B (zh) 从媒体信号提取与音调无关的音色属性的方法和装置
CN116092529A (zh) 音质评估模型的训练方法及装置、音质评估方法及装置
Reddy et al. Supervised classifiers for audio impairments with noisy labels
Ragano et al. Automatic quality assessment of digitized and restored sound archives
US8196046B2 (en) Parallel visual radio station selection
JP2007017462A (ja) データ作成装置及びコンピュータプログラム
CN116959478A (zh) 声源分离方法、装置、设备及存储介质
CN114638293A (zh) 模型训练方法、多维评分方法、介质及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100818

Termination date: 20140103