CN101263739B

CN101263739B - 用于音频处理的系统和方法

Info

Publication number: CN101263739B
Application number: CN2006800336938A
Authority: CN
Inventors: 王文
Original assignee: SRS Labs Inc
Current assignee: DTS Inc
Priority date: 2005-09-13
Filing date: 2006-09-13
Publication date: 2012-06-20
Anticipated expiration: 2026-09-13
Also published as: US9232319B2; KR20080049741A; EP1938661A1; CA2621175C; WO2007033150A1; US8027477B2; US20070061026A1; US20120014528A1; KR101304797B1; PL1938661T3; EP1938661B1; JP2009508442A; CA2621175A1; JP4927848B2; CN101263739A

Abstract

公开了用于处理音频信号的系统和方法，其中针对音频频率范围的特定部分产生离散的多个采样数字滤波器(266)。研究表明，对于人类双耳的方位区分能力而言，特定的频率范围是特别重要的，而其它范围通常被忽略。头部相关传输函数(HRTF)(170)是示例性响应函数，该函数表征双耳如何感知位于不同方位的声音。通过选择该响应函数的一个或更多个“方位关键”部分(172，174)，可以构造可用于模拟听觉的简单的滤波器(180)，在该滤波器中基本上保持了方位区分能力。由于该滤波器可以是简单的，因此可以在具有有限的计算能力和资源的设备(550，562)中实现该滤波器，以提供形成许多期望的音频效果的基础的方位区分响应。

Description

用于音频处理的系统和方法

优先权声明

本申请依据35U.S.C.§119(e)要求2005年9月13日递交的、名称为“用于音频处理的系统和方法”的美国临时申请第60/716,588号的优先权权益，将其全部合并于此作为参考。

技术领域

本公开总体上涉及音频信号处理，更具体地，涉及用于对可听见的频率范围的方位关键部分进行滤波以模拟三维收听效果的系统和方法。

背景技术

可以对声音信号进行处理，以提供增强的收听效果。例如，各种处理技术可以使得能够感知到声源正被定位或者正相对于听者而移动。这种技术使得听者即使在使用具有有限的配置和性能的扬声器时也能够享受模拟的三维收听体验。

然而，许多声音感知增强技术较为复杂，而且通常需要相当大的计算能力和资源。因此，在应用于诸多具有有限的计算能力和资源的电子设备时，使用这些技术是不切实际或不可能的。许多便携式设备如蜂窝电话、PDA、MP3播放器等通常属于这一类电子设备。

发明内容

至少一些前述问题可以通过根据这里公开的用于信号处理的系统和方法的各种实施例来解决。在一个实施例中，可以针对音频频率范围的特定部分而产生简单数字滤波器的离散数字。研究表明，对于人类双耳的方位区分能力而言某些频率范围特别重要，而其它范围通常被忽略。头部相关传输函数(HRTF)是表征双耳如何感知被定位在不同方位处的声音的示例性响应函数。通过选择这种响应函数的一个或更多个“方位关键”部分，人们可以构造可用于模拟听觉的简单的滤波器，在该滤波器中基本上保持了方位区分能力。由于滤波器可以较为简单，因此可以以具有有限的计算能力和资源的设备来实现该滤波器，以提供构成诸多期望的音频效果的基础的方位区分响应。

本公开的一个实施例涉及一种用于处理数字音频信号的方法。该方法包括接收一个或更多个数字信号，该一个或更多个数字信号中的每个信号具有与声源相对于听者的空间位置有关的信息。该方法还包括选择一个或更多个数字滤波器，该一个或更多个数字滤波器的每一个是根据听觉响应函数的特定范围而形成的。该方法还包括将该一个或更多个滤波器应用于该一个或更多个数字信号，以产生对应的一个或更多个滤波信号，其中该一个或更多个滤波信号具有应用于声源的听觉响应函数的模拟效果。

在一个实施例中，该听觉响应函数包括头部相关传输函数(HRTF)。在一个实施例中，该特定范围包括HRTF中的特定频率范围。在一个实施例中，该特定频率范围基本上是在向平均人类听觉提供大于可听到的频率中的平均灵敏度的方向区分灵敏度的频率范围内，或者是与该频率范围相重叠。在一个实施例中，该特定频率范围包括HRTF中的波峰结构，或基本上与HRTF中的波峰结构相重叠。在一个实施例中，该波峰结构基本上是在约2.5KHz与约7.5KHz之间的频率范围内，或者与该频率范围相重叠。在一个实施例中，该波峰结构基本上是在约8.5KHz与约18KHz之间的频率范围内，或者与该波峰结构相重叠。

在一个实施例中，该一个或更多个数字信号包括将要输出至左扬声器和右扬声器的左数字信号和右数字信号。在一个实施例中，针对耳间时差(ITD)，基于声源相对于听者的空间位置来调整左数字信号和右数字信号。在一个实施例中，该ITD调整包括接收具有与声源的空间位置有关的信息的单声道输入信号。该ITD调整还包括基于该空间信息来确定时差值。该ITD调整还包括通过将该时差值引入该单声道输入信号来产生左信号和右信号。

在一个实施例中，该时差值包括与sinθcos

的绝对值成比例的数量，其中θ表示声源相对于听者的前方的方位角，

表示声源相对于由听者的双耳和前方所限定的水平面的仰角。在一个实施例中，将该数值表示为

|(Maximum_ITD_Samples_per_Sampling_Rate-1)sinθcos

|。

在一个实施例中，在声源的空间位置改变时执行该时差值的确定。在一个实施例中，该方法还包括执行该时差值在先前值与当前值之间的交叉衰减过渡。在一个实施例中，该交叉衰减过渡包括在多个处理周期期间将该用于左信号和右信号的产生的时差值从先前值改变为当前值。

在一个实施例中，该一个或更多个滤波信号包括将要被输出至左扬声器和右扬声器的左滤波信号和右滤波信号。在一个实施例中，该方法还包括针对耳间强度差(IID)，调整该左滤波信号和右滤波信号的每个信号，以考虑可能存在并且未被该一个或更多个滤波器的应用所考虑的任何强度差。在一个实施例中，该左滤波信号和右滤波信号针对IID的调整包括确定声源是否位于相对于听者的左侧或右侧。该调整还包括将位于声源相对侧的左滤波信号或右滤波信号指定为较弱的信号。该调整还包括将左滤波信号或右滤波信号的另一个指定为较强的信号。该调整还包括通过第一补偿来调整该较弱的信号。该调整还包括通过第二补偿来调整该较强的信号。

在一个实施例中，该第一补偿包括与cosθ成比例的补偿值，其中θ表示声源相对于听者的前方的方位角。在一个实施例中，对该补偿值进行正规化，以使得如果声源基本上正好位于该前方处，则该补偿值可以是原始的滤波器基本的差值，并且如果声源基本上正好位于该较强的一侧，则该补偿值近似于1，以使得不对该较弱的信号进行增益调整。

在一个实施例中，该第二补偿包括与sinθ成比例的补偿值，其中θ 表示声源相对于听者的前方的方位角。在一个实施例中，对该补偿值进行正规化，以使得如果声源基本上正好位于该前方处，则该补偿值近似于1，以使得不对该较强的信号进行增益调整，并且如果声源基本上正好位于该较弱的一侧，则该补偿值近似于2，从而提供了约6dB的增益补偿，以便近似地与在该方位角的不同值处的总响度相匹配。

在一个实施例中，在由于声源的所选的移动而将新的一个或更多个数字滤波器应用于左滤波信号与右滤波信号时，执行针对IID的该左滤波信号与右滤波信号的调整。在一个实施例中，该方法还包括执行该第一补偿值和第二补偿值在先前值与当前值之间的交叉衰减过渡。在一个实施例中，该交叉衰减过渡包括在多个处理周期期间改变该第一补偿值和第二补偿值。

在一个实施例中，该一个或更多个数字滤波器包括多个数字滤波器。在一个实施例中，将该一个或更多个数字信号中的每个信号分离为数量与该多个数字滤波器的数量相同的信号，以便将该多个数字滤波器并行地应用于该多个分离的信号。在一个实施例中，通过将已被该多个数字滤波器滤波的该多个分离的信号相组合来获得该一个或更多个滤波信号的每个信号。在一个实施例中，该组合包括对该一个或更多个分离的信号进行求和。

在一个实施例中，该多个数字滤波器包括第一数字滤波器和第二数字滤波器。在一个实施例中，该第一数字滤波器和第二数字滤波器包括产生在通带部分中基本上最大限度地平坦并且在听觉响应函数的阻带部分中基本上滚降至零的响应的滤波器。在一个实施例中，该第一数字滤波器和第二数字滤波器的每个滤波器包括巴特沃斯滤波器。在一个实施例中，该第一数字滤波器和第二数字滤波器之一的通带部分由在约2.5KHz与约7.5KHz之间的频率范围来限定。在一个实施例中，将该第一数字滤波器和第二数字滤波器之一的通带部分由在约8.5KHz与约18KHz之间的频率范围来限定。

在一个实施例中，该一个或更多个数字滤波器的选择是基于与听者附近的有限数量的几何位置的。在一个实施例中，该几何位置包括多个半平面，每个半平面由沿着听者两耳之间的方向的边界以及相对于由听者两耳和听者前方所限定的水平面的仰角

来限定。在一个实施例中，将该多个半平面分组为一个或更多个前半平面以及一个或更多个后半平面。在一个实施例中，该前半平面包括在听者前方并在约0度和+/-45度的仰角处的半平面，该后半平面包括在听者后方并在约0度和+/-45度的仰角处的半平面。

在一个实施例中，该方法还包括在接收该一个或更多个数字信号之前或者在应用该一个或更多个滤波器之后，执行至少一个以下处理步骤：采样速率转换、针对声源速度的多普勒调整、用于考虑声源与听者之间的距离的距离调整、用于考虑听者的头部相对于声源的方向的方向调整、或者混响调整。

在一个实施例中，该一个或更多个数字滤波器的针对该一个或更多个数字信号的应用对声源在听者附近运动的效果进行模拟。

在一个实施例中，该一个或更多个数字滤波器的针对该一个或更多个数字信号的应用对将声源放置在听者附近的所选的方位处的效果进行模拟。在一个实施例中，该一个或更多个数字滤波器的针对该一个或更多个数字信号的应用对将多个声源放置在听者附近的所选的方位处的效果进行模拟。在一个实施例中，该一个或更多个数字信号包括将要被输出至左扬声器和右扬声器的左数字信号和右数字信号，该多个声源包括多于两个的声源，以通过该左扬声器和右扬声器来模拟该多于两个的声源的效果。在一个实施例中，该多个声源包括以与一种环绕声布置相类似的方式来布置的五个声源，其中左扬声器和右扬声器位于耳机中，以通过向该耳机提供的左滤波信号和右滤波信号来模拟环绕声效果。

本公开的另一实施例涉及一种用于处理表示来自声源的声音的数字信号的定位音频引擎。该音频引擎包括配置用于选择一个或更多个数字滤波器的滤波器选择组件，该一个或更多个数字滤波器的每个滤波器是根据听觉响应函数的特定范围而形成的，该选择基于声源相对于听者的空间位置。该音频引擎还包括配置用于将该一个或更多个滤波器应用于一个或更多个数字信号以产生对应的一个或更多个滤波信号的滤波器应用组件，该一个或更多个滤波信号的每个信号具有应用于来自声源的声音的听觉响应函数的模拟效果。

在一个实施例中，该听觉响应函数包括头部相关传输函数(HRTF)。在一个实施例中，该特定范围包括该HRTF中的特定频率范围。在一个实施例中，该特定频率范围基本上在提供了针对平均人类听觉的、大于可听见的频率中的平均灵敏度的方位区分灵敏度的频率范围内，或者与该频率范围相重叠。在一个实施例中，该特定频率范围包括该HRTF中的波峰结构，或者基本上与该波峰结构相重叠。在一个实施例中，该波峰结构基本上在约2.5KHz与约7.5KHz之间的频率范围内，或者与该频率范围相重叠。在一个实施例中，该波峰结构基本上在约8.5KHz与约18KHz之间的频率范围内，或者与该频率范围相重叠。

在一个实施例中，该一个或更多个数字信号包括左数字信号和右数字信号，以使得该一个或更多个数字信号包括将要被输出至左扬声器和右扬声器的左滤波信号和右滤波信号。

在一个实施例中，该一个或更多个数字滤波器包括多个数字滤波器。在一个实施例中，该一个或更多个数字信号被分离为数量与该多个数字滤波器的数量相同的信号，以将该多个数字滤波器并行地应用于该多个分离的信号。在一个实施例中，通过将已被该多个数字滤波器滤波的该多个分离的信号相组合，来获得该一个或更多个滤波信号的每个信号。在一个实施例中，该组合包括对该多个分离的信号进行求和。

在一个实施例中，该多个数字滤波器包括第一数字滤波器和第二数字滤波器。在一个实施例中，该第一数字滤波器和第二数字滤波器的每个滤波器包括产生基本上在通带部分中最大限度地平坦并且在听觉响应函数的阻带部分中基本上滚降至零的响应的滤波器。在一个实施例中，该第一数字滤波器和第二数字滤波器的每个滤波器包括巴特沃斯滤波器。在一个实施例中，该第一数字滤波器和第二数字滤波器之一的通带部分由在约2.5KHz与约7.5KHz之间的频率范围所限定。在一个实施例中，该第一数字滤波器和第二数字滤波器之一的通带部分由在约8.5KHz与约18KHz之间的频率范围所限定。

在一个实施例中，该一个或更多个数字滤波器的选择是基于听者附近的有限数量的几何位置的。在一个实施例中，该几何位置包括多个半平面，每个半平面由沿着听者两耳之间的方向的边界以及相对于由听者两耳和听者前方所限定的水平面的仰角

来限定。在一个实施例中，将该多个半平面分组为一个或更多个前半平面以及一个或更多个后半平面。在一个实施例中，该前半平面包括在听者前方并在约0度和+/-45度的仰角处的半平面，该侧半平面包括在听者后方并在约0度和+/-45度的仰角处的半平面。

在一个实施例中，该一个或更多个数字滤波器的针对该一个或更多个数字信号的应用对将声源放置在听者附近的所选的方位处的效果进行模拟。

本公开的另一实施例涉及一种用于处理数字音频信号的系统。该系统包括耳间时差(ITD)组件，配置用于接收单声道输入信号并产生左ITD调整信号和右ITD调整信号，以模拟声音从声源到达听者的左耳和右耳的到达时间差。该单声道输入信号包括与声源相对于听者的空间位置有关的信息。该系统还包括定位滤波器组件，配置用于接收左ITD调整信号和右ITD调整信号，将一个或更多个数字滤波器应用于该左ITD调整信号和右ITD调整信号的每个信号，以产生左滤波数字信号和右滤波数字信号，该一个或更多个数字滤波器的每个滤波器是基于听觉响应函数的特定范围的，以使得该左滤波数字信号和右滤波数字信号对该听觉响应函数进行模拟。该系统还包括耳间强度差(IID)组件，配置用于接收该左滤波数字信号和右滤波数字信号，并产生左IID调整信号和右IID调整信号，以模拟声音到达左耳和右耳的强度差。

在一个实施例中，该头部响应函数包括头部相关传输函数(HRTF)。在一个实施例中，该特定范围包括该HRTF中的特定频率范围。在一个实施例中，该特定频率范围基本上在提供了针对平均人类听觉的、大于可听见的频率中的平均灵敏度的方位区分灵敏度的频率范围内，或者与该频率范围相重叠。在一个实施例中，该特定频率范围包括该HRTF中的波峰结构，或者基本上与该波峰结构相重叠。在一个实施例中，该波峰结构基本上在约2.5KHz与约7.5KHz之间的频率范围内，或者与该频率范围相重叠。在一个实施例中，该波峰结构基本上在约8.5KHz与约18KHz之间的频率范围内，或者与该频率范围相重叠。

在一个实施例中，该ITD包括与sinθcos

表示声源相对于由听者的双耳和前方所限定的水平面的仰角。

在一个实施例中，在声源的空间位置改变时执行该ITD的确定。在一个实施例中，该ITD组件还被配置用于执行该ITD在先前值与当前值之间的交叉衰减过渡。在一个实施例中，该交叉衰减过渡包括在多个处理周期期间将该ITD从先前值改变为当前值。

在一个实施例中，该ITD组件被配置用于确定声源是否位于相对于听者的左侧或右侧。该ITD组件还被配置用于将位于声源相对侧的左滤波信号或右滤波信号指定为较弱的信号。该ITD组件还被配置用于将左滤波信号或右滤波信号的另一个指定为较强的信号。该ITD组件还被配置用于通过第一补偿来调整该较弱的信号。该ITD组件还被配置用于通过第二补偿来调整该较强的信号。

在一个实施例中，该第一补偿包括与cosθ成比例的补偿值，其中θ表示声源相对于听者的前方的方位角。在一个实施例中，该第二补偿包括与sinθ成比例的补偿值，其中θ表示声源相对于听者的前方的方位角。

在一个实施例中，在将新的一个或更多个数字滤波器应用于左滤波信号与右滤波信号时，由于声源的所选的移动而执行该左滤波信号与右滤波信号针对IID的调整。在一个实施例中，该ITD组件还被配置用于执行该第一补偿值和第二补偿值在先前值与当前值之间的交叉衰减过渡。在一个实施例中，该交叉衰减过渡包括在多个处理周期期间改变该第一补偿值和第二补偿值。

在一个实施例中，该一个或更多个数字滤波器包括多个数字滤波器。在一个实施例中，将该一个或更多个数字信号中的每个信号分离为数量与该多个数字滤波器的数量相同的信号，以便将该多个数字滤波器并行地应用于该多个分离的信号。在一个实施例中，通过将已被该多个数字滤波器滤波的该多个分离的信号相组合来获得左滤波信号和右滤波信号的每个信号。在一个实施例中，该组合包括对该一个或更多个分离的信号进行求和。

在一个实施例中，该定位滤波器组件还被配置用于基于听者附近的有限数量的几何位置来选择一个或更多个数字滤波器。在一个实施例中，该几何位置包括多个半平面，每个半平面由沿着听者两耳之间的方向的边界以及相对于由听者两耳与听者前方所限定的水平面的仰角来限定。在一个实施例中，将该多个半平面分组为一个或更多个前半平面以及一个或更多个侧半平面。在一个实施例中，该前半平面包括在听者前方并在约0度和+/-45度的仰角处的半平面，该侧半平面包括在听者侧面并在约0度和+/-45度的仰角处的半平面。

在一个实施例中，该系统还包括至少一个以下组件：采样速率转换组件、配置用于模拟声源速度的多普勒调整组件、配置用于考虑声源与听者之间的距离的距离调整组件、配置用于考虑听者的头部相对于声源的方向的方向调整组件、或者用于模拟混响效果的混响调整组件。

本公开的另一实施例涉及一种用于处理数字音频信号的系统。该系统包括多个信号处理链，每个链包括耳间时差(ITD)组件，配置用于接收单声道输入信号并产生左ITD调整信号和右ITD调整信号，以模拟声音从声源到达听者的左耳和右耳的到达时间差。该单声道输入信号包括与声源相对于听者的空间位置有关的信息。每个链还包括定位滤波器组件，配置用于接收左ITD调整信号和右ITD调整信号，将一个或更多个数字滤波器应用于该左ITD调整信号和右ITD调整信号的每个信号，以产生左滤波数字信号和右滤波数字信号，该一个或更多个数字滤波器的每个滤波器是基于听觉响应函数的特定范围的，以使得该左滤波数字信号和右滤波数字信号对该听觉响应函数进行模拟。每个链还包括耳间强度差(IID)组件，配置用于接收该左滤波数字信号和右滤波数字信号，并产生左IID调整信号和右IID调整信号，以模拟声音到达左耳和右耳的强度差。

本公开的另一实施例涉及一种具有接收一个或更多个数字信号的装置的设备。该设备还包括用于基于与声源的空间位置有关的信息来选择一个或更多个数字滤波器的装置。该设备还包括用于将该一个或更多个数字滤波器应用于该一个或更多个数字信号以产生模拟听觉响应函数的效果的对应的一个或更多个滤波信号的装置。

本公开的另一实施例涉及一种具有用于形成一个或更多个电子滤波器的装置、以及用于将该一个或更多个电子滤波器应用于声音信号以模拟三维声效的设备。

附图说明

图1示出了在定位音频引擎可以向听者提供移动的声源的声效时的示例性听觉情况；

图2示出了在定位音频引擎可以向使用耳机的听者提供环绕声效果时的另一示例性听觉情况；

图3示出了定位音频引擎的整体功能框图；

图4示出了可以由图3的定位音频引擎执行的过程的一个实施例；

图5示出了可以作为图4的过程的更具体的示例的过程的一个实施例；

图6示出了可以作为图5的过程的更具体的示例的过程的一个实施例；

图7A以示例方式示出了如何将来自响应曲线的一个或更多的方位关键信息转换为相对简单的滤波器响应；

图7B示出了可以提供图7A的示例性转换的过程的一个实施例；

图8示出了用于说明目的的示例性空间几何定义；

图9示出了可以将听者附近的空间划分为四个象限的示例性空间配置；

图10示出了示例性空间配置，其中可以将图9的空间配置中的声源近似地定位在X轴附近的多个离散的半平面上，从而简化了定位滤波过程；

图11A-11C示出了可以在图10的一些半平面上的各个示例性方位处获得的诸如HRTF的示例性响应曲线，以使得可以获得针对各个半平面的定位关键模拟滤波器响应；

图12示出了在一个实施例中，定位滤波器可以提供定位关键模拟滤波器响应，并且可以使用耳间时差(ITD)和耳间强度差(IID)功能来操作；

图13示出了图12的ITD组件的一个实施例；

图14示出了图12的定位滤波器组件的一个实施例；

图15示出了图12的IID组件的一个实施例；

图16示出了可以由图12的ITD组件执行的过程的一个实施例；

图17示出了可以由图12的定位滤波器和IID组件执行的过程的一个实施例；

图18示出了可以被执行用于提供图12的ITD、定位滤波器以及IID组件的功能的过程，其中交叉衰减功能可以提供移动的声源的效果的平滑过渡；

图19示出了示例性信号处理配置，其中定位滤波器组件可以是具有其它声音处理组件的链的一部分；

图20示出了在一个实施例中，可以实现多个信号处理链以模拟多个声源；

图21示出了图20的实施例的另一变体；

图22A和22B示出了其中可以实现具有定位滤波器的定位音频引擎的音频系统的非限定性示例；以及

图23A和23B示出了可以实现定位滤波器的功能以向用户提供增强的收听体验的设备的非限定性示例。

根据对以下详细说明的阅读并参照附图，本教益的这些和其它方面、优点以及新颖性特征将变得显而易见。在附图中，类似的元素具有类似的附图标记。

具体实施方式

本公开总体上涉及音频信号处理技术。在一些实施例中，可以在音频或音频/视觉设备上实现本公开的各个特征和技术。如在此所述的，本公开的各个特征提供了音频信号的有效处理，因此在一些应用中，即使在具有有限的信号处理资源的情况下也能够获得逼真的定位声像。因此，在一些实施例中，可以通过计算能力可能有限的诸如手持式设备的便携式设备来输出具有对听者的逼真影响的声音。应当理解，此处公开的各个特征和思想并不限定于在便携式设备中实现，而是可以在处理声音信号的任何电子设备中实现。

图1示出了示例性情况100，其中将听者102示出为收听来自扬声器108的声音110。将听者102描述为对位于相对于听者102的特定方位处的一个或更多的声源112进行感知。示例性声源112a“表现为”位于听者102的前方和右侧；示例性声源112b表现为位于听者的后方和左侧。声源112a还被描述为相对于听者正在移动(如箭头114所示)。

仍如图1所示，一些声音可以使得听者102相对于一些声源移动。可以实现声源和听者方向和动作的许多其它组合。在一些实施例中，这种与对应的视觉感知(例如来自屏幕)相组合的音频感知可以向听者提供有效和强大的感官效果。

在一个实施例中，定位音频引擎104可以产生和向扬声器108提供信号106，以实现这种收听效果。下面更详细地描述定位音频引擎104的各个实施例和特征。

图2示出了在听者102正收听来自诸如耳机124的双扬声器设备的声音时的另一示例性情况120。此外，定位音频引擎104被描述为产生和向该示例性耳机提供信号122。在该示例性实施方式中，听者102所感知的声音使得在相对于听者102基本上固定的方位处存在多个声源。例如，可以通过使得多个声源126(该示例中是五个，但是其它数量和配置也是可能的)表现为被定位在特定方位处，来产生环绕声效果。

在一些实施例中，这种与对应的视觉感知(例如来自屏幕)相组合的音频感知可以向听者提供有效和强大的感官效果。例如，因此，可以为通过耳机收听手持设备的听者产生环绕声效果。下面更详细地描述定位音频引擎104的各种实施例和特征。

图3示出了接收输入信号132并产生输出信号134的定位音频引擎130的框图。可以以诸多方式来实现具有此处所述的特征的这种信号处理。在非限定性示例中，可以将定位音频引擎130的一些或全部功能实现为电子设备中的操作系统与多媒体应用之间的应用编程接口(API)。在另一非限定性示例中，可以将该引擎130的一些或全部功能合并到源数据中(例如合并至数据文件或流数据)。

其它配置是可能的。例如，本公开的各个思想和特征可被实现用于处理模拟系统中的信号。在这种系统中，可以基于定位关键(1ocation-critical)的信息以与此处所述的各种技术相类似的方式来配置定位滤波器的模拟等效物。因此，应当理解，本公开的各个思想和特征并不限定于数字系统。

图4示出了可以由定位音频引擎130执行的过程140的一个实施例。在过程框142中，在给定的频率范围中获得所选的定位响应信息。在一个实施例中，该给定的范围可以是可听见的频率范围(例如，从约20Hz至约20KHz)。在过程框144中，基于所选的定位响应信息来处理音频信号。

图5示出了过程150的一个实施例，其中过程140(图4)的所选的定位响应信息可以是方位关键或方位相关信息。在过程框152中，从频率响应数据中获得方位关键信息。在过程框154中，基于该方位关键信息来确定方位或者一个或更多的声源。

图6示出了过程160的一个实施例，其中可以执行过程150(图5)的更具体的实施方式。在过程框162中，获得了一组离散的滤波器参数，其中该滤波器参数可以对一个或更多个HRTF(头部相关传输函数)的一个或更多个方位关键部分进行模拟。在一个实施例中，该滤波器参数可以是用于数字信号滤波的滤波器系数。在过程框164中，基于使用该滤波器参数的滤波来确定一个或更多个声源的方位。

出于说明的目的，“方位关键”表示人类听觉响应频谱(例如频率响应频谱)的一部分，在该部分中发现声源方位区分特别灵敏。HRTF是人类听觉响应频谱的一个示例。研究(例如E.A.Macperson的“Acomparison of spectral correlation and local feature-matching models ofpinna cue processing”，Jounal of the Acoustical Society of America，101，3105，1997)表明，人类听者通常并不对整个HRTF信息进行处理以辨别声音来自何处。相反，人类听者表现为聚焦于HRTF中的特定特征。例如，在超过4KHz的频率中的局部特征匹配和梯度相关表现为对于声音方向区分而言特别重要，而HRTF的其它部分通常被忽略。

图7A示出了与针对位于相对于右侧约45度处的前方处(大致在耳朵的水平面处)的示例性声源的左耳听觉响应和右耳听觉响应相对应的示例性HRTF 170。在一个实施例中，可以认为由箭头172和174指示的两个波峰结构及相关结构(例如波峰172和174之间的波谷)针对示例性声源方向的左耳听觉是方位关键的。类似地，可以认为由箭头176和178指示的两个波峰结构及相关结构(例如波峰176和178之间的波谷)针对示例性声源方向的右耳听觉是方位关键的。

图7B示出了过程190的一个实施例，该过程190在过程框192中可以根据诸如图7A的示例性HRTF 170的响应数据来识别一个或更多个方位关键的频率(或频率范围)。在示例性HRTF170中，由箭头172、174、176和178指示两个示例性频率。在过程框194中，可以获得模拟一个或更多个这种方位关键的频率响应的滤波器系数。如此处所述的，并且如过程框196所示，可以随后使用这种滤波器系数来模拟产生HRTF170的、对示例性声源方向的响应。

可以根据过程框194中确定的滤波器系数来产生与HRTF170相对应的模拟滤波器响应180。如所示出的，复制波峰186、188、182和184(以及相应的波谷)，以提供用于声源的方位区分的位置关键响应。所示出的HRTF170的其它部分通常被忽略，从而表现为在较低频率处基本上平坦的响应。

由于仅选择某个(些)部分和/或结构(在本示例中是两个波峰和相关的波谷)，因此可以大大简化滤波器响应的形成(例如产生示例性模拟响应180的滤波器系数的确定)。此外，可以存储该滤波器系数并随后以大大简化的方式来使用该滤波器系数，从而基本上减少了实现至听者的逼真的方位区分的声音输出所需要的计算能力。下面更详细地描述滤波器系数确定及后续使用的特定示例。

在此处的描述中，在选择两个波峰的示例的上下文中描述滤波器系数确定及后续使用。然而，应当理解，在一些实施例中，可以识别和模拟HRTF的其它部分和/或特征。例如，因此，如果给定的HRTF具有可以是方位关键的三个波峰，则可以识别和模拟这三个波峰。因此，取代针对两个波峰的两个滤波器，三个滤波器可以表现这三个波峰。

在一个实施例中，可以通过获得产生对期望特征和/或范围的近似响应的滤波器系数，来模拟HRTF的所选特征和/或范围(或其它频率响应曲线)。可以使用任意多种已知技术来获得该滤波器系数。

在一个实施例中，所选的特征(例如波峰)可以提供的简化允许使用简化的滤波技术。在一个实施例中，可以利用快速简单的滤波(如无限冲击响应(IIR))来模拟有限数量的所选方位关键特征的响应。

可以使用已知的巴特沃斯滤波技术以示例方式模拟示例性HRTF170的两个示例性波峰(用于左侧听觉的172和174，以及用于右侧听觉的176和178)。可以使用任何已知的技术来获得这种已知的滤波器的系数，例如，包括诸如MATLAB的信号处理应用程序。表1示出了可以返回该示例性HRTF170的模拟响应的MATLAB函数调用的示例。

表1

波峰	增益	MATLAB滤波器函数调用 Butter(阶，标准化范围，滤波器类型)
			波峰172(左)	2dB	阶＝1 范围＝[2700/(采样速率/2)，6000/(采样速率/2)] 滤波器类型＝“带通”
波峰174(左)	2dB	阶＝1 范围＝[11000/(采样速率/2)，14000/ (采样速率/2)] 滤波器类型＝“带通”
			波峰176(右)	3dB	阶＝1 范围＝[2600/(采样速率/2)，6000/(采样速率/2)] 滤波器类型＝“带通”
波峰178(右)	11dB	阶＝1 范围＝[12000/(采样速率/2)，16000/ (采样速率/2)] 滤波器类型＝“带通”

在一个实施例中，响应于示例性HRTF170的所选波峰的前述示例性IIR滤波器可以产生模拟响应180。如过程190的过程框196所示，可以存储相应的滤波器系数以用于后续使用。

如前所述，可以示例HRTF170及模拟响应180与位于前方距右侧约45度的声源相对应(大致在耳朵水平面处)。以类似的方式获得对其他源位置的响应，以提供听者附近的二维或三维的响应覆盖。下面更详细地描述针对其它声源方位的特定的滤波示例。

图8示出了用于此处的说明目的的示例性空间坐标定义200。假设听者102将位于原点处。Y轴被认为是听者102所面对的前方。因此，X-Y平面表示相对于听者102的水平面。声源202被示出为位于距原点的距离为“R”之处。角

表示距离水平面的仰角，角θ表示距离Y轴的方位角。例如，因此，正好位于听者头部后方的声源将具有θ＝180度，且

＝0度。

在一个实施例中，如图9所示，可以将听者(在原点处)附近的空间划分为前方和后方以及左侧和右侧。在一个实施例中，可以定义前半平面210和后半平面212，以使得该前半平面210和后半平面212共同定义了具有仰角

并在X轴处与X-Y平面相交的平面。例如，因此，位于θ＝45且

＝0处并与图7A的示例性HRTF170相对应的示例性声源位于右前方(FR)区域并位于

＝0处的前半平面。

在一个实施例中，如下文更详细地描述的，各个半平面可以高于和/或低于水平线，以考虑高于和/或低于耳朵水平面的声源。对于给定的半平面，针对一侧(例如右侧)获得的响应可用于通过听者头部的对称方式来估计在另一侧(例如左侧)的镜像图像方位处(Y-Z平面附近)的响应。在一个实施例中，由于对于前方和后方不存在这种对称，因此针对前方和后方(以及因而针对前半平面和后半平面)可以获得单独的响应。

图10示出了，在一个实施例中，可以将听者(在原点处)周围的空间划分为多个前半平面和后半平面。在一个实施例中，前半平面362可以位于水平方向(

＝0)，对应的后半平面364也将基本上是水平的。前半平面366可以位于约45度(

＝45°)处的前上方，对应的后半平面368将位于低于后半平面364约45度处。前半平面370将位于约-45度(

＝-45°)的方向，对应的后半平面372将位于高于后半平面364约45度处。

在一个实施例中，在听者附近的声源可被近似为位于一个前述的半平面上。每个半平面可具有模拟在该半平面处的声源的响应的一组滤波器系数。因此，上文参照图7A所述的示例性模拟响应可以提供一组用于前水平半平面362的滤波器系数。可以通过调整左侧响应和右侧响应的相应增益，来对针对位于前水平半平面362上的任何地方的声源的模拟响应进行近似，以考虑距离前方(Y轴)的左侧位移和右侧位移。此外，可以以下文所述的方式来对诸如声源距离和/或速度之类的其它参数进行近似。

图11A-11C示出了针对可以以与上述相类似的方式获得的各种对应的HRTF(未示出)的模拟响应的一些示例。图11A示出了根据与θ＝270°且

＝+45°(正好在前上半平面366左侧)处相对应的HRTF的方位关键部分获得的示例性模拟响应380。图11B示出了根据与θ＝270°且＝0°(正好在水平半平面362左侧)处相对应的HRTF的方位关键部分获得的示例性模拟响应382。图11C示出了根据与θ＝270°且

＝-45°(正好在前下半平面370左侧)处相对应的HRTF的方位关键的部分获得的示例性模拟响应384。针对后半平面372、364和368可以获得类似的模拟响应。此外，可以在θ的各个值处获得这种模拟响应。

注意，在示例性模拟响应384中，可以使用带阻巴特沃斯滤波来获得对所识别的特征的期望的近似。因此，应当理解，可以使用各种类型的滤波技术来获得期望的结果。此外，可以使用除了巴特沃斯滤波器之外的滤波器来实现类似的结果。此外，尽管使用IIR滤波器来提供快速简单的滤波，但是至少一些本公开的技术还可使用其它滤波器(例如有限冲击响应(FIR)滤波器)来实现。

针对前述的示例性半平面配置(＝+45°，0°，-45°)，表2列出了可被输入以获得针对六个半平面(366，362，370，372，364和368)的滤波器系数的滤波参数。针对(如同表1的)表2中的示例性参数，可以在MATLAB中进行示例性巴特沃斯滤波器函数调用如下：“butter(Order，[f_Low/(SamplingRate/2，f_High/(SamplingRate/2)，Type)”其中对于每个给定的滤波器，Order表示滤波器项的最高阶，f_Low和f_High 表示所选的频率范围的边界值，SamplingRate表示采样速率，Type表示滤波器类型。用于滤波器参数的其它值和/或类型也是可能的。

表2

半平面	滤波器	增益 (dB)	阶	频率范围 (f_Low，f_High) (KHz)	类型
						前方，	左#1	2	1	2.7，6.0	带通

＝+0°
						前方，＝+0°	左#2	2	1	11，14	带通
前方，＝+0°	右#1	3	1	2.6，6.0	带通
						前方，＝+0°	右#2	11	1	12，16	带通
前方，＝+45°	左#1	-4	1	2.5，6.0	带通
						前方，＝+45°	左#2	-1	1	13，18	带通
前方，＝+45°	右#1	9	1	2.5，7.5	带通
						前方，＝+45°	右#2	6	1	11，16	带通
前方，＝-45°	左#1	-15	1	5.0，7.0	带阻
						前方，＝-45°	左#2	-11	1	10，13	带阻
前方，＝-45°	右#1	-3	1	5.0，7.0	带阻
						前方，＝-45°	右#2	3	1	10，13	带阻
后方，＝+0°	左#1	6	1	3.5，5.2	带通
						后方，＝+0°	左#2	1	1	9.5，12	带通
后方，＝+0°	右#1	13	1	3.3，5.1	带通
						后方，	右#2	6	1	10，14	带通

＝+0°
						后方，＝+45°	左#1	6	1	2.5，7.0	带通
后方，＝+45°	左#2	1	1	11，16	带通
						后方，＝+45°	右#1	13	1	2.5，7.0	带通
后方，＝+45°	右#2	6	1	12，15	带通
						后方，＝-45°	左#1	6	1	5.0，7.0	带阻
后方，＝-45°	左#2	1	1	10，12	带阻
						后方，＝-45°	右#1	13	1	5.0，7.0	带阻
后方，＝-45°	右#2	6	1	8.5，11	带阻

如表2所示，在一个实施例中，每个半平面可以具有四组滤波器系数：用于左侧和右侧的每一侧的、针对两个示例性方位关键波峰的两个滤波器。因此，在六个半平面的情况下，可以存在24个滤波器。

在一个实施例中，可以使用相同的滤波器系数来模拟对来自位于给定半平面上的任意地方的声源的声音的响应。如下文将更详细地说明的，可以考虑和调整由于左右置换、距离、和/或源速度而导致的效果。如果声源从一个半平面移动至另一半平面，则可以以下文所述的方式来实现滤波器系数的过渡(transition)，以提供所感知的信号中的平滑过渡。

在一个实施例中，如果给定的声源位于两个半平面之间某处的方位处(例如，该声源在前方，

＝+30°)，则该声源可被认为是位于“最近的”平面处(例如，该最近的半平面将是前方，

＝+45°)。如同可以看出的，在特定情况下期望在听者附近的空间中提供或多或少的半平面，以提供或多或少的半平面分配中的“粒度”。

此外，不必将该三维空间划分为关于X轴的半平面。可以将该空间划分为相对于听者的任意的一个、两个或三个维度的几何。在一个实施例中，如同在关于X轴的半平面中所作的，可以利用诸如左侧听觉和右侧听觉之类的几何来减少滤波器系数的组数。

应当理解，上述的六个半平面配置(

＝+45°，0°，-45°)是针对相对于听者的有限数量的方向如何提供所选方位关键响应信息的示例。通过这样做，可以使用较小的计算能力和/或资源来再现基本逼真的三维声效。即使为了更精细粒度增加半平面的数量(假设为十个(在

＝+60°、+30°、0°、-30°、-60°处的前方和后方))，可以将滤波器系数的组数保持在可管理的级别。

图12示出了功能框图220的一个实施例，其中定位滤波226可以通过对上述的定位关键信息的模拟来提供定位音频引擎的功能。在一个实施例中，可以将具有与声源的方位有关的信息的单声道输入信号222输入用于确定耳间时延(或时差)(“ITD”)的组件224。ITD可以基于该声源的方位信息来提供与到达两耳时间的差别有关的信息。下面更详细地描述ITD功能的示例。

在一个实施例中，ITD组件224可以输出考虑到达差别的左信号和右信号，并且可以将该输出信号提供给定位滤波器组件226。下面更详细地描述定位滤波器组件226的示例性操作。

在一个实施例中，定位滤波器组件226可以输出针对定位关键响应进行调整的左信号和右信号。可以将该输出信号提供至用于确定耳间强度差(“IID”)的组件228中。IID可以提供对定位滤波器输出的调整，以针对左信号和右信号的强度中的位置依赖性来进行调整。下面更详细地描述IID补偿的示例。IID组件228可以将左信号和右信号230输出至扬声器，以提供声源的定位效果。

图13示出了可被实现为图12的ITD组件224的ITD240的一个实施例的框图。如图所示，输入信号242可以包括在给定采样时间与声源方位有关的信息。该方位可以包括声源的θ和

的值。

示出输入信号242以提供给用于计算(如果声源被定位在一侧)模拟在左耳和右耳处的不同到达时间所需要的耳间时延的ITD计算组件244。在一个实施例中，可以如下计算ITD：

ITD＝|(Maximum_ITD_Samples_per_Sampling_Rate-1)sinθcos|.(1)

因此，如同所期望的，当声源正好位于前方(θ＝0°)或者正好位于后方(θ＝180°)时，ITD＝0；并且当声源正好位于左侧(θ＝270°)或者正好位于右侧(θ＝90°)时，ITD具有最大值(针对给定的

的值)。类似地，当声源位于水平面处(

＝0°)时，ITD具有最大值，当声源位于顶部(

＝90°)或底部(＝-90°)的方位处时ITD的值为零。

可以将以前述方式确定的ITD引入输入信号242，以产生ITD调整后的左信号和右信号。例如，如果声源方位是在右侧，则右信号可以从输入信号中声音的定时中减去ITD。类似地，左信号可以向输入信号中声音的定时添加ITD。这种用于产生左信号和右信号的定时调整可以以已知的方法来实现，并且被描述为左延迟线和右延迟线246a和246b。

如果声源相对于听者基本上是固定的，则相同的ITD可以提供基于到达时间的三维声效。然而，如果声源移动，则ITD也可能改变。如果ITD的新值被包括到延迟线中，则可能存在先前的基于ITD的延迟的突然变化，从而可能导致ITD感知中的可检测到的位移。

如图13所示，在一个实施例中，ITD组件240还可包括为左延迟线和右延迟线246a和246b提供至新延迟时间的更平滑过渡的交叉衰减组件250a和250b。下面更详细地描述ITD交叉衰减操作的示例。

如图13所示，左延迟调整信号和右延迟调整信号248被示出为由ITD组件240输出。如上文所述，该延迟调整信号248可以或可以不被交叉衰减。例如，如果声源是固定的，则由于ITD基本上保持相同，因此可以不需要交叉衰减。如果声源移动，则会期望交叉衰减来减少或基本上消除由于声源方位改变而导致的ITD中的位移。

图14示出了可被实现为图12的组件226的定位滤波器组件260的一个实施例的框图。如图所示，左信号和右信号262被示出为被输入至定位滤波器组件260。在一个实施例中，输入信号262可由图13的ITD组件240提供。然而，应当理解，与滤波器准备工作(例如基于方位关键响应的滤波器系数确定)和/或滤波器使用相关的各种特征和概念不必取决于具有ITD组件240所提供的输入信号。例如，来自声源数据的输入信号可能已具有左/右区别的信息和/或ITD区别的信息。在这种情况下，定位滤波器组件260可以作为基本上独立的组件来操作，以提供包括基于所选的方位关键的信息来提供声音的频率响应的功能。

如图14所示，可将左输入信号和右输入信号262提供给滤波器选择组件264。在一个实施例中，滤波器选择可基于与声源相关的θ和

的值。对于此处所述六个半平面的示例而言，θ和

可以将声源方位与半平面之一唯一相关。如上文所述，如果声源并不位于半平面之一上，则可以将该声源与“最近的”半平面相关。

例如，假设声源位于θ＝10°且

＝+10°处。在这种情况下，由于该方位在前方并且水平方向最接近于该10度的仰角，因此可以选择前水平半平面(图10中的362)。前水平半平面362可以具有以表2所示示例性方式所确定的一组滤波器系数。因此，针对该示例性声源方位，可以选择与“前方，

＝+0°”半平面相对应的四个示例性滤波器(2个左滤波器和2个右滤波器)。

如图14所示，(由选择组件264所识别的)左滤波器266a和268a可应用于左信号，(也由选择组件264所识别的)右滤波器266b和268b可应用于右信号。在一个实施例中，每个滤波器266a、268a、266b和268b基于其相应的滤波器系数以已知的方式对数字信号进行操作。

如此处所述，两个左滤波器和两个右滤波器处于两个示例性方位关键波峰的上下文中。应当理解，其它数量的滤波器是可能的。例如，如果在频率响应中存在三个方位关键的特征和/或范围，则针对左侧和右侧的每一侧可能存在三个滤波器。

如图14所示，左增益组件270a可以调整左信号的增益，右增益组件270b可以调整右信号的增益。在一个实施例中，与表12的参数相对应的以下增益可应用于左信号和右信号。

表3

	0度仰角	45度仰角	-45度仰角
				左增益	-4dB	-4dB	-20dB
右增益	2dB	-1dB	-5dB

在一个实施例中，可以分配表3列出的示例性增益值用于基本上保持在这三个示例性仰角处的左信号与右信号之间的正确的电平差。因此，这些示例性增益可用于提供左过程和右过程中的正确的电平，在该示例中每个过程包括(来自第一和第二滤波器266和268的)滤波器输出和(来自增益组件270的)成比例输入的三路求和。

如图14所示，在一个实施例中，可以通过相应的加法器272a和272b来对滤波器和增益调整后的左信号和右信号进行求和，以产生左输出信号和右输出信号274。

图15示出了可被实现为图12的组件228的IID(耳间强度差)调整组件280的一个实施例的框图。如图所示，示出左信号和右信号282输入IID组件280。在一个实施例中，输入信号282可由图14的定位滤波器组件260提供。

在一个实施例中，IID组件280可以在第一补偿组件284中调整较弱的声道信号的强度，以及在第二补偿组件286中调整较强的声道信号的强度。例如，假设声源位于θ＝10°处(也就是说，向右侧的10度处)。在这种情况下，可以认为右声道是较强的声道，而左声道是较弱的声道。因此，可以将第一补偿284应用于左信号，而将第二补偿286应用于右信号。

在一个实施例中，可以通过如下给定的数量来调整较弱的声道信号的电平：

Gain＝|cosθ(Fixed_Filter_Level_Difference_per_Elevation-1.0)|+1.0(2)

因此，如果θ＝0度(正好在前方)，则通过原始的滤波器电平差来调整较弱的声道的增益。如果θ＝90度(正好在右方)，则Gain＝1，并且不对较弱的声道进行增益调整。

在一个实施例中，可以通过如下给定的数量来调整较强的声道信号的电平：

Gain＝sinθ+1.0 (3)

因此，如果θ＝0度(正好在前方)，则Gain＝1，并且不对较强的声道进行增益调整。如果θ＝90度(正好在右方)，则Gain＝2，从而提供了6dB的增益补偿，以便粗略地与在不同的θ值处的总响度相匹配。

如果声源基本上是固定的或者基本上在给定的半平面内移动，则可以使用相同的滤波器来产生滤波器响应。可以通过如上文所述的IID补偿来提供针对较弱听觉侧和较强听觉侧的强度补偿。然而，如果声源从一个半平面移动至另一半平面，则滤波器也可以改变。因此，基于滤波器电平的IID可以不以进行平滑的半平面过渡的方式来提供补偿。在声源在半平面之间移动时，这种过渡可能导致强度中的可检测到的突然位移。

因此，在如图15所示的一个实施例中，IID组件280还可包括在声源从旧的半平面向新的半平面移动时提供向新的半平面的平滑过渡的交叉衰减组件290。下面更详细地描述IID交叉衰减操作的示例。

如图15所示，示出左强度调整信号和右强度调整信号288由IID组件280输出。如上文所述，强度调整信号288可以或可以不是交叉衰减的。例如，如果声源是固定的或者在给定的半平面内移动，则由于滤波器基本上保持相同，因此可以不必进行交叉衰减。如果声源在半平面之间移动，则会期望交叉衰减来减少或基本上消除IID中的突然位移。

图16示出了可以由参照图12和13描述的ITD组件执行的过程300的一个实施例。在过程框302中，根据输入数据来确定声源位置角度θ和。在过程框304中，针对每个采样速率确定最大ITD采样。在过程框306中，确定针对左数据和右数据的ITD偏移量值。在过程框308中，将与该ITD偏移量值相对应的延迟引入该左数据和右数据中。

在一个实施例中，过程300还可包括针对左ITD调整信号和右 ITD调整信号来执行交叉衰减以考虑声源的运动的过程框。

图17示出了可由上文参照图12、14和15所述的定位滤波器组件和/或IID组件执行的过程310的一个实施例。在过程框312中，可以确定IID补偿增益。等式2和3是该补偿增益计算的示例。

在判决框314中，过程310确定声源是否位于前方并朝向右方(“F.R.”)。如果答案是“是”，则在过程框316中将前滤波器(以适当的仰角)应用于左数据和右数据。将应用了滤波器的数据和增益调整后的数据相加，以产生定位滤波器输出信号。由于声源位于右侧，因此右数据是较强的声道，并且左数据是较弱的声道。因此，在过程框318中，将第一补偿增益(等式2)应用于左数据。在过程框320中，将第二补偿增益(等式3)应用于右数据。在过程框322中输出定位滤波和增益调整后的左信号和右信号。

如果判决框314的答案是“否”，则声源并非位于前方并朝向右方。因此，过程310进行至其它剩余的象限。

在判决框324中，过程310确定声源是否位于后方并朝向右方(“R.R.”)。如果答案是“是”，则在过程框326中将后滤波器(以适当的仰角)应用于左数据和右数据。将应用了滤波器的数据和增益调整后的数据相加，以产生定位滤波器输出信号。由于声源位于右侧，因此右数据是较强的声道，并且左数据是较弱的声道。因此，在过程框328中，将第一补偿增益(等式2)应用于左数据。在过程框330中，将第二补偿增益(等式3)应用于右数据。在过程框332中输出定位滤波和增益调整后的左信号和右信号。

如果判决框324的答案是“否”，则声源并非位于F.R.或R.R.处。因此，过程310进行至其它剩余的象限。

在判决框334中，过程310确定声源是否位于后方并朝向左方(“R.L.”)。如果答案是“是”，则在过程框336中将后滤波器(以适当的仰角)应用于左数据和右数据。将应用了滤波器的数据和增益调整后的数据相加，以产生定位滤波器输出信号。由于声源位于左侧，因此左数据是较强的声道，并且右数据是较弱的声道。因此，在过程框338中，将第二补偿增益(等式3)应用于左数据。在过程框340中，将第一补偿增益(等式2)应用于右数据。在过程框342中输出定位滤波和增益调整后的左信号和右信号。

如果判决框334的答案是“否”，则声源并非位于F.R.、R.R.或R.L.处。因此，过程310进行至认为声源位于前方并朝向左方(“F.L.”)。

在过程框346中，将前滤波器(以适当的仰角)应用于左数据和右数据。将应用了滤波器的数据和增益调整后的数据相加，以产生定位滤波器输出信号。由于声源位于左侧，因此左数据是较强的声道，并且右数据是较弱的声道。因此，在过程框348中，将第二补偿增益(等式3)应用于左数据。在过程框350中，将第一补偿增益(等式2)应用于右数据。在过程框352中输出定位滤波和增益调整后的左信号和右信号。

图18示出了可以由上文参照图12-15所述的音频信号处理配置220执行的过程390的一个实施例。具体地，过程390可适应声源在半平面内或在半平面之间的运动。

在过程框392中，获得单声道输入信号。在过程框392中，确定基于定位的ITD并应用于输入信号。在判决框396中，过程390确定声源是否具有位置改变。如果答案是“否”，则可以从左延迟线和右延迟线读取数据，应用ITD延迟，并写回至延迟线。如果答案是“是”，则过程390在过程框400中基于新的位置来确定新的ITD延迟。在过程框402中，可以执行交叉衰减来提供在先前的ITD延迟与新的ITD延迟之间的平滑过渡。

在一个实施例中，可以通过从先前的延迟线和当前的延迟线读取数据来执行交叉衰减。例如，因此，每次调用过程390时，将θ和与历史中的θ和

进行比较，以确定声源方位是否改变。如果不存在变化，则不计算新的ITD延迟；并使用现有的ITD延迟(过程框398)。如果存在变化，则计算新的ITD延迟(过程框400)；并执行交叉衰减(过程框402)。在一个实施例中，可以通过将ITD延迟值从先前值逐渐增加或减少至新的值来实现ITD交叉衰减。

在一个实施例中，可以在检测到声源的位置改变时触发ITD延迟值的交叉衰减，并且该逐渐的变化可以在多个处理周期期间发生。例如，如果ITD延迟具有旧值ITD_old和新值ITD_new，则交叉衰减过渡可以在N个处理周期期间发生：

ITD(1)＝ITD_old，ITD(2)＝ITD_old+ΔITD/N，...，ITD(N-1)＝ITD_old+ΔITD(N-1)/N，ITD(N)＝ITD_new；其中ΔITD＝ITD_new-ITD_old(假设ITD_new＞ITD_old)。

如图18所示，还可使用或不使用ITD交叉衰减来进一步处理ITD调整后的数据，因此在过程框404中，可以基于θ和

的当前值来执行定位滤波。出于说明图18的目的，将假设过程框404还包括IID补偿。

在判决框406中，过程390确定在半平面中是否已存在变化。如果答案是“否”，则不执行IID补偿的交叉衰减。如果答案是“是”，则过程框408中的过程390基于θ和

的先前值来执行另一定位滤波。出于说明图18的目的，将假设过程框408还包括IID补偿。在过程框410中，可以在IID补偿值之间和/或在滤波器已改变时(例如当开关与先前的半平面和当前的半平面相对应的滤波器时)执行交叉衰减。这种交叉衰减可被配置用于在应用不同的IID增益、开关定位滤波器、或两者时消除毛刺或突然的位移。

在一个实施例中，可以通过将IID补偿增益从先前值逐渐地增加或减少至新的值，和/或将滤波器系数从先前的组逐渐地增加或减少至新的组，来实现IID交叉衰减。在一个实施例中，可以在检测到半平面中的变化时触发IID增益值的交叉衰减，并且IID增益值的逐渐变化可以在多个处理周期期间发生。例如，如果给定的IID增益具有旧值IID_old和新值IID_new，则交叉衰减过渡可以在N个处理周期期间发生：

IID(1)＝IID_old，IID(2)＝IID_old+ΔIID/N，...，IID(N-1)＝IID_old+ΔIID(N-1)/N，IID(N)＝IID_new；其中，ΔIID＝IID_new-IID_old(假设IID_new＞IID_old)。针对用于交叉衰减定位滤波器的定位滤波器系数，可以引入类似的逐渐变化。

仍如图18所示，在过程框412中，定位滤波和IID补偿的信号(无论是否经过IID交叉衰减)产生可以被放大的输出信号，以产生处理后的立体声输出414。

在一些实施例中，可以将ITD、ITD交叉衰减、定位滤波、IID、IID交叉衰减的各种特性、或其组合与其它声效增强特性相组合。图19示出了可以在ITD/定位滤波/IID处理之前或之后处理声音信号的信号处理配置420的一个实施例的框图。如图所示，来自声源422的声音信号可被处理用于采样速率转换(SRC)424，并被调整用于多普勒效果426，以模拟移动的声源。也可实现考虑距离428和听者源方向430的效果。在一个实施例中，可以将以前述方式处理的声音信号作为输入信号432提供给ITD组件434。可以以此处所述的方式来执行ITD处理以及定位滤波器436和IID438的处理。

仍如图19所示，通过混响组件440来进一步处理来自IID组件438的输出，以提供输出信号442中的混响效果。

在一个实施例中，SRC424组件、多普勒组件426、距离组件428、方向组件430以及混响组件440可以基于已知的技术，因此不必对其进行进一步说明。

图20示出了，在一个实施例中，多个音频信号处理链(称为1至N，N＞1)可以处理来自多个声源452的信号。在一个实施例中，可以与图19的单链示例420相类似地配置每个SRC454、多普勒456、距离458、方向460、ITD462、定位滤波器464和IID466的链。可以在相应的缩混组件470和474中组合来自该多个IID466的左输出和右输出，并且可以对这两个缩混的信号进行混响处理(472和476)，以产生输出信号478。

在一个实施例中，SRC 454、多普勒456、距离458、方向460、缩混(470和474)和混响(472和476)组件可以基于已知的技术；因此不必对其进行进一步说明。

图21示出了，在一个实施例中，其它的配置是可能的。例如，可以经由混响组件484、多普勒组件486、距离组件488和方向组件490来处理多个声音数据流(作为示例称为流1至8)482的每个流。可以将来自方向组件490的输出输入至输出左信号和右信号的ITD组件492。

如图21所示，可以将八个ITD492的输出经由缩混组件494定向至对应的定位滤波器。六组这样的定位滤波器496被描述为与六个示例性半平面相对应。定位滤波器496将其相应的滤波器应用于向其提供的输入，并提供对应的左输出信号和右输出信号。出于说明图21的目的，将假设该定位滤波器还可提供IID补偿功能。

如图21所示，可以通过缩混组件498来进一步缩混定位滤波器496的输出，该缩混组件498将2D流(例如标准的立体声内容)与如在此处所述地处理的3D流进行混合。在一个实施例中，这种缩混可以避免音频信号中的限幅。可以通过诸如SRS“WOW XT”应用的声音增强组件500来进一步处理缩混的输出信号，以产生输出信号502。

如通过示例方式所看到的，各种配置均可能使用各种其它声效增强技术来合并ITD、定位滤波器和/或IID的特性。因此，应当理解，除了所示出的配置之外的配置是可能的。

图22A和22B示出了关于如何实现定位滤波的各种功能的非限定性示例配置。在图22A所示的一个示例性系统510中，可由被指示为3D声音应用编程接口(API)520的组件来执行定位滤波。该API可以提供定位滤波功能，同时提供操作系统518与多媒体应用522之间的接口。然后音频输出组件524可以向诸如扬声器或耳机的输出设备提供输出信号526。

在一个实施例中，3D声音API520的至少一些部分可驻留于系统510的程序存储器516中，并受处理器514的控制。在一个实施例中，系统510还可包括向听者提供视觉输入的显示器组件512。显示器512所提供的可见信号以及API520所提供的声音处理可以增强针对听者/观看者的视听效果。

图22B示出了也可包括显示器组件532以及音频输出组件538的另一示例性系统530，该音频输出组件538向诸如扬声器或耳机的设备输出定位滤波的信号540。在一个实施例中，系统530可以包括对至少具有一些定位滤波所需的信息的数据534的内部到达或访问。例如，可以根据数据534向在处理器536的控制下运行的一些应用(未示出)提供各种滤波器系数和其它信息。其它的配置是可能的。

如此处所述的，定位滤波及相关的处理技术的各个特征允许产生逼真的三维声效，而不具有大量的计算需求。因此，本公开的各个特征对于计算能力和资源有限的便携式设备中的实现而言是特别有益的。

图23A和23B示出了可以实现各种定位滤波功能的便携式设备的非限定性示例。图23A示出了，在一个实施例中，可以在诸如蜂窝电话550的便携式设备中实现3D音频功能556。许多蜂窝电话提供了包括视频显示552和音频输出554的多媒体功能。然而，这种设备典型地具有有限的计算能力和资源。因此，3D音频功能556可以向蜂窝电话550的用户提供增强的收听体验。

图23B示出了，在另一示例性实现560中，可以通过定位滤波来模拟环绕声效果(由模拟的声源126所描绘)。向耳机124提供的输出信号564可以导致听者102在仅收听耳机124的左扬声器和右扬声器时体验到环绕声效果。

针对示例性环绕声配置560，定位滤波可被配置用于处理五个声源(例如图20或21中的五个处理链)。在一个实施例中，可以将与声源方位相关的信息(例如五个模拟扬声器)编码到输入数据中。由于五个扬声器126并不相对于听者102移动，因此五个声源的位置在处理中可以是固定的。因此，可以简化ITD确定；可以消除ITD交叉衰减；可以固定滤波器选择(例如，如果声源被放置在水平面上，则仅需要使用前水平半平面和后水平半平面)；可以简化IID补偿；以及可以消除IID交叉衰减。

关于便携式以及非便携式的设备的其它实施方式是可能的。

在此处的描述中，描述并以组件或模块的方式描绘了各种功能。这种描绘是出于说明的目的，并不一定意味着物理边界或封装配置。例如，图12(及其它图)描绘了作为组件的ITD、定位滤波器以及IID。应当理解，可以通过单个设备/软件、分离的多个设备/软件、或者两者的任何组合来实现这些组件的功能。此外，对于给定的组件如定位滤波器，可以通过单个设备/软件、多个设备/软件、或者两者的任何组合来实现其功能。

应当理解，处理器总体上可以示例方式包括如此处所述地操作的计算机、程序逻辑、或表示数据和指令的其它基础配置。在其它实施例中，该处理器可包括控制器电路、处理器电路、处理器、通用单芯片或多芯片微处理器、数字信号处理器、嵌入式微处理器、微控制器等。

此外，应当理解，在一个实施例中，可以有利地将该程序逻辑实现为一个或更多个组件。该组件可有利地配置用于在一个或更多个处理器上运行。该组件包括但不限于软件或硬件组件、诸如软件模块的模块、面向对象的软件组件、类组件和任务组件、过程方法、函数、属性、过程、子程序、程序代码段、驱动、固件、微码、电路、数据、数据库、数据结构、表、数组和变量。

尽管上述实施例已示出、描述和指出了应用于上述实施例的本发明的基本的新颖性特征，但是应当理解，在不背离本发明的范围的情况下，本领域的技术人员可以进行在所示出的设备、系统、和/或方法方面的各种省略、替换、改变。因此，本发明的范围不应限定于前述说明，而应由所附的权利要求所限定。

Claims

1.一种用于处理数字音频信号的方法，包括：

接收一个或多个数字信号，所述一个或多个数字信号具有与声源相对于听者的空间位置有关的信息；

选择一个或更多个数字滤波器，每个所述一个或更多个数字滤波器是根据听觉响应函数的特定范围而形成的；以及

将所述一个或更多个数字滤波器应用于所述一个或更多个数字信号，以产生对应的一个或更多个滤波信号，每个所述一个或更多个滤波信号具有被应用于所述声源的所述听觉响应函数的模拟效果，其中所述一个或更多个滤波信号包括要被输出至左扬声器和右扬声器的左滤波信号和右滤波信号；

针对耳间强度差IID来调整所述左滤波信号和右滤波信号的每个信号，以考虑可能存在并且未被所述一个或更多个滤波器的应用所考虑的任何强度差，其中所述针对IID的所述左滤波信号和右滤波信号的调整包括：

确定所述声源是否位于相对于所述听者的左侧或右侧；

将位于所述声源相对侧的左滤波信号或右滤波信号指定为较弱的信号；

将左滤波信号或右滤波信号的另一个指定为较强的信号；

通过第一补偿值来调整所述较弱的信号；以及

通过第二补偿值来调整所述较强的信号；以及

执行所述第一补偿值和第二补偿值的交叉衰减过渡。

2.根据权利要求1所述的方法，其中，基于所述声源相对于所述听者的所述空间位置，针对耳间时差ITD来调整所述左数字信号和右数字信号。

3.根据权利要求2所述的方法，其中所述时差值包括与

的绝对值成比例的数量，其中θ表示所述声源相对于所述听者的前方的方位角，

表示所述声源相对于由所述听者的双耳和所述前方所限定的水平面的仰角。

4.根据权利要求2所述的方法，其中所述ITD调整包括：

接收具有关于所述声源的所述空间位置的信息的单声道输入信号；

基于所述空间信息来确定时差值；以及

通过将所述时差值引入所述单声道输入信号，产生左信号和右信号

5.根据权利要求1所述的方法，其中所述第一补偿值与cosθ成比例，其中θ表示所述声源相对于所述听者的前方的方位角。

6.根据权利要求1所述的方法，其中所述第二补偿值包括与sinθ成比例的补偿值，其中θ表示所述声源相对于所述听者的前方的方位角。

7.根据权利要求1所述的方法，其中当由于所述声源的所选的移动而将新的一个或更多个数字滤波器应用于所述左滤波信号与右滤波信号时，执行所述针对IID的所述左滤波信号和右滤波信号的调整。

8.根据权利要求1所述的方法，其中所述交叉衰减过渡包括在多个处理周期期间改变第一补偿值和第二补偿值。

9.根据权利要求1所述的方法，还包括在接收所述一个或更多个数字信号之前或者在应用所述一个或更多个滤波器之后，执行以下处理步骤的至少一个：采样速率转换、针对声源速度的多普勒调整、考虑所述声源与所述听者之间的距离的距离调整、考虑所述听者的头部相对于所述声源的方向的方向调整、或者混响调整。

10.根据权利要求1所述的方法，其中所述一个或更多个数字滤波器至所述一个或更多个数字信号的应用对所述声源在所述听者附近的运动效果进行模拟。

11.根据权利要求1所述的方法，其中所述一个或更多个数字滤波器至所述一个或更多个数字信号的应用对将所述声源放置在所述听者附近的所选方位处的效果进行模拟。

12.根据权利要求1所述的方法，还包括模拟一个或更多个附加的声源的效果，以对在所述听者附近的所选方位处的多个声源的效果进行模拟。

13.根据权利要求12所述的方法，其中所述多个声源包括多于两个的声源，以通过所述左扬声器和右扬声器来模拟所述多于两个的声源的效果。

14.根据权利要求12所述的方法，其中所述多个声源包括以与环绕声布置之一相类似的方式来布置的五个声源，其中所述左扬声器和右扬声器位于耳机中，以通过向所述耳机提供的所述左滤波信号和右滤波信号来模拟环绕声效果。

15.一种用于处理数字音频信号的系统，包括：

耳间时差ITD组件，配置用于接收单声道输入信号并产生左ITD调整信号和右ITD调整信号，以模拟声音从声源到达听者的左耳和右耳的到达时间差，所述单声道输入信号包括与所述声源相对于所述听者的空间位置有关的信息；

定位滤波器组件，配置用于接收所述左ITD调整信号和右ITD调整信号，将一个或更多个数字滤波器应用于所述左ITD调整信号和右ITD调整信号中的每个，以产生左滤波数字信号和右滤波数字信号，每个所述一个或更多个数字滤波器是基于听觉响应函数的特定范围的，以使得所述左滤波数字信号和右滤波数字信号对该听觉响应函数进行模拟；以及

耳间强度差IID组件，配置用于接收所述左滤波数字信号和右滤波数字信号，并产生左IID调整信号和右IID调整信号，以模拟所述声音到达所述左耳和右耳的强度差。

16.根据权利要求15所述的系统，还包括以下组件的至少一个：采样速率转换组件、配置用于模拟声源速度的多普勒调整组件、配置用于考虑所述声源相对于所述听者的距离的距离调整组件、配置用于考虑所述听者的头部相对于所述声源的方向的方向调整组件、或者用于模拟混响效果的混响调整组件。

17.一种用于处理数字音频信号的系统，包括：

多个信号处理链，每个链包括：

定位滤波器组件，配置用于接收所述左ITD调整信号和右ITD调整信号，将一个或更多个数字滤波器应用于所述左ITD调整信号和右ITD调整信号中的每个，以产生左滤波数字信号和右滤波数字信号，每个所述一个或更多个数字滤波器是基于听觉响应函数的特定范围的，以使得所述左滤波数字信号和右滤波数字信号对所述听觉响应函数进行模拟。