CN105027580A

CN105027580A - 用于输出修改的音频信号的方法以及通过应用程序产生的图形用户界面

Info

Publication number: CN105027580A
Application number: CN201280078150.3A
Authority: CN
Inventors: 陈民亮
Original assignee: Razer Asia Pacific Pte Ltd
Current assignee: Razer Asia Pacific Pte Ltd
Priority date: 2012-11-22
Filing date: 2012-11-22
Publication date: 2015-11-04
Anticipated expiration: 2032-11-22
Also published as: CN105027580B; TW201421354A; EP2923500A1; US20150293655A1; TWI616810B; AU2012394979B2; WO2014081384A1; AU2012394979A1; EP2923500A4; SG11201503926WA; US9569073B2

Abstract

根据各种实施例，可提供一种用于输出修改的音频信号的方法。该方法可包括：从用户接收指示角度的输入；基于所接收的指示该角度的输入，确定头部相关传递函数的参数；基于所确定的参数，根据所述头部相关传递函数修改音频信号；以及输出所修改的音频信号。

Description

用于输出修改的音频信号的方法以及通过应用程序产生的图形用户界面

技术领域

各种实施例概括地涉及用于输出修改的音频信号的方法以及通过应用程序产生的图形用户界面。

背景技术

为了通过典型的立体声头戴式耳机产生多信道音频系统的感觉，头部反射传递函数(或头部相关传递函数；HRTF)可被应用至输入的模拟立体声音频信号。该HRTF可能必须针对特定的用户进行校准。

发明内容

根据各种实施例，可提供一种用于输出修改的音频信号的方法。该方法可包括：从用户接收指示角度的输入；基于所接收的指示该角度的输入，确定头部相关传递函数的参数；基于该所确定的参数，根据该头部相关传递函数修改音频信号；以及输出该修改的音频信号。

根据各种实施例，可提供一种通过应用程序产生的图形用户界面。该图形用户界面可包括：由该应用程序产生的应用程序窗口，其中该应用程序窗口可包括：用户的视觉表示形式；在该用户周围的几何形状上的扬声器的视觉表示形式；以及输入，该输入用于输入关于该扬声器的视觉表示形式在该几何形状上的角度的指示。

附图说明

在附图中，相似的附图标记通常指全部不同的视图中的相同部件。各附图未必是按比例绘制，而是通常侧重于阐明本发明的原理。为清晰起见，各种特征或元素的尺寸可被任意扩大或缩小。在下面的说明中，参照下面的附图描述本发明的各种实施例，其中：

图1示出根据实施例对用于输出修改的音频信号的方法进行说明的流程图；

图2示出根据实施例的音频输出装置；

图3示出根据实施例的图形用户界面；

图4示出根据实施例的图形用户界面；

图5A示出根据实施例的应用程序窗口的示意图；

图5B示出多个耳朵形状；

图5示出根据实施例用于校准虚拟扬声器位置的图形用户界面的屏幕截图；

图6A示出根据实施例用于校准虚拟扬声器位置的图形用户界面的屏幕截图；

图6B示出根据实施例的图形用户界面的屏幕截图，其中在选择虚拟扬声器位置616时，显示虚拟扬声器位置标记；

图7示出根据实施例的图形用户界面或应用程序窗口的屏幕截图，其中可设定音频输出装置；

图8示出根据实施例的图形用户界面或应用程序窗口的屏幕截图，其中可设定一般音频输出参数；

图9示出根据实施例的图形用户界面或应用程序窗口的屏幕截图，其中可设定均衡器参数；

图10示出根据实施例的图形用户界面或应用程序窗口的屏幕截图，其中可调整虚拟扬声器的位置；

图11示出根据实施例的图形用户界面的屏幕截图，其中可设定用于指示所选虚拟扬声器的角度的标记；

图12示出根据实施例的图形用户界面的屏幕截图，其中可设定指示所选虚拟扬声器的角度的标记；

图13示出对扬声器的可替代表示形式进行显示的图形用户界面或应用程序窗口的屏幕截图；以及

图14示出根据实施例的应用程序窗口。

具体实施方式

在以下的详细说明中将参照附图，该附图以图示方式示出可实践本发明的具体细节及实施例。这些实施例将被充分详细地描述，以使本领域技术人员能够实践本发明。可利用其他实施例，且可在不背离本发明的范围的情况下作出结构及逻辑上的变化。实施例未必彼此排斥，因一些实施例可与一个或多个其他实施例组合以形成新的实施例。

为使本发明可被轻易地理解并付诸实际实施，现在将参照附图，通过示例且非限定方式描述具体的实施例。

音频输出装置可包括内存，该内存例如在由该音频输出装置执行的处理中使用。在该实施例中所用的内存可以是易失性存储器(例如，DRAM(动态随机存取存储器))或非易失性存储器(例如，PROM(可编程只读存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦可编程只读存储器))或者闪存(例如，浮栅存储器(floating gate memory)、电荷俘获型存储器(charge trappingmemory)、MRAM(磁阻式随机存取存储器)或PCRAM(相变存储器))。

在实施例中，“电路”可被理解为任意种类的逻辑执行实体，其可以是执行存储在存储器、固件或其任意组合中的软件的应用专用电路或处理器。因此，在实施例中，“电路”可以是硬接线逻辑电路或诸如可编程处理器的可编程逻辑电路，可编程处理器例如微处理器(例如，复杂指令集计算机(CISC)处理器或精简指令集计算机(RISC)处理器)。“电路”还可以是执行软件的处理器，该软件例如任意种类的计算机程序(例如，使用诸如Java之类的虚拟机码的计算机程序)。根据可替代的实施例，将于下文中更详细地描述的各个功能的任意其他种类的实施方式也可被理解为“电路”。应理解，在本文中被以不同名称描述的电路(例如“电路A”及“电路B”)还可设置于如以上所述的一实体电路中。

应理解，几何形状可以是或可包括二次曲线(例如圆形、椭圆、抛物线或双曲线)，或者可包括或可以是多边形，或者可包括或可以是任意其他种类的几何形状。

提供装置的各种实施例，且提供方法的各种实施例。应理解，装置的基本特性还适用于方法，反之亦然。因此，为简明起见，忽略这些特性的重复说明。

应理解，本文中针对具体装置所述的任意特性还可适用于本文中所述的任意装置。应理解，本文中针对具体方法所述的任意特性还可适用于本文中所述的任意方法。此外，应理解，对于本文中所述的任意装置或方法，未必所述的所有组件或步骤都必须包含于该装置或方法中，而是可能仅包含某些(并非所有)组件或步骤。

图1示出根据实施例对用于输出修改的音频信号的方法进行说明的流程图100。在102中，可从用户接收指示角度的输入。在104中，可基于所接收的指示该角度的输入，确定头部相关传递函数的参数(或多个参数)。在106中，可基于所确定的参数(或所确定的多个参数)，根据该头部相关传递函数修改音频信号。在108中，可输出该修改的音频信号。

根据各种实施例，指示该角度的输入可以是通过几何形状上的点指示该角度的图形输入。

根据各种实施例，指示该角度的输入可以是通过来自几何形状的中心的方向指示该角度的图形输入。

根据各种实施例，指示该角度的输入可以是指示该角度的实数。

根据各种实施例，该方法可进一步包括显示当前设定的角度。根据各种实施例，从用户接收指示该角度的输入可包括：响应于显示，接收用于增大或减小该角度的指示。根据各种实施例，该方法可进一步包括基于该指示而设定角度。

根据各种实施例，该方法可进一步包括从该用户接收指示该用户的头部大小的输入。

根据各种实施例，可进一步基于所接收的指示该用户的头部大小的输入确定该头部相关传递函数的参数(或多个参数)。

根据各种实施例，该方法可进一步包括从该用户接收指示该用户的头部形状的输入。

根据各种实施例，可进一步基于所接收的指示该用户的头部形状的输入确定该头部相关传递函数的参数(或多个参数)。

根据各种实施例，该方法可进一步包括从该用户接收指示该用户的耳朵大小的输入。

根据各种实施例，可进一步基于所接收的指示该用户的耳朵大小的输入确定该头部相关传递函数的参数(或多个参数)。

根据各种实施例，该方法可进一步包括从该用户接收指示该用户的耳朵形状的输入。

根据各种实施例，可进一步基于所接收的指示该用户的耳朵形状的输入确定该头部相关传递函数的参数(或多个参数)。

根据各种实施例，该接收步骤和该确定步骤可针对多个虚拟扬声器位置执行。

根据各种实施例，该方法可进一步包括将所确定的参数(或所确定的多个参数)发送至云中的服务器。

根据各种实施例，该方法可进一步包括：从云中的服务器接收该头部相关传递函数的参数(或多个参数)；基于所接收的参数(或多个参数)，根据该头部相关传递函数修改该音频信号；以及输出所修改的音频信号。

根据各种实施例，可利用查找表(lookup table)、基于所接收的指示该角度的输入确定该头部相关传递函数的参数(或多个参数)，其中该查找表储存角度与参数(或多个参数)之间的关系。

图2示出根据实施例的音频输出装置200。音频输出装置200可包括输入电路202，输入电路202被配置成从用户接收指示角度的输入。音频输出装置200可进一步包括确定电路204，确定电路204被配置成基于所接收的指示该角度的输入确定头部相关传递函数的参数(或多个参数)。音频输出装置200可进一步包括修改电路206，修改电路206被配置成基于所确定的参数(或所确定的多个参数)，根据该头部相关传递函数修改音频信号。音频输出装置200可进一步包括输出电路208，输出电路208被配置成输出所修改的音频信号。输入电路202、确定电路204、修改电路206以及输出电路208可经由连接件210(或多个单独的连接件)连接，连接件210(或多个单独的连接件)例如电连接件或光学连接件、例如任意种类的电缆或总线。

根据各种实施例，输入电路202可被配置成接收图形输入，该图形输入通过几何形状上的点来指示该角度。

根据各种实施例，输入电路202可被配置成接收图形输入，该图形输入通过来自几何形状的中心的方向来指示该角度。

根据各种实施例，输入电路202可被配置成接收指示该角度的实数。

根据各种实施例，音频输出装置200可进一步包括显示电路(未示出)，该显示电路被配置成显示当前设定角度。根据各种实施例，输入电路202可被配置成响应于所显示的当前设定角度而从用户接收用于增大或减小该角度的指示。根据各种实施例，音频输出装置200可进一步包括设定电路(未示出)，该设定电路被配置成基于该指示设定该角度。

根据各种实施例，输入电路202可进一步被配置成从该用户接收指示该用户的头部大小的输入。

根据各种实施例，确定电路204可进一步被配置成基于所接收的指示该用户的头部大小的输入确定该头部相关传递函数的参数(或多个参数)。

根据各种实施例，输入电路202可进一步被配置成从该用户接收指示该用户的头部形状的输入。

根据各种实施例，确定电路204可进一步基于所接收的指示该用户的头部形状的输入确定该头部相关传递函数的参数(或多个参数)。

根据各种实施例，输入电路202可进一步被配置成从该用户接收指示该用户的耳朵大小的输入。

根据各种实施例，确定电路204可进一步被配置成基于所接收的指示该用户的耳朵大小的输入确定该头部相关传递函数的参数(或多个参数)。

根据各种实施例，输入电路202可进一步被配置成从该用户接收指示该用户的耳朵形状的输入。

根据各种实施例，确定电路204可进一步被配置成基于所接收的指示该用户的耳朵形状的输入确定该头部相关传递函数的参数(或多个参数)。

根据各种实施例，输入电路202及确定电路204可被配置成针对多个虚拟扬声器位置执行该接收步骤和该确定步骤。

根据各种实施例，音频输出装置200可进一步包括发送电路(未示出)，该发送电路被配置成将所确定的参数(或所确定的多个参数)发送至云中的服务器。

根据各种实施例，音频输出装置200可进一步包括接收电路(未示出)，该接收电路被配置成从云中的服务器接收该头部相关传递函数的参数(或多个参数)。根据各种实施例，修改电路206可被配置成基于所接收的参数(或多个参数)，根据该头部相关传递函数修改音频信号。根据各种实施例，输出电路208可被配置成输出所修改的音频信号。

根据各种实施例，确定电路204可被配置成利用查找表、基于所接收的指示该角度的输入确定该头部相关传递函数的参数(或多个参数)，其中该查找表储存角度与参数(或多个参数)之间的关系。

图3示出根据实施例的图形用户界面300。图形用户界面300可例如显示在计算机屏幕302上。图形用户界面300可包括通过应用程序产生的应用程序窗口304。应用程序窗口304可包括用户的视觉表示形式306(此处示出为几何形状)。应用程序窗口304可进一步包括在用户周围的几何形状310上的扬声器的视觉表示形式308(此处示出为几何形状)。应理解，在该图形用户界面中的几何形状310可被显示为任意种类的几何形式(例如，椭圆)，其中用户306位于该几何形状(例如，椭圆310)的中心处。扬声器308可沿几何形状310移动，其中对扬声器308的定位转变成：输入关于用户306在几何形状310上的角度的指示。在可替代实施例中，应用程序窗口304可进一步包括输入312，输入312用于输入关于该扬声器的视觉表示形式(此处示出为可在几何形状310上移动的几何形状)在该几何形状上的角度的指示，其中输入312与扬声器308关联。移动扬声器308来调整该角度。

图4示出可替代实施方式400。在该可替代实施方式中，可使用可移动的输入312来调整该角度。

根据各种实施例，扬声器的视觉表示形式308可包括扬声器的图像或输出扬声器装置的其他图像。

根据各种实施例，扬声器的视觉表示形式308可包括球体。

根据各种实施例，输入312可包括被配置成在几何形状310上移动的标记(marker)。

根据各种实施例，输入312可包括被配置成在该几何形状上移动的扬声器的视觉表示形式。

根据各种实施例，扬声器的视觉表示形式308或输入312可包括被配置成相对于用户306围绕几何形状310移动的罗盘(compass)的指针。

根据各种实施例，图形用户界面300可被配置成将所输入的角度的指示发送至该应用程序。

根据各种实施例，该应用程序可被配置成：基于所接收的指示角度的输入，确定头部相关传递函数的参数(或多个参数)；基于所确定的参数(或所确定的多个参数)，根据该头部相关传递函数修改音频信号；以及输出所修改的音频信号。

根据各种实施例，应用程序窗口304可进一步被配置成从该用户接收指示该用户的头部大小的输入。

根据各种实施例，该应用程序可进一步被配置成基于所接收的指示该用户的头部大小的输入确定头部相关传递函数的参数(或多个参数)。

根据各种实施例，应用程序窗口304可进一步被配置成从该用户接收指示该用户的头部形状的输入。

根据各种实施例，该应用程序可进一步被配置成基于所接收的指示该用户的头部形状的输入确定头部相关传递函数的参数(或多个参数)。

根据各种实施例，应用程序窗口304可进一步被配置成从该用户接收指示该用户的耳朵大小的输入。

根据各种实施例，该应用程序可进一步被配置成基于所接收的指示该用户的耳朵大小的输入确定头部相关传递函数的参数(或多个参数)。

根据各种实施例，应用程序窗口304可进一步被配置成从该用户接收指示该用户的耳朵形状的输入。

根据各种实施例，该应用程序可进一步被配置成基于所接收的指示该用户的耳朵形状的输入确定头部相关传递函数的参数(或多个参数)。

根据各种实施例，应用程序窗口304可包括多个扬声器的视觉表示形式，并且输入312可用于输入各个扬声器的视觉表示形式中的每一个的角度。

根据各种实施例，应用程序窗口304可进一步包括发送者输入(sender input)，该发送者输入用于接收输入，该输入用于命令该应用程序将基于输入的角度而确定的参数(或多个参数)发送至云中的服务器。

根据各种实施例，应用程序窗口304可进一步包括接收器，该接收器用于从云中的服务器接收头部相关传递函数的参数(或多个参数)。根据各种实施例，该应用程序可被配置成基于所接收的参数(或多个参数)、根据该头部相关传递函数修改音频信号，并输出所修改的音频信号。

根据各种实施例，该应用程序可被配置成利用查找表、基于指示该角度的输入确定头部相关传递函数的参数(或多个参数)，其中该查找表储存角度与该头部相关传递函数的参数(或多个参数)之间的关系。

根据各种实施例，在图形用户界面(UI)中可存在七个扬声器，且该七个扬声器可表示7.1声音系统。典型的声音系统可以是5.1(例如，电影院剧场中的声音系统)。因此，可提供该UI以(ⅰ)允许用户校准7.1音频头戴式耳机的声音设定和/或(ⅱ)执行虚拟化以使2.1或5.1头戴式耳机对用户而言听起来犹如7.1声音系统。

根据各种实施例，可提供一种HRTF校准方法。

为了通过典型的立体声头戴式耳机创建多信道音频系统的感觉，头部反射传递函数(或头部相关传递函数(HRTF))可被应用至输入的模拟立体声音频信号。根据各种实施例，可以以一种对于在微调HRTF方面毫无经验的初学用户而言易于理解且操纵的方式，提供一种校准HRTF系统的方法，该方法使用图形用户界面定位虚拟扬声器的位置。根据各种实施例，可进一步提供用户所确定的HRTF校准参数与该用户唯一的云标识符之间的关联，该关联储存这些设定以供连接至该云服务的任何装置使用。云标识可不仅能够储存特定用户的HRTF校准配置文件，而且在音频再现环境中使用的机器及装置(例如数字-模拟转换器(DAC)、头戴式耳机放大器以及头戴式耳机)可再现声音。

头部相关传递函数(HRTF)可以是响应，该响应可描述耳朵如何从空间中的点接收声音；可使用关于两只耳朵的一对HRTF来合成好像来自空间中特定点的双耳声(binaural sound)。其可以是传递函数，该传递函数描述声音如何从特定点传至耳朵(通常传至耳道的外端)。被设计成从立体声(二个扬声器)头戴式耳机再现环绕声效的某些消费者家庭娱乐产品可使用HRTF。某些HRTF处理形式也可能已被包括在计算机软件中，以仿真从扩音器重放的环绕立体声。

人类仅有二只耳朵，却可定位在三维空间-范围(距离)中、上、下、前、后方向中以及两侧的声音。这可能是因大脑、内耳以及外耳(耳廓)可协同合作以对声音的位置作出推断。因眼睛仅可看到观察者周围的小部分世界，且在黑暗处视力可被限制，而以不同精度来定位声音源的能力可在所有方向上发挥作用且即使在黑暗中，故作为一种进化必要性，人类定位声音源的能力可能已得到发展。

通过接收来自一只耳朵的提示(单耳提示)并对比两只耳朵所接收到的提示(不同提示或双耳提示)，人类可估计一声音源位置。这些不同提示可以是到达的时间不同以及声音强度不同。单耳提示可源自声音源与人类解剖学结构之间的相互作用，其中原始源声音在进入耳道由听觉系统处理之前可先被修改。这些修改可对源位置进行编码，且可经由可与声音源位置和耳朵位置相关的脉冲响应而被捕获。此脉冲响应可被称为头部相关脉冲响应(HRIR)。若已在源位置发出任意源声音且听者的耳朵位于接收器位置，则将该任意源声音与头部相关脉冲响应进行卷积可将该声音转变成听者原本已听到的声音。HRIR可能已被使用来产生虚拟环绕声效。

该HRTF可以是HRIR的傅里叶变换形式。该HRTF还可被称为解剖传递函数(ATF)。

左耳和右耳的HRTF(在上文被称为HRIR)可描述在声音源(x(t))分别在左耳和右耳处被感知为xL(t)及xR(t)之前，对该声音源(x(t))进行的过滤。

该HRTF还可被描述为对来自大气中的方向的声音的修改，将该声音修改为其到达鼓膜时的声音。这些修改可包括听者外耳的形状、听者头部及身体的形状、发出声音的空间的声学特性等等。所有这些特性可影响听者如何(或是否)可准确地分辨出声音来自哪个方向。

HRTF可明显地因人而异。当听者听到带有非个性化HRTF的空间化的声音时，可能会发生知觉畸变(perceptual distortion)。对HRTF的“以一个尺寸应对所有用户(one size fits all)”的这种关注可能假定：所有用户都具有均等的生理及形态结构。头部的大小及头戴式耳机或头戴式装置的安放位置对于如何创建系数并将其应用至滤波器而言可以是关键的决定因素。此外，耳朵的形状及耳朵的大小对于声音如何从驱动器传播至内耳可具有主要影响。正因如此，一种尺寸或类型的滤波器并不适用于所有听者，在其针对在所有用户中得出的平均值时，会导致虚拟环绕声效系统表现欠佳。

此外，用户可建立对于该用户而言可唯一的设定，并且这些设定可不在多个系统及装置链中保持存在，因为该用户在校准期间所建立的参数被保持锁定至设定被配置的特定装置中。

根据各种实施例，用户可校准HRTF滤波器使得其可最佳地为用户工作，且可接着将这些设定保存至客户端并将其镜像至云中以供将来在任意客户端上使用。通过将在一个音频再现系统(例如个人计算机)上所用的HRTF校准参数与唯一云识别系统相关联，用户可配置或校准单个装置或系统上的HRTF算法，且使这些系统通过软件接口而保存于多个装置及系统中，该软件接口对该多个装置及系统进行认证并将其配置文件设定(profile settings)从云传输至该系统。

通过允许用户提供关于其形态参数(诸如头部大小、耳朵大小和耳朵形状、以及虚拟环绕声效位置在声场内的定位)的更多信息，可向听者提供更准确且个性化的虚拟环绕声效体验。

根据各种实施例，可提供用于校准HRTF的图形用户界面及云服务，以通过对用户及用于校准HRTF算法的装置和机器使用唯一标识符而使单个装置或系统与多个装置和系统同步。这可基于用户输入来确定虚拟扬声器位置的偏移、对头部大小、耳朵大小及耳朵形状的选择，以确定在音频滤波器内应用的适当HRTF系数。举例而言，HRTF系数可储存于云中并可被下载至客户端，或者可包含于装置中并被设置为仅限本地使用(仅本地)。一旦用户进行校准并选择HRTF系数，用户所选择的配置便可储存在云中，以供用户在其登录的任意其他PC客户端上使用。

用户可作出的第一选择是其头部的大小，这可以是根据一组选项(诸如小、中等以及大)而作出的主观选择，头部的大小对应于在额头处且围绕头部后部最大区域所测得的头部圆周。这可类似于对帽子大小的测量方法。该选项可以与具有标准偏差为+/-7cm的平均58厘米的圆周相对应。

用户可作出的第二选择是基于一组所提供的选项(例如圆形、椭圆形以及倒置的蛋形)而选择其头部的形状。

用户可作出的第三选择是其耳朵的大小，这可以是根据一组选项(例如小、中等以及大)而作出的主观选择，耳朵的大小对应于用户的外耳(耳廓或耳部)的大小，外耳的大小可以平均6厘米为基准，标准偏差为+/-1.5cm。

用户可作出的第四选择是其耳朵的形状，这可以是用户从8种常见耳朵形状类型中所作出的主观选择。

图5A是根据本发明实施例的应用程序窗口400的示意图。应用程序窗口400包括第一子窗口401、第二子窗口402、第三子窗口403以及第四子窗口404。第一子窗口401为用户提供选择其头部大小的方式。例如，第一子窗口401包括输入窗口，以供用户输入/键入其头部的圆周大小。在另一实施例中，第一子窗口401可包含具有预设的头部圆周大小(例如，自51厘米至65厘米)的下拉菜单/列表，其中该预设的大小可由用户选择。在又一实施例中，第一子窗口401包括多个图示不同头部大小的图像，例如：具有51厘米至55厘米范围的第一图像、具有56厘米至60厘米范围的第二图像以及具有61厘米至65厘米范围的第三图像。用户选择范围最接近其头部大小的图像。可替代地，该第一子窗口可以是输入窗口、下拉菜单或多个图像的组合，以允许灵活地选择头部的大小。

第二子窗口402为用户提供选择其头部形状的方式。在一个实施例中，第二子窗口402包括具有预设的头部形状(例如，圆形、椭圆形和倒置的蛋形)的下拉菜单/列表，该预设的头部形状可由用户选择。在另一实施例中，第二子窗口402包括多个图示不同头部形状的图像，且用户选择范围最接近其头部形状的图像。在又一实施例中，第二子窗口402是具有预设的头部形状的下拉菜单与具有不同头部形状的图像的组合。

第三子窗口403为用户提供选择其耳朵大小的方式。在一个实施例中，第三子窗口403包括输入窗口，以供用户输入/键入其耳朵大小。在另一实施例中，第三子窗口403可包含具有预设的耳朵大小(例如，约4.5厘米至7.5厘米的外耳大小)的下拉菜单/列表，其中该预设的大小可由用户选择。在又一实施例中，第三子窗口403包括多个图示不同耳朵大小的图像，例如：具有4.5厘米至5.0厘米范围的第一图像、具有5.1厘米至5.5厘米范围的第二图像以及具有5.6厘米至6.0厘米范围的第三图像等。用户选择范围最接近其耳朵大小的图像。可替代地，第三子窗口403可以是输入窗口、下拉菜单或该多个图像的组合。

第四子窗口404为用户提供选择其耳朵形状的方式。在一个实施例中，第四子窗口404包括多个图示不同耳朵形状的图像，以允许用户选择与该图像中最接近的耳朵形状。图5B示出具有表示常见耳朵形状的多个图像的第四子窗口404。

根据各种实施例，可由用户对虚拟环绕声效扬声器位置的定位作出进一步的调整，以个性化用户的听觉体验。这种方法通过对图形用户界面中的虚拟扬声器位置作出调整，可使用户更充分地认识到环绕声效的空间性(spatiality)，所作出的调整可被转换成对每一扬声器位置的HRTF系数的调整。因在校准步骤中用户可察觉到虚拟扬声器位置的变化，故这种校准的图形方法的结果对用户可一目了然。

在一个实施例中，该方法可首先命令用户将其优选的头戴式耳机置于头部上，此时正播放在默认(default)虚拟扬声器位置间循环的音频片段(audio clip)。在给定用户形态参数(诸如头部大小、耳朵形状、以及其优选的头戴式耳机的机械设计和其他特征)的情况下，用户可听到这些默认位置的声音像什么。

图6A示出根据实施例用于校准虚拟扬声器位置的图形用户界面的屏幕截图601。用户可选择虚拟扬声器位置611至617中的一个，且可向用户呈现相应的标记(marker)，该标记突出显示相对于声场中心处的头部/用户表示形式670的默认角度(方位角)处的音频位置。

图6B示出根据实施例的图形用户界面的屏幕截图602，其中在选择虚拟扬声器位置616时，显示虚拟扬声器位置标记626。为(从虚拟扬声器位置616)变换声场周围所觉察到的声音发出点，用户可选择调整仅与虚拟扬声器位置616相关联的标记626的位置，其可导致对应用至滤波器的HRTF系数作出调整。例如，用户通过对虚拟环绕声效扬声器的位置进行定位，可“自由地”在几何形状650内变换/移动7个虚拟扬声器位置611至617。

通过重复这种选择扬声器位置、然后调整由滤波器播放的声音的发出点并在此点处发出声音的过程，用户可根据个人偏好而充分地定制声场。根据各种实施例，这可使用户能够通过具有合成多通道环绕声效音频源的扬声器位置的实时调整而实现主观上更佳的虚拟环绕声效体验，该音频源是通过被修改的HRTF滤波器而发出声音。

当用户已完成对虚拟扬声器位置的所有期望的变动时，可为该特定用户保存新的HRTF系数且可选地将新的HRTF系数与用户所偏好的头戴式耳机相关联。可对其他头戴式耳机执行其他HRTF校准，以使用户能够针对多个头戴式耳机或头戴式装置定制并校准其HRTF滤波器库(library)。

通过包含图形用户界面以供用户选择形态参数并调整用于确定HRTF系数(该HRTF系数用于从立体声音频信号合成多信道环绕声效音频)的虚拟扬声器位置，用户可克服HRTF滤波器的标准的“一个尺寸应对所有用户”的方法，且可向用户提供校准的虚拟环绕声效体验。根据各种实施例，可主观上确保可针对用户对滤波器的特定需要以及用户所偏好的头戴式耳机或头戴式装置类型来微调用于合成虚拟环绕声效环境的滤波器。

此外，通过为用户将这些设定既保存至本地的装置或系统上又经由云服务镜像这些设定，该恰当的HRTF滤波器系数可被应用至多种应用中，且可保持存在于用户所用的多个装置及系统中。这可确保不管用户当前正在使用哪个系统，都可获得可能最佳的虚拟环绕声效体验。

HRTF校准的当前状态可能局限于基于客观形态因素而创建的标准的一组预定滤波器，且可能不向用户提供用于校准其虚拟环绕声效体验的功能可见性(affordance)，该功能可见性利用图形用户界面选择预定滤波器的形态参数并控制对虚拟环绕声效扬声器位置的定位。

此外，根据各种实施例，通过将由用户为其装置及系统创建的唯一配置文件与该装置及系统在云服务中的唯一身份相关联，通过HRTF校准软件与云服务的互联(connectivity)而实现多个装置中的一致体验，现有技术的状态可根据各种实施例而得到提高。

图7示出根据实施例的图形用户界面或应用程序窗口的屏幕截图700，其中可设定音频输出装置。应用程序窗口700由在计算装置上运行的应用程序产生。该应用程序通过网络(例如，互联网云服务)连接至远程服务器，其中该应用程序在远程服务器上储存用户配置文件或者从远程服务器接收所储存的用户配置文件。当用户登录至该应用程序时(例如，通过唯一用户身份(ID)及密码)，该应用程序从该远程服务器检索与该用户ID相关联的所储存的用户配置文件，并将其显示在应用程序窗口700的配置文件子窗口720上。配置文件子窗口720显示用户配置文件列表且还实现新的配置文件的创立，其中该用户配置文件列表可从远程服务器或从本地客户端(即，计算机装置)获取。在选择特定用户配置文件(例如图7所示的“配置文件”)时，音频装置子窗口730显示与该用户配置文件相关联的音频装置列表。例如，在该音频装置列表中可提供所有雷蛇(Razer)模拟头戴式耳机和头戴式装置，且可选择其中之一用于校准。在新的头戴式耳机/头戴式装置连接计算装置时，若该头戴式耳机/头戴式装置与应用程序兼容，则该应用程序在音频装置子窗口730中显示该头戴式耳机/头戴式装置的名称。在一个实施例中，应用程序窗口700包括顶部菜单栏710，菜单栏710包括“设定(SETTINGS)”、“音频(AUDIO)”、“均衡器(EQ)”以及“校准(CALIBRATION)”功能。图7示出在用户选择“设定(SETTINGS)”功能711时的应用程序窗口700。

图8示出根据实施例的图形用户界面或应用程序窗口的屏幕截图800，其中可设定一般音频输出参数。在从顶部菜单栏710选择“音频(AUDIO)”功能712时，应用程序窗口800显示音频输出子窗口810以及配置文件子窗口720。音频输出子窗口810使用户能够调整音频输出参数，诸如但不仅限于：“低音提升(BASSBOOST)”、“声音清晰度(VOICE CLARITY)”、“音量正规化(VOLUMENORMALIZATION)”以及“音量水平(VOLUME LEVEL)”。当完成对音频输出参数的调整时，应用程序使期望的音频输出参数的数据与配置文件子窗口720中的所选配置文件相关联或储存期望的音频输出参数的数据至配置文件子窗口720中的所选配置文件。该配置文件及相关联的音频输出参数可接着通过网络储存在远程服务器上，使得当用户在随后使用相同的用户ID及密码登录至该应用程序时可获取该配置文件及相关联的音频输出参数。

图9示出根据实施例的图形用户界面或应用程序窗口的屏幕截图900，其中可设定均衡器(EQ)参数。当从顶部菜单栏710选择“均衡器”功能713时，应用程序窗口900显示具有预设的均衡器设定910的下拉菜单，其中该下拉菜单可包括常用均衡器设定，诸如但不限于：“古典(Classical)”、“摇滚(Rock)”、“舞蹈(Dance)”、“爵士(Jazz)”。可替代地，应用程序窗口900包括多个均衡器频率栏，以便于用户能够配置期望的均衡器设定。类似地，应用程序窗口900包括配置文件子窗口720。当完成对均衡器设定的调整时，该应用程序使期望的均衡器设定的数据与配置文件子窗口720中的所选配置文件相关联或储存期望的均衡器设定的数据至配置文件子窗口720中的所选配置文件。该配置文件及相关联的均衡器设定可接着通过网络储存在远程服务器上，使得当用户在随后使用相同的用户ID及密码登录至该应用程序时可获取该配置文件及相关联的均衡器设定。

图10示出根据实施例的图形用户界面或应用程序窗口的屏幕截图1000，其中可调整虚拟扬声器的位置。当从顶部菜单栏710选择“校准”功能714时，应用程序窗口1000显示设置在圆形路径1002上的多个扬声器1101至1107的表示形式。用户1001的表示形式位于圆形路径1002的中心位置处。类似于量角器(protractor)测量，扬声器1101的默认位置相对于用户1001的角度约为0度。对于其他扬声器，相对于用户1001，扬声器1102位于约45度处、扬声器1103位于约90度处、扬声器1104位于约135度处、扬声器1105位于约225度处、扬声器1106位于约270度处并且扬声器1107位于约325度处。该七个扬声器1101至1107表示7.1环绕系统，但可以理解，对于其他环绕系统，扬声器的数量可有所变化，例如可使用五个扬声器来表示5.1环绕系统。此外，可以理解，圆形路径1002可采用其他形式/形状，诸如矩形路径的正方形路径。

当用户首先在顶部菜单栏710上点击“校准”功能714以打开图10所示的屏幕时，可播放可围绕所有虚拟扬声器位置移动的环绕声效音频循环乐段(诸如直升机)。在任何时候，用户可随时点击“测试所有(Test All)”按钮1201来重放此环绕声效音频循环乐段并聆听位置做出任何变动的所有扬声器。如图11所示，当用户点击虚拟扬声器位置(例如扬声器1102)时，其他扬声器可变暗而所选的扬声器可被突出显示。音频循环乐段可从所选的虚拟扬声器位置播放。

图11示出根据实施例的图形用户界面的屏幕截图1100，其中可设定用于指示所选虚拟扬声器1102的角度的标记1122。用户可点击校准标记1122(具有球的形状)，并可基于所选扬声器1102而围绕圆形路径1002来拖动标记1122至不同角度，以调整声音之位置，直至听起来声音从该虚拟扬声器位置或用户期望的位置发出为止。在一个实施例中，虚拟扬声器位置1102不可移动。校准标记1122可不终止于扬声器1202正上方-其可仅为声音的偏移，以考虑例如耳朵及头部的大小、头戴式耳机的类型等。在可替代实施方式中，用户界面不包括校准标记1122，且用户可通过点击并围绕圆形路径1002拖动扬声器1102来调整从扬声器1102发出的声音的位置。

对仅与扬声器1102相关联的校准标记1122所作的调整会引起对与扬声器1102相关联的HRTF系数的调整。通过重复这种选择扬声器、然后调整所播放声音的发出点的过程，用户可依个人偏好而充分地定制声场。当用户已完成对虚拟扬声器位置的所有期望的改动时，新的HRTF系数与期望的配置文件被储存且与用户在图7所示的音频装置子窗口730中选择的所偏好的头戴式耳机相关联。可对其他头戴式耳机执行其他HRTF校准，以使用户能够针对多个头戴式耳机或头戴式装置定制并校准其HRTF滤波器库。

校准标记或扬声器可仅被移动至某一角度，使得例如不使右扬声器完全移动至左侧或者将前扬声器移动至后侧。这有助于用户在校准其头戴式耳机时保持音频的保真度(fidelity)。可限制每个扬声器1101至1107的方位角，使得用户可将所选的扬声器从其默认/初始位置移动约15度至20度。例如，如图12中的屏幕截图1200所示，扬声器1102的方位角的范围可被固定至对应区/区域1132，使得扬声器1102(或与其相关联之标记)被限制移动至区1132之外。换言之，扬声器1102(或其相关联的标记)仅可围绕圆形路径1002在区1132内滑动，或仅可从其默认角度45度移动约+/-20度(即从25度至65度)。

应用程序基于扬声器1102(或其相关联的校准标记)的角度确定HRTF的参数。接着该应用程序基于该所确定的参数，根据HRTF修改音频信号，结果扬声器1102向用户输出该修改的音频信号。在一个实施例中，应用程序可被配置成利用查找表、基于指示该角度的输入来确定HRTF的参数，其中该查找表储存角度与HRTF的参数之间的关系。当完成对扬声器1101至1107的调整时，该应用程序使该HRTF的参数与配置文件子窗口720中的所选配置文件相关联或储存该HRTF的参数至配置文件子窗口720中的所选配置文件。该配置文件及该HRTF的参数可接着通过网络储存在远程服务器上，使得在用户随后使用相同的用户ID及密码登录至该应用程序时可获取该配置文件及该HRTF的参数。

在一个实施例中，应用程序包括界面以供用户在校准图10及图11所示的扬声器1101至1107之前选择其头部及耳朵的大小和形状(类似于上述的图5A)。应用程序基于所接收的指示头部及耳朵大小和形状的输入确定HRTF的参数。接着应用程序基于该所确定的参数，根据该HRTF修改音频信号，结果从扬声器1101至1107向用户输出该修改的音频信号。在一个实施例中，应用程序可被配置成利用查找表、基于指示头部形状、头部大小、耳朵形状或耳朵大小的输入来确定HRTF的参数，其中该查找表储存头部形状、头部大小、耳朵形状、耳朵大小与HRTF的参数之间的关系。当完成对头部及耳朵的大小及形状的输入时，该应用程序使该HRTF的参数与配置文件子窗口720中的所选配置文件相关联或储存该HRTF的参数至配置文件子窗口720中的所选配置文件。该配置文件及该HRTF的参数可接着通过网络储存在远程服务器上，使得在用户随后使用相同的用户ID及密码登录至该应用程序时可获取该配置文件及该HRTF的参数。

在一个实施例中，应用程序窗口包括“重新设定”按钮，以允许用户将扬声器1101至1107重新设定至其默认位置。

在一个实施例中，可提供复选框(checkbox)，且选取该复选框可覆盖被保存至期望的配置文件(例如，图12中的配置文件子窗口720所示的“配置文件(Profile)”)的校准设定并将校准设定全局地应用至与唯一用户ID相关联的所有配置文件。

图13示出对扬声器的可替代表示形式进行显示的图形用户接口或应用程序窗口的屏幕截图1300。在图13中，扬声器由“箭头”图像而非图10中所图示的扩音器图像表示。类似地，“箭头”扬声器1311至1317可在圆形路径1301上移动。此外，该应用程序窗口包括与圆形路径1301同心的另一圆形路径1302。圆形路径1302包括邻近位于默认位置的扬声器1311至1317的多个校准标记。如图14中应用程序窗口1400所示，当选择扬声器(例如，扬声器1312)时，其余扬声器变暗。类似地，扬声器1312包括可在圆形路径1302的区/区域1332中移动的对应校准标记1322。

尽管已具体示出并参照特定的实施例描述了本发明，但本领域技术人员应理解，在不背离由随附的权利要求限定的本发明的精神和范围的条件下，可作出各种形式和细节上的变化。因此本发明的范围由随附的权利要求指示，且因此权利要求的等效形式的意义及范围内作出的所有变化都意在包含于本发明的范围内。

Claims

1.一种用于输出修改的音频信号的方法，所述方法包括：

从用户接收指示角度的输入；

基于所接收的指示所述角度的输入，确定头部相关传递函数的参数；

基于所确定的参数，根据所述头部相关传递函数修改音频信号；以及

输出所修改的音频信号。

2.根据权利要求1所述的方法，

其中指示所述角度的输入是通过几何形状上的点指示所述角度的图形输入。

3.根据权利要求1所述的方法，

其中指示所述角度的输入是通过来自几何形状的中心的方向指示所述角度的图形输入。

4.根据权利要求1所述的方法，进一步包含：

从所述用户接收指示所述用户的头部大小的输入。

5.根据权利要求4所述的方法，

其中进一步基于所接收的指示所述用户的头部大小的输入确定所述头部相关传递函数的参数。

6.根据权利要求1所述的方法，进一步包括：

从所述用户接收指示所述用户的头部形状的输入。

7.根据权利要求6所述的方法，

其中进一步基于所接收的指示所述用户的头部形状的输入确定所述头部相关传递函数的参数。

8.根据权利要求1所述的方法，进一步包括：

从所述用户接收指示所述用户的耳朵大小的输入。

9.根据权利要求8所述的方法，

其中进一步基于所接收的指示所述用户的耳朵大小的输入确定所述头部相关传递函数的参数。

10.根据权利要求1所述的方法，进一步包括：

从所述用户接收指示所述用户的耳朵形状的输入。

11.根据权利要求10所述的方法，

其中进一步基于所接收的指示所述用户的耳朵形状的输入确定所述头部相关传递函数的参数。

12.根据权利要求1所述的方法，

其中所述接收步骤和所述确定步骤针对多个虚拟扬声器位置执行。

13.根据权利要求1所述的方法，进一步包括：

将所确定的参数发送至云中的服务器。

14.根据权利要求1所述的方法，进一步包括：

从云中的服务器接收所述头部相关传递函数的参数；

基于所接收的参数，根据所述头部相关传递函数修改所述音频信号；以及

输出所修改的音频信号。

15.一种通过应用程序产生的图形用户界面，所述图形用户界面包括：

通过所述应用程序产生的应用程序窗口，其中所述应用程序窗口包括：

用户的视觉表示形式；

在所述用户周围的几何形状上的扬声器的视觉表示形式；以及

输入，所述输入用于输入关于扬声器的所述视觉表示形式在所述几何形状上的角度的指示。

16.根据权利要求15所述的图形用户界面，

其中所述输入包括被配置成在所述几何形状上移动的标记。

17.根据权利要求15所述的图形用户界面，

其中所述输入包括被配置成在所述几何形状上移动的扬声器的所述视觉表示形式。

18.根据权利要求15所述的图形用户界面，

其中所述输入包括被配置成相对于所述用户围绕所述几何形状移动的罗盘的指针。

19.根据权利要求15所述的图形用户界面，

其中所述图形用户界面被配置成将所输入的角度的指示发送至所述应用程序。

20.根据权利要求15所述的图形用户界面，

其中所述应用程序被配置成

基于所接收的指示角度的输入，针对头部相关传递函数确定参数；

输出所修改的音频信号。

21.根据权利要求15所述的图形用户界面，

其中所述应用程序窗口进一步被配置成从所述用户接收指示所述用户的头部大小的输入。

22.根据权利要求21所述的图形用户界面，

其中所述应用程序进一步被配置成进一步基于所接收的指示所述用户的头部大小的输入确定头部相关传递函数的参数。

23.根据权利要求15所述的图形用户界面，

其中所述应用程序窗口进一步被配置成从所述用户接收指示所述用户的头部形状的输入。

24.根据权利要求23所述的图形用户界面，

其中所述应用程序进一步被配置成进一步基于所接收的指示所述用户的头部形状的输入确定头部相关传递函数的参数。

25.根据权利要求15所述的图形用户界面，

其中所述应用程序窗口进一步被配置成从所述用户接收指示所述用户的耳朵大小的输入。

26.根据权利要求25所述的图形用户界面，

其中所述应用程序进一步被配置成进一步基于所接收的指示所述用户的耳朵大小的输入确定头部相关传递函数的参数。

27.根据权利要求15所述的图形用户界面，

其中所述应用程序窗口进一步被配置成从所述用户接收指示所述用户的耳朵形状的输入。

28.根据权利要求27所述的图形用户界面，

其中所述应用程序进一步被配置成进一步基于所接收的指示所述用户的耳朵形状的输入确定头部相关传递函数的参数。

29.根据权利要求15所述的图形用户界面，

其中所述应用程序窗口包括多个扬声器的视觉表示形式，并且其中所述输入用于输入各个扬声器的视觉表示形式中的每一个的角度。

30.根据权利要求15所述的图形用户界面，

其中所述应用程序窗口进一步包括发送者输入，所述发送者输入用于接收输入以命令所述应用程序将基于所输入的角度而确定的参数发送至云中的服务器。

31.根据权利要求15所述的图形用户界面，

其中该应用程序窗口进一步包括接收器，所述接收器用于从云中的服务器接收头部相关传递函数的参数；以及

其中所述应用程序用被配置成基于所接收的参数、根据所述头部相关传递函数修改音频信号，并输出所述修改的音频信号。