CN105284129A

CN105284129A - 音频记录和回放装置

Info

Publication number: CN105284129A
Application number: CN201380077289.0A
Authority: CN
Inventors: M·T·维勒尔莫; L·J·拉克索宁; K·J·耶尔维宁
Original assignee: Nokia Technologies Oy
Current assignee: Nokia Oyj; Nokia Technologies Oy
Priority date: 2013-04-10
Filing date: 2013-04-10
Publication date: 2016-01-27
Also published as: EP2984854A4; EP2984854B1; RU2015145733A; KR20170143013A; CA2908654C; WO2014167384A1; US20160219392A1; KR102003462B1; RU2653136C2; EP2984854A1; KR20150139937A; CA2908654A1; US10834517B2

Abstract

一种装置包括：输入器，其被配置为接收至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移；定向确定器，其被配置为基于设备定向和关于在捕获装置中的麦克风配置的信息来确定音频捕获定向；以及音频输出生成器，其被配置为基于所述捕获定向来输出所述至少两个音频信号，使得基于所述捕获定向来自执行所述至少两个音频信号的回放。

Description

音频记录和回放装置

技术领域

本申请涉及用于音频记录和回放的装置。本发明还涉及但不限于在移动设备内用于音频记录和回放的装置。

背景技术

空间音频信号被更加频繁地使用以产生更加沉浸式的音频体验。立体声或多通道记录能够从记录或捕获装置被传递给收听装置以及使用合适的多通道输出来重放，诸如多通道扩音器布置，以及使用具有虚拟环绕处理的一对立体声头戴式耳机或头戴式耳麦来重放。

将理解的是，在不久的将来，对于诸如移动电话的移动装置具有超过两个麦克风将是可能的。这提供了记录实际的多通道音频的可能性。类似地，对于诸如移动电话的移动装置具有超过两个扬声器将是可能的。因此，立体声和环绕声音频可以在移动设备(诸如智能电话)中重现。

也就是说，移动设备将具有记录(或捕获)和回放立体声和环绕声音频的能力是可能的或不久将是可能的。因此，当由合适的或胜任的移动设备已经执行了音频记录或捕获时，移动设备也将能够将这些音频信号从设备传递到设备，以及同样地，能够在电信应用中以及也针对诸如流式传输、广播和组播的其它服务利用立体声和环绕声音频。

发明内容

因此，本申请的多个方面提供了一种空间音频捕获和处理，由此能够补偿收听的定向或视频和音频捕获定向的差。

根据第一方面，提供了一种方法，所述方法包括：生成至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移；确定捕获定向；以及基于所述捕获定向来输出所述至少两个音频信号，使得基于所述捕获定向来执行所述至少两个音频信号的回放。

确定捕获定向可以包括：基于设备定向和关于在捕获装置中的麦克风配置的信息来确定音频捕获定向。

所述捕获定向可以是初始捕获定向值，以及基于所述捕获定向来输出所述至少两个音频信号可以包括：根据初始音频输出顺序来输出所述至少两个音频信号。

所述方法还可以包括：确定在所述捕获定向和更早的定向之间的差是否大于定义值；以及与所述至少两个音频信号一起还输出所述捕获定向，使得基于所述捕获定向来执行所述至少两个音频信号的回放。

所述更早的定向可以是初始定向。

所述方法还可以包括：基于所述捕获定向来确定针对所述至少两个音频信号的音频输出顺序；以及与所述至少两个音频信号一起还输出所述音频输出顺序，使得基于所述音频输出顺序来执行所述至少两个音频信号的回放。

所述方法还可以包括：确定在所述捕获定向和所述更早的定向之间的差是否大于定义的音频输出重排序值；以及当在所述捕获定向和所述更早的定向之间的差大于定义的音频输出重排序值时，触发音频输出顺序的确定。

生成所述至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移，可以包括：在第一位置处使用第一麦克风来生成所述至少两个音频信号中的第一音频信号；在第二位置处使用第二麦克风来生成所述至少两个音频信号中的第二音频信号，在所述至少两个音频信号之间的相对位移是在所述第一位置和所述第二位置之间的位移。

生成所述至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移，可以包括以下至少之一：从包括至少两个麦克风的远程装置接收所述至少两个音频信号，所述至少两个麦克风在它们之间具有相对位移；以及从存储器来接收所述至少两个音频信号。

根据第二方面，提供了一种方法，所述方法包括：接收至少两个音频信号；确定回放定向；以及基于所述回放定向将所述至少两个音频信号输出给至少两个扬声器。

所述方法还可以包括：接收与所述至少两个音频信号相关联的捕获定向，以及其中向所述至少两个扬声器输出所述至少两个音频信号还基于所述捕获定向。

所述方法还可以包括：接收基于所述捕获定向的针对所述至少两个音频信号的音频输出顺序，其中将所述至少两个音频信号输出给所述至少两个扬声器还基于所述音频输出顺序。

将所述至少两个音频信号输出给至少两个扬声器可以包括以下至少之一：基于所述回放定向将所述至少两个音频信号路由到所述至少两个扬声器；以及将所述至少两个音频信号进行混合以生成将被输出给所述至少两个扬声器中的至少一个扬声器的向下混合(downmixed)的音频信号。

所述至少两个扬声器可以包括以下至少之一：扩音器；头戴式耳机；头戴式耳麦；带麦克风的耳机；外部扩音器；以及集成的免提扬声器。

根据第三方面，提供了一种装置，所述装置包括至少一个处理器和包含针对一个或多个程序的计算机代码的至少一个存储器，所述至少一个存储器和所述计算机代码被配置为使用所述至少一个处理器使得所述装置至少：生成至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移；确定捕获定向；以及基于所述捕获定向来输出所述至少两个音频信号，使得基于所述捕获定向来执行所述至少两个音频信号的回放。

确定捕获定向可以使得所述装置基于设备定向和关于在捕获装置中的麦克风配置的信息来确定音频捕获定向。

所述捕获定向可以是初始捕获定向值，以及基于所述捕获定向来输出所述至少两个音频信号可以使得所述装置根据初始音频输出顺序来输出所述至少两个音频信号。

还可以使得所述装置：确定在所述捕获定向和更早的定向之间的差是否大于定义值；以及与所述至少两个音频信号一起还输出所述捕获定向，使得基于所述捕获定向来执行所述至少两个音频信号的回放。

所述更早的定向可以是初始定向。

还可以使得所述装置：基于所述捕获定向来确定针对所述至少两个音频信号的音频输出顺序；以及与所述至少两个音频信号一起还输出所述音频输出顺序，使得基于所述音频输出顺序来执行所述至少两个音频信号的回放。

还可以使得所述装置：确定在所述捕获定向和所述更早的定向之间的差大于定义的音频输出重排序值；以及当在所述捕获定向和所述更早的定向之间的差大于定义的音频输出重排序值时，触发音频输出顺序的确定。

生成所述至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移，可以使得所述装置：在第一位置处使用第一麦克风来生成所述至少两个音频信号中的第一音频信号；在第二位置处使用第二麦克风来生成所述至少两个音频信号中的第二音频信号，在所述至少两个音频信号之间的相对位移是在所述第一位置和所述第二位置之间的位移。

生成所述至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移，可以使得所述装置执行以下至少之一：从包括至少两个麦克风的远程装置接收所述至少两个音频信号，所述至少两个麦克风在它们之间具有相对位移；以及从存储器来接收所述至少两个音频信号。

根据第四方面，提供了一种装置，所述装置包括至少一个处理器和包含针对一个或多个程序的计算机代码的至少一个存储器，所述至少一个存储器和所述计算机代码被配置为使用所述至少一个处理器使得所述装置：接收至少两个音频信号；确定回放定向；以及基于所述回放定向将所述至少两个音频信号输出给至少两个扬声器。

还可以使得所述装置：接收与所述至少两个音频信号相关联的捕获定向，以及其中向所述至少两个扬声器输出所述至少两个音频信号还基于所述捕获定向。

还可以使得所述装置：接收基于所述捕获定向的针对所述至少两个音频信号的音频输出顺序，其中将所述至少两个音频信号输出给所述至少两个扬声器还基于所述音频输出顺序。

将所述至少两个音频信号输出给所述至少两个扬声器可以使得所述装置执行以下至少之一：基于所述回放定向将所述至少两个音频信号路由到所述至少两个扬声器；以及将所述至少两个音频信号进行混合以生成将被输出给所述至少两个扬声器中的至少一个扬声器的向下混合的音频信号。

根据第五方面，提供了一种装置，所述装置包括：用于生成至少两个音频信号的构件，所述至少两个音频信号在它们之间具有相对位移；用于确定捕获定向的构件；以及用于基于所述捕获定向来输出所述至少两个音频信号，使得基于所述捕获定向来执行所述至少两个音频信号的回放的构件。

用于确定捕获定向的构件可以包括：用于基于设备定向和关于在捕获装置中的麦克风配置的信息来确定音频捕获定向的构件。

所述捕获定向可以是初始捕获定向值，以及用于基于所述捕获定向来输出所述至少两个音频信号的构件可以包括：用于根据初始音频输出顺序来输出所述至少两个音频信号的构件。

所述装置还可以包括：用于确定在所述捕获定向和更早的定向之间的差是否大于定义值的构件；以及用于输出的构件可以包括用于与所述至少两个音频信号一起输出所述捕获定向，使得基于所述捕获定向来执行所述至少两个音频信号的回放的构件。

所述更早的定向可以是初始定向。

所述装置还可以包括：用于基于所述捕获定向来确定针对所述至少两个音频信号的音频输出顺序的构件；以及用于输出的构件可以包括用于与所述至少两个音频信号一起还输出所述音频输出顺序，使得基于所述音频输出顺序来执行所述至少两个音频信号的回放的构件。

所述装置还可以包括：用于确定在所述捕获定向和所述更早的定向之间的差大于定义的音频输出重排序值的构件；以及用于当在所述捕获定向和所述更早的定向之间的差大于定义的音频输出重排序值时，触发音频输出顺序的确定的构件。

用于生成所述至少两个音频信号的构件，所述至少两个音频信号在它们之间具有相对位移，可以包括：用于在第一位置处使用第一麦克风来生成所述至少两个音频信号中的第一音频信号的构件；用于在第二位置处使用第二麦克风来生成所述至少两个音频信号中的第二音频信号的构件，在所述至少两个音频信号之间的相对位移是在所述第一位置和所述第二位置之间的位移。

用于生成所述至少两个音频信号的构件，所述至少两个音频信号在它们之间具有相对位移，可以包括以下至少之一：用于从包括至少两个麦克风的远程装置接收所述至少两个音频信号的构件，所述至少两个麦克风在它们之间具有相对位移；以及用于从存储器来接收所述至少两个音频信号的构件。

根据第六方面，提供了一种装置，所述装置包括：用于接收至少两个音频信号的构件；用于确定回放定向的构件；以及用于基于所述回放定向将所述至少两个音频信号输出给至少两个扬声器的构件。

所述装置还可以包括：用于接收与所述至少两个音频信号相关联的捕获定向的构件，以及其中用于向所述至少两个扬声器输出所述至少两个音频信号的构件还基于所述捕获定向。

所述装置还可以包括：用于接收基于所述捕获定向的针对所述至少两个音频信号的音频输出顺序的构件，其中用于将所述至少两个音频信号输出给所述至少两个扬声器的构件还基于所述音频输出顺序。

用于将所述至少两个音频信号输出给所述至少两个扬声器的构件可以包括以下至少之一：用于基于所述回放定向将所述至少两个音频信号路由到所述至少两个扬声器的构件；以及用于将所述至少两个音频信号进行混合以生成将被输出给所述至少两个扬声器中的至少一个扬声器的向下混合的音频信号的构件。

根据第七方面，提供了一种装置，所述装置包括：输入器，其被配置为接收至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移；定向传感器确定器，其被配置为基于设备定向和关于在捕获装置中的麦克风配置的信息来确定音频捕获定向；以及音频输出生成器，其被配置为基于所述捕获定向来输出所述至少两个音频信号，使得基于所述捕获定向来自执行所述至少两个音频信号的回放。

所述捕获定向可以是初始捕获定向值，以及所述音频输出生成器可以被配置为根据初始音频输出顺序来输出所述至少两个音频信号。

所述装置还可以包括：定向比较器，其被配置为确定在所述捕获定向和更早的定向之间的差是否大于定义值；以及音频定向信号生成器，其被配置为与所述至少两个音频信号一起还输出所述捕获定向，使得基于所述捕获定向来执行所述至少两个音频信号的回放。

所述更早的定向可以是初始定向。

所述音频输出生成器可以被配置为：基于所述捕获定向来确定针对所述至少两个音频信号的音频输出顺序；以及还被配置为与所述至少两个音频信号一起输出所述音频输出顺序，使得基于所述音频输出顺序来执行所述至少两个音频信号的回放。

所述装置可以包括：定向比较器，其被配置为确定在所述捕获定向和所述更早的定向之间的差大于定义的音频输出重排序值；以及还被配置为当在所述捕获定向和所述更早的定向之间的差大于定义的音频输出重排序值时，触发音频输出顺序的确定。

所述输入器可以耦合到第一麦克风，所述第一麦克风被配置为在第一位置处生成所述至少两个音频信号中的第一音频信号；第二麦克风，所述第二麦克风被配置为在第二位置处生成所述至少两个音频信号中的第二音频信号，在所述至少两个音频信号之间的相对位移是在所述第一位置和所述第二位置之间的位移。

所述输入器可以包括以下至少之一：输入器，其被配置为从包括至少两个麦克风的远程装置接收所述至少两个音频信号，所述至少两个麦克风在它们之间具有相对位移；以及输入器，其被配置为从存储器来接收所述至少两个音频信号。

根据第八方面，提供了一种装置，所述装置包括：输入器，其被配置为接收至少两个音频信号；通道选择器，其被配置为确定回放定向；以及通道切换器，其被配置为基于所述回放定向将所述至少两个音频信号输出给至少两个扬声器。

所述通道选择器还可以被配置为接收与所述至少两个音频信号相关联的捕获定向，以及基于所述捕获定向来确定回放定向，以及其中所述通道切换器被配置为向所述至少两个扬声器输出所述至少两个音频信号还基于所述捕获定向。

所述通道选择器还可以被配置为接收基于所述捕获定向的针对所述至少两个音频信号的音频输出顺序，基于针对所述至少两个音频信号的所述音频输出顺序来确定回放定向，其中所述通道切换器被配置为将所述至少两个音频信号输出给所述至少两个扬声器还基于所述音频输出顺序。

所述通道切换器可以包括以下至少之一：路由器，其被配置为基于所述回放定向将所述至少两个音频信号路由到所述至少两个扬声器；以及混合器，其被配置为将所述至少两个音频信号进行混合以生成将被输出给所述至少两个扬声器中的至少一个扬声器的向下混合的音频信号。

存储在介质上的计算机程序产品可以使得装置执行如本文中描述的方法。

电子设备可以包括如本文中描述的装置。

芯片组可以包括如本文中描述的装置。

本申请的实施例旨在解决与现有技术相关联的问题。

附图说明

为了更好地理解本申请，现在通过示例来参照附图，在附图中：

图1示意性地示出了适用于在一些实施例中使用的装置；

图2示意性地示出了根据一些实施例的示例音频捕获或记录装置；

图3示意性地示出了根据一些实施例的在图2中示出的音频捕获或记录装置的操作的流程图；

图4示意性地示出了根据一些实施例的在图2中示出的音频捕获或记录装置的另外的操作的另外的流程图；

图5示意性地示出了根据一些实施例的示例音频回放装置；

图6示意性地示出了根据一些实施例的在图5中示出的音频回放装置的操作的流程图；

图7示意性地示出了根据一些实施例的在图5中示出的音频回放装置的另外的操作的另外的流程图；

图8至11示出了根据一些实施例的针对90度旋转的示例的3个麦克风捕获装置和3个扬声器回放装置定向组合；

图12至15示出了根据一些实施例的针对90度旋转的示例的2个麦克风捕获装置和2个扬声器回放装置定向组合；

图16至19示出了根据一些实施例的针对90度旋转的示例的2个麦克风捕获装置和3个扬声器回放装置定向组合；

图20至23示出了根据一些实施例的针对90度旋转的示例的3个麦克风捕获装置和2个扬声器回放装置定向组合；

图24示意性地示出了根据一些实施例的示例的8个麦克风捕获装置和8个扬声器回放装置的配置；

图25示意性地示出了根据一些实施例的示例的3个麦克风捕获装置的配置；

图26示意性地示出了根据一些实施例的具有任意定向感测的音频记录和回放系统的操作的流程图；

图27示意性地示出了根据一些实施例的具有水平和垂直定向感测的音频记录和回放系统的操作的另一个流程图；以及

图28示意性地示出了根据一些实施例的具有四分位数定向感测的音频记录和回放系统的操作的流程图。

具体实施方式

以下进一步详细描述合适的装置和可能的机制，该合适的装置和可能的机制针对提供例如在通过无线通信链路操作的音频-视频捕获和回放装置内的高效的声场记录和回放。在以下示例中，描述了音频捕获和回放。然而，将了解的是，在一些实施例中，音频捕获和回放是音频-视频系统的一部分。

如本文中描述的，移动设备或装置更常见地装备有适用于记录或捕获在移动设备或装置周围的音频环境或音频场景的多个麦克风配置或麦克风阵列。多个麦克风配置使得能够记录立体声或环绕声信号。

然而，此类移动设备或装置(诸如智能电话)在麦克风的数量和它们的位置中受到限制。因为附加的麦克风增加了尺寸和制造成本，因此麦克风的当前设计针对不同的应用‘重用’麦克风。例如，在‘底端’和‘顶端’处的麦克风位置可以用于在电话的手持便携电话应用中拾取语音和参考噪声以及这些麦克风在视频/音频记录应用中被重用。

类似的移动设备或装置更加常见地装备有适用于生成以立体声或多通道音频格式的合适的音频环境或音频场景的多个扬声器配置。然而，此类移动设备或装置(诸如智能电话)在麦克风的数量和它们的位置中也受到限制。因为附加的扬声器增加了尺寸和制造成本，因此针对麦克风存在与那些约束类似的约束。

因此，当移动设备用于捕获音频时，设备的定向对所捕获的音频的质量具有显著的影响。例如，仅能够在相对于电话的一个定向(诸如由于麦克风的位置，水平或垂直定向)中捕获立体声音频的具有立体声能力的设备将意味的是，改变设备的定向也将改变所捕获的立体声音频信号的‘定向’。

例如，当捕获视频和音频时(例如，在视频电话呼叫期间)，用户有时可以偏爱捕获在纵向定向中的视频，以及有时偏爱捕获在横向定向中的视频，以及甚至在相同的呼叫期间在这些之间改变。这可以在回放或渲染设备不知道音频捕获设备的定向时导致问题以及可以阻止立体声音频信号的正确回放。因此，这可以降低在接收端的音频质量。

已经有建议的解决方案，该解决方案用于在视频捕获期间通过信号传送视频捕获设备的定向以保证在呼叫期间在接收器处以正确的定向来播放所捕获的视频图像而不需要接收方手工地旋转回放设备以匹配捕获设备。此外，将所捕获的视频旋转到在回放设备处或在接收器侧的新定向中是相对简单的任务，因为针对旋转所需的所有信息在所捕获的视频信号中存在。然而，音频的捕获/渲染典型地受限于某一定向(由于在设备上的有限数量的麦克风/扬声器以及它们的受限制的方位)，以及因此可能不能使得能够在回放设备处的所捕获的音频信号的“自由”旋转。

此外，在使用GSMA的富通信套件(RCS)5.1的将来的设备中的视频定向的校正不能恰当地校正音频定向(即，所捕获的音频信号的定向)以及可能使得情况更糟，因为所提出的校正方法可能导致音频和视频定向不同步(例如，在屏幕顶部处示出的声源被从位于屏幕的右手侧或左手侧处的扬声器播出，或在屏幕的左手侧的声源被从屏幕的右手侧播出)。

因此如本文中更详细描述的构思是如下构思：音频记录系统提供针对所期望的记录距离的最优的拾取和立体成像，同时最小化麦克风的数量并且考虑在麦克风放置中的限制。

如本文中更详细描述的构思提供了一种解决方案以将回放或渲染(接收)设备(或头戴式耳机或外部扩音器)的扬声器的使用与在记录或捕获(发送)设备中的麦克风的使用对齐。

在一些实施例中，这是通过从发送设备向接收设备通过信号传送音频记录(捕获)的定向来实现的。在一些实施例中，仅当音频捕获的定向改变时或当在非默认定向(诸如针对立体声音频的垂直捕获)处执行音频捕获时，该通过信号传送可以被执行作为音频数据的一部分以及贯穿传输来发送或作为另外的信息被发送。

在如本文中更详细描述的一些实施例中，构思扩展到用于当音频定向的未对准在捕获和渲染设备之间出现时在渲染设备处提供最佳可能的音频质量的装置和方法。

将理解的是，如本文中描述的，通过使用重力传感器以及通过具有设备的音频捕获属性的知识(也就是说，麦克风的数量和它们的位置连同关于哪些麦克风用于那个设备定向的知识)来检测音频捕获设备的定向(在发送侧)。在一些实施例中，通过信号传送音频定向的包含可以通过使用实时协议(RTP)头部扩展来执行。

在这点上，首先参照图1，图1示出了示例性的装置或电子设备10的示意性框图，它可以用于记录(或作为捕获装置进行操作)或回放(作为渲染装置进行操作)音频信号。

当担当记录装置或收听装置时，电子设备10可以例如是无线通信系统的移动终端或用户设备。在一些实施例中，该装置可以是音频播放器或音频记录器，诸如MP3播放器、媒体记录器/播放器(还被称为MP4播放器)、或适用于记录音频的任何合适的便携式装置或音频/视频摄像机/存储器音频或视频记录器。

在一些实施例中，装置10可以包括音频-视频子系统。在一些实施例中，音频-视频子系统例如可以包括用于音频信号捕获的麦克风或麦克风的阵列11。在一些实施例中，麦克风或麦克风的阵列可以是固态麦克风，也就是说，能够捕获音频信号以及输出合适数字格式的信号，也就是说不需要模拟至数字转换器。在一些其它实施例中，麦克风或麦克风的阵列11可以包括任何合适的麦克风或音频捕获构件，例如，电容式麦克风、电容麦克风、静电麦克风、驻极体电容麦克风、动圈麦克风、带式麦克风、碳粒麦克风、压电麦克风、或微机电系统(MEMS)麦克风。在一些实施例中，麦克风11或麦克风的阵列将音频捕获信号输出给模拟-至-数字转换器(ADC)14。

在一些实施例中，该装置还可以包括：模拟-至-数字转换器(ADC)14，其被配置为从麦克风接收模拟捕获的音频信号以及输出以合适的数字格式的音频捕获的信号。模拟-至-数字转换器14可以是任何合适的模拟-至-数字转换或处理构件。在麦克风是‘集成’的麦克风的一些实施例中，麦克风含有音频信号生成和模拟-至-数字转能力两者。

在一些实施例中，装置10音频-视频子系统还包括：数字-至-模拟转换器32，其用于将来自处理器21的数字音频信号转换成合适的模拟格式。在一些实施例中，数字-至-模拟转换器(DAC)或数字处理构件32可以是任何合适的DAC技术。

此外，在一些实施例中，音频-视频子系统可以包括扬声器33。在一些实施例中，扬声器33能够接收来自数字-至-模拟转换器32的输出以及向用户呈现模拟音频信号。在一些实施例中，扬声器33可以表示多扬声器布置、头戴式耳麦，例如一幅头戴式耳机，或无绳耳机。

在一些实施例中，装置音频-视频子系统包括：相机51或图像捕获构件，其被配置向处理器21提供图像数据。在一些实施例中，相机可以被配置为随着时间的流逝提供多个图像以提供视频流。

在一些实施例中，装置音频-视频子系统包括显示器52。显示器或图像显示构件可以被配置为输出可以由装置的用户观看的可视图像。在一些实施例中，显示器可以是适用于向装置提供输入数据的触控屏显示器。显示器可以是任何合适的显示技术，例如，显示器可以由包括LCD、LED、OLED或‘等离子’显示器实现方式的盒的平板来实现。

尽管装置10被示出为具有音频/视频捕获和音频/视频呈现组件，但是将理解的是在一些实施例中，装置10可以包括音频子系统的仅音频捕获或音频呈现部件，使得在该装置的一些实施例中，麦克风(用于音频捕获)或扬声器(用于音频回放或呈现)是存在的。

在一些实施例中，装置10包括处理器21。处理器21耦合到音频-视频子系统以及特别地，在一些示例中，用于从麦克风11接收表示音频信号的数字信号的模拟-至-数字转换器14、被配置为输出处理的数字音频信号的数字-至-模拟转换器(DAC)12、用于接收表示视频信号的数字信号的相机51、以及被配置为输出来自处理器21的处理的数字视频信号的显示器52。

处理器21可以被配置为执行各种程序代码。所实现的程序代码可以包括例如根据本文中描述的一些实施例的音频记录和音频呈现例程。在一些实施例中，程序代码可以被配置为执行音频信号处理。

在一些实施例中，该装置还包括存储器22。在一些实施例中，处理器耦合到存储器22。存储器可以是任何合适的存储构件。在一些实施例中，存储器22包括程序代码段23，程序代码段23用于存储在处理器21上能够执行的程序代码。此外，在一些实施例中，存储器22还可以包括用于存储数据的存储的数据段24，例如，已经根据本申请被编码的数据或经由如随后描述的本申请的实施例被编码的数据。在程序代码段23内存储的所实现的程序代码，以及在所存储的数据段24内存储的数据可以被处理器21在需要时经由存储器-处理器耦合来检索。

在一些另外的实施例中，装置10可以包括用户接口15。在一些实施例中，用户接口15可以耦合到处理器21。在一些实施例中，处理器能够控制用户接口的操作以及从用户接口15接收输入。在一些实施例中，用户接口15可以使得用户能够例如经由小键盘向电子设备或装置10输入命令，和/或例如经由显示器(其是用户接口15的一部分)从装置10获得信息。在如本文中描述的一些实施例中，用户接口15包括：触控屏或触控接口，其能够使得信息被输入到装置10以及还向装置10的用户显示信息。

在一些实施例中，该装置还包括收发器13，在此类实施例中，收发器13可以耦合到处理器并且被配置为使得能够例如经由无线通信网与其它装置或电子设备通信。在一些实施例中，收发器13或任何合适的收发器或传送器和/或接收器构件可以被配置为经由线缆或有线耦合与其它电子设备或装置通信。

收发器13能够通过任何合适的已知的通信协议与另外的装置通信，例如在一些实施例中，收发器13或传送器构件可以使用合适的通用移动通信系统(UMTS)协议、诸如例如IEEE802.X的无线局域网(WLAN)协议、诸如蓝牙的射频通信协议、或红外线数据通信路径(IRDA)。

在一些实施例中，该装置包括方位传感器16，其被配置为估计装置10的方位。在一些实施例中，方位传感器16可以是卫星定位传感器，诸如GPS(全球放置系统)、GLONASS或伽利略接收器。

在一些实施例中，定位传感器可以是蜂窝ID系统或辅助GPS系统。

在一些实施例中，装置10还包括方向或定向传感器。定向/方向传感器，在一些实施例中，可以是电子罗盘、加速计、陀螺仪或重力传感器或可以使用定位估计通过装置的运动来确定。

还将理解的是，可以以许多方式来补充和改变电子设备10的结构。

参照图2，示出了根据一些实施例的示例音频捕获或记录装置的配置。此外，关于图3和图4，更详细地示出了在图2中示出的音频捕获或记录装置的一些实施例的操作。

在一些实施例中，该装置包括麦克风的阵列11，其被配置为记录或捕获声波以及生成针对每个麦克风的音频信号，该音频信号可以被传递或输入到音频捕获装置。如本文中描述的，在一些实施例中，麦克风11被配置为输出模拟信号，通过模拟至数字转换器(ADC)14该模拟信号被转换成数字格式。然而，在此处的示例中示出的麦克风是集成的麦克风，它被配置为向麦克风顺序生成器103直接输出数字格式。

在此处示出的示例中，有N个麦克风。在一些实施例中，可以以任何合适的方式来布置这些麦克风。然而，可以关于图25示出示例麦克风配置，在图25中，在该装置上分布三个麦克风。如在图25中示出的，装置包括三个麦克风。第一麦克风(右边的麦克风)11₁、以及第二麦克风(左边的麦克风)11₂位于在与相机相同的在装置相同侧上的垂直平面上，据此被称为设备的前面。此外，该装置包括第三麦克风(左后麦克风)11₃，其位于在与含有相机的前侧相对侧上的相同或类似的水平面上。也就是说，在常规使用中，其中相机位于在与显示器相对的一侧上，显示器在使用中典型地面向用户，左后的麦克风11₃是常规语音呼叫麦克风，以及第一麦克风和第二麦克风降噪麦克风被配置为捕获‘噪声’以向语音呼叫音频信号应用噪声降低或消除。

尽管在图25中示出的示例中有三个麦克风，但是将理解的是，在一些实施例中，可以有超过或少于三个麦克风，以及麦克风可以以任何合适的方式被布置在装置上或位于装置上。例如，图24示出了八个麦克风配置，其中八个麦克风围绕定义的圆以45度角位于在装置的表面上。因此例如第一麦克风位于0度，第二麦克风位于45度，第三麦克风位于90度，第四麦克风位于135度，第五麦克风位于180度，第六麦克风位于225度，第七麦克风位于270度，以及第八麦克风位于315度。多个麦克风配置可以位于在装置上的非平坦表面上或可以被分散到装置的不只一个表面/侧上。

此外，尽管如在图2以及图24和图25中示出的，麦克风是装置的一部分，但是将理解的是，在一些实施例中，麦克风或麦克风阵列与装置物理上分离，例如，麦克风阵列可以位于在头戴式耳麦上(其中非必须地，头戴式耳麦可以具有相关联的视频相机)，头戴式耳麦无线地或以其他方式将音频信号传递给装置以用于处理。此外，尽管将理解的是，由麦克风实时地生成音频信号，也就是说生成了至少两个音频信号，该至少两个音频信号在它们之间具有相对位移，但是在一些实施例中，这些音频信号可以被理解为从存储设备或存储器来接收。例如，在一些实施例中，‘生成’音频信号可以来自记录的和存储的音频信号(例如，在离线信号处理应用中)。

在图3和图4中由步骤201示出了接收或生成音频信号的操作。

在一些实施例中，该装置包括重力/定向传感器16。如本文中描述的，重力/定向传感器16可以是任何合适的设备或构件，其用于生成表示与定义水平有关的装置定向的信号和值。在以下示例中，重力/定向传感器16相对于垂直平面或水平面来定义值或生成装置的值。

然而，将理解的是，在一些实施例中，重力/定向传感器16被配置为确定在超过一个平面中的定向，也就是说确定滚转、俯仰和偏航旋转值。此外，将理解的是，尽管如本文中描述的实施例描述了关于水平平面的滚转定向的使用或实现方式，但是类似的方法可以应用于俯仰和偏航旋转或这些中的至少两个的组合。

在图3和图4中通过步骤203示出了接收或生成定向信息的操作。

在一些实施例中，重力/定向传感器16向音频定向信号生成器101和麦克风顺序生成器103输出定向信息。

在一些实施例中，该装置包括音频定向信号生成器101。音频定向信号生成器101被配置为接收重力/定向传感器16的输出以及首先确定音频定向信号是否被生成以及其次将被输出的音频定向信号。

在一些实施例中，音频定向信号生成器101被配置为接收定向信息。

音频定向信号生成器被配置为确定音频定向信号。在一些实施例中，这被生成而不管定向值是什么。然而，在一些实施例中，音频定向信号的确定(也就是说，定向信号是否被输出给接收或回放装置)基于音频定向信息。例如，在一些实施例中，音频定向信号生成器101可以被配置为生成并且传送信号给接收或回放装置，该信号包括音频捕获的定向值，其中该捕获的定向从确定的‘默认’音频定向而言大于确定的阈值。‘默认’的定向可以是任何合适的音频信号，尽管典型地，它是水平定向。在一些实施例中，用于确定是否改变捕获的音频定向的阈值(即通过信号传送音频定向值)可以与默认定向成45度，这个阈值确定音频捕获在接收器处被认为是水平定向还是垂直定向。合适的迟滞应当被应用以避免音频在接收设备处在两个定向之间振荡。在一些实施例中，用于确定是否传送音频定向值的阈值可以大于或小于45度。将理解的是，音频定向还被称为捕获定向或音频捕获定向。还将理解的是，在一些实施例中，确定捕获定向可以包括基于设备定向和关于在捕获装置中的麦克风配置的信息来确定音频捕获定向。也就是说，音频定向信号生成器可以被配置为接收关于麦克风配置的信息，诸如麦克风的数量，麦克风的方位以及麦克风和/或麦克风所附着的设备的相对定位。在一些实施例中，该信息还可以包含麦克风的捕获的方向性(麦克风是方向性麦克风还是全向麦克风)以及在麦克风是方向性的情况下捕获方向性的定向。

在图3中通过步骤205示出了确定所确定的定向是否要求音频定向信号的操作。

音频定向信号生成器101于是，在一些实施例中，可以被配置为生成合适的音频定向信号。音频定向信号，在一些实施例中，包括定向角度的指示符。例如，在一些实施例中，音频定向信号包括四分位数版本的音频定向信号。音频定向信号例如可以包括如下指示：音频捕获是水平定向的或垂直定向的，也就是说，音频定向信号是使用90度定向四分位数的记录的定向值但是没有关于哪一侧是在垂直平面或水平平面中的信息。在此类实施例中，音频定向信号可以要求仅一个比特来通过信号传送这个信息，但是捕获和渲染设备必须知道音频输出顺序，即，哪个信号首先在水平捕获(音频输出顺序，“左、右”或“右、左”)中以及在垂直捕获(音频输出顺序：“顶部、底部”或“底部、顶部”)中被发送。“音频输出顺序”意味着顺序(在比特流中)，以该顺序从捕获设备将音频输出发送给接收设备。

在一些实施例中，音频定向信号例如可以包括如下指示：音频捕获是垂直定向的、旋转了180度垂直定向的、水平定向的、旋转了180度水平定向的。也就是说，音频定向信号是具有四分位数量化的记录或捕获的定向值(或输出0度、90度、180度或270度定向的值，可以使用2比特通过信号传送它)。在这种情况下，可以通过音频定向信号自身通过信号来传送音频输出顺序。在一些实施例中，可以使用更加准确的量化，例如0°,45°,90°,135°,180°...315°，可以使用3比特通过信号来传送它们。

然而，将理解的是，音频定向信息可以在任何合适的格式或形式或量化水平中。在一些实施例中，通过信号传送的音频定向信息作为音频信号的元数据被提供。例如，在非实时记录中，其中从外部源来接收/下载音频信号，以及在元数据中提供定向数据。

在一些实施例中，可以通过将定向值嵌入在任何合适的消息或协议内并且将它传送给接收或回放设备来执行音频定向的信号传递。在一些实施例中，定向值可以被嵌入在实时协议(RTP)头部扩展内。例如，可以通过使用如在IETFRFC5285"AGeneralMechanismforRTPHeaderExtensions"中解释的方式中的RTP头部扩展在互联网协议(IP)连接上来实现音频定向的信号传递。以下给出示例的RTP头部扩展，具有一个扩展的元素，一些填充，以及包含所要求的RTP字段。这支持针对每个RTP帧的具有8比特的音频定向信令(AOS)数据(指定音频捕获的定向，例如，在角度中)。这应当足以支持针对音频定向的任何实用的粒度。

在一些实施例中，仅在确定在音频定向中的改变后发送AOS数据以避免将太多的开销添加到整体传输数据中。

然而，将理解的是，在一些实施例中，AOS数据的生成和/或传输是规则的或连续的操作。

在一些实施例中，扩展的AOS数据，含有不仅音频捕获的定向的信息而且配置信息，在会话建立协商阶段被传送。在基于IP的服务中，可以使用会话描述协议(SDP)来执行此类建立协商，以及麦克风的布局或配置(即在捕获或发送设备中的它们的数量和方位以及任何其他有关配置信息)被详细地传送给接收器。在此类实施例中，仅基于设备定向信令，使得回放或接收设备知道不仅发送设备的定向而且在发送设备中的音频捕获的定向，以及因此可以不需要在建立后发送任何另外的AOS数据。在一些实施例中，可以从捕获或发送设备来生成并传送任何另外的捕获设备定向(或在定向中的至少改变)给回放或接收设备。将理解的是，SDP实施例尝试减少信令开销，但是要求“公共语言”的定义，也就是说，关于麦克风布局是什么样的新的SDP参数的引入由发送设备来描述并且传递给接收设备。

在图3中由步骤207示出了音频定向信号的生成的操作。

此外，音频定向信号生成器于是可以被配置为输出音频定向信号(AOS数据)，其在麦克风顺序生成器103或捕获装置通常输出音频信号(或在一些实施例中，麦克风它们自己输出音频信号)的同时被输出。

在图3中由步骤209示出了与音频信号一起输出音频定向信号的操作。

在音频定向信号生成器101确定没有定向信号将被输出的情况下，然后音频定向信号传送器被配置为不输出音频定向信号。因此在一些实施例中，记录设备或装置输出仅音频信号。

在一些实施例中，在图3中由步骤211示出了输出仅音频信号的操作。

在一些实施例中，可以不仅根据捕获或记录设备的定向而且还根据捕获或记录设备的麦克风配置来执行是否生成或传送音频定向信号的确定。例如，将理解的是，假设关于捕获装置、回放装置(包含回放装置的定向)的配置以及传送音频信号的方式而言满足某些判据，则针对捕获或记录装置的任何定向而言捕获或记录装置的定向可能不是有问题的。

因此例如，在一些实施例中，音频定向信号生成器101被配置为确定关于捕获装置的麦克风配置(例如，麦克风的数量和麦克风的位置)的给定信息，在音频信号回放方面，设备的定向是否可能是有问题的。

在一些实施例中，音频定向信号生成器101被配置为假设输出设备扬声器配置与当前的记录设备是相同的，然而，如本文中描述的，在一些实施例中，音频定向信号生成器101可以接收来自回放设备的关于扬声器配置的信息(以及在一些实施例中，关于回放装置的定向的信息)，以及确定麦克风配置、扬声器配置以及每个的定向是否可能是有问题的。

例如在一些实施例中，音频定向信号生成器101可以使用查询表以确定是否生成和传送定向信号。

在一些实施例中，该装置包括麦克风顺序生成器102或音频输出排序器(或用于生成音频输出顺序的合适的构件)。麦克风顺序生成器103被配置为接收来自麦克风的输入，诸如在图25中由麦克风11_i到11_N所示出的，以及还接收来自重力/定向传感器16的指示装置的定向的输入。在一些实施例中，麦克风顺序生成器103可以被配置为确定特定音频输出顺序或向接收或回放装置通知特定音频输出顺序。

在以下示例中，音频输出顺序是最左边的通道、最右边的通道然后是其它通道，然而可以实现任何合适的音频输出顺序。例如，最右边通道到最左边通道，最上面通道到最下边通道，或最下面通道到最上面通道。

此外，音频输出顺序可以不同于线性排序，例如，在一些实施例中，音频输出顺序可以是循环的顺序，从第一定向开始(最左边通道)以及然后根据麦克风通道顺时针(或逆时针)出现对它们排序。

在一些实施例中，音频输出顺序可以超过一个维度(以及因此使得能够考虑俯仰与偏航旋转)。

在一些实施例中，麦克风顺序生成器103因此被配置为基于麦克风的位置和定向传感器输出的知识来确定音频输出顺序。

在装置的示例3麦克风配置中，在初始定向中(0度)，第一麦克风L11₁₁位于装置的顶部左面，第二麦克风R11₁₂位于装置的顶部右面，以及第三麦克风L’11₁₃位于装置的底部左面。在以下描述中，顶部和底部分别指在最高重力势和最低重力势处的有关方位或元件的通常表示。然而，将理解的是，在一些实施例中，顶部和底部指在任何合适向量中的有关相对的方位或元件。因此，类似地，在一些实施例中，顶部和底部可以被称为上和下。

此外，在以下示例中，其中在两个麦克风之间存在选择，例如，存在两个麦克风位于与第三麦克风相同的或类似的水平距离，则与第三麦克风具有最小垂直距离的麦克风应当被放入在音频输出顺序中的(两个中的)第一。也就是说，在这个示例中，其中可能第一麦克风被选择，因为与其他麦克风相比是最左面的麦克风，以及第二麦克风被选择，因为与第三麦克风相比是最右面的麦克风。另外，基于如由AOS所指示的(最高分离的)定向来得到音频输出顺序，即在垂直捕获的情况下，它将基于哪个麦克风位于最上面以及哪个麦克风位于设备上的最下面(而不是最左和最右)。此外，在以下的示例中示出这种情况。将理解的是，可以使用任何合适的选择顺序。

因此，针对初始的0度定向，麦克风顺序生成器可以被配置为生成L、R、L’的音频输出顺序。

90度顺时针的旋转使得麦克风顺序生成器生成L’、L、R的音频输出顺序。

90度顺时针的进一步旋转，也就是说与初始定向成180度，使得麦克风顺序生成器生成R、L、L’的音频输出顺序。

此外，90度顺时针的进一步旋转，也就是说与初始定向成270度，使得麦克风顺序生成器生成L、L’、R的音频输出顺序。

也就是说，在排序内麦克风音频信号出现的顺序基于装置的定向值。在一些实施例中，可以基于输入定向传感器值的查询表来确定这种排序。

在图4中由步骤301示出了基于定向信息来确定音频输出顺序的操作。

此外，在一些实施例中，麦克风顺序生成器103被配置为在所确定的音频输出顺序中来输出音频信号。

也就是说，与在排序上的第一元件相关联的麦克风音频信号作为第一输出通道105₁被输出，与在排序上的第二元件相关联的麦克风音频信号作为第二输出通道105₂被输出，以及诸如此类。

将理解的是，在一些实施例中，可以有比存在的麦克风音频信号更多或更少的输出通道。

在图4中由步骤303示出了在所确定的定向顺序中输出音频信号的操作。

在一些实施例中，麦克风顺序生成器103以原始接收的顺序来输出麦克风音频信号，以及不改变音频输出顺序，被配置为输出作为消息的音频输出顺序或通过信号传送它给接收器或回放装置。

此外，在一些实施例中，在记录或捕获装置内没有麦克风顺序生成器。然而，在此类实施例中，可以在接收或回放装置内实现麦克风顺序生成器的操作，如之前解释的，该接收或回放装置已经接收或确定了指示捕获装置的定向的信号以及此外例如在作为扩展的AOS数据的SDP消息中已经接收了麦克风配置信息。

关于图8到图11能够示出示例音频输出排序和音频定向信号生成情况，其中示出了针对捕获或记录装置的示例3麦克风配置以及针对90度的定向步骤示出了针对回放或渲染装置的示例3扬声器配置。

在示例3麦克风配置中，初始定向(0度)是在纵向定向中，其中第一麦克风L11₁₁位于装置的顶部左面，第二麦克风R11₁₂位于装置的顶部右面，以及第三麦克风L’11₁₃位于装置的底部左面。

类似地，在示例3扬声器配置中，初始定向(0度)是在纵向定向中，其中第一扬声器33₁₁位于装置的顶部左面，第二扬声器33₁₂位于装置的顶部右面，以及第三扬声器33₁₃位于装置的底部左面。

图8例如示出了四种情况，其中记录或捕获装置(发送装置)在初始定向中，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中旋转在角度中被顺时针测量)。麦克风顺序生成器在这四种情况中可以被配置为生成L、R、L’的音频输出顺序。在这些实施例中，音频输出可以被正确地排序或加标签，使得左面(最)通道的音频信号是由第一麦克风11₁₁L所产生的，以及右面(最)通道的音频信号是由第二麦克风11₁₂R所产生的。将理解的是，在一些实施例中，左面(最)通道的音频信号可以是由第三麦克风11₁₃L’所产生的。图8示出了尽管回放装置的旋转，但是在回放中没有问题，以及因此，在一些实施例中，不需要发送AOS数据。

图9示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成90度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成L’、L、R的音频输出顺序。在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第三麦克风11₁₃L’所产生的，以及右面(最)通道的音频信号是由第一麦克风11₁₁L所产生的。将理解的是，在一些实施例中，右面(最)通道的音频信号可以是由第二麦克风11₁₂R所产生的。图9示出了尽管捕获装置和回放装置的旋转，但是没有问题，以及因此，在一些实施例中，不需要发送AOS数据(假设音频输出被正确地排序或加标签)。

图10示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成180度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成R、L、L’的音频输出顺序。在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第二麦克风11₁₂R所产生的，以及右面(最)通道的音频信号是由第一麦克风11₁₁L所产生的。将理解的是，在一些实施例中，右面(最)通道的音频信号可以是由第三麦克风11₁₃L’所产生的。图10示出了尽管捕获装置和回放装置的旋转，但是没有问题，以及因此，在一些实施例中，不需要发送AOS数据(假设音频输出被正确地排序或加标签)。

图11示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成270度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成L、L’、R的音频输出顺序。在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第一麦克风11₁₁L所产生的，以及右面(最)通道的音频信号是由第三麦克风11₁₃L’所产生的。将理解的是，在一些实施例中，左面(最)通道的音频信号可以是由第二麦克风11₁₂R所产生的。图11示出了尽管捕获装置和回放装置的旋转，但是没有问题，以及因此，在一些实施例中，不需要发送AOS数据(假设音频输出被正确地排序或加标签)。

关于图12到图15示出了另一个示例音频输出排序和音频定向信号生成情况，其中示出了针对捕获或记录装置的示例2麦克风配置以及针对90度的定向步骤示出了针对回放或渲染装置的示例2扬声器配置。

在示例2麦克风配置中，初始定向(0度)是在纵向定向中，其中第一麦克风L11₁₁位于装置的顶部左面，第二麦克风R11₁₂位于装置的顶部右面。也就是说，类似于在图8至图11中示出的示例3麦克风配置，但是移除了或禁用或关闭了第三麦克风。

类似地，在示例2扬声器配置中，初始定向(0度)是在纵向定向中，其中第一扬声器33₁₁位于装置的顶部左面，第二扬声器33₁₂位于装置的顶部右面。也就是说，类似于在图8至图11中示出的示例3扬声器配置，但是移除了或禁用或关闭了第三扬声器。

图12例如示出了四种情况，其中记录或捕获装置(发送装置)在初始定向中，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中旋转在角度中被顺时针测量)。麦克风顺序生成器在这四种情况中可以被配置为生成L、R的音频输出顺序。在这些实施例中，音频输出可以被正确地排序或加标签，使得左面(最)通道的音频信号是由第一麦克风11₁₁L所产生的，以及右面(最)通道的音频信号是由第二麦克风11₁₂R所产生的。图12示出了在回放中没有由捕获装置所导致的问题，以及因此，在一些实施例中，不需要发送AOS数据。

图13示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成90度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成L、R的音频输出顺序。在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第一麦克风11₁₁L所产生的，以及右面(最)通道的音频信号是由第二麦克风11₁₂R所产生的。然而，记录或捕获装置的定向是这样的使得在第一麦克风11₁₁和第二麦克风11₁₂之间没有或有非常少的水平分离，以及因此，水平立体声捕获效果是最小化的(低于阈值)或一点也没有。因此，图13示出了捕获装置的定向可以导致问题，以及因此发送AOS数据以允许接收装置或回放装置考虑缺乏水平分离(或垂直捕获)。在一些实施例中，基于由AOS指示的定向来得到音频输出顺序。也就是说，针对在图13中示出的示例，音频输出顺序可以基于在该设备上，哪个麦克风位于最上面，以及哪个麦克风位于最下面(而不是最左和最右)。

图14示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成180度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成R、L的音频输出顺序。在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第二麦克风11₁₂R所产生的，以及右面(最)通道的音频信号是由第一麦克风11₁₁L所产生的。图14示出了在回放中没有由捕获装置所导致的问题，以及因此，在一些实施例中，不需要发送AOS数据(假设音频输出被正确地排序或加标签)。

图15示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成270度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成R、L的音频输出顺序。在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第二麦克风11₁₂R所产生的，以及右面(最)通道的音频信号是由第一麦克风11₁₁L所产生的。然而，记录或捕获装置的定向是这样的使得在第一麦克风11₁₁和第二麦克风11₁₂之间没有或有非常少的水平分离，以及因此，水平立体声捕获效果是最小化的(低于阈值)或一点也没有。因此，图15示出了捕获装置的定向可以导致问题，以及因此发送AOS数据以允许接收装置或回放装置考虑到缺乏水平分离(或垂直捕获)。在一些实施例中，基于由AOS指示的定向来得到音频输出顺序。也就是说，针对在图15中示出的示例，音频输出顺序可以基于在该设备上，哪个麦克风位于最上面，以及哪个麦克风位于最下面(而不是最左和最右)。

关于图16到图19可以示出另一个示例音频输出排序和音频定向信号生成情况，其中示出了针对捕获或记录装置的示例2麦克风配置以及针对90度的定向步骤示出了针对回放或渲染装置的示例3扬声器配置。

示例3扬声器配置(其类似于图8到图11中示出的示例)，初始定向(0度)是在纵向定向中，其中第一扬声器33₁₁位于装置的顶部左面，第二扬声器33₁₂位于装置的顶部右面，以及第三扬声器33₁₃位于该装置的底部左面。

图16例如示出了四种情况，其中记录或捕获装置(发送装置)在初始定向中，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中旋转在角度中被顺时针测量)。麦克风顺序生成器在这四种情况中可以被配置为生成L、R的音频输出顺序。在这些实施例中，音频输出可以被正确地排序或加标签，使得左面(最)通道的音频信号是由第一麦克风11₁₁L所产生的，以及右面(最)通道的音频信号是由第二麦克风11₁₂R所产生的。图12示出了在回放中没有由捕获装置所导致的问题，以及因此，在一些实施例中，不需要发送AOS数据。

图17示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成90度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成L、R的音频输出顺序。在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第一麦克风11₁₁L所产生的，以及右面(最)通道的音频信号是由第二麦克风11₁₂R所产生的。然而，记录或捕获装置的定向是这样的使得在第一麦克风11₁₁和第二麦克风11₁₂之间没有或有非常少的水平分离，以及因此，水平立体声捕获效果是最小化的(低于阈值)或一点也没有。因此，图13示出了捕获装置的定向可以导致问题，以及因此发送AOS数据以允许接收装置或回放装置考虑到缺乏水平分离(或垂直捕获)。在一些实施例中，基于由AOS指示的定向来得到音频输出顺序。也就是说，针对在图17中示出的示例，音频输出顺序可以基于在该设备上，哪个麦克风位于最上面，以及哪个麦克风位于最下面(而不是最左和最右)。

图18示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成180度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成R、L的音频输出顺序，在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第二麦克风11₁₂R所产生的，以及右面(最)通道的音频信号是由第一麦克风11₁₁L所产生的。图18示出了在回放中没有由捕获装置所导致的问题，以及因此，在一些实施例中，不需要发送AOS数据(假设音频输出被正确地排序或加标签)。

图19示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成270度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成R、L的音频输出顺序。在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第二麦克风11₁₂R所产生的，以及右面(最)通道的音频信号是由第一麦克风11₁₁L所产生的。然而，记录或捕获装置的定向是这样的使得在第一麦克风11₁₁和第二麦克风11₁₂之间没有或有非常少的水平分离，以及因此，水平立体声捕获效果是最小化的(低于阈值)或一点也没有。因此，图19示出了捕获装置的定向可以导致问题，以及因此发送AOS数据以允许接收装置或回放装置考虑到缺乏水平分离(或垂直捕获)。另外，基于由AOS指示的定向来得到音频输出顺序。也就是说，在这个图的情况下，音频输出顺序可以基于在该设备上，哪个麦克风位于最上面，以及哪个麦克风位于最下面(而不是最左和最右)。

关于图20到图23示出了第四示例音频输出排序和音频定向信号生成情况，其中示出了针对捕获或记录装置的示例3麦克风配置以及针对90度的定向步骤示出了针对回放或渲染装置的示例2扬声器配置。

在示例3麦克风配置中，初始定向(0度)是在纵向定向中，其中第一麦克风L11₁₁位于装置的顶部左面，第二麦克风R11₁₂位于装置的顶部右面，以及第三麦克风L’11₁₃位于装置的底部左面(也就是说，类似于如在图8到图11中示出的配置)。

在示例2扬声器配置中，初始定向(0度)是在纵向定向中，其中第一扬声器L33₁₁位于装置的顶部左面，第二扬声器麦克风R33₁₂位于装置的顶部右面。也就是说，类似于在图8至图11中示出的示例3扬声器配置，但是移除了或禁用或关闭了第三扬声器(也就是说，类似于在图12至图15中示出的配置)。

图20例如示出了四种情况，其中记录或捕获装置(发送装置)在初始定向中，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中旋转在角度中被顺时针测量)。麦克风顺序生成器在这四种情况中可以被配置为生成L、R、L’的音频输出顺序。在这些实施例中，音频输出可以被正确地排序或加标签，使得左面(最)通道的音频信号是由第一麦克风11₁₁L所产生的，以及右面(最)通道的音频信号是由第二麦克风11₁₂R所产生的。将理解的是，在一些实施例中，左面(最)通道的音频信号可以是由第三麦克风11₁₃L’所产生的。图20示出了在回放中没有由捕获装置所导致的问题，以及因此，在一些实施例中，不需要发送AOS数据。

图21示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成90度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成L’、L、R的音频输出顺序，在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第三麦克风11₁₃L’所产生的，以及右面(最)通道的音频信号是由第一麦克风11₁₁L所产生的。将理解的是，在一些实施例中，右面(最)通道的音频信号可以是由第二麦克风11₁₂R所产生的。图21示出了在回放中没有由捕获装置所导致的问题，以及因此，在一些实施例中，不需要发送AOS数据(假设音频输出被正确地排序或加标签)。

图22示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成180度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成R、L、L’的音频输出顺序，在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第二麦克风11₁₂R所产生的，以及右面(最)通道的音频信号是由第一麦克风11₁₁L所产生的。将理解的是，在一些实施例中，右面(最)通道的音频信号可以是由第三麦克风11₁₃L’所产生的。图22示出了在回放中没有由捕获装置所导致的问题，以及因此，在一些实施例中，不需要发送AOS数据(假设音频输出被正确地排序或加标签)。

图23示出了四种情况，其中记录或捕获装置(发送装置)与初始定向顺时针成270度，以及回放或渲染装置(接收装置)使用90度粒度被旋转(其中以角度顺时针地测量旋转)。在这四种情况中，麦克风顺序生成器可以被配置为生成L、L’、R的音频输出顺序，在这些实施例中，音频输出被正确地排序或加标签，使得左面(最)通道的音频信号是由第一麦克风11₁₁L所产生的，以及右面(最)通道的音频信号是由第三麦克风11₁₃L’所产生的。将理解的是，在一些实施例中，左面(最)通道的音频信号可以是由第二麦克风11₁₂R所产生的。图13示出了在回放中没有由捕获装置所导致的问题，以及因此，在一些实施例中，不需要发送AOS数据(假设音频输出被正确地排序或加标签)。

关于图5，示出了根据一些实施例的示例的接收或回放装置。此外，关于图6和图7，描述了如在图5中示出的回放或接收装置的示例操作。

在一些实施例中，接收装置被配置为接收AOS输入403。AOS输入403，在一些实施例中，可以被传送给通道选择器409。

在图7中由步骤503示出了接收AOS输入的操作。

此外，在一些实施例中，该装置包括重力/定向传感器405。重力/定向传感器405被配置为执行类似于在记录或捕获装置中描述的重力/定向传感器的作用。重力/定向传感器405被配置为向通道选择器409提供定向输出。

在图6和图7中由步骤505示出了接收/确定定向信息的操作。

在一些实施例中，回放或接收装置包括通道选择器409。通道选择器409可以被配置为接收AOS输入403，以及来自重力/定向传感器405的重力/定向传感器输出。此外，在一些实施例中，通道选择器409可以被配置为接收来自捕获或记录装置的音频配置/音频输出顺序信息。

在一些实施例中，通道选择器409可以被配置为从定向传感器输入值和AOS输入来确定通道输出配置。

将理解的是，通道选择器409具有回放装置的扬声器配置的知识，被配置为执行这种配置。也就是说，知道在回放中的可能的问题何时会出现，诸如例如，什么定向将在扬声器之间不产生水平分离。

在一些实施例中，通道选择器409还可以被配置为基于从捕获或记录设备传送的音频输入配置信息或音频输出顺序信息来执行通道输出确定。例如，其中音频信号输入没有以音频输出顺序来布置，但是可以由通道选择器409来选择性地排序。

在图7中由步骤601示出了基于AOS输入和定向信息来确定通道输出配置的操作。

此外，在一些实施例中，音频回放装置被配置为接收音频输入，在图5中音频输入被示出为音频输入1401₁和音频输入X401_x。音频输入被传送给通道混合器/切换器411。

在一些实施例中，接收或回放装置包括通道混合器/切换器411。通道混合器/切换器411可以被配置为接收来自通道选择器409的输入以及混合和/或切换音频输入以生成合适的音频输出。例如，如在图5中示出的，第一音频输出1413₁和音频输出Y413_Y。

在图7中由步骤613示出了将音频输入混合或切换到输出通道的操作。

如在图6中示出的操作不同于在图7中示出的操作，在于：通道选择器被配置为依赖于存在的AOS数据，生成通道输出配置。也就是说，如在图6中示出的实施例不同于在图7中示出的实施例，在于：如在图6中示出的实施例中所表示的装置被配置为：仅当提供AOS数据时，生成通道输出配置，其中输出配置基于所接收的AOS数据和定向信息的因素的组合，否则的话，‘初始’定向情况用于通道混合器/切换器411。

关于图7，装置被配置为在已知的时间段或连续地接收AOS数据，以及因此被配置为基于AOS数据和定向信息来确定通道输出配置。

在图6中由步骤507示出了检查AOS数据的操作。

在图6中由步骤509示出了基于存在的AOS数据来生成通道输出配置的操作。

关于图8至图11可以示出示例音频输入至输出配置情况，其中针对90度的定向步骤示出了针对捕获或记录装置的示例3麦克风配置，以及针对90度的定向步骤示出了针对回放或渲染装置的示例3的扬声器配置。

因此，例如，图8示出了捕获或记录装置和回放装置或接收器两者在初始定向中的情况下701，左面通道音频信号L在第一扬声器33₁₁上被输出以及右面通道音频信号R在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下703，左面通道音频信号L在第三扬声器33₁₃上被输出，以及右面音频信号R在第一扬声器33₁₁上被输出。在回放装置或接收器被旋转180度的情况下705，左面通道音频信号L在第二扬声器33₁₂上被输出，以及右面音频信号R在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下707，左面通道音频信号L在第一扬声器33₁₁上被输出，以及右面音频信号R在第三扬声器33₁₃上被输出。

因此，例如，图9示出了，在记录或捕获装置已经从初始方位被顺时针旋转90度的情况下，以及在回放装置或接收器在初始定向中的情况下801，左面通道音频信号L’在第一扬声器33₁₁上被输出，以及右面通道音频信号L在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下803，左面通道音频信号L’在第三扬声器33₁₃上被输出，右面通道音频信号L在第一扬声器33₁₁上被输出。在回放装置或接收器被旋转180度的情况下805，左面通道音频信号L’在第二扬声器33₁₂上被输出，右面通道音频信号L在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下807，左面通道音频信号L’在第一扬声器33₁₁上被输出，右面通道音频信号L在第三扬声器33₁₃上被输出。

因此，例如，图10示出了，在记录或捕获装置已经从初始方位被顺时针旋转180度的情况下，以及在回放装置或接收器在初始定向中的情况下901，左面通道音频信号R在第一扬声器33₁₁上被输出，以及右面通道音频信号L在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下903，左面通道音频信号R在第三扬声器33₁₃上被输出，右面通道音频信号L在第一扬声器33₁₁上被输出。在回放装置或接收器被旋转180度的情况下905，左面通道音频信号R在第二扬声器33₁₂上被输出，右面通道音频信号L在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下907，左面通道音频信号R在第一扬声器33₁₁上被输出，右面通道音频信号L在第三扬声器33₁₃上被输出。

因此，例如，图11示出了，在记录或捕获装置已经从初始方位被顺时针旋转270度的情况下，以及在回放装置或接收器在初始定向中的情况下1001，左面通道音频信号L在第一扬声器33₁₁上被输出，以及右面通道音频信号L’在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下1003，左面通道音频信号L在第三扬声器33₁₃上被输出，右面通道音频信号L’在第一扬声器33₁₁上被输出。在回放装置或接收器被旋转180度的情况下1005，左面通道音频信号L在第二扬声器33₁₂上被输出，右面通道音频信号L’在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下1007，左面通道音频信号L在第一扬声器33₁₁上被输出，右面通道音频信号L’在第三扬声器33₁₃上被输出。

关于图12至图15可以示出另外的示例音频输入至输出配置的情况，其中针对90度的定向步骤示出了针对捕获或记录装置的示例2麦克风配置，以及针对90度的定向步骤示出了针对回放或渲染装置的示例2扬声器配置。

因此，例如，图12示出了捕获或记录装置和回放装置或接收器两者在初始定向中的情况下1101，左面通道音频信号L在第一扬声器33₁₁上被输出以及右面通道音频信号R在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下1103，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号L和右面通道音频信号R的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。在回放装置或接收器被旋转180度的情况下1105，左面通道音频信号L在第二扬声器33₁₂上被输出，以及右面音频信号R在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下1107，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号L和右面通道音频信号R的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。

因此，例如，图13示出了，在记录或捕获装置已经从初始方位被顺时针旋转90度的情况下，以及在回放装置或接收器在初始定向中的情况下1201，AOS数据使得组合的左面通道音频信号L和右面通道音频信号R的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。当AOS信号指示垂直捕获时，回放装置或接收器将所接收的信号(在这个示例图中以及在以下其它示例图中)看作由相对于彼此垂直放置的麦克风所捕获的。在回放装置或接收器被旋转90度的情况下1203，AOS数据使得左面通道音频信号L在第一扬声器33₁₁上被输出，右面通道音频信号R在第二扬声器33₁₂上被输出。以此类方式，接收器被配置为输出所接收的音频信号作为垂直立体声输出。在回放装置或接收器被旋转180度的情况下1205，AOS数据使得组合的左面通道音频信号L和右面通道音频信号R的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂上被输出。此外，在回放装置或接收器被旋转270度的情况下1207，AOS数据使得左面通道音频信号L在第二扬声器33₁₂上被输出，右面通道音频信号R在第一扬声器33₁₁上被输出，以及因此输出所接收的音频信号作为垂直立体声输出。

因此，例如，图14示出了，在记录或捕获装置已经从初始方位被顺时针旋转180度的情况下，以及在回放装置或接收器在初始定向中的情况下1301，左面通道音频信号R在第一扬声器33₁₁上被输出，以及右面通道音频信号L在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下1303，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号R和右面通道音频信号L的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。在回放装置或接收器被旋转180度的情况下1305，左面通道音频信号R在第二扬声器33₁₂上被输出，以及右面通道音频信号L在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下1307，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号R和右面通道音频信号L的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂上被输出。

因此，例如，图15示出了，在记录或捕获装置已经从初始方位被顺时针旋转270度的情况下，以及在回放装置或接收器在初始定向中的情况下1401，AOS数据使得组合的左面通道音频信号R和右面通道音频信号L的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂上被输出。在回放装置或接收器被旋转90度的情况下1403，AOS数据使得左面通道音频信号R在第一扬声器33₁₁上被输出，以及右面通道音频信号L在第二扬声器33₁₂上被输出。以此类方式，接收器被配置为输出所接收的音频信号作为垂直立体声输出。在回放装置或接收器被旋转180度的情况下1405，AOS数据使得左面通道音频信号R和右面通道音频信号L的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂上被输出。此外，在回放装置或接收器被旋转270度的情况下1407，AOS数据使得左面通道音频信号R在第二扬声器33₁₂上被输出以及右面通道音频信号L在第一扬声器33₁₁上被输出，左面通道音频信号L’在第一扬声器33₁₁上被输出，以及因此输出所接收的音频信号作为垂直立体声输出。

关于图16至图19可以示出另外的示例音频输入至输出配置的情况，其中针对90度的定向步骤示出了针对捕获或记录装置的示例2麦克风配置，以及针对90度的定向步骤示出了针对回放或渲染装置的示例3的扬声器配置。

因此，例如，图16示出了捕获或记录装置和回放装置或接收器两者在初始定向中的情况下1501，左面通道音频信号L在第一扬声器33₁₁上被输出以及右面通道音频信号R在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下1503，左面通道音频信号L在第三扬声器33₁₃被输出以及右面通道音频信号R在第一扬声器33₁₁上被输出。在回放装置或接收器被旋转180度的情况下1505，左面通道音频信号L在第二扬声器33₁₂上被输出，以及右面音频信号R在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下1507，左面通道音频信号L在第一扬声器33₁₁被输出以及右面通道音频信号R在第三扬声器33₁₃上被输出。

因此，例如，图17示出了，在记录或捕获装置已经从初始方位被顺时针旋转90度的情况下，以及在回放装置或接收器在初始定向中的情况下1601，AOS数据使得左面通道音频信号L在第一扬声器33₁₁上被输出以及右面通道音频信号R在第三扬声器33₁₃上被输出。因此，在此类方式中，接收器被配置为输出所接收的音频信号作为垂直立体声输出以及产生更好质量的输出。在回放装置或接收器被旋转90度的情况下1603，AOS数据使得左面通道音频信号L在第一扬声器33₁₁上被输出，右面通道音频信号R在第二扬声器33₁₂上被输出。因此，接收器被配置为输出所接收的音频信号作为改进质量的垂直立体声输出。在回放装置或接收器被旋转180度的情况下1605，AOS数据使得左面通道音频信号L在第三扬声器33₁₃上被输出，右面通道音频信号R在第一扬声器33₁₁上被输出。因此以此类方式，接收器还被配置为输出所接收的音频信号作为垂直立体声输出，以及产生更好质量的输出。此外，在回放装置或接收器被旋转270度的情况下1607，AOS数据使得左面通道音频信号L在第二扬声器33₁₂上被输出，右面通道音频信号R在第一扬声器33₁₁上被输出，以及因此输出所接收的音频信号作为垂直立体声输出。

因此，例如，图18示出了，在记录或捕获装置已经从初始方位被顺时针旋转180度的情况下，以及在回放装置或接收器在初始定向中的情况下1701，左面通道音频信号R在第一扬声器33₁₁上被输出，以及右面通道音频信号L在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下1703，左面通道音频信号R在第三扬声器33₁₃上被输出，以及右面通道音频信号L在第一扬声器33₁₁上被输出。在回放装置或接收器被旋转180度的情况下1705，左面通道音频信号R在第二扬声器33₁₂上被输出，以及右面通道音频信号L在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下1707，左面通道音频信号R在第一扬声器33₁₁上被输出，以及右面通道音频信号L在第三扬声器33₁₃上被输出。

因此，例如，图19示出了，在记录或捕获装置已经从初始方位被顺时针旋转270度的情况下，以及在回放装置或接收器在初始定向中的情况下1801，AOS数据使得左面通道音频信号R在第一扬声器33₁₁上被输出，以及右面通道音频信号L在第三扬声器33₁₃上被输出。因此，在此类方式中，接收器被配置为输出所接收的音频信号作为垂直立体声输出以及产生更好质量的输出。在回放装置或接收器被旋转90度的情况下1803，AOS数据使得左面通道音频信号R在第一扬声器33₁₁上被输出，以及右面通道音频信号L在第二扬声器33₁₂上被输出。因此，接收器被配置为输出所接收的音频信号作为改进质量的垂直立体声输出。在回放装置或接收器被旋转180度的情况下1805，AOS数据使得左面通道音频信号R在第三扬声器33₁₃上被输出，以及右面通道音频信号L在第一扬声器33₁₁上被输出。因此，在此类方式中，接收器还被配置为输出所接收的音频信号作为垂直立体声输出以及产生更好质量的输出。此外，在回放装置或接收器被旋转270度的情况下1807，AOS数据使得左面通道音频信号R在第二扬声器33₁₂上被输出以及右面通道音频信号L在第一扬声器33₁₁上被输出，以及因此输出所接收的音频信号作为垂直立体声输出。

关于图20至图23可以示出第四示例音频输入至输出配置的情况，其中针对90度的定向步骤示出了针对捕获或记录装置的示例3麦克风配置，以及针对90度的定向步骤示出了针对回放或渲染装置的示例2的扬声器配置。

因此，例如，图20示出了捕获或记录装置和回放装置或接收器两者在初始定向中1901，左面通道音频信号L在第一扬声器33₁₁上被输出以及右面通道音频信号R在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下1903，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号L和右面通道音频信号R的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。也就是说，提供单声道混合输出。在回放装置或接收器被旋转180度的情况下1905，左面通道音频信号L在第二扬声器33₁₂上被输出，以及右面音频信号R在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下1907，回放装置的定向也是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号L和右面通道音频信号R的仅单声道混合版本(L+R)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。

因此，例如，图21示出了，在记录或捕获装置已经从初始方位被顺时针旋转90度的情况下，以及在回放装置或接收器在初始定向中的情况下2001，左面通道音频信号L’在第一扬声器33₁₁上被输出，右面通道音频信号L在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下2003，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号L’和右面通道音频信号L的仅单声道混合版本(L’+L)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。在回放装置或接收器被旋转180度的情况下2005，左面通道音频信号L’在第二扬声器33₁₂上被输出，右面通道音频信号L在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下2007，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号L’和右面通道音频信号L的仅单声道混合版本(L’+L)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。

因此，例如，图22示出了，在记录或捕获装置已经从初始方位被顺时针旋转180度的情况下，以及在回放装置或接收器在初始定向中的情况下2101，左面通道音频信号R在第一扬声器33₁₁上被输出，以及右面通道音频信号L在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下2103，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号R和右面通道音频信号L的仅单声道混合版本(R+L)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。在回放装置或接收器被旋转180度的情况下2105，左面通道音频信号R在第二扬声器33₁₂上被输出，以及右面通道音频信号L在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下2107，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号R和右面通道音频信号L的仅单声道混合版本(R+L)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。

因此，例如，图23示出了，在记录或捕获装置已经从初始方位被顺时针旋转270度的情况下，以及在回放装置或接收器在初始定向中的情况下2201，左面通道音频信号L在第一扬声器33₁₁上被输出，以及右面通道音频信号L’在第二扬声器33₁₂上被输出。在回放装置或接收器被旋转90度的情况下2203，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号L和右面通道音频信号L’的仅单声道混合版本(L+L’)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。在回放装置或接收器被旋转180度的情况下2205，左面通道音频信号L在第二扬声器33₁₂上被输出，以及右面通道音频信号L’在第一扬声器33₁₁上被输出。此外，在回放装置或接收器被旋转270度的情况下2207，回放装置的定向是这样的使得在第一扬声器33₁₁和第二扬声器33₁₂之间没有水平分离，以及因此组合的左面通道音频信号L和右面通道音频信号L’的仅单声道混合版本(L+L’)在第一扬声器33₁₁和第二扬声器32₁₂两者上被输出。

在记录期间，捕获设备可以以若干随后的旋转被旋转，以及每个旋转可以改变音频捕获的定向，首先从初始定向到新的定向以及接着从新定向到另一个新定向。所公开的方法可以应用于每个旋转以确保音频回放定向与记录定向对齐。也就是说，捕获设备能够从所确定的定向和更早的定向来确定定向中的差。在一些情况下，更早的定向可以是初始定向。

关于图26至图28，示例系统概述操作被示出为流程图。

例如，在一些实施例中，如在图26中在步骤2501中示出的，系统装置被配置为检测在发送设备中的音频捕获的定向(xxx角度)。

此外，在一些实施例中，记录或捕获装置被配置为使用合适的粒度(以及基于在记录装置中的重力检测器的准确性)向接收设备发送音频捕获定向(xxx角度)。这在图26中由步骤2503示出了。

在一些实施例中，在记录装置内的回放被配置为使用最佳对应于音频捕获的定向的扬声器。如果合适定向的扬声器不可以使用，则生成从立体声到单声道或从环绕声到立体声回放的回退。这在图26中由步骤2505示出了。

在一些实施例中，诸如在图27中的流程图中示出的，发送或记录装置被配置为确定或检测在发送装置内的音频捕获的定向(被定义为垂直的或水平的)。在图27中由步骤2601示出了记录装置定向确定。

在一些实施例中，发送装置然后可以向接收或回放装置发送音频捕获的定向(垂直的或水平的)。在图27中由步骤2603示出了发送音频捕获定向的操作。

在一些实施例中，在接收装置中的音频信号的回放被配置为使得回放装置使用最佳匹配于音频捕获的定向的扬声器。如果合适定向的扬声器不可以使用，则回放装置可以被配置为从立体声回退到单声道。也就是说，针对

水平音频捕获：从水平放置的扬声器来播放音频(使用如在捕获中的左手侧和右手侧的信号)。如果可以使用的扬声器被垂直地放置，则从它们播放单声道。

垂直音频捕获：从垂直放置的扬声器来播放音频(使用如在捕获中的顶部和底部信号)。如果可以使用的扬声器被水平地放置，则从它们播放单声道。

在图27中由步骤2605示出了合适定向的扬声器的使用。

注意的是，如果发送如在图27中示出的关于音频定向的仅二进制信息(水平的vs垂直的)(一个比特)，则捕获和渲染设备被同步以使用相同的音频输出顺序。也就是说，捕获和渲染设备两者被配置为知道哪个信号在水平捕获中首先被发送(例如，是音频输出顺序“左、右”或“右、左”)以及在垂直捕获中首先被发送(例如，是音频输出顺序“顶部、底部”或“底部、顶部”)。需要同步信息以防止音频回放具有180度误差的可能性。

表I示出了在图27中示出的实施例的应用的示例，图27描述了针对在图中说明的示例中的一些示例的在捕获设备定向、音频(捕获)定向和音频输出顺序之间的关系。在此类环境中，当与默认的(在这个实施例中水平定向)偏差出现时，经由AOS从发送设备向接收设备通过信号传送音频定向。也就是说，针对在该表中使用星号(*)标记的实例，经由AOS从发送设备向接收设备通过信号传送音频定向。也使得发送设备和接收设备两者知道音频输出顺序，例如也通过将它从发送设备发送给接收设备。

表I在捕获设备定向、音频(捕获)定向和音频输出顺序之间的关系的示例。

将理解的是，在一些实施例中，从捕获设备向接收或渲染设备发送两个(单声道)音频信号对于重新产生立体声是足够的(例如，垂直定向和水平定向)，以及因此在音频输出顺序中的前两个组件的知识是足够的并且可以由在该表中的括号内示出的第三组件反映。

在一个实施例中，发送设备仅具有两个麦克风(在图12-15中示出的)。在这些实例中，可以使用仅一个比特通过信号传送音频输出顺序。

在一些实施例中，发送(记录或捕获)装置被配置为确定或检测在发送装置中的音频捕获的定向(0度、90度、180度、或270度)。在图28中由步骤2701示出了定向的检测。

此外，在一些实施例中，发送装置可以被配置为经由AOS向接收装置发送音频捕获的定向(0度、90度、180度、或270度)。在图28中由步骤2703示出了发送定向信息的操作。

在此类实施例中，接收设备被配置为回放音频信号以及进一步被配置为使用最佳对应于音频捕获的定向的扬声器。如果合适定向的扬声器不可以使用，则接收装置被配置为从立体声回退到单声道或从环绕声回退到立体声来播放或一般地从多通道到更少通道来向下混合音频。这可以被示出为以下操作：

0度音频捕获(水平的)：分别从在设备的左手侧和右手侧上的水平放置的扬声器来播放由麦克风L(或L’，其可以在3麦克风实例中发生)(在设备的左手侧上)以及麦克风R(或L)(在设备的右手侧上)所捕获的音频。如果可以使用的扬声器被垂直地放置，则从它们播放单声道。

90度音频捕获旋转(垂直的)：分别从在设备的顶部和底部上的垂直放置的扬声器来播放由麦克风L(在设备的顶部上)以及麦克风R(在设备的底部上)所捕获的音频。如果可以使用的扬声器仅被水平地放置，则从它们播放单声道。

180度音频捕获旋转(水平反转的)：分别从在设备的左手侧和右手侧上的水平放置的扬声器来播放由麦克风R(或L)(在设备的左手侧上)以及麦克风L(或L’)(在设备的右手侧上)所捕获的音频。如果可以使用的扬声器仅被垂直地放置，则从它们播放单声道。

270度音频捕获旋转(垂直反转的)：分别从在设备的顶部和底部上的垂直放置的扬声器来播放由麦克风R(在设备的顶部上)以及麦克风L(在设备的底部上)所捕获的音频。如果可以使用的扬声器仅被水平地放置，则从它们播放单声道。

在图28中由步骤2705示出了使用最佳对应于音频捕获的定向的扬声器来执行音频信号的回放的操作。

注意的是，在一些实施例中，例如如在图28的实例中示出的所执行的操作，在水平和垂直捕获内的音频输出顺序可以经由针对水平捕获的0度vs180度以及针对垂直捕获的90度vs270度的选择，被包含在以上(2比特)AOS信令中。在此类实施例中，对信令压缩要求的是，捕获设备(其中捕获设备具有超过2个麦克风)仅发送两种信号足以用于产生立体声(也就是说，在有三个麦克风的情况下，捕获设备从比特流丢弃在表I中的括号内示出信号而不发送给接收设备)。

表II示出了在捕获设备定向和音频(捕获)定向之间的关系的图28中示出的实施例的应用的示例。在此类实施例中，当与默认的(在这个示例实施例中，水平非反转定向)偏差存在时，经由AOS来发送音频定向。也就是说，在下表中使用星号(*)标记的实例中发送音频定向。

表II：在捕获设备定向和音频(捕获)定向之间的关系的示例

在一些实施例中，特定音频捕获定向(例如，水平音频捕获定向)可能是偏爱的。在一些实施例中，可以使用偏爱的音频捕获定向(也就是说，通过AOS通过信号传送)，即使音频捕获定向更接近于另一个定向。例如，在一些实施例中，可以使用水平音频捕获定向(也就是说，通过AOS通过信号传送)，即使与水平定向的差超过45度。

在一些实施例中，其中接收设备能够仅使用比经由AOS通过信号传送的定向粒度更低的定向粒度，来播放音频信号，接收设备可以用于播放它支持的最接近的定向(可能地偏爱诸如水平的某一定向)。在一些实施例中，接收设备还可以偏爱特定的输出格式，例如，立体声播放，而不切换以播放如单声道的音频信号，或在一些实施例中，接收设备可以使用应用于针对每个扬声器的播放的合适的缩放，从超过一个扬声器同时播放音频信号，使得音频信号表现为来自扬声器之间(即，来自扬声器之间的定向)。

将理解的是扬声器可以包括任何合适的音频变换器输出设备，包含扩音器；头戴式耳机；头戴式耳麦；耳机；外部扩音器；以及集成的免提扬声器。

将了解的是，词语用户设备旨在涵盖任何合适类型的无线用户设备，诸如移动电话、便携式数据处理设备或便携式网络浏览器，以及可穿戴设备。

一般地，可以将本发明的各种实施例实现成硬件或专用电路、软件、逻辑和它们的任何组合。例如，一些方面可以被实现在硬件中，而其它方面可以被实现在固件或软件，该固件或软件可以由控制器、微处理器或其它计算设备来执行，尽管本发明不限制于此。虽然本发明的各种方面被说明和描述成框图、流程图或使用一些其它图形表示，但是很好理解的是，本文中所述的这些框、装置、系统、技术或方法可以被实现在，作为非限制性示例，硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其它计算设备、或其一些组合中。

可以由移动设备的数据处理器可执行的计算机软件，诸如在处理器实体中，或由硬件，或由软件和硬件的组合来实现本发明的实施例。此外，就这点而言，应当注意的是，如在附图中的逻辑流的任何框可以表示程序步骤，或互连的逻辑电路，块和功能，或程序步骤和逻辑电路、块和功能的组合。可以将软件存储在此类物理介质上，诸如存储芯片，或实现在处理器内的存储块，磁介质，诸如硬盘或软盘，以及光介质，诸如例如DVD和其数据变型CD。

存储器可以具有适合于本地技术环境的任何类型，并且可以使用任何合适的数据存储技术来实现，诸如基于半导体的存储设备，磁存储设备和系统，光存储设备和系统，固定存储器和可移动存储器。数据处理器可以具有适合于本地技术环境的任何类型，并且可以包含作为非限制性示例的下列中的一个或多个：通用计算机、专用计算机、微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、门级电路和基于多核处理器架构的处理器。

可以在各种组件中，诸如在集成电路模块中，实践本发明的实施例。一般而言，集成电路的设计基本上是高度自动化的过程。复杂和功能强大的软件工具可用于将逻辑级的设计转换成准备将要被蚀刻和形成在半导体衬底上的半导体电路设计。

程序，诸如由加利福尼亚的山景城的新思科技(Synopsys,Inc.ofMountainView,California)和加利福尼亚的圣何塞的凯登斯设计(CadenceDesign,ofSanJose,California)所提供的那些程序，使用良好建立的设计规则以及预存储的设计模块的库在半导体芯片上自动化路由导体和定位组件。一旦已经完成了针对半导体电路的设计，则所生成的设计可以以标准化电子形式(例如，Opus，GDSII等)传送给半导体制造厂或用于制造的简写的“fab”。

上述描述已经通过示例性和非限制性的示例提供了本发明示例性实施例的全面和教示性的描述。然而，当结合附图和所附权利要求书阅读时，鉴于上述描述，对于相关领域的技术人员来说，各种修改和适应是明显的。然而，本发明的教示中的所有此类或类似的修改仍然将落入如由所附权利要求书限定的本发明的范围内。

Claims

1.一种方法包括：

生成至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移；

确定捕获定向；以及

基于所述捕获定向来输出所述至少两个音频信号，使得基于所述捕获定向来执行所述至少两个音频信号的回放。

2.根据权利要求1所述的方法，其中所述捕获定向是初始捕获定向值，以及基于所述捕获定向来输出所述至少两个音频信号包括：根据初始音频输出顺序来输出所述至少两个音频信号。

3.根据权利要求1和2中所述的方法，还包括：

确定在所述捕获定向和更早的定向之间的差是否大于定义值；以及

与所述至少两个音频信号一起还输出所述捕获定向，使得基于所述捕获定向来执行所述至少两个音频信号的回放。

4.根据权利要求3所述的方法，其中所述更早的定向是初始定向。

5.根据权利要求1至4中所述的方法，还包括：

基于所述捕获定向来确定针对所述至少两个音频信号的音频输出顺序；以及

与所述至少两个音频信号一起还输出所述音频输出顺序，使得基于所述音频输出顺序来执行所述至少两个音频信号的回放。

6.根据权利要求5中所述的方法，当依赖于权利要求3和4时，还包括：

确定在所述捕获定向和所述更早的定向之间的差大于定义的音频输出重排序值；以及

当在所述捕获定向和所述更早的定向之间的差大于定义的音频输出重排序值时，触发音频输出顺序的确定。

7.根据权利要求1至6中所述的方法，其中生成所述至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移，包括：

在第一位置处使用第一麦克风来生成所述至少两个音频信号中的第一音频信号；

在第二位置处使用第二麦克风来生成所述至少两个音频信号中的第二音频信号，在所述至少两个音频信号之间的相对位移是在所述第一位置和所述第二位置之间的位移。

8.根据权利要求1至7中所述的方法，其中生成所述至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移，包括以下至少之一：

从包括至少两个麦克风的远程装置接收所述至少两个音频信号，所述至少两个麦克风在它们之间具有相对位移；以及

从存储器来接收所述至少两个音频信号。

9.一种方法包括：

接收至少两个音频信号；

确定回放定向；以及

基于所述回放定向将所述至少两个音频信号输出给至少两个扬声器。

10.根据权利要求9中所述的方法，还包括：接收与所述至少两个音频信号相关联的捕获定向，以及其中向所述至少两个扬声器输出所述至少两个音频信号还基于所述捕获定向。

11.根据权利要求9和10中所述的方法，还包括：

接收基于所述捕获定向的针对所述至少两个音频信号的音频输出顺序，其中将所述至少两个音频信号输出给所述至少两个扬声器还基于所述音频输出顺序。

12.根据权利要求9和11中所述的方法，其中将所述至少两个音频信号输出给至少两个扬声器包括以下至少之一：

基于所述回放定向将所述至少两个音频信号路由到所述至少两个扬声器；以及

将所述至少两个音频信号进行混合以生成将被输出给所述至少两个扬声器中的至少一个扬声器的向下混合的音频信号。

13.根据权利要求12中所述的方法，其中所述至少两个扬声器包括以下至少之一：

扩音器；

头戴式耳机；

头戴式耳麦；

带麦克风的耳机；

外部扩音器；以及

集成的免提扬声器。

14.一种装置，所述装置包括至少一个处理器和包含针对一个或多个程序的计算机代码的至少一个存储器，所述至少一个存储器和所述计算机代码被配置为使用所述至少一个处理器使得所述装置至少：

确定捕获定向；以及

15.根据权利要求14中所述的装置，其中所述捕获定向是初始捕获定向值，以及基于所述捕获定向来输出所述至少两个音频信号使得所述装置根据初始音频输出顺序来输出所述至少两个音频信号。

16.根据权利要求14和15中所述的装置，还被使得：

17.根据权利要求14至15中所述的装置，还被使得执行：

18.一种装置，所述装置包括至少一个处理器和包含针对一个或多个程序的计算机代码的至少一个存储器，所述至少一个存储器和所述计算机代码被配置为使用所述至少一个处理器使得所述装置：

接收至少两个音频信号；

确定回放定向；以及

19.根据权利要求18中所述的装置，还被使得接收与所述至少两个音频信号相关联的捕获定向，以及其中向所述至少两个扬声器输出所述至少两个音频信号还基于所述捕获定向。

20.根据权利要求18和19中所述的装置，还被使得：接收基于所述捕获定向的针对所述至少两个音频信号的音频输出顺序，其中将所述至少两个音频信号输出给所述至少两个扬声器还基于所述音频输出顺序。

21.一种装置包括：

用于生成至少两个音频信号的构件，所述至少两个音频信号在它们之间具有相对位移；

用于确定捕获定向的构件；以及

用于基于所述捕获定向来输出所述至少两个音频信号，使得基于所述捕获定向来执行所述至少两个音频信号的回放的构件。

22.一种装置包括：

用于接收至少两个音频信号的构件；

用于确定回放定向的构件；以及

用于基于所述回放定向将所述至少两个音频信号输出给至少两个扬声器的构件。

23.一种装置包括：

输入器，其被配置为接收至少两个音频信号，所述至少两个音频信号在它们之间具有相对位移；

定向确定器，其被配置为基于设备定向和关于在捕获装置中的麦克风配置的信息来确定音频捕获定向；以及

音频输出生成器，其被配置为基于所述捕获定向来输出所述至少两个音频信号，使得基于所述捕获定向来自执行所述至少两个音频信号的回放。

24.一种装置包括：

输入器，其被配置为接收至少两个音频信号；

通道选择器，其被配置为确定回放定向；以及

通道切换器，其被配置为基于所述回放定向将所述至少两个音频信号输出给至少两个扬声器。