CN102783187B

CN102783187B - 扩大具有最佳三维音频感知的位置的方法

Info

Publication number: CN102783187B
Application number: CN201180008056.6A
Authority: CN
Inventors: 许军; 张化云
Original assignee: Creative Technology Ltd
Current assignee: Creative Technology Ltd
Priority date: 2010-02-01
Filing date: 2011-01-11
Publication date: 2016-08-03
Anticipated expiration: 2031-01-11
Also published as: TW201143483A; SG10201500753QA; SG182561A1; US20110188660A1; CN102783187A; US9247369B2; WO2011093793A1; TWI528841B

Abstract

提供了一种用于扩大具有最佳三维音频感知的位置的方法。最佳三维音频感知可以涉及全空间音效。所述方法包括：从具有第一通道信号和第二通道信号的音频输入信号导出三维编码的位置提示；将所述第一通道信号和所述第二通道信号解码成多个经解码的通道信号，所述多个经解码的通道信号适合于多个扬声器单元；对所述多个经解码的通道信号执行串音消除，以消除所述多个经解码的通道信号之间的串音；以及将已经经过串音消除的所述多个经解码的通道信号输出到各个所述多个扬声器单元。有利的是，所述串音消除包括进一步处理以产生平滑的频率包络线。

Description

扩大具有最佳三维音频感知的位置的方法

相关申请的交叉引用

本申请包括对2008年10月6日提交的US12/246,491中所公开的主题的引用。

技术领域

本发明涉及音频信号处理过程。具体地，本发明涉及处理音频信号的方法。

背景技术

立体声信号可以被解码成多通道音频，当用户通过多个扬声器体验多通道音频时，该用户被提供以沉浸感和现实感。将信号解码成多通道音频可以使用由创新科技有限公司(CreativeTechnologyLtd.)提交的另一个专利申请US12/246,491中所公开的技术来执行。

应当注意，电影院大厅通常包括多个扬声器，这多个扬声器以广范围散布扩音器布局被分布遍及电影院大厅，这多个扬声器指向坐在电影院大厅内的电影院观众，以使得电影院观众体验到空间音效。

遗憾的是，在一个与电影院大厅相比相对较小的封闭区域(诸如，例如家里的房间)内以广范围散布扩音器布局来设置多个扬声器并不方便，这归因于封闭区域的大小的限制以及存在多个扬声器可能显得多余的事实。然而，如果可以在家里再现空间音效的话，这将是非常希望的。此外，鉴于在家中放置紧凑的扬声器阵列单元的流行，如果使用紧凑的扬声器阵列单元可以在家里再现空间音效，这将是很希望的。

另外，因为不同于电影院大厅里的电影观众，呆在家里的人们保持坐在单一位置上是不太可能的，所以如果紧凑的扬声器阵列单元可以在扩大的位置再现空间音效，这也将是很希望的。

本发明旨在处理以上提及的情况。

发明内容

提供了一种用于扩大具有最佳三维音频感知的位置的方法。最佳三维音频感知可以涉及全空间音效。

所述方法包括：从具有第一通道信号和第二通道信号的音频输入信号导出三维编码的位置提示(locationcue)；将所述第一通道信号和所述第二通道信号解码成多个经解码的通道信号，所述多个经解码的通道信号适用于多个扬声器单元；对所述多个经解码的通道信号执行串音消除，以消除所述多个经解码的通道信号之间的串音；以及将已经经过串音消除的所述多个经解码的通道信号输出到各个所述多个扬声器单元。有利的是，所述串音消除包括进一步的处理以产生平滑的频率包络线(envelope)。

平滑的频率包络线可以从被截平的倒谱重构，所述被截平的倒谱是从将各个所述多个经解码的通道信号转换成倒频谱导出的。所述平滑的频率包络线还最小化了假声(timbreartifact)，所述假声为各个所述多个经解码的通道信号的倒频谱中的高峰和低谷。

位置提示可以包括至少上下维度、左右维度、前后维度、方位角和俯仰角等。所述三维编码的位置提示的导出可以基于向听者提供全空间音效。

由于经扩大的位置涉及涵盖了具有最佳三维音频感知的多个位置的边界，所以，具有最佳三维音频感知的经扩大的位置有利地允许听者走动。

所述方法可以优选地进一步包括在已经经过了串音消除的所述多个经解码的通道信号被输出到各个所述多个扬声器单元之前，对所述多个经解码的通道信号进行求和。各扬声器单元可以包括至少一个扬声器驱动器。优选地，所述串音消除可被执行以使听者感觉音频是从虚拟扬声器发出的。

附图说明

为了本发明可以被完全理解并且容易地被付诸实践，现在将以非限制性示例的方式仅描述本发明的优选实施例，描述将会参照说明性附图。

图1示出了本发明的方法的处理流程。

图2示出了用于执行图1的方法的系统的示意图。

图3示出了使用两个扩音器阵列的3D音频再现的可视化表示。

图4示出了倒频谱中平滑的频率包络线的图示。

图5示出了使用一个扩音器阵列的3D音频再现的可视化表示。

具体实施方式

参照图1和图2，它们分别提供了用于扩大具有最佳三维音频感知的位置(理论概念也称为“最佳听音位置”)的方法20的处理流程以及用于执行方法20的设备40的示意图。当描述方法20和设备40时，将会在随后的段落中分别参照图1和图2。应当理解的是，方法20和设备40在本文中描述用于说明性目的并且不应当以任何方式进行限制。最佳三维音频感知涉及全空间音效。还应当理解的是，由于经扩大的位置涉及涵盖了具有最佳三维音频感知的多个位置的边界，所以经扩大的具有最佳三维音频感知的位置允许听者走动。

用于扩大具有最佳三维音频感知的位置的方法20包括从具有第一通道信号和第二通道信号的音频输入信号导出三维编码的位置提示(22)。已知具有第一通道信号和第二通道信号的音频输入信号可以为立体声信号。导出三维编码的位置提示的技术可以涉及US12/246,491中描述的音频信号处理技术或任何已知的音频信号处理技术。三维编码的位置提示的导出是再现全空间音效的重要步骤。位置提示例如包括上下维度、左右维度、前后维度、方位角和俯仰角等。

方法20还包括将所述第一通道信号和所述第二通道信号解码成多个经解码的通道信号(24)，所述多个经解码的通道信号适合于多个扬声器单元。各扬声器单元可以包括至少一个扬声器驱动器。随后，可以对所述多个经解码的通道信号执行串音消除，以消除所述多个经解码的通道信号之间的串音(26)。所述串音消除被执行以使听者感觉音频是从虚拟扬声器发出的。串音消除消除了通道之间的串音。串音消除还包括产生如图4所示的平滑的频率包络线100的进一步处理。所述平滑的频率包络线100是从被截平的倒谱重构的，所述被截平的倒谱是从将各个所述多个经解码的通道信号转换成倒频谱(标记为“未处理的(raw)”102)导出的。所述平滑的频率包络线100最小化了假声，所述假声为各个所述多个经解码的通道信号的倒频谱中“未处理的”102图中的高峰和低谷。

继而，方法20进一步包括在已经经过了串音消除的所述多个经解码的通道信号被输出到各个所述多个扬声器单元之前，对所述多个经解码的通道信号进行求和(30)。最后，方法20包括将已经经过了串音消除的各个求和的经解码的通道信号输出到各个多个扬声器单元(32)以使得听者在具有最佳三维音频感知的经扩大的位置能享受到全空间音效。在随后的段落中将进一步详细描述经扩大的位置的概念。

参照图5，示出了使用具有四个扬声器的一个扩音器阵列的3D音频再现的可视化表示。应当注意的是，E₁与E₄之间的区域表示具有最佳三维音频感知的经扩大的位置(来自虚拟扬声器v1、v2、v3、v4的线交叉的区域)。头部关联传递函数(HRTF)描述对于任意声音事件施加到听者的双耳响应的时间和振幅差异。这些差异归因于听者的头部和耳廓结构并且被耳朵利用以觉察音频是从哪里发出的。扩音器/头戴式耳机虚拟化使用HRTF被设计以向听者提供声音是从虚拟扬声器而非实际扬声器发出的感觉。

现在将提供数学表示以说明具有最佳三维音频感知的经扩大的位置的概念。

X是通过从音频输入信号导出三维编码的位置提示(方法20中的22)而产生的多通道音频。

Y是听者感知的听觉传输的音频。

H_c是从实际的音频源到听者的HRTF矩阵。

H_v是从虚拟的音频源到听者的HRTF矩阵。

是发送到实际的音频源的虚拟化输出。

ifft涉及“离散傅立叶逆变换”。

fft涉及“快速傅立叶变换”。

Y＝H_cX

\hat{X} = H_{c}^{- 1} H_{v} X

= HX

H被转换成倒频谱，

ceps＝ifft(log(abs(H))

随后，平滑的频谱包络线从被截平的倒谱重构。

H_smooth＝exp(fft(window(ceps)))

在图4中可以看出平滑的频谱包络线100。

参照图3，示出了使用两个扩音器阵列的3D音频再现的可视化表示。听者的七个位置P1、P2、P3、P4、P5、P6、P7表示听者能感知最佳三维音频感知的位置，其中这些位置是从以上段落中详述的数学过程可获得的。这七个位置可以被视为表示听者体验最佳的三维音频感知的区域的边界。

参照图2，示出了用于执行方法20的系统40的示意图。系统40允许立体声信号形式的音频输入信号(N1和N2)输入到系统40的解码器42。解码器42可以处理N1和N2以导出三维编码的位置提示并且将N1和N2解码成多个经解码的通道信号(x₁，x₂，.....，x_N)。

系统40包括用于对多个经解码的通道信号(x₁，x₂，.....，x_n)执行串音消除的多个音频滤波器44。所述串音消除被执行以使听者感觉音频是从虚拟扬声器发出的。串音消除消除了通道之间的串音。串音消除还包括产生如图4所示的平滑的频率包络线100的进一步的处理。

系统40包括用于对多个消除了串音的信号进行求和的多个信号求和电路46。最后，已经求和的多个消除了串音的信号被输出到多个扬声器单元(S₁，S₂，.....，S_N)，使得听者在具有最佳三维音频感知的经扩展的位置能体验到全空间音效。

尽管在前述描述中已经描述了本发明的优选实施例，但是相关技术领域的技术人员将会理解，在不脱离本发明的范围的情况下可以对设计或构造的细节进行多种变化或修改。

Claims

1.一种用于扩大具有最佳三维音频感知的位置的方法，所述方法包括：

从具有第一通道信号和第二通道信号的音频输入信号导出三维编码的位置提示；

将所述第一通道信号和所述第二通道信号解码成多个经解码的通道信号，所述多个经解码的通道信号适合于多个扬声器单元；

对所述多个经解码的通道信号执行串音消除，以消除所述多个经解码的通道信号之间的串音；以及

将已经经过串音消除的所述多个经解码的通道信号输出到各个所述多个扬声器单元，

其中，所述串音消除包括进一步处理以产生平滑的频率包络线,

其中，所述平滑的频率包络线是从被截平的倒谱重构的，所述被截平的倒谱是从将各个所述多个经解码的通道信号转换成倒频谱导出的。

2.如权利要求1所述的方法，其中，所述位置提示包括选自包括以下各项的组中的至少一项：上下维度、左右维度、前后维度、方位角和俯仰角。

3.如权利要求1所述的方法，其中，由于经扩大的位置涉及涵盖了具有最佳三维音频感知的多个位置的边界，所以具有最佳三维音频感知的经扩大的位置允许听者走动。

4.如权利要求1所述的方法，其中，各扬声器单元包括至少一个扬声器驱动器。

5.如权利要求1所述的方法，其中，所述串音消除被执行以使听者感觉音频是从虚拟扬声器发出的。

6.如权利要求1所述的方法，其中，所述三维编码的位置提示的导出基于向听者提供全空间音效。

7.如权利要求1所述的方法，其中，所述平滑的频率包络线最小化了假声，所述假声为各个所述多个经解码的通道信号的倒频谱中的高峰和低谷。

8.如权利要求1所述的方法，其中，最佳三维音频感知涉及全空间音效。

9.如权利要求1所述的方法，进一步包括：在已经经过了串音消除的所述多个经解码的通道信号被输出到各个所述多个扬声器单元之前，对所述多个经解码的通道信号进行求和。