CN104704855B - 用于减小基于换位器的虚拟低音系统中的延迟的系统及方法 - Google Patents
用于减小基于换位器的虚拟低音系统中的延迟的系统及方法 Download PDFInfo
- Publication number
- CN104704855B CN104704855B CN201380053450.0A CN201380053450A CN104704855B CN 104704855 B CN104704855 B CN 104704855B CN 201380053450 A CN201380053450 A CN 201380053450A CN 104704855 B CN104704855 B CN 104704855B
- Authority
- CN
- China
- Prior art keywords
- frequency
- signal
- time
- transposition
- cqmf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 76
- 230000017105 transposition Effects 0.000 claims abstract description 107
- 238000004458 analytical method Methods 0.000 claims abstract description 72
- 230000005236 sound signal Effects 0.000 claims abstract description 59
- 230000004044 response Effects 0.000 claims abstract description 38
- 230000009466 transformation Effects 0.000 claims abstract description 29
- 230000003111 delayed effect Effects 0.000 claims abstract description 17
- 238000005070 sampling Methods 0.000 claims description 87
- 238000006243 chemical reaction Methods 0.000 claims description 31
- 230000008859 change Effects 0.000 claims description 17
- 230000002708 enhancing effect Effects 0.000 claims description 9
- 230000001131 transforming effect Effects 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 5
- 238000011914 asymmetric synthesis Methods 0.000 claims 2
- 230000015572 biosynthetic process Effects 0.000 abstract description 36
- 238000003786 synthesis reaction Methods 0.000 abstract description 36
- 238000012545 processing Methods 0.000 abstract description 31
- 230000009467 reduction Effects 0.000 abstract description 23
- 230000007704 transition Effects 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 31
- 230000006870 function Effects 0.000 description 17
- 238000013507 mapping Methods 0.000 description 12
- 230000007547 defect Effects 0.000 description 8
- 230000008447 perception Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 230000001934 delay Effects 0.000 description 7
- 230000009191 jumping Effects 0.000 description 7
- 102000003712 Complement factor B Human genes 0.000 description 6
- 108090000056 Complement factor B Proteins 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- 238000011946 reduction process Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000006073 displacement reaction Methods 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 235000012364 Peperomia pellucida Nutrition 0.000 description 1
- 240000007711 Peperomia pellucida Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
虚拟低音处理系统中的延迟减小系统对音频信号的低频分量执行谐波换位以生成表示音频信号的谐波的换位数据。该系统使用大于2的基本换位因子,并且响应于由使用非对称分析窗口和合成窗口的正向变换段和逆向变换段确定的频域值来生成谐波。该系统通过具有滤波器系数截断的奈奎斯特滤波器的分析滤波器组将虚拟低音信号与经延时的宽带音频信号进行组合。当与音频信号组合时,虚拟低音信号可以滞后经延时的宽带音频信号以进一步减小由谐波换位引起的延迟。该虚拟低音输入信号可以直接从前面的混合滤波器组段的CQMF分析滤波器组被路由,以避免与奈奎斯特滤波器组相关联的延时。
Description
相关申请的交叉引用
本申请要求于2012年10月15日提交的美国临时专利申请No.13/652,023的优先权,其通过引用以全部内容合并到本文中。
技术领域
一种或更多种实施方式一般地涉及基于变换的音频信号处理,并且更具体地涉及减小基于换位器的虚拟低音合成系统中的延迟。
背景技术
低音合成指的是向信号的低频范围添加分量以增强所感知的低音。在这些方法之中,超低音合成技术创建低于信号的现有分音的低频分量,以扩展和提高存在于对象音频内容中的最低频率范围。另一种方法使用虚拟音高算法,该虚拟音高算法从听不见的低音范围(例如,通过小扬声器播放的低音高的低音)生成听得见的谐波,因此使谐波以及最终还使音高听得见以改善低音响应。
虚拟低音合成是虚拟音高方法,其提高当在不能物理地再现低端低音频率的小扬声器上播放音频时音频中的低音内容的感知水平。该方法基于以下“消失的基频”心理声学观察:即使当基频和一次谐波自身消失时,人类听觉系统仍能够根据高次谐波推断出低音调。基本的功能性方法是对存在于音频中的低音频率进行分析并且生成有助于感知消失的较低频率的听得见的高次谐波。虚拟低音的主要特征是:其通过对低于具有小扬声器的装置的低频滚降(例如,低于150Hz)的频率的高次谐波进行合成来增强在所述装置上的感知低音响应。在能量调整之后,使用多个换位因子(谐波)将听不见的信号分量换位至较高的听得见的频率。虚拟低音合成还可以增大耳机回放或全频段(full-range)扬声器上的回放的感知低音。图1A示出了具有频率分量的听不见的范围10以及高于听不见的范围的频率分量的听得见的范围的音频信号的频率幅度谱。听不见的范围10内的频率分量的谐波换位可以生成听得见的范围的部分11中的经换位的频率分量,其可以增强回放期间音频信号的低音内容的感知水平。这样的谐波换位可以包括对输入音频信号的每个相关的频率分量应用多个换位因子来生成该分量的多个谐波。
在利用传统虚拟低音系统的某些音频处理系统中,与频率换位功能相关联的延时或延迟对于某些应用而言会太大。例如,延迟是1025个采样的数字音频处理系统可以使用添加另外的3200个采样的延时的传统虚拟低音系统。假设采样频率(fs)为48kHz,则这可以导致总延时超过88毫秒。该延迟量通常是有问题的,并且对于游戏和电信应用而言甚至是禁止的,其中,大约100毫秒的延迟开始在听得见的信号延时方面变得明显。
在传统虚拟低音系统中使用的传统换位器系统对于时间至频率变换和频率至时间变换的分析段和合成段分别使用对称的时域窗口。图1B示出了如现有技术中已知的与在传统虚拟低音系统中使用的对称窗口相关联的延时。图1B图形化地示出了由二阶换位器即生成二阶谐波的换位器所强加的延时。如时间曲线100中所示,假定分析窗口的时间步幅SA,格式上对称的分析窗口之一的中心被选择为时间零基准,以及可以从分析段102中的时间t0添加新输入的采样104。时间曲线110示出了换位器的时间拉伸对偶性,其中,t0被拉伸至合成段112中的2·t0。
对于图1B中示出的示例处理,总的分析/合成链延时Dts可以在下面的等式1中如下被表达,其中,L是换位器窗口大小,SA是分析时间步幅或跳距:
Dts=L/2+2·(L/2-SA)=3·L/2-2·SA (等式1)
在基于HQMF(混合正交镜像滤波器)组的音频处理系统中,至CQMF(复数正交镜像滤波器)分析段的输入信号以及来自CQMF合成段的输出信号通常均具有相同的采样频率fs,其中,fs通常被设置为44.1kHz或48kHz。由于系统通常处理仅来自64通道CQMF组的第一CQMF信号,所以对于虚拟低音处理的输入信号采样速率可以是fs/64。应当注意,也可以使用除了64通道以外的CQMF大小。由于使用因子2基本换位因子的组合换位功能,所以来自传统虚拟低音处理系统的经换位的输出的采样频率为2·fs/64,产生因子2带宽扩展。在组合的换位器中,基本换位因子是其中源变换频率段(或频带)按照一对一的关系被映射至目标变换频率段(或频带)的因子,即,在源至目标频率段映射中不涉及插值或抽取。基本换位因子还控制分析窗口的时间步幅与合成窗口的时间步幅之间的关系。更特别地,合成时间步幅等于分析时间步幅乘以基本换位因子。对于L=64并且SA=4的情况而言,来自基于64通道CQMF的系统的输出采样中的延时变成:
Dts={3·L/2-2·SA}·64/2=2816个采样 (等式2)
除了该延时以外,还添加来自两个虚拟低音输出CQMF子带信号的奈奎斯特(Nyquist)滤波器组分析段处理的延时。该延时可以是大约384个采样,从而针对该示例现有技术传统虚拟低音处理系统,给出了2816+384=3200个采样的总延时。
针对由传统虚拟低音系统强加的延迟的一个解决方案是如通过使用替选部件替代谐波换位器来改变实际的处理电路系统如谐波发生器。然而,这潜在地给系统增加了大量成本和复杂度,而且还负面地影响音频品质。
背景技术部分中论述的主题不应当仅因为在背景技术部分中被提到就被认为是现有技术。类似地,背景技术部分中提到的或与背景技术部分的主题相关联的问题不应当被认为是现有技术中先前已经认识到的问题。背景技术部分中的主题仅仅表示不同的方法,这些不同的方法本身也可以是发明。
发明内容
实施方式包括虚拟低音处理系统中的延迟减小系统,其对音频信号的低频分量执行谐波换位以生成表示谐波的换位数据。谐波换位处理使用大于2的基本换位因子,并且响应于由使用非对称分析窗口和合成窗口的变换段和逆变换段确定的频域值来生成谐波。通过使用包括截断原型滤波器的奈奎斯特分析滤波器组将虚拟低音信号与经延时的音频信号进行组合来生成增强的音频信号。当与音频信号组合时,可以允许虚拟低音信号滞后经延时的音频信号限定时间段以进一步减小由谐波换位处理引起的延迟。
实施方式包括通过对输入音频信号的低频分量执行谐波换位来生成表示谐波的换位数据来减小虚拟低音生成系统中的延迟的方法,其中,谐波换位使用大于2的整数值的基本换位因子。所述方法响应于由时间至频率域变换段和后续逆向的频率至时间域变换段通过对时间至频率域变换和逆向的频率至时间域变换使用非对称分析窗口和合成窗口所确定的频域值来生成谐波。输入音频信号是子带CQMF(复数值正交镜像滤波器)信号,并且可以对输入音频信号的采样进行预处理以生成表示低频分量的临界采样的音频。
在一种实施方式中,所述方法通过分析滤波器组或变换来处理输入音频信号以根据低频分量提供一组分析子带信号或频率段,使用基本换位因子B和换位因子T来计算一组合成子带信号或频率段,并且通过合成滤波器组或变换来处理分析子带信号或频率段以根据所述一组合成子带信号来生成高频分量。这表示进行换位的标准方式,即,在包括变换频率段映射的非线性处理之前执行正向FFT变换,然后执行逆FFT变换。所述方法还可以包括:响应于换位数据生成虚拟低音信号,并且通过对虚拟低音音频输出信号应用一个或更多个分析滤波器组将虚拟低音信号与输入音频信号进行组合来生成增强的音频信号,其中,分析滤波器组包括截断原型滤波器,其使限定数量的滤波器系数被去除。所述方法又可以包括虚拟低音信号相对于输入音频信号的预定时间段的滞后,通过将虚拟低音信号与被延时了与虚拟低音系统隐含的处理延时相比更短的预定时间段的输入音频信号组合,来生成包括与延时的输入子带采样组合的时间滞后虚拟低音处理的子带采样的增强的音频信号。
根据一些实施方式,基本换位因子将频域中的输入音频信号扩展到与基本换位因子的值相称的程度以产生经换位的音频信号,并且该基本换位因子可以是4与16之间的偶整数值。在一种实施方式中,对换位器CQMF输出子带进行操作的分析滤波器组包括8通道奈奎斯特滤波器组和4通道奈奎斯特滤波器组,并且限定数量的去除的原型滤波器系数包括6个系数。在又一种实施方式中,输入CQMF信号直接从前面的CQMF分析滤波器组通道0输出端被路由,因此将后续的奈奎斯特滤波器组段旁路,并且因此避免了相关的延时。
所述方法的实施方式还可以包括通过以限定的采样频率(使用分析时间步幅)生成加窗零填充采样来对输入音频信号执行频域过采样变换以生成低频分量。由于虚拟低音信号可以被允许滞后宽带输入音频信号上至20ms而不存在增强的音频信号的明显的恶化,所以当将虚拟低音信号与延时的输入音频信号组合时,预定时间段可以是选自0个采样至1000个采样的范围的值。在一种实施方式中,非对称分析窗口和合成窗口被配置成使得分析窗口的较长部分朝向过去输入采样被拉伸,并且使得合成窗口的较长部分朝向未来输出采样被拉伸。
实施方式还涉及被配置成实现上述方法中的至少一些方法的系统或设备元件。
附图说明
在下面的附图中,相同的附图标记用于指代相同的要素。尽管下面的图描绘了各种示例,但是一个或更多个实现不限于图中所描绘的示例。
图1A示出了已知的虚拟低音处理系统中的频率分量从听不见的频率范围至听得见的频率范围的换位。
图1B示出了现有技术中已知的与在传统虚拟低音系统中使用的对称窗口相关联的延时。
图2是根据实施方式的实现延迟减小处理的虚拟低音处理系统的概括框图。
图3A示出了根据实施方式的基于HQMF的系统中的预处理混合滤波器组段。
图3B示出了根据实施方式的虚拟低音处理系统的先前的奈奎斯特合成滤波器组段。
图3C是根据实施方式的图2中示出的虚拟低音处理系统的更详细的图。
图4是根据实施方式的由虚拟低音延迟降低处理及系统利用的主要功能部件的框图。
图5A是示出了根据实施方式的与使用基本换位因子的不同阶的虚拟低音延迟减小系统的第一跳距相关联的延时的表格。
图5B是示出了根据实施方式的与使用基本换位因子的不同阶的虚拟低音延迟减小系统的第二跳距相关联的延时的表格。
图5C是与某些传统对称窗口相比的非对称窗口的时间响应的示例图,以及图5D是与某些传统对称窗口相比的非对称窗口的频率响应的示例图。
图6示出了根据实施方式的非对称窗口的使用以及由B阶基本换位器强加的相关联的延时。
图7A是示出了根据实施方式的使用非对称变换窗口和基本换位因子的不同阶的虚拟低音延迟减小系统的第一跳距的总延迟值的表格。
图7B是示出了根据实施方式的使用非对称变换窗口和基本换位因子的不同阶的虚拟低音延迟减小系统的第二跳距的总延迟值的表格。
图8是示出了根据实施方式的包括虚拟低音生成系统和延迟减小系统的音频处理系统的框图。
具体实施方式
描述了用于减小基于换位器的虚拟低音系统中的延迟和算法延时的系统及方法的实施方式。这样的系统及方法利用更高阶基本换位因子、低延迟非对称变换窗口、截断奈奎斯特原型滤波器、相对于原始音频信号的时间滞后的虚拟低音信号以及在先前的混合滤波器组段中的被旁路的奈奎斯特分析滤波器组。
贯穿包括权利要求书在内的本公开内容,“对”信号或数据执行操作(例如,对信号或数据进行滤波,缩放,变换或施加增益)的表达用于在广义上表示对信号或数据、或对信号或数据的已处理版本(例如,在对信号执行操作之前已经经历了初步滤波或预处理的信号的版本)直接执行操作。表达“换位器”用于在广义上表示对于部分或整个可用输入信号谱执行实数值或复数值输入信号的音高移位(pitch-shifting)或时间拉伸的算法单元或装置。表达“换位器”、“谐波换位器”、“相位声码器”、“高频生成器”或“谐波生成器”能够可互换地被使用。表达“系统”用于在广义上表示装置、系统或子系统。例如,实现解码器的子系统可以被称为解码器系统,以及包括这样的子系统的系统(例如,响应于多个输入生成X个输出信号的系统,其中子系统生成M个输入,并且其他X-M个输入从外部源接收)也可以被称为解码器系统。术语“处理器”用于在广义上表示可编程成或以其他方式可配置成(例如,使用软件或固件)对数据(例如,音频或视频或其他图像数据)执行操作的系统或装置。处理器的示例包括现场可编程门阵列(或其他可配置集成电路或芯片组)、被编程成和/或以其他方式被配置成对音频或其他声音数据执行流水线式处理的数字信号处理器、可编程的通用处理器或计算机、以及可编程的微处理器或芯片或者芯片组。表达“音频处理器”和“音频处理单元”可互换地被使用且在广义上用于表示被配置成对音频数据进行处理的系统。音频处理单元的示例包括但不限于编码器(例如,代码转换器)、解码器、声码器、编解码器、预处理系统、后处理系统和比特流处理系统(有时被称为比特流处理工具)。
实施方式涉及用于减小虚拟低音延时而无需对现有虚拟低音处理部件如虚拟低音处理系统中使用的谐波换位器进行实质改变的系统及方法。可以结合音频编解码器(例如,解码器)中的谐波生成器(换位器)来使用虚拟低音延迟减小系统及方法的各个方面。还可以结合其他换位器或相位声码器系统例如用于音频信号的一般的时间拉伸或音高移位的传统相位声码器来使用虚拟低音延迟减小系统及方法的各个方面。
一般地如图1A中所示,使用谐波换位的虚拟低音生成方法包括频率分量从听不见的频率范围至听得见的频率范围的换位以改善低音内容在受限的回放装备中例如通过不能物理地再现消失的较低频率的小扬声器的回放。虚拟低音延迟减小系统及方法的实施方式改进虚拟低音生成方法,该虚拟低音生成方法对音频信号的低频分量执行谐波换位以生成表示预期在回放期间听得见的谐波的经换位的数据,响应于经换位的数据生成虚拟低音信号,并且通过将虚拟低音信号与(经延时的)输入音频信号组合来生成增强的音频信号。通常,在增强的音频信号通过不能物理上再现低频分量的一个或更多个扬声器的回放期间,增强的音频信号提供低音内容的提高了的感知水平。
通过虚拟低音生成方法执行的谐波换位利用使用每个低频分量的二阶换位器和至少一个更高阶换位器(通常,三阶换位器和四阶换位器,以及可选地,至少一个另外的更高阶换位器)的组合换位来生成谐波,使得响应于由普通的时间至频率域变换段(例如,通过对从单个时间至频率域变换得到的频率系数执行相位倍增或相位的其他操作)确定的频域值来生成所有谐波,在上述普通的时间至频率域变换段之后进行普通的频率至时间域变换(实际上,上述普通的频率至时间域变换被分成两个较小的变换以适应CQMF框架的子带的带宽和采样频率)。
图2是根据实施方式的实现一些延迟减小处理或结合一些延迟减小处理来使用的虚拟低音处理系统的框图。在一种实施方式中,虚拟低音处理系统200从所谓的混合滤波器组获得多个复数值子带采样(HQMF采样)作为输入201(输入A)。在一种实施方式中,在虚拟低音处理之前的混合滤波器组将原始时域音频输入信号分离成了这样的多个混合子带201(其在下面进一步详细描述),并且它们可以由输入缓存器206缓存。然后,所缓存的输入通过奈奎斯特合成滤波器组208被处理,奈奎斯特合成滤波器组208执行合成功能以重构表示低频音频内容(例如,在0Hz与375Hz之间)的单个复数值QMF(CQMF)域信号202(信号C)。在另一种实施方式中,虚拟低音系统通过将前面的混合滤波器组中的奈奎斯特滤波器组段旁路来包括延迟节省机制。这使得该系统能够通过将CQMF通道0信号作为输入203(输入B)直接馈送至虚拟低音模块来节省与奈奎斯特分析组(例如,384个采样)相关联的延时。如图2中所示,两个输入202或203之一由如选择器204的开关选择,并且所选择的信号包括虚拟低音输入信号205(信号D),其进一步由换位器209处理。
换位器(或相位声码器)通常是以下组合:在时间至频率变换或滤波器组之后是非线性段(执行相位倍增或相位移位),在非线性段之后是频率至时间变换或滤波器组。从而,如图2中所示,换位器209包括时间至频率变换部件210、非线性段212和频率至时间变换214。换位器209内的非线性段212是修改相位并且对信号的子带或变换分量应用一些增益(幅度)控制信号的处理块。然后,经换位的信号由输出缓冲器216缓存,并且随后由奈奎斯特分析滤波器组218处理,奈奎斯特分析滤波器组218执行将虚拟低音输出CQMT信号分解成与输入信号201的混合子带采样(HQMF)对应的子带的分析功能。输入A信号的经延时而未经处理的版本220被与奈奎斯特滤波器组218的输出混合以产生包括虚拟低音输出信号加上经延时的输入信号的增强的音频输出信号222。
尽管实施方式可以涉及奈奎斯特滤波器组对于某些功能如合成208和分析218段处理的使用,但是应当注意,还可以使用其他类型的滤波器组或频率分割或划分电路和技术。在其他实施方式中,上面提到的滤波器组或频率分割或划分电路和技术可以都不存在。
图3A至图3C是图2中示出的虚拟低音处理系统的更详细的图。图3A示出了预处理混合滤波器组段300,即,通常不是虚拟低音系统的一部分而是替代地在虚拟低音系统之前的段。混合滤波器组可以是CQMF组的组合,其中,一定数量的最低CQMF带由预定大小的奈奎斯特滤波器组来处理以提高低频范围的频率分辨率。来自奈奎斯特分析段和其余的CQMF通道的低频子带采样的组合被称作混合子带采样或HQMF(混合QMF)信号。如图3A中所示,时域输入信号302被输入至64通道CQMF分析滤波器组304。在一种实施方式中,该滤波器组的一个输出、CQMF通道0(表示为信号B)306直接被馈送至图3C的虚拟低音模块330(该信号对应于图2的输入B 203)。应当注意,信号B 306将奈奎斯特分析滤波器组307旁路,因此避免相关联的延时。CQMF通道0、1和2还被输入至多个奈奎斯特分析滤波器组307至309。来自奈奎斯特分析滤波器组和其余的CQMF子带(3至63)的输出产生混合子带采样0至76(被表示为信号A)310。
如图3B的系统320中所示,多个复数值混合子带采样(信号A)322被输入至奈奎斯特合成滤波器组段324。假定图3C的虚拟低音模块330是系统中的其他模块之一,其对混合子带采样(HQMF采样)进行操作。因此,图3A的信号A 310可以在变成图3B的输入A 322之前在预处理滤波器组段300之后经历其他模块的处理。在一种示例实施方式中,第一8个混合子带即来自低频8通道(8-ch)奈奎斯特滤波器组307(其根据采样速率产生大致344Hz至375Hz的信号带宽)的子带被处理。由于奈奎斯特滤波器组与CQMF组相反不被下采样,所以奈奎斯特滤波器组合成步骤尤其简单,因为其仅是每个CQMF(或HQMF)时隙的子带采样的求和。在段324中对8个最低混合子带采样进行求和之后,系统重组了CQMF通道0信号C 326,其变成图3C的虚拟低音模块330的输入332。
图3C示出了根据实施方式的实现一些延迟降低处理或结合一些延迟降低处理被使用的虚拟低音系统。图3C的虚拟低音模块330将信号D 332作为输入。在前面的奈奎斯特分析滤波器组307被旁路的实施方式中,信号D 332可以从图3A的信号B 306被路由。在另一种实施方式中,信号D 332可以从图3B的奈奎斯特分析段320的信号C 326被馈送。在这两种实施方式中,信号D 332即虚拟低音模块的输入信号是单个复数值CQMF信号(即,来自一组CQMF子带信号的第一通道(通道0))。
在虚拟低音应用中,可以由动态处理器336执行可选的动态处理功能以改变虚拟低音输入信号的动态。处理器336可以用于降低弱低音的水平并且保持或者增强强低音,即,被用作扩展器。该方案符合低音范围中的等响轮廓(ELC)的形状,其中,响度曲线在较响信号的频率中较平坦,而对于较弱响度的信号较陡峭。因此,当生成谐波以保持基频分量与所生成的谐波之间的相对响度时,较弱低音可以比较强低音被衰减更多。动态处理器336的增益可以由滑动(running)平均能量信号,即,第一CQMF带信号332的经下混合的(单声道)版本的滑动平均能量来控制。
对于系统330的实施方式,在输入至非线性处理块344之前,对(可能动态处理的)CQMF信号执行使用窗口大小L(包括上至长度N的零填充)、正向FFT 340和调制功能342的第一加窗功能。在本发明的实施方式中,窗口形状是非对称的。在另一种实施方式中,换位器(包括部件338至356)表示改进了的相位声码器,其使用与基本换位器相同的FFT分析/合成链来使用被称为“组合换位”的插值技术以生成二阶、三阶、四阶和可能更高阶的谐波(换位因子)。通常,虽然在某种程度上损害除了基阶谐波以外的其他谐波的品质,但是这样的组合换位节省计算复杂度。在不使用组合换位的情况下,至少正向变换或逆变换需要针对不同的换位因子而不同。非线性处理块344使用整数换位因子,其进行冗余的某个相位估计、相位展开或相位锁定技术,这些技术通常当被用于很多标准的相位声码器中时不稳定且不精确。在一种实施方式中,相位倍增器344使用高于2的基本换位因子B如8或任何其他适当的值。
换位器338至356在频域中使用过采样(即,块338和356中的零填充分析窗口和合成窗口)来改进脉冲(敲击的)声音,其当在低音频率范围中使用时是主要的。在不进行这样的过采样的情况下,敲击鼓声音很可能生成至少一些预回声和后回声伪声,使得低音模糊且不清晰。在一种实施方式中,过采样因子F被选择为至少因子F=(B+1)/2,其中,B是基本换位因子(例如,B=8)。这有助于确保针对隔离的瞬变声音抑制前回声和后回声。
如图3C中所示,换位器包括由在相位倍增器电路(非线性处理块344)之后的放大器346应用的每FFT频率段的增益和斜率补偿。这使得不同换位因子的总增益能够独立地被设置。例如,增益可以被设置成近似于某些等响轮廓(ELC)。作为近似值,可以通过低于400Hz的频率的对数刻度上的直线来适当地对ELC进行建模。在这种情况下,虽然奇数阶谐波(例如,三阶、五阶等)对于结果的虚拟低音效果很重要,但是由于奇数阶谐波有时可以被感知为与偶数阶谐波相比更刺耳,所以奇数阶谐波可以较大程度地被衰减。每个经换位的信号可以另外地具有斜率增益,即,以例如每八度音阶dB测量的滚降衰减因子。还在变换域通过放大器346每频率段来应用该衰减。
在基于非混合滤波器组的系统,例如,时域系统中,采用图3A的信号302作为输入,换位器338至356将直接对全采样速率(例如,44.1kHz或48kHz)的时域信号进行操作,然后利用大致4096条线的FFT大小,以提供低频(低音)范围的适当的分辨率。然而,在一种实施方式中,对CQMF通道0子带采样(系统330的信号D 332)执行所有处理。这通过在换位器中对仅感兴趣的信号进行处理,即,通过对临界采样的(或最大抽取的)低通信号进行处理来提供相对于正常的处理实践的某些优点如节省计算复杂度。例如,通过使用四阶基本换位器,虚拟低音系统通过因子4来扩展输入信号的带宽。通常,不要求虚拟低音系统输出带宽高于大致500Hz的信号。这表示,带宽为375Hz(或fs=48kHz)的第一CQMF通道(通道0)对于虚拟低音输入更为适当,以及前面两个CQMF通道(通道0和1)对于虚拟低音输出而言具有足够的带宽(在fs=48kHz下750Hz)。将CQMF通道0作为输入,该系统可以使用大小64(4096/64)代替4096的FFT变换来处理复数值采样,其中,降低到1/64源自CQMF组的下采样因子,与时域输入信号相比,这也等于第一CQMF子带信号的减小了的带宽。由于固有的带宽扩展,所以来自换位器的输出需要被变换成CQMF带0和1。这还可以在计算组成CQMF带0和1的两个16线FFT的逆FFT之前通过将64线FFT分成4个16线FFT以及随后利用变换域中的CQMF原型滤波器响应补偿来近似地进行。注意,在上面的示例中,不考虑频域过采样,因为其将通过先前提到的过采样因子增大正向变换大小和逆变换大小。在一个应用中,可以在虚拟低音模块330的模块348中分割FFT谱,以及可以通过倍增器350进行CQMF滤波器响应补偿。在其他实施方式,在FFT分割模块348之前,可以对全(例如,上面示例中的64线)FFT谱进行CQMF滤波器响应补偿。
如图3C中进一步示出的,使用N/B个点的变换大小以及随后的加窗和交叠/相加步骤356,使用窗口长度L/B,将来自CQMF滤波器响应补偿块350的输出输入至在逆FFT电路354之前的调制步骤352。在本发明的实施方式中,窗口形状是非对称的。还可以在FFT分割块348和CQMF滤波器响应补偿块350之前应用调制步骤352。来自加窗和交叠/相加电路356的输出信号是两个CQMF信号,包括要与经延时的HQMF信号A 364混合的虚拟低音信号。然而,这两个信号首先需要分别通过8通道和4通道奈奎斯特分析滤波器组360被滤波来符合混合域。在本发明的实施方式中,奈奎斯特分析滤波器组360使用截断原型滤波器。来自滤波器组360的HQMF输出可以被带通滤波,并且在模块362中与经延时的输入分量A 364混合以产生增强的音频输出HQMF信号366。在一种实施方式中,至混合带混合块362的输入A 364的延时小于虚拟低音系统延时(如果使用信号B 306作为输入,则减去奈奎斯特分析延时)以包括时间滞后的虚拟低音信号。
当如上面所概述的,当执行FFT分割时,不会保持来自CQMF分析组的子带信号之间的相位关系。为了在实施方式中缓解这种情况,系统330在奈奎斯特分析块360之前对CQMF通道1使用通过exp(-j·π/2)倍增358的相位补偿。相位补偿函数358的特定自变量依赖于由图3A的前面的CQMF组304使用的调制方案,并且可以因实施方式而不同。此外,补偿因子358可以在其他处理块中被移动和吸收。
虚拟低音延迟减小
如在背景技术部分中描述的,虚拟低音处理系统在处理输入信号时引入一些延时。参照图1B,传统换位器的延时(关于换位器输出采样频率所测量的)可以被表达为D=3·L/2-2·SA,其中,L是换位器窗口大小,SA是分析步幅或跳距。如前面所描述的,在L=64和SA=4的系统中,换位器和奈奎斯特滤波器组分析段的总延时可以是大约3200个采样。
在一种实施方式中,虚拟低音处理系统包括执行一些步骤以减小与虚拟低音处理内容相关联的延迟的部件。图4是根据实施方式的由虚拟低音延迟减小处理及系统利用的主要功能部件的框图。如图4的图400所示,延迟减小处理包括使用更高阶基本换位因子402、低延迟非对称变换窗口404、截断奈奎斯特原型滤波器406和时间滞后的虚拟低音信号408。图400的每个功能部件可以单独使用或者结合其他部件中的一个或更多个来使用以帮助减小虚拟低音处理内容的延迟。例如当部件402至408中的每一个被体现为硬件部件如电路、处理器等时,图400可以表示系统。例如当部件402至408中的每一个被实现为由功能部件执行的动作如由一个或更多个处理执行的计算机实现的处理时,该图还可以表示处理。可替代地,图400可以表示其中一些部件可以以硬件电路系统来实现而其他部件可以被实现为所执行的方法步骤的混合系统及方法。部件402至408可以被实现为不同的独立部件,或者它们可以被组合在一个或更多个合并的延迟减小功能中。系统400的每个部件的组成和操作的详细描述如下。
更高阶基本换位因子
对于图4的更高阶基本换位因子402,可以将传统换位器延时等式Dts={3·L/2-2·SA}64/2(等式2)推导为如等式3中所示:
Dts={(B+1)·L/2-B·SA}·64/B (等式3)
在等式3中,传统系统的基本换位因子2由任意整数基本换位因子B替换。注意,等式3指的是具有64个通道的基于CQMF的框架的输出采样的延时。可以验证,对于常数L和SA而言,延时随着B的增大而减小。对于根据实施方式的虚拟低音延迟减小系统,图5A是示出了与第一跳距相关联的延时,图5B是示出了与第二跳距相关联的延时。图5A的表格1示出了对于各种窗口大小(L=16至128)和基本换位因子(B=2至16)而言跳距SA=4的延迟。相比之下,图5B的表格2示出了对于相同的各种窗口大小(L=16至128)和基本换位因子(B=2至16)而言跳距SA=2的延迟。如可以在图5A和图5B中看到的,例如通过将基本换位因子从2增大至8,可以实现显著的延迟减小(例如,对于L=64和SA=4的标称情况而言,从2816个采样降低至2048个采样)。
参照图3C,在组合的换位器338至356中,当生成更高阶换位因子T—其中T大于B(T>B)时,换位器源范围小于分析变换谱中的换位器目标范围。目标频率段由源频率段的插值产生。当使用更高阶基本换位器生成低阶换位因子时,即,当T小于B(T<B)时,源范围将大于目标范围,并且目标频率段由源频率段的抽取产生。然而,同样对于情况T<B而言,当T是奇数时,推导为k=n·B/T的源频率段索引通常不会是整数——其中n是目标频率段索引,并且因此将从两个连续的源频率段的插值推导出目标频率段。
基本换位因子的增大了的阶数对虚拟低音处理具有一定的关联。首先,需要建立控制以迫使换位器源范围保持在分析变换范围内(即,0至N-1的范围内)。其次,与使用基本换位因子2的系统相比,现在两个合成变换354大小会是N/B而非N/2,其中,N是分析变换大小。这表示,合成窗口将通过因子B而非2被抽取并且谱分割348连同滤波器响应补偿350的增益向量也会相应地被缩小。这是对于B的较高值的增加了的带宽扩展的结果;换位器输出固有地覆盖B个CQMF带的频率范围(假定一个CQMF带的输入),其中,实际上仅前面两个CQMF带被合成,从而节省复杂度。对于基本换位因子B=8和频域过采样因子F=4而言,两个合成变换大小为NS=F·L/B=4·64/8=32,并且合成变换窗口356具有仅L/B=64/8=8个抽头。
经换位的信号的品质由基本换位因子来控制,并且对于更高阶换位阶数而言有所降低,但是可以通过使用减小了的分析跳距(时域中的增大了的过采样)来提高。此外,为了保持敲击声音(瞬变)的品质,对于更高的基本换位因子,需要增大频域过采样的阶数。然而,在时间和频率两个方面的增加了的过采样可能增加换位器的计算复杂度。在一种实施方式中,与传统系统相比,分析跳距被减小了二分之一。因子B=8的基本换位器将要求至少F=(B+1)/2=4.5的频域过采样因子。在一种实施方式中,该系统使用因子4的过采样(F=4),并且当变换窗口在末端变尖时消失的值0.5通常实际上不显著。因此,在该实施方式中,由于在时间上增大过采样,导致计算复杂度总计通过因子2而增大。应当注意,增大了的时间过采样以稍微增加了的延时为代价,对于L=64、B=8和SA=2而言,以2176个采样的总延迟而结束,如图5B的表格2所示。
非对称的变换窗口
给出了图5A和图5B的表格1和表格2所示的内容,可以假设减小换位器延时的明显的方式是使用较短的变换窗口以及因此较小的分析变换大小和合成变换大小。然而,这通常以降低密集音调信号的品质为代价,因为由较短的变换窗口产生降低了的频率分辨率。已经发现,可以通过在正向变换段和逆变换段中使用非对称分析窗口和合成窗口来实现换位器的算法延时的更鲁棒的减小。从而,在一种实施方式中,对于图4的低延迟非对称变换404而言,延迟减小系统在正向变换段和逆变换段中使用非对称分析窗口和合成窗口(例如,分别是图3C的加窗段338和356)。这通过朝向历史采样扩展窗口的“尾巴”而不造成变换延时来本质上改善有限长的非对称窗口的频率响应。在甚至更一般的实施方式中,分析窗口的长度和正向变换的大小可以与合成窗口的长度和逆变换的大小不同。
图5C是与传统对称的汉宁(Hanning)窗口相比非对称窗口的时间响应的示例曲线。图5C示出了:如曲线图514所示的对于长度为64的汉宁窗口的作为采样(x轴)与信号幅度(例如,以伏特为单位)的函数的时间响应、如曲线图516所示的对于长度为41的汉宁窗口的作为采样(x轴)与信号幅度(例如,以伏特为单位)的函数的时间响应、以及长度为64和延时为40(延时等于长度为41的汉宁窗口)的非对称窗口的时间响应曲线图512。图5D是与传统对称的汉宁窗口相比非对称窗口的频率响应的示例曲线图。图5D示出了:如曲线图524所示的对于长度为64的汉宁窗口的作为归一化频率(x轴)和对数刻度上的信号幅度(例如,dB)的函数的频率响应、如曲线526所示的对于长度为41的汉宁窗口的作为归一化频率(x轴)和对数刻度上的信号幅度(例如,dB)的函数的频率响应、以及长度为64和延时为40(等于长度41的汉宁窗口)的非对称窗口的频率响应曲线522。如可以在图5D中看到的,非对称窗口的主要波瓣(lobe)在这些对称的汉宁窗口之间具有表示两个汉宁窗口之间的频率分辨率或选择性的宽度。
为了适应非对称窗口变换处理,与传统实现相比,需要部分地改变换位器算法,考虑分析/合成链的减小了的变换延时D。代替在传统系统的正向变换之后和逆变换之前通过e-jπk进行频率调制,非对称系统要求在以下分析变换之后进行频率调制342:
MA(k)=e-i·(2·π/N)(D/2-L+1)·k,0≤k<N (等式4)
该系统还要求在以下合成FFT谱的分割之前进行调制:
MS(n)=e-i·(π/N·D·n),0≤n<N (等式5)
在上面的等式4和等式5中,k和n分别是变换频率系数索引,N是分析变换大小,即,N=FL,其中,F是频域过采样因子,L是分析窗口大小并且D是变换延时。如图3C中所指出的,等式5的调制还可以被应用于FFT分割模块348和响应补偿步骤350之后的调制段352。
图6在格式上示出了根据实施方式的非对称窗口的使用以及由B阶基本换位器强加的相关联的延时。在传统虚拟低音系统中,B通常被设置成2,但是如果结合更高阶基本换位因子处理402使用非对称窗口处理404,则B会是大于2的整数值(例如,B=4、8或16)。时间曲线600示出了作为分析窗口的群延时(近似D/2)的时间零基准。在分析段602从时间t0起添加新的采样604。时间曲线610示出了换位器的时间拉伸对偶性在新的时间拉伸的采样614的合成段612将t0移动至时间B·t0。在使用非对称窗口如图5(512)或图6所示的窗口的情况下,总的分析/合成链延时量近似于:D/2+B·(D/2-SA)。
对于其中频域调制可以由通过N/2个采样的循环时间移位来实现的对称窗口情况而言,上面的等式4和等式5的计算可以同样地分别通过分析变换之前的N-(D/2-(L-1))(mod N)个采样的循环时间移位和在(单个)合成变换之后的N-D/2个采样的循环时间移位来实现。然而,当将非对称窗口与更高阶基本换位因子例如B=8以及FFT分割段348组合时,合成变换之后的时间移位会是(N-D/2)/B个采样,其可以是不是整数值。在这种情况下,取整的值可以用作近似值。另外,为了节省复杂度,可以将分析调制与合成调成组合作为由等式6给出的合并的合成调制:
MASC(k)=e-i·(2·π/N)(D/2·(B+1)-L+1)·B)·k,0≤k<N (等式6)
仅当换位因子T等于B时,等式6的组合调制才会精确。对于其他换位因子,等式6也会是近似值。
可替代地,等式6的调制可以被实现为如等式7中所示的合成变换之后的组合循环时间移位:
在上面的等式7中,gx(m)是来自合成逆变换之一的时间域输出,fx(m)是移位的时间序列,并且S等于:
此外,当ceil函数(取整成最接近的整数)的自变量不是精确的整数时,等式7提供由等式6实现的频率调制的仅近似值(其本身可以是近似值)。还应当注意,上面的等式5和等式6优选地仅被应用于系数的有限部分,这些系数被包括在两个逆傅里叶变换中。
参照图6,非对称窗口换位器框架的总系统延时的精确表达变成如等式8中所示:
Dta={(B+1)·D/2-B·(SA-1)}·64/B (等式8)
此外,等式8指的是使用基于64通道CQMF的框架的输出采样中的延时。
对于根据实施方式的使用非对称变换窗口的虚拟低音延迟减小系统,图7A是示出了关于第一跳距大小的总延迟值的表格,图7B是示出了关于第二跳距的总延迟值的表格。图7A的表格3示出了对于各种变换延时值(D=15至127)和基本换位因子(B=2至16)而言跳距SA=4的延迟。相比之下,图7B的表格4示出了对于相同的各种变化延时值(D=15至127)和基本换位因子(B=2至16)而言跳距SA=2的延迟。如可以在表格4中看到的,从对称64抽头窗口(D=63)至非对称窗口的延迟减小是828个采样(对于SA=2和B=8的标称情况而言,2204-1376=828)。
将等式3与等式8相比,可以验证,设置Dts=Dta给出:
D=L-(2·B/(B+1)) (等式9)
上面的等式9表达当B=1时对称窗口的预期的变换延迟D=L-1。
换位窗口的非对称的量可以根据系统的限制和要求而变化。在一种实施方式和特定实现中,非对称窗口的群延时被选择接近变换延时的二分之一,以便保持适当的换位品质。从而,在这种情况下,Gd≈D/2=20。这可以通过包括非对称滤波器的设计的优化阶段期间的群延时的约束来完成。
截断奈奎斯特原型滤波器
参照图4,第三延迟减小元件包括使用截断奈奎斯特原型滤波器406。如图3C中所示,为了能够在混合域中混合虚拟低音信号,8通道和4通道奈奎斯特分析滤波器组360被应用于虚拟低音输出CQMF通道(这些滤波器组对应于图3A的奈奎斯特滤波器组307和308)。在一种实施方式中,奈奎斯特分析滤波器组360使用对称的13抽头原型滤波器,其可以产生6个CQMF采样的延时(例如,在这种情况下,6·64=384个输出采样)。通过去除原型滤波器的作用在未来采样上的6个系数,可以消除该整个延时(例如,384个采样)。一般地,奈奎斯特分析/合成链仍提供完美的重构。然而,使用截断滤波器的奈奎斯特滤波器组的频率响应可以改变。其余的滤波器系数的优化可以改善使用截断滤波器的奈奎斯特滤波器组的潜在较差的频率响应。
时间滞后的虚拟低音信号
参照图4,第四延迟减小元件包括使虚拟低音信号滞后原始信号,408。在这种情况下,当宽带信号(即,图3C的混合信号A 364)被延时与虚拟低音系统延时实际上暗示的时间段相比更短的时间段时,可以减小整个系统的延迟。非正式聆听测试表明:低于20ms的滞后不妨碍虚拟低音效果。该滞后对于48kHz音频信号而言对应于960个采样。
在实施方式的特定实现中,允许虚拟低音信号使宽带信号滞后总共352个采样(在48kHz下为7.33ms)。由于1376不能由CQMF滤波器组大小64整除,所以在这352个采样中,32个采样来自对非对称变换窗口的使用。因此,来自非对称窗口变换的延时可以被分成1344的宽带延迟加上32个采样的低音滞后。从而,除了32个采样之外的额外滞后是320个采样(5个CQMF采样,在48kHz采样频率下对应于6.67ms)。
图4的不同的延迟减小元件402至408可以以任意实际数量的组合来使用以实现虚拟低音系统延迟的减小。此外,可以将每种延迟减小方法的适当的变化更改成增加与虚拟低音信号品质的任何感知下降有关的延迟。在一种实施方式中,使用以下值实现了四个延迟减小元件:基本换位因子B=8、跳距SA=2、变换延迟D=40、截断奈奎斯特滤波器组和320个采样的额外虚拟低音滞后。在该示例情况下,结果的输出采样中的虚拟低音系统延时如下:
DVB={(B+1)·D/2-B·(SA-1)}·64/B-32+0-320=1376-352=1024
如上所述规避预处理段中的奈奎斯特分析滤波器(例如通过使用图2中的输入B 203、图3A的信号B 306作为图3C的虚拟低音模块330中的输入D 332),可以节省另外的384个采样的延时,产生虚拟低音系统延时1024-384=640个采样(在48kHz采样频率下对应于13ms)。
该示例情况中的640个采样的延时明显小于先前描述的传统虚拟低音系统中的3200个采样的标称延时。甚至可以通过增加更大的虚拟低音滞后,通过将跳距SA增加至4代替2,或者通过设计具有短于40的结果的分析/合成延时的非对称变换窗口来进一步降低该延时。然而,虽然可以进一步降低延迟,但是任何这样的值的变化可以产生稍微较差的虚拟低音品质。
本文中描述的虚拟低音延迟减小系统的实施方式可以结合任何适当的虚拟低音生成系统如图2和图3中示出的系统来使用。图8是示出了根据实施方式的包括虚拟低音生成系统和延迟减小系统的音频处理系统的框图。如图8中所示,系统800包括如图3C中所示的虚拟低音生成系统330。虚拟低音系统330接收输入音频信号801,并且执行一些频率换位功能来产生增强的音频内容以通过可能具有有限的频率响应能力的扬声器806进行回放。一些延迟可以与由虚拟低音系统330执行的换位功能相关联。在一种实施方式中,虚拟低音延迟减小系统400(如图4中所示)被提供为虚拟低音系统300的后处理以减小与虚拟低音处理相关联的延迟。然后,来自虚拟低音系统300和400的减小了延迟的音频信号被发送至渲染子系统802,渲染子系统802被配置成生成扬声器馈送,扬声器馈送可以通过放大器804被馈送给左右(或多通道)扬声器806。
尽管虚拟低音延迟减小系统400被示为系统800中的单独的后处理元件,但是应当注意,这样的延迟减小系统可以被实现为虚拟低音系统330的一部分(如前面指出的),或者被实现为系统800的任何适当的元件的一部分如渲染子系统802内的功能部件。同样地,虚拟低音系统330可以是背景技术中所概述的传统虚拟低音生成系统,或者其可以是使用谐波换位来增强输入音频信号801以增加通过扬声器806回放的低音内容的感知水平的任何其他虚拟低音生成和处理系统。
可以在通过各种不同的回放装置和音频扬声器(换能器)呈现和回放数字音频的任何音频处理系统中使用虚拟低音延迟减小系统的实施方式。这些扬声器可以体现为各种不同的收听装置或回放设备的项目中的任一种,如计算机、电视、立体声系统(家庭或影院)、移动手机、平板电脑和其他便携式回放装置。扬声器可以具有任何适当的大小和额定功率,并且可以以独立式驱动器、扬声器箱、环绕声系统、条形音箱、耳机、耳塞等的形式被提供。扬声器可以以任何适当的阵列被配置,并且可以包括单声道驱动器、双耳扬声器、环绕声扬声器阵列或任何其他适当的音频驱动器阵列。
可以在包括执行软件指令的一个或更多个计算机或处理装置的对音频信号进行处理以便通过网络传输的音频系统中实现本文中描述的一种或更多种实施方式的各个方面。所描述的实施方式中的任何实施方式可以单独被使用或者以任何组合相互结合被使用。尽管各种实施方式是由在说明书的一个或更多个地方讨论或者提及的现有技术的各种缺陷推动的,但是实施方式不是必需地解决这些缺陷中的任何缺陷。换言之,不同的实施方式可以解决可能在说明书中讨论的不同的缺陷。一些实施方式可以仅部分地解决将会在说明书中讨论的一些缺陷或仅仅一个缺陷,而一些实施方式可以不解决这些缺陷中的任何缺陷。
可以在用于处理数字或数字化音频文件的合适的基于计算机的声音处理网络环境中实现本文中所描述的系统的方面。自适应音频系统的各个部分可以包括以下一个或更多个网络:所述网络包括任何期望数量的单独机器,包括用于缓存和路由计算机之间传输的数据的一个或更多个路由器(未示出)。这样的网络可以基于各种不同的网络协议来构建,并且可以是因特网、广域网(WAN)、局域网(LAN)或其任意组合。
可以通过对系统的基于处理器的计算装置的执行进行控制的计算机程序来实现部件、块、处理器或其它功能部件中的一个或更多个。还应当注意,根据其行为、寄存器传送、逻辑部件和/或其它特征,可以使用硬件、固件和/或数据和/或在各种机器可读介质或计算机可读介质中实现的指令的任何数量的组合来描述本文中公开的各种功能。可以体现这样的格式化数据和/或指令的计算机可读介质包括但不限于各种形式的物理(非暂态)、非易失性介质,如光、磁或半导体存储介质。
除非上下文明确要求,否则遍及说明书和权利要求书,词语“包括(comprise)”、“包括(comprising)”等要以与排外的意义或穷尽的意义相反的包括的意义来解释;即,按照“包括但不限于”的意义来解释。此外,使用单数或复数的词语还分别包括复数或单数。另外,词语“在本文中”、“在下文中”、“在上面”、“在下面”以及类似意思的词语指的是本申请的全部而不是本申请的任何特定部分。当参照两项或更多项的列表来使用词语“或”时,该词语涵盖该词语的所有下列解释:列表中任意一个项目、列表中所有项目以及列表中项目的任意组合。
尽管通过示例并且根据特定的实施方式描述了一个或更多个实现,但是应当理解,一个或更多个实现不限于所公开的实施方式。相反,如对本领域技术人员明显的,其意在覆盖各种修改和类似的布置。因此,所附权利要求的范围应当符合最广泛的解释,以包括所有这样的修改和类似的布置。
Claims (22)
1.一种用于生成低延迟虚拟低音的方法,包括:
接收输入音频信号;
使用具有所述输入音频信号的低频分量中的每个低频分量的二阶换位器和一个或更多个更高阶换位器的组合换位器对所述低频分量执行谐波换位,以生成表示所述输入音频信号的谐波的换位数据;
响应于所述换位数据来生成虚拟低音信号;以及
通过将所述虚拟低音信号与所述输入音频信号的延时版本进行组合来生成增强的音频信号,其中,所述谐波换位利用使用高于2的基本换位阶B的组合换位,使得所述谐波包括每个所述低频分量的二阶谐波和至少一个更高阶谐波,并且使得响应于由使用非对称分析窗口的普通的时间至频率域变换段确定的频域值以及由使用非对称合成窗口的普通的频率至时间域变换段确定的后续逆变换来生成所有的所述谐波。
2.根据权利要求1所述的方法,其中,响应于由普通的时间至频率域变换段确定的频域值来生成所述谐波,所述普通的时间至频率域变换段之后进行普通的频率至时间域变换。
3.根据权利要求1所述的方法,其中,所述输入音频信号是表示来自一组复数值正交镜像滤波器(CQMF)子带信号的临界采样的或接近临界采样的低频音频的子带CQMF信号。
4.根据权利要求3所述的方法,其中,所述临界采样的或接近临界采样的低频输入音频是表示来自一组CQMF子带信号的最低频带的CQMF通道0信号。
5.根据权利要求4所述的方法,还包括:
根据低频分量通过以下来生成换位数据:通过生成非对称加窗零填充采样并且对所述非对称加窗零填充采样执行时间至频率域变换来对所述输入音频信号执行频域过采样变换;以及后续对来自所述时间至频率域变换的输出执行非线性操作以根据所述低频分量生成所述换位数据;
根据由所述非线性操作处理的频率分量通过分割成第一频带中的第一组频率分量和第二频带中的第二组频率分量来生成两组频率分量;以及
进一步对所述第一组频率分量执行第一频率至时间域变换并且对所述第二组频率分量执行第二频率至时间域变换,其中,所述第一频率至时间域变换和所述第二频率至时间域变换中的每一个的变换大小是所述时间至频率域变换的变换大小的1/B;以及
进一步对来自所述频率至时间域变换的采样应用非对称零填充窗口,其中,所述非对称零填充窗口是根据所述输入音频信号生成的所述非对称加窗零填充采样的1/B长,从而形成两组换位数据。
6.根据权利要求5所述的方法,其中,所述第一频带是来自一组CQMF子带信号的CQMF通道0的频带,并且所述第二频带是来自所述一组CQMF子带信号的CQMF通道1的频带。
7.根据权利要求6所述的方法,其中,响应于所述换位数据来生成虚拟低音信号包括被应用于所述两组换位数据中之一或两者的分析滤波器组,其中,所述分析滤波器组包括对称滤波器的截断版本。
8.根据权利要求7所述的方法,其中,所述分析滤波器组是奈奎斯特滤波器组,并且所述对称滤波器的截断版本是所述滤波器的对称的半部之一被去除的滤波器。
9.根据权利要求8所述的方法,其中,所述分析滤波器组包括8通道奈奎斯特滤波器组或4通道奈奎斯特滤波器组之一,并且其中,所述滤波器的被去除的对称的半部之一包括6个系数。
10.根据权利要求1所述的方法,其中,所述输入音频信号的延时版本被延时了与所述虚拟低音信号的延迟相比更短的预定时间段,并且所述增强的音频信号表示时间滞后的虚拟低音信号。
11.根据权利要求10所述的方法,其中,所述预定时间段是选自0个采样至1000个采样的范围的值。
12.根据权利要求4所述的方法,其中,直接从预处理混合滤波器组段的分析CQMF组输出端接收输入音频CQMF通道0,从而将所述预处理混合滤波器组段的奈奎斯特分析滤波器组旁路。
13.一种用于生成低延迟虚拟低音的设备,包括:
第一部件,所述第一部件接收输入音频信号,并且使用具有所述输入音频信号的低频分量中的每个低频分量的二阶换位器和一个或更多个更高阶换位器的组合换位器对所述低频分量执行谐波换位,以生成表示所述输入音频信号的谐波的换位数据;以及
第二部件,所述第二部件响应于所述换位数据来生成虚拟低音信号并且将所述虚拟低音信号与所述输入音频信号的延时版本进行组合以生成增强的音频信号,其中,所述谐波换位利用使用高于2的基本换位阶B的组合换位,使得所述谐波包括每个所述低频分量的二阶谐波和至少一个更高阶谐波,并且使得响应于由使用非对称分析窗口的普通的时间至频率域变换段确定的频域值以及由使用非对称合成窗口的普通的频率至时间域变换段确定的后续逆变换来生成所有的所述谐波。
14.根据权利要求13所述的设备,其中,响应于由普通的时间至频率域变换段确定的频域值来生成所述谐波,所述普通的时间至频率域变换段之后进行普通的频率至时间域变换。
15.根据权利要求13所述的设备,其中,所述输入音频信号是表示来自一组复数值正交镜像滤波器(CQMF)子带信号的临界采样的或接近临界采样的低频音频的子带CQMF信号。
16.根据权利要求15所述的设备,其中,所述临界采样的或接近临界采样的低频音频是表示来自一组CQMF子带信号的最低频带的CQMF通道0信号。
17.根据权利要求16所述的设备,还包括:
第三部件,所述第三部件根据低频分量通过以下来生成换位数据:通过生成非对称加窗零填充采样并且对所述非对称加窗零填充采样执行时间至频率域变换来对所述输入音频信号执行频域过采样变换;以及后续对来自所述时间至频率域变换的输出执行非线性操作以根据所述低频分量生成所述换位数据;
第四部件,所述第四部件根据由所述非线性操作处理的频率分量通过分割成第一频带中的第一组频率分量和第二频带中的第二组频率分量来生成两组频率分量;
第五部件,所述第五部件进一步对所述第一组频率分量执行第一频率至时间域变换并且对所述第二组频率分量执行第二频率至时间域变换,其中,所述第一频率至时间域变换和所述第二频率至时间域变换中的每一个的变换大小是所述时间至频率域变换的变换大小的1/B;以及
第六部件,所述第六部件对来自所述频率至时间域变换的采样应用非对称零填充窗口,其中,所述非对称零填充窗口是根据所述输入音频信号生成的所述非对称加窗零填充采样的1/B长,从而形成两组换位数据。
18.根据权利要求17所述的设备,其中,所述第一频带是来自一组CQMF子带信号的CQMF通道0的频带,所述第二频带是来自所述一组CQMF子带信号的CQMF通道1的频带,并且其中,响应于所述换位数据来生成虚拟低音信号包括被应用于所述两组换位数据中之一或两者的分析滤波器组,其中,所述分析滤波器组包括对称滤波器的截断版本。
19.根据权利要求18所述的设备,其中,所述分析滤波器组是奈奎斯特滤波器组,并且所述对称滤波器的截断版本是所述滤波器的对称的半部之一被去除的滤波器。
20.根据权利要求19所述的设备,其中,所述分析滤波器组包括8通道奈奎斯特滤波器组或4通道奈奎斯特滤波器组之一,并且其中,所述滤波器的被去除的对称的半部之一包括6个系数。
21.根据权利要求13所述的设备,还包括:
定时部件,所述定时部件生成所述音频信号的被延时了与所述虚拟低音信号的延迟相比更短的预定时间段的版本;以及
混合部件,所述混合部件将所述虚拟低音信号与经延时的所述输入音频信号组合以生成表示时间滞后的虚拟低音信号的增强的音频信号。
22.根据权利要求16的设备,还包括接口部件,所述接口部件直接从预处理混合滤波器组段的分析CQMF组输出端接收所述CQMF通道0,从而将所述预处理混合滤波器组段的奈奎斯特分析滤波器组旁路。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/652,023 | 2012-10-15 | ||
US13/652,023 US8971551B2 (en) | 2009-09-18 | 2012-10-15 | Virtual bass synthesis using harmonic transposition |
PCT/EP2013/070262 WO2014060204A1 (en) | 2012-10-15 | 2013-09-27 | System and method for reducing latency in transposer-based virtual bass systems |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104704855A CN104704855A (zh) | 2015-06-10 |
CN104704855B true CN104704855B (zh) | 2016-08-24 |
Family
ID=49293633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380053450.0A Active CN104704855B (zh) | 2012-10-15 | 2013-09-27 | 用于减小基于换位器的虚拟低音系统中的延迟的系统及方法 |
Country Status (4)
Country | Link |
---|---|
EP (2) | EP2907324B1 (zh) |
JP (1) | JP5894347B2 (zh) |
CN (1) | CN104704855B (zh) |
WO (1) | WO2014060204A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105280189B (zh) * | 2015-09-16 | 2019-01-08 | 深圳广晟信源技术有限公司 | 带宽扩展编码和解码中高频生成的方法和装置 |
JP7270836B2 (ja) | 2019-08-08 | 2023-05-10 | ブームクラウド 360 インコーポレイテッド | 音響心理学的周波数範囲拡張のための非線形適応フィルタバンク |
CN115299075B (zh) * | 2020-03-20 | 2023-08-18 | 杜比国际公司 | 扬声器的低音增强 |
EP4367901A1 (en) * | 2021-07-09 | 2024-05-15 | Soundfocus Aps | Method and transducer array system for directionally reproducing an input audio signal |
WO2023280357A1 (en) * | 2021-07-09 | 2023-01-12 | Soundfocus Aps | Method and loudspeaker system for processing an input audio signal |
JP2023130644A (ja) * | 2022-03-08 | 2023-09-21 | アルプスアルパイン株式会社 | 音響信号処理装置、音響システム及び低音感の増強方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101505443A (zh) * | 2009-03-13 | 2009-08-12 | 北京中星微电子有限公司 | 一种虚拟重低音增强方法及系统 |
TW201215172A (en) * | 2010-07-09 | 2012-04-01 | Conexant Systems Inc | Systems and methods for generating phantom bass |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0101175D0 (sv) | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
TWI339991B (en) * | 2006-04-27 | 2011-04-01 | Univ Nat Chiao Tung | Method for virtual bass synthesis |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
JP4983694B2 (ja) * | 2008-03-31 | 2012-07-25 | 株式会社Jvcケンウッド | 音声再生装置 |
EP2380172B1 (en) * | 2009-01-16 | 2013-07-24 | Dolby International AB | Cross product enhanced harmonic transposition |
GB0906594D0 (en) * | 2009-04-17 | 2009-05-27 | Sontia Logic Ltd | Processing an audio singnal |
KR101613684B1 (ko) * | 2009-12-09 | 2016-04-19 | 삼성전자주식회사 | 음향 신호 보강 처리 장치 및 방법 |
US9117459B2 (en) * | 2010-07-19 | 2015-08-25 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
JP5375861B2 (ja) * | 2011-03-18 | 2013-12-25 | ヤマハ株式会社 | オーディオ再生の効果付加方法およびその装置 |
CN102354500A (zh) * | 2011-08-03 | 2012-02-15 | 华南理工大学 | 一种基于谐波控制的虚拟低音增强处理方法 |
TWI575962B (zh) * | 2012-02-24 | 2017-03-21 | 杜比國際公司 | 部份複數處理之重疊濾波器組中的低延遲實數至複數轉換 |
-
2013
- 2013-09-27 CN CN201380053450.0A patent/CN104704855B/zh active Active
- 2013-09-27 WO PCT/EP2013/070262 patent/WO2014060204A1/en active Application Filing
- 2013-09-27 EP EP13771123.0A patent/EP2907324B1/en active Active
- 2013-09-27 JP JP2015536058A patent/JP5894347B2/ja active Active
- 2013-10-14 EP EP13188415.7A patent/EP2720477B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101505443A (zh) * | 2009-03-13 | 2009-08-12 | 北京中星微电子有限公司 | 一种虚拟重低音增强方法及系统 |
TW201215172A (en) * | 2010-07-09 | 2012-04-01 | Conexant Systems Inc | Systems and methods for generating phantom bass |
Also Published As
Publication number | Publication date |
---|---|
CN104704855A (zh) | 2015-06-10 |
EP2720477B1 (en) | 2016-03-02 |
WO2014060204A1 (en) | 2014-04-24 |
EP2720477A1 (en) | 2014-04-16 |
EP2907324A1 (en) | 2015-08-19 |
JP5894347B2 (ja) | 2016-03-30 |
JP2015531575A (ja) | 2015-11-02 |
EP2907324B1 (en) | 2016-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9407993B2 (en) | Latency reduction in transposer-based virtual bass systems | |
CN104704855B (zh) | 用于减小基于换位器的虚拟低音系统中的延迟的系统及方法 | |
US11591657B2 (en) | Oversampling in a combined transposer filter bank | |
RU2543309C2 (ru) | Устройство, способ и компьютерная программа для того, чтобы управлять аудиосигналом, включающим переходный сигнал | |
EP1635611B1 (en) | Audio signal processing apparatus and method | |
JP5425952B2 (ja) | 瞬間的事象を有する音声信号の操作装置および操作方法 | |
JP5090390B2 (ja) | サブバンド領域における改良されたスペクトル移動/折返し | |
US20060053018A1 (en) | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods | |
MX2012010416A (es) | Aparato y método para procesar una señal de audio usando alineación de borde de patching. | |
KR101412117B1 (ko) | 재생 속도 또는 피치를 변경할 때 오디오 신호에서 과도 사운드 이벤트를 처리하기 위한 장치 및 방법 | |
WO2020179472A1 (ja) | 信号処理装置および方法、並びにプログラム | |
Juillerat et al. | Low latency audio pitch shifting in the frequency domain | |
Uncini | Digital Audio Effects | |
CN111988726A (zh) | 一种立体声合成单声道的方法和系统 | |
EP2149876A1 (en) | Reverberation applying device and corresponding program | |
Pulikottil | Virtual bass system by exploiting the rhythmic contents in music | |
Altoè | A transient-preserving audio time-stretching algorithm and a real-time realization for a commercial music product | |
Kontsevoi | An application of spectral translation and spectral envelope extrapolation for high-frequency bandwidth extension of generic audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |