具体实施方式
下面,参照附图说明本发明的实施方式。
(实施方式1)
实施方式1的音响信号处理装置对所输入的音响信号进行QMF变换,进行相位调整,实施逆QMF变换,由此实现时间拉伸处理。
图1是表示实施方式1的音响信号处理装置的结构图。首先,QMF分析滤波器组901将所输入的音响信号变换为QMF系数X(m,n)。其中,m表示子带索引,n表示时隙索引。调整电路902对通过变换而得到的QMF系数进行调整。下面,对调整电路902的调整进行说明。式11使用各个QMF系数各自的振幅和相位来表述调整之前的该各个QMF系数。
[数式10]
X(m,n)=r(m,n)·exp(j·a(m,n)) (式11)
r(m,n)表示振幅信息,a(m,n)表示相位信息。调整电路902将相位信息a(m,n)调整为下式所示的相位信息。
[数式11]
调整电路902根据式12,利用调整之后的相位信息和调整之前的振幅信息r(m,n),计算新的QMF系数。
[数式12]
(式12)
最后,QMF合成滤波器组903将根据式12计算出的新的QMF系数变换为时间信号。下面,对调整相位信息的方法进行说明。
在实施方式1中,基于QMF的时间拉伸处理由以下所示的步骤构成。即,时间拉伸处理包括:(1)调整相位信息的步骤,(2)根据QMF变换的加法定理来执行QMF区域的重叠相加的步骤。
下面,在有关时间拉伸的说明中,以利用拉伸系数s对2L样本的实数值的时间信号进行时间拉伸的情况为例。QMF分析滤波器组901例如将2L样本的实数值的时间信号变换为由2L/M个时隙和M个子带构成的2L个QMF系数。即,QMF分析滤波器组901将2L样本的实数值的时间信号变换为合成频域的QMF系数。
与基于STFT的时间拉伸方法相同地,通过QMF变换而计算出的QMF系数,在调整相位信息的前期容易受到分析窗口函数的影响。在实施方式1中,通过下述3个步骤来实现向QMF系数的变换。
(1)分析窗口函数h(n)(窗口长度L)被变换为QMF区域用,由此计算QMF区域用的分析窗口函数H(v,k)(由L/M个时隙和M个子带构成)。
(2)利用下式将计算出的分析窗口函数H(v,k)进行简化。
[数式13]
(v=0,…,L/M-1)
(3)QMF分析滤波器组901根据X(m,k)=X(m,k)·H0(w)(其中,w=mod(m,L/M),mod()表示计算余数的运算),计算QMF系数。
如图2中的上段所示,原来的QMF系数是在L/M个时隙中,由以跳跃尺寸按照每1个时隙进行重叠而得到的L/M+1个QMF块构成。
调整电路902对调整之前的各个QMF块的相位信息进行调整,并构成新的QMF块,以便确实避免相位信息不连续。即,在将第μ个和第μ+1个QMF块进行重叠的情况下,需要确保新的QMF块的相位信息在μ·s样本点处的连续性(s表示拉伸系数)。在利用时域进行说明时,这相当于确保跳跃点μ·M·s(μ∈N)处的连续性。
调整电路902根据复数即QMF系数X(u,k)(时隙索引u=0、…、2L/M-1,子带索引k=0、1、…、M-1),计算调整之前的各个QMF块的相位信息φu(k)。如图2中的中段所示,调整电路902按照时隙从旧到新的顺序来运算各个QMF块,而生成新的QMF块。各个QMF块分别利用不同的图案示出。图2表示错开2时隙量的跳跃尺寸来进行处理的情况。
将第n个(n=1、…、L/M+1)新的QMF块的相位信息表述为ψu (n)(k)(时隙索引u=0、…、L/M-1,子带索引k=0、1、…、M-1)。新的相位信息ψu (n)(k)根据进行时间拉伸后的新的QMF块被重新配置在何处而不同。
在重新配置第1个QMF块X(1)(u,k)(u=0、…、L/M-1)时,假设该QMF块的新的相位信息ψu (1)(k)与调整之前的QMF块的相位信息φu(k)相同。即,根据ψu (1)(k)=φu(k)(u=0、…、L/M-1,k=0、1、…、M-1)来计算新的相位信息ψu (1)(k)。
第2个QMF块X(2)(u,k)(u=0、…、L/M-1)移动s时隙的跳跃尺寸来进行重新配置(图2表示2时隙的情况)。在这种情况下,块的前头的频率成分需要与第1个新的QMF块X(1)(u,k)的第s个时隙相连续。因此,使X(2)(u,k)的第1个时隙的频率成分与原来的QMF块的第2个时隙的频率成分一致。即,根据ψ0 (2)(k)=ψ0 (1)(k)+Δφ1(k)来计算新的相位信息ψ0 (2)(k)。
由于第1个时隙的相位信息发生变化,所以根据原来的QMF块的相位信息来调整剩余的相位信息。即,根据ψu (2)(k)=ψu-1 (2)(k)+Δφu+1(k)(u=0、…、L/M-1)来计算新的相位信息ψu (2)(k)。
其中,Δφu(k)表示根据Δφu(k)=φu(k)-φu-1(k)计算的、调整之前的QMF块的相位差。
调整电路902反复执行L/M+1次上述的流程,并生成调整之后的QMF块。即,根据式13和式14计算第m个(m=3、…、L/M+1)新的QMF块的调整之后的相位信息ψu (m)(k)。
ψ0 (m)(k)=ψ0 (m-1)(k)+Δφm-1(k) (式13)
ψu (m)(k)=ψu-1 (m)(k)+Δφm+u-1(k)(u=1、…、L/M-1)(式14)
调整电路902对新的QMF块的振幅信息使用原来的QMF块的振幅信息,由此能够计算新的QMF块的QMF系数。
调整电路902也可以对QMF区域的第偶数个子带和第奇数个子带利用不同的调整方法来调整相位信息。例如,对于谐波构造较强(音调较强)的音响信号,在QMF区域中,相位差信息(Δφ(n,k)=φ(n,k)-φ(n-1,k))因每个频率成分而不同。在这种情况下,调整电路902根据式15确定瞬时频率成分ω(n,k)。
[数式14]
其中,princarg(α)表示α的变换,并按照式16进行定义。
princarg(α)=mod(α+π,-2π)+π (式16)
mod(a,b)表示将a用b去除而得到的余数。
对以上内容进行汇总,根据式17计算上述的相位调整方法中的相位差信息Δφu(k)。
[数式15]
(式17)
另外,QMF合成滤波器组903也可以不对新的各个QMF块适用QMF合成处理,以便削减时间拉伸处理的运算量。取而代之,QMF合成滤波器组903对新的QMF块进行重叠相加,并对由此得到的信号适用QMF合成处理。
与基于STFT的拉伸处理相同地通过QMF变换而计算出的QMF系数,在进行重叠相加的前期容易受到合成窗口函数的影响。因此,与上述的分析窗口函数同样地,利用X(n+1)(u,k)=X(n+1)(u,k)·H0(w)(其中,w=mod(u,L/M))实现合成窗口函数。
在QMF变换中加法定理是成立的,所以全部的L/M+1个QMF块能够按照s时隙的跳跃尺寸进行重叠相加。重叠相加的结果即Y(u,k)可以根据式18计算得到。
Y(ns+u,k)=Y(ns+u,k)+X(n+1)(u,k)(n=0、…、L/M,u=1、…、L/M,k=0、1、…、M-1) (式18)
QMF合成滤波器组903通过对上述Y(u,k)适用QMF合成滤波器,能够生成进行时间拉伸后的最终的音响信号。能够对原来的信号实施s倍的时间拉伸处理,这能够根据Y(u,k)的时间索引u的范围得到明确。
如上述的式12所示,在实施方式1中,调整电路902在QMF区域中进行相位调整和振幅调整。如前面叙述的那样,QMF分析滤波器组901利用QMF滤波器将按照每时间单位而划分的音响信号逐次变换为QMF系数(QMF块)。并且,调整电路902调整各个QMF块的振幅和相位,以便对应于预先指定的拉伸率(s倍,例如s=2、3、4等)保持相邻的每个QMF块的相位和振幅的连续性。由此,实现相位声码器处理。
QMF合成滤波器组903将在QMF区域中进行相位声码器处理而得到的QMF系数,变换为时域的信号。由此,得到拉伸到s倍后的时域的音响信号。并且,也存在通过时间拉伸处理的后期的信号处理得到更好的QMF系数的情况。例如,也可以对在QMF区域中进行相位声码器处理而得到的QMF系数,实施基于SBR技术的频带扩大处理等某种音响处理。并且,QMF合成滤波器组903也可以采取在后期的信号处理之后变换为时域的音响信号的结构。
图3所示的结构是这种组合的一例。这是将QMF区域的相位声码器处理和音响信号的频带扩大技术相结合的音响解码装置的一例。下面,说明采用相位声码器处理的音响解码装置的结构。
分离部1201将输入的比特流分离为高频带生成用的参数和低频带解码用的编码信息。参数解码部1207对高频带生成用的参数进行解码。解码部1202根据低频带解码用的编码信息,对低频带成分的音响信号进行解码。QMF分析滤波器组1203将被解码后的音响信号变换为QMF区域的音响信号。
频率调制电路1205和时间拉伸电路1204对QMF区域的音响信号实施所述相位声码器处理。然后,高频带生成电路1206使用高频带生成用的参数来生成高频带频率成分的信号。概略形状调整电路1208对高频带成分的频率概略形状进行调整。QMF合成滤波器组1209将QMF区域中的低频带成分和高频带成分的音响信号变换为时域的音响信号。
另外,在上述低频带成分的编码处理或者解码处理中可以采用MPEG-AAC方式、MPEG-Layer3等音响编码方式,或者也可以采用ACELP等声音编码方式。
并且,调整电路902当在QMF区域中进行相位声码器处理时,在根据式12计算调整之后的QMF系数时,也可以对QMF块的每个子带索引进行加权运算。由此,调整电路902也能够利用具有不同的值的调制系数按照每个子带索引进行调制。例如,在与高频带频率对应的子带索引中,具有在进行拉伸时畸变增大的音响信号。调整电路902也可以使用减小这种音响信号的调制参数。
另外,作为在QMF区域中进行相位声码器处理的另一种结构,音响信号处理装置也可以在QMF分析滤波器组901的后面还设置另外的QMF分析滤波器组。存在只采用QMF分析滤波器组901时低频带的频率分辨率较低的情况。在这种情况下,即使对包括较多低频带成分的音响信号实施相位声码器处理,也不能得到充足的效果。
因此,为了提高低频带成分的频率分辨率,可以采用用于分析低频带部分(例如,QMF分析滤波器组901的输出中包含的全部QMF块的一半)的另外的QMF分析滤波器组。由此,频率分辨率提高为2倍。在此基础上,调整电路902实施上述的QMF区域的相位声码器处理。由此,在保持音质的状态下,运算量以及存储器消耗量的削减效果提高。
图4是表示提高QMF区域的分辨率的结构示例的图。QMF合成滤波器组2401利用QMF合成滤波器暂且将输入的音响信号合成。然后,QMF分析滤波器组2402利用2倍析像度的QMF分析滤波器计算QMF系数。针对达到2倍分辨率的QMF区域的信号进行2倍的时间拉伸、和进行2倍或3倍或4倍的基音位移处理,这种相位声码器处理电路(第1时间拉伸电路2403、第2时间拉伸电路2404和第3时间拉伸电路2405)可以并列构成。
并且,各个相位声码器处理电路统一按照2倍析像度进行拉伸比例不同的相位声码器处理。并且,合并电路2406将通过相位声码器处理而得到的信号进行合成。
基于QMF滤波器的相位声码器处理如以上所明确的那样,与基于STFT的相位声码器处理相比,不需要采用运算量较大的FFT处理。因此,具有能够大幅削减运算量的显著效果。
(实施方式2)
关于实施方式2,说明将实施方式1记载的基于块的时间轴拉伸方法进行扩展的方式。实施方式2的音响信号处理装置具有与图1所示的实施方式1的音响信号处理装置相同的构成要素。并且,利用下述的两种方法进行相位信息的计算,以便避免上述的相位信息的不连续的影响。
(a)调整电路902调整相位信息,以使在调整之后的QMF块中相重叠的时隙的相位信息在块之间是连续的。即,调整电路902根据ψ0 (m)(k)=ψ0 (m-1)(k)+Δφm-1(k)来调整相位信息。
(b)调整电路902调整相位信息,以使在调整之后的各个QMF块中在块内相连续的时隙之间,相位信息是连续的。即,调整电路902根据ψu (m)(k)=ψu-1 (m)(k)+Δφm+u-1(k)(其中,u=1、…、L/M-1)来调整相位信息。
在上述的相位信息的调整方法中,假设对应于音调较强的成分,相位信息相对于调整之前的QMF块发生变化。
但是,实际上,上述的假设不一定始终正确。代表性的是,在原来的信号是音响上的瞬变性信号的情况下,上述的假设不正确。当在时域中具有尖锐的攻击音响的情况下等,瞬变信号是非稳定形式的信号。通过对相位信息和频率成分之间假设固定的关系,可以得知以下事项。即,在离散性地包含大量的音调较强的成分,而且在较短的时间间隔的期间包含间隔较宽的频率成分的情况下,很难对瞬变信号进行处理。结果,导致通过规整处理而生成具有能够察觉到的音响畸变的输出信号。
在实施方式2中,为了应对在对包含许多瞬变信号的信号进行拉伸处理时产生的上述问题,将伴随有实施方式1的相位信息的调整的时间规整处理,变形为能够应对音调较强的信号和瞬变信号双方的时间规整处理。
首先,调整电路902在QMF区域中检测瞬变信号中包含的瞬变成分,以便去除有可能成为潜在问题的时间规整处理。
检测瞬变状态的方法有各种方法,并且已经在许多文献中公开。在实施方式2中公开了检测QMF块中的瞬变响应的两个简单方法。
图5A是说明对通过QMF变换而计算出的QMF块X(u,k)(2L/M个时隙、M个子带)进行时间拉伸的情况的说明图。第一个方法是根据所述每个QMF块的能量值的变化来检测瞬变状态的方法,第二个方法是在频率轴上检测每个QMF块的振幅值的变化的方法。
第一个检测方法如下所述。调整电路902按照图5B所示,对各个QMF块的每个时隙计算能量值E0~E2L/M1。图5C是表示每个子带的能量值的图。调整电路902对每个时隙计算能量值的差分,并设为dEu=Eu+1-Eu(其中,u=0、…、2L/M-2)。根据规定的阈值T0,在下式成立的情况下,
[数式16]
在第i个时隙中检测到瞬变成分。
第二个检测方法如下所述。在QMF块中包含的所有时隙和子带的振幅是A(u,k)的情况下,对各个时隙计算振幅信息的概略形状,并利用下式表示。
[数式17]
(其中,u=0,…,2L/M-1)
根据规定的阈值T1和T2,在Fi>T1且下式成立的情况下,
[数式18]
在第i个时隙中检测到瞬变成分。
假设当在第u0个时隙中检测到瞬变成分的情况下,对包括第u0个时隙在内的新的QMF块修改上述的相位信息的拉伸处理。
拉伸处理的修改具有两个目的。一个目的在于,在任意的相位信息拉伸处理中避免第u0个时隙的处理。另一个目的在于,假设在第u0个时隙没有进行任何处理即旁通通过的情况下,保持QMF块内和QMF块之间的连续性。为了达到这两个目的,按照下面所述来修改前述的相位信息拉伸处理。
在第m个新的QMF块(m=2、…、L/M+1)中,其相位ψu (m)(k)如下所述。
(a)在m<u0<m+L/M-1的情况下,为了确保QMF块内的相位信息的连续性,根据下式计算相位ψu (m)(k)(图6A)。
[数式19]
(b)在m=u0而且mod(u0,s)=0的情况下,为了从任意的相位信息处理中避免第u0个时隙的处理,根据下式计算相位ψ0 (m)(k)(图6B)。
[数式20]
并且,为了确保QMF块之间的相位信息的连续性,根据下式计算相位ψ1 (m)(k)。
[数式21]
(c)在m=u0而且mod(u0,s)≠0的情况下,为了从任意的相位信息处理中避免第u0个时隙的处理,根据下式计算相位ψ0 (m)(k)(图6C)。
[数式22]
并且,为了确保QMF块之间的相位信息的连续性,根据下式计算相位ψ1 (m)(k)。
[数式23]
实际上,从音响方面考虑,在大多情况下不期望进行上述的针对瞬变信号的拉伸处理。也可以是,调整电路902不对瞬变信号进行拉伸处理,而是在从QMF块中去除瞬变信号成分的基础上进行拉伸处理,再针对已进行拉伸处理的QMF块将刚刚被去除的瞬变信号恢复。
图7A和图7B表示上述的处理。在此,说明在对通过QMF变换而计算出的QMF块信号X(u,k)(假设具有L/M个时隙和M个子带)进行时间拉伸的情况下,利用上述的瞬变信号检测方法在第u0个时隙中检测到瞬变信号的情况。按照下面的步骤来执行各个块的时间拉伸。
(1)调整电路902从QMF块中去除第u0个时隙成分,对所取出的第u0个时隙填充“0”,或者进行“内插”处理。
(2)调整电路902按照上述拉伸方法,将新的QMF块的信号拉伸成为s·L/M个时隙。
(3)调整电路902将在上述(1)被去除的时隙的信号插入到在上述(2)被拉伸的块的位置(第s·u0个时隙的位置)。
在此,上述方法是第s·u0个时隙不是针对瞬变响应成分的合适位置时的简单示例。这是因为QMF变换的时间分辨率较低。
为了实现更高音质的时间拉伸电路,需要对上述的简单示例进行扩展。并且,需要瞬变响应成分的准确位置。实际上,QMF区域的几个信息、例如振幅信息和相位推移信息等,对确定瞬变响应成分的准确位置比较有用。
优选通过分别检测各个QMF块的信号的振幅成分和相位推移信息的两个步骤,来确定瞬变响应成分的位置(下面称为瞬变位置)。对只在t0时刻具有脉冲成分的情况进行说明。脉冲成分是瞬变响应成分的代表性示例。
首先,调整电路902在QMF区域中计算各个QMF块的振幅信息,由此进行瞬变位置t0的大致推定。
在考虑上述的QMF变换的步骤时,可知如下事项。即,为了进行分析窗口处理,脉冲成分对QMF区域的多个时隙都产生影响。通过分析这些时隙的振幅值的分布,可知存在以下两种情况。
(1)在第n0个时隙具有更高的能量(振幅值的平方)的情况下,调整电路902将瞬变位置t0推定为(n0-5)·64-32<t0<(n0-5)·64+32。
(2)在第n0-1个时隙和第n0个时隙具有大致相同的能量的情况下,调整电路902将瞬变位置t0推定为t0=(n0-5)·64-32。
(n0-5)表示经由QMF分析滤波器组901使延迟5个时隙量。并且,在上述(2)的情况下,调整电路902只通过振幅分析即可准确确定瞬变位置。
并且,在上述(1)的情况下,调整电路902使用QMF区域的相位信息,能够更加高效率地确定瞬变位置t0。
下面,说明对第n0个时隙内的相位信息φ(n0,k)(k=0、1、…、M-1)进行分析的情况。以2π进行巡回(round)的相位信息φ(n0,k)的推移比例,在瞬变位置t0、与和瞬变位置t0最近的左侧(在时间上是过去)的时隙或者第n0个时隙的中间位置之间,必须具有完全线性关系。即,k·Δt=C0-g0成立。其中,相位推移比例利用下式表示。
[数式24]
unwrap(P)表示使弧度相位P以2π进行巡回,并修改π以上的变化的函数。C0表示常数。
Δt表示瞬变位置t0与和瞬变位置t0最近的左侧(在时间上是过去)的时隙或者第n0个时隙之间的距离。即,根据式19计算Δt。
[数式25]
(式19)
上述的参数示例是指诸如利用式20表示的值。
[数式26]
(式20)
图8是表示瞬变位置t0与QMF相位推移比例g0之间的线性关系的图。如图8所示,只要n0(能量最高的时隙的索引)固定,t0和g0就一对一对应。
根据上述情况来说明另一个示例。该示例是当在QMF区域中进行时间拉伸处理的期间对瞬变成分进行处理的方法。与上述的简单方法相比,本方法在以下方面具有优点。即,本方法能够准确检测原来信号的瞬变位置。并且,本方法能够检测已进行时间拉伸的瞬变成分所存在的时隙、和合适的相位信息。下面详细说明本方法。另外,本方法的步骤在图9中以流程图的形式示出。
QMF分析滤波器组901接受所输入的时间信号x(n)(S2001)。QMF分析滤波器组901根据作为时间拉伸的对象的时间信号x(n),计算QMF块X(m,k)(S2002)。在此,将X(m,k)的振幅设为r(m,k),将相位信息设为φ(m,k)。在该QMF块包含瞬变成分的信号的情况下,最佳的时间拉伸方法如下所述。
(a)调整电路902根据能量分布,根据式21检测瞬变信号存在的时隙m0(S2003)。
[数式27]
(式21)
(b)调整电路902估计瞬变响应存在的时隙中、瞬变响应明显的时隙的相位推移比例,并利用下式表示(S2004)。
[数式28]
即,调整电路902推定时隙的相位角ω0和相位推移比例,并利用下式表示。
[数式29]
(c)调整电路902根据式(22)计算多项式残差。
[数式30]
(d)调整电路902根据式(23)确定瞬变位置t0(S2005)。
[数式31]
其中,常数K为K=0.0491。
(e)调整电路902根据式(23)确定处于瞬变状态的区域(S2006)。
[数式32]
(式24)
调整电路902使用标量值,按照式25使QMF系数在处于瞬变状态的区域内减小(S2007)。
[数式33]
(式25)
α是较小的值,例如α=0.001。
(f)调整电路902对没有处于瞬变状态的QMF块实施通常的时间拉伸处理(S2008)。
(g)调整电路902按照下面所述计算瞬变位置s·t0的新的时隙和相位推移比例。
<i>调整电路902根据m1=ceil((s·t0-32)/64)+5,计算已进行时间拉伸的时隙索引m1(S2009)。其中,ceil是指取最接近的整数的处理。
<ii>调整电路902根据式26计算瞬变位置与和新的时隙最近的左侧(在时间上是指过去)的位置之间的距离。
Δt1=s·t0-(m1-5)·64+32 (式26)
<iii>调整电路902根据式27计算新的相位推移比例。
[数式34]
(h)调整电路902对瞬变响应明显的时隙m1的QMF系数进行重新合成。
时隙m1的振幅继承了拉伸前的时隙m0的振幅。调整电路902根据新的相位推移比例和相位差,根据式28计算相位信息(S2010)。
[数式35]
并且,调整电路902根据式29计算新的QMF系数(S2011)。
[数式36]
(i)调整电路902根据式30确定新的瞬变区域(S2013)。
[数式37]
(式30)
(j)在利用下式表示的重新确定的瞬变区域中包含多个时隙的情况下,
[数式38]
调整电路902根据式31重新调整这些时隙的相位(S2015)。
[数式39]
(式31)
并且,调整电路902对于由这样进行调整后的时隙构成的QMF块系数,根据式32进行重新合成。
[数式40]
(式32)
最后,调整电路902输出已进行时间拉伸处理的QMF块(S2012)。
从运算量方面考虑,为了检测瞬变位置而执行的上述(a)~(d),也可以直接利用时域的瞬变响应检测方法置换。例如,用于在时域中检测瞬变位置的瞬变位置检测部(未图示)配置在QMF分析滤波器组901的前面。并且,时域的瞬变响应检测方法的代表性步骤如下所述。
(1)瞬变位置检测部将时间信号x(n)(n=0、1、…、N·L0-1)分割为长度L0的N个区段。
(2)瞬变位置检测部计算各个区段的能量,并利用下式表示。
[数式41]
(3)瞬变位置检测部按照Elt(i)=α·Elt(i-1)+(1-α)·Es(i),计算整体区段的能量。
(4)如果Es(i)/Elt(i)>R1、Es(i)>R2,瞬变位置检测部判定第i个区段是包括瞬变响应成分的瞬变区段。其中,R1和R2表示规定的阈值。
(5)瞬变位置检测部根据t0=(i+0.5)·L0,计算瞬变区段的正中间的位置,作为最终的瞬变位置的估算位置。
如果采用时域的瞬变成分检测,则图9的流程图按照图10所示进行变更。
另外,也可以与实施方式1相同地将实施方式2的音响信号处理与QMF区域的另外的音响处理进行组合。例如,QMF分析滤波器组901利用QMF滤波器将按照每单位时间而划分的音响信号逐次变换为QMF系数(QMF块)。并且,调整电路902调整各个QMF块的振幅和相位,以便对应于预先指定的拉伸率(s倍,例如s=2、3、4等)保持相邻的每个QMF块的相位和振幅的连续性。由此,实现相位声码器处理。
QMF合成滤波器组903将在QMF区域中进行相位声码器处理而得到的QMF系数,变换为时域的信号。由此,得到拉伸到s倍后的时域的音响信号。并且,也存在通过时间拉伸处理的后期的信号处理得到更好的QMF系数的情况。例如,也可以对在QMF区域中进行相位声码器处理而得到的QMF系数,实施基于SBR技术的频带扩大处理等某种音响处理。并且,QMF合成滤波器组903也可以采取在后期的信号处理之后变换为时域的音响信号的结构。
图3所示的结构是这种组合的一例。这是将QMF区域的相位声码器处理和音响信号的频带扩大技术相结合的音响解码装置的一例。下面,说明采用相位声码器处理的音响解码装置的结构。
分离部1201将输入的比特流分离为高频带生成用的参数和低频带解码用的编码信息。参数解码部1207对高频带生成用的参数进行解码。解码部1202根据低频带解码用的编码信息,对低频带成分的音响信号进行解码。QMF分析滤波器组1203将被解码后的音响信号变换为QMF区域的音响信号。
频率调制电路1205和时间拉伸电路1204对QMF区域的音响信号实施所述相位声码器处理。然后,高频带生成电路1206使用高频带生成用的参数来生成高频带频率成分的信号。概略形状调整电路1208对高频带成分的频率概略形状进行调整。QMF合成滤波器组1209将QMF区域中的低频带成分和高频带成分的音响信号变换为时域的音响信号。
另外,在上述低频带成分的编码处理或者解码处理中可以采用MPEG-AAC方式、MPEG-Layer3等音响编码方式,或者也可以采用ACELP等声音编码方式。
另外,作为在QMF区域中进行相位声码器处理的另一种结构,音响信号处理装置也可以在QMF分析滤波器组901的后面还设置另外的QMF分析滤波器组。存在只采用QMF分析滤波器组901时低频带的频率分辨率较低的情况。在这种情况下,即使对包括较多低频带成分的音响信号实施相位声码器处理,也不能得到充足的效果。
因此,为了提高低频带成分的频率分辨率,可以采用用于分析低频带部分(例如,QMF分析滤波器组901的输出中包含的全部QMF块的一半)的另外的QMF分析滤波器组。由此,频率分辨率提高为2倍。在此基础上,调整电路902实施上述的QMF区域的相位声码器处理。由此,在保持音质的状态下,运算量以及存储器消耗量的削减效果提高。
图4是表示提高QMF区域的分辨率的结构示例的图。QMF合成滤波器组2401利用QMF合成滤波器暂且将输入的音响信号合成。然后,QMF分析滤波器组2402利用2倍析像度的QMF分析滤波器计算QMF系数。针对达到2倍分辨率的QMF区域的信号进行2倍的时间拉伸、和进行2倍或3倍或4倍的基音位移处理,这种相位声码器处理电路(第1时间拉伸电路2403、第2时间拉伸电路2404和第3时间拉伸电路2405)可以并列构成。
并且,各个相位声码器处理电路统一按照2倍析像度进行拉伸比例不同的相位声码器处理。并且,合并电路2406将通过相位声码器处理而得到的信号进行合成。
另外,实施方式2的音响信号处理装置也可以具有如下结构。
调整电路902也可以根据输入的音响信号的音调(音响谐波构造的大小)和音响信号的瞬变特性进行灵活调整。调整电路902也可以通过对QMF区域的系数检测瞬变信号来调整相位信息。也可以是,调整电路902以确保相位信息的连续性、而且使QMF区域的系数的瞬变信号成分不变化的方式,调整相位信息。也可以是,调整电路902将与避免了时间规整的瞬变信号成分相关联的QMF系数,恢复为对瞬变信号成分进行解压缩或者压缩而得到的QMF系数,由此调整相位信息。
音响信号处理装置还可以具有:检测部,检测输入信号的瞬变特性;以及衰减器,进行削弱由检测部检测到的瞬变成分的处理。衰减器被设于进行相位调整的前段。调整电路902在进行时间拉伸处理之后,对实施了削弱处理的瞬变成分进行扩展。衰减器也可以调整频域的系数的振幅值,由此削弱瞬变成分。
也可以是,调整电路902对于已进行时间拉伸的瞬变成分,使其增加频域的振幅,并调整相位,由此对已进行时间拉伸的瞬变成分进行扩展。
(实施方式3)
实施方式3的音响信号处理装置对所输入的音响信号进行QMF变换,并对QMF系数进行相位调整和振幅调整,由此实现时间拉伸和频率调制处埋。
实施方式3的音响信号处理装置具有与图1所示的实施方式1的音响信号处理装置相同的构成要素。QMF分析滤波器组901将输入的音响信号变换为QMF系数X(m,n)。调整电路902对QMF系数进行调整。使用振幅和相位,利用式33来表述调整前的QMF系数X(m,n)。
[数式42]
X(m,n)=r(m,n)·exp(j·a(m,n)) (式33)
调整电路902将相位信息a(m,n)调整为如下式所示。
[数式43]
调整电路902根据调整后的相位信息和原来的振幅信息r(m,n),根据式34计算新的QMF系数。
[数式44]
(式34)
最后,QMF合成滤波器组903将根据式34计算出的新的QMF系数变换为时间信号。另外,实施方式3的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理。
与实施方式1的不同之处是如图11所示,在时间拉伸系数是s的情况下,在原来的QMF区域的时隙的后面插入(s-1)个假想时隙。
在这种情况下,调整电路902需要维持原来的音响信号的基音。并且,调整电路902需要计算相位信息,以便避免听觉上的音质恶化。例如,在将原来的QMF块的相位信息设为φn(k)时(时隙索引n=1、…、L/M,子带索引k=0、1、…、M-1),调整电路902根据式35计算上述假想时隙的调整后的新的相位信息。
ψq(k)=ψq-1(k)+Δφn(k)
(q=s·(n-1)+1、…、s·n,n=1、…、L/M) (式35)
在此,与实施方式1同样地,根据Δφn(k)=φn(k)-φn-1(k)计算相位差Δφn(k)。
并且,也根据式36计算相位差Δφn(k)。
[数式45]
所插入的时隙的振幅信息是利用对前一个时隙与后一个时隙之间进行线性插补(内插)的值构成的,以便使其在所插入的边界处是连续的。例如,在将原来的QMF块设为an(k)时,根据式37对所插入的假想时隙的振幅信息进行线性插补。
[数式46]
(式37)
(q=s·(n-1)+1,…,s·n、n=1,…,L/M)
QMF合成滤波器组903将通过这样插入假想时隙而构成的新的QMF块,与实施方式1相同地变换为时域的信号。由此,计算已进行时间拉伸的信号。另外,如上所述,实施方式3的音响信号处理装置也可以不实施QMF合成滤波器组,而将新的QMF系数直接输出给后面的音响信号处理装置。
实施方式3的音响信号处理装置也不采用FFT运算,与基于STFT的相位声码器处理相比,能够以相当少的运算量实现相同的效果。
(实施方式4)
实施方式4的音响信号处理装置对所输入的音响信号进行QMF变换,并对QMF系数进行相位调整。并且,实施方式4的音响信号处理装置按照每个子带来处理原来的QMF块,由此实现时间拉伸处理。
实施方式4的音响信号处理装置具有与图1所示的实施方式1的音响信号处理装置相同的构成要素。QMF分析滤波器组901将输入的音响信号变换为QMF系数X(m,n)。调整电路902对QMF系数进行调整。使用振幅和相位,利用式38来表述调整前的QMF系数X(m,n)。
[数式47]
X(m,n)=r(m,n)·exp(j·a(m,n)) (式38)
调整电路902将相位信息a(m,n)调整为如下式所示。
[数式48]
调整电路902利用调整后的相位信息和原来的振幅信息r(m,n),根据式39计算新的QMF系数。
[数式49]
(式39)
最后,QMF合成滤波器组903将根据式39计算的新的QMF系数变换为时间信号。另外,实施方式4的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理等。
QMF变换具有将所输入的音响信号变换为具有时间特性的合成频域的作用。因此,基于STFT的时间拉伸方法能够适用于QMF块的时间特性。
与实施方式1的不同之处是如图12所示,按照每个子带对原来的QMF块进行时间拉伸。
原来的QMF块由L/M个时隙和M个子带构成。各个QMF块由M个标量值构成,各个标量值利用L/M个系数构成时间经过信息。
在实施方式4中,基于STFT的时间拉伸方法直接适用于各个子带的标量值。即,调整电路902连续地对各个子带的标量值进行FFT变换,并调整相位信息,执行逆FFT。由此,调整电路902计算新的子带的标量值。另外,由于是对每个子带执行该时间拉伸处理,所以运算量不会增大。
例如,在时间拉伸系数是2的情况下(将音响信号拉伸为2倍时间的情况下),调整电路902按照每个跳跃尺寸Ra反复执行上述的处理。结果,实现诸如使原来的QMF块的子带包括2·L/M个系数的时间拉伸。调整电路902通过反复执行上述的步骤,能够将原来的QMF块变换为2倍长度的QMF块。
QMF合成滤波器组903将这样得到的新的QMF块合成为时间信号。由此,实施方式4的音响信号处理装置能够对原来的时间信号进行时间拉伸使成为具有原来的2倍长度的时间信号。另外,在此,把实施方式4的音响信号处理方法称为基于子带的时间拉伸方法。
以上,根据多个实施方式说明了采用三种不同的方法的时间拉伸处理。表1是对这些方法的运算量(复杂性评价:Complexity Measurement)的大小进行整理得到的比较表。
[表1]
可知相比经典的基于STFT的时间拉伸方法,三种时间拉伸方法的运算量都非常少。这是因为基于STFT的时间拉伸方法进行在内部循环的处理。而基于QMF的方法不进行这种循环处理。
(实施方式5)
实施方式5实现与实施方式1~4相同的QMF区域的时间拉伸。不同之处是如图13所示在QMF区域中对QMF系数进行调整。
QMF分析滤波器组1101将输入音响信号变换为QMF系数,以便实现时间规整和频率调制这双方。并且,调整电路1002与实施方式1~4相同地进行所得到的QMF系数的相位调整。
并且,QMF区域变换器1003将调整后的QMF系数变换为新的QMF系数。带通滤波器1004根据需要,在QMF区域中实施频带限制。在降低折返畸变时需要频带限制。最后,QMF合成滤波器组1005将新的QMF系数变换为时域的信号。
另外,实施方式5的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理等。以上是实施方式5的概要。
图14所示的结构是这样一种结构,通过对QMF区域的相位和振幅进行变换处理,实现作为对象的音响信号的时间规整处理和频率调制处理。
首先,QMF分析滤波器组1801将音响信号变换为QMF系数,以便实现时间规整和频率调制这双方。频率调制电路1803针对这样得到的QMF系数,在QMF区域中实施频率调制处理。带通滤波器即频带限制滤波器1802有时在频率调制处理之前进行频带限制,以便去除折返畸变。
并且,频率调制电路1803对多个QMF块连续地适用相位变换处理和振幅变换处理,由此进行频率调制处理。并且,时间拉伸电路1804进行通过频率调制处理而生成的QMF系数的时间规整处理。利用与实施方式1等相同的方法实现时间规整处理。
另外,以上记述了频率调制电路1803和时间拉伸电路1804按照顺序进行连接的结构,但这些电路的连接顺序不限于此。即,也可以是,在时间拉伸电路1804执行时间规整处理之后,频率调制电路1803执行频率调制处理。
最后,QMF合成滤波器组1805将通过实施频率调制处理和时间规整处理而得到的QMF系数,变换为新的音响信号。新的音响信号是在时间轴方向和频率轴方向相比原来的音响信号进行规整后的信号。
另外,图14所示的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理等。
在实施方式1~4中示出了时间拉伸方法。实施方式5的音响信号处理装置的结构是在这些实施方式的音响信号处理装置的结构基础上,追加了基于基音拉伸处理的频率调制处理。用于将时间或者频率调整为理想状态的方法有几种方法。但是,经典的基音拉伸处理、即对通过进行时间拉伸而得到的信号进行重新取样(采集)的方法,不能直接适用于频率调制处理。
图14所示的音响信号处理装置在QMF分析滤波器组1801的处理之后,在QMF区域上实现基音拉伸处理。通过QMF分析滤波器组1801的处理,时域的规定的信号成分(特定频率的正弦波成分)成为两个不同的QMF子带的信号。因此,以后很难从一个QMF系数块中分离出有关频率和振幅双方的正确的信号成分,也很难进行基音变换。
因此,实施方式5的音响信号处理装置也可以畸变为先执行基音拉伸处理的结构。即,如图15所示,在QMF分析滤波器组的前面,对时域的输入信号进行重新取样。在图15中,重新取样部500对音响信号进行重新取样,QMF分析滤波器组504将音响信号变换为QMF系数,时间拉伸电路505对QMF系数进行调整。
图15所示的重新取样部500由下述的三个模块构成。即,重新取样部500具有(1)M倍的向上取样部501、(2)抑制折返畸变的低通滤波器502、和(3)D倍的向下取样部503。即,在QMF分析滤波器组504的处理之前,重新取样部500对输入的原来信号进行重新取样使之成为系数M/D倍。这样,重新取样部500将全体的QMF区域的频率成分设为M/D倍。
在需要多次基音拉伸处理的情况下,例如,在需要2倍和3倍这两种基音拉伸处理的情况下,最好是进行如下所述的处理。为了对不同倍率的重新取样处理进行整合,需要对应各个重新取样处理具有不同的延迟量的多个延迟电路。在将通过2倍或者3倍的基音拉伸处理而得到的输出信号进行合成之前,这些延迟电路实施时间调整。
下面,说明通过使包含低频带的信号进行2倍或者3倍的基音拉伸处理,而对频带进行扩展的情况。为了实现该目的,音响信号处理装置首先实施重新取样处理。图16A是表示基音拉伸处理的输出的图。图16A的纵轴表示频率轴,横轴表示时间轴。
音响信号处理装置通过重新取样处理,生成包含低频带的信号(图16A中最粗的黑线)的2倍(图16A中粗的黑线)以及3倍(图16A中细的黑线)基音拉伸处理后的信号。如果在时域中产生偏差,2倍的基音拉伸处理信号具有d0时间的延迟时间,3倍的基音拉伸处理信号具有d1时间的延迟时间。
音响信号处理装置为了得到高频带的信号,分别对原来的信号、具有2倍的频带的信号以及具有3倍的频带的信号进行时间拉伸为2倍、3倍和4倍。结果,音响信号处理装置能够生成这些信号的合成信号作为如图16B所示的高频带的信号。
另外,在产生时间偏差的情况下,如图16C所示,延迟量的不一致也被直接进行基音拉伸,因而有时在高频带信号中产生延迟量不一致的问题。上述的多个延迟电路进行时间调整,由此降低时间偏差。
也可以直接执行上述的重新取样方法。但是,为了进一步削减上述处理的运算量,低通滤波器502也可以利用多相滤波器组实现。在低通滤波器502的次数较高的情况下,也可以根据卷积原理在FFT区域中实现低通滤波器502,以便削减运算量。
另外,在M/D<1.0的情况下,即基音通过基音拉伸处理而变高的情况下,后面的QMF分析滤波器组504和时间拉伸电路505的运算量将大于重新取样处理所需要的处理量。因此,将时间拉伸和重新取样处理的顺序置换,由此削减运算量。
并且,在图15中,重新取样部500被设于QMF分析滤波器组504的前面。这是为了将在对特定音源(例如单一正弦波等)实施基音拉伸处理时产生的音质恶化抑制在最小限度。当在QMF分析滤波器组504的处理之后实施基音位移处理的情况下,成为原来的音响信号中包含的正弦波信号被分离为多个QMF块的状态。因此,在对该信号实施了基音位移处理的情况下,会导致原来的正弦波信号扩散到多个QMF块中。
即,按照上述的结构对单一正弦波等特殊音源进行重新取样处理比较好。但是,在通常的音响信号的基音位移处理中只输入单一正弦波,基本上等于没有。因此,也可以省略成为运算量的增大原因的重新取样处理。
并且,音响信号处理装置也可以构成为对由QMF分析滤波器组504得到的QMF系数直接实施基音拉伸处理。在这种情况下,已进行基音拉伸处理的音响信号的质量有时在单一正弦波等特殊音源中会变差一些。但是,具有这种结构的音响信号处理装置能够对除此之外的通常的音响信号保持足够好的质量。鉴于这种情况,通过省略重新取样处理,能够省略处理量非常大的处理部。因此,能够削减整体处理量。
并且,音响信号处理装置也可以根据应用用途,利用适当的组合而构成。
(实施方式6)
实施方式6的音响信号处理装置与实施方式5相同地进行QMF区域的时间规整和频率调制处理。在实施方式6中,不采用在实施方式5中采用的重新取样处理,这一点与实施方式5不同。实施方式6的音响信号处理装置具有图13所示的音响信号处理装置的构成要素。
图13所示的音响信号处理装置进行时间规整处理和频率调制处理这两种处理。因此,QMF分析滤波器组1001将音响信号变换为QMF系数。并且,调整电路1002按照实施方式1~4记述的那样,对所得到的QMF系数进行相位调整。
并且,QMF区域变换器1003将调整后的QMF系数变换为新的QMF系数。带通滤波器1004根据需要,在QMF区域中进行频带限制。在降低折返畸变时需要频带限制。最后,QMF合成滤波器组1005将新的QMF系数变换为时域的信号。
另外,实施方式6的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理等。以上是实施方式6的整体结构。
关于基于基音拉伸处理的频率调制处理,实施方式6的音响信号处理装置进行与实施方式5不同的处理。
为了通过对基音进行规整来实现频率调制处理,对时域的音响信号进行重新取样的方法是非常简单的。但是,在结构上需要为了抑制折返畸变所需的低通滤波器。因此,通过低通滤波器而产生延迟。通常,为了提高重新取样处理的精度,需要次数较大的低通滤波器。另一方面,在次数较大时,滤波器的延迟增大。
因此,图17所示的实施方式6的音响信号处理装置具有在QMF区域中对系数的结构进行变换的QMF区域变换器603。并且,通过QMF区域变换器603执行与重新取样处理不同的基音位移处理。
QMF分析滤波器组601根据输入的时间信号计算QMF系数。与实施方式1~5相同地,时间拉伸电路602对计算出的QMF系数进行时间拉伸。QMF区域变换器603对已进行时间拉伸的QMF系数实施基音拉伸处理。
如图18所示,QMF区域变换器603不需重新利用QMF合成滤波器和QMF分析滤波器,即可将某个QMF区域的QMF系数直接变换为频率和时间的分辨率都不同的另外的QMF区域的QMF系数。如图18所示,QMF区域变换器603将由M个子带和L/M个时隙构成的某个QMF块,变换为由N个子带和L/N个时隙构成的新的QMF块。
QMF区域变换器603能够改变时隙数和子带数。并且,该输出信号的时间和频率的分辨率相对于输入信号被变更。因此,为了同时实现时间拉伸处理和基音拉伸处理这两种处理,需要计算新的时间拉伸系数。例如,将期望的时间拉伸系数设为s,将期望的基音拉伸系数设为w,根据下式计算新的时间拉伸系数。
[数式50]
图17是表示实现时间拉伸处理和基音拉伸处理这两种处理的结构的图。另外,图17所示的音响信号处理装置是按照时间拉伸处理(时间拉伸电路602)和基音拉伸处理(QMF区域变换器603)的顺序构成的。但是,音响信号处理装置也可以构成为先进行基音拉伸处理,然后进行时间拉伸处理。在此,假设有L个输入样本。
QMF分析滤波器组601根据L个样本,计算由M个子带和L/M个时隙构成的QMF块。时间拉伸电路602根据这样计算出的QMF块的各个QMF系数,计算由M个子带和下式所示个数的时隙构成的QMF块。
[数式51]
最后,QMF区域变换器603将已被拉伸的QMF块变换为由w·M个子带和s·L/M个时隙构成的另外的QMF块(在w>1.0的情况下,最小的M个子带成为最终的输出信号)。
QMF区域变换器603的处理相当于对QMF合成滤波器组和QMF分析滤波器组的运算处理进行数学压缩。音响信号处理装置构成为在使用QMF合成滤波器组和QMF分析滤波器组进行运算的情况下,在内部包含延迟电路。与此相比,具有QMF区域变换器603的音响信号处理装置能够削减运算延迟和运算量。例如,音响信号处理装置在将子带索引为Sk(k=0、…、M-1)的子带变换成子带索引为S1(1=0、…、wM-1)的情况下,执行式40的计算。
[数式52]
Sl=QMF_ANAwM(QMF_SYNM(Sk,PM),PwM)
(式40)
=QMF_convert(Sk,PM,PwM)
其中,PM和PwM分别表示QMF分析滤波器组和QMF合成滤波器组的原型函数。
下面,说明基音位移处理的另一个示例。与以上叙述的基音位移处理不同,音响信号处理装置按照下面所述进行处理。
(a)音响信号处理装置检测拉伸处理前的QMF块中包含的信号的频率成分。
(b)音响信号处理装置利用规定的变换系数对频率进行位移。进行频率位移用的简单方法是将所述变换系数与输入信号的基音相乘的方法。
(c)音响信号处理装置构成期望的位移频率成分的新的QMF块。
音响信号处理装置针对通过QMF变换而计算出的QMF块,根据式41计算信号的频率成分ω(n,k)。
[数式53]
其中,princarg(α)表示α的基础频率。并且,Δφ(n,k)是指Δφ(n,k)=φ(n,k)-φ(n-1,k),表示同一子带k中的两个QMF成分的相位差。
使用变换系数P0(假设P0>1)计算期望的拉伸后的基础频率,并设为P0·ω(n,k)。
基音的拉伸和压缩(一并称为位移)的本质在于,在位移后的QMF块上构建期望的频率成分。基音位移处理也能够按照图19所示的下述步骤来实现。
(a)首先,音响信号处理装置将位移后的QMF块初始化(S1301)。音响信号处理装置将所有QMF块中的相位ψ(n,k)和振幅r1(n,k)设定为0。
(b)然后,音响信号处理装置将子带提升相当于变换系数P0的量,由此确定子带的边界(S1302)。在P0>1的情况下,音响信号处理装置计算较低的子带边界klb并设klb=0,并且计算较高的子带边界kub并设kub=floor(M/P0),以便避免折返畸变。
这是因为所有频率成分包含在下式所示的范围内。
[数式54]
下限:
上限:
(c)音响信号处理装置针对位于[klb,kub]的第j个子带,将位移处理后的频率P0·ω(n,j)映射为索引q(n)=round(P0·ω(n,j))(S1305)。
(d)音响信号处理装置重建新的块(n,q(n))的相位和振幅(S1306)。在此,音响信号处理装置根据式42计算新的振幅。
[数式55]
(式42)
关于函数F()将在后面进行说明。
音响信号处理装置根据式43计算新的相位。
[数式56]
(式43)
在此,以“包含”df(n)=P0·ω(n,j)-q(n)和ψ(n,q(n))的调整为前提。音响信号处理装置多次相加2π,以便保证-π≤ψ(n,q(n))<π。
(e)音响信号处理装置将下式所示的关于期望的频率成分P0·ω(n,j)的子带索引,
[数式57]
映射为根据式44计算出的子带(S1307)。
[数式58]
(式44)
(f)音响信号处理装置重建下式所示的新的块的相位和振幅(S1308)。
[数式59]
并且,音响信号处理装置根据式45计算新的振幅。
[数式60]
(式45)
关于函数F()将在后面进行说明。
音响信号处理装置根据式46计算新的相位。
[数式61]
(式46)
[数式62]
以“包含”上式的调整为前提。音响信号处理装置多次相加2π,以便保证下式成立。
[数式63]
(g)音响信号处理装置在暂且对包含于范围[klb,kub]中的所有子带信号进行处理后,由于P0>1,所以存在新的QMF块中包含的值为“0”的情况。音响信号处理装置针对这种块,以使各个相位信息成为“非0”的方式进行线性插补。并且,音响信号处理装置根据相位信息对各个振幅进行插补(S1310)。
(h)音响信号处理装置将新的QMF块的振幅和相位信息变换为复数系数的块信号(S1311)。
在此省略有关上述的振幅调整和插补的说明。因为这些处理都涉及QMF区域中的信号的频率成分与振幅之间的相关性。
正弦的基音较强的信号也许会产生上述(c)和(e)所述的两个不同的QMF子带的信号成分。分析的结果是这两个子带的振幅的关系依赖于QMF分析滤波器组(QMF变换)的原型滤波器。
例如,以QMF分析滤波器组(QMF变换)是在MPEGSurround和HE-AAC方式中采用的滤波器组为前提。图20A是表示原型滤波器p(n)(滤波器长度640样本)的振幅响应的图。该振幅响应在频率[-0.5,0.5]的外侧急剧衰减,以便基本完整地实现重建特性。以该原型滤波器为基准,将具有M个频带数的复数QMF分析滤波器组的系数定义如下:
[数式64]
在这种情况下,复数滤波器组构成为在第k个子带中频率的中央为k+1/2。图20B是表示被采集的频率响应的图。为了方便起见,在图20B的左侧利用折线表示第k-1个子带的振幅特性,在图20B的右侧利用折线表示第k+1个子带的振幅特性。
如图20B所示,关于频率f0(k-1≤f0<k+1)的成分,如果0<df=f0-(k+1/2)<1,则分别提供第k个和第k+1个子带的两个块。并且,在-1<df=f0-(k+1/2)<0的情况下,提供第k-1个和第k个子带的两个块(参照上述(e))。与其对应的振幅依赖于频率f0与第k个子带的中央频率之差、以及子带滤波器的振幅。
子带的振幅F(df)在-1≤df<1时是对称的函数,利用下式表示。
[数式65]
由于两个块处于相同的频率,所以这两个块的相位差需要满足下式(参照上述(f))。
[数式66]
根据以上所述,可知振幅的插补处理不应该作为线性插补进行处理。取而代之,信号的频率成分与振幅信息之间的关系应该是上述的关系。
如上所述,在实施方式6中,进行QMF区域的相位调整和振幅调整。如前面叙述的那样,音响信号处理装置利用QMF滤波器组将按照每单位时间而划分的音响信号逐次变换为QMF区域的系数(QMF块)。并且,音响信号处理装置调整各个QMF块的振幅和相位,以便对应于预先指定的拉伸率(s倍,例如s=2、3、4等)保持相邻的每个QMF块的相位和振幅的连续性。由此,音响信号处理装置实现相位声码器处理。
音响信号处理装置利用QMF合成滤波器组将在QMF区域中进行相位声码器处理而得到的QMF系数,变换为时域的信号。由此,得到拉伸到s倍后的时域的音响信号。并且,也存在后面的另外的音响信号处理装置采用QMF系数的情况。在这种情况下,后面的另外的音响信号处理装置可以对在QMF区域中进行相位声码器处理而得到的QMF块的系数,实施基于SBR技术的频带扩大处理等某种音响处理。并且,这种后面的另外的音响信号处理装置也可以利用QMF合成滤波器组将QMF系数变换为时域的音响信号。
图3所示的结构是这种组合的一例。这是将QMF区域的相位声码器处理和音响信号的频带扩大技术相组合的音响解码装置的一例。下面,说明采用相位声码器处理的音响解码装置的结构。
分离部1201将输入的比特流分离为高频带生成用的参数和低频带解码用的编码信息。参数解码部1207对高频带生成用的参数进行解码。解码部1202根据低频带解码用的编码信息,对低频带成分的音响信号进行解码。QMF分析滤波器组1203将被解码后的音响信号变换为QMF区域的音响信号。
频率调制电路1205和时间拉伸电路1204对QMF区域的音响信号实施所述相位声码器处理。然后,高频带生成电路1206使用高频带生成用的参数来生成高频带频率成分的信号。概略形状调整电路1208对高频带成分的频率概略形状进行调整。QMF合成滤波器组1209将QMF区域中的低频带成分和高频带成分的音响信号变换为时域的音响信号。
另外,在上述低频带成分的编码处理或者解码处理中可以采用MPEG-AAC方式、MPEG-Layer3等音响编码方式,或者也可以采用ACELP等声音编码方式。
并且,当在QMF区域中进行相位声码器处理时,对于调制系数r(m,n),也可以对QMF块的每个子带索引(m,n)进行加权。由此,能够利用对于每个子带索引具有不同的值的调制系数对QMF系数进行调制。例如,在与高频带频率对应的子带索引中,存在当进行拉伸时音响信号的畸变增大的情况。针对这种子带索引,采用减小拉伸比例的拉伸参数。
另外,作为在QMF区域中进行相位声码器处理的另一种结构,音响信号处理装置也可以在QMF分析滤波器组的后面还设置另外的QMF分析滤波器组。存在只采用第1QMF分析滤波器组时低频带的频率分辨率较低的情况。在这种情况下,即使对包括较多低频带成分的音响信号实施相位声码器处理,也不能得到充足的效果。
因此,为了提高低频带成分的频率分辨率,可以采用用于分析低频带部分(例如,第1QMF分析滤波器组的输出中包含的全部QMF块的一半)的第2QMF分析滤波器组。由此,频率分辨率提高为2倍。在此基础上,在上述QMF区域实施相位声码器处理,由此在保持音质的状态下,运算量以及存储器消耗量的削减效果提高。
图4是表示提高QMF区域的分辨率的结构示例的图。QMF合成滤波器组2401暂且利用QMF合成滤波器将输入的音响信号合成。然后,QMF分析滤波器组2402利用2倍析像度的QMF分析滤波器计算QMF系数。针对达到2倍分辨率的QMF区域的信号进行2倍的时间拉伸、和进行2倍或3倍或4倍的基音位移处理,这种相位声码器处理电路(第1时间拉伸电路2403、第2时间拉伸电路2404和第3时间拉伸电路2405)可以并列构成。
并且,各个相位声码器处理电路统一按照2倍析像度进行拉伸比例不同的相位声码器处理。并且,合并电路2406将通过相位声码器处理而得到的信号进行合成。
下面,说明音响信号的编码装置采用前面说明的时间拉伸处理和基音拉伸处理的示例。
图21是表示采用时间拉伸处理和基音拉伸处理对音响信号进行编码的音响编码装置的结构图。图21所示的音响编码装置对按照每固定数量的样本分割得到的音响信号进行成帧处理。
首先,向下取样部1102对音响信号进行向下取样,由此生成只包含低频带的频率成分的信号。编码部1103采用以MPEG-AAC、MPEG-Layer3或者AC3方式等为代表的音响编码方式,对只包含该低频带的音响信号进行编码,由此生成编码信息。同时,QMF分析滤波器组1104将只包含低频带成分的音响信号变换为QMF系数。另一方面,QMF分析滤波器组1101将包含全部频带成分的音响信号变换为QMF系数。
时间拉伸电路1105和频率调制电路1106按照在上述的多个实施方式中说明的那样,对将只包含低频带成分的音响信号变换为QMF区域的信号(QMF系数)进行调整,并生成高频带的假想QMF系数。
参数计算部1107将上述的假想的高频带QMF系数与包含全部频带成分的QMF系数(实际的QMF系数)进行比较,由此计算高频带成分的概略形状信息。重叠部1108将计算出的概略形状信息与编码信息重叠。
图3是表示音响解码装置的结构的图。图3所示的音响解码装置是接收由上述的音响编码装置进行编码后的编码信息,并解码成为音响信号的装置。分离部1201将接收到的编码信息分离为第1编码信息和第2编码信息。参数解码部1207将第2编码信息变换为高频带的QMF系数的概略形状信息。另一方面,解码部1202根据第1编码信息对只包含低频带成分的音响信号进行解码。QMF分析滤波器组1203将被解码后的音响信号变换为只包含低频带成分的QMF系数。并且,时间拉伸电路1204和频率调制电路1205按照在上述的多个实施方式中说明的那样,对只包含该低频带成分的QMF系数进行时间和基音的调整。由此,生成包含高频带成分的假想QMF系数。
概略形状调整电路1208和高频带生成电路1206根据接收到的第2编码信息中包含的概略形状信息,对包含高频带成分的假想QMF系数进行调整。QMF合成滤波器组1209将调整后的QMF系数和低频带的QMF系数进行合成。并且,QMF合成滤波器组1209利用QMF合成滤波器,将所得到的合成QMF系数变换为包含低频带成分和高频带成分双方的时域的音响信号。
这样,音响编码装置将时间规整比作为编码信息进行传输。音响解码装置使用时间规整比对音响信号进行解码。由此,音响编码装置能够按照每个帧来多样化地改变时间规整比。因此,高频带成分的控制变灵活。由此,实现较高的编码效率。
图22是表示在过去采用基于SFTF的时间拉伸电路和频率调制电路的情况下、和采用基于QMF的时间拉伸电路和频率调制电路的情况下,进行音质比较实验的结果的图。图22所示的结果依据于比特速率为16kbps、单声道信号条件下的实验。并且,该结果依据于MUSHRA(Multiple Stimuliwith Hidden Reference and Anchor:隐藏参考和基准的多刺激法)法的评价。
在图22中,纵轴表示与STFT方式的音质差异,横轴表示具有不同的音响特性的多个音源。根据图22可知,与基于SFTF的方式相比,基于QMF的方式能够以基本相同的音质进行编码和解码。在本实验中采用的音源是在进行编码和解码时尤其容易产生恶化的音源。因此,针对除此之外的普通音响信号,当然能够进行具有相同性能的编码和解码。
这样,本发明的音响信号处理装置在QMF区域中进行时间拉伸处理和基音拉伸处理。本发明的音响信号处理与经典的基于STFT的时间拉伸处理和基音拉伸处理相比,能够使用QMF滤波器实现。因此,本发明的音响信号处理不需要使用运算量较大的FFT,能够以更少的运算量实现相同的效果。并且,基于STFT的方式需要实施基于跳跃尺寸的处理,因而产生处理延迟。基于QMF的方式的QMF滤波器的处理延迟非常短。因此,本发明的音响信号处理装置还具有能够使处理延迟非常小的优点。
(实施方式7)
图23A是表示实施方式7的音响信号处理装置的结构图。图23A所示的音响信号处理装置具有滤波器组2601和调整部2602。滤波器组2601进行与图1所示的QMF分析滤波器组901等相同的动作。调整部2602进行与图1所示的调整电路902等相同的动作。并且,图23A所示的音响信号处理装置使用规定的调整系数,对输入音响信号序列进行变换。在此,规定的调整系数相当于时间规整比、频率调制比、以及二者相结合的比例中的任意一个比例。
图23B是表示图23A所示的音响信号处理装置的处理的流程图。滤波器组2601使用QMF分析滤波器,将输入音响信号序列变换为QMF系数序列(S2601)。调整部2602根据规定的调整系数对QMF系数序列进行调整(S2602)。
例如,调整部2602根据表示预先设定的时间规整比的调整系数,对QMF系数序列的相位信息和振幅信息进行调整,以便能够从调整后的QMF系数序列得到以预先设定的时间规整比进行时间规整后的输入音响信号序列。或者,调整部2602根据表示预先设定的频率调制比的调整系数,对QMF系数序列的相位信息和振幅信息进行调整,以便能够从调整后的QMF系数序列得到以预先设定的频率调制比进行频率调制(基音位移)后的输入音响信号序列。
图24是表示图23A所示的音响信号处理装置的畸变例的结构图。图24所示的音响信号处理装置在图23A所示的音响信号处理装置的基础上,还具有高频带生成部2705和高频带插补部2706。并且,调整部2602具有频带限制部2701、计算电路2702、调整电路2703和区域变换器2704。
滤波器组2601按照每固定时间间隔将输入音响信号序列逐次变换为QMF系数序列,由此生成按照每固定时间间隔的QMF系数序列。计算电路2702对按照每固定时间间隔生成的QMF系数序列的每个时隙和每个子带,计算相位信息和振幅信息。调整电路2703根据规定的调整系数来调整每个时隙和每个子带的相位信息,由此调整QMF系数序列的相位信息和振幅信息。
频带限制部2701进行与图14所示的频带限制滤波器1802相同的动作。即,频带限制部2701在进行QMF系数序列的调整之前,从QMF系数序列取出与预先设定的带宽对应的新的QMF系数序列。区域变换器2704进行与图17所示的QMF区域变换器相同的动作。即,区域变换器2704在进行QMF系数序列的调整之后,将QMF系数序列变换为时间和频率的分辨率分别不同的新的QMF系数序列。
另外,频带限制部2701也可以在进行QMF系数序列的调整之后,从QMF系数序列取出与预先设定的带宽对应的新的QMF系数序列。并且,区域变换器2704也可以在进行QMF系数序列的调整之前,将QMF系数序列变换为时间和频率的分辨率分别不同的新的QMF系数序列。
高频带生成部2705进行与图3所示的高频带生成电路1206相同的动作。即,高频带生成部2705使用预先设定的变换系数,从调整后的QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整前的QMF系数序列所对应的频带高的高频带。
高频带插补部2706进行与图3所示的概略形状调整电路1208相同的动作。即,高频带插补部2706针对高频带中、未由高频带生成部2705生成高频带系数序列的频带即缺失频带的系数,使用属于与缺失频带的两侧邻接的频带中的高频带系数序列进行插补。
图25是表示实施方式7的音响编码装置的结构图。图25所示的音响编码装置具有向下取样部2802、第1滤波器组2801、第2滤波器组2804、第1编码部2803、第2编码部2807、调整部2806和重叠部2808。图25所示的音响编码装置进行与图21所示的音响编码装置相同的动作。并且,图25所示的构成要素对应于图21所示的构成要素。
即,向下取样部2802进行与向下取样部1102相同的动作。第1滤波器组2801进行与QMF分析滤波器组1101相同的动作。第2滤波器组2804进行与QMF分析滤波器组1104相同的动作。第1编码部2803进行与编码部1103相同的动作。第2编码部2807进行与参数计算部1107相同的动作。调整部2806进行与时间拉伸电路1105相同的动作。重叠部2808进行与重叠部1108相同的动作。
图26是表示图25所示的音响编码装置的处理的流程图。
首先,第1滤波器组2801使用QMF分析滤波器,将音响信号序列变换为QMF系数序列(S2901)。然后,向下取样部2802对音响信号序列进行向下取样,由此生成的新的音响信号序列(S2902)。然后,第1编码部2803对所生成新的音响信号序列进行编码(S2903)。然后,第2滤波器组2804使用QMF分析滤波器,将所生成新的音响信号序列变换为第2QMF系数序列(S2904)。
然后,调整部2806根据规定的调整系数,对第2QMF系数序列进行调整(S2905)。规定的调整系数相当于以上所述的时间规整比、频率调制比、以及二者相结合的比例中的任意一个比例。
然后,第2编码部2807将第1QMF系数序列和调整后的第2QMF系数序列进行比较,由此生成在进行解码时使用的参数,并对所生成的参数进行编码(S2906)。然后,重叠部2808将已被编码的音响信号序列和已被编码的参数重叠(S2907)。
图27是表示实施方式7的音响解码装置的结构图。图27所示的音响解码装置具有分离部3001、第1解码部3007、第2解码部3002、第1滤波器组3003、第2滤波器组3009、调整部3004和高频带生成部3006。图27所示的音响解码装置进行与图3所示的音响解码装置相同的动作。并且,图27所示的构成要素对应于图3所示的构成要素。
即,分离部3001进行与分离部1201相同的动作。第1解码部3007进行与参数解码部1207相同的动作。第2解码部3002进行与解码部1202相同的动作。第1滤波器组3003进行与QMF分析滤波器组1203相同的动作。第2滤波器组3009进行与QMF合成滤波器组1209相同的动作。调整部3004进行与时间拉伸电路1204相同的动作。高频带生成部3006进行与高频带生成电路1206相同的动作。
图28是表示图27所示的音响解码装置的处理的流程图。
首先,分离部3001从所输入的比特流中分离出被编码后的参数和被编码后的音响信号序列(S3101)。然后,第1解码部3007对被编码后的参数进行解码(S3102)。然后,第2解码部3002对被编码后的音响信号序列进行解码(S3103)。然后,第1滤波器组3003使用QMF分析滤波器,将由第2解码部3002进行解码后的音响信号序列变换为QMF系数序列(S3104)。
然后,调整部3004根据规定的调整系数来调整QMF系数序列(S3105)。规定的调整系数相当于以上所述的时间规整比、频率调制比、以及二者相结合的比例中的任意一个比例。
然后,高频带生成部3006使用被解码后的参数,从被调整后的QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比QMF系数序列所对应的频带高的高频带(S3106)。然后,第2滤波器组3009使用QMF合成滤波器,将QMF系数序列和高频带系数序列变换为时域的音响信号序列。
图29是表示图27所示的音响解码装置的畸变例的结构图。图29所示的音响解码装置具有解码部2501、QMF分析滤波器组2502、频率调制电路2503、耦合部2504、高频重建部2505和QMF合成滤波器组2506。
解码部2501从比特流中对音响信号进行解码。QMF分析滤波器组2502将被解码后的音响信号变换为QMF系数。频率调制电路2503对QMF系数实施频率调制处理。该频率调制电路2503具有图4所示的构成要素。如图4所示,在频率调制处理中执行内部的时间拉伸处理。并且,耦合部2504将从QMF分析滤波器组2502得到的QMF系数、和从频率调制电路2503得到的QMF系数进行耦合。高频重建部2505根据耦合后的QMF系数重建与高频带对应的QMF系数。QMF合成滤波器组2506将从高频重建部2505得到的QMF系数变换为音响信号。
本发明的音响信号处理装置与基于STFT的相位声码器处理相比,能够削减运算量。并且,音响信号处理装置在QMF区域中输出信号,所以在SBR技术或者参数立体声(ParametricStereo)等参量编码处理中能够解决区域变换的非效率性。并且,音响信号处理装置也能够削减进行区域变换的运算所需要的存储器的容量。
以上,根据多个实施方式对本发明的音响信号处理装置、音响编码装置和音响解码装置进行了说明,但是本发明不限于这些实施方式。对这些实施方式实施本领域技术人员能够想到的畸变而得到的方式、以及将这些实施方式中的构成要素进行任意组合而实现的其它方式,都包含在本发明中。
例如,由特定的处理部执行的处理也可以由另外的处理部执行。并且,也可以变更执行处理的顺序,还可以并行执行多个处理。
并且,本发明不仅能够实现为音响信号处理装置、音响编码装置或者音响解码装置,也能够实现为将构成音响信号处理装置、音响编码装置或者音响解码装置的处理单元作为步骤的方法。并且,本发明也能够实现为使计算机执行这些方法中包含的步骤的程序。另外,本发明还能够实现为记录了该程序的CD-ROM等计算机能够读取的记录介质。
并且,音响信号处理装置、音响编码装置或者音响解码装置所包含的多个构成要素也可以实现为集成电路即LSI(Large Scale Integration:大规模集成电路)。这些构成要素可以是独立的单片,也可以是包含一部分或者全部构成要素的单片。在此,把集成电路设为LSI,但根据集成度的不同,有时也称为IC(Integrated Circuit:集成电路)、系统LSI、超级LSI或者特级LSI。
并且,集成电路化的方法不限于LSI,也可以利用专用电路或通用处理器实现。也可以采用能够编程的FPGA(Field Programmable Gate Array:可现场编程门阵列)、能够重构架LSI内部的电路单元的连接和设定的可重构处理器(reconfigurable processor)。
另外,如果伴随半导体技术的发展或利用派生的其他技术替换LSI的集成电路化的技术问世,当然也可以使用该技术实现音响信号处理装置、音响编码装置或者音响解码装置所包含的构成要素的集成电路。
产业上的可利用性
本发明的音响信号处理装置对音频录制器、音频播放器、携带电话等是有用的。
标号说明
500重新取样部;501向上取样部;502低通滤波器;503、1102、2802向下取样部;504、601、901、1001、1101、1104、1203、1801、2402、2502、QMF分析滤波器组;505、602、1105、1204、1804时间拉伸电路;603、1003QMF区域变换器;902、1002、2703调整电路;903、1005、1209、1805、2401、2506QMF合成滤波器组;1004带通滤波器;1103编码部;1106、1205、1803、2503频率调制电路;1107参数计算部;1108、2808重叠部;1201、3001分离部;1202、2501解码部;1206高频带生成电路;1207参数解码部;1208概略形状调整电路;1802频带限制滤波器;2403第1时间拉伸电路;2404第2时间拉伸电路;2405第3时间拉伸电路;2406合并电路;2504耦合部;2505高频重建部;2601滤波器组;2602、2806、3004调整部;2701频带限制部;2702计算电路;2704区域变换器;2705、3006高频带生成部;2706高频带插补部;2801、3003第1滤波器组;2803第1编码部;2804、3009第2滤波器组;2807第2编码部;3002第2解码部;3007第1解码部。