CN105324815A

CN105324815A - 信号处理装置和信号处理方法

Info

Publication number: CN105324815A
Application number: CN201480031036.4A
Authority: CN
Inventors: 桥本武志; 渡边哲生; 藤田康弘; 福江一智
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2013-05-31
Filing date: 2014-05-26
Publication date: 2016-02-10
Anticipated expiration: 2034-05-26
Also published as: EP3007171B1; US10147434B2; US20160104499A1; JP6305694B2; EP3007171A4; CN105324815B; JP2014235274A; WO2014192675A1; EP3007171A1

Abstract

一种信号处理装置包括：用于从音频信号中检测满足预定条件的频带的频带检测构件；用于根据由频带检测构件检测到的频带来产生参考信号的参考信号产生构件；用于基于所产生的参考信号本身的频率特性来校正参考信号的参考信号校正构件；用于扩展所述经校正的参考信号达到高于检测到的带的频带的频带扩展构件；用于通过根据音频信号的频率特性来加权经扩展的频带内的每个频率分量，而产生内插信号的内插信号产生构件；以及用于合成所产生的内插信号与音频信号的信号合成构件。

Description

信号处理装置和信号处理方法

技术领域

本发明涉及用于通过产生内插信号并且合成所述内插信号与音频信号，来内插所述音频信号的高频率分量的一种信号处理装置和一种信号处理方法。

背景技术

对于音频信号的压缩形式，已知例如MP3(MPEG音频层-3)、WMA(Windows媒体音频，注册商标)和AAC(高级音频编码)等不可逆的压缩形式。在不可逆的压缩形式中，通过大幅度切除接近或超出可听范围上限的高频率分量来实现高压缩率。当开发这种类型的技术时，人们曾认为，即使在大幅度切除高频率分量时听觉音质也不会发生退化。然而，近年来，大幅度切除高频率分量略微改变了音质并降低了听觉音质的想法正变成主流。因此，已经提出通过对以不可逆方式压缩的音频信号执行高频率内插来改进音质的高频率内插装置。这种类型的高频率内插装置的特定配置例如在第2007-25480A号日本临时专利公开文本(下文中称为专利文献1)中以及在第2007-534478号日本专利申请的再公开文本(下文中称为专利文献2)中进行了公开。

在专利文献1中公开的高频率内插装置计算通过分析音频信号(原始信号)获得的信号的实部和虚部，使用计算出的实部和虚部形成原始信号的包络分量，并且提取所形成的包络分量的高次谐波分量。在专利文献1中公开的高频率内插装置通过合成所提取的高次谐波分量与原始信号来对原始信号执行高频率内插。

在专利文献2中公开的高频率内插装置倒转音频信号的频谱，对倒转了频谱的信号进行上采样，并且从经上采样信号中提取扩展带分量，经上采样信号的低频率端与基带信号的高频率范围几乎相同。在专利文献2中公开的高频率内插装置通过合成所提取的扩展带分量与基带信号来对基带信号执行高频率内插。

发明内容

以不可逆方式压缩的音频信号的频带根据压缩编码格式、采样率和压缩编码之后的比特率而改变。因此，如果如专利文献1中所公开的通过合成固定频带的内插信号与音频信号来执行高频率内插，那么取决于在高频率内插之前的音频信号的频带，高频率内插之后音频信号的频谱变得不连续。因此，使用专利文献1中所公开的高频率内插装置对音频信号执行高频率内插会具有降低听觉音质的不良影响。

此外，作为一般特性，在较高频率下音频信号电平的衰减较大，但是存在音频信号的电平在高频率侧瞬时放大的情况。然而，在专利文献2中，仅将前一种一般特性考虑为待输入到装置的音频信号的特性。因此，在输入电平在高频率侧放大的音频信号之后，音频信号的频谱立即变得不连续，并且高频率区过度突出。因此，如同专利文献1中所公开的高频率内插装置，使用专利文献2中所公开的高频率内插装置对音频信号执行高频率内插会具有降低听觉音质的不良影响。

鉴于以上情况进行了本发明，并且本发明的目的是提供一种信号处理装置和一种信号处理方法，其能够通过高频率内插来实现音质改进，而与不可逆方式压缩的音频信号的频率特性无关。

本发明的一个方面提供了一种信号处理装置，其包括：用于从音频信号中检测满足预定条件的频带的频带检测构件；用于根据频带检测构件检测到的检测带来产生参考信号的参考信号产生构件；用于基于所产生的参考信号的频率特性来校正所产生的参考信号的参考信号校正构件；用于扩展经校正的参考信号达到高于检测带的频带的频带扩展构件；用于通过根据音频信号的频率特性来加权经扩展的频带内的每个频率分量，而产生内插信号的内插信号产生构件；以及用于合成所产生的内插信号与音频信号的信号合成构件。

根据以上配置，由于利用根据音频信号的频率特性的值来校正参考信号，并且基于经校正的参考信号来产生内插信号，以及该内插信号与音频信号合成，所以通过高频率内插实现了音质改进，而与音频信号的频率特性无关。

例如，参考信号校正构件将由参考信号产生构件产生的参考信号校正为平坦频率特性。

另外，参考信号校正构件可以配置为对由参考信号产生构件产生的参考信号执行第一回归分析；基于通过第一回归分析获得的频率特性信息，对参考信号的每个频率计算参考信号加权值；以及通过将计算出的每个频率的参考信号加权值与参考信号相乘来校正参考信号。

例如，参考信号产生构件提取在高频率侧整个检测带的n％内的范围，并且将所提取的分量设定为参考信号。

频带检测构件可以配置为计算在第一频率范围和高于第一频率范围的第二频率范围中的音频信号的电平；基于计算出的在第一和第二频率范围中的电平来设定阈值；以及基于设定的阈值从音频信号中检测频带。

另外，例如，频带检测构件从音频信号中检测如下的频带：其频率上限是电平下降低于阈值的至少一个频率点之中的最高频率点。

内插信号产生构件可以配置为对音频信号的至少一部分执行第二回归分析；基于通过第二回归分析获得的频率特性信息，对经扩展的频带内的每个频率分量计算内插信号加权值；以及通过将计算出的每个频率分量的内插信号加权值与经扩展的频带内的每个频率分量相乘来产生内插信号。

例如，通过第二回归分析获得的频率特性信息包括经扩展的频带内的频率分量的变化率。在此情况下，内插信号产生构件随着变化率在负方向上变大而增加内插信号加权值。

另外，例如，内插信号产生构件随着第二回归分析的范围的频率上限变得更高而增加内插信号加权值。

另外，当满足以下条件(1)到(3)中的至少一个时，信号处理装置可以配置为不执行通过内插信号产生构件来产生内插信号：

(1)检测到的振幅谱Sa等于或小于预定的频率范围；

(2)在第二频率范围的信号电平等于或大于预定值；或者

(3)第一频率范围与第二频率范围之间的信号电平差等于或小于预定值。

本发明的另一个方面提供了一种信号处理方法，其包括：从音频信号中检测满足预定条件的频带的频带检测步骤；根据通过频带检测构件检测到的检测带来产生参考信号的参考信号产生步骤；基于所产生的参考信号的频率特性来校正所产生的参考信号的参考信号校正步骤；扩展经校正的参考信号达到高于检测带的频带的频带扩展步骤；通过根据音频信号的频率特性来加权经扩展的频带内的每个频率分量，而产生内插信号的内插信号产生步骤；以及合成所产生的内插信号与音频信号的信号合成步骤。

根据以上配置，由于利用根据音频信号的频率特性的值来校正参考信号，并且基于经校正的参考信号产生内插信号，以及将该内插信号与音频信号合成，所以通过高频率内插实现了音质改进，而与音频信号的频率特性无关。

例如，在参考信号校正步骤中，由参考信号产生构件产生的参考信号可以被校正为平坦频率特性。

在参考信号校正步骤中，可以对由参考信号产生构件产生的参考信号执行第一回归分析；可以基于通过第一回归分析获得的频率特性信息，对参考信号的每个频率计算参考信号加权值；以及可以通过将计算出的每个频率的参考信号加权值与参考信号相乘来校正参考信号。

在参考信号产生步骤中，可以提取在高频率侧整个检测带的n％内的范围，并且可以将所提取的分量设定为参考信号。

在频带检测步骤中，可以计算在第一频率范围和频率高于第一频率范围的第二频率范围中的音频信号的电平；可以基于计算出的在第一和第二频率范围中的电平来设定阈值；以及可以基于设定的阈值从音频信号中检测频带。

在频带检测步骤中，可以从音频信号中检测如下的频带，其频率上限是电平下降低于所述阈值的至少一个频率点之中的最高频率点。

在内插信号产生步骤中，可以对音频信号的至少一部分执行第二回归分析；可以基于通过第二回归分析获得的频率特性信息，对经扩展的频带内的每个频率分量计算内插信号加权值；以及可以通过将计算出的每个频率分量的内插信号加权值与经扩展的频带内的每个频率分量相乘来产生内插信号。

通过第二回归分析获得的频率特性信息包括经扩展的频带内的频率分量的变化率，并且在内插信号产生步骤中，可以随着变化率在负方向上变大而增加内插信号加权值。

在内插信号产生步骤中，可以随着第二回归分析的范围的频率上限变得更高而增加内插信号加权值。

当满足以下条件(1)到(3)中的至少一个时，所述信号处理方法可以配置为不在内插信号产生步骤中产生内插信号：

(1)检测到的振幅谱Sa等于或小于预定频率范围；

(2)在第二频率范围的信号电平等于或大于预定值；或者

附图说明

图1是示出本发明的实施方案的声音处理装置的配置的框图。

图2是示出提供到本发明实施方案的声音处理装置的高频率内插处理单元的配置的框图。

图3是用于辅助解释提供到本发明实施方案的高频率内插处理单元的频带检测单元的性能的辅助图。

图4示出用于解释使用通过本发明实施方案的频带检测单元检测到的振幅谱，执行高频率内插的一系列过程的操作波形图。

图5示出说明在不校正参考信号的情况下产生的内插信号的图。

图6示出说明在不校正参考信号的情况下产生的内插信号的图。

图7示出展示加权值P₂(x)与各个参数之间的关系的图。

图8示出说明在彼此不同的操作条件下产生的高频率内插之后的音频信号的图。

图9示出说明在彼此不同的操作条件下产生的高频率内插之后的音频信号的图。

具体实施方式

下文中，将参考附图来描述根据本发明的实施方案的声音处理装置。

[声音处理装置1的整体配置]

图1是示出本实施方案的声音处理装置1的配置的框图。如图1中所示，声音处理装置1包括FFT(快速傅里叶变换)单元10、高频率内插处理单元20以及IFFT(快速傅里叶逆变换)单元30。

从声音源输入通过对以不可逆的压缩格式的编码信号进行解码，而由声音源产生的音频信号至FFT单元10。不可逆的压缩格式是MP3、WMA、AAC等。FFT单元10对所输入的音频信号，利用窗函数执行叠加过程和加权，并且接着使用STFT(短期傅里叶变换)将经加权的信号从时域变换为频域，以获得实部频谱和虚部频谱。FFT单元10将通过频率变换获得的频谱变换为振幅谱和相位谱。FFT单元10将振幅谱输出到高频率内插处理单元20，并将相位谱输出到IFFT单元30。高频率内插处理单元20内插从FFT单元10输入的振幅谱的高频率区，并且将经内插的振幅谱输出到IFFT单元30。由高频率内插处理单元20内插的频带是例如通过不可逆的压缩大幅度切除的、接近或超出可听范围上限的高频带。IFFT单元30基于通过高频率内插处理电路20内插了高频率区的振幅谱、以及从FFT单元10输出并且保持原样的相位谱，来计算实部频谱和虚部频谱，并且使用窗函数执行加权。IFFT单元30使用STFT和重叠相加来将经加权的信号从频域变换为时域，以及产生并输出内插了高频率区的音频信号。

[高频率内插处理单元20的配置]

图2是示出高频率内插处理单元20的配置的框图。如图2中所示，高频率内插处理单元20包括：频带检测单元210、参考信号提取单元220、参考信号校正单元230、内插信号产生单元240、内插信号校正单元250以及加法单元260。应注意，为方便解释，至高频率内插处理单元20中的单元中的每一个和来自所述单元中的每一个的输入信号和输出信号中的每一个后接符号。

图3是用于辅助解释频带检测单元210的性能的图，并且示出将从FFT单元10输入到频带检测单元210的振幅谱S的示例。在图3中，竖轴(y轴)是信号电平(单位：dB)，且横轴(x轴)是频率(单位：Hz)。

频带检测单元210将从FFT单元10输入的音频信号的振幅谱S(线性标度)变换为分贝标度。频带检测单元210计算在预定的低/中间频率范围和预定的高频率范围内转化成分贝标度的振幅谱S的信号电平，并且基于在低/中间频率范围和高频率范围内计算出的信号水平来设定阈值。例如，如图3中所示，阈值是在低/中间频率范围内的信号电平(平均值)和高频率范围内的信号电平(平均值)的中间电平处。

频带检测单元210从由FFT单元10输入的振幅谱S(线性标度)中，检测具有如下频带的音频信号(振幅谱Sa)，该频带的频率上限是信号电平下降低于阈值的频率点。如果如图3中所示存在信号电平下降低于阈值的多个频率点，则检测具有频率上限是最高频率点(在图3中示出的示例中，频率ft)的频带的振幅谱Sa。频带检测单元210通过进行平滑以抑制包括于振幅谱Sa中的局部离差，来使检测到的振幅谱Sa平滑。应注意，如果满足以下条件(1)至(3)中的至少一个，则判断出无需产生内插信号，从而抑制不必要的内插信号产生。

(1)检测到的振幅谱Sa等于或小于预定的频率范围。

(2)在高频率范围的信号电平等于或大于预定值。

(3)在低/中间频率范围与高频率范围之间的信号电平差等于或小于预定值。

对判断出的不需要产生内插信号的振幅谱不执行高频率内插。

图4(a)至图4(h)示出用于解释使用通过频带检测单元210检测到的振幅谱Sa，执行高频率内插的一系列过程的操作波形图。在图4(a)至图4(h)中的每一个中，竖轴(y轴)是信号电平(单位：dB)，且横轴(x轴)是频率(单位：Hz)。

通过频带检测单元210检测到的振幅谱Sa被输入到参考信号提取单元220。参考信号提取单元220根据振幅谱Sa的频带，从振幅谱Sa中提取参考信号Sb(见图4(a))。例如，将在高频率侧整个振幅谱Sa的n％(0<n)范围内的振幅谱提取为参考谱Sb。应注意，存在这样的问题：使用由声带(例如，自然声)产生的内插信号来内插音频信号降低了音频信号的音质，这样很可能给人带来不舒适的听觉感受。相反，在以上示例中，由于参考信号Sb的频带随着参考信号Sa的频带变得更窄而变得更窄，因此可以抑制导致音质退化的声带的提取。

参考信号提取单元220将从振幅谱Sa提取的参考信号Sb的频率移位至低频率侧(DC侧)(见图4(b))，并且将频率移位的参考信号Sb输出至参考信号校正单元230。

参考信号校正单元230将从参考信号提取单元220输入的参考信号Sb(线性标度)变换为分贝标度，并且使用线性回归分析来检测变换为分贝标度的参考信号Sb的频率斜率。参考信号校正单元230计算使用线性回归分析检测的频率斜率的逆特性(针对参考信号Sb的每个频率的加权值)。具体来说，当针对参考信号Sb的每个频率的加权值定义为P₁(x)时，横轴(x轴)上频域中的FFT样本位置定义为x，使用线性回归分析检测的参考信号Sb的频率斜率的值定义为α₁，并且对应于参考信号Sb的频带的FFT样本的数量的1/2定义为β₁，参考信号校正单元230使用以下表达式(1)来计算频率斜率的逆特性(针对参考信号Sb的每个频率的加权值P₁(x))。

[表达式1]

P₁(x)＝-α₁x+β₁

如图4(c)中所示，针对参考信号Sb的每个频率计算得到的加权值P₁(x)以分贝标度。参考信号校正单元230将分贝标度的加权值P₁(x)变换为线性标度。参考信号校正单元230通过将变换为线性标度的加权值P₁(x)与从参考信号提取单元220输入的参考信号Sb(线性标度)相乘来校正参考信号Sb。具体来说，参考信号Sb被校正为具有平坦频率特性的信号(参考信号Sb')(见图4(d))。

由参考信号校正单元230校正的参考信号Sb'被输入至内插信号产生单元240。内插信号产生单元240通过扩展参考信号Sb'达到高于振幅谱Sa的频带的频带来产生包括高频率区的内插信号Sc(见图4(e))(换句话说，将参考信号Sb'复制，直至复制的信号达到高于振幅谱Sa的频带的频带)。内插信号Sc具有平坦频率特性。另外，例如，参考信号Sb'的扩展的范围包括：振幅谱Sa的整个频带、以及在高于振幅谱Sa的频带的预定范围内的频带(接近可听范围的上限的频带、超出可听范围的上限的频带等)。

由内插信号产生单元240产生的内插信号Sc被输入到内插信号校正单元250。内插信号校正单元250将从FFT单元10输入的振幅谱S(线性标度)变换为分贝标度，并且使用线性回归分析来检测变换为分贝标度的振幅谱S的频率斜率。应注意，代替检测振幅谱S的频率斜率，而可以检测从频带检测单元210输入的振幅谱Sa的频率斜率。可以任意地设定回归分析的范围，但是通常，回归分析的范围是对应于不包括低频率分量的预定频带的范围，以平滑地连接音频信号的高频率侧和内插信号。内插信号校正单元250基于检测的频率斜率和对应于回归分析的范围的频带来计算针对每个频率的加权值。具体来说，当针对每个频率处的内插信号Sc的加权值定义为P₂(x)时，横轴(x轴)上频域中的FFT样本位置定义为x，回归分析的范围的频率上限定义为b，FFT的样本长度定义为s，对应于回归分析的范围的频带中的斜率定义为α₂，并且预定的校正系数定义为k，内插信号校正单元250使用以下表达式(2)来计算每个频率处的内插信号Sc的加权值P₂(x)。

[表达式2]

P2(x)＝-α'x+β₂

其中，

α'＝α₂-[1-(b/s)]/k

β₂＝-α'b

当x<b时，P2(x)＝-∞

如图4F中所示，以分贝标度来计算在每个频率处内插信号Sc的加权值P₂(x)。内插信号校正单元250将加权值P₂(x)从分贝标度变换为线性标度。内插信号校正单元250通过将变换为线性标度的加权值P₂(x)与由内插信号产生单元240产生的内插信号Sc(线性标度)相乘来校正内插信号Sc。例如，如图4G中所示，校正的内插信号Sc'是在高于频率b的频带中的信号并且其衰减在更高频率处更大。

从内插信号校正单元250输入的内插信号Sc'以及来自FFT单元10的振幅谱S输入至加法单元260。振幅谱S是高频率分量大幅度切除的音频信号的振幅谱，并且内插信号Sc'是在高于音频信号的频带的频率区中的振幅谱。加法单元260产生通过合成振幅谱S与内插信号Sc'而内插了高频率区的音频信号的振幅谱S'(见图4H)，并且将所产生的音频信号振幅谱S'输出至IFFT单元30。

在本实施方案中，根据振幅谱Sa的频带来提取参考信号Sb，从通过校正所提取的参考信号Sb而获得的参考信号Sb'中产生内插信号Sc'，并且将所述内插信号Sc'与振幅谱S(音频信号)合成。因此，利用具有相对于音频信号连续地衰减的自然特性的谱，来内插音频信号的高频率区，而与输入至FFT单元10的音频信号的频率特性无关(例如，即使当音频信号的频带已经根据压缩编码格式等而改变时，或即使当输入电平在高频率侧放大的音频信号时)。因此，通过高频率内插实现了听觉音质的改进。

图5和图6说明了在不校正参考信号的情况下产生的内插信号。在图5和图6的每一个中，竖轴(y轴)是信号电平(单位：dB)，且横轴(x轴)是频率(单位：Hz)。图5说明了衰减在更高频率处变得更大的音频信号，且图6说明了电平在高频率区放大的音频信号。图5(a)和图6(a)中的每一个示出了从音频信号中提取的参考信号。图5(b)和图6(b)中的每一个示出了通过扩展所提取的参考信号达到高于音频信号的频带的频带所产生的内插信号。如图5B和图6B中的每一个所示，在不校正参考信号的情况下，内插信号的谱变得不连续。因此，在图5和图6示出的示例中，对音频信号执行高频率内插具有降低听觉音质的相反效果。

以下是本实施方案的声音处理装置1的示例性操作参数。

(FFT单元10/IFFT单元30)

样本长度：8,192个样本

窗函数：汉宁函数

叠加长度：50％

(频带检测单元210)

最小控制频率：7kHz

低/中间频率范围：2kHz～6kHz

高频率范围：20kHz～22kHz

高频率范围电平判断：-20dB

信号电平差：20dB

阈值：0.5

(参考信号提取单元220)

参考带宽：2.756kHz

(内插信号校正单元250)

低频率限制：500Hz

校正系数k：0.01

“最小控制频率(＝7kHz)”意指如果通过频带检测单元210检测到的振幅谱Sa低于7kHz，则不执行高频率内插。“高频率范围电平判断(＝-20dB)”意指如果在高频率范围的信号电平等于或大于-20dB，则不执行高频率内插。“信号电平差(＝20dB)”意指如果在高低/中间频率范围与高频率范围之间的信号电平差等于或小于20dB，则不执行高频率内插。“阈值(＝0.5)”意指用于检测振幅谱Sa的阈值是在低/中间频率范围的信号电平(平均值)与高频率范围的信号电平(平均值)之间的中间值。“参考带宽(＝2.756kHz)”是对应于“最小控制频率(＝7kHz)”的参考信号Sb的带宽。“低频率限制(＝500Hz)”指示通过内插信号校正单元250进行的回归分析的范围的下限(即，低于500Hz的频率不包括在回归分析的范围中)。

图7(a)示出了如下情况的加权值P₂(x)，当利用以上示例性操作参数时，频率b固定为8kHz并且频率斜率α₂在0至-0.010的范围内以-0.002的间隔变化。图7B示出了如下情况的加权值P₂(x)，当利用以上示例性操作参数时，频率斜率α₂固定为0(平坦频率特性)，并且频率b在8kHz至20kHz的范围内以2kHz的间隔变化。在图7(a)和图7(b)的每一个中，竖轴(y轴)是信号电平(单位：dB)，且横轴(x轴)是频率(单位：Hz)。应注意，在图7(a)和图7(b)示出的示例中，FFT样本位置变换为频率。

参考图7(a)和图7(b)，可以理解，加权值P₂(x)根据频率斜率α₂和频率b而改变。具体来说，如图7(a)中所示，加权值P₂(x)随着频率斜率α₂在负方向上变得更大而变得更大(即，对于在更高频率处其衰减更大的音频信号，加权值P₂(x)更大)，并且内插信号Sc'在高频率区的衰减变得更大。另外，如图7B中所示，加权值P₂(x)随着频率b变得更大而变得更小，并且内插信号Sc'在高频率区的衰减变得更小。因此，通过根据音频信号的频率斜率或回归分析的范围来改变内插信号Sc'的斜率，利用具有相对于音频信号连续衰减的自然特性的谱来内插接近或超出可听范围上限的音频信号的高频率区。因此，通过高频率内插实现了听觉音质的改进。另外，由于参考信号的频带随着音频信号的频带变得更窄而变得更窄，因此可以抑制引起音质退化的声带的提取。此外，由于内插信号的电平随着音频信号的频带变得更窄而变得更小，因此多余的内插信号不合成至例如具有狭窄频带的音频信号。

图8(a)示出了在更高频率处其衰减更大的音频信号(频带：10kHz)。图8(b)至8(e)中的每一个示出了可以通过使用以上示例性操作参数来内插图8(a)中示出的音频信号的高频率区而获得的信号。应注意，图8(b)至8(e)的操作条件彼此不同。在图8(a)至8(e)中的每一个中，竖轴(y轴)是信号电平(单位：dB)，且横轴(x轴)是频率(单位：Hz)。

图8(b)示出了从高频率内插过程中省略参考信号的校正和内插信号的校正的示例。另外，图8(c)示出了从高频率内插过程中省略内插信号的校正的示例。在图8(b)和图8(c)中示出的示例中，具有平坦频率特性的内插信号合成至图8(a)中示出的音频信号。在图8(b)和图8(c)中示出的示例中，由于归因于多余高频率分量的内插而导致了频率均衡损失，因此听觉音质退化。

图8(d)示出了从高频率内插过程中省略参考信号的校正的示例。另外，图8(e)示出了从高频率内插过程中不省略任何过程的示例。在图8(d)中示出的示例中，高频率内插之后的音频信号具有在更高频率处衰减更大的特性，但是不能说谱是连续地衰减的。在图8(d)中示出的示例中，很可能的是，谱中保留的不连续区域给用户带来不舒适的听觉感受。相反，在图8(e)中示出的示例中，高频率内插之后的音频信号具有自然谱特性，其中谱的电平连续地衰减并且在更高频率处衰减变得更大。比较图8(d)和图8(e)，可以理解，通过不仅执行内插信号的校正而且执行参考信号的校正，利用高频率内插实现了听觉音质的改进。

图9(a)示出了其信号电平在高频率区放大的音频信号(频带：10kHz)。图9(b)至9(e)中的每一个示出了可以通过使用以上示例性操作参数来内插图9(a)中示出的音频信号的高频率区而获得的信号。图9(b)至9(e)的操作条件分别与图8(b)至8(e)的操作条件相同。

在图9(b)中示出的示例中，具有不连续谱的内插信号合成至图9(a)中示出的音频信号。在图9(c)中示出的示例中，具有平坦频率特性的内插信号合成至图9(a)中示出的音频信号。在图9(b)和图9(c)中示出的示例中，由于归因于具有不连续特性的内插信号的合成或归因于多余高频率分量的内插而导致频率均衡损失，因此听觉音质退化。

在图9(d)中示出的示例中，高频率内插之后的音频信号的衰减在更高频率处更大，但是谱的变化不连续。在图9(d)中示出的示例中，很可能的是，不连续区域给用户带来不舒适的听觉感受。相反，在图9(e)中示出的示例中，高频率内插之后的音频信号具有自然谱特性，其中谱的电平连续地衰减并且在更高频率处衰减变得更大。比较图9(d)和图9(e)，可以理解，通过不仅执行内插信号的校正而且执行参考信号的校正，利用高频率内插实现了听觉音质的改进。

以上是本发明的说明性实施方案的描述。本发明的实施方案不限于以上阐述的实施方案，并且在本发明的技术理念的范围内各种修改是可能的。例如，在说明书中指定的示例性实施方案和/或从说明书中显而易见的示例性实施方案的适当组合也包括在本发明的实施方案中。例如，在本实施方案中，参考信号校正单元230使用线性回归分析来校正电平在频带内一致地放大或衰减的参考信号Sb。然而，参考信号Sb的特性不限于线性这一种，并且在一些情况下，其可以是非线性的。在校正信号电平在频带内反复地放大和衰减的参考信号Sb的情况下，参考信号校正单元230使用升高程度的回归分析来计算逆特性，并且使用计算出的逆特性来校正参考信号Sb。

Claims

1.一种信号处理装置，其包括：

频带检测构件，其用于从音频信号中检测满足预定条件的频带；

参考信号产生构件，其用于根据所述频带检测构件检测到的检测带产生参考信号；

参考信号校正构件，其用于基于所产生的参考信号的频率特性来校正所产生的参考信号；

频带扩展构件，其用于扩展经校正的参考信号达到高于检测带的频带；

内插信号产生构件，其用于通过根据所述音频信号的频率特性加权经扩展的频带内的每个频率分量来产生内插信号；以及

信号合成构件，其用于合成所产生的内插信号与所述音频信号。

2.根据权利要求1所述的信号处理装置，

其中，所述参考信号校正构件将由所述参考信号产生构件产生的参考信号校正为平坦频率特性。

3.根据权利要求1或2所述的信号处理装置，

其中，所述参考信号校正构件：

对由所述参考信号产生构件产生的参考信号执行第一回归分析；

基于通过所述第一回归分析获得的频率特性信息，对所述参考信号的每个频率计算参考信号加权值；

通过将计算出的每个频率的参考信号加权值与所述参考信号相乘来校正所述参考信号。

4.根据权利要求1至3中的任一权利要求所述的信号处理装置，

其中，所述参考信号产生构件提取在高频率侧的整体检测带的n％内的范围并且将所提取的分量设定为所述参考信号。

5.根据权利要求1至4中的任一权利要求所述的信号处理装置，

其中，所述频带检测构件：

计算在第一频率范围和高于所述第一频率范围的第二频率范围中的所述音频信号的电平；

基于计算出的在第一和第二频率范围中的电平来设定阈值；以及

基于设定的阈值从所述音频信号中检测所述频带。

6.根据权利要求5所述的信号处理装置，

其中，所述频带检测构件从所述音频信号中检测如下的频带，其频率上限是电平下降低于所述阈值的至少一个频率点之中的最高频率点。

7.根据权利要求1至6中的任一权利要求所述的信号处理装置，

其中，所述内插信号产生构件：

对所述音频信号的至少一部分执行第二回归分析；

基于通过所述第二回归分析获得的频率特性信息，对经扩展的频带内的每个频率分量计算内插信号加权值；以及

通过将计算出的每个频率分量的内插信号加权值与经扩展的频带内的每个频率分量相乘来产生内插信号。

8.根据权利要求7所述的信号处理装置，

其中，通过所述第二回归分析获得的所述频率特性信息包括经扩展的频带内的频率分量的变化率，以及

其中，所述内插信号产生构件随着所述变化率在负方向上变大而增加所述内插信号加权值。

9.根据权利要求7或8所述的信号处理装置，

其中，所述内插信号产生构件随着所述第二回归分析的范围的频率上限变得更高而增加所述内插信号加权值。

10.根据权利要求1至9中的任一权利要求所述的信号处理装置，

其中，当满足以下条件(1)至(3)中的至少一个时，所述信号处理装置不执行通过所述内插信号产生构件来产生所述内插信号：

(1)检测到的振幅谱Sa等于或小于预定的频率范围；

(2)在第二频率范围的信号电平等于或大于预定值；或者

11.一种信号处理方法，其包括：

从音频信号中检测满足预定条件的频带的频带检测步骤；

根据通过所述频带检测步骤检测到的检测带来产生参考信号的参考信号产生步骤；

基于所产生的参考信号的频率特性来校正所产生的参考信号的参考信号校正步骤；

扩展经校正的参考信号达到高于所述检测带的频带的频带扩展步骤；

通过根据所述音频信号的频率特性加权经扩展的频带内的每个频率分量来产生内插信号的内插信号产生步骤；以及

合成所产生的内插信号与所述音频信号的信号合成步骤。

12.根据权利要求11所述的信号处理方法，

其中，在所述参考信号校正步骤中，通过所述参考信号产生步骤产生的所述参考信号被校正为平坦频率特性。

13.根据权利要求11或12所述的信号处理方法，

其中，在所述参考信号校正步骤中：

对由所述参考信号产生步骤产生的所述参考信号执行第一回归分析；

基于通过所述第一回归分析获得的频率特性信息，对所述参考信号的每个频率计算参考信号加权值；以及

14.根据权利要求11至13中的任一权利要求所述的信号处理方法，

其中，在所述参考信号产生步骤中，提取在高频率侧整个检测带的n％内的范围，并且将所提取的分量设定为参考信号。

15.根据权利要求11至14中的任一权利要求所述的信号处理方法，

其中，在所述频带检测步骤中：

计算在第一频率范围和频率高于所述第一频率范围的第二频率范围中的音频信号的电平；

基于计算出的在第一频率范围和第二频率范围中的电平来设定阈值；以及

基于设定的阈值从所述音频信号中检测所述频带。

16.根据权利要求15所述的信号处理方法，

其中，在所述频带检测步骤中，从所述音频信号中检测如下的频带：其频率上限是电平下降低于阈值的至少一个频率点之中的最高频率点。

17.根据权利要求11至16中的任一权利要求所述的信号处理方法，

其中，在所述内插信号产生步骤中：

对所述音频信号的至少一部分执行第二回归分析；

通过将计算出的每个频率分量的内插信号加权值与经扩展的频带内的每个频率分量相乘来产生所述内插信号。

18.根据权利要求17所述的信号处理方法，

其中，通过所述第二回归分析获得的所述频率特性信息包括经扩展的频带内的所述频率分量的变化率，以及

其中，在所述内插信号产生步骤中，随着所述变化率在负方向上变大而增加所述内插信号加权值。

19.根据权利要求17或18所述的信号处理方法，

其中，在所述内插信号产生步骤中，随着所述第二回归分析的范围的频率上限变得更高而增加所述内插信号加权值。

20.根据权利要求11至19中的任一权利要求所述的信号处理方法，

其中，当满足以下条件(1)至(3)中的至少一个时，不在所述内插信号产生步骤中执行所述内插信号的产生：

(1)检测到的振幅谱Sa等于或小于预定频率范围；

(2)在第二频率范围的所述信号电平等于或大于预定值；或者

(3)在第一频率范围与第二频率范围之间的信号电平差等于或小于预定值。