CN105324815A - 信号处理装置和信号处理方法 - Google Patents
信号处理装置和信号处理方法 Download PDFInfo
- Publication number
- CN105324815A CN105324815A CN201480031036.4A CN201480031036A CN105324815A CN 105324815 A CN105324815 A CN 105324815A CN 201480031036 A CN201480031036 A CN 201480031036A CN 105324815 A CN105324815 A CN 105324815A
- Authority
- CN
- China
- Prior art keywords
- frequency
- signal
- reference signal
- interpolated
- frequency band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 16
- 230000005236 sound signal Effects 0.000 claims abstract description 93
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims abstract description 11
- 230000003595 spectral effect Effects 0.000 claims description 44
- 238000004458 analytical method Methods 0.000 claims description 38
- 230000008859 change Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 description 23
- 238000000605 extraction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 5
- 230000002427 irreversible effect Effects 0.000 description 5
- 238000012417 linear regression Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000009931 harmful effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 208000012639 Balance disease Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
一种信号处理装置包括:用于从音频信号中检测满足预定条件的频带的频带检测构件;用于根据由频带检测构件检测到的频带来产生参考信号的参考信号产生构件;用于基于所产生的参考信号本身的频率特性来校正参考信号的参考信号校正构件;用于扩展所述经校正的参考信号达到高于检测到的带的频带的频带扩展构件;用于通过根据音频信号的频率特性来加权经扩展的频带内的每个频率分量,而产生内插信号的内插信号产生构件;以及用于合成所产生的内插信号与音频信号的信号合成构件。
Description
技术领域
本发明涉及用于通过产生内插信号并且合成所述内插信号与音频信号,来内插所述音频信号的高频率分量的一种信号处理装置和一种信号处理方法。
背景技术
对于音频信号的压缩形式,已知例如MP3(MPEG音频层-3)、WMA(Windows媒体音频,注册商标)和AAC(高级音频编码)等不可逆的压缩形式。在不可逆的压缩形式中,通过大幅度切除接近或超出可听范围上限的高频率分量来实现高压缩率。当开发这种类型的技术时,人们曾认为,即使在大幅度切除高频率分量时听觉音质也不会发生退化。然而,近年来,大幅度切除高频率分量略微改变了音质并降低了听觉音质的想法正变成主流。因此,已经提出通过对以不可逆方式压缩的音频信号执行高频率内插来改进音质的高频率内插装置。这种类型的高频率内插装置的特定配置例如在第2007-25480A号日本临时专利公开文本(下文中称为专利文献1)中以及在第2007-534478号日本专利申请的再公开文本(下文中称为专利文献2)中进行了公开。
在专利文献1中公开的高频率内插装置计算通过分析音频信号(原始信号)获得的信号的实部和虚部,使用计算出的实部和虚部形成原始信号的包络分量,并且提取所形成的包络分量的高次谐波分量。在专利文献1中公开的高频率内插装置通过合成所提取的高次谐波分量与原始信号来对原始信号执行高频率内插。
在专利文献2中公开的高频率内插装置倒转音频信号的频谱,对倒转了频谱的信号进行上采样,并且从经上采样信号中提取扩展带分量,经上采样信号的低频率端与基带信号的高频率范围几乎相同。在专利文献2中公开的高频率内插装置通过合成所提取的扩展带分量与基带信号来对基带信号执行高频率内插。
发明内容
以不可逆方式压缩的音频信号的频带根据压缩编码格式、采样率和压缩编码之后的比特率而改变。因此,如果如专利文献1中所公开的通过合成固定频带的内插信号与音频信号来执行高频率内插,那么取决于在高频率内插之前的音频信号的频带,高频率内插之后音频信号的频谱变得不连续。因此,使用专利文献1中所公开的高频率内插装置对音频信号执行高频率内插会具有降低听觉音质的不良影响。
此外,作为一般特性,在较高频率下音频信号电平的衰减较大,但是存在音频信号的电平在高频率侧瞬时放大的情况。然而,在专利文献2中,仅将前一种一般特性考虑为待输入到装置的音频信号的特性。因此,在输入电平在高频率侧放大的音频信号之后,音频信号的频谱立即变得不连续,并且高频率区过度突出。因此,如同专利文献1中所公开的高频率内插装置,使用专利文献2中所公开的高频率内插装置对音频信号执行高频率内插会具有降低听觉音质的不良影响。
鉴于以上情况进行了本发明,并且本发明的目的是提供一种信号处理装置和一种信号处理方法,其能够通过高频率内插来实现音质改进,而与不可逆方式压缩的音频信号的频率特性无关。
本发明的一个方面提供了一种信号处理装置,其包括:用于从音频信号中检测满足预定条件的频带的频带检测构件;用于根据频带检测构件检测到的检测带来产生参考信号的参考信号产生构件;用于基于所产生的参考信号的频率特性来校正所产生的参考信号的参考信号校正构件;用于扩展经校正的参考信号达到高于检测带的频带的频带扩展构件;用于通过根据音频信号的频率特性来加权经扩展的频带内的每个频率分量,而产生内插信号的内插信号产生构件;以及用于合成所产生的内插信号与音频信号的信号合成构件。
根据以上配置,由于利用根据音频信号的频率特性的值来校正参考信号,并且基于经校正的参考信号来产生内插信号,以及该内插信号与音频信号合成,所以通过高频率内插实现了音质改进,而与音频信号的频率特性无关。
例如,参考信号校正构件将由参考信号产生构件产生的参考信号校正为平坦频率特性。
另外,参考信号校正构件可以配置为对由参考信号产生构件产生的参考信号执行第一回归分析;基于通过第一回归分析获得的频率特性信息,对参考信号的每个频率计算参考信号加权值;以及通过将计算出的每个频率的参考信号加权值与参考信号相乘来校正参考信号。
例如,参考信号产生构件提取在高频率侧整个检测带的n%内的范围,并且将所提取的分量设定为参考信号。
频带检测构件可以配置为计算在第一频率范围和高于第一频率范围的第二频率范围中的音频信号的电平;基于计算出的在第一和第二频率范围中的电平来设定阈值;以及基于设定的阈值从音频信号中检测频带。
另外,例如,频带检测构件从音频信号中检测如下的频带:其频率上限是电平下降低于阈值的至少一个频率点之中的最高频率点。
内插信号产生构件可以配置为对音频信号的至少一部分执行第二回归分析;基于通过第二回归分析获得的频率特性信息,对经扩展的频带内的每个频率分量计算内插信号加权值;以及通过将计算出的每个频率分量的内插信号加权值与经扩展的频带内的每个频率分量相乘来产生内插信号。
例如,通过第二回归分析获得的频率特性信息包括经扩展的频带内的频率分量的变化率。在此情况下,内插信号产生构件随着变化率在负方向上变大而增加内插信号加权值。
另外,例如,内插信号产生构件随着第二回归分析的范围的频率上限变得更高而增加内插信号加权值。
另外,当满足以下条件(1)到(3)中的至少一个时,信号处理装置可以配置为不执行通过内插信号产生构件来产生内插信号:
(1)检测到的振幅谱Sa等于或小于预定的频率范围;
(2)在第二频率范围的信号电平等于或大于预定值;或者
(3)第一频率范围与第二频率范围之间的信号电平差等于或小于预定值。
本发明的另一个方面提供了一种信号处理方法,其包括:从音频信号中检测满足预定条件的频带的频带检测步骤;根据通过频带检测构件检测到的检测带来产生参考信号的参考信号产生步骤;基于所产生的参考信号的频率特性来校正所产生的参考信号的参考信号校正步骤;扩展经校正的参考信号达到高于检测带的频带的频带扩展步骤;通过根据音频信号的频率特性来加权经扩展的频带内的每个频率分量,而产生内插信号的内插信号产生步骤;以及合成所产生的内插信号与音频信号的信号合成步骤。
根据以上配置,由于利用根据音频信号的频率特性的值来校正参考信号,并且基于经校正的参考信号产生内插信号,以及将该内插信号与音频信号合成,所以通过高频率内插实现了音质改进,而与音频信号的频率特性无关。
例如,在参考信号校正步骤中,由参考信号产生构件产生的参考信号可以被校正为平坦频率特性。
在参考信号校正步骤中,可以对由参考信号产生构件产生的参考信号执行第一回归分析;可以基于通过第一回归分析获得的频率特性信息,对参考信号的每个频率计算参考信号加权值;以及可以通过将计算出的每个频率的参考信号加权值与参考信号相乘来校正参考信号。
在参考信号产生步骤中,可以提取在高频率侧整个检测带的n%内的范围,并且可以将所提取的分量设定为参考信号。
在频带检测步骤中,可以计算在第一频率范围和频率高于第一频率范围的第二频率范围中的音频信号的电平;可以基于计算出的在第一和第二频率范围中的电平来设定阈值;以及可以基于设定的阈值从音频信号中检测频带。
在频带检测步骤中,可以从音频信号中检测如下的频带,其频率上限是电平下降低于所述阈值的至少一个频率点之中的最高频率点。
在内插信号产生步骤中,可以对音频信号的至少一部分执行第二回归分析;可以基于通过第二回归分析获得的频率特性信息,对经扩展的频带内的每个频率分量计算内插信号加权值;以及可以通过将计算出的每个频率分量的内插信号加权值与经扩展的频带内的每个频率分量相乘来产生内插信号。
通过第二回归分析获得的频率特性信息包括经扩展的频带内的频率分量的变化率,并且在内插信号产生步骤中,可以随着变化率在负方向上变大而增加内插信号加权值。
在内插信号产生步骤中,可以随着第二回归分析的范围的频率上限变得更高而增加内插信号加权值。
当满足以下条件(1)到(3)中的至少一个时,所述信号处理方法可以配置为不在内插信号产生步骤中产生内插信号:
(1)检测到的振幅谱Sa等于或小于预定频率范围;
(2)在第二频率范围的信号电平等于或大于预定值;或者
(3)第一频率范围与第二频率范围之间的信号电平差等于或小于预定值。
附图说明
图1是示出本发明的实施方案的声音处理装置的配置的框图。
图2是示出提供到本发明实施方案的声音处理装置的高频率内插处理单元的配置的框图。
图3是用于辅助解释提供到本发明实施方案的高频率内插处理单元的频带检测单元的性能的辅助图。
图4示出用于解释使用通过本发明实施方案的频带检测单元检测到的振幅谱,执行高频率内插的一系列过程的操作波形图。
图5示出说明在不校正参考信号的情况下产生的内插信号的图。
图6示出说明在不校正参考信号的情况下产生的内插信号的图。
图7示出展示加权值P2(x)与各个参数之间的关系的图。
图8示出说明在彼此不同的操作条件下产生的高频率内插之后的音频信号的图。
图9示出说明在彼此不同的操作条件下产生的高频率内插之后的音频信号的图。
具体实施方式
下文中,将参考附图来描述根据本发明的实施方案的声音处理装置。
[声音处理装置1的整体配置]
图1是示出本实施方案的声音处理装置1的配置的框图。如图1中所示,声音处理装置1包括FFT(快速傅里叶变换)单元10、高频率内插处理单元20以及IFFT(快速傅里叶逆变换)单元30。
从声音源输入通过对以不可逆的压缩格式的编码信号进行解码,而由声音源产生的音频信号至FFT单元10。不可逆的压缩格式是MP3、WMA、AAC等。FFT单元10对所输入的音频信号,利用窗函数执行叠加过程和加权,并且接着使用STFT(短期傅里叶变换)将经加权的信号从时域变换为频域,以获得实部频谱和虚部频谱。FFT单元10将通过频率变换获得的频谱变换为振幅谱和相位谱。FFT单元10将振幅谱输出到高频率内插处理单元20,并将相位谱输出到IFFT单元30。高频率内插处理单元20内插从FFT单元10输入的振幅谱的高频率区,并且将经内插的振幅谱输出到IFFT单元30。由高频率内插处理单元20内插的频带是例如通过不可逆的压缩大幅度切除的、接近或超出可听范围上限的高频带。IFFT单元30基于通过高频率内插处理电路20内插了高频率区的振幅谱、以及从FFT单元10输出并且保持原样的相位谱,来计算实部频谱和虚部频谱,并且使用窗函数执行加权。IFFT单元30使用STFT和重叠相加来将经加权的信号从频域变换为时域,以及产生并输出内插了高频率区的音频信号。
[高频率内插处理单元20的配置]
图2是示出高频率内插处理单元20的配置的框图。如图2中所示,高频率内插处理单元20包括:频带检测单元210、参考信号提取单元220、参考信号校正单元230、内插信号产生单元240、内插信号校正单元250以及加法单元260。应注意,为方便解释,至高频率内插处理单元20中的单元中的每一个和来自所述单元中的每一个的输入信号和输出信号中的每一个后接符号。
图3是用于辅助解释频带检测单元210的性能的图,并且示出将从FFT单元10输入到频带检测单元210的振幅谱S的示例。在图3中,竖轴(y轴)是信号电平(单位:dB),且横轴(x轴)是频率(单位:Hz)。
频带检测单元210将从FFT单元10输入的音频信号的振幅谱S(线性标度)变换为分贝标度。频带检测单元210计算在预定的低/中间频率范围和预定的高频率范围内转化成分贝标度的振幅谱S的信号电平,并且基于在低/中间频率范围和高频率范围内计算出的信号水平来设定阈值。例如,如图3中所示,阈值是在低/中间频率范围内的信号电平(平均值)和高频率范围内的信号电平(平均值)的中间电平处。
频带检测单元210从由FFT单元10输入的振幅谱S(线性标度)中,检测具有如下频带的音频信号(振幅谱Sa),该频带的频率上限是信号电平下降低于阈值的频率点。如果如图3中所示存在信号电平下降低于阈值的多个频率点,则检测具有频率上限是最高频率点(在图3中示出的示例中,频率ft)的频带的振幅谱Sa。频带检测单元210通过进行平滑以抑制包括于振幅谱Sa中的局部离差,来使检测到的振幅谱Sa平滑。应注意,如果满足以下条件(1)至(3)中的至少一个,则判断出无需产生内插信号,从而抑制不必要的内插信号产生。
(1)检测到的振幅谱Sa等于或小于预定的频率范围。
(2)在高频率范围的信号电平等于或大于预定值。
(3)在低/中间频率范围与高频率范围之间的信号电平差等于或小于预定值。
对判断出的不需要产生内插信号的振幅谱不执行高频率内插。
图4(a)至图4(h)示出用于解释使用通过频带检测单元210检测到的振幅谱Sa,执行高频率内插的一系列过程的操作波形图。在图4(a)至图4(h)中的每一个中,竖轴(y轴)是信号电平(单位:dB),且横轴(x轴)是频率(单位:Hz)。
通过频带检测单元210检测到的振幅谱Sa被输入到参考信号提取单元220。参考信号提取单元220根据振幅谱Sa的频带,从振幅谱Sa中提取参考信号Sb(见图4(a))。例如,将在高频率侧整个振幅谱Sa的n%(0<n)范围内的振幅谱提取为参考谱Sb。应注意,存在这样的问题:使用由声带(例如,自然声)产生的内插信号来内插音频信号降低了音频信号的音质,这样很可能给人带来不舒适的听觉感受。相反,在以上示例中,由于参考信号Sb的频带随着参考信号Sa的频带变得更窄而变得更窄,因此可以抑制导致音质退化的声带的提取。
参考信号提取单元220将从振幅谱Sa提取的参考信号Sb的频率移位至低频率侧(DC侧)(见图4(b)),并且将频率移位的参考信号Sb输出至参考信号校正单元230。
参考信号校正单元230将从参考信号提取单元220输入的参考信号Sb(线性标度)变换为分贝标度,并且使用线性回归分析来检测变换为分贝标度的参考信号Sb的频率斜率。参考信号校正单元230计算使用线性回归分析检测的频率斜率的逆特性(针对参考信号Sb的每个频率的加权值)。具体来说,当针对参考信号Sb的每个频率的加权值定义为P1(x)时,横轴(x轴)上频域中的FFT样本位置定义为x,使用线性回归分析检测的参考信号Sb的频率斜率的值定义为α1,并且对应于参考信号Sb的频带的FFT样本的数量的1/2定义为β1,参考信号校正单元230使用以下表达式(1)来计算频率斜率的逆特性(针对参考信号Sb的每个频率的加权值P1(x))。
[表达式1]
P1(x)=-α1x+β1
如图4(c)中所示,针对参考信号Sb的每个频率计算得到的加权值P1(x)以分贝标度。参考信号校正单元230将分贝标度的加权值P1(x)变换为线性标度。参考信号校正单元230通过将变换为线性标度的加权值P1(x)与从参考信号提取单元220输入的参考信号Sb(线性标度)相乘来校正参考信号Sb。具体来说,参考信号Sb被校正为具有平坦频率特性的信号(参考信号Sb')(见图4(d))。
由参考信号校正单元230校正的参考信号Sb'被输入至内插信号产生单元240。内插信号产生单元240通过扩展参考信号Sb'达到高于振幅谱Sa的频带的频带来产生包括高频率区的内插信号Sc(见图4(e))(换句话说,将参考信号Sb'复制,直至复制的信号达到高于振幅谱Sa的频带的频带)。内插信号Sc具有平坦频率特性。另外,例如,参考信号Sb'的扩展的范围包括:振幅谱Sa的整个频带、以及在高于振幅谱Sa的频带的预定范围内的频带(接近可听范围的上限的频带、超出可听范围的上限的频带等)。
由内插信号产生单元240产生的内插信号Sc被输入到内插信号校正单元250。内插信号校正单元250将从FFT单元10输入的振幅谱S(线性标度)变换为分贝标度,并且使用线性回归分析来检测变换为分贝标度的振幅谱S的频率斜率。应注意,代替检测振幅谱S的频率斜率,而可以检测从频带检测单元210输入的振幅谱Sa的频率斜率。可以任意地设定回归分析的范围,但是通常,回归分析的范围是对应于不包括低频率分量的预定频带的范围,以平滑地连接音频信号的高频率侧和内插信号。内插信号校正单元250基于检测的频率斜率和对应于回归分析的范围的频带来计算针对每个频率的加权值。具体来说,当针对每个频率处的内插信号Sc的加权值定义为P2(x)时,横轴(x轴)上频域中的FFT样本位置定义为x,回归分析的范围的频率上限定义为b,FFT的样本长度定义为s,对应于回归分析的范围的频带中的斜率定义为α2,并且预定的校正系数定义为k,内插信号校正单元250使用以下表达式(2)来计算每个频率处的内插信号Sc的加权值P2(x)。
[表达式2]
P2(x)=-α'x+β2
其中,
α'=α2-[1-(b/s)]/k
β2=-α'b
当x<b时,P2(x)=-∞
如图4F中所示,以分贝标度来计算在每个频率处内插信号Sc的加权值P2(x)。内插信号校正单元250将加权值P2(x)从分贝标度变换为线性标度。内插信号校正单元250通过将变换为线性标度的加权值P2(x)与由内插信号产生单元240产生的内插信号Sc(线性标度)相乘来校正内插信号Sc。例如,如图4G中所示,校正的内插信号Sc'是在高于频率b的频带中的信号并且其衰减在更高频率处更大。
从内插信号校正单元250输入的内插信号Sc'以及来自FFT单元10的振幅谱S输入至加法单元260。振幅谱S是高频率分量大幅度切除的音频信号的振幅谱,并且内插信号Sc'是在高于音频信号的频带的频率区中的振幅谱。加法单元260产生通过合成振幅谱S与内插信号Sc'而内插了高频率区的音频信号的振幅谱S'(见图4H),并且将所产生的音频信号振幅谱S'输出至IFFT单元30。
在本实施方案中,根据振幅谱Sa的频带来提取参考信号Sb,从通过校正所提取的参考信号Sb而获得的参考信号Sb'中产生内插信号Sc',并且将所述内插信号Sc'与振幅谱S(音频信号)合成。因此,利用具有相对于音频信号连续地衰减的自然特性的谱,来内插音频信号的高频率区,而与输入至FFT单元10的音频信号的频率特性无关(例如,即使当音频信号的频带已经根据压缩编码格式等而改变时,或即使当输入电平在高频率侧放大的音频信号时)。因此,通过高频率内插实现了听觉音质的改进。
图5和图6说明了在不校正参考信号的情况下产生的内插信号。在图5和图6的每一个中,竖轴(y轴)是信号电平(单位:dB),且横轴(x轴)是频率(单位:Hz)。图5说明了衰减在更高频率处变得更大的音频信号,且图6说明了电平在高频率区放大的音频信号。图5(a)和图6(a)中的每一个示出了从音频信号中提取的参考信号。图5(b)和图6(b)中的每一个示出了通过扩展所提取的参考信号达到高于音频信号的频带的频带所产生的内插信号。如图5B和图6B中的每一个所示,在不校正参考信号的情况下,内插信号的谱变得不连续。因此,在图5和图6示出的示例中,对音频信号执行高频率内插具有降低听觉音质的相反效果。
以下是本实施方案的声音处理装置1的示例性操作参数。
(FFT单元10/IFFT单元30)
样本长度:8,192个样本
窗函数:汉宁函数
叠加长度:50%
(频带检测单元210)
最小控制频率:7kHz
低/中间频率范围:2kHz~6kHz
高频率范围:20kHz~22kHz
高频率范围电平判断:-20dB
信号电平差:20dB
阈值:0.5
(参考信号提取单元220)
参考带宽:2.756kHz
(内插信号校正单元250)
低频率限制:500Hz
校正系数k:0.01
“最小控制频率(=7kHz)”意指如果通过频带检测单元210检测到的振幅谱Sa低于7kHz,则不执行高频率内插。“高频率范围电平判断(=-20dB)”意指如果在高频率范围的信号电平等于或大于-20dB,则不执行高频率内插。“信号电平差(=20dB)”意指如果在高低/中间频率范围与高频率范围之间的信号电平差等于或小于20dB,则不执行高频率内插。“阈值(=0.5)”意指用于检测振幅谱Sa的阈值是在低/中间频率范围的信号电平(平均值)与高频率范围的信号电平(平均值)之间的中间值。“参考带宽(=2.756kHz)”是对应于“最小控制频率(=7kHz)”的参考信号Sb的带宽。“低频率限制(=500Hz)”指示通过内插信号校正单元250进行的回归分析的范围的下限(即,低于500Hz的频率不包括在回归分析的范围中)。
图7(a)示出了如下情况的加权值P2(x),当利用以上示例性操作参数时,频率b固定为8kHz并且频率斜率α2在0至-0.010的范围内以-0.002的间隔变化。图7B示出了如下情况的加权值P2(x),当利用以上示例性操作参数时,频率斜率α2固定为0(平坦频率特性),并且频率b在8kHz至20kHz的范围内以2kHz的间隔变化。在图7(a)和图7(b)的每一个中,竖轴(y轴)是信号电平(单位:dB),且横轴(x轴)是频率(单位:Hz)。应注意,在图7(a)和图7(b)示出的示例中,FFT样本位置变换为频率。
参考图7(a)和图7(b),可以理解,加权值P2(x)根据频率斜率α2和频率b而改变。具体来说,如图7(a)中所示,加权值P2(x)随着频率斜率α2在负方向上变得更大而变得更大(即,对于在更高频率处其衰减更大的音频信号,加权值P2(x)更大),并且内插信号Sc'在高频率区的衰减变得更大。另外,如图7B中所示,加权值P2(x)随着频率b变得更大而变得更小,并且内插信号Sc'在高频率区的衰减变得更小。因此,通过根据音频信号的频率斜率或回归分析的范围来改变内插信号Sc'的斜率,利用具有相对于音频信号连续衰减的自然特性的谱来内插接近或超出可听范围上限的音频信号的高频率区。因此,通过高频率内插实现了听觉音质的改进。另外,由于参考信号的频带随着音频信号的频带变得更窄而变得更窄,因此可以抑制引起音质退化的声带的提取。此外,由于内插信号的电平随着音频信号的频带变得更窄而变得更小,因此多余的内插信号不合成至例如具有狭窄频带的音频信号。
图8(a)示出了在更高频率处其衰减更大的音频信号(频带:10kHz)。图8(b)至8(e)中的每一个示出了可以通过使用以上示例性操作参数来内插图8(a)中示出的音频信号的高频率区而获得的信号。应注意,图8(b)至8(e)的操作条件彼此不同。在图8(a)至8(e)中的每一个中,竖轴(y轴)是信号电平(单位:dB),且横轴(x轴)是频率(单位:Hz)。
图8(b)示出了从高频率内插过程中省略参考信号的校正和内插信号的校正的示例。另外,图8(c)示出了从高频率内插过程中省略内插信号的校正的示例。在图8(b)和图8(c)中示出的示例中,具有平坦频率特性的内插信号合成至图8(a)中示出的音频信号。在图8(b)和图8(c)中示出的示例中,由于归因于多余高频率分量的内插而导致了频率均衡损失,因此听觉音质退化。
图8(d)示出了从高频率内插过程中省略参考信号的校正的示例。另外,图8(e)示出了从高频率内插过程中不省略任何过程的示例。在图8(d)中示出的示例中,高频率内插之后的音频信号具有在更高频率处衰减更大的特性,但是不能说谱是连续地衰减的。在图8(d)中示出的示例中,很可能的是,谱中保留的不连续区域给用户带来不舒适的听觉感受。相反,在图8(e)中示出的示例中,高频率内插之后的音频信号具有自然谱特性,其中谱的电平连续地衰减并且在更高频率处衰减变得更大。比较图8(d)和图8(e),可以理解,通过不仅执行内插信号的校正而且执行参考信号的校正,利用高频率内插实现了听觉音质的改进。
图9(a)示出了其信号电平在高频率区放大的音频信号(频带:10kHz)。图9(b)至9(e)中的每一个示出了可以通过使用以上示例性操作参数来内插图9(a)中示出的音频信号的高频率区而获得的信号。图9(b)至9(e)的操作条件分别与图8(b)至8(e)的操作条件相同。
在图9(b)中示出的示例中,具有不连续谱的内插信号合成至图9(a)中示出的音频信号。在图9(c)中示出的示例中,具有平坦频率特性的内插信号合成至图9(a)中示出的音频信号。在图9(b)和图9(c)中示出的示例中,由于归因于具有不连续特性的内插信号的合成或归因于多余高频率分量的内插而导致频率均衡损失,因此听觉音质退化。
在图9(d)中示出的示例中,高频率内插之后的音频信号的衰减在更高频率处更大,但是谱的变化不连续。在图9(d)中示出的示例中,很可能的是,不连续区域给用户带来不舒适的听觉感受。相反,在图9(e)中示出的示例中,高频率内插之后的音频信号具有自然谱特性,其中谱的电平连续地衰减并且在更高频率处衰减变得更大。比较图9(d)和图9(e),可以理解,通过不仅执行内插信号的校正而且执行参考信号的校正,利用高频率内插实现了听觉音质的改进。
以上是本发明的说明性实施方案的描述。本发明的实施方案不限于以上阐述的实施方案,并且在本发明的技术理念的范围内各种修改是可能的。例如,在说明书中指定的示例性实施方案和/或从说明书中显而易见的示例性实施方案的适当组合也包括在本发明的实施方案中。例如,在本实施方案中,参考信号校正单元230使用线性回归分析来校正电平在频带内一致地放大或衰减的参考信号Sb。然而,参考信号Sb的特性不限于线性这一种,并且在一些情况下,其可以是非线性的。在校正信号电平在频带内反复地放大和衰减的参考信号Sb的情况下,参考信号校正单元230使用升高程度的回归分析来计算逆特性,并且使用计算出的逆特性来校正参考信号Sb。
Claims (20)
1.一种信号处理装置,其包括:
频带检测构件,其用于从音频信号中检测满足预定条件的频带;
参考信号产生构件,其用于根据所述频带检测构件检测到的检测带产生参考信号;
参考信号校正构件,其用于基于所产生的参考信号的频率特性来校正所产生的参考信号;
频带扩展构件,其用于扩展经校正的参考信号达到高于检测带的频带;
内插信号产生构件,其用于通过根据所述音频信号的频率特性加权经扩展的频带内的每个频率分量来产生内插信号;以及
信号合成构件,其用于合成所产生的内插信号与所述音频信号。
2.根据权利要求1所述的信号处理装置,
其中,所述参考信号校正构件将由所述参考信号产生构件产生的参考信号校正为平坦频率特性。
3.根据权利要求1或2所述的信号处理装置,
其中,所述参考信号校正构件:
对由所述参考信号产生构件产生的参考信号执行第一回归分析;
基于通过所述第一回归分析获得的频率特性信息,对所述参考信号的每个频率计算参考信号加权值;
通过将计算出的每个频率的参考信号加权值与所述参考信号相乘来校正所述参考信号。
4.根据权利要求1至3中的任一权利要求所述的信号处理装置,
其中,所述参考信号产生构件提取在高频率侧的整体检测带的n%内的范围并且将所提取的分量设定为所述参考信号。
5.根据权利要求1至4中的任一权利要求所述的信号处理装置,
其中,所述频带检测构件:
计算在第一频率范围和高于所述第一频率范围的第二频率范围中的所述音频信号的电平;
基于计算出的在第一和第二频率范围中的电平来设定阈值;以及
基于设定的阈值从所述音频信号中检测所述频带。
6.根据权利要求5所述的信号处理装置,
其中,所述频带检测构件从所述音频信号中检测如下的频带,其频率上限是电平下降低于所述阈值的至少一个频率点之中的最高频率点。
7.根据权利要求1至6中的任一权利要求所述的信号处理装置,
其中,所述内插信号产生构件:
对所述音频信号的至少一部分执行第二回归分析;
基于通过所述第二回归分析获得的频率特性信息,对经扩展的频带内的每个频率分量计算内插信号加权值;以及
通过将计算出的每个频率分量的内插信号加权值与经扩展的频带内的每个频率分量相乘来产生内插信号。
8.根据权利要求7所述的信号处理装置,
其中,通过所述第二回归分析获得的所述频率特性信息包括经扩展的频带内的频率分量的变化率,以及
其中,所述内插信号产生构件随着所述变化率在负方向上变大而增加所述内插信号加权值。
9.根据权利要求7或8所述的信号处理装置,
其中,所述内插信号产生构件随着所述第二回归分析的范围的频率上限变得更高而增加所述内插信号加权值。
10.根据权利要求1至9中的任一权利要求所述的信号处理装置,
其中,当满足以下条件(1)至(3)中的至少一个时,所述信号处理装置不执行通过所述内插信号产生构件来产生所述内插信号:
(1)检测到的振幅谱Sa等于或小于预定的频率范围;
(2)在第二频率范围的信号电平等于或大于预定值;或者
(3)第一频率范围与第二频率范围之间的信号电平差等于或小于预定值。
11.一种信号处理方法,其包括:
从音频信号中检测满足预定条件的频带的频带检测步骤;
根据通过所述频带检测步骤检测到的检测带来产生参考信号的参考信号产生步骤;
基于所产生的参考信号的频率特性来校正所产生的参考信号的参考信号校正步骤;
扩展经校正的参考信号达到高于所述检测带的频带的频带扩展步骤;
通过根据所述音频信号的频率特性加权经扩展的频带内的每个频率分量来产生内插信号的内插信号产生步骤;以及
合成所产生的内插信号与所述音频信号的信号合成步骤。
12.根据权利要求11所述的信号处理方法,
其中,在所述参考信号校正步骤中,通过所述参考信号产生步骤产生的所述参考信号被校正为平坦频率特性。
13.根据权利要求11或12所述的信号处理方法,
其中,在所述参考信号校正步骤中:
对由所述参考信号产生步骤产生的所述参考信号执行第一回归分析;
基于通过所述第一回归分析获得的频率特性信息,对所述参考信号的每个频率计算参考信号加权值;以及
通过将计算出的每个频率的参考信号加权值与所述参考信号相乘来校正所述参考信号。
14.根据权利要求11至13中的任一权利要求所述的信号处理方法,
其中,在所述参考信号产生步骤中,提取在高频率侧整个检测带的n%内的范围,并且将所提取的分量设定为参考信号。
15.根据权利要求11至14中的任一权利要求所述的信号处理方法,
其中,在所述频带检测步骤中:
计算在第一频率范围和频率高于所述第一频率范围的第二频率范围中的音频信号的电平;
基于计算出的在第一频率范围和第二频率范围中的电平来设定阈值;以及
基于设定的阈值从所述音频信号中检测所述频带。
16.根据权利要求15所述的信号处理方法,
其中,在所述频带检测步骤中,从所述音频信号中检测如下的频带:其频率上限是电平下降低于阈值的至少一个频率点之中的最高频率点。
17.根据权利要求11至16中的任一权利要求所述的信号处理方法,
其中,在所述内插信号产生步骤中:
对所述音频信号的至少一部分执行第二回归分析;
基于通过所述第二回归分析获得的频率特性信息,对经扩展的频带内的每个频率分量计算内插信号加权值;以及
通过将计算出的每个频率分量的内插信号加权值与经扩展的频带内的每个频率分量相乘来产生所述内插信号。
18.根据权利要求17所述的信号处理方法,
其中,通过所述第二回归分析获得的所述频率特性信息包括经扩展的频带内的所述频率分量的变化率,以及
其中,在所述内插信号产生步骤中,随着所述变化率在负方向上变大而增加所述内插信号加权值。
19.根据权利要求17或18所述的信号处理方法,
其中,在所述内插信号产生步骤中,随着所述第二回归分析的范围的频率上限变得更高而增加所述内插信号加权值。
20.根据权利要求11至19中的任一权利要求所述的信号处理方法,
其中,当满足以下条件(1)至(3)中的至少一个时,不在所述内插信号产生步骤中执行所述内插信号的产生:
(1)检测到的振幅谱Sa等于或小于预定频率范围;
(2)在第二频率范围的所述信号电平等于或大于预定值;或者
(3)在第一频率范围与第二频率范围之间的信号电平差等于或小于预定值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013-116004 | 2013-05-31 | ||
JP2013116004A JP6305694B2 (ja) | 2013-05-31 | 2013-05-31 | 信号処理装置及び信号処理方法 |
PCT/JP2014/063789 WO2014192675A1 (ja) | 2013-05-31 | 2014-05-26 | 信号処理装置及び信号処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105324815A true CN105324815A (zh) | 2016-02-10 |
CN105324815B CN105324815B (zh) | 2019-03-19 |
Family
ID=51988707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480031036.4A Active CN105324815B (zh) | 2013-05-31 | 2014-05-26 | 信号处理装置和信号处理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10147434B2 (zh) |
EP (1) | EP3007171B1 (zh) |
JP (1) | JP6305694B2 (zh) |
CN (1) | CN105324815B (zh) |
WO (1) | WO2014192675A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109557509A (zh) * | 2018-11-23 | 2019-04-02 | 安徽四创电子股份有限公司 | 一种用于改善脉间干扰的双脉冲信号合成器 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6401521B2 (ja) * | 2014-07-04 | 2018-10-10 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
US9495974B1 (en) * | 2015-08-07 | 2016-11-15 | Tain-Tzu Chang | Method of processing sound track |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
US11240673B2 (en) * | 2019-11-20 | 2022-02-01 | Andro Computational Solutions | Real time spectrum access policy based governance |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1475010A (zh) * | 2000-11-15 | 2004-02-11 | ���뼼�����ɷݹ�˾ | 增强使用高频重建方法的编码系统的性能 |
JP2008058470A (ja) * | 2006-08-30 | 2008-03-13 | Hitachi Maxell Ltd | 音声信号処理装置、音声信号再生システム |
CN101273404A (zh) * | 2005-09-30 | 2008-09-24 | 松下电器产业株式会社 | 语音编码装置以及语音编码方法 |
CN101868823A (zh) * | 2007-10-23 | 2010-10-20 | 歌乐株式会社 | 高频插值装置和高频插值方法 |
CN102027537A (zh) * | 2009-04-02 | 2011-04-20 | 弗劳恩霍夫应用研究促进协会 | 利用谐波带宽扩充及非谐波带宽扩充的组合、基于输入信号表示型态产生扩充带宽信号的表示型态的装置、方法及计算机程序 |
CN102598123A (zh) * | 2009-10-23 | 2012-07-18 | 松下电器产业株式会社 | 编码装置、解码装置及其方法 |
CN103026408A (zh) * | 2010-07-19 | 2013-04-03 | 华为技术有限公司 | 音频信号产生装置 |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5596658A (en) * | 1993-06-01 | 1997-01-21 | Lucent Technologies Inc. | Method for data compression |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
EP1503371B1 (en) * | 2000-06-14 | 2006-08-16 | Kabushiki Kaisha Kenwood | Frequency interpolating device and frequency interpolating method |
WO2003003345A1 (fr) * | 2001-06-29 | 2003-01-09 | Kabushiki Kaisha Kenwood | Dispositif et procede d'interpolation des composantes de frequence d'un signal |
US6988066B2 (en) * | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
CA2359771A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time audio synthesis system and method |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
KR100554680B1 (ko) * | 2003-08-20 | 2006-02-24 | 한국전자통신연구원 | 크기 변화에 강인한 양자화 기반 오디오 워터마킹 장치 및방법 |
WO2005086139A1 (en) * | 2004-03-01 | 2005-09-15 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
DE102004033564B3 (de) | 2004-07-09 | 2006-03-02 | Siemens Ag | Sortiereinrichtung für flache Sendungen |
JP4701392B2 (ja) | 2005-07-20 | 2011-06-15 | 国立大学法人九州工業大学 | 高域信号補間方法及び高域信号補間装置 |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
EP1870880B1 (en) * | 2006-06-19 | 2010-04-07 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
DE102006047197B3 (de) * | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
WO2008022181A2 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Updating of decoder states after packet loss concealment |
US8295507B2 (en) * | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
JP5547081B2 (ja) * | 2007-11-02 | 2014-07-09 | 華為技術有限公司 | 音声復号化方法及び装置 |
US8594343B2 (en) * | 2008-05-01 | 2013-11-26 | Japan Science And Technology Agency | Sound processing apparatus and sound processing method |
WO2009157280A1 (ja) * | 2008-06-26 | 2009-12-30 | 独立行政法人科学技術振興機構 | オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法 |
WO2010005033A1 (ja) * | 2008-07-11 | 2010-01-14 | クラリオン株式会社 | 音響処理装置 |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
CN101983402B (zh) * | 2008-09-16 | 2012-06-27 | 松下电器产业株式会社 | 声音分析装置、方法、系统、合成装置、及校正规则信息生成装置、方法 |
EP2214165A3 (en) * | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
TWI559680B (zh) * | 2009-02-18 | 2016-11-21 | 杜比國際公司 | 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法 |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CO6440537A2 (es) * | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
TWI675367B (zh) * | 2009-05-27 | 2019-10-21 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
CA2792452C (en) * | 2010-03-09 | 2018-01-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an input audio signal using cascaded filterbanks |
JP5652658B2 (ja) * | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) * | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
ES2719102T3 (es) * | 2010-04-16 | 2019-07-08 | Fraunhofer Ges Forschung | Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega |
US9117459B2 (en) * | 2010-07-19 | 2015-08-25 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
BR122021003887B1 (pt) * | 2010-08-12 | 2021-08-24 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
US9532059B2 (en) * | 2010-10-05 | 2016-12-27 | Google Technology Holdings LLC | Method and apparatus for spatial scalability for video coding |
JP5707842B2 (ja) * | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP2803137B1 (en) * | 2012-01-10 | 2016-11-23 | Cirrus Logic International Semiconductor Limited | Multi-rate filter system |
US9154353B2 (en) * | 2012-03-07 | 2015-10-06 | Hobbit Wave, Inc. | Devices and methods using the hermetic transform for transmitting and receiving signals using OFDM |
US9728200B2 (en) * | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
JP2016035501A (ja) * | 2014-08-01 | 2016-03-17 | 富士通株式会社 | 音声符号化装置、音声符号化方法、音声符号化用コンピュータプログラム、音声復号装置、音声復号方法及び音声復号用コンピュータプログラム |
-
2013
- 2013-05-31 JP JP2013116004A patent/JP6305694B2/ja active Active
-
2014
- 2014-05-26 EP EP14804912.5A patent/EP3007171B1/en active Active
- 2014-05-26 US US14/894,579 patent/US10147434B2/en active Active
- 2014-05-26 WO PCT/JP2014/063789 patent/WO2014192675A1/ja active Application Filing
- 2014-05-26 CN CN201480031036.4A patent/CN105324815B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1475010A (zh) * | 2000-11-15 | 2004-02-11 | ���뼼�����ɷݹ�˾ | 增强使用高频重建方法的编码系统的性能 |
CN101273404A (zh) * | 2005-09-30 | 2008-09-24 | 松下电器产业株式会社 | 语音编码装置以及语音编码方法 |
JP2008058470A (ja) * | 2006-08-30 | 2008-03-13 | Hitachi Maxell Ltd | 音声信号処理装置、音声信号再生システム |
CN101868823A (zh) * | 2007-10-23 | 2010-10-20 | 歌乐株式会社 | 高频插值装置和高频插值方法 |
CN102027537A (zh) * | 2009-04-02 | 2011-04-20 | 弗劳恩霍夫应用研究促进协会 | 利用谐波带宽扩充及非谐波带宽扩充的组合、基于输入信号表示型态产生扩充带宽信号的表示型态的装置、方法及计算机程序 |
CN102177545A (zh) * | 2009-04-09 | 2011-09-07 | 弗兰霍菲尔运输应用研究公司 | 用以产生合成音频信号及将音频信号编码的装置与方法 |
CN102598123A (zh) * | 2009-10-23 | 2012-07-18 | 松下电器产业株式会社 | 编码装置、解码装置及其方法 |
CN103026408A (zh) * | 2010-07-19 | 2013-04-03 | 华为技术有限公司 | 音频信号产生装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109557509A (zh) * | 2018-11-23 | 2019-04-02 | 安徽四创电子股份有限公司 | 一种用于改善脉间干扰的双脉冲信号合成器 |
CN109557509B (zh) * | 2018-11-23 | 2020-08-11 | 安徽四创电子股份有限公司 | 一种用于改善脉间干扰的双脉冲信号合成器 |
Also Published As
Publication number | Publication date |
---|---|
EP3007171B1 (en) | 2019-09-25 |
US10147434B2 (en) | 2018-12-04 |
US20160104499A1 (en) | 2016-04-14 |
JP6305694B2 (ja) | 2018-04-04 |
EP3007171A4 (en) | 2017-03-08 |
CN105324815B (zh) | 2019-03-19 |
JP2014235274A (ja) | 2014-12-15 |
WO2014192675A1 (ja) | 2014-12-04 |
EP3007171A1 (en) | 2016-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190341015A1 (en) | Single-channel, binaural and multi-channel dereverberation | |
EP3166107B1 (en) | Audio signal processing device and method | |
US9117455B2 (en) | Adaptive voice intelligibility processor | |
CN105324815A (zh) | 信号处理装置和信号处理方法 | |
JP2005318598A (ja) | 信号処理におけるまたはそれに関する改善 | |
EP2172930A1 (en) | Audio signal processing device and audio signal processing method | |
JP2010014914A (ja) | 音声強調装置 | |
US10128809B2 (en) | Intelligent method and apparatus for spectral expansion of an input signal | |
JP6138015B2 (ja) | 音場測定装置、音場測定方法および音場測定プログラム | |
JP5208413B2 (ja) | 多重チャネル信号の処理方法 | |
JP6533959B2 (ja) | 音声信号処理装置および音声信号処理方法 | |
JP2008076636A (ja) | オーディオ信号補間方法及びオーディオ信号補間装置 | |
EP2943954B1 (en) | Improving speech intelligibility in background noise by speech-intelligibility-dependent amplification | |
EP2407966A1 (en) | Method and Apparatuses for bandwidth expansion for voice communication | |
JP2006324786A (ja) | 音響信号処理装置およびその方法 | |
JP2007043231A (ja) | 自動音量制御装置 | |
Zhu et al. | Streaming audio packet loss concealment based on sinusoidal frequency estimation in MDCT domain | |
US20180270574A1 (en) | Dynamic audio enhancement using an all-pass filter | |
Sonoda et al. | Digital watermarking method based on STFT histogram | |
Kaniewska | Human voice modification using instantaneous complex frequency | |
Ule et al. | Description of the multiple look approach for calculating unsteady loudness | |
JP2009109791A (ja) | 音声信号処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |