CN103250208A - 信号处理装置、信号处理方法和信号处理程序 - Google Patents
信号处理装置、信号处理方法和信号处理程序 Download PDFInfo
- Publication number
- CN103250208A CN103250208A CN2011800565393A CN201180056539A CN103250208A CN 103250208 A CN103250208 A CN 103250208A CN 2011800565393 A CN2011800565393 A CN 2011800565393A CN 201180056539 A CN201180056539 A CN 201180056539A CN 103250208 A CN103250208 A CN 103250208A
- Authority
- CN
- China
- Prior art keywords
- signal
- component
- amplitude
- phase
- rotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 4
- 230000008859 change Effects 0.000 claims abstract description 37
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 238000003786 synthesis reaction Methods 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 abstract description 9
- 230000002194 synthesizing effect Effects 0.000 abstract 2
- 238000001228 spectrum Methods 0.000 description 104
- 230000001629 suppression Effects 0.000 description 52
- 238000000034 method Methods 0.000 description 38
- 230000009466 transformation Effects 0.000 description 38
- 230000002708 enhancing effect Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 10
- 238000009826 distribution Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 7
- 238000003860 storage Methods 0.000 description 5
- 238000006073 displacement reaction Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000009432 framing Methods 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000003292 diminished effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/10—Means associated with receiver for limiting or suppressing noise or interference
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
Abstract
本发明能够获得高质量的增强的信号,并且包括:变换装置,用于将混合信号变换成每个频率的相位分量和振幅分量或功率分量,在所述混合信号中混合有第一信号和第二信号;第一控制装置,用于旋转预定频率的所述相位分量;第二控制装置,用于根据由于所述第一控制装置所执行的旋转造成的振幅分量或功率分量的改变量,来校正所述预定频率的所述振幅分量或所述功率分量;以及合成装置,用于合成由所述第一控制装置旋转的所述相位分量和由所述第二控制装置校正的所述振幅分量或功率分量。
Description
技术领域
本发明涉及用于控制信号的相位分量的信号处理技术。
背景技术
作为用于控制信号的相位分量并执行信号处理的技术实例,在专利文献1和非专利文献1中公开了专注在相位谱上的一种噪声抑制技术。在专利文献1和非专利文献1中描述的所述技术抑制与噪声有关的振幅谱并同时随机地将相位谱移位小于或等于π/4的值。对于无法仅通过经由随机移位相位谱而减弱噪声谱来抑制的噪声,在专利文献1和非专利文献1中描述的所述技术实现了对该噪声的抑制。
[现有技术文献]
[专利文献]
[专利文献1]国际公开WO2007/029536
[非专利文献]
[非专利文献1]Akihiko Sugiyama“Single-Channel Impact-NoiseSuppression with no Auxiliary Information for its Detection”,Proc.IEEE Workshop on Application of Signal Processing to Audio andAcoustics(WASPAA信号处理在音频与声学中的应用研讨会),pp.127-130和21-24,2007年10月。
发明内容
[本发明要解决的问题]
然而,当像专利文献1和非专利文献1中描述的技术那样随机地移位相位谱时,在相邻帧之间出现相位谱的失配,并且在帧合成时信号电平下降。结果,在噪声抑制时段和非噪声抑制时段之间的输出信号电平中出现差异,并且输出信号的质量下降。
本发明的目的是提供一种解决上面提到的问题的信号处理技术。
[解决问题的手段]
为了实现上面提到的目的,根据本发明的一种装置包括:变换装置,用于将混合信号变换成每个频率中的相位分量和振幅分量或功率分量,在所述混合信号中混合有第一信号和第二信号;第一控制装置,用于旋转预定频率中的所述相位分量;第二控制装置,用于根据由所述第一控制装置旋转的所述振幅分量或功率分量的改变量,来补偿所述预定频率中的所述振幅分量或所述功率分量;以及合成装置,用于合成由所述第一控制装置旋转的所述相位分量和由所述第二控制装置补偿的所述振幅分量或功率分量。
为了实现上面提到的目的,根据本发明的一种方法包括:变换步骤,用于将混合信号变换成每个频率中的相位分量和振幅分量或者功率分量,在所述混合信号中混合有第一信号和第二信号;第一控制步骤,用于旋转预定频率中的所述相位分量;第二控制步骤,用于根据由所述第一控制步骤执行的所述旋转产生的所述振幅分量或者功率分量的改变量,来补偿所述预定频率中的所述振幅分量或者所述功率分量;以及合成步骤,用于合成由所述第一控制步骤旋转的所述相位分量和由所述第二控制步骤补偿的所述振幅分量或者功率分量。
为了实现上面提到的目的,一种根据本发明的储存在程序记录介质中的程序使计算机执行:变换步骤,用于将混合信号变换成每个频率中的相位分量和振幅分量或者功率分量,在所述混合信号中混合有第一信号和第二信号;第一控制步骤,用于旋转预定频率中的所述相位分量;第二控制步骤,用于根据由所述第一控制步骤执行的所述旋转所产生的所述振幅分量或者功率分量的改变量,来补偿所述预定频率中的所述振幅分量或者所述功率分量;以及合成步骤,用于合成由所述第一控制步骤旋转的所述相位分量和由所述第二控制步骤补偿的所述振幅分量或者功率分量。
[发明的效果]
根据本发明,能够提供一种信号处理技术,其在不使输出信号的质量恶化的情况下控制输入信号的相位分量。
附图说明
图1为框图,其示出作为本发明第一示例实施例的信号处理装置的概略配置。
图2为框图,其示出作为本发明第二示例实施例的噪声抑制装置的概略配置。
图3为框图,其示出包括在本发明的第二示例实施例中的变换单元的构造。
图4为框图,其示出包括在本发明的第二示例实施例中的逆变换单元的构造。
图5为框图,其示出包括在本发明的第二示例实施例中的噪声抑制单元的构造。
图6为图表,其示出本发明的第二示例实施例中当在频域中不执行相位旋转时的信号流。
图7为图表,其示出本发明的第二示例实施例中当在频域中执行相位旋转时的信号流。
图8为图表,其示出本发明的第二示例实施例中当在频域中不执行相位旋转时的帧的重叠相加。
图9为图表,其示出本发明的第二示例实施例中当在频域中执行相位旋转时的帧的重叠相加。
图10为图表,其通过矢量示出本发明的第二示例实施例中当在频域中执行相位旋转时的频域信号。
图11为图表,其通过矢量示出本发明的第二示例实施例中当在频域中不执行相位旋转时的频域信号。
图12为框图,其示出根据本发明第三示例实施例的相位控制单元和振幅控制单元的构造。
图13为框图,其示出根据本发明第四示例实施例的相位控制单元和振幅控制单元的构造。
图14为框图,其示出根据本发明第五示例实施例的相位控制单元和振幅控制单元的构造。
图15为框图,其示出根据本发明第六示例实施例的相位控制单元和振幅控制单元的构造。
图16为框图,其示出作为本发明第七示例实施例的噪声抑制装置的概略配置。
图17为框图,其示出作为本发明第七示例实施例的相位控制单元和振幅控制单元的构造。
图18为框图,其示出作为本发明第八示例实施例的噪声抑制装置的概略配置。
图19为框图,其示出作为本发明第九示例实施例的噪声抑制装置的概略配置。
图20为框图,其示出作为本发明其他示例实施例的噪声抑制装置的概略配置。
具体实施方式
下面将参考附图详细地示例地描述本发明的示例实施例。然而,在下面的示例实施例中描述的部件最终只是说明,并且它们并非要将本发明的技术范围仅限于这些部件。
(第一示例实施例)
图1为图表,其示出根据本发明第一示例实施例的信号处理装置100的概略配置。
在图1中,信号处理装置100包括变换单元101、第一控制单元102、第二控制单元103和合成单元104。变换单元101变换混合信号110,在所述混合信号中,第一信号和第二信号被混合成每个频率中的相位分量120和振幅分量或者功率分量130。替代地,第一控制单元102旋转预定频率中的相位分量120。此外,与由于第一控制单元102执行的旋转导致的振幅分量或功率分量的变化量相对应,第二控制单元103补偿预定频率中的振幅分量或功率分量。另一方面,合成单元104合成由第一控制单元102旋转的相位分量140和由第二控制单元103补偿的振幅分量或功率分量150。
基于上面提到的构造,根据第一示例实施例的信号处理装置100能够在不让输出信号的质量恶化的情况下控制输入信号的相位分量。
(第二示例实施例)
<<整个配置>>
将使用图2到图11来描述作为本发明第二示例实施例的噪声抑制装置200。图2为框图,其示出噪声抑制装置200的整个配置。例如,该示例实施例的噪声抑制装置200还用作诸如数字相机、膝上型电脑和蜂窝式电话这样的装置的一部分,但是本发明不限于这些装置。该噪声抑制装置200可适用于需要给输入信号降噪的所有信息处理装置。
噪声信号(期望信号和噪声的混合信号)作为采样值系列被供应到输入端206。当噪声信号被供应到输入端206时,变换单元201对所供应的噪声信号进行傅里叶变换的变换等等,并将噪声信号分成多个频率分量。变换单元201独立地处理每个频率中的所述多个频率分量。这里继续关注特定频率分量进行解释。变换单元201将多个频率分量中的振幅谱(振幅分量)230供应给噪声抑制单元205。变换单元201将多个频率分量的相位谱(相位分量)220供应给相位控制单元202。另外,在这里,虽然变换单元201将噪声信号振幅谱230供应给噪声抑制单元205,本发明并不限于此。变换单元201可以将与噪声信号振幅谱230的平方相对应的功率谱供应给噪声抑制单元205。
噪声抑制单元205使用从变换单元201供应的噪声信号振幅谱230来推测噪声,并生成估计的噪声谱。并且,噪声抑制单元205使用从变换单元201供应的噪声信号振幅谱230和所生成的估计的噪声谱来抑制噪声。噪声抑制单元205将作为噪声抑制结果的增强后信号振幅谱发送到振幅控制单元203。相位控制单元202使从变换单元201供应的噪声信号相位谱220旋转(移位),并将其(作为增强后信号相位谱240)供应到逆变换单元204。并且,相位控制单元202将该相位的所述旋转量(位移量)发送到振幅控制单元203。振幅控制单元203从相位控制单元202接收该相位的所述旋转量(位移量),并计算振幅补偿量。振幅控制单元203使用所述振幅补偿量来补偿每个频率中的增强的信号振幅谱,并产生补偿的振幅谱250。振幅控制单元203将所述补偿的振幅谱250供应给逆变换单元204。逆变换单元204合成从相位控制单元202供应的增强的信号相位谱240和从振幅控制单元203供应的补偿的振幅谱250,执行逆变换,并将其作为增强的信号供应给输出端207。
<<变换单元201的构造>>
图3为框图,其示出变换单元201的构造。如图3中所示,变换单元201包括帧分割单元301、加窗单元(加窗单元)302以及傅里叶变换单元303。噪声信号采样被供应到帧分割单元301,其对于每K/2的采样被分隔成帧,其中K为偶数。被分割成帧的所述噪声信号采样被供应到加窗单元302,并且它被用作为窗函数的w(t)乘在一起。通过w(t)加窗的信号,其对应于第n帧的输入信号yn(t)(t=0以及1…K/2-1),由下面的方程(1)给出。
[方程1]
并且,加窗单元302可以堆叠(重叠)连续的两个帧的多个部分,并对它们加窗。当假定帧长度的50%为重叠长度时,根据t=0,1…K/2-1时由下述方程(2)得到的左侧为加窗单元302的输出。
[方程2]
加窗单元302可以对实数信号使用对称窗函数。并且,除了当MMSESTSA方法中的抑制系数被设定为1时或者在SS方法中减去零时的计算误差以外,窗函数被设计成使得输入信号和输出信号是一致的。这意味着变成w(t)+w(t+K/2)=1。
在这之后,将这种情况当作其中通过让连续两个帧的50%重叠来执行加窗的示例,继续进行说明。加窗单元302可以使用由例如下面的方程(3)所示的Hanning窗口作为w(t)。
[方程3]
另外,也知道各种窗口函数,诸如Hamming窗口和三角形窗口。被加窗的输出被供应给傅里叶变换单元303,并被变换成噪声信号谱Yn(k)。噪声信号谱Yn(k)被分成相位和振幅,该噪声信号相位谱argYn(k)被供应给相位控制单元202,而噪声信号振幅谱|Yn(k)|被供应给噪声抑制单元205。如已经描述的那样,可以使用功率谱而非振幅谱。
<<逆变换单元204的构造>>
图4为框图,其示出逆变换单元204的构造。如图4中所示,逆变换单元204包括傅里叶逆变换单元401、加窗单元402和帧合成单元403。傅里叶逆变换单元401将从振幅控制单元203供应的补偿的振幅谱250与从相位控制单元202供应的增强的信号相位谱argXn(k)乘在一起,并获得增强的信号(下面的方程(4)的左侧)。
[方程4]
傅里叶逆变换单元401对所获得的增强的信号执行傅里叶逆变换。作为时域采样值系列xn(t)(t=0,1…K-1),其中一帧包括K个采样,被变换成逆傅里叶的增强的信号被供应给加窗单元402,并且它被乘以窗函数w(t)。被w(t)加窗的信号,其对应于第n帧的输入信号xn(t)(t=0,1…K-1),由下面的方程(5)的左侧给出。
[方程5]
并且,加窗单元302可以堆叠(重叠)连续的两个帧的多个部分,并可对它们加窗。当假定帧长度的50%为重叠长度时,通过下述方程得到的左侧将是加窗单元402对t=0,1…K/2-1时的输出,并且它被发送到帧合成单元403。
[方程6]
帧合成单元403分别在K/2采样处从加窗单元402取出相邻的两个帧的输出,将它们堆叠,并通过使用下面的方程(7)获得在t=0,1…K-1处的输出信号(方程(7)的左侧)。所获得的输出信号被从帧合成单元403发送到输出端207。
[方程7]
另外,虽然在变换单元201和逆变换单元204中的变换在图3和图4中描述为傅里叶变换,变换单元201和逆变换单元204可以使用其他变换,诸如Hadamard变换、Haar变换、小波变换等等而非傅里叶变换。当变换单元201和逆变换单元204使用Haar变换时,乘法成为不必要的并且当被集成到LSI上时它们可以在区域上减小。当变换单元201和逆变换单元204使用小波变换时,因为它们能够根据频度将时间解析度改变成不同的值,可以预期提高噪声抑制效果。
并且,可以在统一了在变换单元201中获得的多个频率分量以后在噪声抑制单元205中执行实际抑制。在这种情况中,通过统一从听觉特性的区别能力高的低频区域到区别能力低的高频区域的更多频率分量,能够实现高质量的声音。因而,当在统一了多个频率分量以后执行噪声抑制时,噪声抑制被应用的频率分量的数量减小,整个操作数量能够减小。
<<噪声抑制单元205的构造>>
噪声抑制单元205使用从变换单元201供应的噪声信号振幅谱230来推测噪声,并生成估计的噪声谱。噪声抑制单元205使用来自变换单元201的噪声信号振幅谱和所生成的估计的噪声谱获得抑制系数。噪声抑制单元205将噪声信号振幅谱乘以所获得的抑制系数,并将其供应到振幅控制单元203作为增强的信号振幅谱。
如M.Kato、A.Sugiyama和M.Serizawa在“Noise suppression withhigh speech quality based on weighted noise estimation and MMSESTSA”,IEICE Trans.Fundamentals(日文版),卷J87-A,no.7,第851-860页,2004年7月(文献1)中以及R.Martin在“Spectralsubtraction based on minimum statistics”,EUSPICO-94,第1182-1185页,1994年9月(文献2)中所指出的那样,在推测噪声时可以使用各种估计方法。
例如,有一种方法(文献1)是取估计的噪声谱为其中不出现目标声音的帧的噪声信号振幅谱的平均值。在这种方法中,需要检测目标声音的出现。可以通过增强的信号的功率判断出目标声音出现的时段。
作为理想的操作状态,增强的信号成为目标声音而不是噪声。并且,目标声音和噪声的电平在相邻帧之间不会明显变化。因为这些,过去的一帧的增强的信号电平被取为判断噪声时段的指标。当过去的一帧的增强的信号的功率是稳定值或者更少时,当前帧被判断为噪声时段。通过等于判断为噪声时段的帧的噪声信号振幅谱,而推测所述噪声谱。
而且,还有方法(文献1)是将估计的噪声谱取为当噪声信号振幅谱开始要被供应的推测的早期阶段的平均值。在这种情况中,需要满足条件:刚好在已经开始推测后不再包括目标声音。当满足该条件时,在推测的早期阶段中的噪声信号振幅谱被设定为估计的噪声谱。
此外,还有方法(文献2)是从统计的噪声信号振幅谱的最小值获得估计的噪声谱。在这种方法中,在固定时间中的噪声信号振幅谱的最小值被保持,并且统计上从所述最小值推测噪声谱。因为噪声信号振幅谱的最小值类似于噪声谱的谱形状,它可以被用作噪声谱形状的估计值。然而,在该最小值中,噪声信号振幅谱变得小于初始噪声电平。因此,使最小值被适当放大的将被用作估计的噪声谱。
噪声抑制单元205能够执行各种抑制。在典型抑制方法中,有SS(谱减法)方法和MMSESTSA(最小均方误差短时谱幅度估计)方法。当噪声抑制单元205使用SS方法时,噪声抑制单元205从自变换单元201供应的噪声信号振幅谱中减去估计的噪声谱。当噪声抑制单元205使用MMSESTA方法时,噪声抑制单元205使用从变换单元201供应的噪声信号振幅谱和所生成的估计的噪声谱来计算抑制系数,并将噪声信号振幅谱乘以该抑制系数。确定该抑制系数从而可以使增强的信号的均方功率最小化。
噪声抑制单元205可以执行各种噪声推测。例如,在估计方法中,有一种方法通过使用其中不出现目标声音的帧的噪声信号振幅谱,取其平均值作为估计的噪声谱。并且,还有一种方法是将噪声信号振幅谱开始要被供应时的初始阶段的平均值取为估计的噪声谱。此外,有一种方法通过统计观测噪声信号振幅谱的最小值,而将该最小值取为估计的噪声谱。
<<相位控制单元202和振幅控制单元203的构造>>
图5为框图,其示出相位控制单元202和振幅控制单元203的构造。如图5中所示,相位控制单元202包括相位旋转单元501和旋转量生成单元502。振幅控制单元203包括补偿量计算单元503和振幅补偿单元504。
旋转量生成单元502生成噪声信号相位谱的旋转量并将其供应给相位旋转单元501和补偿量计算单元503。
相位旋转单元501从变换单元201得到噪声信号相位谱220的供应,并且从旋转量生成单元502得到旋转量的供应。相位旋转单元501将噪声信号相位谱220仅旋转(移位)供应的旋转量,并将其供应给逆变换单元204作为增强的信号相位谱240。
补偿量计算单元503基于从旋转量生成单元502供应的旋转量确定振幅的补偿系数,并将其供应给振幅补偿单元504。
例如,旋转量生成单元502使用随机数生成旋转量。相位旋转单元501使用旋转量生成单元502基于随机数生成的所述旋转量,旋转每个频率中的所述噪声信号相位谱。噪声信号相位谱220的形状根据相位旋转单元501执行的旋转而改变。基于这种形状的改变,能够削弱噪声特征。
在随机数中,存在具有均匀发生概率的均匀随机数,其中发生概率表现出正态分布的正态随机数,等等。这里,将描述使用均匀随机数生成旋转量的方法。均匀随机数通过线性同余方法等产生。这里,给出通过线性同余方法的均匀随机数作为示例,并继续对其进行说明。通过线性同余方法生成的均匀随机数在0到(2^M)-1的范围上均匀地分布。
这里,M是可选整数,并且^表示幂。相位的旋转量需要构成0~2π范围的分布。因此,生成的均匀随机数被变换以便被分布到0~2π范围。该变换由下面的方程(8)执行。这里,R是均匀随机数。Rmax是生成的均匀随机数的最大值。当通过上面提到的线性同余方法生成时,Rmax将是Rmax=(2^M)-1。
[方程8]
R的值可以构成旋转量,仅为了计算简化。因为它是旋转量,2π表示正好一次旋转。当相位旋转2π时,其与没有进行旋转的情况是相同的。因此,旋转量为2π+α变得与旋转量为α的情况相同。这里,虽然已经描述了使用线性同余方法生成均匀随机数的情况,甚至当通过除了该方法以外的方法生成均匀随机数时,也可以使用方程(8)来获得旋转量
相位旋转单元501从旋转量生成单元502接收旋转量,并旋转噪声信号相位谱。当噪声信号相位谱由角度表示时,相位旋转单元501通过将旋转量的值加入所述角度而旋转。当噪声信号相位谱由复数的规则矢量来表示时,相位旋转单元501获得旋转量的规则矢量,并通过将噪声信号相位谱乘以它而旋转。
[方程9]
Φ=cos(φ)+jsin(φ)…(9)
将描述由补偿量计算单元503进行的补偿系数计算方法。首先,使用图6和7描述由于相位旋转而出现了输出电平的下降。
图6和图7示出当用图2中所示的框图处理噪声信号时的信号。在图6和图7之间的差异是存在相位旋转或不存在相位旋转。图6示出不进行相位旋转时的信号,而图7示出从帧3进行相位旋转时的信号。
首先,将使用图6来描述不旋转相位时的信号。在图6的最顶部的图为噪声信号。在帧分割单元301中执行帧分割。来自顶部的被虚线隔开的第二信号是执行帧分割后的信号。在图6中,示出了用于四个连续帧的信号。并且,帧的重叠率取为50%。
对被分割成帧的信号,加窗处理单元302执行加窗。来自顶部的被虚线隔开的第三信号是加窗处理后的信号。在图6中,为了清楚地示出基于相位旋转的影响,使用矩形窗口给予它们权重。
接下来,虽然在加窗处理之后该信号被使用傅里叶变换单元303变换成频域信号,在图6中省略了该频域信号。从相位旋转的虚线的较低部分示出基于逆变换单元204的傅里叶逆变换单元401的被变换成时域的信号。来自顶部的被虚线隔开的第四信号是相位旋转后的信号。然而,因为在图6中未进行相位旋转,相位旋转之后的信号并不从加窗处理后的信号改变。
从逆变换单元204的傅里叶逆变换单元401输出的增强的信号被再一次执行加窗处理。在图6中,示出了使用矩形窗口的给予权重的情况。执行了加窗处理的信号在帧合成单元403中被合成。此时,它需要安排帧之间的时间。因为帧的重叠率为50%,所述帧正好重叠一半。当不执行相位的旋转时,如图6所示,输入信号和输出信号是相同的。
另一方面,将使用图7来描述旋转相位时的信号。在图7中示出的是从帧3执行相位旋转时的信号。在最顶部的图是与图6相同的噪声信号。在帧分割之后和加窗处理之后的信号也和图6中的类似。
在图7中,绘出了其中从帧3执行固定的相位旋转的情况。注意到,在相位旋转的虚线的较低部分中示出向右三角形的分块。帧3和4的信号被信号旋转处理移位到时间方向。被执行相位旋转的所述信号被再次执行加窗处理,并且执行帧合成。此时,在其中帧2和帧3重叠的ii中的分块中,帧2和帧3的信号出现了差异。据此,在帧合成之后的输出信号电平在ii期间变小。就是说,当进行相位旋转时,输出信号电平在图7的ii期间降低。
通过针对频域中的相加来改变时域中的相加,能够用频域的矢量合成来描述基于这种相位旋转的输出信号电平的下降。
针对帧分割和加窗处理之后的两个连续帧的噪声信号在图8中示出为x1[n]和x2[m]。此外,重叠率定为50%。这里,n表示x1的离散时间,m表示x2的离散时间。当重叠率为50%时,建立下面的方程(10)。
[方程10]
并且x1和x2之间的关系则如下面的方程(11)所示。
[方程11]
首先,示出了从时域信号到频域信号的变换方程和逆变换方程。频域信号X[k]如下面的使用时域信号x[n]的傅里叶变换方程(12)那样表示。这里,k表示离散频率而L为帧长度。
[方程12]
并且,当使用逆变换将频域信号X[k]返回到时域信号x[n]时,如下面的方程(13)那样表示。
[方程13]
基于此,当时域信号x1[n]和x2[m]被变换成频域信号X1[k]和X2[k]时,它们如下面的方程(14)和(15)那样表示。
[方程14]
[方程15]
当使用逆变换将频域信号X1[k]和X2[k]分别返回到时域信号x1[n]和x2[m]时,它们如下面的利用方程(13)的方程(16)和方程(17)那样表示。
[方程16]
[方程17]
逆变换单元使用傅里叶逆变换将频域信号变换成时域信号。之后,帧合成单元403执行前一帧和当前帧的增强的声音的重叠相加。
例如,在示出例子的重叠率50%中,帧合成单元403在m=L/2-L-1的离散时间的时段中进行相邻帧的相加。考虑了这个相加时段m=L/2~L-1。
当方程(16)和(17)被时域的相加取代时,其如下面的方程(18)那样表示。
[方程18]
此外,当方程(14)和(15)被方程(18)中的频域信号X1[k]和X2[k]取代时,其如下面的方程(19)那样表示。
[方程19]
此外,当展开方程(19)时,它如下面的方程(20)那样表示。
[方程20]
…(20)
这里,考虑了包括在方程(20)的每一项中的总的计算。通过引入任意整数g,建立下面的方程(21)。
[方程21]
Delta函数δ(g)的傅里叶逆变换由方程(22)示出。
[方程22]
这里,Delta函数δ(g)由下面的方程(23)示出。
[方程23]
能够使用方程(22)将方程(21)变换成下面的方程(24)。
[方程24]
方程(20)由与方程(24)关联的下面的方程(25)表示。
[方程25]
因此,方程(20)变成下面的方程(26)。
[方程26]
顺便地,这里考虑了其中对频域信号X2[k]执行相位旋转的情况。此时,时域信号变成如图9所示那样。
[方程27]
当其被方程(18)代替时,建立了下面的方程(28)。
[方程28]
当展开上述方程时,建立了下面的方程(29)。
[方程29]
…(29)
这里,交迭率估计为50%,并考虑了n=L/2~L-1的重叠时段。在重叠时段中,可以使用方程(11)将其展开如下面的方程(30)那样。
[方程30]
…(30)
这里,因为在各个项的括号中的(方程(13)中指出的)项是矢量合成,当注意特定频率k时,它可以被绘成如图10中所示。
[方程31]
1+ejφ[k]…(31)
[方程32]
补偿量计算单元503确定增强的信号振幅谱的振幅补偿量,从而补偿上述输出信号电平的减小的量。
这里,假定使用均匀随机数来确定相位旋转量,具体地描述补偿量的计算方法。这里,要注意由于旋转造成的相位的改变,每个频率分量应当用单位矢量归一化以简化该问题。
首先,考虑考虑不进行相位旋转的情况。当相位在连续帧之间相同时,合成矢量变得像图11中所示的矢量S,而矢量的大小|S|由下面的方程(33)表示。
[方程33]
另一方面,当使用均匀随机数进行相位旋转时,在连续帧之间的相位差被均匀地分布在从到-π到+π范围上。在连续帧之间的相位不同时,合成矢量变得如图10中所示的矢量S’。矢量的大小|S’|由下面的方程(34)表示。
方程34
顺便地,这里,当得到期望E(|S’|^2)时,它变得如下面的方程(35)。
[方程35]
E(|S′|2)=E(2+2cosφ)=E(2)+E(2cosφ)…(35)
这里,因为被均匀地分布在从到-π到+π上,其变成如下面的方程(36)。
[方程36]
E(2cos(φ))=0…(36)
因此,期望|S’|^2由下面的方程(37)表示。
[方程37]
E(|S′|2)=2…(37)
顺便地,当不执行相位旋转时,期望E(|S|^2)由来自方程(33)的下面的方程(38)表示。
[方程38]
E(|S|2)=E(22)
=E(4) …(38)
=4
当取方程(37)和方程(38)之比时,建立下面的方程(39)。
[方程39]
E(|S′|2)/E(|S|2)=2/4=1/2…(39)
就是说,当相位旋转了均匀随机数时,输出信号的功率平均值与输入方面相比仅变小了1/2。振幅补偿单元504对振幅值进行补偿。因此,补偿量计算单元503计算补偿系数sqrt(2),并将其发送到振幅补偿单元504。
这里,虽然作为示例描述了使用均匀随机数生成旋转量的情况,如果针对正态随机数的方差和均值被确定了,则唯一地设定补偿系数。下面将描述使用正态随机数时补偿系数的导出。
当使用正态随机数执行相位旋转时,输出功率期望值E(S”^2)通过引入加权函数和整数值到作为均匀随机数的输出功率期望值的方程(35)中而如下面的方程(40)表示的那样。
[方程40]
[方程41]
这里,σ表示方差而μ表示均值。
例如,在均值μ=0而方差σ=1的标准正态分布中,因为在它被方程(40)代替时它变成下面的方程(42),所以它变成像方程(43)一样。
[方程42]
[方程43]
这里,因为在方程(43)的右侧的第二项的数值被计算时建立方程(44),在不执行相位旋转时它和E(|S^2|)之比由方程(45)表示。
[方程44]
E(|S″|2)=2{1+0.609}=3.218…(44)
[方程45]
E(|S″|2)/E(|S|2)=3.218/4=0.805…(45)
当相位被旋转了标准正态分布的正态随机数时,补偿量计算单元503计算补偿系数为sqrt(1/0.805)并将其发送到振幅补偿单元504。相位控制单元202可以在所有频率中执行相位旋转,或者可以在部分频率下执行相位旋转。振幅控制单元203仅在其中执行相位旋转的频率中执行振幅补偿。因此,在其中未执行相位旋转的频率的补偿系数取为1.0。执行相位旋转的频率的补偿系数仅变成导出的值。
<<对振幅补偿单元504的解释>>
振幅控制单元203使用从相位控制单元202发送的相位旋转量来计算振幅补偿系数。振幅控制单元203将从噪声抑制单元205供应的增强的信号振幅谱乘以计算出的振幅补偿系数,并将其提供到逆变换单元204。基于将增强的信号振幅谱乘以振幅补偿系数,噪声抑制装置200能够旋转噪声信号相位谱并且在获得增强的信号相位谱时消除减小的输出电平。
如上所述,根据这个示例实施例的噪声抑制装置200能够去除振幅控制单元203进行的相位谱的旋转操作对输出信号电平的影响。因此,噪声抑制装置200能够获得高质量的增强的信号。
(第三示例实施例)
使用图12来描述本发明的第三示例实施例。该示例实施例不同于第二示例实施例之处在于限制了相位旋转量的上限。因为在除了这一点以外的构造和操作上,第三实施例与第二示例实施例相同,这里将省略详细的描述。
图12为框图,其示出根据这一示例实施例的相位控制单元1202和振幅控制单元203的构造。如图12中所示,在该示例实施例中的相位控制单元1202包括旋转量限制单元1221(除了第二示例实施例中描述的旋转量生成单元502以及相位旋转单元501以外)。旋转量生成单元502生成收到来自旋转量限制单元1221的限制的噪声信号相位谱的旋转量,并将其供应给相位旋转单元501。
旋转量限制单元1221将由旋转量生成单元502生成的旋转量限制在固定范围内。就是说,旋转量限制单元1221将的分布限制在从0到2π的可选范围内。例如,旋转量限制单元1221将的分布限制在像从0到π/2。据此,噪声信号相位谱的特征在某种程度上保持在增强的信号相位谱中。因为与其中相位完全随机旋转的情况相比,噪声信号的特征在某种程度上被保持,对目标声音的影响变得很小。因此,减小了目标声音的失真。
除了第二示例实施例的效果以外,根据这个示例实施例的本发明能够基于对相位旋转量的限制而减小目标声音的恶化。
(第四示例实施例)
将使用图13来描述本发明的第四示例实施例。根据这个示例实施例的本发明不同于第二示例实施例之处在于通过延迟相位分量并且获得帧之间的相位分量上的差异而计算补偿量。就是说,它在相位控制单元1302和振幅控制单元1303的内部配置上不同于第二示例实施例。因为其他构造和操作与第二示例实施例的相同,这里将省略相应描述。
图13为框图,其示出在这个示例实施例中的相位控制单元1302和振幅控制单元1303的构造。如图13中所示,第四示例实施例中的相位控制单元1302包括在第二示例实施例中包括的相位旋转单元501和旋转量生成单元502。相位控制单元1302将旋转之后的相位供应给振幅控制单元1303。并且,振幅控制单元1303包括相位分量延迟单元1331、补偿量计算单元1333和振幅补偿单元504。
相位分量延迟单元1331保持从相位旋转单元501供应的增强的信号相位谱的一帧,并且将其供应给补偿量计算单元1333。
补偿量计算单元1333计算在来自相位分量延迟单元1331的一帧之前的增强的信号相位谱和来自相位旋转单元501的当前的增强的信号相位谱的振幅补偿量,并将其发送到振幅补偿单元504。
相位分量延迟单元1331保持增强的信号相位谱的一帧并将其延迟一帧,并将它供应给补偿量计算单元1333。通过简单地将增强的信号相位谱延迟一帧,而实现相位分量延迟单元1331。
除了第二示例实施例的效果以外,根据这个示例实施例的本发明能够补偿输出电平,即使当不能用方程导出输出电平的期望作为相位旋转量。例如,虽然在使用随机数表的随机数中的出现概率中有偏差,根据这个示例实施例的本发明能够令人满意地补偿输出电平。
补偿量计算单元1333根据前一帧和当前帧的增强的信号相位谱获得每个频率中的合成矢量的大小,并根据所述大小确定补偿系数。当前一帧的相位是α而当前帧的相位是β,那么合成矢量的大小|S’|由下面的方程(46)表示。
[方程46]
当连续帧的相位一致时,合成矢量的大小|S’|是|S|=2,如已经通过方程(33)导出的那样。因此,振幅补偿量由下面的方程(47)表示。
[方程47]
通过将这个值供应给振幅控制单元203并且补偿增强的信号振幅谱,根据这个示例实施例的本发明能够消除输出电平的下降。在这个示例实施例中,因为除了相位旋转单元以外的构造和操作与第二实施例的那些相同,这里将省略相应的解释。
(第五示例实施例)
将使用图14来描述本发明的第五示例实施例。图14为框图,其示出根据这个示例实施例的相位控制单元202和振幅控制单元1403的构造。
根据这个示例实施例的本发明不同于第二示例实施例之处在于包括输入/输出比计算单元1431。输入/输出比计算单元1431接收来自输入端206的噪声信号以及来自逆变换单元204的增强的信号,并计算输入/输出电平的比。输入/输出比计算单元1431将输入/输出电平的比供应给补偿量计算单元1433。补偿量计算单元1433计算补偿量,从而增强的信号的电平变得与噪声信号相等。振幅补偿单元504使用计算出的补偿量来补偿增强的信号振幅谱。
输入/输出比计算单元1431从增强的信号和噪声信号的时域信号获得电平之比。
第n帧的噪声信号yn(t)与第n帧的增强的信号xn(t)的电平比R由下面的方程(48)表示。这里,t表示采样时间。L表示傅里叶变换的帧长度。
[方程48]
补偿量计算单元1433基于该比值R和执行相位旋转的频率分量的数量,而获得振幅补偿量G。当时域信号被变换单元分割成N个频率分量并且向M个相位谱执行相位旋转时,得到振幅补偿量G如下面的方程(49)所示。
[方程49]
并且,振幅控制单元1403基于从相位控制单元202发送的存在相位旋转或不存在相位旋转的信息,仅仅在执行了相位旋转的频率中执行振幅补偿。在这个示例实施例中,因为除了输入/输出比计算单元1431和补偿量计算单元1433之外的构造和操作与第二示例实施例的那些相同,这里将省略解释。
因为是从时域信号获得补偿系数,根据这个示例实施例的本发明能够补偿输出电平,不论通过何种方法确定相位旋转。
(第六示例实施例)
将使用图15来描述本发明的第六示例实施例。图15为框图,其示出根据这个示例实施例的振幅控制单元1503和相位控制单元202的构造。如图15中所示,在这个示例实施例中的振幅控制单元1503包括平均处理单元1531(除了在第五示例实施例中包括的输入/输出比计算单元1431以外)。因为除了平均处理单元1531以外的构造和操作与第五示例实施例的那些相同,这里将省略解释。
平均处理单元1531从输入端206接收噪声信号,执行平均处理,并将它的平均值供应给输入/输出比计算单元1431。并且,平均处理单元1531从逆变换单元204接收增强的信号,执行平均处理,并将它的均值供应给输入/输出比计算单元1431。输入/输出比计算单元1431从平均处理单元1531接收噪声信号和增强的信号的均值,并计算它们的电平比。
平均处理单元1531使噪声信号和增强的信号的电平在任意时间长度上相等。具体地说,平均处理单元1531使用移动平均和泄漏积分使噪声信号和增强的信号的电平相等。
除了第五示例实施例的效果以外,根据这个示例实施例的本发明通过使用相等的电平能够抑制补偿量的变化并且实现对输出信号的质量提升。
(第七示例实施例)
使用图16和图17描述本发明的第七示例实施例。图16的图表示出根据这个示例实施例的噪声抑制装置1600的构造。根据这个示例实施例的噪声抑制装置1600包括振幅分量延迟单元1611、相位分量延迟单元1612和逆变换单元1613(除了图2中的构造以外)。并且,在振幅控制单元1603的内部配置上也有不同。因为除了振幅分量延迟单元1611、相位分量延迟单元1612和振幅控制单元1603以外的操作与第六示例实施例的那些相同,这里将省略解释。
供应给输入端206的噪声信号被供应给变换单元201和振幅控制单元1603。变换单元201将噪声信号振幅谱230供应给振幅分量延迟单元1611和逆变换单元1613。并且,变换单元201将噪声信号相位谱220供应给相位控制单元202。相位控制单元202旋转从变换单元201供应的噪声信号相位谱220,并将其供应给逆变换单元1613和相位分量延迟单元1612作为增强的信号相位谱。并且,相位控制单元202将每个频率中的相位旋转量的存在或不存在发送到振幅控制单元1603。
逆变换单元1613使用从变换单元201供应的噪声信号振幅谱230和从相位控制单元202供应的噪声信号相位谱,将针对相位旋转导致的电平下降而产生的信号发送到振幅控制单元1603。
振幅分量延迟单元1611延迟来自变换单元201的噪声信号振幅谱230,并将其供应给噪声抑制单元205。
相位分量延迟单元1612延迟来自相位控制单元202的增强的信号相位谱,并将其供应给逆变换单元204。噪声抑制单元205使用来自振幅分量延迟单元1611供应的噪声信号振幅谱来推测噪声,并产生估计的噪声谱。
逆变换单元204合成经由相位分量延迟单元1612从相位控制单元202供应的增强的信号相位谱240和从振幅控制单元1603供应的补偿的振幅谱250,进行逆变换并将其供应给输出端207作为增强的信号。
噪声信号相位谱220受相位控制单元202的控制,并被逆变换单元1613变换成时域信号。振幅控制单元1603使用该信号和噪声信号210获得相位旋转造成的电平变动量。
该变动量是仅仅在相位旋转单元501进行的旋转处理中的变化。因此,振幅控制单元1603能够正确地捕捉相位旋转造成的电平变动。虽然振幅控制单元1603使用该电平比进行振幅补偿,所获得的电平比是在一帧之前的电平比。
因此,引入了振幅分量延迟单元1611和相位分量延迟单元1612,并且振幅控制单元1603在一帧之前执行对频率分量的振幅补偿。
图17为框图,其用来说明根据这个示例实施例的相位控制单元202和振幅控制单元1603的内部配置。输入/输出比计算单元1731根据从输入端206供应的噪声信号和包括基于从逆变换单元1613供应的相位旋转的减小的电平部分的信号,计算电平比,并将其供应给补偿量计算单元1233。
补偿量计算单元1233从相位控制单元202接收关于每个频率中存在或不存在相位旋转的信息,并且计算振幅补偿量。振幅补偿单元504基于所述振幅补偿量在每个频率中补偿增强的信号相位谱,并将其供应给逆变换单元204。另外,振幅分量延迟单元1611可以引入到噪声抑制单元205和振幅控制单元1603之间。
除了第五示例实施例的效果以外,根据这个示例实施例的噪声抑制装置1600能够避免在第五实施例和第六实施例中无法避开的输入/输出比的延迟,并且能够实现对输出电平的更精确的补偿。
(第八示例实施例)
使用图18描述了本发明的第八示例实施例。如图18中所示,根据这个示例实施例的噪声抑制装置1800包括(除了第二示例实施例的构造以外)帧重叠控制单元1808。在变换单元201和逆变换单元204中,帧重叠控制单元1808在合成时执行帧分割和对重叠率的控制。帧重叠控制单元1808将其重叠率供应给振幅控制单元203。如已经描述的那样,出现由于重叠造成的基于相位旋转的电平下降。这种电平下降量随重叠率而改变,并且下降量也变大从而重叠率变大。因此,当重叠率改变时,需要控制振幅补偿量。
具体地说,当重叠率为50%时,噪声抑制装置1800基于振幅补偿量G获得补偿量。
当重叠率为0%时,不需要振幅补偿。并且当重叠率为50%时,振幅补偿量为G。因此,振幅补偿量变得像利用帧长度L和重叠长度Q之比的下面的方程(50)。这里,G’为基于重叠率执行补偿的振幅补偿量。
[方程50]
例如,在重叠率为50%的情况中,因为Q是Q=L/2,建立下面的方程(51)。在重叠率为25%的情况中,因为Q是Q=L/4,建立了下面的方程(52)。
[方程51]
[方程52]
振幅控制单元203基于方程(50)补偿从相位控制单元202发送的补偿系数,并补偿增强的信号振幅谱。在这个示例实施例中,因为除了帧重叠控制单元1808以外的构造和操作与第二示例实施例的那些相同,这里将省略解释。
除了第二示例实施例的效果以外,根据这个示例实施例的噪声抑制装置1800能够自由地设定帧的重叠率。
(第九示例实施例)
使用图19来描述本发明的第九示例实施例。噪声存储单元1909连接到噪声抑制单元205。根据这个实施例的噪声抑制装置1900使用已知的噪声谱来抑制噪声。噪声存储单元1909储存了应该被抑制的噪声谱。通过让噪声抑制单元205基于所储存的噪声谱执行噪声抑制,噪声抑制装置1900能够只抑制作为抑制目标的噪声。
这里,作为噪声谱,噪声存储单元1909可以储存噪声的平均谱、最大谱和最小谱。或者,噪声存储单元1901可以储存这些谱的组合。在这个示例实施例中,因为除了噪声存储单元1909以外的构造和操作与第二示例实施例的那些相同,这里将省略解释。
根据这个示例实施例的噪声抑制装置1900能够仅仅对指定噪声施加第二示例实施例的效果,并且当将被抑制的噪声很清楚时能够获得更高质量的增强的信号。
(其他示例实施例)
根据上面描述的第一到第九示例实施例,虽然已经分别描述了具有单独特征的噪声抑制装置,具有这些特征的任意组合的噪声抑制装置也包括在本发明的范畴内。
并且,本发明可以应用到有多个设备构成的系统,它可以应用到单个设备。此外,在实现示例实施例的功能的软件的信号处理程序被直接或远程地供应到系统或设备时,本发明也能适用。因此,为了通过计算机实现本发明的功能,安装在计算机中的程序和储存所述程序的介质以及使所述程序能被下载的WWW服务器也包括在本发明的范畴内。
图20是当第一示例实施例是利用信号处理程序构成时用于执行信号处理程序的计算机2000的框图。计算机2000包括输入单元2001、CPU 2002、输出单元2003和存储器2004。
CPU 2002基于读取信号处理程序而控制计算机2000的操作。就是说,CPU 2002执行储存在存储器2004中的信号处理程序,并将其中第一信号和第二信号被混合的混合信号变换成每个频率中的相位分量和振幅分量或功率分量(S2011)。接下来,CPU 2000旋转预定频率中的相位分量(S2012)。按照由相位旋转产生的输出信号的振幅分量或功率分量的改变量,CPU 2002补偿预定频率中的振幅分量或功率分量(S2013)。CPU 2002合成基于步骤S2012旋转的相位分量和基于步骤S2013补偿的振幅分量或功率分量(S2014)。
基于这些,能够获得和第一示例实施例相同的效果。
[示例实施例的其他表述]
上面公开的示例实施例的全部或一部分可以描述为,但不限于,下面的补充注解。
(补充注解1)
一种信号处理装置,具有:变换装置,用于将混合信号变换成每个频率中的相位分量和振幅分量或功率分量,在所述混合信号中混合有第一信号和第二信号;第一控制装置,用于旋转预定频率中的所述相位分量;第二控制装置,用于根据由所述第一控制装置旋转的振幅分量或功率分量的改变量,来补偿所述预定频率中的所述振幅分量或所述功率分量;以及合成装置,用于合成由所述第一控制装置旋转的所述相位分量和由所述第二控制装置补偿的所述振幅分量或功率分量。
(补充注解2)
根据补充注解1所述的信号处理装置,其中所述第一控制装置包括:旋转量生成装置,用于生成所述相位分量的旋转量;并且所述第二控制装置基于从所述旋转量生成装置供应的所述旋转量而计算所述改变量,并且根据计算出的所述改变量来补偿所述振幅分量或者所述功率分量。
(补充注解3)
根据补充注解1所述的信号处理装置,其中所述第二控制装置包括相位分量延迟装置,用于延迟所述相位分量,并且所述第二控制装置通过比较延迟之前和延迟之后的相位分量而计算所述改变量,并且根据所计算出的改变量来补偿所述振幅分量或者所述功率分量。
(补充注解4)
根据补充注解1所述的信号处理装置,其中所述第二控制装置通过将来自所述合成装置的输出与所述混合信号相比较而计算所述改变量,并且根据计算出的改变量来补偿所述振幅分量或者所述功率分量。
(补充注解5)
根据补充注解4所述的信号处理装置,其中所述第二控制装置通过将来自所述合成装置的所述输出的均值与所述混合信号的均值相比较而计算所述改变量,并且根据计算出的所述改变量来补偿所述振幅分量或者所述功率分量。
(补充注解6)
根据补充注解1所述的信号处理装置,还包括:振幅分量延迟装置,用于延迟所述振幅分量或者所述功率分量,其中所述第二控制装置通过将来自所述合成装置的所述输出与所述混合信号相比较而计算所述改变量,并且根据计算出的所述改变量来补偿由所述振幅分量延迟装置延迟的所述振幅分量或者功率分量。
(补充注解7)
根据补充注解1到6中任一项所述的信号处理装置,其中所述变换装置包括分割装置,用于将所述混合信号分割成彼此部分重叠的多个帧,并且所述第二控制装置还根据所述帧的重叠率来补偿所述预定频率中的所述振幅分量或者所述功率分量。
(补充注解8)
根据补充注解1到7中任一项所述的信号处理装置,其中所述第一控制装置包括旋转量限制装置,用于限制所述相位分量的旋转量。
(补充注解9)
一种信号处理方法,包括:变换步骤,用于将混合信号变换成每个频率中的相位分量和振幅分量或者功率分量,在所述混合信号中混合有第一信号和第二信号;第一控制步骤,用于旋转预定频率中的所述相位分量;第二控制步骤,用于根据由所述第一控制步骤执行的所述旋转所产生的所述振幅分量或者功率分量的改变量,来补偿所述预定频率中的所述振幅分量或者所述功率分量;以及合成步骤,用于合成由所述第一控制步骤旋转的所述相位分量和由所述第二控制步骤补偿的所述振幅分量或者功率分量。
(补充注解10)
一种存储有信号处理程序的程序记录介质,所述信号处理程序使计算机执行:变换步骤,用于将混合信号变换成每个频率中的相位分量和振幅分量或者功率分量,在所述混合信号中混合有第一信号和第二信号;第一控制步骤,用于旋转预定频率中的所述相位分量;第二控制步骤,用于根据由所述第一控制步骤执行的所述旋转所产生的所述振幅分量或者功率分量的改变量,来补偿所述预定频率中的所述振幅分量或者所述功率分量;以及合成步骤,用于合成由所述第一控制步骤旋转的所述相位分量和由所述第二控制步骤补偿的所述振幅分量或者功率分量。
尽管已经参考其示例实施例特别示出和描述了本发明,本发明不限于这些实施例。本领域技术人员将理解到可以在不偏离如权利要求书中所限定的本发明的精神和范围下在形式和细节上做出各种改变。
本申请基于并要求2010年11月24日提交的日本专利申请号2010-261831的优先权,通过参考将上述日本申请的公开内容整体并入在此。
Claims (10)
1.一种信号处理装置,包括:
变换装置,用于将混合信号变换成每个频率中的相位分量和振幅分量或功率分量,在所述混合信号中混合有第一信号和第二信号;
第一控制装置,用于旋转预定频率中的所述相位分量;
第二控制装置,用于根据由所述第一控制装置旋转的所述振幅分量或所述功率分量的改变量,来补偿所述预定频率中的所述振幅分量或所述功率分量;以及
合成装置,用于合成由所述第一控制装置旋转的所述相位分量和由所述第二控制装置补偿的所述振幅分量或所述功率分量。
2.根据权利要求1所述的信号处理装置,其中
所述第一控制装置包括:
旋转量生成装置,用于生成所述相位分量的旋转量,以及
所述第二控制装置基于从所述旋转量生成装置供应的所述旋转量而计算所述改变量,并且根据计算出的所述改变量来补偿所述振幅分量或所述功率分量。
3.根据权利要求1所述的信号处理装置,其中
所述第二控制装置包括:
相位分量延迟装置,用于延迟所述相位分量,以及
所述第二控制装置通过比较延迟之前和延迟之后的所述相位分量而计算所述改变量,并且根据计算出的所述改变量来补偿所述振幅分量或所述功率分量。
4.根据权利要求1所述的信号处理装置,其中
所述第二控制装置通过将来自所述合成装置的输出与所述混合信号相比较而计算所述改变量,并且根据计算出的所述改变量来补偿所述振幅分量或所述功率分量。
5.根据权利要求4所述的信号处理装置,其中
所述第二控制装置通过将来自所述合成装置的所述输出的均值与所述混合信号的均值相比较而计算所述改变量,并且根据计算出的所述改变量来补偿所述振幅分量或所述功率分量。
6.根据权利要求1所述的信号处理装置,还包括:
振幅分量延迟装置,用于延迟所述振幅分量或所述功率分量,其中
所述第二控制装置通过将来自所述合成装置的输出与所述混合信号相比较而计算所述改变量,并且根据计算出的所述改变量来补偿由所述振幅分量延迟装置延迟的所述振幅分量或所述功率分量。
7.根据权利要求1到6中任一项所述的信号处理装置,其中
所述变换装置包括:
分割装置,用于将所述混合信号分割成彼此部分重叠的多个帧,以及
所述第二控制装置还根据所述帧的重叠率来补偿所述预定频率中的所述振幅分量或所述功率分量。
8.根据权利要求1到7中任一项所述的信号处理装置,其中
所述第一控制装置包括:
旋转量限制装置,用于限制所述相位分量的旋转量。
9.一种信号处理方法,包括:
变换步骤,用于将混合信号变换成每个频率中的相位分量和振幅分量或者功率分量,在所述混合信号中混合有第一信号和第二信号;
第一控制步骤,用于旋转预定频率中的所述相位分量;
第二控制步骤,用于根据由所述第一控制步骤执行的所述旋转所产生的所述振幅分量或者所述功率分量的改变量,来补偿所述预定频率中的所述振幅分量或所述功率分量;以及
合成步骤,用于合成由所述第一控制步骤旋转的所述相位分量和由所述第二控制步骤补偿的所述振幅分量或功率分量。
10.一种存储有信号处理程序的程序记录介质,所述信号处理程序使计算机执行:
变换步骤,用于将混合信号变换成每个频率中的相位分量和振幅分量或者功率分量,在所述混合信号中混合有第一信号和第二信号;
第一控制步骤,用于旋转预定频率中的所述相位分量;
第二控制步骤,用于根据由所述第一控制步骤执行的所述旋转所产生的所述振幅分量或者所述功率分量的改变量,来补偿所述预定频率中的所述振幅分量或所述功率分量;以及
合成步骤,用于合成由所述第一控制步骤旋转的所述相位分量和由所述第二控制步骤补偿的所述振幅分量或功率分量。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010-261831 | 2010-11-24 | ||
JP2010261831 | 2010-11-24 | ||
PCT/JP2011/077286 WO2012070671A1 (ja) | 2010-11-24 | 2011-11-21 | 信号処理装置、信号処理方法、及び信号処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103250208A true CN103250208A (zh) | 2013-08-14 |
CN103250208B CN103250208B (zh) | 2015-06-17 |
Family
ID=46146006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180056539.3A Active CN103250208B (zh) | 2010-11-24 | 2011-11-21 | 信号处理装置和信号处理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9030240B2 (zh) |
EP (1) | EP2645368B1 (zh) |
JP (1) | JP6079236B2 (zh) |
CN (1) | CN103250208B (zh) |
WO (1) | WO2012070671A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014084000A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
WO2014083999A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
CN109767760A (zh) * | 2019-02-23 | 2019-05-17 | 天津大学 | 基于振幅和相位信息的多目标学习的远场语音识别方法 |
CN112037816A (zh) * | 2020-05-06 | 2020-12-04 | 珠海市杰理科技股份有限公司 | 语音信号频域频率的校正、啸叫检测、抑制方法及装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9517366B2 (en) * | 2013-02-01 | 2016-12-13 | 3M Innovative Properties Company | Respirator mask speech enhancement apparatus and method |
WO2014136629A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
JP6432597B2 (ja) | 2014-03-17 | 2018-12-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
KR101746799B1 (ko) * | 2015-11-04 | 2017-06-14 | 주식회사 쏠리드 | 분산 안테나 시스템 |
TWI692719B (zh) * | 2019-03-21 | 2020-05-01 | 瑞昱半導體股份有限公司 | 音訊處理方法與音訊處理系統 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143198A (ja) * | 1996-11-07 | 1998-05-29 | Matsushita Electric Ind Co Ltd | 音声符号化装置/復号化装置 |
JP2000181498A (ja) * | 1998-12-15 | 2000-06-30 | Toshiba Corp | ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体 |
CN1281576A (zh) * | 1997-12-08 | 2001-01-24 | 三菱电机株式会社 | 声音信号加工方法和声音信号加工装置 |
US20030177007A1 (en) * | 2002-03-15 | 2003-09-18 | Kabushiki Kaisha Toshiba | Noise suppression apparatus and method for speech recognition, and speech recognition apparatus and method |
EP1398762A1 (en) * | 2002-09-06 | 2004-03-17 | Microsoft Corporation | Non-linear model for removing noise from corrupted signals |
CN101091209A (zh) * | 2005-09-02 | 2007-12-19 | 日本电气株式会社 | 抑制噪声的方法、装置和计算机程序 |
US20080219470A1 (en) * | 2007-03-08 | 2008-09-11 | Sony Corporation | Signal processing apparatus, signal processing method, and program recording medium |
CN101300623A (zh) * | 2005-09-02 | 2008-11-05 | 日本电气株式会社 | 用于抑制噪声的方法、设备和计算机程序 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0795672B2 (ja) * | 1987-12-28 | 1995-10-11 | アルパイン株式会社 | ディジタル位相制御回路 |
JP4006770B2 (ja) * | 1996-11-21 | 2007-11-14 | 松下電器産業株式会社 | ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 |
US7254195B2 (en) * | 2003-08-25 | 2007-08-07 | M/A-Com, Inc. | Apparatus, methods and articles of manufacture for dynamic differential delay correction |
US7945223B2 (en) * | 2007-02-14 | 2011-05-17 | Infineon Technologies Ag | Polar modulator with signed amplitude reducing phase transitions |
JP4818955B2 (ja) | 2007-02-27 | 2011-11-16 | 三菱電機株式会社 | 雑音除去装置 |
US8509300B2 (en) * | 2007-10-09 | 2013-08-13 | St-Ericsson Sa | Transmitter with reduced power consumption and increased linearity |
US7932763B2 (en) * | 2009-04-02 | 2011-04-26 | Mediatek Inc. | Signal processing circuit and signal processing method |
JP2010261831A (ja) | 2009-05-08 | 2010-11-18 | Toyota Motor Corp | 歪み量計測方法 |
US8107898B2 (en) * | 2009-10-23 | 2012-01-31 | Panasonic Corporation | Transmitter circuit and communication device using the same |
US8488497B2 (en) * | 2010-06-10 | 2013-07-16 | Panasonic Corporation | Transmission circuit and transmission method |
JP6070953B2 (ja) * | 2011-02-26 | 2017-02-01 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び記憶媒体 |
US8660209B2 (en) * | 2012-01-20 | 2014-02-25 | Mediatek Inc. | Transmitter and frequency deviation reduction method thereof |
-
2011
- 2011-11-21 WO PCT/JP2011/077286 patent/WO2012070671A1/ja active Application Filing
- 2011-11-21 CN CN201180056539.3A patent/CN103250208B/zh active Active
- 2011-11-21 US US13/988,690 patent/US9030240B2/en active Active
- 2011-11-21 JP JP2012545815A patent/JP6079236B2/ja active Active
- 2011-11-21 EP EP11842659.2A patent/EP2645368B1/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143198A (ja) * | 1996-11-07 | 1998-05-29 | Matsushita Electric Ind Co Ltd | 音声符号化装置/復号化装置 |
CN1281576A (zh) * | 1997-12-08 | 2001-01-24 | 三菱电机株式会社 | 声音信号加工方法和声音信号加工装置 |
JP2000181498A (ja) * | 1998-12-15 | 2000-06-30 | Toshiba Corp | ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体 |
US20030177007A1 (en) * | 2002-03-15 | 2003-09-18 | Kabushiki Kaisha Toshiba | Noise suppression apparatus and method for speech recognition, and speech recognition apparatus and method |
EP1398762A1 (en) * | 2002-09-06 | 2004-03-17 | Microsoft Corporation | Non-linear model for removing noise from corrupted signals |
CN101091209A (zh) * | 2005-09-02 | 2007-12-19 | 日本电气株式会社 | 抑制噪声的方法、装置和计算机程序 |
CN101300623A (zh) * | 2005-09-02 | 2008-11-05 | 日本电气株式会社 | 用于抑制噪声的方法、设备和计算机程序 |
US20080219470A1 (en) * | 2007-03-08 | 2008-09-11 | Sony Corporation | Signal processing apparatus, signal processing method, and program recording medium |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014084000A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
WO2014083999A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
CN109767760A (zh) * | 2019-02-23 | 2019-05-17 | 天津大学 | 基于振幅和相位信息的多目标学习的远场语音识别方法 |
CN112037816A (zh) * | 2020-05-06 | 2020-12-04 | 珠海市杰理科技股份有限公司 | 语音信号频域频率的校正、啸叫检测、抑制方法及装置 |
CN112037816B (zh) * | 2020-05-06 | 2023-11-28 | 珠海市杰理科技股份有限公司 | 语音信号频域频率的校正、啸叫检测、抑制方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
EP2645368B1 (en) | 2019-05-08 |
US20130251079A1 (en) | 2013-09-26 |
EP2645368A1 (en) | 2013-10-02 |
CN103250208B (zh) | 2015-06-17 |
JP6079236B2 (ja) | 2017-02-15 |
EP2645368A4 (en) | 2014-08-20 |
WO2012070671A1 (ja) | 2012-05-31 |
JPWO2012070671A1 (ja) | 2014-05-19 |
US9030240B2 (en) | 2015-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103250208A (zh) | 信号处理装置、信号处理方法和信号处理程序 | |
US20240294987A1 (en) | Oversampling in a combined transposer filterbank | |
US8489394B2 (en) | Method, apparatus, and computer program for suppressing noise | |
US9047874B2 (en) | Noise suppression method, device, and program | |
US9837097B2 (en) | Single processing method, information processing apparatus and signal processing program | |
CN104541327B (zh) | 用于高频音频内容的有效恢复的方法及系统 | |
CN101916567B (zh) | 应用于双麦克风系统的语音增强方法 | |
US20080140396A1 (en) | Model-based signal enhancement system | |
US9858946B2 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
CN1909383B (zh) | 一种窄带干扰抑制方法及其装置 | |
US9613633B2 (en) | Speech enhancement | |
CN103354937A (zh) | 包括噪声抑制增益的中值滤波的后处理 | |
JP6070953B2 (ja) | 信号処理装置、信号処理方法、及び記憶媒体 | |
US8190426B2 (en) | Spectral refinement system | |
CN103238180A (zh) | 信号处理设备、信号处理方法及信号处理程序 | |
JP6300031B2 (ja) | 信号処理装置、信号処理方法、および信号処理プログラム | |
CN102598126A (zh) | 信息处理装置及其附属设备、信息处理系统及其控制方法和控制程序 | |
JP3766975B1 (ja) | パラメトリックな時間引き延ばしパルス生成装置 | |
CN102598128A (zh) | 信号处理方法、信息处理装置及用于存储信号处理程序的存储介质 | |
JP6119604B2 (ja) | 信号処理装置、信号処理方法、および信号処理プログラム | |
JP6350871B2 (ja) | 信号処理装置、信号処理方法、および信号処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |