CN100593197C - 信号处理方法和装置 - Google Patents
信号处理方法和装置 Download PDFInfo
- Publication number
- CN100593197C CN100593197C CN200580047603A CN200580047603A CN100593197C CN 100593197 C CN100593197 C CN 100593197C CN 200580047603 A CN200580047603 A CN 200580047603A CN 200580047603 A CN200580047603 A CN 200580047603A CN 100593197 C CN100593197 C CN 100593197C
- Authority
- CN
- China
- Prior art keywords
- noise
- spectrum
- signal
- segmentation
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 238000001228 spectrum Methods 0.000 claims abstract description 166
- 230000011218 segmentation Effects 0.000 claims description 108
- 238000012545 processing Methods 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 21
- 230000001629 suppression Effects 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 10
- 238000005070 sampling Methods 0.000 abstract 1
- 230000005236 sound signal Effects 0.000 abstract 1
- 238000012937 correction Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000006854 communication Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 206010038743 Restlessness Diseases 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Noise Elimination (AREA)
Abstract
本发明提供了一种信号处理方法和装置,该信号处理方法和装置在噪声电平的急剧上升分段中提高了所估算的噪声的跟踪速度,并且在语音分段中很少产生由于语音的影响而导致的噪声频谱的估算误差,在该信号处理方法和装置中,提取作为输入信号的抽样数据的时域信号,按帧将该时域信号转换成频域信号,并计算输入频谱。此外,获得输入频谱的最小值,以估算噪声频谱,所述噪声频谱是包括在输入语音信号中的噪声分量的频域信号。此外,将该输入频谱与该噪声频谱进行比较,以确定分段是在噪声分段还是混合了语音与噪声的混合分段中。
Description
技术领域
本发明涉及信号处理方法和装置,具体地说,涉及例如用于数字移动电话的噪声消除器、VAD(语音活动检测)等中的语音信号处理所需的方法和装置。
背景技术
作为一种在数字移动电话等中抑制通信语音中的背景噪声以使得能够容易地听到语音的技术,噪声消除器可以被提及。同样,作为一种通过根据语音的存在/不存在而打开/关闭发射输出来节省发射部的电力的技术,VAD可以被提及。对于噪声消除器、VAD等,需要在通信过程中确定语音存在的分段或者没有语音存在的分段。
作为确定这分段的方法,例如可以提及下述的方法,即,通过将过去计算出的长期的平均功率看作噪声的功率,将噪声功率与当前分段中的功率进行比较,以将功率较大的当前分段确定或判定为语音分段。然而,仅通过这种简单的功率比较,当背景噪声电平很高并且信噪比SNRn很小时,存在语音被错认为噪声的情况。
作为对于这种情况的措施,已经提出了通过利用语音的频域信号来执行分段确定的方法(例如参见专利文献1)。在下文中,将对这种技术进行描述。
对输入信号周期性地执行时间-频率转换。计算输入信号的频域信号(在下文中,称为输入频谱)。把过去计算出的长期的平均输入频谱看作噪声频谱(在下文中,称为平均噪声频谱)。为平均噪声频谱和输入频谱中的每一个计算每带宽的信噪比SNRn,以便在所需带宽下计算每带宽的信噪比SNRn的平均值、正(负)变化量、离差值(dispersion value)等。通过利用这些值,来执行分段确定。同样,仅在通过上述分段确定将该分段确定为噪声分段时,才利用输入频谱对平均噪声频谱进行更新。因此,实现了更精确的分段确定。
专利文献1:日本专利申请特开No.2001-265367
发明内容
然而,如在专利文献1中所述的现有技术中,仅在噪声分段中对平均噪声频谱进行更新。因此,当噪声电平急剧上升时,噪声分段被错认为语音分段,此后不对平均噪声频谱进行更新,从而不利地持续错误的确定。
为了避免这种错误的确定,专利文献1还公开了下述的方法,即,根据每带宽的信噪比SNRn来控制噪声更新的时间常数,以与分段确定的结果无关地对噪声进行更新。
然而,当在语音分段中对平均噪声频谱进行更新时,由于语音的影响而对平均噪声频谱明显估计过高。因此,出现了一个新的问题,即,低电平的语音分段很容易被错认为噪声分段。
因此,本发明的一个目的是提供一种信号处理方法和装置,其中,在具有急剧上升的噪声电平的分段中,提高所估算的噪声的跟踪速度(following speed),以使得在信号分段中几乎不产生由于语音的影响而导致的噪声频谱的估算误差。
(1)为了实现上述目的,根据本发明的信号处理方法包括:时域信号提取步骤,用于提取时域信号,所述时域信号是输入信号的抽样数据;频域信号分析步骤,用于按帧将所述时域信号转换成频域信号,并计算输入频谱;以及噪声估算步骤,通过利用所述输入频谱的最小分量来估算噪声频谱,所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号。将参照附图对这种方法进行描述。
首先,采用如图1所示的输入信号(叠加了噪声的语音)作为示例。在图1中,分段(i)与(iv)是“噪声独占分段”(在下文中,称为噪声分段)。在分段(iii)中,出现了噪声电平的急剧上升。分段(ii)与(v)是“混合了语音与噪声的混合分段”(在下文中称为混合分段)。图2示出了上述分段(i)、(ii)、(iv)以及(v)的典型输入频谱。
当将图2中的分段(i)的输入频谱A与分段(ii)的输入频谱A进行比较时,分段(ii)中的“语音和噪声的混合分段”中的输入频谱A的最小部分(图2中的实心圆)被所叠加的噪声屏蔽,其中噪声的贡献程度很高。因此,这些最小部分变得在值方面等于作为“噪声独占分段”的分段(i)中的输入频谱的最小部分。对于噪声电平增加的情况也是一样,以使得作为“噪声独占分段”的分段(iv)中的频谱的最小部分的值变得等于作为“语音和噪声的混合分段”的分段(v)中的频谱的最小部分的值。在下文中,用直线来连接输入频谱的最小部分,这将被称为如图2所示的最小频谱B。
基于这种原理,在本发明的时域信号提取步骤与频域信号分析步骤中,根据预定分段的时域的输入信号计算作为频域信号的输入频谱A。在噪声估算步骤中,通过利用输入频谱A的最小值来获得最小频谱B,以估算作为当前帧内的噪声分量的频域信号的噪声频谱。
因此,在本发明中通过利用频谱的最小部分来计算所估算的噪声,以使得几乎不产生由于语音信号的影响而导致的噪声频谱的估算误差,并且可以在噪声电平的急剧上升分段中提高所估算的噪声的跟踪速度。
(2)在上述的(1)中,在噪声估算步骤中,可以获得每帧的瞬时噪声频谱作为噪声频谱。
因此,由于在该帧内结束或完成了噪声频谱的估算步骤,所以使得较高敏感度的噪声估算成为可能。同样,利用相对小规模的电路结构的实现也成为可能。
(3)在上述的(2)中,在噪声估算步骤中,可以获得多个帧的瞬时噪声频谱的平均噪声频谱作为噪声频谱。
因此,在长时间内对所估算的噪声频谱进行平均,以使得更稳定的噪声估算成为可能。
(4)上述(1)-(3)中的任何一个可以进一步包括分段确定步骤,用于对所述噪声频谱与所述输入频谱进行比较,并确定该帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段中。
也就是说,如图1和2所示,对基于输入频谱A和最小频谱B的瞬时噪声频谱相互进行比较,由此可以指定混合分段和噪声分段,并且可以构造在噪声抑制和节能方面优异的系统。
(5)在上述的(4)中,在噪声估算步骤中,当在分段确定步骤中直到最后一帧的确定结果表示混合分段时,可以通过利用瞬时噪声频谱来获得平均噪声频谱,而当确定结果表示噪声分段时,可以通过利用输入频谱来获得平均噪声频谱。
也就是说,当在分段确定步骤中直到最后一帧的确定结果表示混合分段时,通过如上所述利用瞬时噪声频谱来获得平均噪声频谱。另一方面,当确定结果表示噪声分段时,不需要利用瞬时噪声频谱而只需要利用输入频谱。因此,基于输入频谱来获得平均噪声频谱。
(6)上述的(4)可以进一步包括抑制量计算步骤,用于在考虑了分段确定步骤中的确定结果的情况下,基于噪声频谱与输入频谱对输入信号计算每带宽的抑制量,并抑制输入信号的噪声。
因此,基于噪声频谱与输入频谱计算输入信号的抑制量。然而,考虑到分段确定步骤中的确定结果,如果在例如混合分段的情况下减小抑制量,而在噪声分段的情况下增大抑制量,则可以进行更有效的噪声抑制。
因此,具有灵敏度与稳定性之间的平衡的噪声估算成为可能。
(7)在上述(1)-(6)中的任何一个中,输入信号可以包括语音信号。在这种情况下,可以提供有效的应用。
应当注意,可以实现用于分别执行在上述(1)-(7)中描述的信号处理方法的信号处理装置。
根据本发明,在噪声电平的急剧上升分段中提高了所估算的噪声的跟踪速度,并且在混合分段中减小了由于语音的影响而导致的噪声频谱的估算误差,从而可以执行精确的分段确定。
附图说明
图1是用于说明本发明的原理的波形图,其示出了每分段的输入语音信号的变化;
图2是示出了图1中的每分段的输入语音信号的频谱的频谱图;
图3是示出了根据本发明的第一实施方式的信号处理装置的构造框图;
图4是示出了由本发明的第一实施方式的信号处理装置计算出的最小频谱的示例的频谱图;
图5是用于说明校正系数的计算的频谱图,该校正系数用于与由根据本发明的第一实施方式的信号处理装置计算出的最小频谱相乘;
图6是用于说明校正系数的计算的关系图,该校正系数用于与由根据本发明的第一实施方式的信号处理装置计算出的最小频谱相乘;
图7是示出了根据本发明的第二实施方式的信号处理装置的构造框图;
图8是示出了本发明的第三实施方式的信号处理装置的配置框图;
图9是示出了用作本发明的第四实施方式的噪声抑制装置的信号处理装置的构造框图。
标号的说明
1时域信号提取部
2频域信号分析部
3a、3b、3c噪声估算装置
4a、4b、4c分段确定装置
5抑制量计算部
7时域信号合成部
31瞬时噪声估算部
32b、32c平均噪声估算部
41a、41b、41c用于噪声/语音确定的参数计算部
42噪声/语音确定部
在所有附图中,相同的标号表示相同或相应的组件。
具体实施方式
在下文中,将参照附图对本发明的实施方式进行描述。
第一实施方式
图3是示出了根据本发明的第一实施方式的信号处理装置的构造框图,该信号处理装置用作噪声估算装置和噪声分段确定装置。该信号处理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3a、以及分段确定装置4a。在下文中,将对该信号处理装置的各个块进行详细描述。
时域信号提取部1对模拟输入语音信号进行量化,并从中提取时域信号xn(k)(其中“n”表示帧编号)作为每单位时间(帧)的抽样数据。同样,频域信号分析部2通过利用例如FFT(快速傅立叶变换)来执行对时域信号xn(k)的频率分析,并计算输入频谱Xn(f)(与图2中的输入频谱A相对应),输入频谱Xn(f)是输入信号的频谱幅值。在“Digital signalprocessing series vol.1:Digital signal processing(Tujii & Kamata),P94-P120,Shoukoudou”、“Computer music(Curtis Roads著,Aoyagi等编译),P452-P457,Tokyo Denki University Press”等中对FFT进行了详细描述。
应当注意,输入频谱Xn(f)可以被分成多个带宽,在各个带宽中可以用通过加权平均等计算出的带宽频谱来替代输入频谱。
首先,通过下列方程将输入信号xn(t)分成带宽信号
BPF(i,j):用于带宽划分的FIR滤波器系数
M:FIR滤波器级数(degree)
i:带宽号
向噪声估算装置3a和分段确定装置4a中输入这样获得的输入频谱。
噪声估算装置3a具有瞬时噪声估算部31,瞬时噪声估算部31根据输入频谱Xn(f)的近似形式来估算瞬时噪声频谱Nn(f),该瞬时噪声频谱Nn(f)是当前帧的噪声频谱,该输入频谱Xn(f)是由频域信号分析部2计算的。通过下列过程来计算瞬时噪声频谱Nn(f):
首先,从输入频谱Xn(f)中选择频谱的最小值mn(k)。例如,选择满足下列条件式的输入频谱Xn(f)作为最小值mn(k):
Xn(f)<Xn(f-1)并且Xn(f)<Xn(f+1) 方程(3)
然后,根据最小值mn(k)计算最小频谱Mn(f)(与图2中的最小频谱B相对应)。如果假定第k个频率是mn(k),则可以用最小值mn(k)与fk的函数来表示最小频谱Mn(f)。例如,当例如最小频谱Mn(f)是如图4所示的函数时,可以用下列方程来表示最小频谱Mn(f):
应当注意,虽然图4示出了利用非线性函数来计算最小频谱Mn(f)的示例,但是也可以利用高阶多项式方程、线性函数等。
然后,通过利用这样获得的最小频谱Mn(f)来计算瞬时噪声频谱Nn(f)。应当注意,可以通过将校正系数αn(f)与最小频谱Mn(f)相加或相乘来具体计算瞬时噪声频谱Nn(f)。
校正系数αn(f)可以是预先根据经验从实际噪声中获得的常数(考虑到噪声的离差等),或者可以是对每帧计算的变量。在下文中,αn(f)是变量的情况被表示为计算示例1和2。
作为计算示例1,在被随后的噪声/语音确定部42确定为噪声分段的过去的分段中,初步计算输入频谱Xn(f)的离差值σn(f),以根据离差值σn(f)计算校正系数αn(f)。可以计算每频率带宽的离差值σn(f),或者可以在某个特定的带宽中通过加权平均等计算离差值σn(f)。
作为用离差值σn(f)计算校正系数αn(f)的一个示例,可以利用下列方程:
αn(f)=γn(f)×σn(f) 方程(5)
系数γn(f)是通过实验获得的经验值。
作为计算示例2,根据输入频谱Xn(f)与最小频谱Mn(f)之间的比率的积分值Rxmn来计算校正系数αn(f)。用下列方程来表示积分值Rxmn:
积分值Rxmn与图5中的阴影区域的面积相对应。在图5(1)示出的噪声独占分段中,积分值Rxmn很小,而在图5(2)示出的语音和噪声的混合分段中,积分值Rxmn很大。因此,将校正系数αn(f)规定为例如图6所示的积分值Rxmn的函数,基于瞬时噪声计算的校正系数αn(f)根据语音信号在输入信号中的贡献程度而改变,以使得可以估算更接近于实际情况的噪声频谱。
此时,可以在某个特定的带宽中计算积分值Rxmn。同样,可以对频率带宽中的Rxm-1、Rxm-2、α-1(f)以及α-2(f)使用不同的值,或者可以在某个特定的带宽中使用相同的值。应当进行适当的选择,以便与实际的噪声频谱相对应。
从噪声估算装置3a输出由瞬时噪声估算部31这样估算出的瞬时噪声频谱Nn(f)。
同时,向分段确定装置4a发送瞬时噪声频谱Nn(f),分段确定装置4a具有噪声/语音确定部42和用于噪声/语音确定的参数计算部41a。用于噪声/语音确定的参数计算部41a通过利用瞬时噪声估算部31计算出的瞬时噪声频谱Nn(f)和来自频域信号分析部2的输入频谱Xn(f)来计算用于分段确定的参数。
作为用于分段确定的参数,根据例如输入频谱Xn(f)计算输入信号的功率,并且根据瞬时噪声频谱Nn(f)计算瞬时噪声的功率。根据各个功率计算出的信噪比SNRn被用作用于分段确定的参数。同样,根据输入频谱Xn(f)和瞬时噪声频谱Nn(f)计算出的每带宽的信噪比的积分值Rn等也可以被用作用于分段确定的参数。可以用下列方程来表示积分值Rn:
应当注意,用于获得积分值Rn的频率的积分范围可以被限于用于计算的某个特定的带宽。
噪声/语音确定部42通过对分段确定参数和阈值进行比较来执行分段确定,并输出确定结果vad_flag,该分段确定参数是由用于噪声/语音确定的参数计算部41a计算的。也就是说,如果确定结果vad_flag是FALSE,则意味着该帧是包括语音的混合分段,而如果确定结果vad_flag是TRUE,则意味着该帧是没有语音的噪声分段。
作为分段确定参数,可以使用由用于噪声/语音确定的参数计算部41a计算出的信噪比SNRn或者使用积分值Rn。为了更有效的实现,可以将用于噪声/语音确定的参数计算部41a设置为计算信噪比SNRn和积分值Rn两者,其中,分段确定参数被计算为信噪比SNRn和积分值Rn的函数,以用于确定。
第二实施方式
图7示出了根据本发明的第二实施方式的信号处理装置,该信号处理装置用作噪声估算装置和噪声分段确定装置。以与根据第一实施方式的信号处理装置相同的方式,该信号处理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3b、以及分段确定装置4b。在该第二实施方式中,与第一实施方式不同,未发生变化的瞬时噪声频谱不被假定为估算噪声频谱,而是被用来计算平均噪声频谱,该平均噪声频谱被输出为估算噪声频谱。应当注意,具有与图3中相同的标号的块与第一实施方式中的块相同,因此将在下文中省略对其的描述。
也就是说,噪声估算装置3b中的平均噪声估算部32b通过利用由瞬时噪声估算部31计算出的瞬时噪声频谱Nn(f)来计算平均噪声频谱Nn(f)。在下文中,作为平均噪声频谱Nn(f)的实施方式,可以提及下列的计算1和2。
作为计算示例1,通过利用FIR滤波器来计算平均噪声频谱Nn(f)。此时,通过对包括当前帧的过去的K帧的瞬时噪声频谱Nn(f)进行加权平均来计算平均噪声频谱Nn(f)。这可以用下列方程来表示:
加权系数βn(f)可以被设定为对于每一频率不同的值。
作为计算示例2,通过IIR滤波器来计算平均噪声频谱。此时,以瞬时噪声频谱Nn(f)的长期平均来计算平均噪声频谱Nn(f)。这可以用下列方程来表示:
Nn(f)=λ(f)×Nn-1(f)+(1-λ(f))×Nn(f)
λ(f):加权系数 方程(9)
加权系数λn(f)可以被设定为对于每一频率不同的值。
已接收到由平均噪声估算部32b这样获得的平均噪声频谱Nn(f)的用于噪声/语音确定的参数计算部41b可以通过利用平均噪声频谱Nn(f)而不是瞬时噪声频谱Nn(f)来类似地计算在第一实施方式的用于噪声/语音确定的参数计算部41a中描述的信噪比SNRn和每频带的信噪比的积分值Rn。噪声/语音确定部42中的后续处理与第一实施方式中的相同。
第三实施方式
图8示出了本发明的第三实施方式的用作噪声估算装置和噪声分段确定装置的信号处理装置。以与根据第一实施方式的信号处理装置相同的方式,该信号处理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3c、以及分段确定装置4c。然而,该实施方式与第二实施方式的不同之处在于,被确定为噪声分段的分段的输入频谱未发生变化地用于后续帧中的平均噪声频谱的计算。应当注意,具有与图3中相同的标号的块与第一实施方式中的块相同,因此将在下文中省略对其的描述。
平均噪声估算部32c计算平均噪声频谱Nn(f)。为了计算平均噪声频谱Nn(f),在分段确定装置4c中通过利用输入频谱Xn(f)和直到最后一帧的平均噪声频谱Nn-1(f)来执行分段确定。
结果,在被确定为混合分段(vad_flag=FALSE)的分段中利用瞬时噪声频谱Nn(f)来计算平均噪声频谱Nn(f),并且在被确定为噪声分段(vad_flag=TRUE)的分段中利用输入频谱Xn(f)来计算平均噪声频谱Nn(f)。
也就是说,当确定结果表示噪声分段时,输入信号是噪声分量本身,因此如上所述,只需要利用输入频谱而不需要利用瞬时噪声频谱。
用于噪声/语音确定的参数计算部41c通过用在平均噪声估算部32c中计算的直到最后一帧的平均噪声频谱Nn-1(f)代替瞬时噪声频谱Nn(f)来计算由第一实施方式的用于噪声/语音确定的参数计算部41a计算的信噪比SNRn和每频带的信噪比的积分值Rn。
第四实施方式(噪声抑制装置)
图9示出了根据本发明的第四实施方式的用作噪声抑制装置的信号处理装置。该噪声抑制装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3a、以及分段确定装置4a,这些组件都已在根据第一实施方式的信号处理装置中进行了描述。根据第四实施方式的噪声抑制装置进一步具有抑制量计算部5、抑制部6、以及时域信号合成部7。
首先,频域信号分析部2通过利用FFT来产生输入频谱Xn(f)。抑制量计算部5通过利用由频域信号分析部2计算出的输入频谱Xn(f)和由瞬时噪声估算部31计算出的瞬时噪声频谱Nn(f)来计算每带宽的抑制系数Gn(f)。通过下列方程来计算抑制系数Gn(f):
应当注意,当噪声/语音确定部42中的确定结果vad_flag表示混合分段时,减小方程(10)中的系数Wn(f),并且当确定结果表示噪声分段时,增大系数Wn(f),从而使得噪声分段中的抑制系数变得大于混合分段中的抑制系数。因此,可以增加抑制量。
抑制部6通过利用输入频谱Xn(f)和由抑制量计算部5计算出的抑制系数Gn(f)而在噪声抑制后计算每带宽的振幅谱Yn(f)。通过下列方程计算振幅谱Yn(f):
Yn(f)=Xn(f)×Gn(f) 方程(11)
时域信号合成部7通过IFFT(快速傅立叶逆变换)把振幅谱Yn(f)从频域逆变换到时域,以计算输出信号yn(t)。
虽然图9利用了第一实施方式中示出的噪声估算装置3a和分段确定装置4a,但是也可以利用在第二实施方式和第三实施方式中示出的噪声估算装置3a和分段确定装置4a。此时,抑制量计算部5通过用平均噪声频谱Nn(f)代替瞬时噪声频谱Nn(f)来计算抑制系数Gn(f)。
虽然已通过上述的实施方式对本发明进行了详细描述,但是显而易见的是,本发明不限于上述实施方式。在不脱离权利要求的描述所确定的目的和范围的情况下,本发明的装置可以被实现为经修正的和经修改的方式。
Claims (10)
1、一种信号处理方法,该信号处理方法包括:
时域信号提取步骤,用于提取时域信号,所述时域信号是输入信号的抽样数据;
频域信号分析步骤,用于按帧将所述时域信号转换成频域信号并计算输入频谱;
噪声估算步骤,用于通过利用所述输入频谱的最小分量来估算噪声频谱,所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号;
分段确定步骤,用于对所述噪声频谱与所述输入频谱进行比较,并确定所述帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段中;以及
抑制量计算步骤,用于根据所述分段确定步骤的确定结果,基于所述噪声频谱和所述输入频谱对所述输入信号计算每带宽的抑制量,并抑制所述输入信号的噪声。
2、根据权利要求1所述的信号处理方法,其中,所述噪声估算步骤包括获得每帧的瞬时噪声频谱作为所述噪声频谱。
3、根据权利要求2所述的信号处理方法,其中,所述噪声估算步骤包括获得多个帧的瞬时噪声频谱的平均噪声频谱作为所述噪声频谱。
4、根据权利要求3所述的信号处理方法,其中,当在所述分段确定步骤中直到前一帧的确定结果表示混合分段时,所述噪声估算步骤包括通过利用所述瞬时噪声频谱来获得所述平均噪声频谱,而当所述确定结果表示噪声分段时,所述噪声估算步骤包括通过利用所述输入频谱来获得所述平均噪声频谱。
5、根据权利要求1到4中的任意一项所述的信号处理方法,其中,所述输入信号包括语音信号。
6、一种信号处理装置,该信号处理装置包括:
时域信号提取部,用于提取时域信号,所述时域信号是输入信号的抽样数据;
频域信号分析部,用于按帧将所述时域信号转换成频域信号并计算输入频谱;
噪声估算部,用于通过利用所述输入频谱的最小分量来估算噪声频谱,所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号;
分段确定部,用于对所述噪声频谱和所述输入频谱进行比较,并确定所述帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段中;以及
抑制量计算部,用于根据所述分段确定部的确定结果,基于所述噪声频谱和所述输入频谱对所述输入信号计算每带宽的抑制量,并抑制所述输入信号的噪声。
7、根据权利要求6所述的信号处理装置,其中,所述噪声估算部获得每帧的瞬时噪声频谱作为所述噪声频谱。
8、根据权利要求7所述的信号处理装置,其中,所述噪声估算部获得多个帧的瞬时噪声频谱的平均噪声频谱作为所述噪声频谱。
9、根据权利要求8所述的信号处理装置,其中,当在所述分段确定部中直到前一帧的确定结果表示混合分段时,所述噪声估算部通过利用所述瞬时噪声频谱来获得所述平均噪声频谱,而当所述确定结果表示噪声分段时,所述噪声估算部通过利用所述输入频谱来获得所述平均噪声频谱。
10、根据权利要求6到9中的任意一项所述的信号处理装置,其中,所述输入信号包括语音信号。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2005/001515 WO2006082636A1 (ja) | 2005-02-02 | 2005-02-02 | 信号処理方法および信号処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101111888A CN101111888A (zh) | 2008-01-23 |
CN100593197C true CN100593197C (zh) | 2010-03-03 |
Family
ID=36777031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200580047603A Expired - Fee Related CN100593197C (zh) | 2005-02-02 | 2005-02-02 | 信号处理方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20070265840A1 (zh) |
EP (1) | EP1845520A4 (zh) |
JP (1) | JP4519169B2 (zh) |
CN (1) | CN100593197C (zh) |
WO (1) | WO2006082636A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080084829A1 (en) * | 2006-10-05 | 2008-04-10 | Nokia Corporation | Apparatus, method and computer program product providing link adaptation |
WO2009035613A1 (en) * | 2007-09-12 | 2009-03-19 | Dolby Laboratories Licensing Corporation | Speech enhancement with noise level estimation adjustment |
JP2011100029A (ja) * | 2009-11-06 | 2011-05-19 | Nec Corp | 信号処理方法、情報処理装置、及び信号処理プログラム |
US8744068B2 (en) * | 2011-01-31 | 2014-06-03 | Empire Technology Development Llc | Measuring quality of experience in telecommunication system |
PL2676266T3 (pl) | 2011-02-14 | 2015-08-31 | Fraunhofer Ges Forschung | Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej |
PL2676268T3 (pl) | 2011-02-14 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej |
AU2012217158B2 (en) | 2011-02-14 | 2014-02-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
AR085895A1 (es) * | 2011-02-14 | 2013-11-06 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio |
CN103493129B (zh) | 2011-02-14 | 2016-08-10 | 弗劳恩霍夫应用研究促进协会 | 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法 |
PT2676267T (pt) | 2011-02-14 | 2017-09-26 | Fraunhofer Ges Forschung | Codificação e descodificação de posições de pulso de faixas de um sinal de áudio |
JP6160045B2 (ja) | 2012-09-05 | 2017-07-12 | 富士通株式会社 | 調整装置および調整方法 |
CN103440870A (zh) * | 2013-08-16 | 2013-12-11 | 北京奇艺世纪科技有限公司 | 一种音频降噪方法及装置 |
JP6059130B2 (ja) * | 2013-12-05 | 2017-01-11 | 日本電信電話株式会社 | 雑音抑圧方法とその装置とプログラム |
CN105791530B (zh) * | 2014-12-26 | 2019-04-16 | 联芯科技有限公司 | 输出音量调节方法和装置 |
TWI684912B (zh) * | 2019-01-08 | 2020-02-11 | 瑞昱半導體股份有限公司 | 語音喚醒裝置及方法 |
CN114285505A (zh) * | 2021-12-16 | 2022-04-05 | 重庆会凌电子新技术有限公司 | 一种自动噪底计算方法和系统 |
CN115291151B (zh) * | 2022-09-28 | 2023-01-13 | 中国科学院精密测量科学与技术创新研究院 | 一种基于低相关分段的高精度磁共振信号频率测量方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3274600B2 (ja) * | 1995-03-31 | 2002-04-15 | サムソン コーニング カンパニー,リミテッド | 接着用ガラス組成物と接着方法 |
JP2003280696A (ja) * | 2002-03-19 | 2003-10-02 | Matsushita Electric Ind Co Ltd | 音声強調装置及び音声強調方法 |
CN1496032A (zh) * | 1999-06-09 | 2004-05-12 | ������������ʽ���� | 噪声抑制装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3027389B2 (ja) * | 1990-03-26 | 2000-04-04 | 株式会社リコー | 2値化パターン生成方式 |
JPH06208395A (ja) * | 1992-10-30 | 1994-07-26 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | ホルマント検出装置及び音声加工装置 |
FR2704111B1 (fr) * | 1993-04-16 | 1995-05-24 | Sextant Avionique | Procédé de détection énergétique de signaux noyés dans du bruit. |
JP3353994B2 (ja) * | 1994-03-08 | 2002-12-09 | 三菱電機株式会社 | 雑音抑圧音声分析装置及び雑音抑圧音声合成装置及び音声伝送システム |
SE505156C2 (sv) * | 1995-01-30 | 1997-07-07 | Ericsson Telefon Ab L M | Förfarande för bullerundertryckning genom spektral subtraktion |
JP3484801B2 (ja) * | 1995-02-17 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
JPH09212196A (ja) * | 1996-01-31 | 1997-08-15 | Nippon Telegr & Teleph Corp <Ntt> | 雑音抑圧装置 |
JPH09311696A (ja) * | 1996-05-21 | 1997-12-02 | Nippon Telegr & Teleph Corp <Ntt> | 自動利得調整装置 |
JP3250604B2 (ja) * | 1996-09-20 | 2002-01-28 | 日本電信電話株式会社 | 音声認識方法および装置 |
JP3418855B2 (ja) * | 1996-10-30 | 2003-06-23 | 京セラ株式会社 | 雑音除去装置 |
US6104993A (en) * | 1997-02-26 | 2000-08-15 | Motorola, Inc. | Apparatus and method for rate determination in a communication system |
US7072831B1 (en) * | 1998-06-30 | 2006-07-04 | Lucent Technologies Inc. | Estimating the noise components of a signal |
US7209567B1 (en) * | 1998-07-09 | 2007-04-24 | Purdue Research Foundation | Communication system with adaptive noise suppression |
JP3459363B2 (ja) * | 1998-09-07 | 2003-10-20 | 日本電信電話株式会社 | 雑音低減処理方法、その装置及びプログラム記憶媒体 |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
FR2797343B1 (fr) * | 1999-08-04 | 2001-10-05 | Matra Nortel Communications | Procede et dispositif de detection d'activite vocale |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
JP3325248B2 (ja) * | 1999-12-17 | 2002-09-17 | 株式会社ワイ・アール・ピー高機能移動体通信研究所 | 音声符号化パラメータの取得方法および装置 |
JP4282227B2 (ja) * | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
US7171357B2 (en) * | 2001-03-21 | 2007-01-30 | Avaya Technology Corp. | Voice-activity detection using energy ratios and periodicity |
US6820054B2 (en) * | 2001-05-07 | 2004-11-16 | Intel Corporation | Audio signal processing for speech communication |
JP4058987B2 (ja) * | 2002-04-15 | 2008-03-12 | 三菱電機株式会社 | 雑音除去装置及び雑音除去方法 |
EP1681670A1 (en) * | 2005-01-14 | 2006-07-19 | Dialog Semiconductor GmbH | Voice activation |
JP4670483B2 (ja) * | 2005-05-31 | 2011-04-13 | 日本電気株式会社 | 雑音抑圧の方法及び装置 |
US7366658B2 (en) * | 2005-12-09 | 2008-04-29 | Texas Instruments Incorporated | Noise pre-processor for enhanced variable rate speech codec |
-
2005
- 2005-02-02 EP EP05709635A patent/EP1845520A4/en not_active Ceased
- 2005-02-02 CN CN200580047603A patent/CN100593197C/zh not_active Expired - Fee Related
- 2005-02-02 WO PCT/JP2005/001515 patent/WO2006082636A1/ja active Application Filing
- 2005-02-02 JP JP2007501472A patent/JP4519169B2/ja not_active Expired - Fee Related
-
2007
- 2007-07-12 US US11/826,122 patent/US20070265840A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3274600B2 (ja) * | 1995-03-31 | 2002-04-15 | サムソン コーニング カンパニー,リミテッド | 接着用ガラス組成物と接着方法 |
CN1496032A (zh) * | 1999-06-09 | 2004-05-12 | ������������ʽ���� | 噪声抑制装置 |
JP2003280696A (ja) * | 2002-03-19 | 2003-10-02 | Matsushita Electric Ind Co Ltd | 音声強調装置及び音声強調方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2006082636A1 (ja) | 2006-08-10 |
EP1845520A1 (en) | 2007-10-17 |
CN101111888A (zh) | 2008-01-23 |
JP4519169B2 (ja) | 2010-08-04 |
EP1845520A4 (en) | 2011-08-10 |
JPWO2006082636A1 (ja) | 2008-06-26 |
US20070265840A1 (en) | 2007-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100593197C (zh) | 信号处理方法和装置 | |
CN100492493C (zh) | 噪声抑制方法和设备 | |
CN101300623B (zh) | 用于抑制噪声的方法、设备和计算机程序 | |
CN102414742B (zh) | 低复杂度听觉事件边界检测 | |
Badeau et al. | Selecting the modeling order for the ESPRIT high resolution method: an alternative approach | |
CN102959625A (zh) | 自适应地检测输入音频信号中的话音活动的方法和设备 | |
Papoulis et al. | Detection of hidden periodicities by adaptive extrapolation | |
Zeng et al. | Parameter estimation of power system signals based on cosine self-convolution window with desirable side-lobe behaviors | |
Barkat | Instantaneous frequency estimation of nonlinear frequency-modulated signals in the presence of multiplicative and additive noise | |
CN103280225B (zh) | 一种低复杂度的静音检测方法 | |
CN105210386A (zh) | 用于多个麦克风的自动化增益匹配 | |
CN105534480A (zh) | 鼾声检测方法及装置 | |
US7630432B2 (en) | Method for analysing the channel impulse response of a transmission channel | |
Santamaria et al. | Estimation of the magnitude squared coherence spectrum based on reduced-rank canonical coordinates | |
Matania et al. | Algorithms for spectrum background estimation of non-stationary signals | |
Savaresi et al. | Closed-form unbiased frequency estimation of a noisy sinusoid using notch filters | |
CN104729677A (zh) | 一种非平稳噪声信号的时域数字计权方法 | |
CN111711586B (zh) | 一种应用于通信调制方式识别的时频协同滤波方法及系统 | |
CN113035223A (zh) | 音频处理方法、装置、设备及存储介质 | |
US20140314185A1 (en) | Method and apparatus for impulsive noise mitigation using adaptive blanker based on bpsk modulation system | |
Abdullah et al. | Bilinear time-frequency analysis techniques for power quality signals | |
CN112017674B (zh) | 一种基于音频特征检测广播音频信号中噪声的方法 | |
Upadhyay et al. | A perceptually motivated multi-band spectral subtraction algorithm for enhancement of degraded speech | |
CN109378012B (zh) | 用于单通道语音设备录制音频的降噪方法及系统 | |
JPH10190470A (ja) | 周波数荷重評価関数に基づくスペクトル特徴パラメータ抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20181205 Address after: Kanagawa Patentee after: Fujitsu Interconnection Technology Co., Ltd. Address before: Kanagawa Patentee before: Fujitsu Ltd. |
|
TR01 | Transfer of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100303 Termination date: 20210202 |
|
CF01 | Termination of patent right due to non-payment of annual fee |