CN101111888A - 信号处理方法和装置 - Google Patents

信号处理方法和装置 Download PDF

Info

Publication number
CN101111888A
CN101111888A CNA2005800476036A CN200580047603A CN101111888A CN 101111888 A CN101111888 A CN 101111888A CN A2005800476036 A CNA2005800476036 A CN A2005800476036A CN 200580047603 A CN200580047603 A CN 200580047603A CN 101111888 A CN101111888 A CN 101111888A
Authority
CN
China
Prior art keywords
noise
spectrum
signal
segmentation
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800476036A
Other languages
English (en)
Other versions
CN100593197C (zh
Inventor
松原光良
大谷猛
远藤香绪里
大田恭士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FICT Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN101111888A publication Critical patent/CN101111888A/zh
Application granted granted Critical
Publication of CN100593197C publication Critical patent/CN100593197C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Noise Elimination (AREA)

Abstract

本发明提供了一种信号处理方法和装置,该信号处理方法和装置在噪声电平的急剧上升分段中提高了所估算的噪声的跟踪速度,并且在语音分段中很少产生由于语音的影响而导致的噪声频谱的估算误差,在该信号处理方法和装置中,提取作为输入信号的抽样数据的时域信号,按帧将该时域信号转换成频域信号,并计算输入频谱。此外,获得输入频谱的最小值,以估算噪声频谱,所述噪声频谱是包括在输入语音信号中的噪声分量的频域信号。此外,将该输入频谱与该噪声频谱进行比较,以确定分段是在噪声分段还是混合了语音与噪声的混合分段中。

Description

信号处理方法和装置
技术领域
本发明涉及信号处理方法和装置,具体地说,涉及例如用于数字移动电话的噪声消除器、VAD(语音活动检测)等中的语音信号处理所需的方法和装置。
背景技术
作为一种在数字移动电话等中抑制通信语音中的背景噪声以使得能够容易地听到语音的技术,噪声消除器可以被提及。同样,作为一种通过根据语音的存在/不存在而打开/关闭发射输出来节省发射部的电力的技术,VAD可以被提及。对于噪声消除器、VAD等,需要在通信过程中确定语音存在的分段或者没有语音存在的分段。
作为确定这分段的方法,例如可以提及下述的方法,即,通过将过去计算出的长期的平均功率看作噪声的功率,将噪声功率与当前分段中的功率进行比较,以将功率较大的当前分段确定或判定为语音分段。然而,仅通过这种简单的功率比较,当背景噪声电平很高并且信噪比SNRn很小时,存在语音被错认为噪声的情况。
作为对于这种情况的措施,已经提出了通过利用语音的频域信号来执行分段确定的方法(例如参见专利文献1)。在下文中,将对这种技术进行描述。
对输入信号周期性地执行时间-频率转换。计算输入信号的频域信号(在下文中,称为输入频谱)。把过去计算出的长期的平均输入频谱看作噪声频谱(在下文中,称为平均噪声频谱)。为平均噪声频谱和输入频谱中的每一个计算每带宽的信噪比SNRn,以便在所需带宽下计算每带宽的信噪比SNRn的平均值、正(负)变化量、离差值(dispersion value)等。通过利用这些值,来执行分段确定。同样,仅在通过上述分段确定将该分段确定为噪声分段时,才利用输入频谱对平均噪声频谱进行更新。因此,实现了更精确的分段确定。
专利文献1:日本专利申请特开No.2001-265367
发明内容
然而,如在专利文献1中所述的现有技术中,仅在噪声分段中对平均噪声频谱进行更新。因此,当噪声电平急剧上升时,噪声分段被错认为语音分段,此后不对平均噪声频谱进行更新,从而不利地持续错误的确定。
为了避免这种错误的确定,专利文献1还公开了下述的方法,即,根据每带宽的信噪比SNRn来控制噪声更新的时间常数,以与分段确定的结果无关地对噪声进行更新。
然而,当在语音分段中对平均噪声频谱进行更新时,由于语音的影响而对平均噪声频谱明显估计过高。因此,出现了一个新的问题,即,低电平的语音分段很容易被错认为噪声分段。
因此,本发明的一个目的是提供一种信号处理方法和装置,其中,在具有急剧上升的噪声电平的分段中,提高所估算的噪声的跟踪速度(following speed),以使得在信号分段中几乎不产生由于语音的影响而导致的噪声频谱的估算误差。
(1)为了实现上述目的,根据本发明的信号处理方法包括:时域信号提取步骤,用于提取时域信号,所述时域信号是输入信号的抽样数据;频域信号分析步骤,用于按帧将所述时域信号转换成频域信号,并计算输入频谱;以及噪声估算步骤,通过利用所述输入频谱的最小分量来估算噪声频谱,所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号。将参照附图对这种方法进行描述。
首先,采用如图1所示的输入信号(叠加了噪声的语音)作为示例。在图1中,分段(i)与(iv)是“噪声独占分段”(在下文中,称为噪声分段)。在分段(iii)中,出现了噪声电平的急剧上升。分段(ii)与(v)是“混合了语音与噪声的混合分段”(在下文中称为混合分段)。图2示出了上述分段(i)、(ii)、(iv)以及(v)的典型输入频谱。
当将图2中的分段(i)的输入频谱A与分段(ii)的输入频谱A进行比较时,分段(ii)中的“语音和噪声的混合分段”中的输入频谱A的最小部分(图2中的实心圆)被所叠加的噪声屏蔽,其中噪声的贡献程度很高。因此,这些最小部分变得在值方面等于作为“噪声独占分段”的分段(i)中的输入频谱的最小部分。对于噪声电平增加的情况也是一样,以使得作为“噪声独占分段”的分段(iv)中的频谱的最小部分的值变得等于作为“语音和噪声的混合分段”的分段(v)中的频谱的最小部分的值。在下文中,用直线来连接输入频谱的最小部分,这将被称为如图2所示的最小频谱B。
基于这种原理,在本发明的时域信号提取步骤与频域信号分析步骤中,根据预定分段的时域的输入信号计算作为频域信号的输入频谱A。在噪声估算步骤中,通过利用输入频谱A的最小值来获得最小频谱B,以估算作为当前帧内的噪声分量的频域信号的噪声频谱。
因此,在本发明中通过利用频谱的最小部分来计算所估算的噪声,以使得几乎不产生由于语音信号的影响而导致的噪声频谱的估算误差,并且可以在噪声电平的急剧上升分段中提高所估算的噪声的跟踪速度。
(2)在上述的(1)中,在噪声估算步骤中,可以获得每帧的瞬时噪声频谱作为噪声频谱。
因此,由于在该帧内结束或完成了噪声频谱的估算步骤,所以使得较高敏感度的噪声估算成为可能。同样,利用相对小规模的电路结构的实现也成为可能。
(3)在上述的(2)中,在噪声估算步骤中,可以获得多个帧的瞬时噪声频谱的平均噪声频谱作为噪声频谱。
因此,在长时间内对所估算的噪声频谱进行平均,以使得更稳定的噪声估算成为可能。
(4)上述(1)-(3)中的任何一个可以进一步包括分段确定步骤,用于对所述噪声频谱与所述输入频谱进行比较,并确定该帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段中。
也就是说,如图1和2所示,对基于输入频谱A和最小频谱B的瞬时噪声频谱相互进行比较,由此可以指定混合分段和噪声分段,并且可以构造在噪声抑制和节能方面优异的系统。
(5)在上述的(4)中,在噪声估算步骤中,当在分段确定步骤中直到最后一帧的确定结果表示混合分段时,可以通过利用瞬时噪声频谱来获得平均噪声频谱,而当确定结果表示噪声分段时,可以通过利用输入频谱来获得平均噪声频谱。
也就是说,当在分段确定步骤中直到最后一帧的确定结果表示混合分段时,通过如上所述利用瞬时噪声频谱来获得平均噪声频谱。另一方面,当确定结果表示噪声分段时,不需要利用瞬时噪声频谱而只需要利用输入频谱。因此,基于输入频谱来获得平均噪声频谱。
(6)上述的(4)可以进一步包括抑制量计算步骤,用于在考虑了分段确定步骤中的确定结果的情况下,基于噪声频谱与输入频谱对输入信号计算每带宽的抑制量,并抑制输入信号的噪声。
因此,基于噪声频谱与输入频谱计算输入信号的抑制量。然而,考虑到分段确定步骤中的确定结果,如果在例如混合分段的情况下减小抑制量,而在噪声分段的情况下增大抑制量,则可以进行更有效的噪声抑制。
因此,具有灵敏度与稳定性之间的平衡的噪声估算成为可能。
(7)在上述(1)-(6)中的任何一个中,输入信号可以包括语音信号。在这种情况下,可以提供有效的应用。
应当注意,可以实现用于分别执行在上述(1)-(7)中描述的信号处理方法的信号处理装置。
根据本发明,在噪声电平的急剧上升分段中提高了所估算的噪声的跟踪速度,并且在混合分段中减小了由于语音的影响而导致的噪声频谱的估算误差,从而可以执行精确的分段确定。
附图说明
图1是用于说明本发明的原理的波形图,其示出了每分段的输入语音信号的变化;
图2是示出了图1中的每分段的输入语音信号的频谱的频谱图;
图3是示出了根据本发明的第一实施方式的信号处理装置的构造框图;
图4是示出了由本发明的第一实施方式的信号处理装置计算出的最小频谱的示例的频谱图;
图5是用于说明校正系数的计算的频谱图,该校正系数用于与由根据本发明的第一实施方式的信号处理装置计算出的最小频谱相乘;
图6是用于说明校正系数的计算的关系图,该校正系数用于与由根据本发明的第一实施方式的信号处理装置计算出的最小频谱相乘;
图7是示出了根据本发明的第二实施方式的信号处理装置的构造框图;
图8是示出了本发明的第三实施方式的信号处理装置的配置框图;
图9是示出了用作本发明的第四实施方式的噪声抑制装置的信号处理装置的构造框图。
标号的说明
1时域信号提取部
2频域信号分析部
3a、3b、3c噪声估算装置
4a、4b、4c分段确定装置
5抑制量计算部
7时域信号合成部
31瞬时噪声估算部
32b、32c平均噪声估算部
41a、41b、41c用于噪声/语音确定的参数计算部
42噪声/语音确定部
在所有附图中,相同的标号表示相同或相应的组件。
具体实施方式
在下文中,将参照附图对本发明的实施方式进行描述。
第一实施方式
图3是示出了根据本发明的第一实施方式的信号处理装置的构造框图,该信号处理装置用作噪声估算装置和噪声分段确定装置。该信号处理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3a、以及分段确定装置4a。在下文中,将对该信号处理装置的各个块进行详细描述。
时域信号提取部1对模拟输入语音信号进行量化,并从中提取时域信号xn(k)(其中“n”表示帧编号)作为每单位时间(帧)的抽样数据。同样,频域信号分析部2通过利用例如FFT(快速傅立叶变换)来执行对时域信号xn(k)的频率分析,并计算输入频谱Xn(f)(与图2中的输入频谱A相对应),输入频谱Xn(f)是输入信号的频谱幅值。在“Digital signalprocessing series vol.1:Digital signal processing(Tujii & Kamata),P94-P120,Shoukoudou”、“Computer music(Curtis Roads著,Aoyagi等编译),P452-P457,Tokyo Denki University Press”等中对FFT进行了详细描述。
应当注意,输入频谱Xn(f)可以被分成多个带宽,在各个带宽中可以用通过加权平均等计算出的带宽频谱来替代输入频谱。
同样,可以用通过BPF(带通滤波器)计算出的每带宽的输入振幅
Figure A20058004760300091
来替代输入频谱Xn(f)。通过下列过程来计算每带宽的输入振幅
Figure A20058004760300092
首先,通过下列方程将输入信号xn(t)分成带宽信号
Figure A20058004760300093
x ^ n ( i , t ) = Σ j = 0 M - 1 ( BPF ( i , j ) × x n ( t - j ) ) 方程(1)
BPF(i,j):用于带宽划分的FIR滤波器系数
M:FIR滤波器级数(degree)
i:带宽号
然后,按帧通过下列方程计算每带宽的输入幅值
Figure A20058004760300095
X ^ n ( i ) = 1 N Σ l = 0 N - 1 x ^ n 2 ( i , t - l ) (N:帧长)方程(2)
向噪声估算装置3a和分段确定装置4a中输入这样获得的输入频谱。
噪声估算装置3a具有瞬时噪声估算部31,瞬时噪声估算部31根据输入频谱Xn(f)的近似形式来估算瞬时噪声频谱Nn(f),该瞬时噪声频谱Nn(f)是当前帧的噪声频谱,该输入频谱Xn(f)是由频域信号分析部2计算的。通过下列过程来计算瞬时噪声频谱Nn(f):
首先,从输入频谱Xn(f)中选择频谱的最小值mn(k)。例如,选择满足下列条件式的输入频谱Xn(f)作为最小值mn(k):
Xn(f)<Xn(f-1)并且Xn(f)<Xn(f+1)  方程(3)
然后,根据最小值mn(k)计算最小频谱Mn(f)(与图2中的最小频谱B相对应)。如果假定第k个频率是mn(k),则可以用最小值mn(k)与fk的函数来表示最小频谱Mn(f)。例如,当例如最小频谱Mn(f)是如图4所示的函数时,可以用下列方程来表示最小频谱Mn(f):
M n ( f ) = m n ( k - 1 ) + ( m n ( k ) - m n ( k - 1 ) ) ( f k - f k - 1 ) × ( f - f k - 1 ) 方程(4)
应当注意,虽然图4示出了利用非线性函数来计算最小频谱Mn(f)的示例,但是也可以利用高阶多项式方程、线性函数等。
然后,通过利用这样获得的最小频谱Mn(f)来计算瞬时噪声频谱Nn(f)。应当注意,可以通过将校正系数αn(f)与最小频谱Mn(f)相加或相乘来具体计算瞬时噪声频谱Nn(f)。
校正系数αn(f)可以是预先根据经验从实际噪声中获得的常数(考虑到噪声的离差等),或者可以是对每帧计算的变量。在下文中,αn(f)是变量的情况被表示为计算示例1和2。
作为计算示例1,在被随后的噪声/语音确定部42确定为噪声分段的过去的分段中,初步计算输入频谱Xn(f)的离差值σn(f),以根据离差值σn(f)计算校正系数αn(f)。可以计算每频率带宽的离差值σn(f),或者可以在某个特定的带宽中通过加权平均等计算离差值σn(f)。
作为用离差值σn(f)计算校正系数αn(f)的一个示例,可以利用下列方程:
αn(f)=γn(f)×σn(f)  方程(5)
系数γn(f)是通过实验获得的经验值。
作为计算示例2,根据输入频谱Xn(f)与最小频谱Mn(f)之间的比率的积分值Rxmn来计算校正系数αn(f)。用下列方程来表示积分值Rxmn
Rx m n = Σ f = 0 L - 1 ( X n ( f ) M n ( f ) ) (L:频率带宽的数量)  方程(6)
积分值Rxmn与图5中的阴影区域的面积相对应。在图5(1)示出的噪声独占分段中,积分值Rxmn很小,而在图5(2)示出的语音和噪声的混合分段中,积分值Rxmn很大。因此,将校正系数αn(f)规定为例如图6所示的积分值Rxmn的函数,基于瞬时噪声计算的校正系数αn(f)根据语音信号在输入信号中的贡献程度而改变,以使得可以估算更接近于实际情况的噪声频谱。
此时,可以在某个特定的带宽中计算积分值Rxmn。同样,可以对频率带宽中的Rxm-1、Rxm-2、α-1(f)以及α-2(f)使用不同的值,或者可以在某个特定的带宽中使用相同的值。应当进行适当的选择,以便与实际的噪声频谱相对应。
从噪声估算装置3a输出由瞬时噪声估算部31这样估算出的瞬时噪声频谱Nn(f)。
同时,向分段确定装置4a发送瞬时噪声频谱Nn(f),分段确定装置4a具有噪声/语音确定部42和用于噪声/语音确定的参数计算部41a。用于噪声/语音确定的参数计算部41a通过利用瞬时噪声估算部31计算出的瞬时噪声频谱Nn(f)和来自频域信号分析部2的输入频谱Xn(f)来计算用于分段确定的参数。
作为用于分段确定的参数,根据例如输入频谱Xn(f)计算输入信号的功率,并且根据瞬时噪声频谱Nn(f)计算瞬时噪声的功率。根据各个功率计算出的信噪比SNRn被用作用于分段确定的参数。同样,根据输入频谱Xn(f)和瞬时噪声频谱Nn(f)计算出的每带宽的信噪比的积分值Rn等也可以被用作用于分段确定的参数。可以用下列方程来表示积分值Rn
R n = Σ f = 0 L - 1 ( X n ( f ) N n ( f ) ) (L:频率带宽的数量)  方程(7)
应当注意,用于获得积分值Rn的频率的积分范围可以被限于用于计算的某个特定的带宽。
噪声/语音确定部42通过对分段确定参数和阈值进行比较来执行分段确定,并输出确定结果vad_flag,该分段确定参数是由用于噪声/语音确定的参数计算部41a计算的。也就是说,如果确定结果vad_flag是FALSE,则意味着该帧是包括语音的混合分段,而如果确定结果vad_flag是TRUE,则意味着该帧是没有语音的噪声分段。
作为分段确定参数,可以使用由用于噪声/语音确定的参数计算部41a计算出的信噪比SNRn或者使用积分值Rn。为了更有效的实现,可以将用于噪声/语音确定的参数计算部41a设置为计算信噪比SNRn和积分值Rn两者,其中,分段确定参数被计算为信噪比SNRn和积分值Rn的函数,以用于确定。
第二实施方式
图7示出了根据本发明的第二实施方式的信号处理装置,该信号处理装置用作噪声估算装置和噪声分段确定装置。以与根据第一实施方式的信号处理装置相同的方式,该信号处理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3b、以及分段确定装置4b。在该第二实施方式中,与第一实施方式不同,未发生变化的瞬时噪声频谱不被假定为估算噪声频谱,而是被用来计算平均噪声频谱,该平均噪声频谱被输出为估算噪声频谱。应当注意,具有与图3中相同的标号的块与第一实施方式中的块相同,因此将在下文中省略对其的描述。
也就是说,噪声估算装置3b中的平均噪声估算部32b通过利用由瞬时噪声估算部31计算出的瞬时噪声频谱Nn(f)来计算平均噪声频谱
Figure A20058004760300121
在下文中,作为平均噪声频谱
Figure A20058004760300122
的实施方式,可以提及下列的计算1和2。
作为计算示例1,通过利用FIR滤波器来计算平均噪声频谱
Figure A20058004760300123
此时,通过对包括当前帧的过去的K帧的瞬时噪声频谱Nn(f)进行加权平均来计算平均噪声频谱
Figure A20058004760300124
这可以用下列方程来表示:
N ‾ n ( f ) = Σ n = 0 K - 1 β n ( f ) × N n ( f ) βn(f):加权系数  方程(8)
加权系数βn(f)可以被设定为对于每一频率不同的值。
作为计算示例2,通过IIR滤波器来计算平均噪声频谱。此时,以瞬时噪声频谱Nn(f)的长期平均来计算平均噪声频谱
Figure A20058004760300126
这可以用下列方程来表示:
N ‾ n ( f ) = λ ( f ) × N ‾ n - 1 ( f ) + ( 1 - λ ( f ) ) × N n ( f )
λ(f):加权系数  方程(9)
加权系数λn(f)可以被设定为对于每一频率不同的值。
已接收到由平均噪声估算部32b这样获得的平均噪声频谱
Figure A20058004760300132
的用于噪声/语音确定的参数计算部41b可以通过利用平均噪声频谱而不是瞬时噪声频谱Nn(f)来类似地计算在第一实施方式的用于噪声/语音确定的参数计算部41a中描述的信噪比SNRn和每频带的信噪比的积分值Rn。噪声/语音确定部42中的后续处理与第一实施方式中的相同。
第三实施方式
图8示出了本发明的第三实施方式的用作噪声估算装置和噪声分段确定装置的信号处理装置。以与根据第一实施方式的信号处理装置相同的方式,该信号处理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3c、以及分段确定装置4c。然而,该实施方式与第二实施方式的不同之处在于,被确定为噪声分段的分段的输入频谱未发生变化地用于后续帧中的平均噪声频谱的计算。应当注意,具有与图3中相同的标号的块与第一实施方式中的块相同,因此将在下文中省略对其的描述。平均噪声估算部32c计算平均噪声频谱
Figure A20058004760300134
为了计算平均噪声频谱
Figure A20058004760300135
在分段确定装置4c中通过利用输入频谱Xn(f)和直到最后一帧的平均噪声频谱
Figure A20058004760300136
来执行分段确定。
结果,在被确定为混合分段(vad_flag=FALSE)的分段中利用瞬时噪声频谱Nn(f)来计算平均噪声频谱
Figure A20058004760300137
并且在被确定为噪声分段(vad_flag=TRUE)的分段中利用输入频谱Xn(f)来计算平均噪声频谱
Figure A20058004760300138
也就是说,当确定结果表示噪声分段时,输入信号是噪声分量本身,因此如上所述,只需要利用输入频谱而不需要利用瞬时噪声频谱。
用于噪声/语音确定的参数计算部41c通过用在平均噪声估算部32c中计算的直到最后一帧的平均噪声频谱
Figure A20058004760300139
代替瞬时噪声频谱Nn(f)来计算由第一实施方式的用于噪声/语音确定的参数计算部41a计算的信噪比SNRn和每频带的信噪比的积分值Rn
第四实施方式(噪声抑制装置)
图9示出了根据本发明的第四实施方式的用作噪声抑制装置的信号处理装置。该噪声抑制装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3a、以及分段确定装置4a,这些组件都已在根据第一实施方式的信号处理装置中进行了描述。根据第四实施方式的噪声抑制装置进一步具有抑制量计算部5、抑制部6、以及时域信号合成部7。
首先,频域信号分析部2通过利用FFT来产生输入频谱Xn(f)。抑制量计算部5通过利用由频域信号分析部2计算出的输入频谱Xn(f)和由瞬时噪声估算部31计算出的瞬时噪声频谱Nn(f)来计算每带宽的抑制系数Gn(f)。通过下列方程来计算抑制系数Gn(f):
G n ( f ) = W n ( f ) ( 1 - N n ( f ) X n ( f ) ) (0<Gn(f)<1)  方程(10)
应当注意,当噪声/语音确定部42中的确定结果vad_flag表示混合分段时,减小方程(10)中的系数Wn(f),并且当确定结果表示噪声分段时,增大系数Wn(f),从而使得噪声分段中的抑制系数变得大于混合分段中的抑制系数。因此,可以增加抑制量。
抑制部6通过利用输入频谱Xn(f)和由抑制量计算部5计算出的抑制系数Gn(f)而在噪声抑制后计算每带宽的振幅谱Yn(f)。通过下列方程计算振幅谱Yn(f):
Yn(f)=Xn(f)×Gn(f)  方程(11)
时域信号合成部7通过IFFT(快速傅立叶逆变换)把振幅谱Yn(f)从频域逆变换到时域,以计算输出信号yn(t)。
虽然图9利用了第一实施方式中示出的噪声估算装置3a和分段确定装置4a,但是也可以利用在第二实施方式和第三实施方式中示出的噪声估算装置3a和分段确定装置4a。此时,抑制量计算部5通过用平均噪声频谱代替瞬时噪声频谱Nn(f)来计算抑制系数Gn(f)。
虽然已通过上述的实施方式对本发明进行了详细描述,但是显而易见的是,本发明不限于上述实施方式。在不脱离权利要求的描述所确定的目的和范围的情况下,本发明的装置可以被实现为经修正的和经修改的方式。
例如,在根据本发明的第四实施方式的噪声抑制装置中,当用FIR滤波器计算出的每带宽的输入幅值
Figure A20058004760300151
代替用FFT计算出的输入频谱Xn(f)时,可以通过利用与每带宽的输入幅值相对应的逆变换而不是IFFT来计算时域的输出信号yn(t)。

Claims (14)

1.一种信号处理方法,该信号处理方法包括:
时域信号提取步骤,用于提取时域信号,所述时域信号是输入信号的抽样数据;
频域信号分析步骤,用于按帧将所述时域信号转换成频域信号并计算输入频谱;以及
噪声估算步骤,用于通过利用所述输入频谱的最小分量来估算噪声频谱,所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号。
2.根据权利要求1所述的信号处理方法,其中,所述噪声估算步骤包括获得每帧的瞬时噪声频谱作为所述噪声频谱。
3.根据权利要求2所述的信号处理方法,其中,所述噪声估算步骤包括获得多个帧的瞬时噪声频谱的平均噪声频谱作为所述噪声频谱。
4.根据权利要求1到3中的任意一项所述的信号处理方法,该方法还包括分段确定步骤,用于对所述噪声频谱与所述输入频谱进行比较,并确定所述帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段中。
5.根据权利要求4所述的信号处理方法,其中,当在所述分段确定步骤中直到最后一帧的确定结果表示混合分段时,所述噪声估算步骤包括通过利用所述瞬时噪声频谱来获得所述平均噪声频谱,而当所述确定结果表示噪声分段时,所述噪声估算步骤包括通过利用所述输入频谱来获得所述平均噪声频谱。
6.根据权利要求4所述的信号处理方法,该方法还包括抑制量计算步骤,用于考虑了所述分段确定步骤的确定结果的情况下,基于所述噪声频谱和所述输入频谱对所述输入信号计算每带宽的抑制量,并抑制所述输入信号的噪声。
7.根据权利要求1到6中的任意一项所述的信号处理方法,其中,所述输入信号包括语音信号。
8.一种信号处理装置,该信号处理装置包括:
时域信号提取部,用于提取时域信号,所述时域信号是输入信号的抽样数据;
频域信号分析部,用于按帧将所述时域信号转换成频域信号并计算输入频谱;以及
噪声估算部,用于通过利用所述输入频谱的最小分量来估算噪声频谱,所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号。
9.根据权利要求8所述的信号处理装置,其中,所述噪声估算部获得每帧的瞬时噪声频谱作为所述噪声频谱。
10.根据权利要求9所述的信号处理装置,其中,所述噪声估算部获得多个帧的瞬时噪声频谱的平均噪声频谱作为所述噪声频谱。
11.根据权利要求8到10中的任意一项所述的信号处理装置,该信号处理装置还包括分段确定部,用于对所述噪声频谱和所述输入频谱进行比较,并确定所述帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段中。
12.根据权利要求11所述的信号处理装置,其中,当在所述分段确定部中直到最后一帧的确定结果表示混合分段时,所述噪声估算部通过利用所述瞬时噪声频谱来获得所述平均噪声频谱,而当所述确定结果表示噪声分段时,所述噪声估算部通过利用所述输入频谱来获得所述平均噪声频谱。
13.根据权利要求11所述的信号处理装置,该信号处理装置还包括抑制量计算部,用于在考虑了所述分段确定部的确定结果情况下,基于所述噪声频谱和所述输入频谱对所述输入信号计算每带宽的抑制量,并抑制所述输入信号的噪声。
14.根据权利要求8到13中的任意一项所述的信号处理装置,其中,所述输入信号包括语音信号。
CN200580047603A 2005-02-02 2005-02-02 信号处理方法和装置 Expired - Fee Related CN100593197C (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/001515 WO2006082636A1 (ja) 2005-02-02 2005-02-02 信号処理方法および信号処理装置

Publications (2)

Publication Number Publication Date
CN101111888A true CN101111888A (zh) 2008-01-23
CN100593197C CN100593197C (zh) 2010-03-03

Family

ID=36777031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580047603A Expired - Fee Related CN100593197C (zh) 2005-02-02 2005-02-02 信号处理方法和装置

Country Status (5)

Country Link
US (1) US20070265840A1 (zh)
EP (1) EP1845520A4 (zh)
JP (1) JP4519169B2 (zh)
CN (1) CN100593197C (zh)
WO (1) WO2006082636A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102598127A (zh) * 2009-11-06 2012-07-18 日本电气株式会社 信号处理方法、信息处理装置及用于存储信号处理程序的存储介质
CN103440870A (zh) * 2013-08-16 2013-12-11 北京奇艺世纪科技有限公司 一种音频降噪方法及装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080084829A1 (en) * 2006-10-05 2008-04-10 Nokia Corporation Apparatus, method and computer program product providing link adaptation
WO2009035613A1 (en) * 2007-09-12 2009-03-19 Dolby Laboratories Licensing Corporation Speech enhancement with noise level estimation adjustment
US8744068B2 (en) * 2011-01-31 2014-06-03 Empire Technology Development Llc Measuring quality of experience in telecommunication system
PL3239978T3 (pl) 2011-02-14 2019-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
RU2585999C2 (ru) * 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование шума в аудиокодеках
JP6160045B2 (ja) 2012-09-05 2017-07-12 富士通株式会社 調整装置および調整方法
JP6059130B2 (ja) * 2013-12-05 2017-01-11 日本電信電話株式会社 雑音抑圧方法とその装置とプログラム
CN105791530B (zh) * 2014-12-26 2019-04-16 联芯科技有限公司 输出音量调节方法和装置
TWI684912B (zh) * 2019-01-08 2020-02-11 瑞昱半導體股份有限公司 語音喚醒裝置及方法
CN114285505A (zh) * 2021-12-16 2022-04-05 重庆会凌电子新技术有限公司 一种自动噪底计算方法和系统
CN115291151B (zh) * 2022-09-28 2023-01-13 中国科学院精密测量科学与技术创新研究院 一种基于低相关分段的高精度磁共振信号频率测量方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3027389B2 (ja) * 1990-03-26 2000-04-04 株式会社リコー 2値化パターン生成方式
JPH06208395A (ja) * 1992-10-30 1994-07-26 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho ホルマント検出装置及び音声加工装置
FR2704111B1 (fr) * 1993-04-16 1995-05-24 Sextant Avionique Procédé de détection énergétique de signaux noyés dans du bruit.
JP3353994B2 (ja) * 1994-03-08 2002-12-09 三菱電機株式会社 雑音抑圧音声分析装置及び雑音抑圧音声合成装置及び音声伝送システム
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
JP3484801B2 (ja) * 1995-02-17 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び装置
KR970011336B1 (ko) * 1995-03-31 1997-07-09 삼성코닝 주식회사 접착용 유리조성물
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
JPH09212196A (ja) * 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置
JPH09311696A (ja) * 1996-05-21 1997-12-02 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JP3250604B2 (ja) * 1996-09-20 2002-01-28 日本電信電話株式会社 音声認識方法および装置
JP3418855B2 (ja) * 1996-10-30 2003-06-23 京セラ株式会社 雑音除去装置
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
US7072831B1 (en) * 1998-06-30 2006-07-04 Lucent Technologies Inc. Estimating the noise components of a signal
US7209567B1 (en) * 1998-07-09 2007-04-24 Purdue Research Foundation Communication system with adaptive noise suppression
JP3459363B2 (ja) * 1998-09-07 2003-10-20 日本電信電話株式会社 雑音低減処理方法、その装置及びプログラム記憶媒体
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP3454190B2 (ja) * 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
FR2797343B1 (fr) * 1999-08-04 2001-10-05 Matra Nortel Communications Procede et dispositif de detection d'activite vocale
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
JP3325248B2 (ja) * 1999-12-17 2002-09-17 株式会社ワイ・アール・ピー高機能移動体通信研究所 音声符号化パラメータの取得方法および装置
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US7171357B2 (en) * 2001-03-21 2007-01-30 Avaya Technology Corp. Voice-activity detection using energy ratios and periodicity
US6820054B2 (en) * 2001-05-07 2004-11-16 Intel Corporation Audio signal processing for speech communication
JP3960834B2 (ja) * 2002-03-19 2007-08-15 松下電器産業株式会社 音声強調装置及び音声強調方法
JP4058987B2 (ja) * 2002-04-15 2008-03-12 三菱電機株式会社 雑音除去装置及び雑音除去方法
EP1681670A1 (en) * 2005-01-14 2006-07-19 Dialog Semiconductor GmbH Voice activation
JP4670483B2 (ja) * 2005-05-31 2011-04-13 日本電気株式会社 雑音抑圧の方法及び装置
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102598127A (zh) * 2009-11-06 2012-07-18 日本电气株式会社 信号处理方法、信息处理装置及用于存储信号处理程序的存储介质
CN102598127B (zh) * 2009-11-06 2016-07-13 日本电气株式会社 信号处理方法、信息处理装置
CN103440870A (zh) * 2013-08-16 2013-12-11 北京奇艺世纪科技有限公司 一种音频降噪方法及装置

Also Published As

Publication number Publication date
JP4519169B2 (ja) 2010-08-04
EP1845520A1 (en) 2007-10-17
CN100593197C (zh) 2010-03-03
US20070265840A1 (en) 2007-11-15
JPWO2006082636A1 (ja) 2008-06-26
EP1845520A4 (en) 2011-08-10
WO2006082636A1 (ja) 2006-08-10

Similar Documents

Publication Publication Date Title
CN100593197C (zh) 信号处理方法和装置
US8233636B2 (en) Method, apparatus, and computer program for suppressing noise
CN100492493C (zh) 噪声抑制方法和设备
Pham et al. Analysis of multicomponent polynomial phase signals
Papoulis et al. Detection of hidden periodicities by adaptive extrapolation
EP2209117A1 (en) Method for determining unbiased signal amplitude estimates after cepstral variance modification
CN105792072B (zh) 一种音效处理方法、装置及终端
CN102959625A (zh) 自适应地检测输入音频信号中的话音活动的方法和设备
Zeng et al. Parameter estimation of power system signals based on cosine self-convolution window with desirable side-lobe behaviors
CN103280225B (zh) 一种低复杂度的静音检测方法
Barkat Instantaneous frequency estimation of nonlinear frequency-modulated signals in the presence of multiplicative and additive noise
Chu et al. A new local polynomial modeling-based variable forgetting factor RLS algorithm and its acoustic applications
Zhang et al. Structure detection of Wiener–Hammerstein systems with process noise
US7630432B2 (en) Method for analysing the channel impulse response of a transmission channel
CN105534480A (zh) 鼾声检测方法及装置
Santamaria et al. Estimation of the magnitude squared coherence spectrum based on reduced-rank canonical coordinates
Matania et al. Algorithms for spectrum background estimation of non-stationary signals
Savaresi et al. Closed-form unbiased frequency estimation of a noisy sinusoid using notch filters
CN111711586B (zh) 一种应用于通信调制方式识别的时频协同滤波方法及系统
CN113035223A (zh) 音频处理方法、装置、设备及存储介质
CN113077804B (zh) 回声消除方法、装置、设备及存储介质
CN112017674B (zh) 一种基于音频特征检测广播音频信号中噪声的方法
Sucic et al. Optimisation algorithm for selecting quadratic time-frequency distributions: performance results and calibration
JPH10190470A (ja) 周波数荷重評価関数に基づくスペクトル特徴パラメータ抽出装置
CN104618043B (zh) 接收机信号质量评估方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20181205

Address after: Kanagawa

Patentee after: Fujitsu Interconnection Technology Co., Ltd.

Address before: Kanagawa

Patentee before: Fujitsu Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100303

Termination date: 20210202

CF01 Termination of patent right due to non-payment of annual fee