CN1083183C - 用来降低语音信号中噪声的方法和装置 - Google Patents

用来降低语音信号中噪声的方法和装置 Download PDF

Info

Publication number
CN1083183C
CN1083183C CN96105920A CN96105920A CN1083183C CN 1083183 C CN1083183 C CN 1083183C CN 96105920 A CN96105920 A CN 96105920A CN 96105920 A CN96105920 A CN 96105920A CN 1083183 C CN1083183 C CN 1083183C
Authority
CN
China
Prior art keywords
noise
consonant
speech signal
input speech
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN96105920A
Other languages
English (en)
Other versions
CN1141548A (zh
Inventor
J·陈
西口正之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1141548A publication Critical patent/CN1141548A/zh
Application granted granted Critical
Publication of CN1083183C publication Critical patent/CN1083183C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/09Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Picture Signal Circuits (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

一种用来降低在一语音信号中的噪声的方法和装置能够抑制在该输入信号中的噪声并能简化其过程。该装置包括一用来将输入语音信号转换为一频域信号的快速付里叶变换单元3和一用于控制与为了消除来自输入语音信号中的噪声而使用的滤波相关的滤波特性的Hn值计算单元7。该装置还包括一通过与由Hn值计算单元7所产生的滤波特性相一致的滤波来降低该输入语音信号的频谱校正单元10。该Hn值计算单元7响应于由快速付里叶变换单元3所得到的输入信号频谱的以帧为基础的最大SN比而的一值和一估算噪声电平计算该Hn值并且响应于该Hn值控制在频谱校正单元10中的用来消除噪声的处理。

Description

用来降低语音信号中噪声的方法和装置
本发明涉及一种用来消除一语音信号中的噪声以便抑制或降低其内所包含的噪声的方法和装置。
在便携式电话机或语音识别领域中,为了突出它的语音分量而必须抑制在被收集的语音信号中所包含的诸如背景噪声或环境噪声之类的噪声。作为用来突出其语音或降低该噪声的技术,使用了一种R.J.Mcaulay和M.L.Maplass在"使用一软判定噪声抑制滤波器的语音增强"(IEEE Trans.Acous.,Speecn Signal Processing,Vol.28,pp.137 to 145,April 1980)中所披露的用于衰减系数调整的条件概率函数的技术。
在上述噪声抑制技术中,由于一不适当的滤波或基于一不适当被安置的信噪比(SNR)的操作而频繁出现所产生的不自然的声调或失真语音。这是所不希望出现的现象,在实际操作中为了实现一最佳的性能,用户不得不去调整作为一噪声抑制装置的参量之一的SNR。另外,利用常规的语音信号增强技术在短时间内有效化消除SNR中对明显变化敏感的语音信号内的噪声而又不产生失真是困难的。
这种语音增强或噪声降低技术采用了一种通过将输入功率或电平与一予置阈值相比较而鉴别一噪声范围的技术。但是,如果利用与禁止阈值跟踪语音相关的技术使该阈值的时间常数增加,那么,就不能适当地跟随噪声电平的变化,特别是噪声电平的增加,从而导致出现错误的辨别。
为了克服这个缺点,本发明具有在日本专利申请平-6-99869(1994)中所提出的一种用来降低在一语音信号中的噪声的噪声降低方法。
利用这种用于语音信号的噪声降低方法,噪声抑制是通过根据由输入语音信号和语音出现概率得到的SNR而适当地控制一用于计算一语音分量构成的最大似然滤波来实现的。在计算语音出现概率中该方法采用了一种相应于较少被估算噪声频谱的输入语音频谱的信号。
利用这种用于语音信号的噪声降低方法,因为最大似然滤波是依据该输入语音信号的SNR而被调整为一最佳抑制滤波,所以可以实现对于输入语音信号的充分的噪声减少。
但是,为了计算语音出现概率需要复杂和庞大的处理操作,因而希望能简化该处理操作。
另外,在输入语音信号中的辅音,特别是在输入语音信号中的背景噪音中出现的辅音有被抑制的趋向。因而希望该辅音分量不被抑制。
因此本发明的一个目的是提供一种用于输入语音信号的噪声降低方法,从而使得对于该输入语音信号的噪声抑制的处理操作得以简化并且可以阻止在该输入信号中的辅音分量被抑制。
在一个方面,本发明所提供的与噪声抑制相关的降低在一输入语音信号中噪声的方法包括有检测在该输入语音信号中所包含的辅音部分的步骤和响应由辅音部分检测步骤的辅音检测的结果以一种控制方式在从输入语音信号中消除该噪声时抑制该噪声降低量的步骤。
在另一方面,本发明所提供的用来降低在一语音信号中噪声的装置包括有一用于与噪声抑制相关降低在的一输入语音信号中的噪声以便使该噪声降低量根据一控制信号而变化的噪声降低单元,用来检测在输入语音信号中所包含的一辅音部分的装置,和用来响应来自辅音部分检测结果以受控方式抑制该噪声降低量的装置。
利用根据本发明的噪声降低方法和装置,因为在这样一种方式中从输入语音信号中检测辅音部分并且按照所检测的辅音从该输入语音信号中消除噪声从而抑制该噪声降低量,因而使得在噪声抑制期间除去辅音部分和防止该辅音部分的失真变为可能。另外,因为输入语音信号被转换为频域信号,从而使得仅仅包含在该输入语音信号中的临界特性可被取出用于执行噪声抑制的处理,因而使得减少处理操作量变为可能。
利用与语音信号相关的噪声降低方法和装置,使用在输入语音信号的一短的范围内的至少一个被检测的能量变化值、一表明在该输入语音信号中频率分量的分布的值和在该输入语音信号中的零交叉数可以检测该辅音。在检测该辅音中,以这样一种方式将噪声从输入语音信号中消除从而抑制噪声降低量,使得在噪声抑制期间除去辅音部分和防止该辅音部分的失真以及降低用于噪声的处理操作量成为可能。
另外,使用本发明的噪声降低方法和装置,因为用于与从输入语音信号中消除噪声的滤波相关的滤波特性可以利用响应于辅音部分检测的第一值和第二值来控制,因而通过与输入语音信号的最大SN比相一致的滤波从该输入语音信号中消除噪声变为可能,同时在噪声抑制期间除去辅音部分和防止辅音部分的失真以及减少用于噪声抑制的处理操作量变为可能。
图1示出了根据本发明的一噪声降低装置的一实施例的方框图;
图2示出了根据本发明的用来降低在一语音信号中的噪声的一噪声降低方法的操作的一流程图;
图3示出了用于图1的实施例的能量E[K]和衰减能量Edecay[K]的一具体例子;
图4示出了用于图1的实施例的一RMS值RMS[K]、一估计噪声电平值MinRMS[K]和一最大RMS值MaxRMS[K]的具体例子;
图5示出了用于图1中所示实施例的相关能量Brel[K]、一最大SNR MAXSNR[K](分贝)、一最大SNR MAXSNR[K]和作为噪声辨别的阈值之一的值dBthresrel[K]的具体例子;
图6的图形示出了用于图1所示实施例的作为相对于最大SNRMaxSNR[K]所规定的一特征的NR_电平[K];
图7示出了用于图1所示实施例的NR[W,K]和最大噪声降低量(dB)之间的关系;
图8说明了用于图1所示的实施例的用来求出该输入信号频谱的频段的分布值的一种方法;
图9示出了用于根据本发明降低该语音信号中的噪声的一噪声降低装置的改进的方框图。
参照附图,将详细说明根据本发明的用来降低语音信号中噪声的方法和装置。
图1示出了根据本发明的用来降低语音信号中噪声的一噪声降低装置的一实施例。
用于语音信号的该噪声降低装置包括有一频谱校正单元10,作为与噪声抑制相关的从输入语音信号中消除噪声从而使噪声降低量可根据一控制信号变化的一噪声降低单元。该用于语音信号的噪声降低装置还包括一辅音检测单元41,作为用来检测包含在输入语音信号中的辅音部分的一辅音部分检测装置,和一Hn值计算单元7,作为用于响应于由辅音部分检测装置所产生的辅音检测结果而抑制噪声降低量的控制装置。
用于语音信号的该噪声降低装置进一步包括有一快速付里叶变换单元3作为用来将输入语音信号变换为一在频率轴上的信号的变换装置。
一进入该噪声降低的装置的语音信号输入端13的输入语音信号Y(t)被提供到一成帧单元1。由成帧单元1输出的一成帧信号Y-framej,k被提供给窗口单元2、在一噪声估算单元5中的均方根(RMS)计算单元21、和一滤波单元8中。
窗口单元2的输出被提供给快速付里叶变换单元3,其输出被提供到频谱校正单元10和频段分离单元4。
频段分离单元4的输出被提供给频谱校正单元10、在噪声估算单元5中的噪声频谱估算单元26、Hn值计算单元7以及在辅音检测单元41中的零交叉检测单元42和音调检测单元43。频谱校正单元10的输出通过快速付里叶变换单元11以及重叠和相加单元12被提供到语音信号输出端14。
RMS计算单元21的一输出被提供给相关能量计算单元22、最大RMS计算单元23、估算噪声电平计算单元24、噪声频谱估算单元26、在辅音检测单元41中的邻近语音帧检测单元44和辅音分量检测单元45。最大RMS计算单元23的一输出被提供给估算噪声电平计算单元24和最大SNR计算单元25。相关能量计算单元22的一输出被提供给噪声频谱估算单元26。估算噪声电平计算单元24的一输出被提供给滤波单元8、最大SNR计算单元25、噪声频谱估算单元26和NR值计算单元之6。最大SNR计算单元25的一输出被提供给NR值计算单元6和噪声频谱估算单元26,噪声频谱估算单元26的一输出被提供给Hn值计算单元7。
NR值计算单元6的一输出再次被提供给NR值计算单元6,同时还提供给NR2值计算单元46。
零交叉检测单元42的一输出被提供给邻近语音帧检测单元44和辅音分量检测单元45。音调检测单元43的一输出被提供给辅音分量检测单元45。辅音分量检测单元45的一输出被提供给NR2值计算单元46。
NR2值计算单元46的一输出被提供给Hn值计算单元7。
Hn值计算单元7的一输出通过滤波单元8和频段转换单元9被提供给频谱校正单元10。
后面将说明用于语音信号的噪声降低装置的第一实施例的操作。在下面的说明中,说明噪声降低装置的各种分量的操作在图2的流程图的各个步骤的括号内被指明。
加到语音信号输入端13的所提供的输入语音信号Y(t)包括有一语音分量和一噪声分量。该输入语音信号Y(t)是例如为以取样频率FS取样的一数字信号,它被提供给成帧单元1,在那里被分离成为每一个具有一FL取样的帧长度的多个帧。这种分离的输入语音信号Y[t]随后在该帧的基础上被处理。帧时间间隔(是沿时间轴的帧位移量)是FI取样,这样第(K+1)帧是在作为来自第K帧的FI取样之后开始的。作为取样频率和取样数的例子说明,如果该取样频率FS是8KHz则80次取样的帧间隔FI相当于10ms,同时160次取样的帧长度FL相当于20ms。
在由快速付里叶变换单元3进行正交变换计算之前,窗口单元2对来自成帧单元1的每个成帧信号Y-framej,k与一窗口系数Winput相乘。和在后面所将要介绍的在基本帧信号处理操作的末级所执行的反相FFI,一输出信号与一窗口系数Woutput相乘。窗口系数Winput和Woutput分别由下式等式(1)和(2)所说明: W input [ j ] = ( 1 2 - 1 2 cos ( 2 πj FL ) ) 1 4 , 0 ≤ j ≤ FL .....(1) W output [ j ] = ( 1 2 - 1 2 cos ( 2 πj FL ) ) 3 4 , 0 ≤ j ≤ FL .....(2)
快速付里叶变换单元3随后执行256点快速付里叶变换操作以产生频率频谱幅值,之后该频谱幅值由频段分离部分4分离成例如18频段。作为一例子这些频段的频率范围示于表1:表1
频段号       频率范围
01234567891011121314151617 0至125Hz125至250Hz250至375Hz375至563Hz563至750Hz750至938Hz938至1125Hz1125至1313Hz1313至1563Hz1563至1813Hz1813至2063Hz2063至2313Hz2313至2563Hz2563至2813Hz2813至3063Hz3063至3375Hz3375至3688Hz3688至4000Hz
如前面所说明的,来自频率频谱分离结果的频段幅值变为输入信号频谱的幅度Y[W,K],并被输出到各自部分。
上述频率范围是基于这样的事实,频率越多,人类听觉器官可感知分辨率的就变得越少。作为各个频段的幅度,使用了在适当频率范围中的最大FEt幅度。
在噪声估算单元5中,成帧噪声信号Y_framej,k从该语音中被分离并且认为有噪声的一帧被检测,同时将所估算的噪声电平值和最大SN比提供给NR值计算单元6。通过例如三个检测操作的组合执行有噪声范围估算或有噪声帧的检测。现在说明有噪声范围估算的说明性例子。
RMS计算单元21计算每帧信号的RMS值并输出所计算的RMS值。由下式(3)计算第K帧的RMS或RMS[K]: RMS [ k ] = 1 FL Σ j = 0 FL - 1 ( y - framej , k ) 2 .....(3)
在相关能量计算单元22中,计算与来自前面帧的衰减能量有关的第K帧的相关能量,或dBre[K],并且输出结果值。由下面等式(4)求出相关能量(dB),即dBre[K]: dB rel [ K ] = 10 log 10 ( E decay [ K ] ) E [ K ] ……(4)同时从下面等式(5)和(6)求出能量值E[K]和衰减能量值Edecay[K]: E [ k ] = Σ l = 1 FL ( y - framej , k ) 2 .....(5) E decay [ k ] = mas ( E [ k ] , ( esp ( - FL 0.65 * FS ) ) * E decay [ k - 1 ] ) .....(6)
等式(5)可以根据等式(3)被表示为FL*(RMS[K]))2。当然,由RMS计算单元21在等式(3)的计算期间所得到的等式(5)的值可以直接地提供给相关能量计算单元21。在等式(6)中,衰减时间被置为0.65秒。
图3示出了说明能量值E[K]和衰减能量Edecay[K]的例子。
最大RMS计算单元23求得并输出用来估算信号电平与噪声电平之比的最大值所必须的一最大RMS值,即最大SN比。这个最大RMS值MaxRMS[K]可由等式(7)求出:
MaxRMS[K]=max(4000,RMS[K],θ*MacRMS[K-1]+(1-θ)*RMS[K])
                                ……(7)其中θ是一衰减常数。对于θ来说,是在3.2秒时将最大RMS值衰减1/e所使用即θ=0.993769所使用的这样一个值。
估算噪声电平计算单元24求得并输出适用来求解背景噪声电平的一最小RMS值。这个估算噪声电平值minRMS[K]是在当前时间点之前的五个局部最小值的最小值,即满足于等式(8)的五个值中的最小值:
       (RMS[K]<0.6*MaxRMS[K]和
       RMS[K]<4000和
       RMS[K]<RMS[K+1]和
       RMS[K]<RMS[K-1]和
       RMS[K]<RMS[K-2]或
       (RMS[K]<MinRMS)
该估算的噪声电平值minRMS[K]的设置使得与语音无关的背景噪声上升。对于高噪声电平来说这个上升比值是按指数规律上升的,同时为了获得一更显著的上升对于低噪声电平使用了一固定上升比。
图4示出了说明RMS值RMS[K]、估算噪声电平值minRMS[K]和最大RMS值MaxRMS[K]的例子。
最大SNR计算单元25通过下面等式(9)利用最大RMS值和估算的噪声电平值来估算和计算最大SN比MaxSNR[K]: MaxSNR [ k ] = 20 log 10 ( MaxRMS [ k ] MinRMS [ k ] ) - 1 .....(9)
根据最大SNR值MaxSNR,计算在从0到1的表示相关噪声电平的一范围内的一标准化参数NR_|eve|。对于NR_|eve|,使用下面的函数:
Figure C9610592000162
.....(10)
现在说明噪声频谱会算单元26的操作。在相关能量计算单元22、估算噪声电平计算单元24和最大SNR计算单元25中求得的各个值是用来辨别来自该背景噪声的语音的。如果下面的条件:((RMS[K]<noiseRMsthres[K])或(dBrel[K]>dBthres[K]))和(RMS[K]<RMS[K-1]+200)……(11)
这里
NoiseRMSthres[K]=1.05+0.45*NR_level[K]×MinRMS[K]
dBthres rel[K]=max(MaxSNR[K]-4.0,0.9*MaxSNR[K]是有效的,则在第K帧中的信号被分类为背景噪声。因此被分类为背景噪声的幅度被作为该噪声频谱的一时间平均估算值N(W,K)被计算和输出。
图5示出了说明在式11中所示的相关能量(dB)即作为用于噪声辨别的阈值之一的dBrel[K]、最大SNR[K]和dBthresrel的例子。
图6示出了在等式10中作为MaxSNR[K]的一函数的NR_level[K]。
如果第K帧是被分类为背景噪声或噪声,则该噪声频谱N[W,K]的平均估算值由下面等式(12)所计算的当前帧的信号的输入信号频谱的幅度Y[W,K]可更新:N[W,K]=a*max(N[W,K-1],Y[W,K])
     +(1-a)*min(N[W,K-1],Y[W,K])……(12) α = exp ( - FI 0.5 * FS ) 这里W是在频段分离中的具体的频段数。
如果第K帧被分类为语音,则N[W,K-1]的值被直接地用于N[W,K]。
NR值计算单元6计算NR[W,K],它是一用来禁止该滤波响应来自突然变化的值,并且输出所产生的值NR[W,K],这个NR[W,K]是一从0到1范围内的值并由等式(13)来确定:
Figure C9610592000182
.....(13)
在等式(13)中,adj[W,K]是用于考虑如下所述的效果并由等式(14)所确定的一个参数:
δNR=0.004
adj[W,K]=min(adj1[K],adj2[K]-adj3[W,K]
                                         ……(14)
在等式(14)中,adj1[K]是一具有通过如下所述的滤波抑制在高SNR处的噪声抑制效果的效果的值,并由下述等式(15)来确定:
Figure C9610592000191
……(15)
在等式(14)中,adj2[K]是一具有通过上述滤波操作相对于一极低的噪声电平或一极高的噪声电平抑制该噪声抑制速率的效果的值,并由下述等式来确定:.....(16)
在等式(14)中ajd3[K]是一具有在2375Hz和4000Hz之间从18dB到15dB抑制最大噪声降低量的效果的值,并由下面等式(17)来确定:……(17)
同时,如图7所示,可以看出上述NR[W,K]的值和以dB表示的最大噪声降低量的值之间的关系在该dB范围内基本为线性。
在图1的辅音检测部分41中,该辅音分量是根据输入信号频谱Y[W,K]的幅度Y在帧基础上被检测的。按照辅音检测的结果,计算表明该辅音作用的值CE[K]并输出这样被计算的值CE[K]。现在来说明辅音检测的一个例子。
在零交叉部分42,符号从正反转为负或从负反转为正的Y[W,K]的相邻取样之间的部分或在两个具有相反符号的取样之间存在有一具有值为0的取样的部分被作为零交叉而被检测(步骤S3)。从帧到帧地检测零交叉部分的数并且输出零交叉数C[K]。
在音调检测单元43,音调,即表明Y[W,K]的频率的分量的一值,例如在高区域输入信号频谱的平均电平t′与在低区域输入信号频谱的平均电平b′之比或t′/b′(=音调[K],被检测(步骤S2)并被输出。值t′和b′是假设由等式(18)确定的其误差函数ERR(fc,b,t)为最小值的值t和b: min f 0 - 2 . . . N b , i ∈ R R - 3 Err ( fc , b , t ) = Σ w = 0 fc ( Y max [ w , k ] - b ) 2 + Σ w = fc + 1 NR - 1 ( Y max [ w , k ] .....(18)在上述等式(18)中,NB代表频段数,Ymax[W,K]代表在一频谱W中的Y[W,K]的最大值和fc代表一高区域和一低区域相互分离的点。在图8中,Y[W,K]的频率fc的低端的一平均值是b,同时Y[W,K]的频率fc的高端的一平均值是t。
在邻近语音帧检测单元44中,基于RMS值和零交叉检测在一语音声音被检测的帧的附近的帧,也就是一邻近语音帧(步骤S4)。按照这个帧数,根据下面等式(19)产生作为输出的邻近音节帧的数spch-prox[K]:……(19)
在辅音分量检测单元45,根据零交叉数、邻近语音帧数、音调和RMS值检测在每帧的Y[W,K]中的辅音分量(步骤S5)。该辅音检测结果被作为表明辅音效果的值CE[K]而被输出。该值CE[K]由下式(20)确定:……(20)符号C1、C2、C3、C4.1至C4.7的确定如表2中所示:表2
   符号     确定的公式
   C1   RMS[K]>CDSO*MinRMS[K]
   C2   ZC[K]>Z low
   C3   spch_pfox[K]<T
   C4.1   RMS[K]>CDS1*RMS[K-1]
   C4.2   RMS[K]>CDS1*RMS[K-2]
   C4.3   RMS[K]>CDS1*RMS[K-3]
   C4.4   ZC[K]>乙high
   C4.5   tone[K]>CDS2*tone[K-1]
   C4.6   tone[K]>CDS2*tone[K-2]
   C4.7   tone[K]>CDS2*tone[K-3]
在上述表2中,CDS0、CDS1、CDS2、T、ZlOW和Zhigh是确定辅音检测灵敏度的常数。例如,CDS0=CDS1=CDS2=1.41,T=20,Zlow=20和Zhigh=75。再有,在式(20)中假定E是从0到1的一个值,例如为0.7。调整滤波器响应曲线使得E值越接近于0,则越逼近于常用的辅音抑制量,反之,E值越接近于1,则越逼近于常用的辅音抑制量的最小值。
在上述表2中,符号C1有效表明该帧的信号电平大于最小噪声电平。另一方面,符号C2有效表明上述帧的零交叉数大于一予置零交叉数(在20之内),同时符号C3有效表明上述帧是在从其中语音声音被检测的一帧计数的T帧之内(在20帧范围内)。
符号C4.1有效规定信号电平是在上述帧的范围内变化,4.2有效表明上述帧是由于该语音信号改变而出现的一帧之后所出现的一帧和经受信号电平的变化的一帧。符号C4.3有效表明上述帧是由于该语音信号的变化而出现的二帧之后所出现的一帧和经受信号电平变化的一帧。符号4.4有效表明在上述帧中零交叉数大于零交叉Zhigh的一予置数,在上述帧中是在75之内。符号C4.5有效规定该音调值是在上述帧内变化,同时符号4.6有效表明上述帧是由于该语音信号的变化而出现的一帧之后所出现的一帧和音调值经受变化的一帧。符号C4.7有效表明上述帧是由于该语音信号变化出现的二帧之后所出现的一帧和经受音调值变化的一帧。
根据式(20),包含辅音分量的帧的条件是对于符号C1至C3的条件被满足,tone[K]大于0.6和C1至C4.7的条件中的至少一个条件被满足。
参见图1,NR2值计算单元46根据式(21)从上述值NR[W,K]和表明辅音效果CE[K]的上述值计算NR2[W,K]并输出该值NR2[W,K]:
          NR2[W,K]=(1.0-CE[K])*NR[W,K]
                                         ……(21)
Hn值计算单元7是一根据频段分离输入信号频谱的幅度Y[W,K]、噪声频谱的时间平均估算值N[W,K]和上述值NR2[W,K]用来降低该频段分离输入信号的幅度Y[W,K]用来降低该频段分离输入信号的幅度Y[W,K]中的噪声分量的一予置滤波。值Y[W,K]响应于N[W,K]被转换成一予置滤波。值Y[W,K]响应于N[W,K]被转换成一滤波响应Hn[W,K]并被输出。根据下面等式(22)计算值Hn[W,K]:
Hn[W,K]=1-2*NR[W,K]-NR22[W,K])*(1-H[W][S/N=r])
                        ……(22)
在上述等式(22)中,值H[W][S/N=r]是当SNR被固定在值r时等效于噪声抑制滤波器的最佳特性,并由下面等式(23)求得: H [ w ] [ S / N = r ] = 1 2 ( 1 + 1 - 1 x 2 [ w , k ] ) * PHl | Y w ) S / N - r ] + G min * P ( HO | Y w ) [ : .....(23)
同时,根据值Y[W,K]/N[W,K],这个值可在先地求出并列在一表中。同时,在等式(19)中X[W,K]等效于Y[W,K]/N[W,K],而Gmin是一表示H[W][S/N=r]的最小增益的参数并假定为一例如-18dB的值。另一方面,p(Hi/Yw)[S/N=r]和p(Ho/Yw)[S/N=r]是指明每个输入信号频谱的幅值Y[W,K]的状态的参数,而p(H1/Yw)[S/N=r]是指明Y(W,K)中共同混合有语音分量和噪声分量的状态的参数和p(Ho/Yw)[S/N=r]是一指明在Y(W,K)中仅包含有噪声分量的参数。根据等式(24)来计算这些值: P ( H 1 | Y w ) [ S / N = r ] = 1 - P ( HO | Y w ) [ S / N = r ] = P ( H 1 ) * ( exp ( - r 2 ) ) * P ( H 1 ) * ( exp ( - r 2 ) ) * I 0 ( 2 : r : x [ w , l .....(24)其中p(H1)=p(Ho)=0.5。
从等式(20)可见,p(H1/YW)[S/N=r]和P(Ho/YW)[S/N=r]是X[W,K]的函数,而Io(2*r*X[W,K])是一贝塞尔(Bessel)函数并根据r和[W,K]的值来求出。P(H1)和P(Ho)固定为0.5。通过上述的简化参数,与常数方法相比其处理量可降低到大约五分之一。
滤波单元8沿着频率轴和时间轴执行用来平滑Hn[W,K]的滤波,这样产生一种平滑的信号Ht-Smooth[W,K]作为一输出信号。在沿频率轴方向的滤波具有降低信号Hn[W,K]的有效冲击响应长度的作用。这就阻止了在该频域中由于来自一滤波器实现乘法运算导致周期回旋而产生的混淆。在沿时间轴方向上的滤波具有限制在抑制突然的噪声产生中在滤波器特性中的变化速率。
首先说明沿频率轴方向上的滤波。在每个波段的Hn[W,K]中执行中值滤波。这种方法如下面等式(25)和(26)所示:
步骤1:H1[W,K]=max(median(Hn[W-i,K],
       Hn[W,K],Hn[W+1,K],
       Hn[W,K]
                 ……(25)
步骤2:H2[W,K]=min(median(H1[W-i,K],
       H1[W,K],H1[W+1,K],H1[W,K]
                                 ……(26)
如果在等式(25)和(26)中,(W-1)或(W+1)不存在,则分别H1[W,K]和Hn[W,K]和H2[W,K]=H1[W,K][W,K]。
如果在步骤中(W-1)或(W+1)不存在,则H1[W,K]是无有单一的或单独的零(0)频段的Hn[W,K],反之,在步骤2中,H2[W,K]是没有单一的、单独的或突出频段的H1[W,K]。在这种方式中,Hn[W,K]被转换成H2[W,K]。
接着说明沿时间轴方向上的滤波。对于在沿时间轴方向的滤波,事实上考虑该输入信号包括三种分量,即语音、背景噪声和表示该语音的上升部分的瞬变状态的瞬变状态。如等式(27)所示,语音信号Hspeech[W,K]是沿时间轴而被平滑:
  Hspeech[W,K]=0.7*Hz[W,K]+0.3*Hz[W,K-1]
                                            ……(27)
在沿该轴的方向上所平滑的背景噪声如等式(28)所示:
Hnoise[W,K]=0.7*Min-H+0.3*Max_H
                                            ……(28)
在上述等式(24)中,Min-H和Max-H可分别由Min-H=min[H2[W,K],H2[W,K-1]和Max_H=max(H2[W,K],H2[W,K-1])求得。
在瞬变状态的信号在沿时间轴方向上不被平滑。
利用上述被平滑的信号,由等式(29)产生一被平滑的输出信号Ht=smooth;
 Ht-smooth[W,K]=(1-atr)(a sp*Hspeech[W,K]
         +(1-a sp)*Hnoise[W,K]
         +atr*H2[W,K]
                           ……(29)
在上述等式(29)中,a sp和a tr可以分别由等式(30)和(31)求得:
Figure C9610592000291
.....(30)这里 SNR inst = RMS local [ K ] RMS local [ K - 1 ]
Figure C9610592000293
.....(31)这里 δ rms = RMS local [ K ] RMS local [ K - 1 ] RMS local [ K ] = 1 FI * Σ j - FI / 2 FL - FI / 2 ( y - framej , k ) 2
然后,在频段转换单元中,来自滤波单元8的用于18个频段的平滑信号Ht-smooth[W,K]通过插入例如一128频段信号的H128[W,K]而被扩散,并将其输出。这种转换例如通过二级来执行,分别由零阶保持和由低通滤波型插入执行从18到64频段和从64到128频段的扩展。
频谱校正单元10随后按比例放大通过用执行频谱校正即噪声分量降低的方法由FFT单元3用上述信号H128[W,K]所得的成帧信号Y_frmaej,k的快速付里叶变换所获得的FFT系数的实数和虚数部分,并输出其结果信号。其结果是无须相位变化就可校正各频段幅度。
为了输出其所产生的经过IFFT的信号,反相FFT单元11随后对频谱校正单元10的输出信号执行反相FFT
重叠和相加单元12重叠和相加该帧基IFFT处理的信号的帧边界部分。在语音信号输出端14上输出所产生的输出语音信号。
图9示出了根据本发明的一种用来对一语音信号执行噪声降低方法的另一实施例。与图1所示的噪声降低装置共同使用的部分或元件用相同的标号示出并且为了简明起见省略了其操作的描述。
用于语音信号的噪声降低装置包括用来与抑制噪声相关的从输入语音信号中除去噪声的便使该噪声降低量依据控制信号而可改变的作为一噪声降低单元的一频谱校正单元。该用于语音信号的噪声降低装置还包括有一用来计算CE值、adj1、adj2和adj3值的作为用来检测包含在输入语音信号中的辅音部分的检测装置的一计算单元32,和作为响应于由辅音部分检测装置所产生的辅音检测的结果用来控制噪声降低量的抑制的控制装置的一Hn值计算单元7。
该用于语音信号的噪声降低装置进一步包括有作为用来将输入语音信号变换为在频率轴上的信号的变换装置的一快速付里叶变换装置3。
在用来产生噪声抑制滤波特性的发生单元35中具有用来计算adj1、adj2和adj3的计算单元7和计算单元32,频段分离单元4将该频谱的幅值分离成例如18个频段,并且将基本频段幅度Y[W,K]输出到用来计算信号特性的计算单元31、噪声频谱估算单元26和初始滤波响应计算单元33。
用于计算信号特性的计算单元31根据自成帧单元1输出的值Y-framej,k和由频段分离单元4输出的值Y[W,K]计算基本帧噪声电平值MinRMS[K]、估算噪声电平值MinRMS[K]、最大RMS值MaxRMS[K]、零交叉的数ZC[K]、音调值tone[K]和近似语音帧的数spch-prox[K],并且向噪声频谱估算单元26和向adj1、adj2和adj3计算单元32提供这些值。
CE值和adj1、adj2和adj3值计算单元32根据RMS[K]、MinRMS[K]和MaxRMS[K]计算adj1[K]、adj2[K]和adj3[W,K]的值,同时根据值ZC[K]、tone[K]、spch-prox[K]和MinRMS[K]计算在指明辅音作用的该语音信号中的CF[K]值,并且向NR值和NR2值计算单元36提供这比值。
初始滤波响应计算单元33将自噪声频谱估算单元26输出的时间平均噪声值N[W,K]和自频段分离单元4输出的Y[W,K]提供给滤波抑制曲线表单元34用来按照在该滤波抑制曲线表单元34中所存贮的Y[W,K]和N[W,K]求出H[W,K]的值以向Hn值计算单元7传送这种求出的值。在滤波抑制曲线表单元34中存贮一用于H[W,K]值的表。
由图1和9所示的噪声降低装置所得到的输出语音信号被提供给例如用于便携式电话机的编码电路或提供给一语音识别装置。另外,在该便携式电话机的一译码器输出信号上可以执行该噪声抑制。
根据本发明的用于语音信号的噪声降低装置的效果如图10所示,其中纵坐标和横坐标分别代表每帧的信号的RMS电平和每帧的帧号。该帧以20ms的间隔被分隔。
原始语音信号和相应于由汽车的噪声或称之为汽车噪音所覆盖的这个语音的信号分别由图10中的曲线A和B表示。可以看出对于所有的帧号来说曲线A的RMS电平高于或等于曲线B,也就是说与噪声相混合的信号的能量值通常较高。
对于曲线C和D来说,在具有帧号约为15的区域a1,具有帧号约为60的区域a2、具有帧号约为60到65的区域a3、具有帧号约为100到105的区域a4、具有帧号约为110的区域a5、具有帧号约为150到160的区域a6和具有帧号约为175到180的区域a7中,曲线C的RMS电平高于曲线D的RSM电平。也就是,在相应于区域a1至a7的帧号的信号中噪声降低被抑制。
利用根据图2中所示的实施例的用于语音信号的噪声降低方法,在值tone[K]的检测之后该语音信号的零交叉被检测,它是一表明频域信号的幅度分布的数。但是,这并不对本发明有所限制,因为值tone[K]可以在检测零交叉之后被检测或者值tone[K]和零交叉可以同时地被检测。

Claims (6)

1.一种在输入语音信号中降低噪声的方法,包括有步骤:
检测在该输入语音信号中所包含的辅音部分;和
响应从所述辅音部分检测步骤的辅音检测结果在从所述输入语音信号消除噪声时以一受控方式控制该噪声降低量;
其中,检测辅音部分的步骤包括在输入语音信号的一短区域中使用至少一个能量的变化、一个表明在输入语音信号中的频率分量的分布的值和在所述输入语音信号中的零交叉数,在所述输入语音信号中被检测的一语音信号部分的附近检测辅音的步骤。
2.如权利要求1所述的噪声降低方法,其中所述表明在该输入语音信号中频率分量的分布的值是根据在一高区域该输入语音信号频谱的平均值与在一低区域该输入语音信号频谱的平均值之比得到的。
3.一种在输入语音信号中降低噪声的方法,包括:
检测在该输入语音信号中所包含的辅音部分;和
响应从所述辅音部分检测步骤的辅音检测结果在从所述输入语音信号消除噪声时以一受控方式控制该噪声降低量;
将输入语音信号转换成一频域信号的步骤,其中所述以一受控方式控制该噪声降低量的步骤包括一根据响应于在所述辅音部分检测步骤中所产生的辅音检测结果由变换步骤所得到的输入信号频谱而得到的可变地控制滤波特性的步骤;
其中所述滤波特性是由根据由所述变换步骤所得到的输入语音信号频谱与包括在所述输入信号频谱中的一估算的噪声频谱之比所求出的第一值和根据输入信号频谱信号值与估算的噪声电平之比的最大值所求出第二值、估算的噪声频谱和表明辅音检测的结果的一辅音效果系数来控制的。
4.一种用来降低在一语音信号中的噪声的装置,包括有:
一为了噪声抑制而降低在一输入语音信号中的噪声以便使噪声降低量按照一控制信号而变化的噪声降低单元;
用来检测在该输入语音信号中所包含的一辅音部分的装置;和
用来响应于自所述辅音部分检测步骤的辅音检测结果而以一受控方式控制该噪声降低量的装置,
其中,所述控制装置按照辅音检测结果可变换控制确定该噪声降低量的滤波特性;
其中所述滤波特性是由根据输入语音信号频谱与在所述输入信号频谱中所包含的估算噪声频谱的比值所求出的第一值和根据输入信号频谱的信号值与估算噪声频谱之比的最大值所求出的第二值、估算噪声频谱和表明辅音检测结果的一辅音效果系数所控制的。
5.一种用来降低在一语音信号中的噪声的装置,包括有:
一为了噪声抑制而降低在一输入语音信号中的噪声以便使噪声降低量按照一控制信号而变化的噪声降低单元;
用来检测在该输入语音信号中所包含的一辅音部分的装置;和
用来响应于自所述辅音部分检测步骤的辅音检测结果而以一受控方式控制该噪声降低量的装置;
其中,所述控制装置按照辅音检测的结果可变换控制确定该噪声降低量的滤波特性;
其中,该辅音部分检测装置利用在该输入语音信号中的一短区域中的至少一个能量的变化、一表明在输入语音信号中的频率分量的分布值和在所述输入语音信号中的零交叉数而在所述输入语音信号中所检测的一语音信号部分的附近检测辅音。
6.如权利要求5所述的噪声降低装置,其中表明在该输入语音信号中的频率分量的分布的值是根据在一高区域中的输入语音信号频谱的平均值和在一低区域中的输入语音信号频谱的平均值而得到的。
CN96105920A 1995-02-17 1996-02-17 用来降低语音信号中噪声的方法和装置 Expired - Lifetime CN1083183C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP02933795A JP3453898B2 (ja) 1995-02-17 1995-02-17 音声信号の雑音低減方法及び装置
JP029337/95 1995-02-17

Publications (2)

Publication Number Publication Date
CN1141548A CN1141548A (zh) 1997-01-29
CN1083183C true CN1083183C (zh) 2002-04-17

Family

ID=12273430

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96105920A Expired - Lifetime CN1083183C (zh) 1995-02-17 1996-02-17 用来降低语音信号中噪声的方法和装置

Country Status (17)

Country Link
US (1) US5752226A (zh)
EP (1) EP0727768B1 (zh)
JP (1) JP3453898B2 (zh)
KR (1) KR100394759B1 (zh)
CN (1) CN1083183C (zh)
AT (1) ATE201276T1 (zh)
AU (1) AU695585B2 (zh)
BR (1) BR9600762A (zh)
CA (1) CA2169422C (zh)
DE (1) DE69612770T2 (zh)
ES (1) ES2158992T3 (zh)
MY (1) MY114695A (zh)
PL (1) PL312846A1 (zh)
RU (1) RU2121719C1 (zh)
SG (1) SG52257A1 (zh)
TR (1) TR199600131A2 (zh)
TW (1) TW291556B (zh)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100250561B1 (ko) * 1996-08-29 2000-04-01 니시무로 타이죠 잡음소거기 및 이 잡음소거기를 사용한 통신장치
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
FR2765715B1 (fr) * 1997-07-04 1999-09-17 Sextant Avionique Procede de recherche d'un modele de bruit dans des signaux sonores bruites
US6327564B1 (en) * 1999-03-05 2001-12-04 Matsushita Electric Corporation Of America Speech detection using stochastic confidence measures on the frequency spectrum
US7706525B2 (en) * 2001-10-01 2010-04-27 Kyocera Wireless Corp. Systems and methods for side-tone noise suppression
US7096184B1 (en) * 2001-12-18 2006-08-22 The United States Of America As Represented By The Secretary Of The Army Calibrating audiometry stimuli
US7149684B1 (en) 2001-12-18 2006-12-12 The United States Of America As Represented By The Secretary Of The Army Determining speech reception threshold
US7016651B1 (en) * 2002-12-17 2006-03-21 Marvell International Ltd. Apparatus and method for measuring signal quality of a wireless communications link
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7499686B2 (en) * 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
CN101091412B (zh) * 2004-09-07 2012-12-26 森塞尔有限公司 用于声音增强的装置和方法
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US7983720B2 (en) * 2004-12-22 2011-07-19 Broadcom Corporation Wireless telephone with adaptive microphone array
US20070116300A1 (en) * 2004-12-22 2007-05-24 Broadcom Corporation Channel decoding for wireless telephones with multiple microphones and multiple description transmission
KR100657948B1 (ko) * 2005-02-03 2006-12-14 삼성전자주식회사 음성향상장치 및 방법
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
WO2009025142A1 (ja) * 2007-08-22 2009-02-26 Nec Corporation 話者速度変換システムおよびその方法ならびに速度変換装置
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
KR101460059B1 (ko) 2007-12-17 2014-11-12 삼성전자주식회사 잡음 검출 방법 및 장치
US9575715B2 (en) * 2008-05-16 2017-02-21 Adobe Systems Incorporated Leveling audio signals
GB2466668A (en) * 2009-01-06 2010-07-07 Skype Ltd Speech filtering
CN101859568B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
TWI413112B (zh) * 2010-09-06 2013-10-21 Byd Co Ltd Method and apparatus for eliminating noise background noise (1)
KR101247652B1 (ko) * 2011-08-30 2013-04-01 광주과학기술원 잡음 제거 장치 및 방법
KR101491911B1 (ko) 2013-06-27 2015-02-12 고려대학교 산학협력단 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템
CN104036777A (zh) * 2014-05-22 2014-09-10 哈尔滨理工大学 一种语音活动检测方法及装置
RU2580796C1 (ru) * 2015-03-02 2016-04-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки
TWI662544B (zh) * 2018-05-28 2019-06-11 塞席爾商元鼎音訊股份有限公司 偵測環境噪音以改變播放語音頻率之方法及其聲音播放裝置
CN110570875A (zh) * 2018-06-05 2019-12-13 塞舌尔商元鼎音讯股份有限公司 检测环境噪音以改变播放语音频率的方法及声音播放装置
TWI662545B (zh) * 2018-06-22 2019-06-11 塞席爾商元鼎音訊股份有限公司 調整語音頻率之方法及其聲音播放裝置
CN112201272A (zh) * 2020-09-29 2021-01-08 腾讯音乐娱乐科技(深圳)有限公司 音频数据降噪的方法、装置、设备及存储介质
CN114724571B (zh) * 2022-03-29 2024-05-03 大连理工大学 一种鲁棒的分布式说话人噪声消除系统
CN114511474B (zh) * 2022-04-20 2022-07-05 天津恒宇医疗科技有限公司 血管内超声图像的降噪方法、系统、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
FR2695750A1 (fr) * 1992-09-17 1994-03-18 Lefevre Frank Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif.

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US5175793A (en) * 1989-02-01 1992-12-29 Sharp Kabushiki Kaisha Recognition apparatus using articulation positions for recognizing a voice
GB2239971B (en) * 1989-12-06 1993-09-29 Ca Nat Research Council System for separating speech from background noise
JP2959792B2 (ja) * 1990-02-13 1999-10-06 松下電器産業株式会社 音声信号処理装置
DE69121312T2 (de) * 1990-05-28 1997-01-02 Matsushita Electric Ind Co Ltd Geräuschsignalvorhersagevorrichtung
JPH087596B2 (ja) * 1990-07-26 1996-01-29 国際電気株式会社 雑音抑圧型音声検出器
JPH04235600A (ja) * 1991-01-11 1992-08-24 Clarion Co Ltd 適応型フィルタを用いた雑音除去装置
FR2679690B1 (fr) * 1991-07-23 1996-10-25 Thomson Csf Procede et dispositif de reconnaissance de la parole en temps reel.
JP3010864B2 (ja) * 1991-12-12 2000-02-21 松下電器産業株式会社 雑音抑圧装置
JPH05259928A (ja) * 1992-03-09 1993-10-08 Oki Electric Ind Co Ltd 適応制御ノイズキャンセラ装置及び適応制御ノイズキャンセル方法
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
WO1995002288A1 (en) * 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
IT1272653B (it) * 1993-09-20 1997-06-26 Alcatel Italia Metodo di riduzione del rumore, in particolare per riconoscimento automatico del parlato, e filtro atto ad implementare lo stesso
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
DE69420705T2 (de) * 1993-12-06 2000-07-06 Koninkl Philips Electronics Nv System und vorrichtung zur rauschunterdrückung sowie mobilfunkgerät
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
FR2695750A1 (fr) * 1992-09-17 1994-03-18 Lefevre Frank Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif.

Also Published As

Publication number Publication date
PL312846A1 (en) 1996-08-19
DE69612770T2 (de) 2001-11-29
KR100394759B1 (ko) 2004-02-11
ATE201276T1 (de) 2001-06-15
CA2169422A1 (en) 1996-08-18
MY114695A (en) 2002-12-31
TW291556B (zh) 1996-11-21
AU4444596A (en) 1996-08-29
ES2158992T3 (es) 2001-09-16
CN1141548A (zh) 1997-01-29
JPH08221094A (ja) 1996-08-30
US5752226A (en) 1998-05-12
EP0727768B1 (en) 2001-05-16
EP0727768A1 (en) 1996-08-21
DE69612770D1 (de) 2001-06-21
KR960032293A (ko) 1996-09-17
JP3453898B2 (ja) 2003-10-06
TR199600131A2 (tr) 1996-10-21
BR9600762A (pt) 1997-12-23
SG52257A1 (en) 1998-09-28
CA2169422C (en) 2005-07-26
AU695585B2 (en) 1998-08-20
RU2121719C1 (ru) 1998-11-10

Similar Documents

Publication Publication Date Title
CN1083183C (zh) 用来降低语音信号中噪声的方法和装置
CN1140869A (zh) 用于降低噪声的方法
CN108831499B (zh) 利用语音存在概率的语音增强方法
CN110197670B (zh) 音频降噪方法、装置及电子设备
CN1113335A (zh) 降低语音信号中噪声的方法和检测噪声域的方法
CN1145931C (zh) 降低语音信号中的噪声的方法和采用该方法的系统和电话机
CN1302462C (zh) 降噪装置和降噪方法
US20090112584A1 (en) Dynamic noise reduction
US20080281589A1 (en) Noise Suppression Device and Noise Suppression Method
CN1727860A (zh) 增益受限的噪音抑制
WO2008121436A1 (en) Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
WO2011014512A1 (en) System and method for noise reduction in processing speech signals by targeting speech and disregarding noise
CN1361972A (zh) 回波抑制系统中增强近端语音信号
JP2014122939A (ja) 音声処理装置および方法、並びにプログラム
US7885810B1 (en) Acoustic signal enhancement method and apparatus
TWI504282B (zh) 增加聽障者聽到聲音正確性之方法及助聽器
US7917359B2 (en) Noise suppressor for removing irregular noise
CN103813251A (zh) 一种可调节去噪程度的助听器去噪装置和方法
CN101034878A (zh) 增益调整方法和增益调整装置
JP2004341339A (ja) 雑音抑圧装置
JPH06208395A (ja) ホルマント検出装置及び音声加工装置
JP4922427B2 (ja) 信号補正装置
CN1787079A (zh) 一种噪声检测装置和方法
CN112750451A (zh) 一种提升语音听感的降噪方法
CN1212603C (zh) 非线性谱减缺失分量估计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1041309

Country of ref document: HK

CX01 Expiry of patent term

Granted publication date: 20020417

EXPY Termination of patent right or utility model