CN1064772C - 语音活动性检测器 - Google Patents

语音活动性检测器 Download PDF

Info

Publication number
CN1064772C
CN1064772C CN94193383A CN94193383A CN1064772C CN 1064772 C CN1064772 C CN 1064772C CN 94193383 A CN94193383 A CN 94193383A CN 94193383 A CN94193383 A CN 94193383A CN 1064772 C CN1064772 C CN 1064772C
Authority
CN
China
Prior art keywords
signal
speech activity
activity detector
detector
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN94193383A
Other languages
English (en)
Other versions
CN1130952A (zh
Inventor
P·A·巴列特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
British Telecommunications PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27235491&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1064772(C) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from GB939324967A external-priority patent/GB9324967D0/en
Priority claimed from GB9412451A external-priority patent/GB9412451D0/en
Application filed by British Telecommunications PLC filed Critical British Telecommunications PLC
Publication of CN1130952A publication Critical patent/CN1130952A/zh
Application granted granted Critical
Publication of CN1064772C publication Critical patent/CN1064772C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/46Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies comprising means for distinguishing between a signalling current of predetermined frequency and a complex current containing that frequency, e.g. speech current
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M19/00Current supply arrangements for telephone systems
    • H04M19/08Current supply arrangements for telephone systems with current supply sources at the substations

Landscapes

  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Telephone Function (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Radio Relay Systems (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
  • Electromechanical Clocks (AREA)
  • Cosmetics (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Measuring Fluid Pressure (AREA)
  • Burglar Alarm Systems (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

通过对输入信号和存储的噪声估算值(113)的频谱进行比较(114、115)来将语音与噪声区分开来。在辅助检测器(200)的控制下在无语音期间内更新噪声估算值(在缓冲器(113)中)。为了改善具有强谐波分量的信号(例如信号音)存在时的操作,根据输入(x(i))和从在被具有与输入的频谱互补的响应的滤波器(105)滤波后的输入获得的残留信号(y(i))计算LPC预测增益,如果该增益超过阈值,缓冲器更新就被禁止。

Description

语音活动性检测器
语音活动性检测器是一种通过向其提供信号输入以达到检测语音时间段或仅包含噪声的时间段的目的的装置。虽然本发明不局限于此,但这种检测器特别感兴趣的一种应用是在移动无线电电话系统中,在这种移动无线电电话系统中可以利用有关语音存在与否的知识在寂静期间关闭发射机来减小功率消耗和干扰。在这种移动无线电电话系统中,(车载单元的)噪声电平通常是较高的。在无线电系统中的另一种可能的应用是改善无线电频谱的有效利用。
图1表示在国际专利申请WO 89/08910中描述的语音活动性检测器。
在噪声的语音信号在输入端1被接收。存储器2中存储有确定噪声频谱的估算或模型的数据;将这一数据与当前信号的频谱进行比较(3)来获得与阈值进行比较(4)的相似性度量。为了跟踪噪声分量的变化,仅当无语音时才根据输入更新噪声模型。并且,还可以调整阈值(适配器6)。
为了保证仅在只存在噪声的期间内进行调整,以免出现因错误判断造成的累积的错误调整的危险,在辅助检测器7的控制下进行调整,该辅助检测器7包括非发声语音检测器(unvoicedspeech detector)8和发声语音检测器(voiced speech detector)9:如果这两个检测器中的任何一个识别了语音,检测器7就认为存在语音,并且禁止主检测器的更新和阈值调整。一般来说,非发声语音检测器8获得信号的一组LPC系数并在连续的帧周期之间比较这些系数的自相关函数,发声语音检测器9检测LPC残留信号的自相关的变化。
这一装置在区分语音期间和只接收有噪声的期间方面非常有效。但是,产生了这样的问题,即信号音(signalling tones)经常被辅助检测器认为只是噪声(即不将它们识别为语音),因此主检测器就当这些信号音为噪声而去适应它们,这些信号音的传输被阻止,或者至少过早地将其加以终止。
这一问题可以通过提供一些分别被调谐到某个特定信号音频率的检音器(tone detector)来克服;但是,不可忽视世界上的不同信号音的多种多样性,因此,为了例如使正在打国际电话的移动电话用户能够可靠地听到“占线”音而不管其来自哪一个国家,就需要大量的不同的检测器。
根据本发明,提供了一种用于检测输入信号中语音的存在的语音活动性检测器,它包括:
(a)存储输入信号噪声分量的估算值的装置;
(b)识别输入信号和被存储的估算值的频谱相似性以便产生一个输出判定信号的装置;
(c)更新被存储的估算值的装置;
(d)辅助检测器,用于控制更新装置,以便仅当辅助检测器指出在输入信号中无语音时才进行更新;
其特征在于,用于计算输入信号的预测增益参数的装置,以及用于在预测增益超过阈值时禁止更新的修正装置。
现在参看附图举例描述本发明的某些实施例,附图中:
图2是根据本发明一个方面的具有语音活动性检测器的语音编码器的方框图;
图3和4用图形表示各种输入信号的预测增益值;
图5、6和7是本发明其它实施例的方框图。
在图2中,传统语音编码器100具有语音输入端101,语音信号被模数变换器102以8KHz的频率进行取样和变换为数字形式。开窗口单元(Windowing unit)103将语音样值划分成为(例如)160个样值的帧(即20ms的帧)、并将其乘以一个可减小在帧的开始和结束处的样值的贡献的汉明(Hamming)窗口或其它函数。相关器104接收数字化语音样值并产生每一帧的自相关系数Pi。LPC分析单元105计算具有相应于输入语音信号频谱的频率响应的滤波器(它有时称为综合滤波器)的系数ai,这里,采用例如列文森-德宾(Levinson-Durbin)或肖思(schurr)算法的已知方法。
数字化输入信号还通过被这些系数控制的反滤波器(或分析滤波器)106,以便产生出被长期预测器分析单元107进一步分析的残留信号,该长期预测器分析单元107计算根据其先前值来预测LPC残留信号的最佳延迟以及该预测值的相应增益值。分析单元106还产生第二残留信号(即当前LPC残留信号和被所获得的参数延迟和定标的LPC残留信号之间的差值)。激励单元108通过仅对LTP残留信号进行量化或利用其它普通的方法来获得用以传送给译码器的激励参数。
LPC系数ai、长期预测器延迟d和增益g、以及激励参数e都传送给译码器。
申请人先前的专利申请中的主语音活动性检测器利用平均器110来对自相关系数Ri求平均,该平均器110产生当前系数和被存储在缓冲器111中的先前帧的系数的加权和R′i。另一自相关器112产生用以传送给缓冲器113的LPC系数ai的自相关系数Bi。缓冲器的内容只在被辅助检测器(以下将描述)认为只包含噪声的期间内才被更新,因此缓冲器113的内容B′i代表了输入信号噪声频谱的估算值。乘法/加法单元114产生被如下定义的、输入信号和噪声模型之间频谱相似性的度量M: &Mgr; = &Bgr; ′ o + 2 Σ i = 1 n R ′ iB ′ i R ′ o
这里的零下标表示零阶自相关系数,n是语音帧中样值的数目。
度量M在比较器115中与阈值电平进行比较,并在输出端116产生表示语音的存在或不存在的信号。阈值可以根据当前噪声功率电平自适应地进行调整(117)。
由于不能识别语音将导致对具有语音信息的缓冲器的更新和随后的其它识别错误-“锁定”状态,所以在缓冲存储器113中的噪声估算值的更新不被上述检测器的输出端116进行控制。因此更新由辅助检测器200进行控制。为了区分噪声和非发声的语音,这就产生出(201)输入信号的(未平均的)自相关系数Ri和LPC系数的(末缓冲的)自相关系数Bi的乘积和。减法器202将这个和与在缓冲器203中被延迟的先前语音帧的相应的和进行比较。表示输入信号的连续帧之间频谱相似性的这一差值与阈值进行比较(204)从而产生判决信号。
为了识别发声的语音,长期预测器延迟d被音调分析单元205所测量。其输出在“或”门206中与阈值级204的输出合并-即如果单元204或205中的任何一个(或两者)产生表示语音存在的输出,辅助检测器200就认为存在语音。正如在引言中所论述的那样,如果系统传送信号音,则这些信号音必须被识别为语音而不是噪声,而刚刚所述的辅助检测器在这方面并不是非常有效。虽然它识别某些信号音,但另一些信号音(通常是具有相对纯净的频谱内容的信号音)不能被识别。由于在缓冲器113中的噪声估算值此时根据信号音来进行“训练”,所以一旦辅助检测器200已失效,则主检测器也失效。
因此,提供另一辅助检测器来检测信号音。最好注意到人为产生的信号音包含少量的频率分量(它可能是被调制的)这一事实。对于这样的信号,LPC预测器的性能极其优异,利用这一特性来区分基于信号音的信号(包括多信号音信号)和背景或环境噪声信号。
LPC预测增益Gp被定义为一语音帧的输入信号功率与输出信号功率之比,即 Gp = Σ i = 0 n - 1 x 2 ( i ) Σ i = 0 n - 1 y 2 ( i ) 这里的x是滤波器输入而y是反滤波器输出: y ( t ) = x ( t ) + Σ i = 1 m y ( t - i ) ai (这里的m是滤波系数的个数,一般为8或10)。信号x(i)和y(i)可分别从LPC编码器100内的变换器102和滤波器106的输出端获得。这些值被求平方(301,302),预测增益利用按照上述公式计算Gp的算术单元303来获得。其输出被比较器304用来与固定的阈值T作比较,如果增益超过该阈值(通常T=63或18分贝),就认为识别了信号音。对于信号音识别有几种可能的响应:
(a)利用“或”门303来替换主检测器的输出;
(b)利用“或”门206的第三输入来替换辅助检测器;
(c)以上两者(如所示)。当然,可以不计算商而将∑x2项与被乘以阈值的∑y2进行比较。图3以分贝为单位表示从背景环境噪声、语音、信号音中的背景噪声中获得的预测增益和信号音本身的频率分布图,图4表示对于不同的UK信号音,即:“用户占线”音、拨号音、振铃音、“空号”音、“设备占用”音的预测增益相对于时间的曲线图。实际上,用户占线音、拨号音和“空号”音因确实是(例如来自键盘的)多频音,所以被另一检测器成功地识别。振铃音和“设备占用”音被音调分析单元205识别。
该另一检测器300可被认为是对于某些类型信号音的检测器;或者(在图2的实施例中)它可被看作是检测残留信号Yi为较小的状态,所以长期预测器107(以及由此音调分析205)的操作就不是强有力的。
检测发声的语音的另一种选择是用类似于301、302、303和304的部件来代替音调检测器205,以便产生基于长期预测器分析107的预测增益(并将其与阈值作比较)。
现在参看图5描述对图2装置的另外两种改进。首先,在图2所示的实施例中,所计算的预测增益是语音编码器100的LPC分析单元的预测增益,它一般可以采用第8或者甚至第10阶预测器。但是,应注意到这一分析单元部件的基础是:信息音比环境噪声具有更高的预测增益,并且分析单元的阶次越高,则预测器模拟噪声环境的能力就越大,已经得知:通过将增益计算限制为第4阶分析,则由一个或两个信号音组成的信息信号给出高的预测增益,同时可以减小环境噪声的预测增益。
这在原理上可以通过与第8阶单元105,106并列地提供第4阶分析单元和滤波器来向辅助检测器输入信号从而得到实现。但是,根据反射系数(有时称为Parcor相关系数)计算预测增益较为简单。在图5中,这些反射系数是由单元400按照已知的方法根据自相关系数Ri进行计算的(虽然根据语音编码器设计的不同,可以利用LPC分析单元105从中间点将它们取出)。预测增益的度量、即预测误差Pe可以如下地根据前4个反射系数Rci进行计算来获得: Pe = Π i = 1 4 ( 1 - R 2 ci ) 这一计算在401中进行。大的预测误差相应于小的预测增益,反之亦然,所以,如果Pe小于阈值Pth,就认为存在信号音。这一比较403代替了图2的比较304。
其次,移动无线电环境中的噪声包含非常强的低频谐振,进行进一步的测试来确定“信号音”是否低于阈频率。阈频率的选择涉及到一定程度的折衷,但由于大多数信号音都高于400Hz,所以建议阈频率为385Hz。
该进一步的测试是确定LPC滤波器的极点频率。为降低分析单元的复杂性,最好用低阶滤波器。还可以进行进一步的LPC分析,但如图5那样通过根据反射系数计算LPC系数就能够容易地进行该进一步的LPC分析。假定只利用单元400的前两个反射系数,则LPC系数ai被单元404按照通常的方式进行计算,使得综合滤波器的响应是: H ( z ) = 1 / ( a 0 - a 1 z - 1 - a 2 z - 2 ) 然后极点在Z平面上的位置由二次方程的解来确定: a 0 z 2 - a 1 z + a 2 = 0 - - - - - - a 0 = 1 - a 1 2 j 4 a 2 - a 1 2 4
如果平方根内的项是负的,则极点位于实轴上,于是该信号不是信号音。如果它是正的,但极点位置的实数部分是负的(即a1<0),则极点在Z平面的左半侧。这就必然意味着该频率比取样速率高了25%-即对于8KHz的取样频率fs在2000Hz以上,这时该频率计算是不必要的了,可以立即产生“>385”信号。极点频率为: f = arctan { - 4 a 2 - a 1 2 a 1 } &times; f s 2 &pi; f<385Hz的条件可表述为(取消平方根): ( 4 a 2 - a 1 2 ) / a 1 2 < tan 2 { 2 &pi; &times; 385 f s } 或者 ( 4 a 2 - a 1 2 ) / a 1 2 < 0 . 0973 - - - - - - at f s = 8 kHz
这一计算由单元405来进行。它的输出在与门406中与比较器403的输出进行合并,以便只有当预测增益是高的并且极点频率是大于385Hz时才作出“信号音”判定。
如果需要的话,还可以俘获2000Hz以上的极点频率(或者某些其它上限频率),以便高于预期信号音范围的高频不会被识别为信号音。
如果求解二次方程的额外计算可被容许,就还可以利用第三和第四反射系数,在这种情况下,有可能区分具有两个相关频率的两个复共轭极点对,可以看出,如果这两个频率都低于阈频率,就不会认为存在信号音。
已经指出图2和5的实施例在自相关计算103之前采用汉明窗口(对于基于自相关的LPC分析通常如此)。如果在语音编码器中不需要进行这种开窗口,则另一种可能的选择就是在图5的情形中省去开窗口103和通过将自相关值变换为协方差值来取代反射系数计算400,并修改单元401、404来使用协方差值而不是反射系数。或者,如图6所示(它只表示相对于图5已被改变的那些部件),开头的处理可以由协方差分析109来完成,它的输出提供给反射系数计算装置400'和改进的自相关系数单元104′。LPC分析单元105可以象以上那样与自相关单元104′连接或者如所示那样直接与协方差分析单元109连接。
上述“信号音检测”实施例产生了良好的结果;但是,它们可能对于在某些范围内使用的、用机械方式产生的信号音无效,这是由于这些信号音往往具有导致产生小的预测增益的高次谐波分量的缘故。由于滤波器的插入势必增大所有信号的自相关,并由此也使其它信号的预测增益增大,所以仅滤除高次谐滤不是一个解决方案。已发现预测器往往模拟滤波器的极点而不是输入信号的特性。但是已发现如果能够将预测增益分析局限于对只处在相应于谐波滤波器通带的频率范围内的信号的可预测性进行评估,则利用滤波就能够获得良好的结果。这可以通过在预测增益分析之前以滤波器带宽两倍的频率对信号进行二次取样来实现。
因此在其它方面与图5类似的图7实施例采用了滤波器450,这是低通等波纹FIR滤波器,其零点位于单位圆上,通带高达600(3dB点),20dB的阻带衰减位于1200Hz。阻带衰减不是太大将被认为是有利的。滤波器输出在二次取样单元451中被以1200Hz的频率进行二次取样。
由于使用这种滤波,信号音检测与语音编码器100共用元件的可能性当然被大大减少;因此滤波器450由模数变换器102直接提供数字化输入信号,并如上所述地给反射系数分析单元400″或者协方差或自相关分析单元提供信号。自相关方案将如上所述地需要开窗口。
另一实施例减轻了“谐波”问题,且不会不适当地限制预测增益分析的频率范围;这是通过利用滤波器将信号分成两个或多个频带来实现的,这每一个频带足够窄,以至于无法包含信号音的基波和三次谐波。各个频带然后被二次取样并对其进行单独的预测增益分析。
因此,在图8中,信号被滤波器450a、450b分成频带400-1200Hz和1200Hz-2000Hz,并被以1.6KHz的频率进行二次取样(45h、451b)。对这两个频带分别进行反射系数计算400″a、b、预测误差分析401a、b、和取阈值403a、b。比较器403a、403b的两个输出被传送给“或”门206的分开的输入端,所以在这两个频道的任一个之内的高的预测增益都被认为表示了信号音的存在。图7的其它部件100-303没有改变,所以不在图8中表示。

Claims (8)

1.一种用于检测输入信号中语音的存在的语音活动性检测器,包括
(a)存储输入信号噪声分量的估算值的装置;
(b)识别输入信号和被存储的估算值的频谱相似性以便产生输出判定信号的装置;
(c)更新被存储的估算值的装置;
(d)辅助检测器,用于控制更新装置,以便仅当辅助检测器指出在输入信号中无语音时才进行更新;
其特征在于,用于计算输入信号的预测增益参数的装置,以及用于在预测增益超过阈值时禁止更新的修正装置。
2.如权利要求1所述的语音活动性检测器,其特征在于,在该语音活动性检测器中,辅助检测器包括对从LPC残留信号中获得的信号作出响应的发声的语音检测器。
3.如权利要求1或2所述的语音活动性检测器,其特征在于,在该语音活动性检测器中,增益参数表示第6阶或低于第6阶的LPC预测的预测增益。
4.如权利要求3所述的语音活动性检测器,其特征在于,在该语音活动性检测器中,增益参数表示第4阶或低于第4阶的LPC预测的预测增益。
5.如权利要求1所述的语音活动性检测器,其特征在于,还包括用于检测输入信号的一个或多个主频率分量的装置,以及用于将这些频率与预定阈频率作比较并仅当所述主分量超过阈频率时才允许禁止更新的装置。
6.如权利要求1所述的语音活动性检测器,其特征在于,在该语音活动性检测器中,在增益计算装置前面设有用于滤除输入信号频率范围的高频部分的滤波器,仅对位于该滤波器通带内的频率分量进行增益计算。
7.权利要求6的语音活动性检测器,其特征在于,具有两个滤波器,这两个滤波器有各自的通带和用于计算各自通带的增益参数的增益计算装置,该语音活动性检测器还具有用于当在任一通带内的预测增益超过阈值时禁止进行更新的修正装置。
8.如权利要求6或7所述的语音活动性检测器,其特征在于,包括用于对被滤波信号进行二次取样的装置。
CN94193383A 1993-09-14 1994-09-14 语音活动性检测器 Expired - Lifetime CN1064772C (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
EP93307211 1993-09-14
EP93307211.8 1993-09-14
GB939324967A GB9324967D0 (en) 1993-12-06 1993-12-06 Voice activity detector
GB9324967.0 1993-12-06
GB9412451.8 1994-06-21
GB9412451A GB9412451D0 (en) 1994-06-21 1994-06-21 Voice activity detector

Publications (2)

Publication Number Publication Date
CN1130952A CN1130952A (zh) 1996-09-11
CN1064772C true CN1064772C (zh) 2001-04-18

Family

ID=27235491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN94193383A Expired - Lifetime CN1064772C (zh) 1993-09-14 1994-09-14 语音活动性检测器

Country Status (23)

Country Link
US (2) US5749067A (zh)
EP (1) EP0719439B1 (zh)
JP (1) JP3224132B2 (zh)
KR (1) KR100363309B1 (zh)
CN (1) CN1064772C (zh)
AT (1) ATE182420T1 (zh)
BR (1) BR9407535A (zh)
CA (1) CA2169745C (zh)
CZ (1) CZ286743B6 (zh)
DE (1) DE69419615T2 (zh)
DK (1) DK0719439T3 (zh)
ES (1) ES2136204T3 (zh)
FI (1) FI118195B (zh)
GR (1) GR3031515T3 (zh)
HK (1) HK1014392A1 (zh)
HU (1) HU219994B (zh)
IN (1) IN184794B (zh)
MY (1) MY111134A (zh)
NO (1) NO307979B1 (zh)
NZ (1) NZ273045A (zh)
SG (1) SG48935A1 (zh)
SK (1) SK281796B6 (zh)
WO (1) WO1995008170A1 (zh)

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN184794B (zh) * 1993-09-14 2000-09-30 British Telecomm
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
FI100840B (fi) 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
JP4307557B2 (ja) * 1996-07-03 2009-08-05 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 音声活性度検出器
US6708146B1 (en) * 1997-01-03 2004-03-16 Telecommunications Research Laboratories Voiceband signal classifier
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
US6531982B1 (en) 1997-09-30 2003-03-11 Sirf Technology, Inc. Field unit for use in a GPS system
US5970446A (en) 1997-11-25 1999-10-19 At&T Corp Selective noise/channel/coding models and recognizers for automatic speech recognition
US6385548B2 (en) * 1997-12-12 2002-05-07 Motorola, Inc. Apparatus and method for detecting and characterizing signals in a communication system
US6327471B1 (en) 1998-02-19 2001-12-04 Conexant Systems, Inc. Method and an apparatus for positioning system assisted cellular radiotelephone handoff and dropoff
US5991718A (en) * 1998-02-27 1999-11-23 At&T Corp. System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments
US6182035B1 (en) 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
US6348744B1 (en) 1998-04-14 2002-02-19 Conexant Systems, Inc. Integrated power management module
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US7545854B1 (en) 1998-09-01 2009-06-09 Sirf Technology, Inc. Doppler corrected spread spectrum matched filter
US7711038B1 (en) 1998-09-01 2010-05-04 Sirf Technology, Inc. System and method for despreading in a spread spectrum matched filter
US6693953B2 (en) 1998-09-30 2004-02-17 Skyworks Solutions, Inc. Adaptive wireless communication receiver
US6448925B1 (en) 1999-02-04 2002-09-10 Conexant Systems, Inc. Jamming detection and blanking for GPS receivers
US6606349B1 (en) 1999-02-04 2003-08-12 Sirf Technology, Inc. Spread spectrum receiver performance improvement
US6556967B1 (en) 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6577271B1 (en) 1999-03-30 2003-06-10 Sirf Technology, Inc Signal detector employing coherent integration
US6304216B1 (en) 1999-03-30 2001-10-16 Conexant Systems, Inc. Signal detector employing correlation analysis of non-uniform and disjoint sample segments
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6381568B1 (en) 1999-05-05 2002-04-30 The United States Of America As Represented By The National Security Agency Method of transmitting speech using discontinuous transmission and comfort noise
US6351486B1 (en) 1999-05-25 2002-02-26 Conexant Systems, Inc. Accelerated selection of a base station in a wireless communication system
JP3929686B2 (ja) * 2000-08-14 2007-06-13 松下電器産業株式会社 音声スイッチング装置およびその方法
US6931055B1 (en) 2000-04-18 2005-08-16 Sirf Technology, Inc. Signal detector employing a doppler phase correction system
US6714158B1 (en) 2000-04-18 2004-03-30 Sirf Technology, Inc. Method and system for data detection in a global positioning system satellite receiver
US6952440B1 (en) 2000-04-18 2005-10-04 Sirf Technology, Inc. Signal detector employing a Doppler phase correction system
US6788655B1 (en) 2000-04-18 2004-09-07 Sirf Technology, Inc. Personal communications device with ratio counter
FR2808391B1 (fr) * 2000-04-28 2002-06-07 France Telecom Systeme de reception pour antenne multicapteur
US7885314B1 (en) 2000-05-02 2011-02-08 Kenneth Scott Walley Cancellation system and method for a wireless positioning system
US6778136B2 (en) * 2001-12-13 2004-08-17 Sirf Technology, Inc. Fast acquisition of GPS signal
JP4201470B2 (ja) * 2000-09-12 2008-12-24 パイオニア株式会社 音声認識システム
JP4201471B2 (ja) * 2000-09-12 2008-12-24 パイオニア株式会社 音声認識システム
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US7437286B2 (en) * 2000-12-27 2008-10-14 Intel Corporation Voice barge-in in telephony speech recognition
US6707869B1 (en) * 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
DE10121532A1 (de) * 2001-05-03 2002-11-07 Siemens Ag Verfahren und Vorrichtung zur automatischen Differenzierung und/oder Detektion akustischer Signale
JP3859462B2 (ja) * 2001-05-18 2006-12-20 株式会社東芝 予測パラメータ分析装置および予測パラメータ分析方法
KR100399057B1 (ko) * 2001-08-07 2003-09-26 한국전자통신연구원 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법
US20030110029A1 (en) * 2001-12-07 2003-06-12 Masoud Ahmadi Noise detection and cancellation in communications systems
US7689406B2 (en) * 2002-03-08 2010-03-30 Koninklijke Kpn. N.V. Method and system for measuring a system's transmission quality
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US20040064314A1 (en) * 2002-09-27 2004-04-01 Aubert Nicolas De Saint Methods and apparatus for speech end-point detection
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
US7272552B1 (en) * 2002-12-27 2007-09-18 At&T Corp. Voice activity detection and silence suppression in a packet network
US7230955B1 (en) * 2002-12-27 2007-06-12 At & T Corp. System and method for improved use of voice activity detection
JP2004341339A (ja) * 2003-05-16 2004-12-02 Mitsubishi Electric Corp 雑音抑圧装置
KR101164937B1 (ko) * 2003-05-28 2012-07-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램
EP1661916A4 (en) 2003-07-16 2008-10-01 Daikin Ind Ltd PROCESS FOR PREPARING FLUOROUS POLYMER, AQUEOUS DISPERSION OF FLUOROUS POLYMER, 2-ACYLOXYCARBOXYLENE DERIVATIVE AND TENSID
SG119199A1 (en) * 2003-09-30 2006-02-28 Stmicroelectronics Asia Pacfic Voice activity detector
JP4497911B2 (ja) * 2003-12-16 2010-07-07 キヤノン株式会社 信号検出装置および方法、ならびにプログラム
US20050209762A1 (en) * 2004-03-18 2005-09-22 Ford Global Technologies, Llc Method and apparatus for controlling a vehicle using an object detection system and brake-steer
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
CN101048935B (zh) 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
JP4729927B2 (ja) * 2005-01-11 2011-07-20 ソニー株式会社 音声検出装置、自動撮像装置、および音声検出方法
BRPI0610719B1 (pt) * 2005-04-18 2015-11-24 Basf Ag preparação, processo para a produção da mesma, e, uso de preparações
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
DE102006032967B4 (de) * 2005-07-28 2012-04-19 S. Siedle & Söhne Telefon- und Telegrafenwerke OHG Hausanlage und Verfahren zum Betreiben einer Hausanlage
GB2430129B (en) * 2005-09-08 2007-10-31 Motorola Inc Voice activity detector and method of operation therein
JP4971351B2 (ja) * 2005-12-05 2012-07-11 クゥアルコム・インコーポレイテッド トーンコンポーネントの検出のためのシステム、方法および装置
US8417185B2 (en) * 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7885419B2 (en) 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
WO2007091956A2 (en) 2006-02-10 2007-08-16 Telefonaktiebolaget Lm Ericsson (Publ) A voice detector and a method for suppressing sub-bands in a voice detector
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
JP5185254B2 (ja) * 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
AU2007243586B2 (en) 2006-04-27 2010-12-23 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
CN101149921B (zh) * 2006-09-21 2011-08-10 展讯通信(上海)有限公司 一种静音检测方法和装置
WO2008051347A2 (en) 2006-10-20 2008-05-02 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
WO2008143569A1 (en) * 2007-05-22 2008-11-27 Telefonaktiebolaget Lm Ericsson (Publ) Improved voice activity detector
CN101790758B (zh) * 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
US20090043577A1 (en) * 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
EP2107553B1 (en) * 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Method for determining barge-in
US8611556B2 (en) * 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
US8244528B2 (en) 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
CN101572090B (zh) * 2008-04-30 2013-03-20 向为 一种自适应多速率窄带编码方法及编码器
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
KR101547344B1 (ko) 2008-10-31 2015-08-27 삼성전자 주식회사 음성복원장치 및 그 방법
TWI384423B (zh) * 2008-11-26 2013-02-01 Ind Tech Res Inst 以聲音事件為基礎之緊急通報方法與系統以及行為軌跡建立方法
CN101609678B (zh) * 2008-12-30 2011-07-27 华为技术有限公司 信号压缩方法及其压缩装置
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
KR20120091068A (ko) 2009-10-19 2012-08-17 텔레폰악티에볼라겟엘엠에릭슨(펍) 음성 활성 검출을 위한 검출기 및 방법
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
FR2956539B1 (fr) * 2010-02-16 2012-03-16 Dominique Retali Procede de detection du fonctionnement d'un dispositif de transmission sans fil de signaux de voix.
US20120143604A1 (en) * 2010-12-07 2012-06-07 Rita Singh Method for Restoring Spectral Components in Denoised Speech Signals
CN102883244B (zh) * 2011-07-25 2015-09-02 开曼群岛威睿电通股份有限公司 声震防护的装置及方法
US9363603B1 (en) 2013-02-26 2016-06-07 Xfrm Incorporated Surround audio dialog balance assessment
CN111261197B (zh) * 2020-01-13 2022-11-25 中航华东光电(上海)有限公司 一种复杂噪声场景下的实时语音段落追踪方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4358738A (en) * 1976-06-07 1982-11-09 Kahn Leonard R Signal presence determination method for use in a contaminated medium
JPS53105303A (en) * 1977-02-25 1978-09-13 Hitachi Ltd Preprocessing system for audio recognition
JPS5850360B2 (ja) * 1978-05-12 1983-11-10 株式会社日立製作所 音声認識装置における前処理方法
JPS59115625A (ja) * 1982-12-22 1984-07-04 Nec Corp 音声検出器
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
US4700392A (en) * 1983-08-26 1987-10-13 Nec Corporation Speech signal detector having adaptive threshold values
US4696039A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with silence suppression
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
EP0548054B1 (en) * 1988-03-11 2002-12-11 BRITISH TELECOMMUNICATIONS public limited company Voice activity detector
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
JP2573352B2 (ja) * 1989-04-10 1997-01-22 富士通株式会社 音声検出装置
US5680508A (en) * 1991-05-03 1997-10-21 Itt Corporation Enhancement of speech coding in background noise for low-rate speech coder
IN184794B (zh) * 1993-09-14 2000-09-30 British Telecomm
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system

Also Published As

Publication number Publication date
US5749067A (en) 1998-05-05
IN184794B (zh) 2000-09-30
CA2169745C (en) 2000-05-16
DK0719439T3 (da) 2000-02-07
DE69419615T2 (de) 2000-05-25
NO961032L (no) 1996-03-13
NO961032D0 (no) 1996-03-13
JPH09502814A (ja) 1997-03-18
DE69419615D1 (de) 1999-08-26
BR9407535A (pt) 1997-08-26
AU7619894A (en) 1995-04-03
FI961158A (fi) 1996-03-13
CN1130952A (zh) 1996-09-11
KR960705303A (ko) 1996-10-09
US6061647A (en) 2000-05-09
GR3031515T3 (en) 2000-01-31
CA2169745A1 (en) 1995-03-23
FI961158A0 (fi) 1996-03-13
SG48935A1 (en) 1998-05-18
EP0719439B1 (en) 1999-07-21
ATE182420T1 (de) 1999-08-15
HU9600641D0 (en) 1996-05-28
SK281796B6 (sk) 2001-08-06
ES2136204T3 (es) 1999-11-16
AU673776B2 (en) 1996-11-21
FI118195B (fi) 2007-08-15
KR100363309B1 (ko) 2003-02-17
CZ67896A3 (en) 1996-07-17
NZ273045A (en) 1996-11-26
MY111134A (en) 1999-08-30
NO307979B1 (no) 2000-06-26
HU219994B (hu) 2001-10-28
JP3224132B2 (ja) 2001-10-29
WO1995008170A1 (en) 1995-03-23
EP0719439A1 (en) 1996-07-03
HK1014392A1 (en) 1999-09-24
HUT73986A (en) 1996-10-28
SK31896A3 (en) 1997-03-05
CZ286743B6 (en) 2000-06-14

Similar Documents

Publication Publication Date Title
CN1064772C (zh) 语音活动性检测器
EP1918910B1 (en) Model-based enhancement of speech signals
US6766292B1 (en) Relative noise ratio weighting techniques for adaptive noise cancellation
US6523003B1 (en) Spectrally interdependent gain adjustment techniques
US6529868B1 (en) Communication system noise cancellation power signal calculation techniques
EP1239465B2 (en) Method and apparatus for selecting an encoding rate in a variable rate vocoder
US6996523B1 (en) Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
CN1985304B (zh) 用于增强型人工带宽扩展的系统和方法
US5970441A (en) Detection of periodicity information from an audio signal
US6671667B1 (en) Speech presence measurement detection techniques
WO1997022117A1 (en) Method and device for voice activity detection and a communication device
EP1887559B1 (en) Yule walker based low-complexity voice activity detector in noise suppression systems
US20110238417A1 (en) Speech detection apparatus
US8165872B2 (en) Method and system for improving speech quality
US20120265526A1 (en) Apparatus and method for voice activity detection
CN1218945A (zh) 静态和非静态信号的鉴别
EP0970463A1 (en) Speech analysis system
Puder Kalman‐filters in subbands for noise reduction with enhanced pitch‐adaptive speech model estimation
Sambur A preprocessing filter for enhancing LPC analysis/synthesis of noisy speech
AU673776C (en) Voice activity detector

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: LG ELECTRONIC CO., LTD.

Free format text: FORMER OWNER: BRITISH TELECOMMUNICATIONS PUBLIC LIMITED COMPANY

Effective date: 20031121

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20031121

Address after: Seoul

Patentee after: LG Electronics Inc.

Address before: London, England, England

Patentee before: British Telecommunications Public Ltd., Co.

C17 Cessation of patent right
CX01 Expiry of patent term

Expiration termination date: 20140914

Granted publication date: 20010418