CN1230276A - 使用多个确定装置的语音检测系统 - Google Patents

使用多个确定装置的语音检测系统 Download PDF

Info

Publication number
CN1230276A
CN1230276A CN97197729A CN97197729A CN1230276A CN 1230276 A CN1230276 A CN 1230276A CN 97197729 A CN97197729 A CN 97197729A CN 97197729 A CN97197729 A CN 97197729A CN 1230276 A CN1230276 A CN 1230276A
Authority
CN
China
Prior art keywords
signal
voice
speech
statistical
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN97197729A
Other languages
English (en)
Inventor
G·M·科克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tylorbis Operation Inc.
Original Assignee
Coherent Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coherent Communications Systems Corp filed Critical Coherent Communications Systems Corp
Publication of CN1230276A publication Critical patent/CN1230276A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

语音检测系统(10)配有多个语音检测子系统(11,13和15)。语音检测子系统(11,13和15)采用不同的统计方法用来确定输入端处(12)接收到的电通讯信号中是否存在语音。例如,第一语音检测子系统(11)采用一个移动平均峰值信号滤波器(20),第二语音检测子系统采用一个移动平均噪声滤波器(22),第三语音检测子系统采用一个方差滤波器(24)。来自每个滤波器(20,22,24)的信号分别与一个阈值比较,这些阈值被提供给语音判断逻辑电路(40)来作出总的语音检测判断。这种语音检测系统对于电话自动增益控制是很有用的。

Description

使用多个确定装置的语音检测系统
发明领域
该发明涉及用来确定电通讯信号中是否主要包括语音或噪声的过程及装置。更具体的,该发明涉及一种语音检测系统,通过并行地将多个对于通讯信号的统计判断结果组合起来,该系统连续地将信号归类为语音或噪声。
发明背景
自动增益控制(AGC)电路被用于通讯系统,例如电话通讯系统中,以便使发送语音信号保持在舒适可听的级别。为了保持语音信号一个确定的均值或峰值,同时使噪声值变的很小,自动增益控制电路使用语音检测器来区分语音和噪声信号。一般地,语音检测器估计发送信号的信号统计特性,并将该统计特性与预定的参考值比较,并且提供一个表示发送信号是否存在语音的逻辑输出信号。根据逻辑输出信号是否表明了语音的存在,AGC电路通过调整所施加的增益来响应该逻辑输出信号。
传统语音检测器的一个问题是,对于单个信号统计判断值的依赖使得当对于其统计特性达到足以表示语音存在的噪声信号进行噪声估计时,这种语音检测器易于作出错误的判断。另一个问题是,单个信号逻辑输出的产生模糊了可信等级,而正是根据该等级,语音检测器确定语音的存在性。为了确定发送电话信号中语音的存在性,最好是给出一种使用多于一个统计标准的语音检测器。更理想的是,给出一种语音检测器,它产生一个检测信号,根据该检测信号,在调整增益时,可以将判断中得到的可信度考虑进来。
概要
根据该发明的一个方面,用于电话AGC系统的语音检测器包括一些独立的语音检测装置用来相互独立地确定信号中语音的存在性。每个语音检测装置产生一个检测信号,各个检测信号被组合起来产生一个总的检测信号用来表明发送信号中语音的存在性。
根据该发明的另一个方面,各个检测信号表明了在其语音检测器对于发送信号中是否存在语音的判断的一个可信度。
附图简要描述
图1是根据该发明的语音检测器的功能方框图。
详细描述
参考图1,该图给出了该发明的语音检测器10的一个功能方框图。如同将要认识到的,语音检测器的物理实现可以通过模拟电路、数字电路、一个适当编程的通用数字信号处理器DSP来实现,或者按照要求通过这些类型电路的混合来实现。在优选实施方案中,数字信号处理器被编程来完成图1中功能块和其中所描述的各种功能。
在语音检测器10的输入端12处给出了一个通讯信号。该通讯信号一般为声音波段的信号,比如300Hz到3500Hz的标准电话信号。另外,例如,在希望对通讯信道的各个子波段进行语音/噪声判断的应用中,该通讯信号可能包括声音波段信号的一个子波段部分。
图1中表示的通讯信号由数字序列xi来表示。该通讯信号首先被转换成一个非零均值信号以便识别信号xi的正负峰值。这种非零均值信号被校正器14生成为绝对值信号|xi|。
绝对值信号|xi|由校正器14提供给峰值检测器16。峰值检测器16被安排来检测绝对值信号中的局部最大值。当局部最大值被检测到时,峰值检测器确认一个检测信号,PDET,表明在通讯信号中检测到了一个峰值。同时,检测到的峰值pi被峰值检测器16提供给输出寄存器或终端18。在DSP实施方案中,检测信号PDET可以通过峰值检测循环中的一个分支命令来实现。如果没有检测到有关输入信号的峰值,那麽分支检测循环继续执行直到检测到一个峰值。
检测到的峰值作为输入被提供给三个语音检测器,这三个检测器包括一个移动平均峰值信号检测器11,一个移动平均峰值噪声检测器13,以及一个移动方差检测器15。语音检测器11,13和15每个都包括一个统计滤波器用来产生各自涉及峰值序列pi的统计值。在优选实施方案中,检测器11包括一个移动平均峰值滤波器20用来产生峰值信号的移动平均;检测器13包括一个移动平均噪声滤波器22用来在语音检测器10确定输入信号主要是噪声的间隔内产生峰值信号的移动平均值;移动方差检测器15包括一个方差滤波器24用来产生一个输出信号 νi,该信号表示峰值信号pi的方差。
在移动平均峰值信号检测器11中,移动平均峰值滤波器20在使能端上接收峰值检测信号PDET,并作为响应,根据下述平均公式来更新移动平均输出值 pi p - i = 1 m p i + m - 1 m p - i - 1
其中m>1。平均常数m确定了每个峰值对于移动平均的加权,并因此影响移动平均值 pi的响应和延迟时间。通讯信号中是否主要包括语音或噪声的第一判断是通过将移动平均信号 pi的当前值与一个预定阈值比较而作出的。这种比较基于下述假设:高平均峰值更可能产生在语音间隔中而不是噪声间隔中。
为了产生传送信息量多于简单的二进制语音/非语音输出信号的输出信号,最好的是,移动平均值 pi与多个阈值比较。在所表示的实施方案中,移动平均信号 pi通过比较器26和28与阈值t11和t12相比,来产生决定因子D11和D12的3个输出组合中的一个,其中t11<t12
(1) pi≤t11,       其中D11=0以及D12=0
(2)t11< pi≤t12, 其中D11=1以及D12=0
(3) pi>t12,       其中D11=1以及D12=1
状态(1)被解释为表示噪声,状态(2)表示不确定状态,状态(3)表示语音。在仅使用移动平均峰值判断的传统语音检测系统中,不确定状态将没有任何实际意义。然而,因为移动平均峰值判断是与其他判断集合在一起的,任何一个检测器在语音检测中的可信度都是一个有用的权重标识,该权重决定了其检测器对整个语音判断所起的作用。对应于二进制决定因子D11和D12的算术和,通过将0,1或2分配给各个输出状态,可以产生一个多值的或模糊的决定因子。
在移动平均峰值噪声检测器13中,峰值序列 pi被提供给移动平均噪声滤波器22。根据结合移动平均峰值滤波器20所讨论的相似公式,移动平均滤波器22被安排来产生峰值的一个移动平均。然而,移动平均滤波器22被连接来通过语音检测信号SPEECH的逻辑电路反转而被启用。因此,滤波器22仅在语音检测器10确定通讯信号主要包括噪声时更新其移动平均值,并在通讯信号主要包括语音时保持当前输出值。移动平均噪声滤波器22给出平均峰值噪声序列 ni。基于当前平均峰值 pi是否比噪声平均 ni超出一个预定裕量,可以做出第二个语音/非语音判断。
最好是,如同上面讨论的移动平均峰值信号检测器11中那样,根据如下定义的二进制决定因子D21和D22,通过采用多个阈值t21和t22来定义至少三个输出状态,结合噪声平均值产生一个模糊决定因子:
(1) pi≤ ni+t21,             其中D21=0以及D22=0
(2) ni+t21< pi≤ ni+t2    其中D21=1以及D22=0
(3) pi> ni+t22,             其中D21=1以及D21=1
用来产生二进制决定因子D21和D22的元件表示在图1中,包括用于将各个阈值加进噪声平均信号 ni的加法接点31和32,以及用来将所产生的和与平均峰值信号 pi相比较的比较器30和32。
通过将峰值序列 pi提供给移动方差滤波器24,方差检测器15产生第三模糊决定因子。根据下述公式,移动方差滤波器24计算峰值信号pi的方差 vi的近似值: v - i = 1 n ( p i - p - i ) 2 + n - 1 n v - i - 1
其中加权因子n>1确定滤波器24的响应时间。语音/噪声判断是基于方差信号 vi是否低于一个预定的阈值而确定的。一般来说,纯噪声信号的方差低于纯语音信号的方差。最好是,通过将方差信号 vi与至少两个阈值t31和t32相比来确定模糊决定因子,从而定义至少三个状态如下:
(1) vi≤t31,          其中D31=0以及D32=0
(2)t31< vi≤t32,    其中D31=1以及D32=0
(3) vi>t32,          其中D31=1以及D32=1
在一个其中语音检测器产生一个二进制语音/非语音判断的实施方案中,整个的语音检测输出信号SPEECH可以基于是否大部分语音检测器表示存在语音或非语音来产生。对于奇数个语音检测器来说,这种策略总能产生一个确定的结果。对于偶数个语音检测器,只要其结果平均分布于各个检测器中,那么总的语音检测输出信号可以被保持在以前的状态。
在其中每个语音检测器产生一个多值或模糊决定因子的实施方案中,可以基于模糊决定因子的集合来确定总的语音检测输出。例如,来自比较器26,28,30,32,34,36的二进制决定因子Dik被提供给语音判断逻辑电路40。语音判断逻辑电路40被配置来产生总的决定因子值,该值为例如,二进制决定因子的代数和(∑Djk),或以上述方式计算所得模糊决定因子的代数和。根据总的决定因子值,语音检测逻辑电路由下表产生一个逻辑输出信号,SPEECH:
      ∑Djk          语音
        0              0
        1              0
        2              0
        3           SPEECHi-i
        4              1
        5              1
        6              1
当∑Djk<3时,语音判断逻辑电路40确定通讯信号主要包括噪声,SPEECH没有被确认。当∑Djk>3时,语音判断逻辑电路40确定通讯信号主要包括语音,SPEECH被确认。当=3时,SPEECH保持在以前值,因为总的决定因子∑Djk并不能确定地表示语音或噪声。
每个决定因子Djk还被提供给阈值调整逻辑电路42,该装置被配置来动态调整用于各个语音检测器11,13,15的阈值tjk。为了使得语音检测器能适应通讯信道或其中信号的时变特性,需要作动态阈值调整。此外,动态阈值调整对于将语音检测器用于复用通讯系统也是很理想的,在这些系统中,对于任何通讯信道的快速调整都是很理想的。
某个语音检测器的输出状态与语音判断逻辑电路40的总的判断相冲突的情况是可能发生的。这种冲突是由于各个检测器的响应时间的差别、变化的信号状态或者促成某个检测器产生错误判断的通讯信号的特异统计特性造成的。为了纠正错误的判断,各个检测器中的一个或多个检测阈值在预定限制内并在至少与该检测器相关的滤波器的响应时间一样长的时间间隔内被进行渐进调整。最好的是,这种调整进行到足以使得冲突检测器的输出状态成为不确定的程度,因为“强迫”任何一个检测器同意总的判断将降低通过采用多种检测方案而得到的优势。当各个检测器中采用多个阈值时,如同在优选实施方案中一样,各个阈值被参考绝对限值和相对于其它阈值的限值来调整。这种安排防止了多个阈值发散到不易于或不可能得到决定因子输出状态的程度。
例如,如果逻辑电路输出信号SPEECH没有被确认(表示总的噪声判断),并且来自移动平均信号检测器11的模糊决定因子表示了语音(D11+D12=1+1=2),那么上限阈值t12被阈值调整逻辑电路42渐进增加直到来自移动平均检测器的模糊决定因子表示不确定状态(D11+D12=1+0=1)为止。因为阈值调整是渐进执行的,并且最好不快于移动平均滤波器20的调整时间,那么,可能发生通讯信号的变化解决冲突的情况(通过改变SPEECH或改变移动平均信号检测器11的输出状态),在这种情况下,阈值t12将保持在其最近的值上,而不管在解决冲突之前是否实现了不确定输出状态。
类似的,如果SPEECH被确认,并且移动平均信号检测器11的输出状态表示噪声,那么较低的阈值t11被递减直到移动平均检测器的输出状态为不确定,或者直到冲突解决。
最好的是,t12的上调限制在低于语音信号平均值的最大值上,例如,限制到低于平均语音值SAVG(该值可以通过SPEECH确认期间对|xi|求均值确定)3dB以下。t11的下调限制到一个最小值,例如高于噪声平均值NAVG(该值可以通过SPEECH不确认期间对|xi|求均值确定)6dB的大小。此外,如果t11或t12中的一个被调整,那么另一个阈值也可以被调整同样的量值,以便最好使两个阈值保持一定距离,而使其与预定的或测量到的通讯信号中的信噪比一致。
阈值调整逻辑电路42按照下述方式调整涉及噪声平均检测器13的阈值。如果SPEECH没有确认并且噪声平均检测器13的输出状态表示了语音(D21+D22=0),那么t22被增加使得噪声平均检测器趋向不确定输出状态。如果SPEECH被确认并且噪声平均检测器13的输出状态表示噪声(D21+D22=2),那么t21被减小使得噪声平均检测器趋向不确定输出状态。最好是,t22最大值被限制到低于平均语音值和平均噪声值之间的差值2dB(t22<=|NAVG-SAVG|),并且t21保持在噪声平均值之上约2dB。然而,如果信噪比很差,例如4dB或更低,那么t22和t21可能在很宽的范围上调整。
在类似的方式中,阈值调整逻辑电路42被配置来驱动方差检测器15变为不确定状态,其方式是当方差检测器15与SPEECH表示的总判断相冲突时,在适当的绝对或相对限值内调整t21和/或t32
如上所述,如果检测器与总的语音判断相矛盾的话,阈值调整逻辑电路42被配置来使任何一个语音检测器变为不确定输出状态。通过配置阈值调整逻辑电路42来检测各个语音检测器是否在一段明显超过其相关滤波器响应时间的时间段内产生一个不确定状态,可以获得语音检测准确性的附加改进。如此长的不确定状态表明相应阈值之间的差值太大了,因此产生了一个太大的不确定范围。通过参考预选的间隔限制值,阈值调整逻辑电路42可以被配置来检测何时某个语音检测器超过了这样一个限制,并采取适当的行动。例如,当某个语音检测器超过其不确定间隔限制时,阈值调整逻辑电路42则以使语音检测器趋向对应于SPEECH当前状态的输出状态,以及调整一个或多个与之相关的阈值的方式来作出响应。
每个检测器可以使用多于2个阈值以便给出数量更多的梯度,其中,总的决定因子表示语音,噪声或不确定状态。例如,在每个检测器采用三个阈值的实施方案中,总的决定因子将具有9个可能的值,定义如下:
        ∑Djk         语音
          0              0
          1              0
          2              0
          3              0
          4          SPEECHi-i
          5          SPEECHi-1
          6              1
          7              1
          8              1
          9              1
在这个实施方案中,当∑Djk=4或∑Djk=5时,总决定因子可以被定义为表明一个不确定语音检测状态。各个模糊决定因子将在0到3的范围内。模糊决定因子的更大范围给予阈值调整逻辑电路42更多的阈值调整机会。例如,当SPEECH不被确认时,任何具有模糊决定因子值2或3的检测器可以使其相关的阈值调整以产生一个较低值模糊决定因子。相反地,当SPEECH被确认时,任何具有模糊决定因子值0或1的检测器可以使其相关的阈值调整以产生更大的模糊决定因子。此外,当总决定因子为不确定语音检测状态时,任何具有边界模糊决定因子值的(0,3)检测器可以被驱动来产生不在边界的决定因子值(例如1或2)。
在另一可选实施方案中,各个逻辑决定因子Djk可以二进制语音检测字(D31D21D11D32D22D12)的形式写入语音判断逻辑电路42的适当寄存器中。二进制语音检测字的高位比特包括与检测阈值上限相关的二进制决定因子,而二进制语音检测字低位比特包括与较低检测阈值相关的二进制决定因子。语音判断逻辑电路40被配置来从适当的查找表或逻辑阵列中查询或产生SPEECH输出状态,而不是执行任何计算操作。阈值调整逻辑电路42可以类似地被配置来执行检测器阈值的调整以直接响应预定的二进制语音检测字。这样与在总决定因子值中插入特定的二进制决定因子确认值的实施方案相比,可以获得更高的语音检测准确性。例如,对于语音检测字101101和001111来说,总决定因子值都是4,然而也许希望为各个检测字定义一个不同的SPEECH逻辑状态。通过使得语音判断逻辑电路直接响应所定义的二进制检测字,就能得到这样一种功能。
在另一个采用二进制语音检测字的实施方案中,语音判断逻辑电路40被配置除了响应单个语音检测字之外,还响应预定的语音检测字序列。这种操作可以适当补偿各个语音检测器的不同响应时间。例如,如果移动平均滤波器响应语音比其它检测器快,并且预定数量的连续二进制检测字每个都是000000,那麽通过在语音开始的假设基础上确认SPEECH,语音判断逻辑电路40响应001001,但是其它检测器没有足够的时间来检测语音。如果在一个或所有其它检测器响应时间的时间段内语音检测器保持在001001,那麽可以假设移动平均滤波器作出了错误的判断,SPEECH可能被消确认(deassert),移动平均检测阈值可能被适当调整。
在另一个采用二进制语音检测字的实施方案中,语音判断逻辑电路40接收连续的二进制语音检测字并持续计算表示连续语音检测字变化率和方向的向量。这一过程避免了存储大量语音检测字以便提取关于各个语音检测器的语音检测状态的临时数据的需要。
这里采用的术语和表达式是用来描述而不是作为限制的。这里没有用这种术语和表达式排除所表示和描述的部分和特征的等价物的意图。然而,要意识到的是,在所宣称的发明的范围和思想之内的各种修正都是可能的。

Claims (25)

1.一种用于检测通讯信号中是否存在语音的装置,包括:
用于接收通讯信号的输入端;
与输入端连接用来提供表示得自通讯信号的第一统计值的第一统计信号的第一滤波器。
用来将第一统计信号与表示通讯信号中存在语音的第一参考信号相比,并用来产生表明比较结果的第一判断信号的第一比较装置;
与输入端连接用来提供表示得自通讯信号的第二统计值的第二统计信号的第二滤波器。
用来将第二统计信号与表示通讯信号中存在语音的第二参考信号相比,并用来产生表明比较结果的第二判断信号的第二比较装置;
被连接来接收第一和第二判断信号,并被配置来组合第一和第二判断信号以产生总判断信号,而且用来基于总判断信号确定通讯信号中存在语音,以及用来给出表示判断结果的逻辑输出信号的语音判断逻辑电路。
2.权利要求1的装置,其特征在于第一和第二参考信号每个都包括至少两个阈值信号,并且其中第一和第二比较装置被配置来给出所述的第一和第二判断信号,使每个信号为具有至少三个定义的输出状态的多值信号。
3.权利要求2的装置,其特征在于总判断信号是分配给第一、第二判断信号的输出状态的数值之和。
4.权利要求3装置,其特征在于语音判断逻辑电路被配置来将总判断信号与表明通讯信号中存在语音的定义值相比,并用来确认逻辑输出信号以表明比较的结果。
5.权利要求4的装置,其特征在于语音判断逻辑电路被配置来将总判断信号与表明通讯信号中语音不存在的第二定义值相比,并用来消确认逻辑输出信号以表明比较的结果。
6.权利要求5的装置,其特征在于语音判断逻辑电路被配置来将总判断信号与表明通讯信号中语音存在性为不确定的第三定义值相比,并将逻辑输出值保持在最近状态。
7.权利要求4的装置,其特征在于第二滤波器被操作性连接来接收逻辑输出信号,并被配置来在逻辑输出信号表明通讯信号中不存在语音时改变第二统计信号。
8.权利要求7的装置,其特征在于还包括一个与输入端相连并被配置来检测通讯信号中的峰值并给出表明检测到峰值的峰值检测信号的峰值检测器,其中第一滤波器被连接来接收峰值检测信号,并被配置来在峰值被检测到时改变第一统计信号。
9.权利要求8的装置,其特征在于第一和第二滤波器都从包括移动平均滤波器和方差滤波器的组中选出。
10.权利要求9的装置,其特征在于峰值检测器被配置来提供从通讯信号中得到的峰值信号,并且其中第一和第二滤波器被连接来接收峰值信号从而产生第一和第二统计信号。
11.权利要求10的装置,其特征在于第一滤波器包括一个移动平均滤波器用来给出第一统计信号,该信号为峰值信号的移动平均,并且其中第一比较装置包括用来将第一统计信号与至少两个阈值相比来建立第一判断信号的至少三个输出状态的装置。
12.权利要求11的装置,其特征在于第二滤波器包括一个移动平均滤波器用来给出第二统计信号,该信号为与表明语音不存在的逻辑输出信号同时发生的峰值信号部分的移动平均,并且其中第二比较装置包括用来根据两个阈值将第二统计信号与第一统计信号相比来建立第二判断信号的至少三个输出状态的装置。
13.权利要求1的装置,其特征在于包括:
与输入终端连接用来提供表示得自通讯信号的第三统计值的第三统计信号的第三滤波器。
用来将第三统计信号与表示通讯信号中语音存在的第三参考信号相比,并用来产生表明比较结果的第三判断信号的第三比较装置;
所述语音判断逻辑电路还被配置来组合第一、第二和第三判断信号来产生总判断信号。
14.权利要求13的装置,其特征在于第一、第二和第三比较装置被配置来将第一、第二和第三统计信号分别与第一、第二和第三对阈值相比来建立每个所述第一、第二和第三判断信号的至少三个输出状态。
15.权利要求14的装置,其特征在于包括阈值调整逻辑电路被操作性连接来接收逻辑输出信号并用来在对应的判断信号表明输出状态与语音判断逻辑电路给出的逻辑输出信号冲突时,调整与其中一个所述比较装置相关的参考信号。
16.权利要求15的装置,其特征在于所述三个输出状态包括表明通讯信号中存在语音的第一状态,表明通讯信号中不存在语音的第二状态,表明通讯信号中语音存在性不确定的第三状态,并且
所述阈值调整逻辑电路被配置来渐进调整所述参考信号直到相应的判断信号采取了第三个状态或不再与逻辑输出信号冲突。
17.权利要求2的装置,其特征在于包括动态调整装置,该装置响应逻辑输出信号用来建立多个阈值信号,这些信号定义了所述的第一和第二参考信号,该调整装置还用来在相应的判断信号表明输出状态与逻辑输出信号冲突时调整至少一个所述阈值信号。
18.权利要求17的装置,其特征在于所述三个输出状态包括(ⅰ)表明通讯信号中存在语音的第一状态,(ⅱ)表明通讯信号中不存在语音的第二状态,(ⅲ)表明通讯信号中语音存在性不确定的第三状态,并且
所述动态调整装置被配置来渐进调整所述阈值信号直到相应的判断信号采取了第三个状态或不再与逻辑输出信号冲突。
19.一种用于检测通讯信号中语音存在性的语音检测系统,包括:
用于接收通讯信号的输入端;
被连接来接收通讯信号的一些语音检测模块,每个语音检测模块被配置来基于统计标准产生一个模糊判断信号表明通讯信号中语音的相对存在或不存在,其中每个模块与其它的语音检测模块相对独立。
用来接收模糊判断信号,并组合模糊判断信号以产生总判断信号,而且用来确定总判断值表明通讯信号中语音存在还是不存在的语音判断逻辑电路。
用来基于语音判断逻辑电路的判断给出逻辑控制信号的输出端。
20.权利要求19的装置,其特征在于所述多个语音检测模块包括具有移动平均峰值信号滤波器的第一模块,具有移动平均峰值噪声滤波器的第二模块,具有方差滤波器的第三模块;每个所述模块还包括用来将其相关滤波器的输出信号与至少两个阈值相比来产生模糊判断信号的比较装置。
21.权利要求20的装置,其特征在于还包括动态阈值调整装置用来对应于其中一个语音检测模块和语音判断逻辑电路装置之间的冲突的语音/非语音状态来调整其中一个所述的阈值。
22.权利要求19的装置,其特征在于每个模糊判断信号表示被定义为噪声存在,语音存在和不确定状态的至少三个状态。
23.权利要求22的装置,其特征在于每个所述语音检测模块被安排来通过将来自通讯信号的统计值与至少两个阈值相比来产生其模糊判断信号。
24.权利要求23的装置还包括阈值调整装置,用来对应于逻辑输出信号与任何一个语音检测模块确定的状态之间冲突来改变其中一个所述的阈值。
25.权利要求24的装置,其特征在于所述阈值调整装置被配置来调整所述的一个阈值大小使得其相应的语音检测模块趋于在不确定信号状态下产生所述模糊决定因子。
CN97197729A 1996-07-16 1997-03-31 使用多个确定装置的语音检测系统 Pending CN1230276A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/678,363 1996-07-16
US08/678,363 US5884255A (en) 1996-07-16 1996-07-16 Speech detection system employing multiple determinants

Publications (1)

Publication Number Publication Date
CN1230276A true CN1230276A (zh) 1999-09-29

Family

ID=24722481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN97197729A Pending CN1230276A (zh) 1996-07-16 1997-03-31 使用多个确定装置的语音检测系统

Country Status (9)

Country Link
US (1) US5884255A (zh)
EP (1) EP0954852A1 (zh)
JP (1) JP2001516463A (zh)
KR (1) KR20000023823A (zh)
CN (1) CN1230276A (zh)
AU (1) AU2598197A (zh)
CA (1) CA2260218A1 (zh)
IL (1) IL128053A (zh)
WO (1) WO1998002872A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009012693A1 (fr) * 2007-07-20 2009-01-29 Huawei Technologies Co., Ltd. Procédé et système permettant d'ajuster le paramètre de port du côté de la fonction vocale
CN101110217B (zh) * 2007-07-25 2010-10-13 北京中星微电子有限公司 一种音频信号的自动增益控制方法及装置
CN104753656A (zh) * 2005-09-19 2015-07-01 核心无线许可有限公司 检测存在/不存在信息信号
CN110390957A (zh) * 2018-04-19 2019-10-29 半导体组件工业公司 用于语音检测的方法及设备
CN110705426A (zh) * 2019-09-25 2020-01-17 广东石油化工学院 一种利用去模糊算子的功率信号滤波方法和系统

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718302B1 (en) * 1997-10-20 2004-04-06 Sony Corporation Method for utilizing validity constraints in a speech endpoint detector
US6718301B1 (en) * 1998-11-11 2004-04-06 Starkey Laboratories, Inc. System for measuring speech content in sound
US6490556B2 (en) * 1999-05-28 2002-12-03 Intel Corporation Audio classifier for half duplex communication
AU1359601A (en) * 1999-11-03 2001-05-14 Tellabs Operations, Inc. Integrated voice processing system for packet networks
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US6954745B2 (en) * 2000-06-02 2005-10-11 Canon Kabushiki Kaisha Signal processing system
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US20020026253A1 (en) * 2000-06-02 2002-02-28 Rajan Jebu Jacob Speech processing apparatus
US7489790B2 (en) * 2000-12-05 2009-02-10 Ami Semiconductor, Inc. Digital automatic gain control
US7293079B1 (en) * 2000-12-22 2007-11-06 Nortel Networks Limited Method and apparatus for monitoring a network using statistical information stored in a memory entry
US20020103636A1 (en) * 2001-01-26 2002-08-01 Tucker Luke A. Frequency-domain post-filtering voice-activity detector
US7031916B2 (en) 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
GB2379148A (en) * 2001-08-21 2003-02-26 Mitel Knowledge Corp Voice activity detection
KR100429896B1 (ko) * 2001-11-22 2004-05-03 한국전자통신연구원 잡음 환경에서의 음성신호 검출방법 및 그 장치
KR20030070177A (ko) * 2002-02-21 2003-08-29 엘지전자 주식회사 원시 디지털 데이터의 잡음 필터링 방법
KR100677396B1 (ko) * 2004-11-20 2007-02-02 엘지전자 주식회사 음성인식장치의 음성구간 검출방법
JP4758879B2 (ja) * 2006-12-14 2011-08-31 日本電信電話株式会社 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置、方法
EP2118885B1 (en) * 2007-02-26 2012-07-11 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
KR101251045B1 (ko) * 2009-07-28 2013-04-04 한국전자통신연구원 오디오 판별 장치 및 그 방법
JP5793500B2 (ja) * 2009-10-19 2015-10-14 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声区間検出器及び方法
US8737654B2 (en) 2010-04-12 2014-05-27 Starkey Laboratories, Inc. Methods and apparatus for improved noise reduction for hearing assistance devices
CN104424956B9 (zh) * 2013-08-30 2022-11-25 中兴通讯股份有限公司 激活音检测方法和装置
US9552817B2 (en) 2014-03-19 2017-01-24 Microsoft Technology Licensing, Llc Incremental utterance decoder combination for efficient and accurate decoding
KR101550648B1 (ko) 2015-03-24 2015-09-08 (주)스타넥스 웨어러블 무선 통신 장치 및 이를 이용한 무선 통신 방법

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3832496A (en) * 1973-01-02 1974-08-27 Gte Automatic Electric Lab Inc Link accessing arrangement including square-wave clock generator
US4052568A (en) * 1976-04-23 1977-10-04 Communications Satellite Corporation Digital voice switch
US4061878A (en) * 1976-05-10 1977-12-06 Universite De Sherbrooke Method and apparatus for speech detection of PCM multiplexed voice channels
US4028496A (en) * 1976-08-17 1977-06-07 Bell Telephone Laboratories, Incorporated Digital speech detector
US4187396A (en) * 1977-06-09 1980-02-05 Harris Corporation Voice detector circuit
FR2410923A1 (fr) * 1977-08-18 1979-06-29 Dassault Electronique Installation de transmission telephonique de la parole entre des interlocuteurs places dans une ambiance bruyante
US4351983A (en) * 1979-03-05 1982-09-28 International Business Machines Corp. Speech detector with variable threshold
US4281218A (en) * 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
US4382164A (en) * 1980-01-25 1983-05-03 Bell Telephone Laboratories, Incorporated Signal stretcher for envelope generator
US4277645A (en) * 1980-01-25 1981-07-07 Bell Telephone Laboratories, Incorporated Multiple variable threshold speech detector
US4357491A (en) * 1980-09-16 1982-11-02 Northern Telecom Limited Method of and apparatus for detecting speech in a voice channel signal
US4410763A (en) * 1981-06-09 1983-10-18 Northern Telecom Limited Speech detector
JPS5876899A (ja) * 1981-10-31 1983-05-10 株式会社東芝 音声区間検出装置
US4700392A (en) * 1983-08-26 1987-10-13 Nec Corporation Speech signal detector having adaptive threshold values
US4667065A (en) * 1985-02-28 1987-05-19 Bangerter Richard M Apparatus and methods for electrical signal discrimination
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
FR2631147B1 (fr) * 1988-05-04 1991-02-08 Thomson Csf Procede et dispositif de detection de signaux vocaux
US4975657A (en) * 1989-11-02 1990-12-04 Motorola Inc. Speech detector for automatic level control systems
US5152007A (en) * 1991-04-23 1992-09-29 Motorola, Inc. Method and apparatus for detecting speech
US5509102A (en) * 1992-07-01 1996-04-16 Kokusai Electric Co., Ltd. Voice encoder using a voice activity detector
US5323337A (en) * 1992-08-04 1994-06-21 Loral Aerospace Corp. Signal detector employing mean energy and variance of energy content comparison for noise detection
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104753656A (zh) * 2005-09-19 2015-07-01 核心无线许可有限公司 检测存在/不存在信息信号
US9755790B2 (en) 2005-09-19 2017-09-05 Core Wireless Licensing S.A.R.L. Detecting presence/absence of an information signal
WO2009012693A1 (fr) * 2007-07-20 2009-01-29 Huawei Technologies Co., Ltd. Procédé et système permettant d'ajuster le paramètre de port du côté de la fonction vocale
CN101110217B (zh) * 2007-07-25 2010-10-13 北京中星微电子有限公司 一种音频信号的自动增益控制方法及装置
CN110390957A (zh) * 2018-04-19 2019-10-29 半导体组件工业公司 用于语音检测的方法及设备
CN110705426A (zh) * 2019-09-25 2020-01-17 广东石油化工学院 一种利用去模糊算子的功率信号滤波方法和系统
CN110705426B (zh) * 2019-09-25 2021-09-21 广东石油化工学院 一种利用去模糊算子的功率信号滤波方法和系统

Also Published As

Publication number Publication date
JP2001516463A (ja) 2001-09-25
WO1998002872A1 (en) 1998-01-22
IL128053A0 (en) 1999-11-30
AU2598197A (en) 1998-02-09
EP0954852A1 (en) 1999-11-10
US5884255A (en) 1999-03-16
KR20000023823A (ko) 2000-04-25
EP0954852A4 (zh) 1999-11-10
CA2260218A1 (en) 1998-01-22
IL128053A (en) 2003-02-12

Similar Documents

Publication Publication Date Title
CN1230276A (zh) 使用多个确定装置的语音检测系统
CN1188835C (zh) 噪声抑制系统和方法
CN1091980C (zh) 差错检测电路及检测方法
US8977556B2 (en) Voice detector and a method for suppressing sub-bands in a voice detector
US8724822B2 (en) Noisy environment communication enhancement system
US6725027B1 (en) Multipath noise reducer, audio output circuit, and FM receiver
KR910002327B1 (ko) 신호 분류 장치 및 방법
CN110349595A (zh) 一种音频信号自动增益控制方法、控制设备及存储介质
AU714455B2 (en) A hands-free communication unit having residual acoustic echo suppression means for suppressing residual echoes which have been left unremoved by an echo canceller, a bilateral communication system and a method for suppressing residual echoes
US5103431A (en) Apparatus for detecting sonar signals embedded in noise
CN1175560C (zh) 无线接收装置和无线接收方法
US6784653B2 (en) Eye monitor
CN1193424A (zh) 自适应增益控制器
WO1999012155A1 (en) Channel gain modification system and method for noise reduction in voice communication
US7080006B1 (en) Method for decoding digital audio with error recognition
CN1188981C (zh) 调整数据传输系统内取样节拍的方法和装置
US5309478A (en) Method and apparatus for hybrid analog/digital signal processing
CN1289500A (zh) 带有用于在存在噪声下增强主观信号感觉的装置的电话
CN1099198C (zh) 带有改进音频检测的传输系统
CN1653711A (zh) 接收装置及接收方法
CN115173955B (zh) 一种光路调顶信号的解调方法及装置
CN1332589A (zh) 用于改善传输误差的检测的接收机、方法、系统和电话
JP3436214B2 (ja) データ検出方式およびこれを用いた電子機器
JP2629618B2 (ja) 利得調整装置
JP2949925B2 (ja) 効果音付加判別装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: COHERENT COMMUNICATIONS SYSTEMS CORP. TO: TYLERBISCAY OPERATION CO.,LTD.

CP03 Change of name, title or address

Address after: Illinois State

Applicant after: Tylorbis Operation Inc.

Address before: Virginia

Applicant before: Coherent Communications Systems Corp.

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication