CN1443349A - 从电子信号中去除噪声的方法和仪器 - Google Patents

从电子信号中去除噪声的方法和仪器 Download PDF

Info

Publication number
CN1443349A
CN1443349A CN01812924A CN01812924A CN1443349A CN 1443349 A CN1443349 A CN 1443349A CN 01812924 A CN01812924 A CN 01812924A CN 01812924 A CN01812924 A CN 01812924A CN 1443349 A CN1443349 A CN 1443349A
Authority
CN
China
Prior art keywords
noise
signal
voice
transport function
produce
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN01812924A
Other languages
English (en)
Inventor
格雷戈里·伯内特
埃里克·F·伯瑞特泰勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AliphCom LLC
Original Assignee
AliphCom LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AliphCom LLC filed Critical AliphCom LLC
Publication of CN1443349A publication Critical patent/CN1443349A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种从人的语音中去除声音噪音的方法和系统,其中在语音中不管什么类型、幅度、方向的噪声都要被除去。这个系统包括麦克风和一个耦合在处理器之中的语音活动检测(VAD)数据流。麦克风接收声音信号,VAD在有语音(浊音和清音)时产生二进制1,没有时产生0。处理器包括能产生传递函数的降噪算法。这些传递函数包括响应一判定产生的传递函数,该判定是在一个确定的时间周期内接收到的声音信号里缺失了发音信息。这些传递函数还包括响应一判定产生的一种传递函数,该判定是在一个确定的时间周期内接收到的声音信号里存在发音信息。用传递函数产生至少一个降噪语音数据流。

Description

从电子信号中去除噪声的方法和仪器
技术领域
本发明属于从声音传输或者记录中去除或者抑止不想要的声噪音的数学方法和电子系统领域。
背景技术
在一个典型的声音应用中,人的语音被记录或者存储并传送到不同位置的接收器。在使用者所处的环境中可能存在一个或者多个噪声源,这些噪声源用使用者不想要的声音噪声污染了有用的信号(使用者的声音)。这样就造成了接收者理解使用者语音上的困难,无论是人还是机器来接收。随着移动通讯设备如蜂窝式移动电话和个人数字助理的日益增多,这个问题显得尤为突出了。现在已经存在多种抑止这些噪声增加的方法,但是这些方法或者要求长时间的计算或笨重的硬件,或者缺少实用性。例如Vaseghi的课本“高级数字信号处理和减噪”ISBN0-471-67692-9一书中介绍了许多这种方法。所以说,很有必要找到新的去除和减少噪声的方法来阐明典型系统的缺点同时提出无失真的净化声音信号的新方法。
发明内容
本专利提出了一种从人的语音中去除声音噪声的方法和系统,在语音中不管什么类型、幅度、音源的噪声都要被除去。系统包括麦克风和带有处理器的传感器。麦克风接收来自人信号源的包括噪音和声音的语音信号。传感器产生一个二进制的VAD信号,这个信号当有语音(声音的或者非声音的)时是二进制“1”,没有语音时是二进制“0”,
VAD信号可以通过很多的方法获得,例如,用声音获取,加速计,和射频传感器。
处理器系统和方法包括降噪算法,该算法计算出噪音源和麦克风之间的传递函数以及使用人和麦克风之间的传递函数。这些传递函数用来从收到的声音信号中去除噪声和产生至少一种降噪语音数据流。
附图说明
图1是一实施例的降噪系统的方块图;
图2是一个实施例的除噪算法方块图,这里假定是单一的噪声源和一个直接通道到麦克风;
图3是一个实施例的除噪算法的前端的方块图,可以推广到n个孤立的噪声源(这些噪声源可以相互反射或回声);
图4是在最普通的情况下即有n个独立的噪声源和信号反射时的实施例的除噪算法的前端的方块图;
图5是一个实施例的降噪方法的流程图;
图6显示的是一个实施例的除噪算法在一个美语发音的女试验者身上的试验结果,试验环境中的飞机场的终端噪声包括很多说话者和机场公告。
具体实施方式
图1是一实施例的降噪系统的方块图,该实施例用到了当语音产生自发音活动的生理信息时的知识。系统包括麦克风10和传感器20,它们提供信号给至少一个处理器30。处理器包括一个降噪子系统或者算法。
图2是一个实施例的噪音去除系统/算法的方块图,这里假定有单一的噪声源和一个到麦克风的直接通道。噪音去除系统框图包括一个实施例方法的图示描述,有单一信号源(100)和单一噪声源(101)。这种算法用两个麦克风,一个“信号”麦克风(MIC1,102)和一个“噪声”麦克风(MIC2,103),但是也不是非这样不可。MIC1主要用来捕获含有一些噪声的信号,而MIC2主要用来捕获含有信号的噪声。这是常规高级声音系统的通用配置。从信号到MIC1的数据用s(n)表示,从信号到MIC2的数据用s2(n)表示,从噪音到MIC2的数据用n(n)表示,从噪音到MIC1的数据用n2(n)表示。同样,从MIC1出来的信号用m1(n)表示,从MIC2出来的信号用m2(n)表示,这里s(n)表示信号源发出的模拟信号的离散采样。
假定从信号到MIC1与从噪声到MIC2的传递函数一样,但是从信号到MIC2的传递函数被表示成H2(z),从噪声到MIC2的传递函数被表示成H1(z)。假定的传递函数一致并不影响这个算法的一般性,因为信号、噪声和麦克风之间的实际关系是简单的线性关系而且为了简化起见以这一方式又重新定义了该线性关系。
在常规的除噪系统中,来自MIC2的信息用来试图除去来自MIC1的噪声。但是,未说出的假设是VAD装置从来不是完美的,因此降噪必须谨慎的进行,以保证不去除过多的伴随着噪声的信号。但是,如果假定VAD装置是完美的,当使用者不发出声音时输出为0,发出声音时为1,这样就可以对除噪系统有一个实质性的改进。
参考图2,在分析该单一噪声源和到麦克风的直接通路时,进入到MIC1的声音信息表示为m1(n).进入到MIC2的信息表示为m2(n).在z(数字频率)域中,它们表示为M1(z)和M2(z)。这样:
                      M1(z)=S(z)+N2(z)
                      M1(z)=N(z)+S2(z)
其中:
                      N2(z)=N(z)H1(z)
                      S2(z)=S(z)H2(z)
因此
                      M1(z)=S(z)+N(z)H1(z)
                      M2(z)=N(z)+S(z)H2(z)         方程1
这是用于所有的两个麦克风系统的通用情况。在一个实际系统中,会经常有一些噪音泄漏到MIC1,一些信号泄漏到MIC2。方程1有4个未知量而仅有2个已知的关系式,因此不能明确地解出。
但是,有另外的方法来解决方程1中的一些未知量。分析从考察没有信号产生的情况开始,也就是,VAD信号等于0,语音没有产生。在这种情况下,S(n)=S(z)=0,方程1就简化为:
                      M1n(z)=N(z)H1(z)
                      M2n(z)=N(z)
这里变量M的下标n代表仅有噪声在被接收。这样就有:
                      M1n(z)=M2n(z)H1(z) H 1 ( z ) = M 1 n ( z ) M 2 n ( z ) 方程2
当确定系统只接收到噪声时,可以使用可用的系统辨识算法和麦克风的输出来计算出H1(z)。计算可以自适应完成,这样系统就能对噪声的变化作出反应。
现在可得到对方程1中的一个未知量的解决办法。另外一个未知量H2(z),在有语音信号和VAD等于1时也可以确定下来。这时候,麦克风的最近记录(也许小于1秒)指示出较低的噪声水平,那么可以假定n(s)=N(z)~0。于是方程1简化为:
                      M1s(z)=S(z)
                      M2s(z)=S(z)H2(z)
接着可以导出:
                      M2s(z)=M1s(z)H2(z) H 2 ( z ) = M 2 s ( z ) M 1 s ( z )
这个过程是计算H1(z)的逆过程。但是,要注意的是正在用不同的输入-而在仅有噪声产生之前就仅有信号产生。在计算H2(z)时,用来计算H1(z)的值保持为常量,反之依然。这样,就假定在计算另一个时H1(z)或H2(z)没有实质的改变。
在计算完H1(z)和H2(z)后,它们被用于从信号从去除噪声。如果方程1写成:
                      S(z)=M1(z)-N(z)H1(z)
                      N(z)=M2(z)-S(z)H2(z)
                      S(z)=M1(z)-[M2(z)-S(z)H2(z)]H1(z)
                      S(z)[1-H2(z)H1(z)]=M1(z)-M2(z)H1(z)
那么N(z)可以做所示的替代用于解S(z): S ( z ) = M 1 ( z ) - M 2 ( z ) H 1 ( z ) 1 - H 2 ( z ) H 1 ( z ) 方程3
如果传递函数H1(z)和H2(z)能被描述得足够精确,那么就可以完全去除噪声,原始信号就能被恢复。不管噪声的幅度和谱特性如何,这都是适用的。做出的仅有的一些假设是:一个完美的VAD,足够精确的H1(z)和H2(z),而且在另外一个计算时候H1(z)或H2(z)没有实质的变化。实际上这些假设已经证明是合理的。
这里描述的除噪算法可以很容易被推广到包括任意数目的噪声源。图3是一个实施例的除噪算法的前端的方块图,可以推广到n个孤立的噪声源。这些独立的噪声源可以相互反射或者回应,但是并不严格限制。图中显示出了几个噪声源,每个有一个传递函数,或通路,到每个麦克风。前面命名的通路H2的已经被改标为H0,这样标示到MIC1的噪声源2通路更方便了。每个麦克风的输出,当转变为z域时,为:
      M1(z)=S(z)+N1(z)H1(z)+N2(z)H2(z)+...Nn(z)Hn(z)
      M2(z)=S(z)H0(z)+N1(z)G1(z)+N1(z)G2(z)+...Nn(z)Gn(z)
                        方程4
当没有信号时(VAD=0),那么(为了清晰抑制z’s)
      M1n=N1H1+N2H2+...NnHn                       方程5
      M2n=N1G1+N2G2+...NnGn
现在可以定义一个新的传递函数,类似与上面的H1(z): H ~ 1 = M 1 n M 2 n = N 1 H 1 + N 2 H 2 + . . . NnHn N 1 G 1 + N 2 G 2 + . . . NnGn 方程6
这样 仅仅依赖于噪声源和它们各自独立的传递函数,就可以在没有信号传送的任意时刻计算。再说明一次,麦克风输入的下标n表示仅仅检测到了噪声,而下标s表示麦克风仅仅接收到信号。
在假设没有噪声产生时考察方程4:
                         M1s=S
                         M2s=SH0
这样用任何可用的传递函数计算方法,可以象前面那样解出H0。数学公式为: H 0 = M 2 s M 1 s
用在方程6中面定义的 重写方程4,可得 H ~ 1 = M 1 - S M 2 - SH 0 方程7
算出S输出: S = M 1 - M 2 H ~ 1 1 - H 0 H ~ 1 方程8
它与方程3一样,用H0取代了H2, 取代了H1。这样噪声去除算法对任意数量的噪声源,包括多噪声源回声具有了数学有效性。再一次强调,如果对
Figure A0181292400156
和H0的估计有一个足够高的精确度,而且从信号到麦克风只有一条通路的上述假设成立,那么噪声可以全部清除。
最一般的情况包括多个噪声源和多个信号源。图4是在有n个独立的噪声源和信号反射的最一般的情况下一实施例的噪音去除算法的前端的方块图。这里,信号反射进入两个麦克风。这是最一般的情况,因为噪声反射进麦克风的情况可以用附加噪声信号源来精确的模拟。为了清楚起见,从信号到MIC2的直接通路由H0(z)改为H00(z),而且到麦克风1,2的反射路径分别标示为:H01(z)和H02(z)。
到麦克风的输入现在变为:
M1(z)=S(z)+S(z)H01(z)+N1(z)H1(z)+N2(z)H2(z)+...Nn(z)Hn(z)
M2(z)=S(z)H00(z)+S(z)H02(z)+N1(z)G1(z)+N2(z)G2(z)+...Nn(z)Gn(z)方程9
当VAD=0时,输入变为(再一次抑制z’s):
                 M1n=N1H1+N2H2+...NnHn
                 M2n=N1G1+N2G2+...NnGn
和方程5中的一样。这样,方程6中的 1的计算不改变,和预期的一样。考察没有噪声的情况,方程9可以简化为:
                        M1s=S+SH01
                        M2s==SH00+SH02
这就产生 的定义: H ~ 2 = M 2 s M 1 s = H 00 + H 02 1 + H 01 方程10
的定义(如公式2中所示)重写公式9: H ~ 1 = M 1 - S ( 1 + H 01 ) M 2 - S ( H 00 + H 02 ) 方程11
中间一些运算操作输出: S ( 1 + H 01 - H ~ 1 ( H 00 + H 02 ) ) = M 1 - M 2 H ~ 1 S ( 1 + H 01 ) [ 1 - H ~ H 00 + H 02 ) ( 1 + H 01 ) ] = M 1 - M 2 H ~ 1 S ( 1 + H 01 ) [ 1 - H ~ 1 H ~ 2 ] = M 1 - M 2 H ~ 1
最后: S ( 1 + H 01 ) = M 1 - M 2 H ~ 1 1 - H ~ 1 H ~ 2 方程12
公式12和公式8一样,只是用
Figure A01812924001610
代替了H0,因子(1+H01)附加在了左端。这个附加因子说明S在这种情况下不能被直接解出来,但是信号加上它所有的回音就可以得出一个结果。这不是一个坏的情况,因为有很多传统方法来处理回声抑制,而且即使回音得不到抑止,它也不会对语音的可理解性产生大的影响。为了解决作为响应噪声源的麦克风2的信号回音需要对 做更复杂的计算。
图5是一个实施例的降噪方法的流程图。在操作中,502声音信号被接收。进而,504和人的发音活动有关的生理信息接收。506依据声音信号缺乏语音信息至少一个特定时间段的判定,计算出第一个语音信号的传递函数。508依据声音信息是否在语音信号中存在至少一个特定的时间的判定,计算出第二个代表语音信号的传递函数。510用由第一个传递函数和第二个传递函数的合成,并产生降噪语音数据流来去除声音信号里面的噪声。
这里描述了除噪或者降噪的一种算法,既适合有一条通路和单一噪声源的最简单情况,也适合有反射和回音的多噪声源情况。这里的算法随着环境条件的改变有所变化。如果已经给
Figure A0181292400173
做了很好的估计,而且如果它们不随着对方的变化而变化,噪声的类型和数量是不合逻辑的。如果用户的环境里面有回音,而且来自一个噪声源那么就回音就可以被补偿。如果信号回音也存在,它们将影响降噪处理过的信号,但是在大多数场合,效果应该是可忽略的。
在操作中,一个实施例的算法在处理不同类型的噪声、振幅和方向时都有很好的结果。但是,当算法从数学概念向工程实践转化时,总是需要做近似和调整。在方程3中做了一个假设,H2(z)假定很小,因此H2(z)H1(z)≈0,因此方程3简化为:
S(z)≈M1(z)-M2(z)H1(z).
这意味着仅仅需要计算H1(z),大大地加速了计算过程同时减少了所需的计算数。选择适当的麦克风,这个近似很容易被实现。
另外一个近似涉及到在实施例中用的滤波器。实际的H1(z)无疑将同时有零点和极点,但是为了稳定和简单,用了一个全零的有限的刺激响应(FIR)滤波器。有足够轻叩次数(大约60),对实际H1(z)的近似将非常好。
至于子波段选择,由于在每个频段上必须计算一个传递函数,故频带越宽,就越难精确的计算出来。因此语音数据被分为16个子波段,最低的是50Hz,最高达到3700Hz。降噪算法依次用到每个子频段,而且16个降噪数据流被混合以生产降噪语音数据。这样系统工作的很好,但是任意的混合子频段(即4,6,8,32,均衡分配)都可以用,而且发现工作的都很好。
在实施里中噪声的幅度要抑制,这样所用的麦克风才不会饱和(即在线性响应范围外操作)。为确保最佳效果保持麦克风的线性操作很重要。即使有了这个限制,还可以检测到很高的信噪比(SNR)(达到-10dB)。
H1(z)每10毫秒计算一次,用的是LMS方法—一种普通的自适应的传递函数。解释可以在“适应性信号处理”(1985)中找到,作者:WindrowStearns,出版社:Prentice-Hall,
ISBN 0-13-0040299-0.
用于实施例的VAD装置来自一个射频传感器和两个麦克风,对声音或者非声音的语音都有很高的精确性(>99%)。实施例的VAD用一个射频干涉计来测量人发语相关的组织运动,但也不是完全限制的。这样它完全不依赖于语音—噪音,可以在任何语音—噪音环境里面工作。可以使用简单的能量测量来判断有语音出现。不发生语音可以用传统的基于频率的方法来判断,用接近的浊音部分或者通过上述方法的结合。因为在清语音中有很少的能量损失,所以活动的精确性也不和浊语音那样要求的很挑剔。
借助于浊音和清语音的可靠检测,实施例的算法可以被实现。再重复说一次,重述噪音去除算法不依赖于VAD如何获得输入,它仅仅取决于装置的精确性,特别是对浊语音是有用的。如果语音不被检测到,而是仅仅做些语音训练的话,相应的降噪声音数据就可能会失真。
通过四个通路来收集数据,一个用于MIC1,一个用于MIC2,另外两个用于检测与浊语音相关的人体组织运动的射频传感器。数据在40kHz同步采样,接着进行数字滤波和分频至8kHz。采用较高的采样率的原因是为了减少信号从数字到模拟转化过程的任何混淆。一个四通路的NI的A/D采集板和一起捕获和存储数据。然后用一个C程序读入数据进行一次10毫秒的降噪处理。
图6示出一实施例的除噪算法的结果,该实施例为一个美式英语发音的女性在存在飞机场终端噪音时情况,噪音包括许多其他人的声音和公众呼告。发音者在适度的机场终端噪声中度水平发音数目为“406-5562”。原始语音数据进行10毫秒一次的降噪处理,在进行10秒降噪之前,先进行从50Hz到3700Hz的预滤波。噪音明显降低了大约是17dB。因为没有对采样信号做任何的后滤波,所以所有的噪音减少都是系统降噪算法完成的。很明显,这个算法根据噪声立即做出调整,能够去除其他说话人的各种噪声。已经在许多类型的噪音上实验得到了类似的试验结果,这些噪音包括街道噪音、直升机、音乐和正弦波,等等。同样,噪声源的方向也可以做相应改变,对系统噪音抑止效果没有什么影响。最后,降噪后的语音失真率很低,对机器或者人的接收者等确保良好的语音辨认性。
已经示出实施例的噪音去除算法任何环境条件下是可行的。如果一个好的评估一直由
Figure A0181292400202
组成,那么噪音的类型和量是无关紧要的。如果用户的环境里面有回音,如果来自一个噪音源它们就可以被补偿。如果信号回音也存在,它们将影响降噪处理过的信号,但是在大多数场合,效果应该是可忽略的。
这里参考图描述了各种实施例,但是详细的描述和图表并不给予限定。这里虽然没有给出描述的各种单元组合,但是它们在下面的权利要求中所限定的发明范围内。

Claims (28)

1.一种从语音信号中去除噪声的方法,包括:
接收多个声音信号;
接收与人的发音活动相联系的生理信息;
依据确定来自多个声音信号中的声音信息缺乏至少一个特定的时间段,产生至少一个多数语音信号的第一传递函数代表;
依据确定在多个声音信号中的声音信息存在至少一个特定的时间段,产生至少一个多个语音信号的一第二传递函数代表;
用至少一个第一传递函数和至少一个第二传递函数的至少一个合成从多个声音信号中去除噪音以产生至少一个降噪数据流。
2.根据权利要求1所述的方法,其中,多数语音信号包括至少一个相关噪声源信号的至少一个反射和至少一个语音信号源的至少一个反射。
3.根据权利要求1所述的方法,其中,接收生理信息包括使用至少一个检测器接收与人的发音相关的生理数据,该检测器选自包括射频装置、声带振动测量器、超声设备、语音嗓音麦克风和气流检测器的一组中。
4.根据权利要求1的方法,其中,接收多个语音信号包括使用多个独立定位的麦克风。
5.根据权利要求1的方法,其中,去除噪音还包括用至少一个第一传递函数和至少一个第二传递函数来产生至少一个第三传递函数。
6.根据权利要求1的方法,其中,产生至少一个第一传递函数包括在至少一个预先确定的时间段内重新计算至少一个第一传递函数。
7.根据权利要求1的方法,其中,产生至少一个第二传递函数包括在至少一个预先确定的时间段内重新计算至少一个第二传递函数。
8.根据权利要求1的方法,其中,产生至少一个第一传递函数和至少一个第二传递函数包括使用至少一种技术,该技术选自包括自适应技术和递归技术在内的一组中。
9.一种从电信号中去除噪声的方法,包括:
在至少一个时间段内检测浊音信息的缺失;
在至少一个时间段内接收至少一个噪声源信号;
产生至少一个噪声源信号的至少一个传递函数代表;
接收至少一个包括声音和噪声的复合信号;以及
用至少一个传递函数从至少一个复合信号中去除该噪音信号以产生至少一个降噪数据流。
10.根据权利要求9中的方法,其中,至少一个噪声源信号包括至少一个与噪音源信号相关的至少一个反射。
11.根据权利要求9的方法,其中,至少一个复合信号包括至少一个相关复合信号的至少一个反射。
12.根据权利要求9中的方法,其中,检测包括使用至少一个检测器收集与人的发音相关的生理数据,该检测器选自包括射频装置、声带振动测量器、超声设备、语音嗓音麦克风和气流检测器的一组中。
13.根据权利要求9的方法,其中,接收包括用至少一个麦克风来接收至少一个噪音源信号。
14.根据权利要求13的方法,其中,至少一个麦克风包括多个独立定位的麦克风。
15.根据权利要求9的方法,其中,用至少一个传递函数从至少一个复合信号中去除噪声信号包括:用至少一个传递函数产生至少另外一个传递函数。
16.根据权利要求9中的方法,其中,产生至少一个传递函数包括:在一个预先规定的时间间隔内重新计算至少一个传递函数。
17.根据权利要求9的方法,其中,产生至少一个传递函数包括:使用至少一种技术计算至少一个传递函数,该技术选自包括自适应技术和递归技术的一组中。
18.从电信号中去除噪声的方法包括:
确定至少一个清音周期,期间浊音信号缺失;
在至少一个清音周期内接收至少一个噪声信号输入并产生至少一个噪声信号的至少一个清音传递函数代表;
确定是否在至少一个浊音周期,期间存在浊音信息;
在至少一个发音周期内接收来自于至少一个信号探测装置的至少一个语音信号输入而且产生至少一个语音信号的至少一个语音传递函数代表;
接收至少一个包括语音和噪声的复合信号;
使用至少一个清音传递函数和至少一个浊音传递函数的至少一个组合从至少一个复合信号中去除噪音信号以产生至少一个降噪语音数据流。
19.一个从语音信号中去除噪音的系统,包括:
至少一个接收器,它接收至少一个语音信号;
至少一个传感器,接收与人的发音活动相关的生理信息;
至少一个处理器,该处理器耦合在至少一个接收器和至少一个产生多数传递函数的的传感器之间,其中产生至少一个声音信号的至少一个第一传递函数代表来响应在至少一个特定的时间周期内的至少一个声音信号缺乏语音信息的判定,其中产生至少一个声音信号的至少一个第二传递函数代表来响应在至少一个语音信号中存在声音信息至少一个特定时间周期的判定,其中使用至少一个第一传递函数和至少一个第二传递函数的组合从至少一个语音信号中去除噪音以产生至少一个降噪语音数据流。
20.根据权利要求19的系统,其中,至少一个传感器包括至少一个探测与人的语音相关的组织运动的射频(RF)干涉计。
21.根据权利要求19的系统,其中,至少一个传感器包括至少一个选自包括射频装置、声带振动测量器、超声设备、语音嗓音麦克风和气流检测器的一组中的传感器。
22.根据权利要求19的系统,还包括:
把至少一个语音信号的语音数据分成多个分波段;
使用至少一个第一传递函数和至少一个第二传递函数的至少一个组合传递函数来从每个多个分波段中去除噪音,其中产生多个降噪语音数据流;以及
把多个降噪语音数据流合成在一起产生至少一个降噪语音数据流。
23.根据权利要求19的系统,其中,至少一个接收器包括多个独立定位的麦克风。
24.一种从语音信号中去除噪声的系统,包括:至少一个处理器,该处理器耦合在至少一个麦克风和至少一个发声传感器之间,其中至少一个发声传感器收集与发声相关的生理数据,其中使用至少一个发声传感器在至少一个周期内来探测浊音信息的缺失,其中使用至少一个麦克风在至少一个周期内接收至少一个噪音源信号,其中至少一个处理器产生至少一个噪音源信号的至少一个传递函数代表,其中使用至少一个麦克风来接收至少一个包括语音和噪音源信号的复合信号,其中至少一个处理器使用至少一个传递函数从至少一个复合信号中去除该噪音信号以产生至少一个降噪语音数据流。
25.一个信号处理系统,耦合在至少一个使用者和至少一个电子设备之间,其中信号处理系统包括至少一个从语音信号中去除噪音的至少一个降噪子系统,降噪子系统包括至少一个处理器,该处理器耦合在至少一个接收器和至少一个传感器的处理器之间,其中耦合了至少一个接收器以接收至少一个语音信号,其中耦合了至少一个传感器以接收跟人的发声活动相关的生理信息,其中至少一个处理器产生多个传递函数,其中产生至少一个语音信号的至少一个第一传递函数代表来响应至少一个语音信号内缺失发声信息的至少一个特定的时间周期的判定,其中至少产生一个语音信号的至少一个第二传递函数代表来响应在至少一个语音信号内存在发声信息至少一个特定的时间周期的判定,其中使用至少一个第一传递函数和至少一个第二传递函数从至少一个语音信号中去除噪声来产生至少一个合成至少一个降噪数据流。
26.根据权利要求25中的信号处理系统,其中,至少一个电子装置包括至少一个选自一组的设备,该组包括移动电话、个人数字助理、便携式通讯设备、计算机、摄像机、数码相机和远程信息处理系统。
27.一个计算机可读介质包含可执行指令,在一个处理系统中执行该指令时,该指令从接收到的语音信号中去除噪声,使用的方法有:
接收至少一个语音信号;
接收跟人的语音活动相关的生理信息;
依据确定从至少一个语音信号的发声信息的缺失在至少一个特定的时间周期内产生至少一个语音信号的至少一个第一传递函数代表;
依据确定在至少一个语音信号中发声信息存在至少一个特定的时间周期内产生至少一个语音信号的至少一个第二传递函数代表;
使用至少一个第一传递函数和至少一个第二传递函数的至少一个组合从至少一个语音信号中去除噪声来产生至少一个降噪语音数据流。
28.一个电磁介质包括可执行指令,在一个处理系统中执行该指令时,该指令从接收到的语音信号中去除噪声,使用的方法有:
接收至少一个语音信号;
接收与人的语音活动相关的生理信息;
依据确定从至少一个语音信号的发声信息的缺失在至少一个特定的时间周期内产生至少一个语音信号的至少一个第一传递函数代表;
依据确定在至少一个语音信号中发声信息存在至少一个特定的时间周期内产生至少一个语音信号的至少一个第二传递函数代表;
使用至少一个第一传递函数和至少一个第二传递函数的至少一个组合从至少一个语音信号中去除噪声来产生至少一个降噪语音数据流。
CN01812924A 2000-07-19 2001-07-17 从电子信号中去除噪声的方法和仪器 Pending CN1443349A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US21929700P 2000-07-19 2000-07-19
US60/219,297 2000-07-19
US09/905,361 2001-07-12
US09/905,361 US20020039425A1 (en) 2000-07-19 2001-07-12 Method and apparatus for removing noise from electronic signals

Publications (1)

Publication Number Publication Date
CN1443349A true CN1443349A (zh) 2003-09-17

Family

ID=26913758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01812924A Pending CN1443349A (zh) 2000-07-19 2001-07-17 从电子信号中去除噪声的方法和仪器

Country Status (8)

Country Link
US (1) US20020039425A1 (zh)
EP (1) EP1301923A2 (zh)
JP (3) JP2004509362A (zh)
KR (1) KR20030076560A (zh)
CN (1) CN1443349A (zh)
AU (1) AU2001276955A1 (zh)
CA (1) CA2416926A1 (zh)
WO (1) WO2002007151A2 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1311421C (zh) * 2003-12-25 2007-04-18 株式会社Ntt都科摩 有声无声判定装置和有声无声判定方法
CN1322487C (zh) * 2004-01-28 2007-06-20 株式会社Ntt都科摩 有声无声判定装置和有声无声判定方法
CN102005207A (zh) * 2009-08-26 2011-04-06 奥迪康有限公司 校正二进掩模中的错误的方法
CN103794221A (zh) * 2012-10-26 2014-05-14 索尼公司 信号处理装置和方法以及程序
CN104717996A (zh) * 2012-08-22 2015-06-17 瑞思迈公司 具有语音检测的呼吸辅助系统
CN106569774A (zh) * 2016-11-11 2017-04-19 青岛海信移动通信技术股份有限公司 一种去除噪声的方法及终端
CN107165846A (zh) * 2016-03-07 2017-09-15 深圳市轻生活科技有限公司 一种语音控制智能风扇
CN111508512A (zh) * 2019-01-31 2020-08-07 哈曼贝克自动系统股份有限公司 语音信号中的摩擦音检测
CN112889110A (zh) * 2018-10-15 2021-06-01 索尼公司 音频信号处理装置及噪声抑制方法
CN113189414A (zh) * 2017-08-30 2021-07-30 亚德诺半导体无限责任公司 管理测量传感器的传递函数的确定

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8467543B2 (en) 2002-03-27 2013-06-18 Aliphcom Microphone and voice activity detection (VAD) configurations for use with communication systems
US8019091B2 (en) * 2000-07-19 2011-09-13 Aliphcom, Inc. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
US8280072B2 (en) 2003-03-27 2012-10-02 Aliphcom, Inc. Microphone array with rear venting
US20030179888A1 (en) * 2002-03-05 2003-09-25 Burnett Gregory C. Voice activity detection (VAD) devices and methods for use with noise suppression systems
US20070233479A1 (en) * 2002-05-30 2007-10-04 Burnett Gregory C Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors
US7246058B2 (en) 2001-05-30 2007-07-17 Aliph, Inc. Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors
WO2003058607A2 (en) * 2002-01-09 2003-07-17 Koninklijke Philips Electronics N.V. Audio enhancement system having a spectral power ratio dependent processor
AU2003263733A1 (en) * 2002-03-05 2003-11-11 Aliphcom Voice activity detection (vad) devices and methods for use with noise suppression systems
EP1555968B1 (en) 2002-10-17 2018-10-31 Rehabtronics Inc. Method and apparatus for controlling a device or process with vibrations generated by tooth clicks
TW200425763A (en) 2003-01-30 2004-11-16 Aliphcom Inc Acoustic vibration sensor
US9066186B2 (en) 2003-01-30 2015-06-23 Aliphcom Light-based detection for acoustic applications
US9099094B2 (en) 2003-03-27 2015-08-04 Aliphcom Microphone array with rear venting
KR100556365B1 (ko) * 2003-07-07 2006-03-03 엘지전자 주식회사 음성 인식장치 및 방법
US7516067B2 (en) * 2003-08-25 2009-04-07 Microsoft Corporation Method and apparatus using harmonic-model-based front end for robust speech recognition
US7424119B2 (en) * 2003-08-29 2008-09-09 Audio-Technica, U.S., Inc. Voice matching system for audio transducers
US7447630B2 (en) * 2003-11-26 2008-11-04 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7574008B2 (en) * 2004-09-17 2009-08-11 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7590529B2 (en) * 2005-02-04 2009-09-15 Microsoft Corporation Method and apparatus for reducing noise corruption from an alternative sensor signal during multi-sensory speech enhancement
US8180067B2 (en) * 2006-04-28 2012-05-15 Harman International Industries, Incorporated System for selectively extracting components of an audio input signal
US8036767B2 (en) * 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
US8213635B2 (en) * 2008-12-05 2012-07-03 Microsoft Corporation Keystroke sound suppression
KR101387195B1 (ko) * 2009-10-05 2014-04-21 하만인터내셔날인더스트리스인코포레이티드 오디오 신호의 공간 추출 시스템
CA2804638A1 (en) * 2010-07-15 2012-01-19 Aliph, Inc. Wireless conference call telephone
KR101500823B1 (ko) * 2010-11-25 2015-03-09 고어텍 인크 음성 향상 방법, 장치 및 노이즈 감소 통신 헤드셋
JP5561195B2 (ja) * 2011-02-07 2014-07-30 株式会社Jvcケンウッド ノイズ除去装置およびノイズ除去方法
EP3500337B1 (en) 2016-08-17 2021-04-14 Envoy Medical Corporation Implantable modular cochlear implant system with communication system and network
JP6729186B2 (ja) * 2016-08-30 2020-07-22 富士通株式会社 音声処理プログラム、音声処理方法及び音声処理装置
RU2680735C1 (ru) * 2018-10-15 2019-02-26 Акционерное общество "Концерн "Созвездие" Способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала
RU2700189C1 (ru) * 2019-01-16 2019-09-13 Акционерное общество "Концерн "Созвездие" Способ разделения речи и речеподобного шума путем анализа значений энергии и фаз частотных составляющих сигнала и шума
EP3927420B1 (en) 2019-02-21 2024-01-10 Envoy Medical Corporation Implantable cochlear system with integrated components and lead characterization
US11564046B2 (en) 2020-08-28 2023-01-24 Envoy Medical Corporation Programming of cochlear implant accessories
TW202226226A (zh) * 2020-10-27 2022-07-01 美商恩倍科微電子股份有限公司 具低複雜度語音活動檢測演算之設備及方法
US11790931B2 (en) 2020-10-27 2023-10-17 Ambiq Micro, Inc. Voice activity detection using zero crossing detection
US11471689B2 (en) 2020-12-02 2022-10-18 Envoy Medical Corporation Cochlear implant stimulation calibration
US11697019B2 (en) 2020-12-02 2023-07-11 Envoy Medical Corporation Combination hearing aid and cochlear implant system
US11806531B2 (en) 2020-12-02 2023-11-07 Envoy Medical Corporation Implantable cochlear system with inner ear sensor
US11633591B2 (en) 2021-02-23 2023-04-25 Envoy Medical Corporation Combination implant system with removable earplug sensor and implanted battery
US11839765B2 (en) 2021-02-23 2023-12-12 Envoy Medical Corporation Cochlear implant system with integrated signal analysis functionality
US11865339B2 (en) 2021-04-05 2024-01-09 Envoy Medical Corporation Cochlear implant system with electrode impedance diagnostics

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63278100A (ja) * 1987-04-30 1988-11-15 株式会社東芝 音声認識装置
JP3059753B2 (ja) * 1990-11-07 2000-07-04 三洋電機株式会社 雑音除去装置
JPH04184495A (ja) * 1990-11-20 1992-07-01 Seiko Epson Corp 音声認識装置
JP2995959B2 (ja) * 1991-10-25 1999-12-27 松下電器産業株式会社 収音装置
JPH05259928A (ja) * 1992-03-09 1993-10-08 Oki Electric Ind Co Ltd 適応制御ノイズキャンセラ装置及び適応制御ノイズキャンセル方法
JP3394998B2 (ja) * 1992-12-15 2003-04-07 株式会社リコー 音声入力システムの騒音除去装置
JP3250577B2 (ja) * 1992-12-15 2002-01-28 ソニー株式会社 適応信号処理装置
JP3171756B2 (ja) * 1994-08-18 2001-06-04 沖電気工業株式会社 ノイズ除去装置
JP3431696B2 (ja) * 1994-10-11 2003-07-28 シャープ株式会社 信号分離方法
JPH11164389A (ja) * 1997-11-26 1999-06-18 Matsushita Electric Ind Co Ltd 適応ノイズキャンセラ装置
JP3688879B2 (ja) * 1998-01-30 2005-08-31 株式会社東芝 画像認識装置、画像認識方法及びその記録媒体

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1311421C (zh) * 2003-12-25 2007-04-18 株式会社Ntt都科摩 有声无声判定装置和有声无声判定方法
CN1322487C (zh) * 2004-01-28 2007-06-20 株式会社Ntt都科摩 有声无声判定装置和有声无声判定方法
CN102005207A (zh) * 2009-08-26 2011-04-06 奥迪康有限公司 校正二进掩模中的错误的方法
CN102005207B (zh) * 2009-08-26 2015-05-20 奥迪康有限公司 校正二进掩模中的错误的方法
CN104717996A (zh) * 2012-08-22 2015-06-17 瑞思迈公司 具有语音检测的呼吸辅助系统
US10406310B2 (en) 2012-08-22 2019-09-10 Resmed Paris Sas Breathing assistance system with speech detection
CN103794221A (zh) * 2012-10-26 2014-05-14 索尼公司 信号处理装置和方法以及程序
CN103794221B (zh) * 2012-10-26 2017-07-14 索尼公司 信号处理装置和方法
CN107165846B (zh) * 2016-03-07 2019-01-18 深圳市轻生活科技有限公司 一种语音控制智能风扇
CN107165846A (zh) * 2016-03-07 2017-09-15 深圳市轻生活科技有限公司 一种语音控制智能风扇
CN106569774A (zh) * 2016-11-11 2017-04-19 青岛海信移动通信技术股份有限公司 一种去除噪声的方法及终端
CN106569774B (zh) * 2016-11-11 2020-07-10 青岛海信移动通信技术股份有限公司 一种去除噪声的方法及终端
CN113189414A (zh) * 2017-08-30 2021-07-30 亚德诺半导体无限责任公司 管理测量传感器的传递函数的确定
CN112889110A (zh) * 2018-10-15 2021-06-01 索尼公司 音频信号处理装置及噪声抑制方法
CN111508512A (zh) * 2019-01-31 2020-08-07 哈曼贝克自动系统股份有限公司 语音信号中的摩擦音检测

Also Published As

Publication number Publication date
JP2013178570A (ja) 2013-09-09
KR20030076560A (ko) 2003-09-26
JP2011203755A (ja) 2011-10-13
WO2002007151A2 (en) 2002-01-24
AU2001276955A1 (en) 2002-01-30
CA2416926A1 (en) 2002-01-24
WO2002007151A3 (en) 2002-05-30
JP2004509362A (ja) 2004-03-25
US20020039425A1 (en) 2002-04-04
EP1301923A2 (en) 2003-04-16

Similar Documents

Publication Publication Date Title
CN1443349A (zh) 从电子信号中去除噪声的方法和仪器
US9196261B2 (en) Voice activity detector (VAD)—based multiple-microphone acoustic noise suppression
McAulay et al. Speech enhancement using a soft-decision noise suppression filter
Tsoukalas et al. Speech enhancement based on audible noise suppression
RU2376722C2 (ru) Способ многосенсорного улучшения речи на мобильном ручном устройстве и мобильное ручное устройство
US7383178B2 (en) System and method for speech processing using independent component analysis under stability constraints
RU2595636C2 (ru) Система и способ для генерации аудиосигнала
CN101430882B (zh) 一种抑制风噪声的方法及装置
CN104424956B (zh) 激活音检测方法和装置
JP2011203759A (ja) 複数感知の音声強調のための方法および機器
Roman et al. Pitch-based monaural segregation of reverberant speech
US8423357B2 (en) System and method for biometric acoustic noise reduction
WO2012040577A1 (en) Systems and methods for multiple pitch tracking
KR100936093B1 (ko) 전자 신호로부터의 잡음 제거 방법 및 장치
CN106297795B (zh) 语音识别方法及装置
US20030128848A1 (en) Method and apparatus for removing noise from electronic signals
McLoughlin Super-audible voice activity detection
CN109243495A (zh) 语音检测方法及装置
TW201506915A (zh) 針對空間中多音源進行萃取出單一音源的方法及裝置
EP2063420A1 (en) Method and assembly to enhance the intelligibility of speech
Liu et al. Phase Spectrum Recovery for Enhancing Low-Quality Speech Captured by Laser Microphones
Ottaviani et al. Separation of speech signal from complex auditory scenes
US20130226568A1 (en) Audio signals by estimations and use of human voice attributes
JP2004258422A (ja) 音源情報を用いた音源分離・抽出方法および装置
張詩銘 et al. Statistical Signal Processing Approaches to Analysis and Synthesis of Bone-Conducted Speech

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication