CN102779524B - 噪声估计的设备和方法以及使用该设备和方法的降噪设备 - Google Patents
噪声估计的设备和方法以及使用该设备和方法的降噪设备 Download PDFInfo
- Publication number
- CN102779524B CN102779524B CN201210251379.4A CN201210251379A CN102779524B CN 102779524 B CN102779524 B CN 102779524B CN 201210251379 A CN201210251379 A CN 201210251379A CN 102779524 B CN102779524 B CN 102779524B
- Authority
- CN
- China
- Prior art keywords
- sound signal
- signal
- noise
- target sound
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 title abstract description 28
- 230000005236 sound signal Effects 0.000 claims abstract description 182
- 230000000903 blocking effect Effects 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 3
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 206010038743 Restlessness Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
提供了一种噪声估计的设备和方法以及使用该设备和方法的降噪设备。噪声估计设备通过阻止接收的音频信号中的来自目标声音源的方向的音频信号来估计噪声,并补偿来自目标声音阻止器的方向性增益的失真,所述目标声音阻止器阻止来自目标声音源的音频信号。
Description
本申请是申请日为2009年9月29日、申请号为200910177314.8、题为“噪声估计的设备和方法以及使用该设备和方法的降噪设备”的专利申请的分案申请。
本申请要求于2008年10月10日在韩国知识产权局提交的10-2008-0099699号韩国专利申请的利益,该申请全部公开于此以资参考。
技术领域
以下描述涉及音频信号处理,更具体地,涉及一种用于噪声估计的设备和方法以及使用该设备和方法的降噪设备。
背景技术
使用诸如移动电话的通信终端的语音电话不能保证噪声环境中的高语音质量。为了提高噪声环境中的语音质量,需要一种估计背景噪声分量以仅提取实际语音信号的技术。
随着技术的发展,出现了用于响应于语音来操作或者存储音频数据的各种终端(诸如,便携式摄像机、笔记本PC、导航系统、游戏机等)的基于语音的应用。因此,迫切需要一种用于降低或清除背景噪声以提取高质量语音的技术。
已经提出了用于估计或降低背景噪声的各种方法。然而,由于随时间改变的噪声的统计特征或在用于更新噪声的统计特征的初始操作时产生无法预期的偶发噪声而难以获得期望的噪声降低或清除性能。
发明内容
根据一个总体方面,提供了一种噪声估计设备,包括:音频输入单元,从多个方向接收音频信号并将音频信号变换为频域信号;目标声音阻止器,阻止来自目标声音源方向的音频信号;补偿器,补偿来自目标声音阻止器的方向性增益的失真。
音频输入单元可包括彼此距离1cm到8cm的两个相邻的话筒,并且音频输入单元将通过两个话筒接收的音频信号变换为频域信号。
目标声音阻止器可通过计算经由两个话筒接收的音频信号之间的差来阻止来自目标声音源的声音信号。
补偿器可基于来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重,并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。
噪声估计设备还可包括:目标声音检测器,检测来自目标声音源的音频信号,在来自目标声音源的音频信号未被检测到的部分,计算与在所述部分中接收的音频信号的数量的比率相应的尺度系数,所述部分与补偿器估计的噪声分量相关,其中,补偿器将估计的噪声分量乘以尺度系数。
可在来自目标声音源的音频信号未被检测的部分计算和更新尺度系数,在来自目标声音源的音频信号被检测到的部分,可使用先前计算的尺度系数。
噪声估计设备还可包括:增益校准器,对所述两个话筒进行校准以均衡所述两个话筒的增益。
目标声音阻止器可输出来自目标声音源的音频信号被阻止的音频信号。
根据另一方面,提供了一种降噪设备,包括:噪声估计器,被配置为从多个方向接收音频信号,将音频信号变换为频域信号,阻止频域信号中的来自目标声音源的方向的音频信号,并补偿来自目标声音源的音频信号被阻止的音频信号的增益失真,从而估计噪声分量;降噪滤波器,使用基于估计的噪声分量计算的滤波器系数来去除由噪声估计器估计的噪声分量。
噪声估计器可包括彼此距离1cm到8cm的两个相邻的话筒,噪声估计器可将通过两个相邻话筒接收的音频信号变换为频域信号,计算频域信号之差来阻止来自目标声音源的声音信号,使用来自目标声音源的音频信号被阻止的音频信号的平均值计算来自目标声音源的音频信号被阻止的音频信号的权重,并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。
根据另一方面,提供了一种噪声估计设备的噪声估计方法,所述方法包括:从多个方向接收音频信号并将音频信号变换为频域信号;阻止频域信号中的来自目标声音源的方向的音频信号;补偿来自目标声音源的音频信号被阻止的音频信号的增益失真。
接收音频信号的步骤可包括:使用彼此距离1cm到8cm的两个相邻的话筒接收音频信号,阻止音频信号的步骤可包括:通过计算经由两个话筒接收的音频信号之差来阻止来自目标声音源的声音信号。
补偿的步骤可包括:使用来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重,并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。
补偿的步骤可包括:检测来自目标声音源的音频信号,在来自目标声音源的音频信号未被检测到的部分,计算与在所述部分中接收的音频信号的数量的比率相应的尺度系数,所述部分与先前计算的噪声分量相关。
可在来自目标声音源的音频信号未被检测到的部分计算和更新尺度系数,在来自目标声音源的音频信号被检测到的部分,可使用先前计算的尺度系数。
噪声估计设备可包括两个话筒,所述方法还包括对所述两个话筒进行校准以均衡所述两个话筒的增益,接收音频信号的步骤可包括使用校准的两个话筒接收音频信号。
根据另一方面,提供了一种用于降噪的设备,包括:音频输入单元,具有从多个方向接收音频信号的多个话筒并将音频信号变换为频域信号;目标声音阻止器,通过计算经由多个话筒接收的音频信号之间的差来阻止频域信号中的来自目标声音源的方向的音频信号,并输出来自目标声音源的音频信号被阻止的音频信号;降噪单元,去除来自目标声音源的音频信号被阻止的音频信号,以输出来自目标声音源的音频信号。
降噪单元可以是使用基于来自目标声音源的音频信号被阻止的音频信号确定的滤波器系数来去除来自目标声音源的音频信号被阻止的音频信号的滤波器。
所述设备还可包括:补偿器,补偿来自目标声音阻止器的方向性增益的失真。
补偿器可基于来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重,并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。
所述设备还可包括:目标声音检测器,检测来自目标声音源的音频信号,在来自目标声音源的音频信号未被检测到的部分,计算与在所述部分中接收的音频信号的数量的比率相应的尺度系数,所述部分与补偿器估计的噪声分量相关,其中,补偿器将估计的噪声分量乘以尺度系数。
可在来自目标声音源的音频信号未被检测到的部分计算和更新尺度系数,在来自目标声音源的音频信号被检测到的部分,可使用先前计算的尺度系数。
所述设备还可包括:增益校准器,对所述多个话筒进行校准以均衡所述多个话筒的增益。
通过以下详细的描述、附图和权利要求,其它特点和方面将变得清楚。
附图说明
图1是示出示例性噪声估计设备的框图。
图2是示出声音源与图1的噪声估计设备的话筒阵列的布置之间的位置关系的示图。
图3是示出由图1的噪声估计设备的目标声音阻止器获得的方向性模式的图表。
图4是示出具有目标声音检测器的另一示例性噪声估计设备的框图。
图5是示出具有增益校准器的另一示例性噪声估计设备的框图。
图6是示出具有噪声估计器的示例性降噪设备的框图。
图7是示出示例性噪声估计方法的流程图。
在整个附图和详细描述中,除非另外描述,否则相同的附图标号将被理解为表示相同的元件、特征和结构。出于简明、示例和方便的目的可夸大这些元件的相对大小和叙述。
具体实施方式
提供以下描述以助于读者获得在此描述的方法、设备和/或系统的全面理解。因此,各种改变、修改和在此描述的系统、设备和/或方法的等同物将被建议给本领域的普通技术人员。另外,为了清楚和简明会省略已知功能和构建的描述。
图1是示出示例性噪声估计设备的框图。
如图1中所示,噪声估计设备100包括音频输入单元110、目标声音阻止器120和补偿器130。
音频输入单元110从多个方向接收音频信号并将音频信号变换为频域信号。目标声音阻止器120阻止来自目标声音源的方向的音频信号。补偿器130补偿来自目标声音阻止器120的增益失真。
如一个示例,音频输入单元110包括彼此相邻的两个话筒(未示出),并且音频输入单元110将通过话筒接收的音频信号变换为频域信号。例如,变换可以是傅里叶变换。将参照图2对包括话筒的布置和数量、目标声音源的位置以及噪声源的位置的更多示例性细节进行描述。
在具有两个话筒的音频输入单元110的示例中,目标声音阻止器120通过计算经由两个话筒接收的音频信号之差来阻止目标声音。例如,用于从多个方向接收音频信号两个全向话筒被以预定距离(例如,1cm)分离放置,从而阻止例如来自产生目标声音的正前方向的音频信号,并接收来自其它方向的音频信号。
例如,两个话筒之间的距离可以从1cm到8cm。如果两个话筒之间的距离小于1cm,则会减少来自多个方向的所有音频信号。如果两个话筒之间的距离大于8cm,则会阻止除了来自目标源的方向的音频信号之外的来自多个方向的音频信号。
如所示的,可通过等式1计算由话筒接收的音频信号的频率变换的值S1(f)和S2(f)、目标声音被阻止的音频信号的频率变换的值B(f):
B(f)=w1(f)·S1(f)+w2(f)·S2(f) [等式1]
其中,w1(f)和w2(f)是用于阻止目标声音的参数并可通过过度(undue)的实验被合适地设置。例如,其中,w1(f)和w2(f)被分别设置为+1和-1,目标声音被阻止的音频信号的频率变换的值B(f)变为由话筒接收的音频信号的频率变换的值S1(f)和S2(f)之间的差。
其中,w1(f)和w2(f)被分别设置为+1和-1,由于从两个话筒的正前方向,也就是从目标声音源的方向接收的音频信号理想地相同,并且从其它方向接收的音频信号彼此不同,故仅有从两个话筒的正前方向接收的音频信号理想地成为零。因此,从正前方向接收的目标声音可被阻止。
目标声音被阻止的音频信号可以是噪声分量。然而,从目标声音阻止器120输出的音频信号的频率特征可根据例如话筒阵列口径大小、话筒的数量等而显著地改变。因此,为了在噪声估计中减小误差,补偿器130可被用于基于目标声音被阻止的音频信号的平均值来计算权重,并将音频信号分别乘以相应的权重。
可通过等式2计算目标声音被阻止的音频信号的通过目标声音阻止器120获得的方向性模式D(f,φ):
其中,N表示话筒的数量,d表示话筒之间的距离,φ表示方向,f表示频率,wn(f)表示相对于位于坐标n的话筒的权重,其中,所述权重与等式1中的用于阻止目标的参数相关。例如,如果话筒的数量是两个,则w-0.5(f)和w0.5(f)分别是+1和-1。
补偿器130接收目标声音被阻止的通过等式1计算的音频信号B(f),并将音频信号B(f)乘以相应的权重,从而实时估计噪声分量。可通过等式3计算权重:
其中,α是作为全局尺度系数的常数,被应用到所有频率分量以调节权重。可通过过度的实验获得α的值。
结果,可通过等式4写出由补偿器130估计的噪声分量:
如等式4中所示,可不使用先前帧的噪声信息来估计当前帧的噪声,并且可不管目标声音的方向来实时估计方向噪声的存在和数量。
已经为了说明性的目的描述了具有两个话筒的示例性实施例。因此,应该理解话筒的数量可以不是两个。例如,噪声估计设备的音频输入单元可具有三个或更多个话筒。基于话筒的数量,可选择参数w的合适的组合用于阻止从目标声音源的方向接收的音频信号。
图2是示出声音源220和声音源230-1到230-n与图1的噪声估计设备100的话筒阵列210的布置之间的位置关系的示图。
如所示出的,例如,组成话筒阵列210的话筒是彼此相邻的,并且,例如,目标声音源220位于话筒阵列210的前方(垂直向上/向下),从而音频信号被输入到话筒阵列210。输入到话筒阵列210的音频信号被传送到降噪设备240以执行噪声估计和降噪。
降噪设备240通过例如以上参照图1描述的目标声音阻止方法来阻止从目标声音源220接收的音频信号,并提取从位于除声音源220所在方向以外的方向的噪声源230-1、230-2、...、230-n接收的噪声信号。
图3是示出由图1的噪声估计设备100的目标声音阻止器120获得的示例性方向性模式。
参照图2,在示图中示出,话筒阵列210与目标声音源220之间的角度是90°。参照图3,以目标声音被接收的90°的角度接收的所有频带具有大约零的增益。也就是说,以90°的角度接收的目标声音被阻止,声音源的角度的从90°偏离越大,增益就越大。增益取决于频带。例如,高频分量的增益较大,低频分量的增益较小。
同时,方向性模式可取决于目标声音阻止器120。
如图3中所示,根据噪声的方向的方向性模式的增益差在较高频率变得更大。因此,由补偿器130(见图1)计算的权重w(f)可被用于对方向性模式的增益取平均。
图4是示出具有目标声音检测器410的另一示例性噪声估计设备400的框图。
目标声音检测器410检测目标声音的存在与否,在目标声音未被检测到的部分,也就是,在噪声部分,计算与在噪声部分中接收的音频信号的数量的比率相应的尺度系数,并将尺度系数提供给补偿器420,所述噪声部分与补偿器420计算的噪声分量相关。随后估计噪声分量,补偿器420将先前计算的噪声分量乘以由目标声音检测器410计算的尺度系数。
虽然如上所述补偿器420使用平均值补偿方向应模式的增益,但是补偿器420不能在所有频率正确地补偿噪声信号的方向性。因此,在假设噪声的方向不由于噪声的特性随着时间改变而急剧地变化的情况下,示例性噪声估计设备400在未检测到目标声音的无声部分根据噪声的方向补偿增益的变化。也就是说,在目标声音检测器410检测目标声音不存在的噪声部分,通过计算在噪声部分中接收的噪声信号的数量的比率来调节先前估计的噪声,所述噪声部分与通过等式4计算的噪声信号相关。
可通过等式5计算比率,也就是,局部尺度系数β(f):
由于可以以帧为单位来执行频域中的估计的噪声值的计算,故等式5可重新写为包括帧信息的等式6:
[等式6]
也就是说,局部尺度系数β(f)被在未检测到目标声音的部分重新计算和更新,在检测到目标声音的部分,先前局部尺度系数被使用。在等式6中,γ是更新率,随着γ逼近1,目标声音检测器410对输入噪声中的改变响应更快,随着γ逼近0,目标声音检测器410对突发误差的响应具有较小的灵敏度。因此,可通过等式7计算反映局部尺度系数β(f)的从补偿器420输出的估计的噪声值:
应该理解,可将一般语音激活检测方法用于目标声音检测器410,因此,为了简明的目的省略对其进一步描述。还应该理解,各种已知或将被得知的方法可用于检测目标声音。
图5是示出具有增益校准器510的另一示例性噪声估计设备500的框图。
增益校准器510对例如被输入目标声音的两个话筒进行校准,以均衡所述两个话筒的增益。一般地,由于制造处理中的误差,根据标准制造的不同的话筒可具有不同的增益。如果两个话筒具有增益差,则目标声音阻止器120不能正确地阻止目标声音。因此,可在通过话筒接收音频信号之前执行增益校准。
增益校准可被执行一次。然而,由于增益可取决于诸如温度或适度的环境因素,故还可以以有规律的时间间隔执行增益校准。应该理解,可使用一般增益校准方法,因此,为了简明的目的省略对其进一步描述。
图6是示出具有噪声估计器的示例性降噪设备600的框图。
参照图6,降噪设备600包括噪声估计器610和降噪滤波器620。
噪声估计器610可执行上述参照图1到图5描述的噪声估计。例如,为了估计噪声,噪声估计器610从多个方向接收音频信号并将音频信号变换为频域信号,阻止频域信号中的来自将被检测的目标声音源的方向的音频信号,并补偿目标声音被阻止的结果音频信号的增益失真。
噪声估计器610将通过例如两个相邻话筒接收的音频信号变换为频域信号,计算频域信号之差以阻止目标声音,使用目标声音被阻止的音频信号的平均值来计算音频信号的权重,并将目标声音被阻止的音频信号乘以相应的权重,从而估计噪声分量。
可基于使用估计的噪声分量计算的滤波器参数来设计降噪滤波器620。降噪滤波器620可以是各种滤波器中的一种,诸如谱减法、维纳滤波器、振幅估计器等。
图7是示出示例性噪声估计方法的流程图。应该理解上述的示例性噪声估计设备可执行所述方法。
在操作S710,从多个方向接收音频信号并将音频信号变换为频域信号。
在操作S720,阻止频域信号中的来自将被检测的目标声音源的方向的音频信号。例如,通过计算经由例如两个相邻话筒接收的音频信号之差,可仅阻止目标声音。
在操作S730,补偿来自目标声音阻止器的方向性增益的失真。例如,基于目标声音被阻止的音频信号的平均值来计算音频信号的权重,并将音频信号乘以相应的权重,从而估计噪声分量。为了估计噪声分量,可检测目标声音的存在与否,在目标声音未被检测到的部分,可计算与先前估计的噪声分量相关的输入音频信号的数量的比率(尺度系数),并可将先前估计的噪声分量乘以尺度系数。
尺度系数可以是如上所述的局部尺度系数。局部尺度系数可被在未检测到目标声音的部分重新计算和更新,在检测到目标声音的部分,可原样使用先前尺度系数。
在操作S730,可补偿从目标声音阻止器的方向性增益起源的谱失真。
为了均衡话筒的增益,可在接收音频信号的操作S710之前校准话筒。
根据如上所述的示例,由于能够估计随时间改变的非平稳噪声,故可在接收音频或语音的各种设备中提高音频或语音质量以及音频或语音识别性能。
如一个示例,上述的示例性噪声估计可被应用到诸如移动电话的通信终端以提高音频或语音质量。由于可在所有频域上以及存在音频或语音的部分一致地执行噪声估计,故有效或提高的噪声估计是可能的。
根据上述的示例,提供了一种通过阻止目标声音来估计非平稳噪声的设备和方法,以及使用所述设备和方法的降噪设备。
应该理解在此使用的术语在其它申请或当被该领域中的另一普通技术人员描述时可以不同。例如,“降”噪滤波器或“降”噪设备还可分别被称为“除”噪滤波器或“除”噪设备。此外,对于所述的被阻止的目标声音,应该理解,例如由于话筒的增益不匹配,目标声音阻止器可以不“完全”阻止目标声音。
上述的方法可被记录、存储或安装在包括由计算机实施以引起处理器执行程序指令的所述程序指令的一个或多个计算机可读介质中。介质还可包括程序指令、数据文件、数据结构等的单个或组合。计算机可读介质的示例包括:磁性介质,诸如硬盘、软盘和磁带;光学介质,诸如CD-ROM盘和DVD;磁光介质,诸如光盘;被具体配置为存储和执行程序指令的硬件装置,诸如只读存储器(ROM)、随机访问存储器(RAM)、闪存等。程序指令的示例包括:机器码,诸如由编译器产生的;文件,包含可被计算机使用解释器执行的更高级代码。所述硬件装置可被配置以作为一个或更多个软件模块,以执行上述的操作和方法,反之亦然。
上面已经描述了一些示例性实施例。然而,应该理解,可做出各种修改。例如,如果所述技术被以不同的顺序执行和/或如果上述系统、结构、装置或电路中的组件被以不同的方式组合和/或被其它组件或它们的等同物替代或补充,则可获得相配的结果。因此,其它实施落入权利要求的范围内。
Claims (13)
1.一种噪声估计设备,包括:
音频输入单元,从多个方向接收音频信号并将音频信号变换为频域信号;
目标声音阻止器,阻止来自目标声音源方向的音频信号;和
补偿器,补偿来自目标声音阻止器的方向性增益的失真,
其中,补偿器基于来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重,并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。
2.如权利要求1所述的噪声估计设备,其中,音频输入单元包括彼此距离1cm到8cm的两个相邻的话筒,并且音频输入单元将通过两个话筒接收的音频信号变换为频域信号。
3.如权利要求2所述的噪声估计设备,其中,目标声音阻止器通过计算经由两个话筒接收的音频信号之间的差来阻止来自目标声音源的声音信号。
4.如权利要求1所述的噪声估计设备,还包括:目标声音检测器,检测来自目标声音源的音频信号,在来自目标声音源的音频信号未被检测到的部分,计算与在所述部分中接收的音频信号的数量相比于补偿器估计的噪声分量的比率相应的尺度系数,
其中,补偿器将估计的噪声分量乘以尺度系数。
5.如权利要求4所述的噪声估计设备,其中,在来自目标声音源的音频信号未被检测到的部分计算和更新尺度系数,在来自目标声音源的音频信号被检测到的部分,使用先前计算的尺度系数。
6.如权利要求2所述的噪声估计设备,还包括:增益校准器,对所述两个话筒进行校准以均衡所述两个话筒的增益。
7.如权利要求1所述的噪声估计设备,其中,目标声音阻止器输出来自目标声音源的音频信号被阻止的音频信号。
8.一种降噪设备,包括:
噪声估计器,被配置为从多个方向接收音频信号,将音频信号变换为频域信号,阻止频域信号中的来自目标声音源的方向的音频信号,并补偿来自目标声音源的音频信号被阻止的音频信号的增益失真,从而估计噪声分量;
以及
降噪滤波器,使用基于估计的噪声分量计算的滤波器系数来去除由噪声估计器估计的噪声分量,
其中,噪声估计器使用来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重,并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。
9.如权利要求8所述的降噪设备,其中,
噪声估计器包括彼此距离1cm到8cm的两个相邻的话筒,以及
噪声估计器将通过两个相邻话筒接收的音频信号变换为频域信号,计算频域信号之差来阻止来自目标声音源的声音信号。
10.一种用于降噪的设备,包括:
音频输入单元,具有从多个方向接收音频信号的多个话筒并将音频信号变换为频域信号;
目标声音阻止器,通过计算经由多个话筒接收的音频信号之差来阻止频域信号中的来自目标声音源的方向的音频信号,并输出来自目标声音源的音频信号被阻止的音频信号;
补偿器,补偿来自目标声音阻止器的方向性增益的失真;
降噪单元,去除来自目标声音源的音频信号被阻止的音频信号,以输出来自目标声音源的音频信号;以及
增益校准器,对所述多个话筒进行校准以均衡所述多个话筒的增益,
其中,补偿器基于来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重,并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。
11.如权利要求10所述的设备,其中,降噪单元是使用基于来自目标声音源的音频信号被阻止的音频信号确定的滤波器系数来去除来自目标声音源的音频信号被阻止的音频信号的滤波器。
12.如权利要求10所述的设备,还包括:目标声音检测器,检测来自目标声音源的音频信号,在来自目标声音源的音频信号未被检测到的部分,计算与在所述部分中接收的音频信号的数量相比于补偿器估计的噪声分量的比率相应的尺度系数,
其中,补偿器将估计的噪声分量乘以尺度系数。
13.如权利要求12所述的设备,其中,在来自目标声音源的音频信号未被检测的部分计算和更新尺度系数,在来自目标声音源的音频信号被检测到的部分,使用先前计算的尺度系数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2008-0099699 | 2008-10-10 | ||
KR20080099699 | 2008-10-10 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910177314A Division CN101727909A (zh) | 2008-10-10 | 2009-09-29 | 噪声估计的设备和方法以及使用该设备和方法的降噪设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102779524A CN102779524A (zh) | 2012-11-14 |
CN102779524B true CN102779524B (zh) | 2015-01-07 |
Family
ID=41403885
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210251379.4A Expired - Fee Related CN102779524B (zh) | 2008-10-10 | 2009-09-29 | 噪声估计的设备和方法以及使用该设备和方法的降噪设备 |
CN201410432952.0A Pending CN104269179A (zh) | 2008-10-10 | 2009-09-29 | 噪声估计的设备和方法以及使用该设备和方法的降噪设备 |
CN200910177314A Pending CN101727909A (zh) | 2008-10-10 | 2009-09-29 | 噪声估计的设备和方法以及使用该设备和方法的降噪设备 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410432952.0A Pending CN104269179A (zh) | 2008-10-10 | 2009-09-29 | 噪声估计的设备和方法以及使用该设备和方法的降噪设备 |
CN200910177314A Pending CN101727909A (zh) | 2008-10-10 | 2009-09-29 | 噪声估计的设备和方法以及使用该设备和方法的降噪设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9159335B2 (zh) |
EP (1) | EP2175446A3 (zh) |
JP (1) | JP5805365B2 (zh) |
KR (1) | KR101597752B1 (zh) |
CN (3) | CN102779524B (zh) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101291672B1 (ko) | 2007-03-07 | 2013-08-01 | 삼성전자주식회사 | 노이즈 신호 부호화 및 복호화 장치 및 방법 |
JP5573517B2 (ja) * | 2010-09-07 | 2014-08-20 | ソニー株式会社 | 雑音除去装置および雑音除去方法 |
KR101176207B1 (ko) * | 2010-10-18 | 2012-08-28 | (주)트란소노 | 음성통신 시스템 및 음성통신 방법 |
US10218327B2 (en) * | 2011-01-10 | 2019-02-26 | Zhinian Jing | Dynamic enhancement of audio (DAE) in headset systems |
US9538286B2 (en) * | 2011-02-10 | 2017-01-03 | Dolby International Ab | Spatial adaptation in multi-microphone sound capture |
KR101226493B1 (ko) * | 2011-02-15 | 2013-01-25 | 주식회사 파워챔프 | 반복 신호를 이용한 노이즈 백색화 수신기 |
GB2493327B (en) * | 2011-07-05 | 2018-06-06 | Skype | Processing audio signals |
GB2495278A (en) * | 2011-09-30 | 2013-04-10 | Skype | Processing received signals from a range of receiving angles to reduce interference |
GB2495128B (en) | 2011-09-30 | 2018-04-04 | Skype | Processing signals |
GB2495129B (en) | 2011-09-30 | 2017-07-19 | Skype | Processing signals |
GB2495131A (en) | 2011-09-30 | 2013-04-03 | Skype | A mobile device includes a received-signal beamformer that adapts to motion of the mobile device |
GB2495472B (en) | 2011-09-30 | 2019-07-03 | Skype | Processing audio signals |
KR101888426B1 (ko) * | 2011-10-18 | 2018-08-17 | 엘지디스플레이 주식회사 | 노이즈 제거회로를 이용한 표시장치 및 비디오 시스템 |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
GB201120392D0 (en) | 2011-11-25 | 2012-01-11 | Skype Ltd | Processing signals |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
EP2747081A1 (en) * | 2012-12-18 | 2014-06-25 | Oticon A/s | An audio processing device comprising artifact reduction |
JP2016515342A (ja) | 2013-03-12 | 2016-05-26 | ヒア アイピー ピーティーワイ リミテッド | ノイズ低減法、およびシステム |
KR101312451B1 (ko) * | 2013-04-05 | 2013-09-27 | 주식회사 시그테크 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
US10037765B2 (en) | 2013-10-08 | 2018-07-31 | Samsung Electronics Co., Ltd. | Apparatus and method of reducing noise and audio playing apparatus with non-magnet speaker |
JP6337519B2 (ja) * | 2014-03-03 | 2018-06-06 | 富士通株式会社 | 音声処理装置、雑音抑圧方法、およびプログラム |
CN105469786A (zh) * | 2014-08-22 | 2016-04-06 | 中兴通讯股份有限公司 | 语音识别的控制方法和装置 |
CN105590631B (zh) * | 2014-11-14 | 2020-04-07 | 中兴通讯股份有限公司 | 信号处理的方法及装置 |
US10257240B2 (en) * | 2014-11-18 | 2019-04-09 | Cisco Technology, Inc. | Online meeting computer with improved noise management logic |
JP6638248B2 (ja) * | 2015-08-19 | 2020-01-29 | 沖電気工業株式会社 | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 |
DE112016007079T5 (de) * | 2016-07-21 | 2019-04-04 | Mitsubishi Electric Corporation | Störgeräuschbeseitigungseinrichtung, echolöscheinrichtung, anormales-geräusch-detektionseinrichtung und störgeräuschbeseitigungsverfahren |
CN108022595A (zh) * | 2016-10-28 | 2018-05-11 | 电信科学技术研究院 | 一种语音信号降噪方法和用户终端 |
CN106657508A (zh) * | 2016-11-30 | 2017-05-10 | 深圳天珑无线科技有限公司 | 一种实现双mic降噪的终端配件及终端组件 |
US10699727B2 (en) * | 2018-07-03 | 2020-06-30 | International Business Machines Corporation | Signal adaptive noise filter |
DE102018220600B4 (de) * | 2018-11-29 | 2020-08-20 | Robert Bosch Gmbh | Verfahren und Vorrichtung zum Detektieren von Partikeln |
US11817114B2 (en) | 2019-12-09 | 2023-11-14 | Dolby Laboratories Licensing Corporation | Content and environmentally aware environmental noise compensation |
US20220013127A1 (en) * | 2020-03-08 | 2022-01-13 | Certified Electronic Reporting Transcription Systems, Inc. | Electronic Speech to Text Court Reporting System For Generating Quick and Accurate Transcripts |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
CN1947171A (zh) * | 2004-04-28 | 2007-04-11 | 皇家飞利浦电子股份有限公司 | 自适应波束形成器、旁瓣抑制器、自动语音通信设备 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3194872B2 (ja) | 1996-10-15 | 2001-08-06 | 松下電器産業株式会社 | マイクロホン装置 |
JP4163294B2 (ja) | 1998-07-31 | 2008-10-08 | 株式会社東芝 | 雑音抑圧処理装置および雑音抑圧処理方法 |
JP3454206B2 (ja) | 1999-11-10 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP2002099297A (ja) | 2000-09-22 | 2002-04-05 | Tokai Rika Co Ltd | マイクロフォン装置 |
EP1202602B1 (en) * | 2000-10-25 | 2013-05-15 | Panasonic Corporation | Zoom microphone device |
EP2239733B1 (en) * | 2001-03-28 | 2019-08-21 | Mitsubishi Denki Kabushiki Kaisha | Noise suppression method |
US7171008B2 (en) * | 2002-02-05 | 2007-01-30 | Mh Acoustics, Llc | Reducing noise in audio systems |
JP2003271191A (ja) | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
US7139703B2 (en) * | 2002-04-05 | 2006-11-21 | Microsoft Corporation | Method of iterative noise estimation in a recursive framework |
US7613310B2 (en) | 2003-08-27 | 2009-11-03 | Sony Computer Entertainment Inc. | Audio input system |
JP4348706B2 (ja) | 2002-10-08 | 2009-10-21 | 日本電気株式会社 | アレイ装置および携帯端末 |
US7165026B2 (en) * | 2003-03-31 | 2007-01-16 | Microsoft Corporation | Method of noise estimation using incremental bayes learning |
JP4496378B2 (ja) | 2003-09-05 | 2010-07-07 | 財団法人北九州産業学術推進機構 | 定常雑音下における音声区間検出に基づく目的音声の復元方法 |
JP4496379B2 (ja) * | 2003-09-17 | 2010-07-07 | 財団法人北九州産業学術推進機構 | 分割スペクトル系列の振幅頻度分布の形状に基づく目的音声の復元方法 |
US7778425B2 (en) | 2003-12-24 | 2010-08-17 | Nokia Corporation | Method for generating noise references for generalized sidelobe canceling |
JP4162604B2 (ja) | 2004-01-08 | 2008-10-08 | 株式会社東芝 | 雑音抑圧装置及び雑音抑圧方法 |
JP2005286413A (ja) * | 2004-03-26 | 2005-10-13 | Toshiba Corp | ノイズ低減装置及びテレビジョン受像機 |
US7454332B2 (en) | 2004-06-15 | 2008-11-18 | Microsoft Corporation | Gain constrained noise suppression |
US20060013412A1 (en) * | 2004-07-16 | 2006-01-19 | Alexander Goldin | Method and system for reduction of noise in microphone signals |
US7533017B2 (en) * | 2004-08-31 | 2009-05-12 | Kitakyushu Foundation For The Advancement Of Industry, Science And Technology | Method for recovering target speech based on speech segment detection under a stationary noise |
JP4873913B2 (ja) * | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
JP4862656B2 (ja) | 2005-01-20 | 2012-01-25 | 日本電気株式会社 | 信号除去方法、信号除去システムおよび信号除去プログラム |
JP4551817B2 (ja) * | 2005-05-20 | 2010-09-29 | Okiセミコンダクタ株式会社 | ノイズレベル推定方法及びその装置 |
US7680656B2 (en) | 2005-06-28 | 2010-03-16 | Microsoft Corporation | Multi-sensory speech enhancement using a speech-state model |
US20070244698A1 (en) * | 2006-04-18 | 2007-10-18 | Dugger Jeffery D | Response-select null steering circuit |
KR100857467B1 (ko) | 2006-12-08 | 2008-09-08 | 한국전자통신연구원 | 잡음 모델을 이용한 순수 음성 추정 방법 |
US8275611B2 (en) * | 2007-01-18 | 2012-09-25 | Stmicroelectronics Asia Pacific Pte., Ltd. | Adaptive noise suppression for digital speech signals |
US20080175408A1 (en) * | 2007-01-20 | 2008-07-24 | Shridhar Mukund | Proximity filter |
JP2008236077A (ja) * | 2007-03-16 | 2008-10-02 | Kobe Steel Ltd | 目的音抽出装置,目的音抽出プログラム |
KR101434200B1 (ko) * | 2007-10-01 | 2014-08-26 | 삼성전자주식회사 | 혼합 사운드로부터의 음원 판별 방법 및 장치 |
-
2009
- 2009-09-10 KR KR1020090085511A patent/KR101597752B1/ko not_active IP Right Cessation
- 2009-09-10 US US12/557,347 patent/US9159335B2/en not_active Expired - Fee Related
- 2009-09-29 CN CN201210251379.4A patent/CN102779524B/zh not_active Expired - Fee Related
- 2009-09-29 CN CN201410432952.0A patent/CN104269179A/zh active Pending
- 2009-09-29 CN CN200910177314A patent/CN101727909A/zh active Pending
- 2009-10-06 EP EP09172293.4A patent/EP2175446A3/en not_active Withdrawn
- 2009-10-09 JP JP2009235217A patent/JP5805365B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1947171A (zh) * | 2004-04-28 | 2007-04-11 | 皇家飞利浦电子股份有限公司 | 自适应波束形成器、旁瓣抑制器、自动语音通信设备 |
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5805365B2 (ja) | 2015-11-04 |
JP2010092054A (ja) | 2010-04-22 |
US20100092000A1 (en) | 2010-04-15 |
CN104269179A (zh) | 2015-01-07 |
CN101727909A (zh) | 2010-06-09 |
EP2175446A3 (en) | 2014-11-12 |
KR20100040664A (ko) | 2010-04-20 |
EP2175446A2 (en) | 2010-04-14 |
US9159335B2 (en) | 2015-10-13 |
CN102779524A (zh) | 2012-11-14 |
KR101597752B1 (ko) | 2016-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102779524B (zh) | 噪声估计的设备和方法以及使用该设备和方法的降噪设备 | |
US9984702B2 (en) | Extraction of reverberant sound using microphone arrays | |
US10873814B2 (en) | Analysis of spatial metadata from multi-microphones having asymmetric geometry in devices | |
WO2019080553A1 (zh) | 基于麦克风阵列的目标语音获取方法及装置 | |
US7720679B2 (en) | Speech recognition apparatus, speech recognition apparatus and program thereof | |
US9584947B2 (en) | Optimized calibration of a multi-loudspeaker sound playback system | |
US9813833B1 (en) | Method and apparatus for output signal equalization between microphones | |
TWI558228B (zh) | 依據空間能量密度定位麥克風之設備及方法 | |
US8300846B2 (en) | Appratus and method for preventing noise | |
US20120099732A1 (en) | Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation | |
US20090129609A1 (en) | Method and apparatus for acquiring multi-channel sound by using microphone array | |
US11289109B2 (en) | Systems and methods for audio signal processing using spectral-spatial mask estimation | |
US8615392B1 (en) | Systems and methods for producing an acoustic field having a target spatial pattern | |
CN1751540B (zh) | 使用多通道信号控制再生单元的方法和装置 | |
US11580966B2 (en) | Pre-processing for automatic speech recognition | |
CN106646350A (zh) | 一种单只矢量水听器各通道幅度增益不一致时的修正方法 | |
CN106872945A (zh) | 声源定位方法、装置和电子设备 | |
US20230352044A1 (en) | Signal characteristic determinator, method for determining a signal characteristic, audio encoder and computer program | |
US11528556B2 (en) | Method and apparatus for output signal equalization between microphones | |
US20220030353A1 (en) | Flexible differential microphone arrays with fractional order | |
US11994605B2 (en) | Direction of arrival estimation device, system, and direction of arrival estimation method | |
US20020177998A1 (en) | Calibration of speech data acquisition path | |
CN112533120B (zh) | 基于带噪语音信号幅度谱动态压缩的波束形成方法及装置 | |
CN115862632A (zh) | 语音识别方法、装置、电子设备和存储介质 | |
CN110931038A (zh) | 一种语音增强方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150107 Termination date: 20180929 |
|
CF01 | Termination of patent right due to non-payment of annual fee |