CN106463106A - 用于音频接收的风噪声降低 - Google Patents
用于音频接收的风噪声降低 Download PDFInfo
- Publication number
- CN106463106A CN106463106A CN201580031921.7A CN201580031921A CN106463106A CN 106463106 A CN106463106 A CN 106463106A CN 201580031921 A CN201580031921 A CN 201580031921A CN 106463106 A CN106463106 A CN 106463106A
- Authority
- CN
- China
- Prior art keywords
- subband
- wind noise
- frequency
- noise
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 title abstract description 16
- 230000005236 sound signal Effects 0.000 claims abstract description 36
- 238000001914 filtration Methods 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 34
- 238000005070 sampling Methods 0.000 claims description 32
- 238000001228 spectrum Methods 0.000 claims description 19
- 230000003595 spectral effect Effects 0.000 claims description 14
- 238000004891 communication Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000009499 grossing Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 108091006146 Channels Proteins 0.000 description 5
- 230000009471 action Effects 0.000 description 5
- 230000002708 enhancing effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 102100029464 Aquaporin-9 Human genes 0.000 description 1
- 206010052804 Drug tolerance Diseases 0.000 description 1
- 101000771413 Homo sapiens Aquaporin-9 Proteins 0.000 description 1
- 101000921370 Homo sapiens Elongation of very long chain fatty acids protein 1 Proteins 0.000 description 1
- 241001597008 Nomeidae Species 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000026781 habituation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001256 tonic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/07—Mechanical or electrical reduction of wind noise generated by wind passing a microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Spectroscopy & Molecular Physics (AREA)
Abstract
描述了用于对设备中所接收的音频信号进行的风噪声降低。在一个实施例中,将音频信号分解为多个子带,该音频信号包括风噪声;对该多个子带中的第一子带进行低通滤波;从该第一子带中去除风噪声;并且在去除风噪声之后将该第一子带与其他子带组合。
Description
技术领域
本申请涉及音频处理领域,并且特别地涉及从所接收的音频信号中去除风噪声。
背景技术
许多不同的设备提供用于各种不同目的的麦克风。这些麦克风可以用于从用户那里接收要发送给用户其他设备的语音。麦克风可以用于记录语音备忘录以供本地或远程存储以及以后检索。麦克风可以用于对设备或对远程系统的语音命令,或者麦克风可以用于记录环境音频。许多设备还提供音频记录,并与相机一起提供视频记录。这些设备范围从便携式游戏控制台到智能手机到录音机到摄像机等。
当风或其他空气运动影响麦克风时,产生可能损害、淹没或使得音频信号的其余部分无法理解的噪声。可能导致声音记录令人不快,并且对于另一个人或自动化语音识别系统而言语音可能不可识别。虽然已经开发了用于抑制风噪声的材料和结构,但是这些通常都需要庞大或大型的外部麦克风,这对于许多设备而言可能是不切实际的、不方便的或不可能使用的。还存在基于软件的风噪声降低系统,其使用复杂算法来将风噪声与其他声音隔离,并且然后降低或消除风噪声。
风噪声降低技术往往是复杂的,因为风噪声非常不稳定,并且如果存在多个麦克风,则每个麦克风处的噪声将不同。风噪声表示特殊的噪声类别,因为它是由设备周围的风流的湍流直接产生的。湍流在设备上的不同位置处将不同,并且随时间快速变化。
附图说明
以示例性而非限制性方式在附图中展示本发明的实施方式,在附图中,类似号码指示类似元件。
图1是根据实施例的用于接收音频系统并对信号应用风噪声降低的系统的框图。
图2是根据实施例的交叉滤波器(Crossover Filter)(如图1的交叉滤波器)的输出的曲线图。
图3是适合用于实施例的风噪声降低系统的框图。
图4是适合用于实施例的替代性风噪声降低系统的框图。
图5是根据实施例的具有输入和输出音频链路的通信链路的框图。
图6是根据实施例的降低风噪声的过程流程图。
图7是根据实施例的结合了风噪声降低的计算设备的框图。
具体实施方式
依赖信号分析的风噪声降低系统通常需要高频谱分辨率来区分风与其他声音。由于风噪声的瞬态性质,系统还必须以高速率更新。处理需求随着更高的采样频率而增加。虽然可以以8kHz对语音进行采样,但是以32kHz、48k Hz或更高速率可以对更高质量的音频进行采样。针对这些信号的风噪声分析需要高计算(MIPS)和存储器(KB)资源来进行处理。
可以通过将输入音频划分为子带来减少计算和存储器要求。这允许风噪声降低系统与具有较低采样频率的子带一起工作。结果,总体输入音频采样频率可能远大于8kHz。计算和存储器要求在很大程度上独立于输入音频的采样率。还可以处理多个同时的麦克风记录。许多视频记录器记录两个或更多个独立的音频通道以支持立体声或环绕声模式。甚至一些智能手机提供四个麦克风来为记录的音频提供深度和空间滤波。
风噪声的音频频谱通常包括非常低音调的声音,但通常不超过4kHz以上的音频频率。风噪声的这种物理特性可以用于将输入音频分成两个或更多个分离的子带,包括风噪声的子带可以被限制为大约4kHz。这允许独立于其他子带来降低风噪声。在风噪声被滤除之后可以然后重新组合子带。
图1示出了用于对输入音频信号102应用风噪声降低的系统101。本示例中的音频信号采用已经从耦合到模拟麦克风的模数转换器取得的数字样本序列的形式。在一些情况下,转换器和麦克风被组合并被称为数字麦克风。输入信号被标识为d(k),fs=48kHz。这将表明,在本示例中,信号是以48kHz的采样率上的k个数字样本的流。48和其他数字用作示例,取决于具体实现方式可以使用不同的滤波器和不同的采样率。在成帧块104处,输入音频样本被收集为帧。帧表示短音频序列,例如10或20毫秒。然而,取决于具体实现方式,可以使用更长或更短的音频序列。如果音频系统是传输系统的具有成帧协议的一部分,则可以使用用于传输系统的成帧协议。
在上部路径103和下部路径105上发送输入信号帧。信号的这两个副本用于产生具有4kHz的交叉频率的两个子带。在上部路径中,信号被低通滤波106,然后在下采样器108中被重新采样到8kHz。然后对所输出的下采样信号x(k),fs=8kHz进行处理以用于风噪声降低。在处理之后,在上采样块112中将经降噪的信号上采样回48kHz。然后将经上采样的信号施加到低通滤波器114,以去除在采样和降噪期间引入的任何较高频率假象。
下部路径信号在滤波器120中在4kHz下被高通滤波,然后在延迟缓冲器122中被延迟。该延迟缓冲器容纳由低通滤波器中的群延迟引起的延迟。延迟缓冲器还可以被适配成用于引起另一路径中的任何其它延迟,这取决于上部路径的滤波器、上下采样器和噪声降低电路的实现。上部路径输出然后与下部路径输出时间对准,并且这两个信号在组合器124中再次被组合以产生具有减小的风噪声和48kHz采样率的输出信号y(k),fs=48kHz。
这种方法允许保持在音频信号中执行风噪声降低所需的时间和频率分辨率。在上述说明中,选择了4kHz的交叉频率(Crossover Frequency)。在实践中,该交叉频率可以变化。取决于风噪声的性质和输出信号的期望质量,交叉频率可以更低或更高。在另一示例中,8kHz可以用作低通滤波截止频率。
在图1的示例中,考虑了48kHz的典型输入采样频率。风噪声的频谱通常不超过4kHz。因此,风噪声降低系统首先将输入信号的单个信道d(k)分解106、102为具有4kHz的交叉频率的两个子带103、105。4kHz是指原始音频信号中的模拟声音的频率,而不是采样率。低通滤波器106去除频谱图像,并且然后可以以因子6对信号进行下采样108,以获得重采样到8kHz的较低子带信号x(k)。8kHz是具有最大频率4kHz、没有混叠的音频信号的最小采样率。
然后使用多种风噪声降低技术中的任何一种来处理110较低子带信号x(k)。较低的采样率和较低的最大频率大大减少了对信号执行风噪声降低所需的计算和存储器资源。然后通过相同的因子(在这种情况下6)对增强的信号进行上采样112并且进行低通滤波114,以去除由上采样和任何其他过程引入的频谱图像。然后将该信号添加124到延迟的经高通滤波信号。该延迟对于补偿图1所示的信号处理链的上部分支中的附加低通滤波器是必要的。
相同的原理可以应用于具有其它采样率的信号。8kHz或更高的任何采样率可以用作输入音频信号。如果输入信号以8kHz被采样,则可以避免上部路径的下采样和上采样。可以用比8kHz更高或更低的速率进行下采样。利用更多资源,系统可以作为替代将音频下采样到16kHz。当在124处重新组合信号时,这可以提供更高质量的音频。可以基于低通滤波截止频率来选择下采样率。如所示,8kHz的下采样音频速率被选择为滤波器所允许的最高音频频率的两倍,例如4kHz。基于典型的风噪声的特性来选择低通滤波截止频率。对于较高速度的风,可以选择较高的截止频率,而对于较温和的风,可以选择较低的截止频率。对于较低或较高截止频率,可以选择较低或较高的下采样率。
输入音频d(k)可以具有取决于应用的任何采样率。8kHz和16kHz是常见的,但是一些音频应用以更高的速率对输入信号进行采样以提高输出信号质量。为了更高的信号保真度,通常以32kHz、48kHz或更高速率对音频记录进行采样。
当多个麦克风用于单次记录时,可以使用多个风噪声降低处理。风噪声通常具有单个麦克风信号之间的低相干性。图1的方法可以独立地应用于这些麦克风通道中的每个。这允许来自这些单独麦克风中的每一个的空间提示被保留。
低通滤波器106和高通滤波器120这两个滤波器构成音频交叉滤波器。这个交叉滤波器可以被设计为用于既分解输入信号又充当随后下采样操作108的抗混叠滤波器的双重作用。虽然可以使用常规滤波器组,通过使用交叉而不是常规滤波器组,输入信号被分解为使得低通滤波器和高通滤波器的频率响应是互补的并且相加为整体。这创建了一种结构,在该结构中,由于在交叉滤波器中的固定点实现而导致的任何数字误差被反映在高通和低通两分支中。相应地,当组合这两个上和下部路径分支时,数字误差彼此抵消。交叉滤波器组系统提供了分解输入信号的高效低失真方法。
可以通过平衡滤波器长度、过渡带宽和阻带衰减来设计交叉滤波器。较长的滤波器长度提供了更令人期待的滤波器设计特性,比如更尖锐的过渡带宽和更多的阻带衰减。然而,较长的滤波器长度引入额外的群延迟。交叉滤波器输出的示例在图2中示出,图2是竖直轴上的振幅对水平轴上的频率的曲线图。示出了这两个不同的信号,其中,上部路径信号202具有在4kHz上的高端截止频率fc。下部路径信号204具有在4kHz上的低端截止频率。这样的响应可以用129个滤波器系数(采样频率,fs=48kHz)来产生。转换带宽已设置为500Hz,其中,阻带衰减为-60dB。
图3是可以用作图1的风噪声降低系统110的风噪声降低(WNR)系统300的示例的框图。此系统作为示例被示出,并且取决于实现方式,可以使用各种其它系统。分割(和/或开窗)电路302耦合到FFT(快速傅立叶变换)电路304,该FFT电路向特征提取电路306提供结果。特征提取向风噪声检测电路308以及同样耦合到WND检测电路308的风噪声PSD(功率频谱密度)的估计电路310提供结果。估计电路耦合到频谱减法增益计算电路312,该频谱减法增益计算电路的输出与FFT输出组合并被提供给耦合到重叠相加电路316的IFFT(逆FFT)电路314。
噪声语音信号x(k)通过干净语音信号s(k)和噪声信号n(k)的叠加来建模,其中,k是数字信号的离散时间指标。对风噪声PSD的估计可以被划分为可以基于帧执行的两个单独的步骤。第一步是风噪声检测(WND),包括特征提取(例如,计算每个帧中的子带信号质心(SSC))以及基于所提取的特征(例如,SCC值)将信号帧分类为干净的浊音语音、有噪声的浊音语音(语音+风)或纯风噪声。
第二步是风噪声估计(WNEST),其可以包括基于信号帧分类的风噪声周期图估计。干净的浊音语音导致没有风噪声估计。有噪声的语音导致在频谱中的最小搜索以及多项式拟合。纯风噪声导致使用输入信号作为风噪声周期图估计。WNEST可以进一步包括用于最终噪声PSD估计的自适应平滑因子的计算。可以针对每个麦克风重复图3的配置。
在图3的示例中,提供了重叠相加框架。在一个示例中,有噪声的输入信号x(k)首先被分割成20ms的帧,具有50%的重叠,即10ms。之后,对每个帧进行开窗(例如,使用Hann窗口),并且使用快速傅里叶变换(FFT)在离散频域中对其进行变换,产生X(λ,μ),其中λ是帧索引,μ是离散频率仓。通过将噪声频谱X(λ,μ)与频谱增益G(λ,μ)相乘,在频域中实现风噪声降低。在时域中使用快速傅里叶逆变换(IFFT)来对增强信号进行变换。最后,对重叠的增强信号帧进行求和,得到输出信号
图4是可以用作图1的WNR 110的替代性WNR系统400的框图。在此替代性示例中,STFT(短时傅立叶变换)电路402耦合到WND(风噪声检测)电路404,该WND电路耦合到WNEST(风噪声估计)电路406,该WNEST电路耦合到频谱减法电路408,该频谱减法电路耦合到提供风噪声降低的输出的逆STFT电路410。
首先在频域中执行风噪声检测(WND)以提取用于检测风噪声的存在的潜在信号特性和特征。在WND中确定信号子带质心值SSCm(λ)和能量比ER(λ),并将其用于风噪声估计(WNEST)技术中以估计当检测到风噪声时的风噪声功率。然后可以通过执行频谱减法来衰减这些风噪声分量。然后,所输出的增强信号可以用于使用逆STFT重构输出信号
图5是具有音频输出流水线和音频输入流水线的通信链路的框图,以示出可如何将图1的系统(表示为风噪声降低508)集成到语音通信或音频记录流水线500中。图5的流水线可以集成到图7的系统或使用各种硬件和软件资源的另一系统中。来自麦克风502的上行链路信号或近端信号首先由麦克风均衡电路504和噪声降低电路(或模块)506处理。该输出被输入到风噪声降低电路508。取决于实现方式,风噪声降低电路508可以将频率仓输出到残留回波抑制电路510。
乘法器512从AGC(自动增益控制)电路522和残留回波抑制电路510接收输入数据,并且将输出数据提供给DRP(动态范围处理器)上行链路电路514。这表示被输出到存储器或输出到传输链路的经滤波的增强音频。可以去除或替换滤波、均衡、抵消、降低、抑制和其他声音增强组件中的任何一个或多个,并且可以添加其他组件以适合特定实现方式。
在图的顶部所示的输出流水线中,从存储器或从远程设备接收的远端信号被输入到进一步的噪声降低电路516,其输出被输入到DRP下行链路电路518中。DRP下行链路电路518的输出被输入到声学回波消除器520(其可以将其输出提供给求和电路528,该求和电路将其和(进一步考虑麦克风均衡电路504的输出)输出到噪声降低电路506)、AGC电路522和扬声器均衡电路524。扬声器均衡电路524可以将其输出提供给扬声器526。
风噪声具有独特的瞬态特征,这使其难以降低少。取决于具体实现方式,实施例可以使用多种不同技术和系统中的任何一种来降低风噪声。图3和图4中示出了几种实现方式。下面描述图3和图4中的风噪声降低的操作细节和一些功能。然而,实施例并不需要这种风噪声降低。
风噪声主要位于低频(f<500Hz),并且显示出朝较高频率的大约1/f衰退。浊音语音段显示出谐波结构,并且信号能量的主要部分位于频率0Hz和3000Hz之间。近端信号的清音段是类噪声的,并且显示信号能量的高通特性(f>3000Hz)。浊音语音受风噪声的影响很大,而不受高通噪声的影响。
对于WND,可以提供鲁棒特征,利用该鲁棒特征可以实现对当前帧的分类。然后,映射此特征以执行对干净语音风噪声的检测或者对先前两种情况的混合的软判决。
SSCs(子带信号质心)可以用于表示信号帧X(λ,μ)的频谱能量分布。第m子带的SSC被定义为:
频率仓μm可以定义子带之间的界限。对于根据本公开的各个方面的系统,仅考虑覆盖低频范围(0Hz-3000Hz)的第一子带SSC1的质心。在这种情况下:
μ0=0,且
其中,fs是采样频率,N是FFT的大小,并且<>可以代表取整到下一个整数。SSC1被视为给定信号的频谱中的“重心”。
相应地,SSC1仅受浊音语音段和风噪声段的影响,而清音语音段仅对第一质心具有轻微影响。对于风噪声信号的理想1/f衰退,SSC1值是恒定的并且与绝对信号能量无关。风噪声信号的SSC1值通常集中在100Hz以下,而浊音语音段分布在250Hz与700Hz之间。使用这些SSC1值,可以使用阈值来检测纯风噪声或干净的浊音语音段。
还可能存在具有语音和风的叠加的瞬态区域。因此,除了在浊音语音和风噪声的存在之间的硬判决之外,可以使用软值给出关于信号失真程度的信息。
除SSC1之外,两个频带之间的能量比ER(λ)可以用作用于检测干净的浊音语音和纯风噪声的安全网。
能量比ER(λ)定义如下:
频率仓μ0、μ1、μ2和μ3定义限制这两个频带的频率仓。如果界限μ0和μ1覆盖比μ2和μ3(例如200Hz-4000Hz)更低的频率范围(例如0Hz-200Hz),则高能量比值(ER(λ)>>1)表示干净的语音,并且低值(0<ER(λ)<1)表示风噪声。这些阈值的典型值是用于检测纯风噪声的ER(λ)<0.2,以及用于检测干净的浊音语音的ER(λ)>10。
风噪声估计(WNEST)已被表征为功率频谱密度PSD给定信号的PSD估计是通过对连续信号帧X(λ,μ)进行递归平滑得到的:
其中,平滑因子α(λ)可以取0和1之间的值,并且可以选择为固定的或自适应的。振幅平方傅里叶变换|X(λ,μ)|2被称为周期图。对于所需的风噪声PSD噪声|X(λ,μ)|2信号的周期图不能直接访问,因为输入信号包含语音和风噪声。因此,对于根据本公开的各个方面的系统,基于在前面部分中所定义的分类来估计噪声周期图。对于风噪声占优势的范围,输入信号可直接用作噪声周期图。在具有清晰语音的范围中,噪声周期图被设置为零。对于其中浊音语音和风噪声都有效的范围的估计,使用更复杂的方法,该方法利用风噪声和浊音语音的频谱特性。
如上所述,风噪声的频谱可以具有1/f衰退。因此,风噪声周期图用简单的多项式被近似为:
引入参数β和γ来调整功率和衰退衰退参数γ的典型值在-2和-0.5之间。对于β和γ的计算,需要频谱中的两个支持点,并且这些支持点被分配给风噪声周期图。由于扬声器的共振,浊音语音具有谐波结构。谐波在说话音的频率以及此频率的倍数处的表现为局部极大值。风噪声不显示谐波结构。
对于浊音语音活动期间的风噪声周期图的估计,浊音语音的前两个极小值可用作等式(4)中的多项式近似的支持点。
给定在频率仓μ最小1和μ最小2处的两个极小值,参数β和γ估计如下:
以及
为了防止对风噪声周期图的过高估计,特别是对于低频(<100Hz),计算的周期图被当前周期图限制为
基于当前SSC1值的风噪声周期图的计算总结为:
θ1和θ2表示图7中定义的三个范围之间的SSC1值的阈值。阈值可以设置为200Hz和600Hz作为θ1和θ2的相应频率。
为了确定所需的风噪声PSD,将等式(3)中给出的递归平滑应用于等式(8)的周期图。这里,平滑因子α(λ)的选择起重要作用。一方面,小的平滑因子允许对风噪声的快速跟踪,但是具有的缺点是被错误地检测为风噪声的语音段对噪声PSD具有很大的影响。另一方面,接近1的大平滑因子减少了在语音活动期间的错误检测的影响,但是导致噪声估计的缓慢适应速度。因此,α(λ)的自适应计算是有利的,其中,在语音暂停时在风中选择低值,在语音活动期间选择高值。由于SSC1值是当前SNR条件的指示符,因此使用平滑因子的以下线性映射:
平滑因子α(λ)和SSC1(λ)值之间的这种关系导致语音暂停中的快速跟踪和因此的精确的噪声估计,并且降低了在语音活动期间将语音错误地检测为风噪声的风险。此外,可以对SSC1(λ)和α(λ)之间的关系应用诸如S形函数的非线性映射。
通过将噪声频谱X(λ,μ)与频谱增益G(λ,μ)相乘来降低风噪声。使用频谱减法方式从估计的噪声PSD和噪声输入频谱X(λ,μ)中确定频谱增益:
对于风噪声检测,能量分布以及因此信号质心向较高频率偏移。为了调整风噪声降低系统,修改信号分类和平滑因子计算的阈值θ1和θ2。这可能导致对来自等式9的平滑因子的修改。
对于风噪声估计,麦克风的高通特性可导致低于麦克风的截止频率的低信号功率。这可能降低如上所述的近似的准确度。为了克服这个问题,在麦克风截止频率之上执行上述极小值搜索。
图6是如本文所述的使用较少计算资源来降低风噪声的过程流程图。在602,音频信号被分解成子带。在图1的示例中,仅使用两个子带,但实施例不限于此。在604,对这些子带中的一个进行低通滤波。低通滤波器可以处于4kHz,然而根据具体实现,也可以使用其它更低的频率。在许多情况下,几乎所有的风噪声都低于0.5kHz,因此甚至可以使用1kHz的低通滤波器。
在606,从第一子带中去除风噪声,并且在608,将第一子带与其他子带组合。这个过程的基础是这样的想法:风噪声将排他地或至少主要在第一子带中,使得仅需要针对风噪声处理第一子带。取决于例如图5中所示的实现方式,可以针对其他噪声处理其他子带。还可以针对其他噪声处理第一子带,如图5中所示。例如在图1的两个路径示例中,第二路径具有高于4kHz的较高频率,此子带通常承载各种不同的嘶嘶和吱吱噪声。这些可以在单独的过程中降低。
在较低路径中,通过降低风噪声之前对第一子带进行下采样,然后在将第一子带与其他子带组合之前上将经降低的噪声信号上采样回原始采样率,可以进一步减少风噪声降低所需的计算资源。由于第一子带被低通滤波,可以在没有显著音频质量损失的情况下对其进行下采样。较高的采样率主要有助于再现已经从第一子带滤波出的较高频率声音。
图7展示了根据一种实现方式的计算设备100。计算设备100容纳系统板2。该板2可以包括多个组件,包括但不限于处理器4和至少一个通信封装体6。通信封装体耦合到一个或多个天线16。处理器4物理地和电学地耦合到板2。
根据其应用,计算设备100可以包括可以或可以不物理地和电学地耦合到板2的其他组件。这些其他组件包括但不限于易失性存储器(例如DRAM)8、非易失性存储器(例如ROM)9,闪存(未示出)、图形处理器12、数字信号处理器(未示出)、密码处理器(未示出)、芯片组14、天线16、诸如触摸屏显示器的显示器18、触摸屏控制器20、电池22、音频编解码器(未示出)、视频编解码器(未示出)、功率放大器24、全球定位系统(GPS)设备26、罗盘28、加速度计(未示出)、陀螺仪(未示出)、扬声器30、照相机32、麦克风阵列34、和大容量存储设备(诸如硬盘驱动)10,光盘(CD)(未示出)、数字通用盘(DVD)(未示出)等等)。这些组件可以连接到系统板2、安装到系统板或与任何其他组件组合。
通信封装体6使得向和从计算设备100传递数据的无线和/或有线通信成为可能。术语“无线”及其派生词可以用于描述可以通过使用通过非固体介质的经调制的电磁辐射来传达数据的电路、设备、系统、方法、技术、通信信道等。该术语并不意味着相关联的设备不包含任何导线,尽管在一些实施例中它们可能不包括。通信封装体6可以实现多种无线或有线标准或协议中的任何一种,包括但不限于Wi-Fi(IEEE 802.11家族)、WiMAX(IEEE802.16家族)、IEEE 802.20、长期演进(LTE)、Ev-DO、HSPA+、HSDPA+、HSUPA+、EDGE、GSM、GPRS、CDMA、TDMA、DECT、蓝牙、其以太网衍生物以及被指定为3G,4G,5G及以上的任何其它无线和有线协议。计算设备100可以包括多个通信封装体6。例如,第一通信封装体6可以专用于诸如Wi-Fi和蓝牙的较短程无线通信,并且第二通信封装体6可以专用于较长程无线通信,诸如GPS、EDGE、GPRS、CDMA、WiMAX、LTE、Ev-DO、以及其他。
麦克风34和扬声器30耦合到音频前端36以执行如本文所描述的数字转换、编码和解码、以及风噪声降低。处理器4耦合到音频前端以借助音频前端的中断、设置参数、和控制操作来驱动处理。可以在音频前端或通信封装体6中执行基于帧的处理。
在各种实现中,计算设备100可以是膝上型计算机、上网本、笔记本、超极本、智能电话、平板、个人数字助理(PDA)、超移动PC、移动电话、台式计算机、服务器、打印机、扫描仪、监视器、机顶盒、娱乐控制单元、数字相机、便携式音乐播放器、或数字视频记录器。该计算设备可以是固定的、便携式的、或可穿戴的。在进一步实现方式中,计算设备100可以是对数据进行处理的任何其他电子设备。
实施例可以实现为使用母板、专用集成电路(ASIC)、和/或现场可编程门阵列(FPGA)互连的一个或多个存储器芯片、控制器、CPU(中央处理单元)、微芯片或集成电路的一部分。
对“一个实施例”、“实施例”、“示例实施例”、“各实施例”等的引用表明这样描述的本发明的这个或这些个实施例可以包括具体特征、结构、或特性,但并不是每个实施例必定包括这些具体特征、结构、或特性。进一步,某些实施例可具有针对其他实施例所描述的特征的一部分、全部、或不具有任何这些特征。
在以下说明书和权利要求书中,可以使用术语“耦合”及其衍生词。“耦合”用于指示两个或更多个元件彼此协作或相互作用,但是它们之间可以具有或不具有中间的物理或电学组件。
如权利要求书中所使用的,除非另有说明,使用序数形容词“第一”、“第二”、“第三”等来描述公共元素仅仅指示相同元素的不同实例被提及,并且不旨在暗示如此描述的元件必须在或者时间上、空间上、排名上、或以任何其它方式处于给定序列中。
附图和前述描述给出了实施例的示例。本领域技术人员将理解,所描述的元件中的一个或多个可以被良好地组合成单个功能元件。可替代地,某些元件可以分成多个功能元件。来自一个实施例的元件可以被添加到另一个实施例。例如,本文描述的过程的顺序可以改变并且不限于本文所述的方式。此外,任何流程图的动作不需要以所示的顺序实现;也不一定需要执行所有的动作。此外,不依赖于其他动作的那些动作可以与其他动作并行地执行。实施例的范围决不限于这些特定示例。无论是否在说明书中明确给出,诸如材料的结构、尺寸和使用上的差异的许多变化都是可能的。实施例的范围至少与所附权利要求给出的一样宽。
下面的示例涉及进一步的实施例。不同实施例的各种特征可以与包括的一些特征和排除的其他特征进行各种组合以适应各种不同的应用。一些实施例涉及一种方法,所述方法包括:将音频信号分解成多个子带,所述音频信号包括风噪声;对所述多个子带中的第一子带进行低通滤波;在低通滤波之后从所述第一子带中去除风噪声;以及在去除风噪声之后,将所述第一子带与所述多个子带中的其他子带组合。
在一些实施例中,所述音频信号是以第一采样率被采样的,所述方法进一步包括:在去除风噪声之前,将所述第一子带下采样到第二采样率;以及在去除所述风噪声之后,将所述第一子带上采样到所述第一采样率。
进一步的实施例包括在上采样之后对所述第一子带进行低通滤波。
一些实施例包括:在去除风噪声之前对所述第一子带进行低通滤波以及在上采样之后进行低通滤波都是在相同的低通滤波截止频率上进行的。
在一些实施例中,所述低通滤波截止频率被选择为高于风噪声频率。一些实施例包括将所述音频信号施加到产生所述多个子带的交叉滤波器。
在一些实施例中,所述音频信号包括从麦克风和数模转换器接收的数字样本流。在一些实施例中,所述数字样本具有第一采样频率,所述方法进一步包括:在去除风噪声之前,将所述第一子带下采样到低于所述第一采样率的第二采样率。
在一些实施例中,去除风噪声包括:估计所述第一子带的功率频谱密度以确定风噪声的存在性,并且然后通过对所述子带应用频谱减法以降低所述风噪声。
一些实施例涉及一种装置,所述装置包括:频率滤波器,所述频率滤波器用于将音频信号分解成多个子带,所述音频信号包括风噪声;低通滤波器,所述低通滤波器用于对所述多个子带中的第一子带进行滤波;噪声去除电路,所述噪声去除电路用于在低通滤波之后从所述第一子带中去除风噪声;以及组合器,所述组合器用于在去除风噪声之后将所述第一子带与所述多个子带中的其他子带组合。
一些实施例进一步包括:第一采样率转换器,所述第一采样率转换器用于在去除风噪声之前将所述第一子带下采样到第二采样率;以及第二采样率转换器,所述第二采样率转换器用于在去除所述风噪声之后将所述第一子带上采样到所述第一采样率。
一些实施例进一步包括:第二低通滤波器,所述第二低通滤波器用于在上采样之后对所述第一子带进行滤波。
在一些实施例中,所述第一和第二低通滤波器具有相同的低通滤波截止频率。在一些实施例中,所述低通滤波截止频率被选择为高于风噪声频率。在一些实施例中,所述音频信号包括从麦克风和数模转换器接收的数字样本流。在一些实施例中,所述数字样本具有第一采样频率,所述方法进一步包括:在去除风噪声之前,将所述第一子带下采样到低于所述第一采样率的第二采样率。在一些实施例中,所述噪声去除电路通过以下方式来去除风噪声:估计所述第一子带的功率频谱密度以确定风噪声的存在性,并且然后通过对所述子带应用频谱减法以降低所述风噪声。
一些实施例涉及一种装置,所述装置包括:麦克风;模数转换器,所述模数转换器耦合到所述麦克风以产生作为样本序列的音频信号;频率滤波器,所述频率滤波器用于将所述音频信号分解成多个子带,所述音频信号包括风噪声;低通滤波器,所述低通滤波器用于对所述多个子带中的第一子带进行滤波;噪声去除电路,所述噪声去除电路用于在低通滤波之后从所述第一子带中去除风噪声;组合器,所述组合器用于在去除风噪声之后将所述第一子带与所述多个子带中的其他子带组合;以及发射机,所述发射机用于将所述经滤波的音频发射到远程设备。
一些实施例进一步包括成帧电路,所述成帧电路用于在分解所述音频信号之前将所述音频信号的样本组合成帧。在一些实施例中,所述第一子带具有4kHz的低通滤波截止频率,所述装置进一步包括采样率转换电路,所述采样率转换电路用于在去除风噪声之前将所述第一子带下采样到8kHz。
Claims (23)
1.一种方法,包括:
将音频信号分解成多个子带,所述音频信号包括风噪声;
对所述多个子带中的第一子带进行低通滤波;
在低通滤波之后从所述第一子带中去除风噪声;以及
在去除风噪声之后,将所述第一子带与所述多个子带中的其他子带组合。
2.如权利要求1所述的方法,其中,所述音频信号是以第一采样率被采样的,所述方法进一步包括:
在去除风噪声之前,将所述第一子带下采样到第二采样率;以及
在去除所述风噪声之后,将所述第一子带上采样到所述第一采样率。
3.如权利要求2所述的方法,进一步包括:在上采样之后对所述第一子带进行低通滤波。
4.如权利要求3所述的方法,其中,在去除风噪声之前对所述第一子带进行低通滤波以及在上采样之后进行低通滤波都是在相同的低通滤波截止频率上进行的。
5.如权利要求4所述的方法,其中,所述低通滤波截止频率被选择为高于风噪声频率。
6.如权利要求1所述的方法,其中,分解包括将所述音频信号施加到产生所述多个子带的交叉滤波器。
7.如权利要求1所述的方法,其中,所述音频信号包括从麦克风和数模转换器接收的数字样本流。
8.如权利要求7所述的方法,其中,所述数字样本具有第一采样频率,所述方法进一步包括:在去除风噪声之前,将所述第一子带下采样到低于所述第一采样率的第二采样率。
9.如权利要求1所述的方法,其中,去除风噪声包括:估计所述第一子带的功率频谱密度以确定风噪声的存在性,并且然后通过对所述子带应用频谱减法以降低所述风噪声。
10.一种装置,包括:
频率滤波器,所述频率滤波器用于将音频信号分解成多个子带,所述音频信号包括风噪声;
低通滤波器,所述低通滤波器用于对所述多个子带中的第一子带进行滤波;
噪声去除电路,所述噪声去除电路用于在低通滤波之后从所述第一子带中去除风噪声;以及
组合器,所述组合器用于在去除风噪声之后将所述第一子带与所述多个子带中的其他子带组合。
11.如权利要求10所述的装置,进一步包括:
第一采样率转换器,所述第一采样率转换器用于在去除风噪声之前将所述第一子带下采样到第二采样率;以及
第二采样率转换器,所述第二采样率转换器用于在去除所述风噪声之后将所述第一子带上采样到所述第一采样率。
12.如权利要求11所述的装置,进一步包括第二低通滤波器,所述第二低通滤波器用于在上采样之后对所述第一子带进行滤波。
13.如权利要求12所述的装置,其中,所述第一和第二低通滤波器具有相同的低通滤波截止频率。
14.如权利要求13所述的装置,其中,所述低通滤波截止频率被选择为高于风噪声频率。
15.如权利要求10所述的装置,其中,所述音频信号包括从麦克风和数模转换器接收的数字样本流。
16.如权利要求15所述的装置,其中,所述数字样本具有第一采样频率,所述方法进一步包括:在去除风噪声之前,将所述第一子带下采样到低于所述第一采样率的第二采样率。
17.如权利要求10所述的装置,其中,所述噪声去除电路通过以下方式来去除风噪声:估计所述第一子带的功率频谱密度以确定风噪声的存在性,并且然后通过对所述子带应用频谱减法以降低所述风噪声。
18.一种装置,包括:
麦克风;
模数转换器,所述模数转换器耦合到所述麦克风以产生作为样本序列的音频信号;
频率滤波器,所述频率滤波器用于将所述音频信号分解成多个子带,所述音频信号包括风噪声;
低通滤波器,所述低通滤波器用于对所述多个子带中的第一子带进行滤波;
噪声去除电路,所述噪声去除电路用于在低通滤波之后从所述第一子带中去除风噪声;
组合器,所述组合器用于在去除风噪声之后将所述第一子带与所述多个子带中的其他子带组合;以及
发射机,所述发射机用于将所述经滤波的音频传送到远程设备。
19.如权利要求18所述的装置,进一步包括成帧电路,所述成帧电路用于在分解所述音频信号之前将所述音频信号的样本组合成帧。
20.如权利要求18所述的装置,其中,所述第一子带具有4kHz的低通滤波截止频率,所述装置进一步包括采样率转换电路,所述采样率转换电路用于在去除风噪声之前将所述第一子带下采样到8kHz。
21.一种具有指令的计算机可读介质,所述指令当由计算机执行时使所述计算机执行包括以下各项的操作:
将音频信号分解成多个子带,所述音频信号包括风噪声;
对所述多个子带中的第一子带进行低通滤波;
在低通滤波之后从所述第一子带中去除风噪声;以及
在去除风噪声之后,将所述第一子带与所述多个子带中的其他子带组合。
22.如权利要求21所述的介质,其中,所述音频信号是以第一采样率被采样的,所述操作进一步包括:
在去除风噪声之前,将所述第一子带下采样到第二采样率;以及
在去除所述风噪声之后,将所述第一子带上采样到所述第一采样率。
23.如权利要求22所述的方法,进一步包括:在以与所述第一低通滤波器相同的低通截止频率进行上采样之后对所述第一子带进行低通滤波,所述频率被选择为高于风噪声频率。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/330,810 US9721584B2 (en) | 2014-07-14 | 2014-07-14 | Wind noise reduction for audio reception |
US14/330,810 | 2014-07-14 | ||
PCT/US2015/031549 WO2016010624A1 (en) | 2014-07-14 | 2015-05-19 | Wind noise reduction for audio reception |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106463106A true CN106463106A (zh) | 2017-02-22 |
CN106463106B CN106463106B (zh) | 2021-01-26 |
Family
ID=55068025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580031921.7A Active CN106463106B (zh) | 2014-07-14 | 2015-05-19 | 用于音频接收的风噪声降低 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9721584B2 (zh) |
EP (1) | EP3170172A4 (zh) |
CN (1) | CN106463106B (zh) |
WO (1) | WO2016010624A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109427345A (zh) * | 2017-08-29 | 2019-03-05 | 杭州海康威视数字技术股份有限公司 | 一种风噪检测方法、装置及系统 |
CN111583958A (zh) * | 2020-05-19 | 2020-08-25 | 北京达佳互联信息技术有限公司 | 音频信号处理方法、装置、电子设备及存储介质 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10181329B2 (en) * | 2014-09-05 | 2019-01-15 | Intel IP Corporation | Audio processing circuit and method for reducing noise in an audio signal |
US10049678B2 (en) * | 2014-10-06 | 2018-08-14 | Synaptics Incorporated | System and method for suppressing transient noise in a multichannel system |
WO2016181752A1 (ja) * | 2015-05-12 | 2016-11-17 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
JP2017009663A (ja) * | 2015-06-17 | 2017-01-12 | ソニー株式会社 | 録音装置、録音システム、および、録音方法 |
US10373608B2 (en) * | 2015-10-22 | 2019-08-06 | Texas Instruments Incorporated | Time-based frequency tuning of analog-to-information feature extraction |
WO2017143105A1 (en) | 2016-02-19 | 2017-08-24 | Dolby Laboratories Licensing Corporation | Multi-microphone signal enhancement |
US11120814B2 (en) | 2016-02-19 | 2021-09-14 | Dolby Laboratories Licensing Corporation | Multi-microphone signal enhancement |
US10509624B2 (en) * | 2017-01-30 | 2019-12-17 | Cirrus Logic, Inc. | Single-bit volume control |
US10157627B1 (en) * | 2017-06-02 | 2018-12-18 | Bose Corporation | Dynamic spectral filtering |
US11069365B2 (en) * | 2018-03-30 | 2021-07-20 | Intel Corporation | Detection and reduction of wind noise in computing environments |
US11227622B2 (en) * | 2018-12-06 | 2022-01-18 | Beijing Didi Infinity Technology And Development Co., Ltd. | Speech communication system and method for improving speech intelligibility |
CN112259116B (zh) * | 2020-10-14 | 2024-03-15 | 北京字跳网络技术有限公司 | 一种音频数据的降噪方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080317261A1 (en) * | 2007-06-22 | 2008-12-25 | Sanyo Electric Co., Ltd. | Wind Noise Reduction Device |
US20120148067A1 (en) * | 2008-12-05 | 2012-06-14 | Audioasics A/S | Wind noise detection method and system |
US20120209611A1 (en) * | 2009-12-28 | 2012-08-16 | Mitsubishi Electric Corporation | Speech signal restoration device and speech signal restoration method |
CN102763160A (zh) * | 2010-02-18 | 2012-10-31 | 高通股份有限公司 | 用于稳健噪声降低的麦克风阵列子组选择 |
US20120310639A1 (en) * | 2008-09-30 | 2012-12-06 | Alon Konchitsky | Wind Noise Reduction |
CN203242334U (zh) * | 2010-05-03 | 2013-10-16 | 艾利佛卡姆公司 | 用于电子系统的风抑制/替换部件 |
JP2014102317A (ja) * | 2012-11-19 | 2014-06-05 | Jvc Kenwood Corp | 雑音除去装置、雑音除去方法、及びプログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6175602B1 (en) | 1998-05-27 | 2001-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using linear convolution and casual filtering |
JP4196162B2 (ja) | 2002-08-20 | 2008-12-17 | ソニー株式会社 | 自動風音低減回路および自動風音低減方法 |
US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7876918B2 (en) * | 2004-12-07 | 2011-01-25 | Phonak Ag | Method and device for processing an acoustic signal |
BRPI0607646B1 (pt) * | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
JP4742226B2 (ja) * | 2005-09-28 | 2011-08-10 | 国立大学法人九州大学 | 能動消音制御装置及び方法 |
JP2008263498A (ja) | 2007-04-13 | 2008-10-30 | Sanyo Electric Co Ltd | 風雑音低減装置、音響信号録音装置及び撮像装置 |
US20100329471A1 (en) * | 2008-12-16 | 2010-12-30 | Manufacturing Resources International, Inc. | Ambient noise compensation system |
GB2473266A (en) * | 2009-09-07 | 2011-03-09 | Nokia Corp | An improved filter bank |
JP5882576B2 (ja) * | 2010-12-01 | 2016-03-09 | キヤノン株式会社 | 画像処理装置及び画像処理装置の制御方法、並びにプログラム |
US8983833B2 (en) * | 2011-01-24 | 2015-03-17 | Continental Automotive Systems, Inc. | Method and apparatus for masking wind noise |
US8842842B2 (en) * | 2011-02-01 | 2014-09-23 | Apple Inc. | Detection of audio channel configuration |
JP5919647B2 (ja) * | 2011-05-11 | 2016-05-18 | 富士通株式会社 | 風雑音抑圧装置、半導体集積回路及び風雑音抑圧方法 |
CN102306496B (zh) * | 2011-09-05 | 2014-07-09 | 歌尔声学股份有限公司 | 一种多麦克风阵列噪声消除方法、装置及系统 |
US20130129117A1 (en) * | 2011-11-21 | 2013-05-23 | Henrik Thomsen | Audio amplification circuit |
US8750526B1 (en) * | 2012-01-04 | 2014-06-10 | Audience, Inc. | Dynamic bandwidth change detection for configuring audio processor |
JP5573901B2 (ja) * | 2012-08-23 | 2014-08-20 | Nttエレクトロニクス株式会社 | 標本化レート変換装置 |
US9131307B2 (en) * | 2012-12-11 | 2015-09-08 | JVC Kenwood Corporation | Noise eliminating device, noise eliminating method, and noise eliminating program |
-
2014
- 2014-07-14 US US14/330,810 patent/US9721584B2/en active Active
-
2015
- 2015-05-19 WO PCT/US2015/031549 patent/WO2016010624A1/en active Application Filing
- 2015-05-19 EP EP15821863.6A patent/EP3170172A4/en not_active Withdrawn
- 2015-05-19 CN CN201580031921.7A patent/CN106463106B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080317261A1 (en) * | 2007-06-22 | 2008-12-25 | Sanyo Electric Co., Ltd. | Wind Noise Reduction Device |
US20120310639A1 (en) * | 2008-09-30 | 2012-12-06 | Alon Konchitsky | Wind Noise Reduction |
US20120148067A1 (en) * | 2008-12-05 | 2012-06-14 | Audioasics A/S | Wind noise detection method and system |
US20120209611A1 (en) * | 2009-12-28 | 2012-08-16 | Mitsubishi Electric Corporation | Speech signal restoration device and speech signal restoration method |
CN102763160A (zh) * | 2010-02-18 | 2012-10-31 | 高通股份有限公司 | 用于稳健噪声降低的麦克风阵列子组选择 |
CN203242334U (zh) * | 2010-05-03 | 2013-10-16 | 艾利佛卡姆公司 | 用于电子系统的风抑制/替换部件 |
JP2014102317A (ja) * | 2012-11-19 | 2014-06-05 | Jvc Kenwood Corp | 雑音除去装置、雑音除去方法、及びプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109427345A (zh) * | 2017-08-29 | 2019-03-05 | 杭州海康威视数字技术股份有限公司 | 一种风噪检测方法、装置及系统 |
CN109427345B (zh) * | 2017-08-29 | 2022-12-02 | 杭州海康威视数字技术股份有限公司 | 一种风噪检测方法、装置及系统 |
CN111583958A (zh) * | 2020-05-19 | 2020-08-25 | 北京达佳互联信息技术有限公司 | 音频信号处理方法、装置、电子设备及存储介质 |
CN111583958B (zh) * | 2020-05-19 | 2023-10-10 | 北京达佳互联信息技术有限公司 | 音频信号处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106463106B (zh) | 2021-01-26 |
EP3170172A4 (en) | 2018-01-17 |
US20160012828A1 (en) | 2016-01-14 |
US9721584B2 (en) | 2017-08-01 |
WO2016010624A1 (en) | 2016-01-21 |
EP3170172A1 (en) | 2017-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106463106A (zh) | 用于音频接收的风噪声降低 | |
CN102074245B (zh) | 基于双麦克风语音增强装置及语音增强方法 | |
Vaseghi | Multimedia signal processing: theory and applications in speech, music and communications | |
US9818424B2 (en) | Method and apparatus for suppression of unwanted audio signals | |
US9536540B2 (en) | Speech signal separation and synthesis based on auditory scene analysis and speech modeling | |
KR101422368B1 (ko) | 오디오 신호를 처리하기 위한 방법 및 장치 | |
CN105788607B (zh) | 应用于双麦克风阵列的语音增强方法 | |
CN102074246B (zh) | 基于双麦克风语音增强装置及方法 | |
CN101430882B (zh) | 一种抑制风噪声的方法及装置 | |
JP2010224321A (ja) | 信号処理装置 | |
WO2011148230A1 (en) | A bandwidth extender | |
CN101916567B (zh) | 应用于双麦克风系统的语音增强方法 | |
CN104520925A (zh) | 噪声降低增益的百分位滤波 | |
CN104103278A (zh) | 一种实时语音去噪的方法和设备 | |
US12073818B2 (en) | System and method for data augmentation of feature-based voice data | |
CN110503940B (zh) | 语音增强方法、装置、存储介质、电子设备 | |
CN103871418A (zh) | 一种扩声系统啸叫频点的检测方法及装置 | |
CN103426433A (zh) | 噪声消除方法 | |
Ganapathy et al. | Temporal envelope compensation for robust phoneme recognition using modulation spectrum | |
KR20120094892A (ko) | 손상된 오디오 신호의 복구 | |
JP5595605B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
CN106558315A (zh) | 异质麦克风自动增益校准方法及系统 | |
WO2022256577A1 (en) | A method of speech enhancement and a mobile computing device implementing the method | |
JP5443547B2 (ja) | 信号処理装置 | |
JP2009223210A (ja) | 信号帯域拡張装置および信号帯域拡張方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210630 Address after: California, USA Patentee after: INTEL Corp. Address before: California, USA Patentee before: INTEL IP Corp. |
|
TR01 | Transfer of patent right |