CN108141656A - 使用用于自适应波束形成的前置白化的自适应分块矩阵 - Google Patents
使用用于自适应波束形成的前置白化的自适应分块矩阵 Download PDFInfo
- Publication number
- CN108141656A CN108141656A CN201680055768.6A CN201680055768A CN108141656A CN 108141656 A CN108141656 A CN 108141656A CN 201680055768 A CN201680055768 A CN 201680055768A CN 108141656 A CN108141656 A CN 108141656A
- Authority
- CN
- China
- Prior art keywords
- noise
- signal
- input signal
- adaptive
- prewhitening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 67
- 239000011159 matrix material Substances 0.000 title claims abstract description 60
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 49
- 238000000034 method Methods 0.000 claims description 67
- 230000006870 function Effects 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 8
- 230000007423 decrease Effects 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 claims description 2
- 238000012937 correction Methods 0.000 abstract description 8
- 230000009467 reduction Effects 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000005534 acoustic noise Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1781—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
- G10K11/17821—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1083—Reduction of ambient noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/25—Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
在自适应波束形成器或空值形成器中的自适应分块矩阵的自适应滤波器可以被修改以跟踪并维持到自适应噪声对消器模块的输入和参考噪声信号之间的噪声相关。也就是说,噪声相关因子可以被确定,并且噪声相关因子可以在当生成分块矩阵输出信号时应用的传感器间信号模型中被使用。输出信号可以接着在自使用波束形成器中进一步被处理以生成在麦克风处接收的语音信号的较不嘈杂的表示。可以使用梯度降低总最小二乘(GrTLS)算法来估计传感器间信号模型。此外,空间前置白化可以在自适应分块矩阵中被应用以进一步提高噪声降低。
Description
技术领域
本公开涉及数字信号处理。更具体地,本公开的部分涉及麦克风的数字信号处理。
背景技术
在全球各地在各种条件而不是仅仅安静的办公室环境下使用电话和其它通信设备。话音通信可以发生在多种和苛刻的声学条件(例如汽车、机场、饭店等)下。具体地,背景声学噪声可以从静止噪声(例如道路噪声和引擎噪声)改变为非静止噪声(例如潺潺声和加速的汽车噪声)。移动通信设备需要减小这些不需要的背景声学噪声,以便提高话音通信的质量。如果这些不需要的背景噪声的起源和期望语音在空间上分离,则设备可以使用波束形成从有噪声的麦克风信号提取纯净的语音。
处理环境声音以减小背景噪声的一种方式是将多于一个麦克风放置在移动通信设备上。空间分离算法使用这些麦克风来得到对通过移除在空间上与语音源相异的噪声源而提取纯净语音所必需的空间信息。这样的算法通过利用存在于麦克风之间的空间分集来提高噪声信号的信噪比(SNR)。一种这样的空间分离算法是自适应波束形成,其适合于基于所接收的数据来改变噪声条件。与固定波束形成器比较,自适应波束形成器可实现较高的噪声对消或干扰抑制。一个这样的自适应波束形成器是广义旁瓣对消器(GSC)。GSC的固定波束形成器形成朝着期望方向的麦克风波束,使得只有在那个方向上的声音被捕获,且GSC的分块矩阵形成朝着期望探视方向的空值。在图1中示出GSC的一个示例。
图1是根据现有技术的自适应波束形成器的示例。自适应波束形成器100包括用于分别生成信号x1[n]和x2[n]的麦克风102和104。信号x1[n]和x2[n]被提供到固定波束形成器110和分块矩阵120。固定波束形成器110产生信号a[n],其为被包含在麦克风信号x1[n]和x2[n]内的期望信号的噪声降低版本。分块矩阵120通过自适应滤波器122的操作而生成b[n]信号,其为噪声信号。在存在于两个麦克风102和104之间的期望信号分量和因而信号x1[n]和x2[n]之间的关系由线性时变系统建模,且这个线性模型h[n]使用自适应滤波器122来估计。麦克风通道的回响/衍射效应和频率响应都可以被包含在脉冲响应h[n]中。因此,通过估计线性模型的参数,在麦克风102和104之一中的期望信号(例如语音)和来自其它麦克风的经滤波的期望信号在幅度和相位上紧密地匹配,从而极大地减小在信号b[n]中的期望信号泄漏。信号b[n]在自适应噪声对消器130中被处理以产生信号w[n],其为包含信号a[n]中的所有相关噪声的信号。信号w[n]从自适应噪声对消器130中的信号a[n]减去以生成信号y[n],其为由麦克风102和104采集的期望信号的噪声降低版本。
常规波束形成器的一个问题是,自适应分块矩阵120可以从信号b[n]无意地移除某个噪声,使得信号b[n]和a[n]中的噪声变得不相关。这个不相关的噪声不能在对消器130中移除。因此,一些不需要的噪声可以保持存在于在处理块130中由信号b[n]生成的信号y[n]中。噪声相关在自适应滤波器122中失去。因此,修改常规自适应波束形成器100的自适应滤波器122中的处理以用于减小自适应滤波器122内的噪声对消的破坏将是合乎需要的。
在这里提到的缺点仅仅是代表性的,并且简单地被包括以强调存在对改进的电气部件、特别是对消费者级别设备(例如移动电话)中使用的信号处理的需要。本文所述的实施例处理某些缺点,但不一定是在这里所述或在本领域中已知的每一个缺点。
发明内容
一个解决方案可以包括修改自适应滤波器以跟踪并维持麦克风信号之间的噪声相关。也就是说,噪声相关因子可以被确定,并且噪声相关因子可以用于使用自适应滤波器来推导出正确的传感器间信号模型,以便生成信号b[n]。那个信号b[n]可以接着在自适应波束形成器内进一步被处理以产生在麦克风处接收的语音的较不噪声的表示。在一个实施例中,信号前置白化可以在自适应分块矩阵中被应用来进一步提高噪声降低。上面所述的自适应分块矩阵和其它部件和方法可以在移动设备中实现以处理从移动设备的近和/或远麦克风接收到的信号。
在一个实施例中,可以应用梯度下降总最小二乘(GrTLS)算法来在多个噪声源存在的情况下估计信号间模型。GrTLS算法可以合并交叉相关噪声因子和/或用于产生由多个噪声语音源提供的信号的噪声降低版本的前置白化滤波器。在蜂窝电话的实施例中,多个噪声源可以包括近麦克风和远麦克风。近麦克风可以是位于最接近用户的嘴在电话呼叫期间所位于的地方的电话的端部附近的麦克风。远麦克风可以位于在蜂窝电话上的其它任何地方,其为更远离用户的嘴的位置。
根据一个实施例,一种方法可以包括由耦合到多个传感器的处理器接收至少第一噪声输入信号和第二噪声输入信号,第一噪声输入信号和第二噪声输入信号中的每个来自多个传感器;由处理器确定第一噪声输入信号和第二噪声输入信号之间的至少一个估计噪声相关统计值;和/或由处理器执行学习算法,其至少部分地基于至少一个估计噪声相关统计值来估计第一噪声输入信号和第二噪声输入信号之间的传感器间信号模型,使得噪声相关被维持在自适应噪声对消器模块的输入和分块矩阵的输出之间。
在某些实施例中,执行学习算法的步骤可以包括执行自适应滤波器,其至少部分地基于估计噪声相关统计值来计算至少一个滤波器系数;执行自适应滤波器的步骤可以包括对包括估计噪声相关统计值的总最小二乘(TLS)成本函数求解;执行自适应滤波器的步骤可以包括对总最小二乘(TLS)成本函数求解以推导出使用估计噪声相关统计值的梯度下降总最小二乘(GrTLS)学习方法;执行自适应滤波器的步骤可以包括对包括估计噪声相关统计值的最小二乘(LS)成本函数求解;执行自适应滤波器的步骤可以包括对最小二乘(LS)成本函数求解以推导出使用估计噪声相关统计值的最小平均二乘(LMS)学习方法;滤波的步骤可以包括将空间前置白化近似应用于第一噪声信号和第二噪声信号中的至少一个;和/或应用空间前置白化近似的步骤可以在没有直接矩阵求逆且没有矩阵平方根计算的情况下被执行。
在某些实施例中,该方法还可以包括在确定至少一个估计噪声相关统计值(例如用前置白化滤波器进行滤波)的步骤之前由处理器滤波第一噪声输入信号和第二噪声输入信号中的至少一个;将估计传感器间信号模型应用于第一噪声输入信号和第二噪声输入信号中的至少一个;在将估计传感器间信号模型应用于第一噪声输入信号和第二噪声输入信号中的至少一个之后组合第一噪声输入信号和第二噪声输入信号;和/或在组合的第一噪声输入信号和第二噪声输入信号上应用逆时间前置白化滤波器。
根据另一实施例,装置可以包括被配置为接收第一噪声输入信号的第一输入节点;被配置为接收第二噪声输入信号的第二输入节点;和/或耦合到第一输入节点并耦合到第二输入节点的处理器。处理器可以被配置为执行下面的步骤,其包括:从多个传感器接收至少第一噪声输入信号和第二噪声输入信号;确定第一噪声输入信号和第二噪声输入信号之间的至少一个估计噪声相关统计值;和/或执行学习算法,其至少部分地基于至少一个估计噪声相关统计值来估计第一噪声输入信号和第二噪声输入信号之间的传感器间信号模型,使得噪声相关被维持在自适应噪声对消器模块的输入和分块矩阵的输出之间。
在一些实施例中,处理器还可以被配置成在确定至少一个估计噪声相关统计值的步骤之前由处理器(例如使用时间前置白化滤波器)来执行将噪声滤波为第一噪声输入信号和第二噪声输入信号中的至少一个的步骤;将估计传感器间信号模型应用于第一噪声输入信号和第二噪声输入信号中的至少一个;在将估计传感器间信号模型应用于第一噪声输入信号和第二噪声输入信号中的至少一个之前组合第一噪声输入信号和第二噪声输入信号;和/或在组合的第一噪声输入信号和第二噪声输入信号上应用逆时间前置白化滤波器。
在某些实施例中,执行学习算法的步骤可以包括执行自适应滤波器,其至少部分地基于估计噪声相关统计值来计算至少一个滤波器系数;执行自适应滤波器的步骤可以包括对包括估计噪声相关统计值的总最小二乘(TLS)成本函数求解;执行自适应滤波器的步骤可以包括对总最小二乘(TLS)成本函数求解以推导出使用估计噪声相关统计值的梯度下降总最小二乘(GrTLS)学习方法;执行自适应滤波器的步骤可以包括对包括估计噪声相关统计值的最小二乘(LS)成本函数求解;执行自适应滤波器的步骤可以包括对最小二乘(LS)成本函数求解以推导出使用估计噪声相关统计值的最小平均二乘(LMS)学习方法;滤波的步骤可以包括将空间前置白化近似应用于第一噪声信号和第二噪声信号中的至少一个;应用空间前置白化近似的步骤可以在没有直接矩阵求逆且没有矩阵平方根计算的情况下被执行;第一输入节点可以被配置为耦合到近麦克风;第二输入节点可以被配置为耦合到远麦克风;和/或处理器可以是数字信号处理器(DSP)。
根据另一实施例,装置可以包括被配置为从第一传感器接收第一噪声输入信号的第一输入节点;被配置为从第二传感器接收第二噪声输入信号的第二输入节点;耦合到第一输入节点并耦合到第二输入节点的固定波束形成器模块;耦合到第一输入节点并耦合到第二输入节点的分块矩阵模块,其中分块矩阵模块执行学习算法,其至少部分地基于至少一个估计噪声相关统计值来估计第一噪声输入信号和第二噪声输入信号之间的传感器间信号模型,使得噪声相关被维持在自适应噪声对消器模块的输入和分块矩阵的输出之间;和/或自适应噪声对消器,其耦合到固定波束形成器模块并耦合到分块矩阵模块,其中自适应噪声对消滤波器被配置为输出表示在第一传感器和第二传感器处接收的期望音频信号的输出信号。
在某些实施例中,分块矩阵模块被配置为执行下面的步骤,其包括:将空间前置白化近似应用于第一噪声信号;将另一或同一空间前置白化近似应用于第二噪声信号;将估计传感器间信号模型应用于第一噪声输入信号和第二噪声输入信号中的至少一个;在应用估计传感器间信号模型之前组合第一噪声输入信号和第二噪声输入信号;和/或在组合的第一噪声输入信号和第二噪声输入信号上应用逆前置白化滤波器。
根据另一实施例,一种方法可以包括由耦合到多个传感器的处理器从多个传感器接收至少第一噪声输入信号和第二噪声输入信号;和/或由处理器执行估计第一噪声输入信号和第二噪声输入信号之间的传感器间信号模型的基于梯度下降的总最小二乘(GrTLS)算法。
在某些实施例中,该方法还可以包括将前置白化滤波器应用于第一噪声输入信号和第二噪声输入信号中的至少一个;应用前置白化滤波器的步骤可以包括应用空间和时间前置白化滤波器;和/或GrTLS算法可以包括至少一个估计噪声相关统计值,使得噪声相关被维持在自适应噪声对消器模块的输入和分块矩阵的输出之间。
根据另一实施例,装置可以包括用于接收第一噪声输入信号的第一输入节点;用于接收第二噪声输入信号的第二输入节点;和/或处理器,其耦合到第一输入节点、耦合到第二输入节点并被配置为执行下面的步骤:用估计信号a[n]和b[n]之间的传感器间信号模型的前置白化更新算法来执行基于梯度下降的总最小二乘法(GrTLS)或标准化最小平均二乘法(NLMS)。
在某些实施例中,处理器还可以被配置为执行一个步骤,其包括将前置白化滤波器应用于第一噪声输入信号和第二噪声输入信号中的至少一个;应用前置白化滤波器的步骤可以包括应用空间和时间前置白化滤波器;和/或具有前置白化更新算法的GrTLS或NLMS可以包括至少一个估计噪声相关统计值,使得噪声相关被维持在自适应噪声对消器模块的输入和分块矩阵的输出之间。
前述内容相当广泛地概述了本发明的实施例的某些特征和技术优点,以便接下来的具体实施方式可被更好地理解。形成本发明的权利要求的主题的额外的特征和优点将在下文中被描述。本领域中的普通技术人员应认识到,所公开的概念和特定的实施例可以容易被利用,作为用于修改或设计用于实现相同或相似的目的的其它结构。本领域中的普通技术人员还应认识到,这样的等效结构不偏离如在所附权利要求中阐述的本发明的精神和范围。当结合附图被考虑时,从下面的描述将更好地理解额外的特征。然而应明确理解,每个附图为了说明和描述的目的而被提供,且并不旨在限制本发明。
附图说明
为了所公开的系统和方法的更彻底的理解,现在参考结合附图理解的以下描述。
图1是根据现有技术的自适应波束形成器的示例。
图2是示出根据本公开的一个实施例的确定自适应分块矩阵的噪声相关因子的处理块的示例性方框图。
图3是根据本公开的一个实施例的用于使用学习算法来处理麦克风信号的示例性流程图。
图4是根据本公开的一个实施例的用于自适应分块矩阵处理的信号处理的示例性模型。
图5是根据本公开的一个实施例的用于使用前置白化滤波器来进行自适应分块矩阵处理的信号处理的示例性模型。
图6是根据本公开的一个实施例的用于在噪声相关确定之前使用前置白化滤波器来进行自适应分块矩阵处理的信号处理的示例性模型。
图7是根据本公开的一个实施例的用于使用前置白化滤波器来进行自适应分块矩阵处理的信号处理的示例性模型。
图8是根据本公开的一个实施例的用于执行梯度降低总最小二乘(TLS)学习算法的系统的示例性方框图。
图9是示出应用于本公开的某些实施例的某些示例性输入的噪声相关值的示例性曲线。
具体实施方式
当噪声在麦克风之间保持相关时,从处理麦克风输入中得到更好的语音信号。在图2中示出自适应滤波器的处理块,其通过维持噪声相关因子来处理信号。图2是示出根据本公开的一个实施例的确定自适应分块矩阵的噪声相关因子的处理块的示例性方框图。处理器210从可以耦合到麦克风的输入节点202和204接收麦克风数据。麦克风数据被提供到噪声相关确定块212和传感器间信号模型估计器214。传感器间信号模型估计器214还接收由噪声相关确定块212计算的噪声相关因子,例如下面所述的rq2q1。传感器间信号模型估计器214可以实现学习算法,例如标准化最小平均二乘(NLMS)算法或梯度总最小二乘(GrTLS)算法,以生成被提供到另外的处理块或其它部件的噪声信号b[n]。其它部件可以使用b[n]信号来生成例如比在任一麦克风处单独地接收的信号具有降低的噪声的语音信号。
在图3中示出了处理麦克风信号以提高自适应分块矩阵中的噪声相关的方法的示例。图3是根据本公开的一个实施例的使用学习算法来处理麦克风信号的示例性流程图。方法300可以在块302以例如分别从通信设备的第一麦克风和第二麦克风接收第一输入和第二输入开始。在块304,例如在数字信号处理器(DSP)中的处理块可以确定第一输入和第二输入之间的至少一个估计噪声相关统计值。然后,在块306,学习算法可以例如由DSP执行,以估计第一和第二麦克风之间的传感器间模型。当第一输入和第二输入被处理时,估计传感器间模型可以基于块304的所确定的噪声相关统计值并在自适应分块矩阵中被应用来维持第一输入和第二输入之间的噪声相关。例如,通过维持a[n]和b[n]信号之间的噪声相关或更一般地维持自适应噪声对消器块的输入和自适应分块矩阵的输出之间的相关。
根据这样的学习算法由自适应分块矩阵对麦克风信号的处理由图4、图5、图6和图7中所示的处理模型示出。图4是根据本公开的一个实施例的用于自适应分块矩阵处理的信号处理的示例性模型。在自适应波束形成器中,分块矩阵的主要目的是估计具有hest[n]的系统h[n],以便可以通过相减过程来消除期望定向语音信号s[n]。语音信号s[n]可以由两个麦克风检测,其中每个麦克风经历不同的噪声,其中噪声被示为v1[n]和v2[n]。图4的输入节点202和204指示如分别从第一麦克风和第二麦克风接收的信号x1[n]和x2[n]。系统h[n]被表示为添加到第二麦克风信号作为所接收的信号的部分。尽管h[n]被示为添加到信号,但当数字信号处理器从麦克风接收信号x2[n]时,h[n]信号通常是信号x2[n]的不可分离的分量并与其它噪声v2[n]和与语音信号s[n]组合。分块矩阵然后生成将hest[n]估计为模型h[n]的模型402。因此,当hest[n]从第一麦克风x1[n]添加到信号并且那个信号在处理块210中与x2[n]信号组合时,输出信号b[n]抵消期望语音信息。加性噪声v1[n]和v2[n]彼此相关,并且相关的程度取决于麦克风间距。
可以使用自适应滤波器在hest[n]中估计未知的系统h[n]。可以使用如在下面的等式中所示的经典标准化最小平均二乘法(NLMS)来更新自适应滤波器系数:
其中
xk=[x1[k]x1[k-1]...x1[k-L+1]]T
表示信号x1[n]的过去和当前的样本,并且L是可被调节的有限脉冲响应(FIR)滤波器系数的数量,并且μ是可以基于期望适应率而调节的学习率。基于NLMS的滤波器系数估计的收敛的深度可以由存在于信号x1[n](参考信号)和x2[n](输入信号)中的噪声的相关特性限制。
例如当所观察的(参考和输入)信号被不相关的白噪声信号破坏时,可以替代地基于总最小二乘(TLS)方法来计算系统400的自适应滤波器402的系数。在TLS方法的一个实施例中,基于梯度降低的TLS解(GrTLS)由下面的等式给出:
用于估计滤波器系数的由数字信号处理器实现的学习算法的类型(例如NLMS或GrTLS)可以由用户或在处理器上执行的控制算法选择。TLS解优于LS解的收敛提高的深度可以取决于信噪比(SNR)和脉冲响应的最大振幅。
可以基于下面的假设来得到TLS学习算法:加性噪声v1[n]和v2[n]在时间上和空间上都是不相关的。然而,由于存在于麦克风信号之间的空间相关以及还有声学背景噪声在频谱上不是平坦的(即,在时间上相关)的事实,噪声可以是相关的。这个相关噪声可导致学习算法的收敛的深度不足。
可以通过在从麦克风接收的信号x1[n]和x2[n]上应用固定前置白化滤波器来减小时间相关的效应。图5是根据本公开的一个实施例的用于使用白化滤波器进行自适应分块矩阵处理的信号处理的示例性模型。前置白化(PW)块504和506可被添加到处理块210。PW块504和506可将前置白化滤波器分别应用于麦克风信号x1[n]和x2[n],以得到信号y1[n]和y2[n]。在相应的前置白化信号中的噪声分别被表示为q1[n]和q2[n]。可使用第一阶有限脉冲响应(FIR)滤波器来实现前置白化(PW)滤波器。在一个实施例中,PW块504和506可自适应地被修改以解释在信号x1[n]和x2[n]中的变化的噪声频谱。在另一实施例中,PW块504和506可以是固定前置白化滤波器。
PW块504和506可以应用空间和/或时间前置白化。使用基于空间前置白化的更新等式或其它更新等式的选择可由用户或由在控制器行执行的算法控制。在一个实施例中,可以使用相关矩阵的平方根求逆的全部知识来将时间和空间前置白化过程实现为单步骤过程。在另一实施例中,前置白化过程可被分成两个步骤,其中时间前置白化首先被执行,后面是空间前置白化过程。可通过使相关矩阵的平方根求逆近似来执行空间前置白化过程。在另一实施例中,将使用相关矩阵的近似平方根求逆的空间前置白化嵌在信号间模型估计过程的系数更新步骤中。
在应用可以类似于图4的自适应滤波器402的自适应滤波器502并组合信号以形成信号e[n]之后,可以在逆前置白化(IPW)块508中(例如通过在信号e[n]上应用IIR滤波器)来移除前置白化过程的滤波效应。在一个实施例中,PW滤波器的分子和分母系数由(a0=1,a1=0,b0=0.9,b1=-0.7)给出,并且IPW滤波器的分子和分母系数由(a0=0.9,a1=0.7,b0=-0.7,b1=0)给出,其中ai’s和bi’s是IIR滤波器的分母和分子系数。IPW块508的输出是b[n]信号。
可以通过使用可从空间相关矩阵得到的解相关矩阵使噪声解相关来处理空间相关的效应。替代明确地使信号解相关,噪声的交叉相关可以被包括在最小化问题的成本函数中,并且可以为对自适应滤波器502选择的任何学习算法推导出作为估计交叉相关函数的函数的梯度降低算法。
例如,对于TLS学习算法,可以根据下面的等式计算自适应滤波器502的系数:
作为另一示例,对于LS学习算法,可以根据下面的等式计算自适应滤波器502的系数:
其中σq是可以通过取平均噪声功率的平方根来计算的背景噪声的标准偏差,并且其中rq2q1是在时间上白化的麦克风信号之间的交叉相关。可以接着根据下面的等式得到平滑标准偏差:
其中Eq[l]是平均噪声功率,并且α是平滑参数。
通常,背景噪声从远场到达,并且因此在两个麦克风处的噪声功率可以被假设为具有相同的功率。因此,来自麦克风中的任一个的噪声功率可以用于计算Eq[l]。平滑交叉相关估计rq2q1被得到为:
其中
其中m是在样本中的交叉相关延迟滞后,N是用于估计交叉相关的样本的数量并且其被设置为256个样本,l是超帧时间指数——大小为N个样本的噪声缓冲区在该超帧时间指数处被创建,D是在输入x2[n]处引入的因果延迟,并且β是可调节的平滑常数。回来参考图2,上面所述的rq2q1因子可以由噪声相关确定块212来计算。
当滞后增加时,噪声交叉相关值可能是不重要的。为了减小计算复杂度,可计算相应于仅仅选定数量的滞后的交叉相关。最大交叉相关滞后M可因此由用户可调节或由算法确定。可以在存在较小数量的噪声源(例如方向性的、干扰性的、竞争性的谈话者)的应用中或在麦克风彼此紧密地间隔开的情况下使用M的较大值。
在期望语音的存在期间的交叉相关的估计可能破坏噪声相关估计,从而影响期望语音对消性能。因此,交叉相关技术的数据样本的缓冲和平滑的交叉相关的估计可以只在特定的时间被启用,并且可以例如在测定期望语音不存在的情况下有高置信度时被禁用。
图6是根据本公开的一个实施例的用于在噪声相关确定之前使用前置白化滤波器进行自适应分块矩阵处理的信号处理的示例性模型。图6的系统600类似于图5的系统500,但包括噪声相关确定块610。相关块610可以从块504和506接收前置白化麦克风信号作为输入。相关块610可以向自适应滤波器502输出噪声相关参数,例如rq2q1。
图7是根据本公开的一个实施例的用于使用前置白化滤波器和延迟来进行自适应分块矩阵处理的信号处理的示例性模型。图7的系统700类似于图6的系统600,但包括延迟块722。根据期望信号和选定参考信号的到达的方向,系统的脉冲响应h[n]可导致因果系统。可通过在自适应滤波器502的输入处引入延迟(Z-D)块来实现这个因果系统,使得估计脉冲响应是真实系统的时间移动版本。在输入处引入的块722处的延迟可以由用户调节或可以由控制器上执行的算法确定。
在图8中示出了用于实现信号处理块的一个实施例的系统。图8是根据本公开的一个实施例的用于执行梯度降低总最小二乘(TLS)学习算法的系统的示例性方框图。系统800包括噪声信号源802A和802B,例如数字微机电系统(MEMS)麦克风。噪声信号可分别穿过前置时间白化滤波器806A和806B。虽然示出两个滤波器,在一个实施例中,前置白化滤波器可应用于信号源802A和802B中的仅仅一个。前置白化信号然后被提供给相关确定模块810和梯度降低TLS模块808。可在同一处理器例如数字信号处理器(DSP)上执行模块808和810。相关确定模块810可确定例如上面所述的参数rq2q1,其被提供给GrTLS模块808。GrTLS模块808然后产生表示在输入源802A和8082B处接收的语音信号的信号。那个信号然后穿过逆前置白化滤波器812以产生在源802A和802B处接收的信号。此外,滤波器806A、806B和812也在同一处理器或数字信号处理器(DSP)上被实现为GrTLS块808。
可以通过将样本噪声信号应用于系统并确定系统的输出处的噪声降低来示出应用上面所述的示例性系统的结果。图9是示出应用于本公开的某些实施例的某些示例性输入的噪声相关值的示例性曲线。曲线900是在到自适应噪声对消器的参考信号(b[n]信号)与它的输入(a[n]信号)之间的幅度平方相干性的曲线。几乎理想的情况被示为线902。NLMS学习算法的噪声相关曲线被示为线906A和906B。GrTLS学习算法的噪声相关曲线被示为线904A和904B。线904A和904B更接近902的理想情况,特别是在100和1000赫兹之间的频率处,该频率是一般背景噪声的公共频率。因此,上面所述的基于GrTLS的系统可提供优于常规系统的在噪声降低方面的最高提高,至少对于某些噪声信号。而且,当前置白化方法被使用时,噪声相关被提高。
自适应分块矩阵和上面所述的其它部件和方法可以在移动设备中实现以处理从移动设备的近和/或远麦克风接收的信号。移动设备可以是例如移动电话、平板计算机、膝上型计算机或无线耳机。移动设备的处理器例如设备的应用处理器可实现自适应波束形成器、自适应分块矩阵、自适应噪声对消器,例如参考图2、图4、图5、图6、图7和/或图8所述的那些或用于处理的其它电路。可选地,移动设备可包括用于执行这些功能的特定硬件,例如数字信号处理器(DSP)。此外,处理器或DSP可以使用如在上面的实施例和描述中所述的修改的自适应分块矩阵来实现图1的系统。
图3的示意性流程图图示通常被阐述为逻辑流程图。因此,所描绘的顺序和所标记的步骤指示所公开的方法的方面。可以设想在功能、逻辑或效果上与所示方法的一个或多个步骤或其部分等效的其它步骤和方法。此外,所使用的格式和符号被提供来解释该方法的逻辑步骤,并被理解为不限制该方法的范围。虽然可在流程图中使用各种箭头类型和线类型,它们被理解为不限制相应方法的范围。实际上,一些箭头或其它连接符可用于仅指示该方法的逻辑流程。例如,箭头可指示在所描绘的方法的被编号的步骤之间的未指定的持续时间的等待或监控期。此外,特定的方法出现的顺序可以或可以不严格地依附于所示对应步骤的顺序。
如果在固件和/或软件中实现,则上面所述的功能可以在计算机可读介质上被存储为一个或多个指令或代码。示例包括使用数据结构来编码的非暂时性计算机可读介质和使用计算机程序来编码的计算机可读介质。计算机可读介质包括物理计算机存储介质。存储介质可以是可由计算机访问的任何可用介质。作为示例而不是限制,这样的计算机可读介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、压缩盘只读存储器(CD-ROM)或其它光学盘存储器、磁盘存储器或其它磁性存储设备、或可以用于以指令或数据指令的形式存储期望程序代码并可以由计算机访问的任何其它介质。磁盘和光盘包括压缩盘(CD)、激光盘、光学盘、数字多功能盘(DVD)、软盘和蓝光盘。通常,磁盘磁性地再现数据,而光盘光学地再现数据。上述项的组合也可以被包括在计算机可读介质的范围内。
除了存储在计算机可读介质上以外,指令和/或数据也可以被提供为在被包括在通信装置上的传输介质上的信号。例如,通信装置可以包括具有指示指令和数据的信号的收发机。指令和数据被配置为使一个或多个处理器实现权利要求中所概述的功能。
尽管已详细描述了本公开和某些代表性优点,但应理解,可以在本文做出各种变化、替换和变更而不偏离如由所附权利要求限定的本公开的精神和范围。例如,尽管上面的描述指的是处理和提取来自移动设备的麦克风的语音信号,上面所述的方法和系统可以用于从其它设备提取其它信号。可以实现所公开的方法和系统的其它系统包括例如音频设备的处理电路,其可能需要从噪声麦克风信号提取乐器声音。又一系统可以包括可能需要从噪声传感器提取期望信号的雷达、声纳或成像系统。而且,本申请的范围并不是要局限于说明书中所述的事件、模块、方法或步骤的过程、机器、制造、组成。如本领域中的普通技术人将容易从本公开中认识到的,可以利用执行与本文所述的对应实施例实质上相同的功能或实现实质上相同的结果的目前存在的或以后将发展的事件、模块、方法和步骤的过程、机器、制造、组成。因此,所附权利要求是要在它们的范围内包括事件、模块、方法或步骤的这样的过程、机器、制造、组成。
Claims (32)
1.一种方法,包括:
由耦合到多个传感器的处理器接收至少第一噪声输入信号和第二噪声输入信号,第一噪声信号和第二噪声信号中的每个噪声信号来自所述多个传感器;
由所述处理器确定第一输入信号和第二输入信号之间的至少一个估计噪声相关统计值;以及
由所述处理器执行自适应分块矩阵中的学习算法,所述学习算法至少部分地基于所述至少一个估计噪声相关统计值来估计所述第一噪声输入信号和所述第二噪声输入信号之间的传感器间信号模型,使得噪声相关被维持在自适应噪声对消器模块的输入和分块矩阵的输出之间。
2.根据权利要求1所述的方法,其中,执行所述学习算法的步骤包括执行自适应滤波器,所述自适应滤波器至少部分地基于所述估计噪声相关统计值来计算至少一个滤波器系数。
3.根据权利要求2所述的方法,其中,执行所述自适应滤波器的步骤包括对包括所述估计噪声相关统计值的总最小二乘(TLS)成本函数求解。
4.根据权利要求2所述的方法,其中,执行所述自适应滤波器的步骤包括执行包括所述估计噪声相关统计值的梯度下降总最小二乘(GrTLS)学习方法以最小化所述总最小二乘(TLS)成本函数。
5.根据权利要求2所述的方法,其中,执行所述自适应滤波器的步骤包括执行包括所述估计噪声相关统计值的最小二乘(LS)学习方法以最小化最小二乘(LS)成本函数。
6.根据权利要求2所述的方法,其中,执行所述自适应滤波器的步骤包括对最小二乘(TLS)成本函数求解以推导出使用所述估计噪声相关统计值的最小平均二乘(LMS)学习方法。
7.根据权利要求1所述的方法,还包括在确定所述至少一个估计噪声相关统计值的步骤之前由所述处理器对所述第一噪声输入信号和所述第二噪声输入信号中的至少一个噪声输入信号进行滤波。
8.根据权利要求5所述的方法,其中,滤波的步骤包括将空间前置白化近似应用于所述第一噪声信号和所述第二噪声信号中的至少一个噪声信号。
9.根据权利要求8所述的方法,其中,应用所述空间前置白化近似的步骤在没有直接矩阵求逆且没有矩阵平方根计算的情况下被执行。
10.根据权利要求8所述的方法,还包括以下步骤:
将所述估计传感器间信号模型应用于所述第一噪声输入信号和所述第二噪声输入信号中的至少一个噪声输入信号;
在将所述估计传感器间信号模型应用于所述第一噪声输入信号和所述第二噪声输入信号中的至少一个噪声输入信号之后组合所述第一噪声输入信号和所述第二噪声输入信号;以及
在经组合的第一噪声输入信号和第二噪声输入信号上应用逆前置白化滤波器。
11.一种装置,包括:
第一输入节点,其被配置为接收第一噪声输入信号;
第二输入节点,其被配置为接收第二噪声输入信号;
处理器,其耦合到所述第一输入节点并耦合到所述第二输入节点,并且所述处理器被配置为执行包括下列操作的步骤:
从多个传感器接收至少第一噪声输入信号和第二噪声输入信号;
确定所述第一噪声输入信号和所述第二噪声输入信号之间的至少一个估计噪声相关统计值;以及
执行学习算法,所述学习算法至少部分地基于所述至少一个估计噪声相关统计值来估计所述第一噪声输入信号和所述第二噪声输入信号之间的传感器间信号模型,使得噪声相关被维持在自适应噪声对消器模块的输入和分块矩阵的输出之间。
12.根据权利要求11所述的装置,其中,执行所述学习算法的步骤包括执行自适应滤波器,所述自适应滤波器至少部分地基于所述估计噪声相关统计值来计算至少一个滤波器系数。
13.根据权利要求12所述的装置,其中,执行所述自适应滤波器的步骤包括对包括所述估计噪声相关统计值的总最小二乘(TLS)成本函数求解。
14.根据权利要求12所述的装置,其中,执行所述自适应滤波器的步骤包括执行包括所述估计噪声相关统计值的梯度下降总最小二乘(GrTLS)学习方法以最小化总最小二乘(TLS)成本函数。
15.根据权利要求12所述的装置,其中,执行所述自适应滤波器的步骤包括执行包括所述估计噪声相关统计值的最小二乘(LS)学习方法以最小化最小二乘(LS)成本函数。
16.根据权利要求12所述的装置,其中,执行所述自适应滤波器的步骤包括对最小二乘(LS)成本函数求解以推导出使用所述估计噪声相关统计值的最小平均二乘(LMS)学习方法。
17.根据权利要求11所述的装置,其中,所述处理器还被配置为在确定所述至少一个估计噪声相关统计值的步骤之前执行由所述处理器对所述第一噪声输入信号和所述第二噪声输入信号中的至少一个噪声输入信号进行滤波的步骤。
18.根据权利要求17所述的装置,其中,滤波的步骤包括将空间前置白化近似应用于第一噪声信号和第二噪声信号中的至少一个噪声信号。
19.根据权利要求18所述的装置,其中,应用所述空间前置白化近似的步骤在没有直接矩阵求逆且没有矩阵平方根计算的情况下被执行。
20.根据权利要求18所述的装置,其中,所述处理器还被配置为执行包括下列操作的步骤:
将所述估计传感器间信号模型应用于所述第一噪声输入信号和所述第二噪声输入信号中的至少一个噪声输入信号;
在将所述估计传感器间信号模型应用于所述第一噪声输入信号和所述第二噪声输入信号中的至少一个之后组合所述第一噪声输入信号和所述第二噪声输入信号;以及
在经组合的第一噪声输入信号和第二噪声输入信号上应用逆前置白化滤波器。
21.根据权利要求11所述的装置,其中,所述第一输入节点被配置为耦合到近麦克风,并且其中,所述第二输入节点被配置为耦合到远麦克风。
22.根据权利要求11所述的装置,其中,所述处理器是数字信号处理器(DSP)。
23.一种装置,包括:
第一输入节点,其被配置为从第一传感器接收第一噪声输入信号;
第二输入节点,其被配置为从第二传感器接收第二噪声输入信号;
固定波束形成器模块,其耦合到所述第一输入节点并耦合到所述第二输入节点;
自适应分块矩阵模块,其耦合到所述第一输入节点并耦合到所述第二输入节点,其中,所述自适应分块矩阵模块执行学习算法,所述学习算法至少部分地基于至少一个估计噪声相关统计值来估计所述第一噪声输入信号和所述第二噪声输入信号之间的传感器间信号模型;以及
自适应噪声对消器,其耦合到所述固定波束形成器模块并耦合到所述自适应分块矩阵模块,其中,所述自适应噪声对消器被配置为输出表示在所述第一传感器和所述第二传感器处接收到的音频信号的输出信号,
其中,所述自适应分块矩阵模块被配置为将噪声相关维持在所述自适应噪声对消器的输入和所述自适应分块矩阵的输出之间。
24.根据权利要求23所述的装置,其中,所述分块矩阵模块被配置为执行包括下列操作的步骤:
将空间前置白化近似应用于所述第一噪声信号;
将所述空间前置白化近似应用于所述第二噪声信号;
将所述估计传感器间信号模型应用于所述第一噪声输入信号和所述第二噪声输入信号中的至少一个噪声输入信号;
在应用所述估计传感器间信号模型之后组合所述第一噪声输入信号和所述第二噪声输入信号;以及
在经组合的第一噪声输入信号和第二噪声输入信号上应用逆前置白化滤波器。
25.一种方法,包括:
由耦合到多个传感器的处理器从所述多个传感器接收至少第一噪声输入信号和第二噪声输入信号;以及
由所述处理器执行基于梯度下降的总最小二乘(GrTLS)算法,所述基于梯度下降的总最小二乘(GrTLS)算法估计所述第一噪声输入信号和所述第二噪声输入信号之间的传感器间信号模型。
26.根据权利要求25所述的方法,还包括将前置白化滤波器应用于所述第一噪声输入信号和所述第二噪声输入信号中的至少一个噪声输入信号。
27.根据权利要求26所述的方法,其中,应用前置白化滤波器的步骤包括应用空间和时间前置白化滤波器。
28.根据权利要求25所述的方法,其中,执行所述GrTLS算法的步骤包括至少一个估计噪声相关统计值,使得噪声相关被维持在自适应噪声对消器的输入和自适应分块矩阵的输出之间。
29.一种装置,包括:
第一输入节点,其用于接收第一噪声输入信号;
第二输入节点,其用于接收第二噪声输入信号;以及
处理器,其耦合到所述第一输入节点、耦合到所述第二输入节点并被配置为执行以下步骤:执行估计所述第一噪声信号和所述第二噪声输入信号之间的传感器间信号模型的基于梯度下降的总最小二乘(GrTLS)算法。
30.根据权利要求29所述的装置,其中,所述处理器还被配置为执行包括将前置白化滤波器应用于所述第一噪声输入信号和所述第二噪声输入信号中的至少一个噪声输入信号的步骤。
31.根据权利要求29所述的装置,其中,应用前置白化滤波器的步骤包括应用空间和时间前置白化滤波器。
32.根据权利要求29所述的装置,其中,执行所述GrTLS算法的步骤包括至少一个估计噪声相关统计值,使得噪声相关被维持在自适应噪声对消器的输入和自适应分块矩阵的输出之间。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/871,688 US9607603B1 (en) | 2015-09-30 | 2015-09-30 | Adaptive block matrix using pre-whitening for adaptive beam forming |
US14/871,688 | 2015-09-30 | ||
PCT/US2016/040034 WO2017058320A1 (en) | 2015-09-30 | 2016-06-29 | Adaptive block matrix using pre-whitening for adaptive beam forming |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108141656A true CN108141656A (zh) | 2018-06-08 |
CN108141656B CN108141656B (zh) | 2020-01-07 |
Family
ID=55132322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680055768.6A Active CN108141656B (zh) | 2015-09-30 | 2016-06-29 | 用于麦克风的数字信号处理的方法和装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9607603B1 (zh) |
EP (1) | EP3357256B1 (zh) |
JP (1) | JP6534180B2 (zh) |
KR (2) | KR102333031B1 (zh) |
CN (1) | CN108141656B (zh) |
GB (2) | GB2556199B (zh) |
TW (2) | TWI661684B (zh) |
WO (1) | WO2017058320A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10475471B2 (en) | 2016-10-11 | 2019-11-12 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications using a neural network |
US10013995B1 (en) * | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US10395667B2 (en) * | 2017-05-12 | 2019-08-27 | Cirrus Logic, Inc. | Correlation-based near-field detector |
US10297267B2 (en) | 2017-05-15 | 2019-05-21 | Cirrus Logic, Inc. | Dual microphone voice processing for headsets with variable microphone array orientation |
US10319228B2 (en) * | 2017-06-27 | 2019-06-11 | Waymo Llc | Detecting and responding to sirens |
US9947338B1 (en) * | 2017-09-19 | 2018-04-17 | Amazon Technologies, Inc. | Echo latency estimation |
US10885907B2 (en) | 2018-02-14 | 2021-01-05 | Cirrus Logic, Inc. | Noise reduction system and method for audio device with multiple microphones |
US10418048B1 (en) * | 2018-04-30 | 2019-09-17 | Cirrus Logic, Inc. | Noise reference estimation for noise reduction |
US11195540B2 (en) * | 2019-01-28 | 2021-12-07 | Cirrus Logic, Inc. | Methods and apparatus for an adaptive blocking matrix |
US10839821B1 (en) * | 2019-07-23 | 2020-11-17 | Bose Corporation | Systems and methods for estimating noise |
CN110464343A (zh) * | 2019-08-16 | 2019-11-19 | 杭州电子科技大学 | 一种基于自主手部动作的增强型脑肌相干方法 |
US10735887B1 (en) * | 2019-09-19 | 2020-08-04 | Wave Sciences, LLC | Spatial audio array processing system and method |
US11997474B2 (en) * | 2019-09-19 | 2024-05-28 | Wave Sciences, LLC | Spatial audio array processing system and method |
US11508379B2 (en) | 2019-12-04 | 2022-11-22 | Cirrus Logic, Inc. | Asynchronous ad-hoc distributed microphone array processing in smart home applications using voice biometrics |
US11025324B1 (en) | 2020-04-15 | 2021-06-01 | Cirrus Logic, Inc. | Initialization of adaptive blocking matrix filters in a beamforming array using a priori information |
USD998712S1 (en) * | 2021-08-10 | 2023-09-12 | Pacoware Inc. | Block play board |
CN116320947B (zh) * | 2023-05-17 | 2023-09-01 | 杭州爱听科技有限公司 | 一种应用于助听器的频域双通道语音增强方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101278337A (zh) * | 2005-07-22 | 2008-10-01 | 索福特迈克斯有限公司 | 噪声环境中语音信号的健壮分离 |
US20110142247A1 (en) * | 2008-07-29 | 2011-06-16 | Dolby Laboratories Licensing Corporation | MMethod for Adaptive Control and Equalization of Electroacoustic Channels |
US20120288124A1 (en) * | 2011-05-09 | 2012-11-15 | Dts, Inc. | Room characterization and correction for multi-channel audio |
CN104301999A (zh) * | 2014-10-14 | 2015-01-21 | 西北工业大学 | 一种基于rssi的无线传感器网络自适应迭代定位方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56119517A (en) * | 1980-02-26 | 1981-09-19 | Matsushita Electric Ind Co Ltd | Amplitude limiting circuit |
EP0095902A1 (en) * | 1982-05-28 | 1983-12-07 | British Broadcasting Corporation | Headphone level protection circuit |
CA2399159A1 (en) | 2002-08-16 | 2004-02-16 | Dspfactory Ltd. | Convergence improvement for oversampled subband adaptive filters |
ATE487332T1 (de) * | 2003-07-11 | 2010-11-15 | Cochlear Ltd | Verfahren und einrichtung zur rauschverminderung |
US7415117B2 (en) * | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
KR101149571B1 (ko) | 2004-04-28 | 2012-05-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 적응성 빔 형성기, 사이드로브 소거기, 핸즈프리 음성 통신 디바이스 |
US8106827B2 (en) * | 2006-04-20 | 2012-01-31 | Nec Corporation | Adaptive array control device, method and program, and adaptive array processing device, method and program |
KR20070117171A (ko) * | 2006-06-07 | 2007-12-12 | 삼성전자주식회사 | 오디오 앰프의 입력이득 제한 장치 및 방법 |
US8270625B2 (en) * | 2006-12-06 | 2012-09-18 | Brigham Young University | Secondary path modeling for active noise control |
US8005238B2 (en) * | 2007-03-22 | 2011-08-23 | Microsoft Corporation | Robust adaptive beamforming with enhanced noise suppression |
WO2009034524A1 (en) | 2007-09-13 | 2009-03-19 | Koninklijke Philips Electronics N.V. | Apparatus and method for audio beam forming |
US8401206B2 (en) * | 2009-01-15 | 2013-03-19 | Microsoft Corporation | Adaptive beamformer using a log domain optimization criterion |
EP2237270B1 (en) | 2009-03-30 | 2012-07-04 | Nuance Communications, Inc. | A method for determining a noise reference signal for noise compensation and/or noise reduction |
KR101581885B1 (ko) | 2009-08-26 | 2016-01-04 | 삼성전자주식회사 | 복소 스펙트럼 잡음 제거 장치 및 방법 |
CN102903368B (zh) * | 2011-07-29 | 2017-04-12 | 杜比实验室特许公司 | 用于卷积盲源分离的方法和设备 |
US9078057B2 (en) * | 2012-11-01 | 2015-07-07 | Csr Technology Inc. | Adaptive microphone beamforming |
US20140270241A1 (en) * | 2013-03-15 | 2014-09-18 | CSR Technology, Inc | Method, apparatus, and manufacture for two-microphone array speech enhancement for an automotive environment |
US20140270219A1 (en) * | 2013-03-15 | 2014-09-18 | CSR Technology, Inc. | Method, apparatus, and manufacture for beamforming with fixed weights and adaptive selection or resynthesis |
CN204761691U (zh) * | 2015-07-29 | 2015-11-11 | 泉州品荣商贸有限公司 | 一种对讲机音频电路 |
-
2015
- 2015-09-30 US US14/871,688 patent/US9607603B1/en active Active
- 2015-11-05 GB GB1716064.9A patent/GB2556199B/en active Active
- 2015-11-05 GB GB1519514.2A patent/GB2542862B/en active Active
-
2016
- 2016-06-29 KR KR1020197002784A patent/KR102333031B1/ko active IP Right Grant
- 2016-06-29 JP JP2018515532A patent/JP6534180B2/ja not_active Expired - Fee Related
- 2016-06-29 EP EP16738615.0A patent/EP3357256B1/en active Active
- 2016-06-29 KR KR1020187006782A patent/KR101976135B1/ko active IP Right Grant
- 2016-06-29 CN CN201680055768.6A patent/CN108141656B/zh active Active
- 2016-06-29 WO PCT/US2016/040034 patent/WO2017058320A1/en active Application Filing
- 2016-09-12 TW TW107110670A patent/TWI661684B/zh active
- 2016-09-12 TW TW105129556A patent/TWI660614B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101278337A (zh) * | 2005-07-22 | 2008-10-01 | 索福特迈克斯有限公司 | 噪声环境中语音信号的健壮分离 |
US20110142247A1 (en) * | 2008-07-29 | 2011-06-16 | Dolby Laboratories Licensing Corporation | MMethod for Adaptive Control and Equalization of Electroacoustic Channels |
CN102113346A (zh) * | 2008-07-29 | 2011-06-29 | 杜比实验室特许公司 | 用于电声通道的自适应控制和均衡的方法 |
US20120288124A1 (en) * | 2011-05-09 | 2012-11-15 | Dts, Inc. | Room characterization and correction for multi-channel audio |
CN104301999A (zh) * | 2014-10-14 | 2015-01-21 | 西北工业大学 | 一种基于rssi的无线传感器网络自适应迭代定位方法 |
Also Published As
Publication number | Publication date |
---|---|
US20170092256A1 (en) | 2017-03-30 |
CN108141656B (zh) | 2020-01-07 |
TWI660614B (zh) | 2019-05-21 |
KR20190011839A (ko) | 2019-02-07 |
WO2017058320A1 (en) | 2017-04-06 |
TW201714442A (zh) | 2017-04-16 |
GB2542862A (en) | 2017-04-05 |
KR101976135B1 (ko) | 2019-05-07 |
GB2542862B (en) | 2019-04-17 |
GB201716064D0 (en) | 2017-11-15 |
EP3357256A1 (en) | 2018-08-08 |
TW201826725A (zh) | 2018-07-16 |
JP6534180B2 (ja) | 2019-06-26 |
TWI661684B (zh) | 2019-06-01 |
KR102333031B1 (ko) | 2021-11-29 |
KR20180039138A (ko) | 2018-04-17 |
JP2018528717A (ja) | 2018-09-27 |
EP3357256B1 (en) | 2022-03-30 |
US9607603B1 (en) | 2017-03-28 |
GB201519514D0 (en) | 2015-12-23 |
GB2556199A (en) | 2018-05-23 |
GB2556199B (en) | 2018-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108141656A (zh) | 使用用于自适应波束形成的前置白化的自适应分块矩阵 | |
CN108172231B (zh) | 一种基于卡尔曼滤波的去混响方法及系统 | |
US20180358032A1 (en) | System for collecting and processing audio signals | |
KR20190085927A (ko) | 적응성 빔포밍 | |
CN112863535B (zh) | 一种残余回声及噪声消除方法及装置 | |
US8761410B1 (en) | Systems and methods for multi-channel dereverberation | |
van Waterschoot et al. | Double-talk-robust prediction error identification algorithms for acoustic echo cancellation | |
CN110211602B (zh) | 智能语音增强通信方法及装置 | |
CN116030823B (zh) | 一种语音信号处理方法、装置、计算机设备及存储介质 | |
EP1589783A2 (en) | System and method for separating multiple sources using directional filtering | |
KR20220022286A (ko) | 잔향 제거 오토 인코더를 이용한 잔향 환경 임베딩 추출 방법 및 장치 | |
Schwartz et al. | Nested generalized sidelobe canceller for joint dereverberation and noise reduction | |
US20230060081A1 (en) | Signal processing device, signal processing method, and program | |
Jukic et al. | A general framework for incorporating time–frequency domain sparsity in multichannel speech dereverberation | |
EP4032321A1 (en) | Enhancement of audio from remote audio sources | |
US11195540B2 (en) | Methods and apparatus for an adaptive blocking matrix | |
Kodrasi et al. | Instrumental and perceptual evaluation of dereverberation techniques based on robust acoustic multichannel equalization | |
WO2014097470A1 (ja) | 残響除去装置 | |
EP4383255A1 (en) | Acoustic interference suppression through speaker-aware processing | |
CN109905811B (zh) | 一种经济型声反馈控制的方法及装置 | |
Xiong et al. | System identification for listening-room compensation by means of acoustic echo cancellation and acoustic echo suppression filters | |
Sun et al. | Multi-channel linear prediction speech dereverberation algorithm based on qr-rls adaptive filter | |
JP2017083583A (ja) | 雑音抑圧装置、その方法及びプログラム | |
Uppaluru | Blind deconvolution and adaptive algorithms for de-reverberation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |