CN111243615B - 麦克风阵列信号处理方法及手持式装置 - Google Patents
麦克风阵列信号处理方法及手持式装置 Download PDFInfo
- Publication number
- CN111243615B CN111243615B CN202010017312.9A CN202010017312A CN111243615B CN 111243615 B CN111243615 B CN 111243615B CN 202010017312 A CN202010017312 A CN 202010017312A CN 111243615 B CN111243615 B CN 111243615B
- Authority
- CN
- China
- Prior art keywords
- sound pressure
- sound
- signal
- degrees
- source angle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Abstract
一种麦克风阵列信号处理方法,包含声音信号接收步骤、声压信号产生步骤、声压值判定步骤、声源角度判定步骤及增强信号产生步骤。在声压值判定步骤中,各应用声压信号所对应的频率小于应用频率,判定应用声压信号中任一者的声压值是否大于声压阈值。在声源角度判定步骤中,当应用声压信号中所述一者的声压值大于声压阈值时,判定应用声压信号中所述一者的声源角度是否介于‑45度至45度之间。在增强信号产生步骤中,当所述声源角度介于‑45度至45度之间时,将总声压信号的声压值加上增强权重值而成为增强信号。因此,提供使用者所需的声音品质。
Description
技术领域
本发明涉及一种麦克风阵列信号处理方法及手持式装置,且特别涉及导入应用频率的一种麦克风阵列信号处理方法及手持式装置。
背景技术
近年来网络通信发达,视频会议及多人会议机已广为大众所使用,以麦克风阵列的方法强化收音品质逐渐受到重视,而将麦克风阵列应用于手持式装置也成了未来的趋势。手持式装置的特点在于可以随时随地使用,然而在吵杂的环境中,使用者在麦克风的体验会大幅降低。
在一种现有技术的含有麦克风阵列的手持式装置中,可增强麦克风在特定方向(例如使用者方向)的感度,但因受限于麦克风间距的物理限制,应用的频宽比较小,以及特定方向的感度提升及非特定方向的感度抑制并不是非常的显着。再者,非特定方向常产生旁办效应,即空间混叠(Spatial Aliasing),这会造成波束在其他方向产生,而造成错误的声源音量提升。以图5为例,现有技术的手持式装置在频率约为1kHz以上时即有所谓空间混叠的效应产生,非特定方向90度及270度所产生的旁办会加强此方向的接收强度,造成错误方向的声压增量,且在频率低于600Hz的情况下,其他方向的感度抑制已不太显着,显见现有技术的手持式装置在收音品质有其限制性。
根据上述,市场上亟需一种麦克风阵列信号处理方法及手持式装置,其可强化手持式装置在扩音模式中使用者方向的收音效果,并同时抑制其他方向产生的噪音,提高噪声环境下收音的强健性,大幅改善手机等手持式装置在扩音模式时的收音品质。
发明内容
本发明提供一种麦克风阵列信号处理方法及执行所述方法的手持式装置,通过麦克风阵列信号处理方法中的声压值判定步骤、声源角度判定步骤及增强信号产生步骤,可强化手持式装置在扩音模式中使用者方向的收音效果,并同时抑制其他方向产生的噪音,提高噪声环境下收音的强健性,大幅改善手持式装置在扩音模式时的收音品质。
依据本发明一实施方式提供一种麦克风阵列信号处理方法,用于麦克风阵列,麦克风阵列包含多个麦克风,所述麦克风具有预设的中心位置、应用频率及声压阈值,麦克风阵列信号处理方法包含声音信号接收步骤、声压信号产生步骤、声压值判定步骤、声源角度判定步骤及增强信号产生步骤。在声音信号接收步骤中,通过各麦克风接收多个声音信号。在声压信号产生步骤中,将各麦克风所接收的声音信号转换为频域上的多个声压信号,各声压信号对应一频率及相对于中心位置的一声源角度。在声压值判定步骤中,一部分数量的声压信号为多个应用声压信号,各应用声压信号所对应的频率小于应用频率,判定应用声压信号中任一者的声压值是否大于声压阈值。在声源角度判定步骤中,当应用声压信号中所述一者的声压值大于声压阈值时,通过最小变异量无失真响应演算法判定应用声压信号中所述一者的声源角度是否介于-45度至45度之间。在增强信号产生步骤中,依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号,总声压信号对应所述声源角度,当所述声源角度介于-45度至45度之间时,将总声压信号的声压值加上增强权重值而成为增强信号,增强权重值大于0dB。因此,有助增强主要声源预设方向发出的声音,同时有效区隔其他方向发出的噪音,以有助提供使用者所需的声音信号品质。
根据前述实施方式的麦克风阵列信号处理方法,还包含声压值保持步骤,当应用声压信号中另一者的声压值不大于声压阈值时,应用声压信号中所述另一者的声压值保持不变。
根据前述实施方式的麦克风阵列信号处理方法,其中在声源角度判定步骤中,判定应用声压信号中所述一者的声源角度是否介于-30度至30度之间。在增强信号产生步骤中,当声源角度介于-30度至30度之间时,将总声压信号的声压值加上增强权重值而成为增强信号,增强权重值大于0dB。麦克风阵列信号处理方法还包含抑制信号产生步骤,依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号,总声压信号对应声源角度,当声源角度不介于-30度至30度之间时,将总声压信号的声压值加上抑制权重值而成为抑制信号,抑制权重值小于0dB。
根据前述实施方式的麦克风阵列信号处理方法,其中在声源角度判定步骤中,通过最小变异量无失真响应演算法判定应用声压信号中所述一者的声源角度是否介于-30度至30度之间。在增强信号产生步骤中,通过宽边阵列演算法且依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号。在抑制信号产生步骤中,通过宽边阵列演算法且依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号。
根据前述实施方式的麦克风阵列信号处理方法,其中声压阈值大于60dB且小于110dB,增强权重值大于0dB且小于20dB,抑制权重值大于-20dB且小于0dB。
根据前述实施方式的麦克风阵列信号处理方法,其中麦克风的数量为两个,麦克风分别设置于手持式装置的两端,应用频率与麦克风之间的距离成反比,声源零度方向垂直于距离的方向且位于麦克风的前方。
通过前述实施方式的麦克风阵列信号处理方法,有助记录或输出使用者所需的声音信号品质。
依据本发明另一实施方式提供一种手持式装置,执行前述的麦克风阵列信号处理方法,手持式装置包含麦克风阵列及麦克风阵列信号处理单元。麦克风阵列包含多个麦克风。麦克风阵列信号处理单元通信连接麦克风,麦克风阵列信号处理单元执行声压信号产生步骤、声压值判定步骤、声源角度判定步骤及增强信号产生步骤。因此,有效区隔主要声源预设方向与其他方向发出的声音,同时简化手持式装置的软硬件设计。
根据前述实施方式的手持式装置,其中在声源角度判定步骤中,通过最小变异量无失真响应演算法判定应用声压信号中所述一者的声源角度是否介于-30度至30度之间。在增强信号产生步骤中,通过宽边阵列演算法且依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号,当声源角度介于-30度至30度之间时,将总声压信号的声压值加上增强权重值而成为增强信号,增强权重值大于0dB。麦克风阵列信号处理方法还包含抑制信号产生步骤,通过宽边阵列演算法且依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号,总声压信号对应声源角度,当声源角度不介于-30度至30度之间时,将总声压信号的声压值加上抑制权重值而成为抑制信号,抑制权重值小于0dB。
根据前述实施方式的手持式装置,其中声压阈值大于60dB且小于110dB,增强权重值大于0dB且小于20dB,抑制权重值大于-20dB且小于0dB。
根据前述实施方式的手持式装置,其中麦克风的数量为两个,麦克风分别设置于手持式装置的两端,应用频率与麦克风之间的距离成反比,声源零度方向垂直于距离的方向且位于麦克风的前方。
通过前述实施方式的手持式装置,有助于提升手持式装置在扩音模式时的收音品质。
附图说明
图1示出本发明第一实施例的麦克风阵列信号处理方法的流程图;
图2示出本发明第二实施例的麦克风阵列信号处理方法的流程图;
图3A示出本发明第三实施例的手持式装置的方框图;
图3B示出第三实施例的手持式装置的立体图;
图3C示出第三实施例的手持式装置的使用状态示意图;
图3D示出第三实施例的手持式装置的测量结果示意图;
图4示出现有技术中一手持式装置的测量结果示意图;以及
图5示出现有技术中另一手持式装置的测量结果示意图。
附图标记说明:
100、200…麦克风阵列信号处理方法
110、210…声音信号接收步骤
120、220…声压信号产生步骤
130、230…声压值判定步骤
232…声压值保持步骤
140、240…声源角度判定步骤
141、241…增强信号产生步骤
242…抑制信号产生步骤
300…手持式装置
370…麦克风阵列
371、372…麦克风
380…麦克风阵列信号处理单元
390…输出单元
800…声源
d…二麦克风之间的距离
c0…中心位置
r1、r2…声源至麦克风的传递距离
a0…声源零度方向
具体实施方式
以下将参照附图说明本发明的多个实施例。为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本发明。也就是说,在本发明部分实施例中,这些实务上的细节是非必要的。此外,为简化附图起见,一些现有惯用的结构与元件在附图中将以简单示意的方式示出的;并且重复的元件将可能使用相同的编号表示的。
请参照图1,其示出本发明第一实施例的麦克风阵列信号处理方法100的流程图。由图1可知,麦克风阵列信号处理方法100为一种数字信号处理(Digital SignalProcessing)方法,麦克风阵列信号处理方法100用于麦克风阵列(Microphone Array),麦克风阵列包含多个麦克风,所述多个麦克风具有预设的中心位置、预设的应用频率(Applying Frequency)及预设的声压阈值,麦克风阵列信号处理方法100包含声音信号接收步骤110、声压信号产生步骤120、声压值判定步骤130、声源角度判定步骤140及增强信号产生步骤141。再者,麦克风的数量可为两个或三个以上,中心位置为所述线性排列的多个麦克风之间的几何中心位置,应用频率亦可称为混叠频率(Aliasing Frequency)。
在声音信号接收步骤110中,通过各麦克风接收时域上的多个声音信号。
在声压信号产生步骤120中,将各麦克风所接收的声音信号转换为频域上的多个声压信号,各声压信号对应一频率及相对于中心位置的一声源角度(即声源方向)。再者,在声压信号产生步骤120中,未得知或未精确得知各声压信号的相对于中心位置的声源角度,且声源角度可延伸应用为球坐标中的任一角度或任一立体角。
在声压值判定步骤130中,一部分数量的声压信号为多个应用声压信号,各应用声压信号所对应的频率小于应用频率,判定应用声压信号中任一者的声压值(即声压级,Sound Pressure Level)是否大于声压阈值。
在声源角度判定步骤140中,当应用声压信号中所述一者的声压值大于声压阈值时,通过最小变异量无失真响应(Minimum-Variance Distortionless Response,MVDR)演算法判定应用声压信号中所述一者的声源角度是否介于-45度至45度(包含-45度及45度)之间。再者,声源角度0度为麦克风阵列信号处理方法100中的主要声源预设方向。
在增强信号产生步骤141中,依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号,总声压信号对应所述声源角度,当所述声源角度介于-45度至45度之间时,将总声压信号的声压值加上增强权重值而成为增强信号,增强权重值大于0dB。因此,麦克风阵列信号处理方法100可提供具有语音会议机的远场指向收音功能,以及非收音方向(即非主要声源预设方向)抵噪,提升手持式装置在扩音模式时的收音品质。
此外,依据本发明的手持式装置(未另图示)执行前述的麦克风阵列信号处理方法100,手持式装置包含麦克风阵列及麦克风阵列信号处理单元。麦克风阵列包含多个麦克风。麦克风阵列信号处理单元通信连接麦克风,麦克风阵列信号处理单元执行声压信号产生步骤120、声压值判定步骤130、声源角度判定步骤140及增强信号产生步骤141。因此,依据本发明的手持式装置可提供具有语音会议机的远场指向收音功能,以及非收音方向抵噪,提升手持式装置在扩音模式时的收音品质。
请参照图2及图3A至图3C,其中图2示出本发明第二实施例的麦克风阵列信号处理方法200的流程图,图3A示出本发明第三实施例的手持式装置300的方框图,图3B示出第三实施例的手持式装置300的立体图,图3C示出第三实施例的手持式装置300的使用状态示意图。由图2及图3A至图3C可知,第二实施例的麦克风阵列信号处理方法200用于第三实施例的手持式装置300的麦克风阵列370,麦克风阵列370包含两个麦克风(具体上为麦克风371、372),麦克风371、372具有预设的中心位置c0、预设的应用频率及预设的声压阈值,麦克风阵列信号处理方法200包含声音信号接收步骤210、声压信号产生步骤220、声压值判定步骤230、声源角度判定步骤240及增强信号产生步骤241。
在声音信号接收步骤210中,通过麦克风371、372中各者接收时域上的多个声音信号。
在声压信号产生步骤220中,将麦克风371、372中各者所接收的声音信号以快速傅里叶(Fast Fourier Transform,FFT)转换为频域上的多个声压信号,各声压信号对应一频率及相对于中心位置c0的一声源角度。
在声压值判定步骤230中,一部分数量的声压信号为多个应用声压信号,各应用声压信号所对应的频率小于应用频率,判定应用声压信号中任一者的声压值是否大于声压阈值。
具体而言,在声源角度判定步骤240中,当应用声压信号中所述一者的声压值大于声压阈值时,通过最小变异量无失真响应演算法判定应用声压信号中所述一者的声源角度是否介于-30度至30度(包含-30度及30度)之间。因此,有助筛选主要声源预设方向(可介于-30度至30度之间)发出的声音。再者,声源角度0度为麦克风阵列信号处理方法200中的主要声源预设方向,声源角度可延伸应用为球坐标中的任一角度或任一立体角。
在增强信号产生步骤241中,依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号,总声压信号对应所述声源角度,当所述声源角度介于-30度至30度之间时,将总声压信号的声压值加上增强权重值而成为增强信号,增强权重值大于0dB。因此,更加有助增强主要声源预设方向发出的声音,同时有效区隔其他方向发出的噪音。
进一步而言,请一并参照图3B及图3C,麦克风371、372分别设置于手持式装置300的两端,应用频率与麦克风371、372之间的距离d成反比,声源零度方向a0垂直于距离d的方向且位于麦克风371、372的前方,其中声源零度方向a0为声源角度0度的方向。因此,有助麦克风阵列信号处理方法200应用于手持式装置300时,记录或输出使用者所需的声音信号品质。
请参照以下式(1),其中fa为预设的应用频率,音速或声速为343m/sec,d为二麦克风之间的距离。以手持式装置300举例而言,手持式装置300具体上为一智能手机,麦克风371、372之间的距离d为0.15m,由以下式(1)可得出麦克风371、372预设的应用频率fa的数值约为1.1kHz。
fa=343÷(d×2) 式(1)
由图2可知,麦克风阵列信号处理方法200还包含声压值保持步骤232,当应用声压信号中另一者的声压值不大于声压阈值时,应用声压信号中所述另一者的声压值保持不变。因此,有助简化麦克风阵列信号处理方法200的复杂度。
麦克风阵列信号处理方法200还包含抑制信号产生步骤242,依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号,总声压信号对应声源角度,当声源角度不介于-30度至30度之间时,将总声压信号的声压值加上抑制权重值而成为抑制信号,抑制权重值小于0dB,所述抑制信号即为被衰减的信号。因此,有效区隔来自主要声源预设方向的增强信号与来自其他方向的抑制信号,增加麦克风阵列演算法的应用频宽,同时简化麦克风阵列信号处理方法200的演算复杂度。
在声源角度判定步骤240中,通过最小变异量无失真响应演算法判定应用声压信号中所述一者的声源角度是否介于-30度至30度之间。在增强信号产生步骤241中,通过宽边阵列演算法(Broadside Array Algorithm)且依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号。在抑制信号产生步骤242中,通过宽边阵列演算法且依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号。因此,有助在自由声场中的球面波模型下,将麦克风371、372所接收的信号在特定方向(即主要声源预设方向)进行波束成形(Beamforming)。
进一步而言,麦克风阵列信号处理方法200利用MVDR先将声源角度做精确定位,并结合宽边阵列演算法将预设的使用者声源角度的感度提升,并抑制其他方向的音量。MVDR是一种信号自适应的波束成形方法,其目标是最小化信号的方差。因噪音信号通常与音频信号不相关(Uncorrelated),录制信号的方差(Variance)即为预设主要声源信号与噪音信号的方差之和。MVDR通过寻求最小化该总和,减轻噪音信号的影响,来达到高精确度的定位效果,其波束成形器方程式如以下式(2),其中w为权重向量,aH(θ)为a(θ)的转置矩阵,为录制声音信号的自相关(Autocorrelation)阵列,a(θ)为各个频率声源的传递角度阵列。
在增强信号产生步骤241及抑制信号产生步骤242中,宽边阵列演算法如以下式(3)。请一并参照图3C及以下式(3),麦克风371、372获取的信号可视为自由声场传递模型,假设其声源800的强度为A,经球面波传递的声压分别为P1及P2,其中式(3)中的k为波数且“k=2πf/c”,即k由声音频率f及声音在空气中的传递速度c决定,而r1、r2分别为声源800至麦克风371、372的传递距离。通过加总信号强度可得麦克风信号在各频率f的信号为S(f),其加总后的效果可令邻近主要声源预设方向(即使用者方向,声源信号0度)的麦克风信号在特定的频率以下得到强化,初步增加主要声源预设方向的麦克风感度。进一步地,在增强信号产生步骤241及抑制信号产生步骤242中,在预设主要声源范围的声压值加上增强权重值而成为增强信号,在其他方向范围的声压值加上抑制权重值而成为抑制信号,有助增加麦克风阵列演算法的应用频宽,以记录或输出使用者所需的声音信号品质。
通过MVDR精准的定位效果,麦克风阵列信号处理方法200以两阶段的阵列运算方式先判断应用频率范围内的发声源是否介于-30度至30度之间,若确认在此范围则将宽边阵列演算法的声音信号进一步具体提升两倍(即增强权重值为6dB),其他方向角度则抑制两倍(即抑制权重值为-6dB),以麦克风阵列信号处理方法200所强化的语音收音效果,让手持式装置300在视频通话或多人会议时的使用体验更好。
第二实施例的麦克风阵列信号处理方法200中,声压阈值大于60dB且小于110dB,增强权重值大于0dB且小于20dB,抑制权重值大于-20dB且小于0dB,其中声压阈值的单位为以20微帕斯卡(μPa)为参考值的绝对单位,增强权重值及抑制权重值为相对单位。因此,有助记录或输出使用者所需的声音信号品质。再者,声压阈值可大于60dB且小于80dB,增强权重值可大于3dB且小于10dB,抑制权重值可大于-10dB且小于-3dB。第二实施例的麦克风阵列信号处理方法200中,声压阈值具体上为70dB,增强权重值具体上为6dB,抑制权重值具体上为-6dB。
依据本发明第三实施例的手持式装置300执行前述的麦克风阵列信号处理方法200,手持式装置300包含麦克风阵列370及麦克风阵列信号处理单元380。麦克风阵列370包含麦克风371、372。麦克风阵列信号处理单元380通信连接麦克风371、372,麦克风阵列信号处理单元380执行声压信号产生步骤220、声压值判定步骤230、声压值保持步骤232、声源角度判定步骤240、增强信号产生步骤241及抑制信号产生步骤242。因此,手持式装置300可提供具有语音会议机的远场指向收音功能,以及非收音方向抵噪,并增加麦克风阵列信号处理方法200的应用频宽,提升手持式装置300在扩音模式时的收音品质。再者,麦克风阵列信号处理单元380具体上可包含处理元件(例如处理器)及存储元件(例如存储器)。手持式装置300可还包含输出单元390,且应可了解麦克风阵列信号处理方法200中的增强信号、抑制信号、声压值保持信号可记录于麦克风阵列信号处理单元380的存储元件中,或由麦克风阵列信号处理单元380输出至输出单元390,其中输出单元390可为扬声器、射频收发器,且不以此为限。
第三实施例中,麦克风371、372分别设置于手持式装置300的两端,应用频率与麦克风371、372之间的距离d成反比,声源零度方向a0垂直于距离d的方向且位于麦克风371、372的前方,其中声源零度方向a0为声源角度0度的方向。因此,有助手持式装置300记录或输出使用者所需的声音信号品质。
手持式装置300所执行的麦克风阵列信号处理方法200中,在声源角度判定步骤240中,通过最小变异量无失真响应演算法判定应用声压信号中所述一者的声源角度是否介于-30度至30度之间。在增强信号产生步骤241中,通过宽边阵列演算法且依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号,当声源角度介于-30度至30度之间时,将总声压信号的声压值加上增强权重值而成为增强信号,增强权重值大于0dB。麦克风阵列信号处理方法200还包含抑制信号产生步骤242,通过宽边阵列演算法且依据对应相同的声源角度的应用声压信号中所述一者及其他者而得出总声压信号,总声压信号对应声源角度,当声源角度不介于-30度至30度之间时,将总声压信号的声压值加上抑制权重值而成为抑制信号,抑制权重值小于0dB。因此,有效区隔主要声源预设方向与其他方向发出的声音,同时简化手持式装置300的软硬件设计。
手持式装置300所执行的麦克风阵列信号处理方法200中,声压阈值大于60dB且小于110dB,增强权重值大于0dB且小于20dB,抑制权重值大于-20dB且小于0dB。因此,有助记录或输出使用者所需的声音信号品质。再者,声压阈值可大于60dB且小于80dB,增强权重值可大于3dB且小于10dB,抑制权重值可大于-10dB且小于-3dB。第三实施例的手持式装置300中,声压阈值具体上为70dB,增强权重值具体上为6dB,抑制权重值具体上为-6dB。
请参照图3D、图4及图5,其中图3D示出第三实施例的手持式装置300的测量结果示意图,图4示出现有技术中未使用任何麦克风阵列信号处理方法的一手持式装置的测量结果示意图,图5示出现有技术中未使用本发明的麦克风阵列信号处理方法的一手持式装置的测量结果示意图,且图3D、图4及图5具体上皆为一平面上的感度极化图(PolarPattern),所述平面通过二麦克风并垂直于手持式装置。由图3D、图4及图5可知,图3D对应的手持式装置300相较于图4对应的未使用任何麦克风阵列信号处理方法的手持式装置,能够为声源角度-30度至30度之间的声压值增加约10dB的大小。其他方向于应用频率以下的声压值也能够被有效的抑制,例如图3D中声源角度90度及270度、频率300Hz的声压值,相较于图5中多抑制了6dB的音量,克服了原本低频信号中指向效果不显着的情况,使得麦克风阵列信号处理方法200的使用频宽增加了。因此,麦克风阵列信号处理方法200能与手持式装置300结合应用,提升手持式装置300在视频会议或多人会议中的语音收音效果。此外,依据本发明的麦克风阵列信号处理方法200具有感度对称性质,例如图3D中声源角度150度至210度之间的声音亦被增强。
虽然本发明已以实施方式公开如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的构思和范围内,当可作各种的变动与润饰,因此本发明的保护范围当视权利要求所界定者为准。
Claims (10)
1.一种麦克风阵列信号处理方法,其特征在于,用于一麦克风阵列,该麦克风阵列包含多个麦克风,所述多个麦克风具有预设的一中心位置、一混叠频率及一声压阈值,该麦克风阵列信号处理方法包含:
一声音信号接收步骤,通过各该麦克风接收多个声音信号;
一声压信号产生步骤,将各该麦克风所接收的所述多个声音信号转换为频域上的多个声压信号,各该声压信号对应一频率及相对于该中心位置的一声源角度;
一声压值判定步骤,一部分数量的所述多个声压信号为多个应用声压信号,各该应用声压信号所对应的该频率小于该混叠频率,判定所述多个应用声压信号中任一者的一声压值是否大于该声压阈值;
一声源角度判定步骤,当所述多个应用声压信号中该者的该声压值大于该声压阈值时,通过一最小变异量无失真响应演算法判定所述多个应用声压信号中该者的该声源角度是否介于-45度至45度之间;以及
一增强信号产生步骤,依据对应相同的该声源角度的所述多个应用声压信号中该者及其他者而得出一总声压信号,该总声压信号对应该声源角度,当该声源角度介于-45度至45度之间时,将该总声压信号的一声压值加上一增强权重值而成为一增强信号,该增强权重值大于0dB。
2.如权利要求1所述的麦克风阵列信号处理方法,其特征在于,还包含:
一声压值保持步骤,当所述多个应用声压信号中另一者的该声压值不大于该声压阈值时,所述多个应用声压信号中该另一者的该声压值保持不变。
3.如权利要求1所述的麦克风阵列信号处理方法,其特征在于,在该声源角度判定步骤中,判定所述多个应用声压信号中该者的该声源角度是否介于-30度至30度之间;
在该增强信号产生步骤中,当该声源角度介于-30度至30度之间时,将该总声压信号的该声压值加上该增强权重值而成为该增强信号,该增强权重值大于0dB;以及
该麦克风阵列信号处理方法还包含一抑制信号产生步骤,依据对应相同的该声源角度的所述多个应用声压信号中该者及该其他者而得出该总声压信号,该总声压信号对应该声源角度,当该声源角度不介于-30度至30度之间时,将该总声压信号的该声压值加上一抑制权重值而成为一抑制信号,该抑制权重值小于0dB。
4.如权利要求3所述的麦克风阵列信号处理方法,其特征在于,在该声源角度判定步骤中,通过该最小变异量无失真响应演算法判定所述多个应用声压信号中该者的该声源角度是否介于-30度至30度之间;
在该增强信号产生步骤中,通过一宽边阵列演算法且依据对应相同的该声源角度的所述多个应用声压信号中该者及该其他者而得出该总声压信号;以及
在该抑制信号产生步骤中,通过该宽边阵列演算法且依据对应相同的该声源角度的所述多个应用声压信号中该者及该其他者而得出该总声压信号。
5.如权利要求3所述的麦克风阵列信号处理方法,其特征在于,该声压阈值大于60dB且小于110dB,该增强权重值大于0dB且小于20dB,该抑制权重值大于-20dB且小于0dB。
6.如权利要求1所述的麦克风阵列信号处理方法,其特征在于,所述多个麦克风的数量为两个,所述两个麦克风分别设置于一手持式装置的两端,该混叠频率与所述两个麦克风之间的一距离成反比,一声源零度方向垂直于该距离的方向且位于所述两个麦克风的前方。
7.一种手持式装置,其特征在于,执行如权利要求1所述的麦克风阵列信号处理方法,该手持式装置包含:
该麦克风阵列,包含所述多个麦克风;以及
一麦克风阵列信号处理单元,通信连接所述多个麦克风,该麦克风阵列信号处理单元执行该声压信号产生步骤、该声压值判定步骤、该声源角度判定步骤及该增强信号产生步骤。
8.如权利要求7所述的手持式装置,其特征在于,在该声源角度判定步骤中,通过该最小变异量无失真响应演算法判定所述多个应用声压信号中该者的该声源角度是否介于-30度至30度之间;
在该增强信号产生步骤中,通过一宽边阵列演算法且依据对应相同的该声源角度的所述多个应用声压信号中该者及该其他者而得出该总声压信号,当该声源角度介于-30度至30度之间时,将该总声压信号的该声压值加上该增强权重值而成为该增强信号,该增强权重值大于0dB;以及
该麦克风阵列信号处理方法还包含一抑制信号产生步骤,通过该宽边阵列演算法且依据对应相同的该声源角度的所述多个应用声压信号中该者及该其他者而得出该总声压信号,该总声压信号对应该声源角度,当该声源角度不介于-30度至30度之间时,将该总声压信号的该声压值加上一抑制权重值而成为一抑制信号,该抑制权重值小于0dB。
9.如权利要求8所述的手持式装置,其特征在于,该声压阈值大于60dB且小于110dB,该增强权重值大于0dB且小于20dB,该抑制权重值大于-20dB且小于0dB。
10.如权利要求7所述的手持式装置,其特征在于,所述多个麦克风的数量为两个,所述两个麦克风分别设置于该手持式装置的两端,该混叠频率与所述两个麦克风之间的一距离成反比,一声源零度方向垂直于该距离的方向且位于所述两个麦克风的前方。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010017312.9A CN111243615B (zh) | 2020-01-08 | 2020-01-08 | 麦克风阵列信号处理方法及手持式装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010017312.9A CN111243615B (zh) | 2020-01-08 | 2020-01-08 | 麦克风阵列信号处理方法及手持式装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111243615A CN111243615A (zh) | 2020-06-05 |
CN111243615B true CN111243615B (zh) | 2023-02-10 |
Family
ID=70876053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010017312.9A Active CN111243615B (zh) | 2020-01-08 | 2020-01-08 | 麦克风阵列信号处理方法及手持式装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111243615B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114858271B (zh) * | 2022-07-05 | 2022-09-23 | 杭州兆华电子股份有限公司 | 一种声音探测用的阵列放大方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010087155A1 (ja) * | 2009-01-27 | 2010-08-05 | シャープ株式会社 | データ送信装置、データ送信方法、視聴環境制御装置、視聴環境制御方法および視聴環境制御システム |
CN109100727A (zh) * | 2018-06-06 | 2018-12-28 | 江苏大学 | 一种使用运动虚拟声源识别声源运动轨迹的方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101427648B1 (ko) * | 2007-10-12 | 2014-08-07 | 삼성전자주식회사 | 어레이 스피커 시스템에서 불균일 방사 패턴을 제거하는방법 및 장치 |
CN104780259B (zh) * | 2014-01-14 | 2019-05-21 | 深圳富泰宏精密工业有限公司 | 通话语音质量自动调节系统与方法 |
JP5864799B1 (ja) * | 2015-03-30 | 2016-02-17 | 株式会社日立パワーソリューションズ | 音源探査装置および音源探査方法 |
CN105025416B (zh) * | 2015-07-10 | 2019-03-15 | 武汉科技大学 | 一种便携式双传声器声源识别与定位装置 |
CN109036448B (zh) * | 2017-06-12 | 2020-04-14 | 华为技术有限公司 | 一种声音处理方法和装置 |
CN107742522B (zh) * | 2017-10-23 | 2022-01-14 | 科大讯飞股份有限公司 | 基于麦克风阵列的目标语音获取方法及装置 |
CN109712626B (zh) * | 2019-03-04 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法及装置 |
CN110544486B (zh) * | 2019-09-02 | 2021-11-02 | 上海其高电子科技有限公司 | 基于麦克风阵列的语音增强方法及系统 |
-
2020
- 2020-01-08 CN CN202010017312.9A patent/CN111243615B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010087155A1 (ja) * | 2009-01-27 | 2010-08-05 | シャープ株式会社 | データ送信装置、データ送信方法、視聴環境制御装置、視聴環境制御方法および視聴環境制御システム |
CN109100727A (zh) * | 2018-06-06 | 2018-12-28 | 江苏大学 | 一种使用运动虚拟声源识别声源运动轨迹的方法 |
Non-Patent Citations (1)
Title |
---|
A consolidated perspective on multi-microphone speech enhancement and source separation;Sharon Gannot et al;《IEEE/ACM Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers》;20171231;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111243615A (zh) | 2020-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10331396B2 (en) | Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrival estimates | |
US8098844B2 (en) | Dual-microphone spatial noise suppression | |
US9997173B2 (en) | System and method for performing automatic gain control using an accelerometer in a headset | |
US10269369B2 (en) | System and method of noise reduction for a mobile device | |
JP5323995B2 (ja) | マルチチャネル信号の残響除去のためのシステム、方法、装置、およびコンピュータ可読媒体 | |
US8233352B2 (en) | Audio source localization system and method | |
US7366662B2 (en) | Separation of target acoustic signals in a multi-transducer arrangement | |
EP2868117B1 (en) | Systems and methods for surround sound echo reduction | |
US8712069B1 (en) | Selection of system parameters based on non-acoustic sensor information | |
US9768829B2 (en) | Methods for processing audio signals and circuit arrangements therefor | |
KR102352927B1 (ko) | 상관 기반 근접장 검출기 | |
US9020163B2 (en) | Near-field null and beamforming | |
KR20160003844A (ko) | 멀티-채널 에코 소거 및 잡음 억제 | |
US20130142356A1 (en) | Near-field null and beamforming | |
JP2011527025A (ja) | ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法 | |
Thiergart et al. | An informed LCMV filter based on multiple instantaneous direction-of-arrival estimates | |
WO2018158558A1 (en) | Device for capturing and outputting audio | |
WO2007059255A1 (en) | Dual-microphone spatial noise suppression | |
US6718041B2 (en) | Echo attenuating method and device | |
Fukui et al. | Sound source separation for plural passenger speech recognition in smart mobility system | |
CN111243615B (zh) | 麦克风阵列信号处理方法及手持式装置 | |
WO2023065317A1 (zh) | 会议终端及回声消除方法 | |
Anderson et al. | Multichannel Wiener filter estimation using source location knowledge for speech enhancement | |
CN110858485A (zh) | 语音增强方法、装置、设备及存储介质 | |
WO2022041030A1 (en) | Low complexity howling suppression for portable karaoke |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |