CN115474117B - 基于三麦克风的收音方法和收音装置 - Google Patents
基于三麦克风的收音方法和收音装置 Download PDFInfo
- Publication number
- CN115474117B CN115474117B CN202211364950.3A CN202211364950A CN115474117B CN 115474117 B CN115474117 B CN 115474117B CN 202211364950 A CN202211364950 A CN 202211364950A CN 115474117 B CN115474117 B CN 115474117B
- Authority
- CN
- China
- Prior art keywords
- signal
- channel
- band
- microphone
- frequency spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/01—Noise reduction using microphones having different directional characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/03—Connection circuits to selectively connect loudspeakers or headphones to amplifiers
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种基于三麦克风的收音方法和收音装置。所述方法使用三个麦克风构成两个通道,对各通道的前后向延时相减波束形成信号划分成预定数量的频谱子带信号,计算同一通道的前向形成信号和后向形成信号的各相同频谱子带的信号能量以获得相对能量统计参数,由此确定两个通道各频谱子带信号的通道的增益。最后比较两个通道的前向形成信号的相同频谱子带的频谱子带信号的能量值,将该频谱子带的最后增益取能量值小的通道的增益。本发明通过双通道频谱子带的降噪后的能量值大于稳态底噪的能量,降低了流水声,减小了有用信号的衰减。
Description
技术领域
本发明涉及录音或收音技术,特别是录音或收音过程中对音频信号进行降噪处理,具体而言,涉及一种基于三麦克风的收音方法、装置、电子设备及计算机可读介质。
背景技术
为了降低录音噪声以提高录音质量,现有技术已提出采用多麦克风进行收音后再进行降噪处理。例如,在公告号为US6668062B1的专利中提出一种包括自适应方向性双麦克风系统,其中来自第一和第二麦克风的时域数据被转换为频域数据。然后,处理该频域数据以产生噪声消除信号,该噪声消除信号在逆傅立叶变换块中被转换为噪声消除时域数据。
中国发明专利CN111131947 B公开一种耳机信号处理方法,其获取位于耳道外部靠近嘴的位置的耳机的第一麦克风拾取的信号、位于耳道外部远离嘴的位置的耳机的第二麦克风拾取的信号、以及耳机的第三麦克风拾取的信号。其中,对第一麦克风拾取的信号和第二麦克风拾取的信号做双麦克风降噪得到第一中间信号,对第二麦克风拾取的信号和第三麦克风拾取的信号做双麦克风降噪得到第二中间信号,对第一中间信号和第二中间信号进行融合,得到并输出融合语音信号。
然而,现有的收音方法所达到的降噪效果仍不能令人满意,有用信号可能会过度衰减,而底噪或流水声不能有效的消除。
发明内容
本发明旨在解决现有的收音方法在降噪时对有用信号过度衰减以及流水声消除不明显的问题。
为了解决上述技术问题,本发明第一方面提出一种基于三麦克风的收音方法,包括如下步骤:
获取第一麦克风、第二麦克风和第三麦克风所产生的声音信号,所述第一麦克风和第二麦克风之间的距离,与第一麦克风和第三麦克风之间的距离相等,且第一麦克风和第二麦克风构成第一通道,第一麦克风和第三麦克风构成第二通道;
分别计算所述第一通道和第二通道的延时相减波束形成信号,其包括第一通道前向形成信号、第一通道后向形成信号、第二通道前向形成信号和第二通道后向形成信号;
对各所述延时相减波束形成信号划分成预定数量的频谱子带信号,计算同一通道的前向形成信号和后向形成信号的各相同频谱子带的信号能量E fij 和E bij ,f表示前向,b表示后向,i为通道序号,j为频谱子带序号;
根据前向形成信号和后向形成信号的频谱子带信号的能量计算相对能量统计参数;
根据所述相对能量统计参数对第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号赋予第一增益G 1ij ,其中i为通道序号,j为频谱子带序号;
计算第一通道前向形成信号和第二通道前向形成信号衰减到稳态噪声能量等级时的第二增益G 2ij ,其中i为通道序号,j为频谱子带序号;
对于第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号,比较第一增益G 1ij 和第二增益G 2ij 的大小,并取二者的最大值作为该频谱子带信号的通道最后增益G ij ;
计算第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号的降噪后的能量值E’ fij = E fij * G ij ,并比较该两个前向形成信号的相同频谱子带的频谱子带信号的能量值E’ f1j 和E’ f2j ,将该频谱子带j的最后增益G j 取能量值小的通道的增益;
平滑频谱子带的增益值后,计算出该频谱子带最后的复数频谱,再逆傅里叶变换得到时域信号。
根据本发明的一种优选实施方式,所述第一麦克风、第二麦克风和第三麦克风两两之间的距离均相等。
根据本发明的一种优选实施方式,使用一阶延时相减波束形成算法计算所述延时相减波束形成信号。
根据本发明的一种优选实施方式,计算所述相对能量统计参数值的方法为:初始化相对能量统计参数值为0,逐一比较前向形成信号和后向形成信号的各相同频谱子带信号的能量,当前向形成信号的频谱子带信号能量较大时,该相对能量统计参数值加1,否则减1。
根据本发明的一种优选实施方式,所述信号合成装置还用于对所述傅里叶变换得到的时域信号进行稳态降噪处理。
为了解决上述技术问题,本发明第二方面提出一种基于三麦克风的收音装置,包括第一麦克风模块、第二麦克风模块和第三麦克风模块,其特征在于:
第一麦克风模块和第二麦克风模块之间的距离,与第一麦克风模块和第三麦克风模块之间的距离相等,且第一麦克风模块和第二麦克风模块构成第一通道,第一麦克风模块和第三麦克风模块构成第二通道;
所述收音装置还包括信号合成模块,其用于:
获取第一麦克风模块、第二麦克风模块和第三麦克风模块所产生的声音信号;
分别计算所述第一通道和第二通道的延时相减波束形成信号,其包括第一通道前向形成信号、第一通道后向形成信号、第二通道前向形成信号和第二通道后向形成信号;
对各所述延时相减波束形成信号划分成预定数量的频谱子带信号,计算同一通道的前向形成信号和后向形成信号的各相同频谱子带的信号能量E fij 和E bij ,f表示前向,b表示后向,i为通道序号,j为频谱子带序号;
根据前向形成信号和后向形成信号的频谱子带信号的能量计算相对能量统计参数;
根据所述相对能量统计参数对第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号赋予第一增益G 1ij ,其中i为通道序号,j为频谱子带序号;
计算第一通道前向形成信号和第二通道前向形成信号衰减到稳态噪声能量等级时的第二增益G 2ij ,其中i为通道序号,j为频谱子带序号;
对于第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号,比较第一增益G 1ij 和第二增益G 2ij 的大小,并取二者的最大值作为该频谱子带信号的通道最后增益G ij ;
计算第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号的降噪后的能量值E’ fij = E fij * G ij ,并比较该两个前向形成信号的相同频谱子带的频谱子带信号的能量值E’ f1j 和E’ f2j ,将该频谱子带j的最后增益G j 取能量值小的通道的增益;
平滑频谱子带的增益值后,计算出该频谱子带最后的复数频谱,再逆傅里叶变换得到时域信号。
根据本发明的一种优选实施方式,所述第一麦克风模块、第二麦克风模块和第三麦克风模块两两之间的距离均相等。
根据本发明的一种优选实施方式,使用一阶延时相减波束形成算法计算所述延时相减波束形成信号。
根据本发明的一种优选实施方式,计算所述相对能量统计参数值的方法为:初始化相对能量统计参数值为0,逐一比较前向形成信号和后向形成信号的各相同频谱子带信号的能量,当前向形成信号的频谱子带信号能量较大时,该相对能量统计参数值加1,否则减1。
根据本发明的一种优选实施方式,其特征在于:所述信号合成装置还用于对所述傅里叶变换得到的时域信号进行稳态降噪处理。
为了解决上述技术问题,本发明第三方面提出一种电子设备,其包括处理器以及存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行上述的方法。
为了解决上述技术问题,本发明第四方面提出一种计算机可读存储介质,该所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现上述的方法。
本发明通过比较前后向延时相减波束形成信号的频谱子带能量,通过统计的方式来确定频谱子带增益,通过通道频谱子带的降噪后的能量值大于稳态底噪的能量,降低了流水声,减小了有用信号的衰减。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明的示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是本发明的第一实施例的三麦克风收音的布局图。
图2是延时相减波束形成示意图。
图3是双麦克风的延时相减波束形成信号的方向性图。
图4是本发明的第二实施例的收音装置的模块结构图。
图5是根据本发明的一种电子设备的示例性实施例的结构框图。
图6是本发明的一个计算机可读介质实施例的示意图。
具体实施方式
现在将参考附图来更加全面地描述本发明的示例性实施例,虽然各示例性实施例能够以多种具体的方式实施,但不应理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例是为了使本发明的内容更加完整,更加便于将发明构思全面地传达给本领域的技术人员。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的结构、性能、效果或者其他特征可以以任何合适的方式结合到一个或更多其他的实施例中。
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
本发明一方面提出一种基于三麦克风的收音方法。本发明中将三个麦克风分别称为第一麦克风、第二麦克风和第三麦克风,并且使第一麦克风和第二麦克风的距离,与第一麦克风与第三麦克风的距离相等。上述两个距离相等能够使得麦克风相减波束形成的两通道信号之间进行有意义的比较,即是根据本发明进行降噪处理的前提条件,这将在后面进一步说明。此外,根据本发明,这两组麦克风的夹角可以变化,但更优选为取60度,也即,本发明优选为第一麦克风、第二麦克风和第三麦克风两两之间的距离相等,以达到比较好的方向性选择效果和降噪效果。
本发明首先获取第一麦克风、第二麦克风和第三麦克风所产生的声音信号,然后进行波束形成方法进行处理。具体来说,本发明将第一麦克风和第二麦克风构成第一通道,第一麦克风和第三麦克风构成第二通道,分别计算所述第一通道和第二通道的延时相减波束形成信号,即包括第一通道前向形成信号、第一通道后向形成信号、第二通道前向形成信号和第二通道后向形成信号。
接下来,本发明对各所述延时相减波束形成信号划分成预定数量的频谱子带信号,计算同一通道的前向形成信号和后向形成信号的各相同频谱子带的信号能量E fij 和E bij 。其中f表示前向,b表示后向,i为通道序号,取1或2,j为频谱子带序号,取值为1至n,n为预定频谱子带数量,为大于等于2的自然数。本发明中,n优选为64~256,更优选为128。
本发明创新地提出根据前向形成信号和后向形成信号的频谱子带信号的能量进行比较统计,得到相对能量统计参数,并根据所述相对能量统计参数对第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号赋予第一增益G 1ij ,其中i为通道序号,j为频谱子带序号。赋予第一增益G 1ij 时,相对能量统计参数值大越大,给予越大的增益系数,相对能量统计参数统计值越小,给予越小的增益系数,增益系数在0和1之间。
本发明中的相对能量统计参数表示当前一段时间内前向能量大还是后向能量大,或者说,表示了声音的前向能量与后向能量之间的相对大小。根据本发明,当声音在前方,前向能量大于后向能量,统计值变大,对应的增益值也大,声音被保留;当声音在后方,后向能量大于前向能量,统计值变小,对应的增益值也变小,声音被抑制。
对于第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号,本发明比较第一增益G 1ij 和第二增益G 2ij 的大小,并取二者的最大值作为该频谱子带信号的通道最后增益G ij ;该第二增益是频谱子带信号衰减到稳态噪声能量等级的增益。即本发明还需要先计算第一通道前向形成信号和第二通道前向形成信号衰减到稳态噪声能量等级时的第二增益G 2ij ,这可以通过对每一个频谱子带进行稳态噪声降噪的谱减法计算出。
然后,本发明计算第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号的降噪后的能量值E’ fij = E fij *G ij ,并比较该两个前向形成信号的相同频谱子带的频谱子带信号的能量值E’ f1j 和E’ f2j ,将该频谱子带j的最后增益G j 取能量值小的通道的增益;取两个通道中前向信号每一个频谱子带中能量低的子带频谱和增益合并,最后输出一个通道。
最后,本发明平滑频谱子带的增益值后,计算出该频谱子带最后的复数频谱,再逆傅里叶变换得到时域信号。具体来说,对每一个频谱子带的增益G j 进行前后帧平滑。记平滑后的增益为 G jn ,前一次的平滑增益为G j(n-1) ,
如果G jn >= G j(n-1) ,
G jn = a * G j(n-1) +(1-a)* G j ;
如果G jn < G j(n-1) ,
G jn = b * G j(n-1) +(1-b) * G j 。
下面参照附图来描述本发明的具体实施例。
图1是本发明的第一实施例的三麦克风收音的布局图。如图1所示,第一麦克风mic1、第二麦克风mic2和第三麦克风mic3两两之间等距排列。在该实施例中,其间距均为20mm。第一麦克风mic1、第二麦克风mic2和第三麦克风mic3可以集成在一个实体设备中,也可以分别实现于不同的实体设备中。
上述三个麦克风构成了麦克风阵列,第一麦克风mic1与第二麦克风mic2、第一麦克风mic1与第三麦克风mic3分别构成两个一阶延时相减波束形成。我们将第一麦克风mic1与第二麦克风mic2构成的收音信号通道称为第一通道,将第一麦克风mic1与第三麦克风mic3构成的收音信号通道称为第二通道。使用延时τ=d/c,可知第一通道和第二通道分别的收音方向型图都为心型。这三个麦克风的组合的收音方向为这两个心型的重叠部分。波束形成算法对于不同来向上的声音具有不同的增益。波束形成能良好地应用声音的空间信息,因此对于空间噪声有较好的抑制效果。
一阶延时相减是较为简单和经典的波束形成技术,具体做法为使用两路麦克采集语音,将一路输入信号进行延时,然后与另一路信号进行相减。
图2是延时相减波束形成示意图。如图2所示,设原始声音信号为y(t),两路麦克风输入声音信号s 1(t)、s 2(t),则增强输出声音信号x(t)为:
x(t)= s 1(t)-s 2(t-τ),τ=d/c。
其中为τ延时值,d为麦克风间距。
两路麦克风输入信号为:
s 1(t)= y(t)
s 2(t)= y(t-(d/c)∙cosθ),θ为声音来向角。
代入可得:
x(t)= y(t)- y(t-(d/c)∙cosθ-τ)
则麦克风阵列输出的功率谱为:
当麦克风距离较小时,进行Taylor展开,使用cosφ=1-φ 2/2,可得到:
由上式可以看出,麦克风阵列的方向性图是与延时值τ有关。
当τ=d/c时,公式变为:
当θ=0°时,增益最大;当θ=180°时,增益最小。此时方向形图称为心型(Cardioid)图,如图3所示。
本实施例中,第一麦克风mic1与第二麦克风mic2、第一麦克风mic1与第三麦克风mic3分别构成两个一阶延时相减波束形成。使用延时τ=d/c,这样第一麦克风mic1与第二麦克风mic2、第一麦克风mic1与第三麦克风mic3分别的收音方向型图都为心型。这三个麦克风的组合的收音方向为这两个心型的重叠部分。
本发明使用一阶延时相减波束形成算法分别计算第一通道、第二通道的前向和后向的延时相减波束形成信号的频带能量。
该实施例对于所获取的各声音信号均划分了128个频谱子带信号。在其他的实施方式中,也可以划分成其他预定数量的频谱子带信号。然后,计算同一通道的前向形成信号和后向形成信号的各相同频谱子带的信号能量E fij 和E bij 。其中E表示能量,f表示前向,b表示后向,i为通道序号,取1或2,分别代表第一通道和第二通道。j为频谱子带序号,取值为1至128。
根据前向形成信号和后向形成信号的频谱子带信号的能量计算相对能量统计参数,并根据所述相对能量统计参数对第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号赋予第一增益G 1ij ,其中i为通道序号,j为频谱子带序号。如前所述,本发明中的相对能量统计参数表示当前一段时间内前向能量大还是后向能量大,或者说,表示了声音的前向能量与后向能量之间的相对大小。根据本发明,当声音在前方,前向能量大于后向能量,统计值变大,对应的增益值也大,声音被保留;当声音在后方,后向能量大于前向能量,统计值变小,对应的增益值也变小,声音被抑制。
对于第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号,本发明比较第一增益G 1ij 和第二增益G 2ij 的大小,并取二者的最大值作为该频谱子带信号的通道最后增益G ij ;该第二增益是频谱子带信号衰减到稳态噪声能量等级的增益。即本发明还需要先计算第一通道前向形成信号和第二通道前向形成信号衰减到稳态噪声能量等级时的第二增益G 2ij 。
然后,本发明计算第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号的降噪后的能量值E’ fij = E fij *G ij ,并比较该两个前向形成信号的相同频谱子带的频谱子带信号的能量值E’ f1j 和E’ f2j ,将该频谱子带j的最后增益G j 取能量值小的通道的增益;
最后,本发明平滑频谱子带的增益值后,计算出该频谱子带最后的复数频谱,再逆傅里叶变换得到时域信号。
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由数据处理设备(包括计算机)执行的程序,即计算机程序。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、ROM、RAM等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
图4是本发明的第二实施例的收音装置的模块结构图。如图4所示,该收音装置包括第一麦克风模块、第二麦克风模块和第三麦克风模块和信号合成模块。第一麦克风模块、第二麦克风模块和第三麦克风模块用于感应声音以产生声音信号,且各麦克风模块两两之间的距离均相等。与第一实施例相似,第一麦克风模块和第二麦克风模块构成第一通道,第一麦克风模块和第三麦克风模块构成第二通道,各麦克风模块产生的声音信号均输入信号合成模块。信号合成模块获取第一麦克风模块、第二麦克风模块和第三麦克风模块所产生的声音信号并对信号进行处理以产生最终处理过的声音信号,该处理过的声音信号对声音信号中的噪声进行消除或减弱,因此也可以称为增强的声音信号。
总的来说,信号合成模块用于执行本发明第一实施例的收音方法中的各个步骤。为了执行各个步骤,该信号合成模块可以由多个不同功能的子模块来实现。
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的实体形式的实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
图5是根据本发明的一种电子设备的示例性实施例的结构框图。图5显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,该示例性实施例的电子设备510以通用数据处理设备的形式表现。电子设备510的组件可以包括但不限于:至少一个处理单元511、至少一个存储单元512、连接不同系统组件(包括存储单元512和处理单元511)的总线516、显示单元513等。
其中,所述存储单元512存储有计算机可读程序,其可以是源程序或都只读程序的代码。所述程序可以被处理单元511执行,使得所述处理单元511执行本发明各种实施方式的步骤。例如,所述处理单元511可以执行第一实施例的步骤。
所述存储单元512可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5121和/或高速缓存存储单元5122,还可以进一步包括只读存储单元(ROM)5123。所述存储单元512还可以包括具有一组(至少一个)程序模块5125的程序/实用工具5124,这样的程序模块5125包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线516可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备510也可以与一个或多个外部设备520(例如键盘、显示器、网络设备、蓝牙设备等)通信,使得用户能经由这些外部设备520与该电子设备520交互,和/或使得该电子设备510能与一个或多个其它数据处理设备(例如路由器、调制解调器等等)进行通信。这种通信可以通过输入/输出(I/O)接口514进行,还可以通过网络适配器515与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)进行。网络适配器515可以通过总线516与电子设备520的其它模块通信。应当明白,尽管图中未示出,电子设备510中可使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
图6是本发明的一个计算机可读介质实施例的示意图。如图6所示,所述计算机程序可以存储于一个或多个计算机可读介质上。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。当所述计算机程序被一个或多个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台数据处理设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以执行计算机程序的方法、装置、电子设备或计算机可读介质来实现。可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现本发明的一些或者全部功能。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种基于三麦克风的收音方法,其特征在于包括如下步骤:
获取第一麦克风、第二麦克风和第三麦克风所产生的声音信号,所述第一麦克风和第二麦克风之间的距离,与第一麦克风和第三麦克风之间的距离相等,且第一麦克风和第二麦克风构成第一通道,第一麦克风和第三麦克风构成第二通道;
分别计算所述第一通道和第二通道的延时相减波束形成信号,其包括第一通道前向形成信号、第一通道后向形成信号、第二通道前向形成信号和第二通道后向形成信号;
对各所述延时相减波束形成信号划分成预定数量的频谱子带信号,计算同一通道的前向形成信号和后向形成信号的各相同频谱子带的信号能量E fij 和E bij ,f表示前向,b表示后向,i为通道序号,j为频谱子带序号;
根据前向形成信号和后向形成信号的频谱子带信号的能量计算相对能量统计参数;
根据所述相对能量统计参数对第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号赋予第一增益G 1ij ,其中i为通道序号,j为频谱子带序号;
计算第一通道前向形成信号和第二通道前向形成信号衰减到稳态噪声能量等级时的第二增益G 2ij ,其中i为通道序号,j为频谱子带序号;
对于第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号,比较第一增益G 1ij 和第二增益G 2ij 的大小,并取二者的最大值作为该频谱子带信号的通道最后增益G ij ;
计算第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号的降噪后的能量值E’ fij = E fij * G ij ,并比较该两个前向形成信号的相同频谱子带的频谱子带信号的能量值E’ f1j 和E’ f2j ,将该频谱子带j的最后增益G j 取能量值小的通道的增益;
平滑频谱子带的增益值后,计算出该频谱子带最后的复数频谱,再逆傅里叶变换得到时域信号。
2.根据权利要求1所述的收音方法,其特征在于:所述第一麦克风、第二麦克风和第三麦克风两两之间的距离均相等。
3.根据权利要求1所述的收音方法,其特征在于:使用一阶延时相减波束形成算法计算所述延时相减波束形成信号。
4.根据权利要求1所述的收音方法,其特征在于:计算所述相对能量统计参数的方法为:初始化相对能量统计参数值为0,逐一比较前向形成信号和后向形成信号的各相同频谱子带信号的能量,当前向形成信号的频谱子带信号能量较大时,该相对能量统计参数值加1,否则减1。
5.根据权利要求1所述的收音方法,其特征在于:所述方法还包括:对所述傅里叶变换得到的时域信号进行稳态降噪处理。
6.一种基于三麦克风的收音装置,包括第一麦克风模块、第二麦克风模块和第三麦克风模块,其特征在于:
第一麦克风模块和第二麦克风模块之间的距离,与第一麦克风模块和第三麦克风模块之间的距离相等,且第一麦克风模块和第二麦克风模块构成第一通道,第一麦克风模块和第三麦克风模块构成第二通道;
所述收音装置还包括信号合成模块,其用于:
获取第一麦克风模块、第二麦克风模块和第三麦克风模块所产生的声音信号;
分别计算所述第一通道和第二通道的延时相减波束形成信号,其包括第一通道前向形成信号、第一通道后向形成信号、第二通道前向形成信号和第二通道后向形成信号;
对各所述延时相减波束形成信号划分成预定数量的频谱子带信号,计算同一通道的前向形成信号和后向形成信号的各相同频谱子带的信号能量E fij 和E bij ,f表示前向,b表示后向,i为通道序号,j为频谱子带序号;
根据前向形成信号和后向形成信号的频谱子带信号的能量计算相对能量统计参数;
根据所述相对能量统计参数对第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号赋予第一增益G 1ij ,其中i为通道序号,j为频谱子带序号;
计算第一通道前向形成信号和第二通道前向形成信号衰减到稳态噪声能量等级时的第二增益G 2ij ,其中i为通道序号,j为频谱子带序号;
对于第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号,比较第一增益G 1ij 和第二增益G 2ij 的大小,并取二者的最大值作为该频谱子带信号的通道最后增益G ij ;
计算第一通道前向形成信号和第二通道前向形成信号的各频谱子带信号的降噪后的能量值E’ fij = E fij * G ij ,并比较该两个前向形成信号的相同频谱子带的频谱子带信号的能量值E’ f1j 和E’ f2j ,将该频谱子带j的最后增益G j 取能量值小的通道的增益;
平滑频谱子带的增益值后,计算出该频谱子带最后的复数频谱,再逆傅里叶变换得到时域信号。
7.根据权利要求6所述的收音装置,其特征在于:所述第一麦克风模块、第二麦克风模块和第三麦克风模块两两之间的距离均相等。
8.根据权利要求6所述的收音装置,其特征在于:使用一阶延时相减波束形成算法计算所述延时相减波束形成信号。
9.根据权利要求6所述的收音装置,其特征在于:计算所述相对能量统计参数值的方法为:初始化相对能量统计参数值为0,逐一比较前向形成信号和后向形成信号的各相同频谱子带信号的能量,当前向形成信号的频谱子带信号能量较大时,该相对能量统计参数值加1,否则减1。
10.根据权利要求6所述的收音装置,其特征在于:所述信号合成模块还用于对所述傅里叶变换得到的时域信号进行稳态降噪处理。
11.一种电子设备,包括:
处理器;以及
存储计算机可执行指令的存储器,其特征在于,所述计算机可执行指令在被执行时使所述处理器执行根据权利要求1-5中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211364950.3A CN115474117B (zh) | 2022-11-03 | 2022-11-03 | 基于三麦克风的收音方法和收音装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211364950.3A CN115474117B (zh) | 2022-11-03 | 2022-11-03 | 基于三麦克风的收音方法和收音装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115474117A CN115474117A (zh) | 2022-12-13 |
CN115474117B true CN115474117B (zh) | 2023-01-10 |
Family
ID=84336780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211364950.3A Active CN115474117B (zh) | 2022-11-03 | 2022-11-03 | 基于三麦克风的收音方法和收音装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115474117B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102347028A (zh) * | 2011-07-14 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及方法 |
CN105407443A (zh) * | 2015-10-29 | 2016-03-16 | 小米科技有限责任公司 | 录音方法及装置 |
CN107734426A (zh) * | 2017-08-28 | 2018-02-23 | 深圳市金立通信设备有限公司 | 音频信号处理方法、终端及计算机可读存储介质 |
CN111131947A (zh) * | 2019-12-05 | 2020-05-08 | 北京小鸟听听科技有限公司 | 耳机信号处理方法、系统和耳机 |
WO2022105392A1 (zh) * | 2020-11-17 | 2022-05-27 | Oppo广东移动通信有限公司 | 电子设备中执行语音处理的方法、装置、电子设备及芯片 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345900B2 (en) * | 2007-05-10 | 2013-01-01 | Phonak Ag | Method and system for providing hearing assistance to a user |
FR3017708B1 (fr) * | 2014-02-18 | 2016-03-11 | Airbus Operations Sas | Dispositif de mesure acoustique dans un ecoulement d'air |
-
2022
- 2022-11-03 CN CN202211364950.3A patent/CN115474117B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102347028A (zh) * | 2011-07-14 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及方法 |
CN105407443A (zh) * | 2015-10-29 | 2016-03-16 | 小米科技有限责任公司 | 录音方法及装置 |
CN107734426A (zh) * | 2017-08-28 | 2018-02-23 | 深圳市金立通信设备有限公司 | 音频信号处理方法、终端及计算机可读存储介质 |
CN111131947A (zh) * | 2019-12-05 | 2020-05-08 | 北京小鸟听听科技有限公司 | 耳机信号处理方法、系统和耳机 |
WO2022105392A1 (zh) * | 2020-11-17 | 2022-05-27 | Oppo广东移动通信有限公司 | 电子设备中执行语音处理的方法、装置、电子设备及芯片 |
Also Published As
Publication number | Publication date |
---|---|
CN115474117A (zh) | 2022-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6637014B2 (ja) | 音声信号処理のためのマルチチャネル直接・環境分解のための装置及び方法 | |
US8654990B2 (en) | Multiple microphone based directional sound filter | |
JP6002690B2 (ja) | オーディオ入力信号処理システム | |
JP4195267B2 (ja) | 音声認識装置、その音声認識方法及びプログラム | |
JP5323995B2 (ja) | マルチチャネル信号の残響除去のためのシステム、方法、装置、およびコンピュータ可読媒体 | |
EP2210427B1 (en) | Apparatus, method and computer program for extracting an ambient signal | |
CN105165026B (zh) | 使用多个瞬时到达方向估计的知情空间滤波的滤波器及方法 | |
US9818424B2 (en) | Method and apparatus for suppression of unwanted audio signals | |
US20180240471A1 (en) | Method and system of acoustic dereverberation factoring the actual non-ideal acoustic environment | |
JP6703525B2 (ja) | 音源を強調するための方法及び機器 | |
EP2932731B1 (en) | Spatial interference suppression using dual- microphone arrays | |
CN107039045A (zh) | 用于语音增强的全局优化最小二乘后滤波 | |
EP3275208B1 (en) | Sub-band mixing of multiple microphones | |
BR112016013366B1 (pt) | Extração de som reverberante utilizando redes de microfones | |
CA2840132C (en) | Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator | |
CN102968999B (zh) | 处理音频信号 | |
JP5034734B2 (ja) | 音処理装置およびプログラム | |
Song et al. | An integrated multi-channel approach for joint noise reduction and dereverberation | |
Ali et al. | An integrated MVDR beamformer for speech enhancement using a local microphone array and external microphones | |
CN115474117B (zh) | 基于三麦克风的收音方法和收音装置 | |
JP2009020472A (ja) | 音処理装置およびプログラム | |
CN115665606B (zh) | 基于四麦克风的收音方法和收音装置 | |
WO2018066376A1 (ja) | 信号処理装置および方法、並びにプログラム | |
JP6956929B2 (ja) | 情報処理装置、制御方法、及び制御プログラム | |
Ali et al. | MWF-based speech dereverberation with a local microphone array and an external microphone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |