CN116095565A - 音频信号处理方法、装置、电子设备及可读存储介质 - Google Patents

音频信号处理方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN116095565A
CN116095565A CN202211095430.7A CN202211095430A CN116095565A CN 116095565 A CN116095565 A CN 116095565A CN 202211095430 A CN202211095430 A CN 202211095430A CN 116095565 A CN116095565 A CN 116095565A
Authority
CN
China
Prior art keywords
audio signal
frequency band
noise
transmission channel
channel information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211095430.7A
Other languages
English (en)
Inventor
贺玉梁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202211095430.7A priority Critical patent/CN116095565A/zh
Publication of CN116095565A publication Critical patent/CN116095565A/zh
Priority to PCT/CN2023/115441 priority patent/WO2024051521A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了一种音频信号处理方法、装置、电子设备及可读存储介质,属于音频技术领域。该方法包括:根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带,第一音频信号为第一麦克风采集目标音源得到的音频信号,第二音频信号为第二麦克风采集目标音源得到的音频信号;在第一频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第一融合处理;在第二频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第二融合处理;对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,目标音频信号包括第一音频信号和第二音频信号中的至少之一。

Description

音频信号处理方法、装置、电子设备及可读存储介质
技术领域
本申请属于音频技术领域,具体涉及一种音频信号处理方法、装置、电子设备及可读存储介质。
背景技术
目前,电子设备中通常设置有多个麦克风,用户可以通过该多个麦克风进行通话、录音或录像等,而在不同场景的音频处理中,环境风噪会极大地降低音频的主观听感。
以电子设备中设置有两个麦克风为例,在传统的降噪方法中,电子设备可以利用双麦频域幅度平方相干系数(Magnitude-Squared Coherence,MSC)实现风噪检测,并将检测的风噪映射为风噪抑制增益,再结合单麦风噪特征实现风噪抑制。
然而,按照上述方法,由于一方面单麦风噪特征通常可靠性较差,另一方面基于双麦MSC的风噪检测结果通常包括双麦所有的风噪频点,直接映射为风噪增益会损伤低风噪带宽麦克风上的音频信号,因此导致电子设备处理音频信号的稳健性较差。
发明内容
本申请实施例的目的是提供一种音频信号处理方法、装置、电子设备及可读存储介质,能够解决电子设备处理音频信号的稳健性较差的问题。
第一方面,本申请实施例提供了一种音频信号处理方法,该方法包括:根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带,第一音频信号为第一麦克风采集目标音源得到的音频信号,第二音频信号为第二麦克风采集目标音源得到的音频信号;在第一频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第一融合处理;在第二频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第二融合处理;对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,目标音频信号包括第一音频信号和第二音频信号中的至少之一。
第二方面,本申请实施例提供了一种音频信号处理装置,该装置包括划分模块、融合模块和降噪模块;划分模块,用于根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带,第一音频信号为第一麦克风采集目标音源得到的音频信号,第二音频信号为第二麦克风采集目标音源得到的音频信号;融合模块,用于在第一频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第一融合处理;融合模块,还用于在第二频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第二融合处理;降噪模块,用于对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,目标音频信号包括第一音频信号和第二音频信号中的至少之一。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
在本申请实施例中,可以根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带,第一音频信号为第一麦克风采集目标音源得到的音频信号,第二音频信号为第二麦克风采集目标音源得到的音频信号;且在第一频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第一融合处理;且在第二频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第二融合处理;并对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,目标音频信号包括第一音频信号和第二音频信号中的至少之一。通过该方案,由于电子设备在对不同麦克风采集的音频信号进行降噪处理之前,可以先基于划分的频带,以及每个音频信号对应的传输通道信息,进行传输通道信息的融合处理,然后再对对应的传输通道信息进行融合处理后的音频信号进行降噪,因此电子设备在处理音频信号时可以无需基于单一音频信号的特征或多个音频信号的所有频点,而是可以结合划分的不同频带内不同音频信号对应的传输通道信息,从而可以提高电子设备处理音频信号的稳健性。
附图说明
图1是本申请实施例提供的音频信号处理方法的流程图;
图2是本申请实施例提供的音频信号处理方法的示意图之一;
图3是本申请实施例提供的音频信号处理方法的示意图之二;
图4是本申请实施例提供的音频信号处理方法的示意图之三;
图5是本申请实施例提供的音频信号处理方法的示意图之四;
图6是本申请实施例提供的音频信号处理方法的示意图之五;
图7是本申请实施例提供的音频信号处理方法应用于双麦立体声稳健风噪检测抑制的信息流示意图;
图8是本申请实施例提供的音频信号处理装置的示意图;
图9是本申请实施例提供的电子设备的示意图;
图10是本申请实施例提供的电子设备的硬件示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的音频信号处理方法、装置、电子设备及可读存储介质进行详细地说明。
户外通话或音频录制中,电子设备通常会采集到大量的环境声,包括各类平稳噪声和非平稳噪声。通常,噪声来自于环境中的各种声源,但音频采集场景中的风噪声主要由传声器膜附近的湍流气流引起,会使传声器产生相对较高的信号电平,而风噪的声源就在麦克风附近。自然风噪声主要发生在低频1kHz范围内,并向高频迅速衰减。突发的阵风常常会引起持续时间为几十到几百毫秒的风噪。并且由于阵风的突发性,风噪声可能会产生超过期望采集音频振幅的高幅值,表现出显著的非平稳特性,会极大地降低音频的主观听感,因而需要有效的风噪抑制方法。
目前,从技术手段上来分,风噪抑制方法包括声学方法和信号处理方法。声学方法是从物理角度隔离风噪,从信号采集的源头抑制风噪干扰,如通过防风罩、抗风噪导管和加速度计拾音等实现风噪抑制,但该方法的应用场景会受到物理条件限制;信号处理方法是对混有风噪的音频,利用信号处理手段,实现风噪的抑制或分离,也可能包含受损音频的重构,广义上讲可以应对各种风噪场景。
在信号处理方法中,传统的风噪抑制策略通常建立在单麦克风(或传声器)的基础上的,通过谱质心方法、噪声模板方法、形态学方法或深度学习方法,以单麦风噪特征实现风噪检测、估计和抑制。然而,当前智能手机或真无线立体声耳机等电子设备中通常配备有2个或更多的麦克风,基于上述风噪形成原理,双麦采集风噪由相对独立的麦克风附近湍流形成,通常二者的相干性(或相关性)很低,传统双麦风噪抑制很大程度上依赖这一特性,利用频域幅度平方相干系数(Magnitude-Squared Coherence,MSC)实现风噪检测,并将检测的风噪映射为风噪抑制增益。但在双麦立体声中,该风噪检测结果通常包括双麦所有的风噪频点,因而检测和估计结果可能只与其中一个麦克风是对应的,并不适用于另一个麦克风。
可以看出,传统双麦风噪抑制信号处理方法通常严重依赖MSC特征,再结合可靠性相对较低的单麦风噪特征实现风噪抑制,但存在如下缺点:
1.基于双麦MSC的风噪检测结果包括双麦所有的风噪频点,并不均适用于两个麦克风,直接映射为风噪增益会损伤低风噪带宽麦克风上的音频。
2.单麦特征通常可靠性较差,致使风噪抑制稳健性不足。
为了解决上述问题,在本申请实施例提供的音频信号处理方法中,可以根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带,第一音频信号为第一麦克风采集目标音源得到的音频信号,第二音频信号为第二麦克风采集目标音源得到的音频信号;且在第一频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第一融合处理;且在第二频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第二融合处理;并对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,目标音频信号包括第一音频信号和第二音频信号中的至少之一。通过该方案,由于电子设备在对不同麦克风采集的音频信号进行降噪处理之前,可以先基于划分的频带,以及每个音频信号对应的传输通道信息,进行传输通道信息的融合处理,然后再对对应的传输通道信息进行融合处理后的音频信号进行降噪,因此电子设备在处理音频信号时可以无需基于单一音频信号的特征或多个音频信号的所有频点,而是可以结合划分的不同频带内不同音频信号对应的传输通道信息,从而可以提高电子设备处理音频信号的稳健性。
本申请实施例提供一种音频信号处理方法,图1示出了本申请实施例提供的音频信号处理方法的流程图。如图1所示,本申请实施例提供的音频信号处理方法可以包括下述的步骤101至步骤104。下面以电子设备执行该方法为例对该方法进行示例性地说明。
步骤101、电子设备根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带。
本申请实施例中,第一音频信号为第一麦克风采集目标音源得到的音频信号,第二音频信号为第二麦克风采集目标音源得到的音频信号。
可选地,本申请实施例中,第一音频信号和第二音频信号为同时采集的音频信号。
可选地,本申请实施例中,第一麦克风和第二麦克风可以为设置在同一电子设备中的麦克风,或可以为设置在不同电子设备中的麦克风。
本申请实施例中,目标频率范围为:第一音频信号的频率和第二音频信号的频率组成的频率范围。
可选地,本申请实施例中,目标频率范围中还可以包括除第一频带和第二频带之外的无风噪频带。
可选地,本申请实施例中,第一频带可以为:第一音频信号的噪声频带与第二音频信号的噪声频带的交集频带。
可选地,本申请实施例中,第二频带可以为:第一音频信号的噪声频带与第二音频信号的噪声频带的外延差集频带。
本申请实施例中,还包括以下至少一项:第一频带可以为上述交集频带,第二频带可以为上述外延差集频带,从而可以提高电子设备划分目标频率范围的灵活性。
可选地,本申请实施例中,第一音频信号的噪声频带和第二音频信号的噪声频带,可以是基于第一音频信号与第二音频信号间的目标相干系数得到的。
可选地,本申请实施例中,目标相干系数可以包括以下至少一项:
(a)幅度平方相干系数(即Magnitude-Squared Coherence);
(b)相对偏差系数;
(c)相对强度敏感系数;
(d)幅度谱的幅度平方相干系数;
(e)相位谱的幅度平方相干系数。
本申请实施例中,目标相干系数用于指示第一音频信号与第二音频信号间的相干特征,通常基于取值在0~1间的相异度或相似性度量来生成,具体确定目标相干系数的过程如下:
首先,在目标频率范围内,频点相干性(即Coherence)可表示为下述的公式(1):
Figure BDA0003833057110000071
其中,PX(ω)为第一音频信号X(ω)的功率谱密度,PY(ω)第二音频信号Y(ω)的功率谱密度,PXY(ω)为第一音频信号和第二音频信号间的互功率谱密度。COH(ω)是复数,且|COH(ω)|≤1,当且仅当第一音频信号和第二音频信号完全相干时等式成立。为了避免开平方运算,常采用上述(a)幅度平方相干系数,可表示为下述的公式(2):
Figure BDA0003833057110000072
显然,MSC(ω)的归一化效果对X(ω)和Y(ω)的相对强度不敏感,而第一音频信号和第二音频信号的相对强度对判断噪声有重要意义,为此再定义归一化功率水平差,即上述(b)相对偏差系数,可表示为下述的公式(3):
Figure BDA0003833057110000081
显然,0≤NPLD(ω)≤1是一种期望音频信号间的相异度度量。此外,也可以将COH变形为对第一音频信号和第二音频信号的相对强度敏感的形式,即上述(c)相对强度敏感系数,如下述的公式(4):
Figure BDA0003833057110000082
也可以将上述公式(2)变形为分别只考虑幅度谱或相位谱的版本,其中只考虑幅度谱的形式,即上述(d)幅度谱的幅度平方相干系数,可表示为下述的公式(5):
Figure BDA0003833057110000083
显然,可以得到如下接连的不等式关系(6),其度量了期望音频信号间的相似度:
0≤COH_AS(ω)2≤MSC(ω)≤MSC_AMP(ω)≤1;   (6)
综上,任何其它的取值在0~1间的相似度或相异度判据均是可用的。如此可以确定第一音频信号与第二音频信号间的目标相干系数。
本申请实施例中,由于目标相干系数可以包括上述(a)至(e)中的至少一项,因此可以使电子设备基于第一音频信号与第二音频信号间的不同目标相干系数,得到音频信号不同的噪声频带,从而使电子设备在根据噪声频带划分目标频率范围时,进一步提高划分目标频率范围的灵活性。
可选地,本申请实施例中,电子设备在确定上述目标相干系数之后,可以基于该目标相干系数的线性或非线性组合,得到期望音频信号的存在概率
Figure BDA0003833057110000084
Figure BDA0003833057110000085
可表示为下述的公式(7):
Figure BDA0003833057110000086
可以理解,由于噪声能量集中在低频段,并在趋向高频段时迅速衰减,因此电子设备依据
Figure BDA0003833057110000087
可以从低频到高频搜索并估计出第一音频信号的噪声频带和第二音频信号的噪声频带间的并集频带。
可选地,本申请实施例中,电子设备在估计出上述并集频带之后,可以先基于基频的谐波位置对PX(ω)和PY(ω)进行修正,以防止带宽过估计;然后电子设备可以基于修正后的PX(ω)和PY(ω)从该并集频带中估计出第一音频信号的噪声频带和第二音频信号的噪声频带。
本申请实施例中,由于第一音频信号的噪声频带和第二音频信号的噪声频带,可以是基于第一音频信号与第二音频信号间的目标相干系数得到的,因此可以提高得到音频信号的噪声频带的准确性。
下面对电子设备将目标频率范围划分为第一频带、第二频带和无风噪频带的具体方法进行详细说明。
可选地,本申请实施例中,电子设备在基于上述目标相干系数,估计得到第一音频信号的噪声频带(以下称为噪声频带A)和第二音频信号的噪声频带(以下称为噪声频带B)之后,可以将目标频率范围划分为:
a、噪声频带A和噪声频带B的交集(即第一频带);
b、噪声频带A和噪声频带B,对应的外延风噪频带与上述交集间的外延差集(即第二频带);
c、无风噪频带。
下面结合附图,对本申请实施例提供的音频信号处理方法进行示例性地说明。
示例性地,如图2所示,电子设备可以先基于噪声频带21(即第一音频信号的噪声频带)和噪声频带22(即第二音频信号的噪声频带),估计得到噪声频带25(即上述外延风噪频带),然后可以将目标频率范围划分为频带23(即第一频带)、频带24(即第二频带)和频带26(即无风噪频带);可以看出,频带23为噪声频带21和噪声频带22的交集,频带24为:噪声频带21和噪声频带22,对应的噪声频带25与频带23间的外延差集。
可选地,本申请实施例中,电子设备在估计得到第一音频信号的噪声频带和第二音频信号的噪声频带的同时,可以基于上述(a)幅度平方相干系数和上述(b)相对偏差系数,生成第一音频信号对应的初始增益及第二音频信号对应的初始增益,以用于对音频信号的降噪。
步骤102、电子设备在第一频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第一融合处理。
本申请实施例中,第一音频信号和第二音频信号分别对应一个传输通道。
可选地,本申请实施例中,上述传输通道信息可以包括对应传输通道中的音频信号的幅度谱、风噪增益和稳噪增益等信息。
可选地,本申请实施例中,上述步骤102具体可以通过下述的步骤102a或步骤102b实现。
步骤102a、电子设备在第一子音频信号的噪声强度小于第二子音频信号的噪声强度的情况下,将第一子音频信号对应的传输通道信息,以第一权重叠加至第二子音频信号对应的传输通道信息。
步骤102b、电子设备在第一子音频信号的噪声强度大于第二子音频信号的噪声强度的情况下,将第二子音频信号对应的传输通道信息,以第二权重叠加至第一子音频信号对应的传输通道信息。
本申请实施例中,第一子音频信号为:第一音频信号在第一频带内的音频信号;第二子音频信号为:第二音频信号在第一频带内的音频信号。
可以理解,第一子音频信号对应的传输通道信息为:第一音频信号对应的传输通道,在第一频带内的传输通道信息;第二子音频信号对应的传输通道信息为:第二音频信号对应的传输通道,在第一频带内的传输通道信息。
可选地,本申请实施例中,第一权重和第二权重可以相同,或可以不同。
本申请实施例中,电子设备在将一个传输通道信息叠加至另一个传输通道信息之后,仍然保留该一个传输通道信息。
本申请实施例中,由于电子设备可以根据第一子音频信号的噪声强度与第二子音频信号的噪声强度间的大小关系,以不同的方式叠加第一频带内的传输通道信息,因此可以提高电子设备融合传输通道信息的灵活性。
步骤103、电子设备在在第二频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第二融合处理。
可选地,本申请实施例中,上述步骤103具体可以通过下述的步骤103a或步骤103b实现。
步骤103a、电子设备在第三子音频信号为无噪声音频信号的情况下,将第三子音频信号对应的传输通道信息,以第三权重叠加至第四子音频信号对应的传输通道信息。
步骤103b、电子设备在第四子音频信号为无噪声音频信号的情况下,将第四子音频信号对应的传输通道信息,以第四权重叠加至第三子音频信号对应的传输通道信息。
本申请实施例中,第三子音频信号为:第一音频信号在第二频带内的音频信号;第四子音频信号为:第二音频信号在第二频带内的音频信号。
可以理解,第三子音频信号对应的传输通道信息为:第一音频信号对应的传输通道,在第二频带内的传输通道信息;第四子音频信号对应的传输通道信息为:第二音频信号对应的传输通道,在第二频带内的传输通道信息。
可选地,本申请实施例中,第三权重和第四权重可以相同,或可以不同。
本申请实施例中,由于电子设备可以在第三子音频信号为无噪声音频信号,或第四子音频信号为无噪声音频信号的情况下,分别以不同的方式叠加第二频带内的传输通道信息,因此可以进一步提高电子设备融合传输通道信息的灵活性。
可选地,本申请实施例中,第一融合处理的处理强度可以小于第二融合处理的处理强度;即第一权重和第二权重可以均小于目标权重,目标权重为第三权重和第四权重中的最小权重。
例如,第一权重和第二权重可以均为0.5,此时电子设备可以以该权重0.5在第一频带内完成传输通道信息的叠加;第三权重和第四权重可以均为1,此时电子设备可以以该权重1在第二频带内完成传输通道信息的叠加,即在第二频带内,将一个传输通道信息直接替换为另一个传输通道信息。
可以看出,第一融合处理可以实现传输通道信息的叠加,第二融合处理可以实现传输通道信息的替换。
本申请实施例中,由于第一融合处理的处理强度可以小于第二融合处理的处理强度,因此可以在不同的频带内以不同的处理强度进行传输通道信息的融合处理,从而可以进一步提高电子设备融合传输通道信息的灵活性。
步骤104、电子设备对对应的传输通道信息进行融合处理后的目标音频信号进行降噪。
本申请实施例中,目标音频信号包括第一音频信号和第二音频信号中的至少之一。
可以理解,电子设备可以对第一音频信号和第二音频信号中,进行对应的传输通道信息融合处理的音频信号进行降噪。
可选地,本申请实施例中,进行融合处理后的传输通道信息中可以包括第一增益和第二增益。
本申请实施例中,第一增益用于对第一音频信号进行降噪,第二增益用于对第二音频信号进行降噪。
可选地,本申请实施例中,第一增益和第二增益中的至少之一为:对传输通道信息中的初始增益进行融合处理后的增益。
可选地,本申请实施例中,若目标音频信号包括第一音频信号和第二音频信号,则电子设备可以将第一增益作用在第一音频信号的幅度谱上,并将第二增益作用在第二音频信号的幅度谱上,以对第一音频信号和第二音频信号进行降噪。
可选地,本申请实施例中,上述步骤104具体可以通过下述的步骤104a实现。
步骤104a、电子设备在在目标音频信号的信风比小于或等于预设阈值的情况下,以目标降噪方式对目标音频信号进行降噪。
本申请实施例中,目标降噪方式为:在第三频带内对目标音频信号进行第一降噪处理,且在第四频带内对目标音频信号进行第二降噪处理的降噪方式。
本申请实施例中,第三频带的频率小于或等于第一频率阈值,第四频带的频率大于或等于第二频率阈值。
可选地,本申请实施例中,第一频率阈值和第二频率阈值均可以为电子设备默认的,或可以为用户根据实际使用需求设置的。
本申请实施例中,第一降噪处理的处理强度小于第二降噪处理的处理强度。
可选地,本申请实施例中,第一降噪处理的处理强度可以接近于0。
可选地,本申请实施例中,电子设备可以基于音频信号中的噪声频带,确定该音频信号的信风比。
可选地,本申请实施例中,上述预设阈值可以为电子设备默认的,或可以为用户根据实际使用需求设置的。
可以理解,音频信号的信风比小于或等于上述预设阈值,即该音频信号中存在超大频带的噪声信号;若对该音频信号进行降噪,则需倾向于保守降噪,即减少低频带噪声信号的抑制,仅做部分高频带噪声信号的抑制,也即以目标降噪方式进行降噪,以实现听感更加自然的降噪效果。
本申请实施例中,由于电子设备在目标音频信号的信风比小于或等于预设阈值的情况下,可以以目标降噪方式(即在低频带进行第一降噪处理,在高频带进行处理强度更大的第二降噪处理)对目标音频信号进行降噪,因此可以确保进行降噪后的目标音频信号的听感更加自然。
在本申请实施例提供的音频信号处理方法中,由于电子设备在对不同麦克风采集的音频信号进行降噪处理之前,可以先基于划分的频带,以及每个音频信号对应的传输通道信息,进行传输通道信息的融合处理,然后再对对应的传输通道信息进行融合处理后的音频信号进行降噪,因此电子设备在处理音频信号时可以无需基于单一音频信号的特征或多个音频信号的所有频点,而是可以结合划分的不同频带内不同音频信号对应的传输通道信息,从而可以提高电子设备处理音频信号的稳健性。
可选地,本申请实施例中,在上述步骤104之后,本申请实施例提供的音频信号处理方法还可以包括下述的步骤105。
步骤105、电子设备在至少一个目标频带内插入噪声补偿音频信号。
本申请实施例中,每个目标频带为目标频率范围内,进行降噪的音频信号所在的一个频带。
本申请实施例中,噪声补偿音频信号用于对对应目标频带内的音频信号进行补偿。
可选地,本申请实施例中,每个目标频带可以与一个噪声补偿音频信号一一对应。
可选地,本申请实施例中,噪声补偿音频信号可以为:与第一目标频带中的音频信号连续性较好的音频信号;第一目标频带为:与对应目标频带相邻的且不包括进行降噪的音频信号的频带。
本申请实施例中,由于电子设备可以在至少一个目标频带内插入噪声补偿音频信号,因此可以提升进行降噪后的目标音频信号的连续性,从而可以提高目标音频信号的主观听感。
下面结合附图,对本申请实施例提供的音频信号处理方法应用的一种示例进行示例性地说明。
示例性地,音频信号的工作频带通常在24kHz内,图3示出了示例音频信号的输入语谱图,如图3所示,主麦克风采集的音频信号(以下称为音频信号A)与副麦克风采集的音频信号(以下称为音频信号B)有显著不同的风噪频带,音频信号B对应的平滑功率谱中的区间31为受噪声污染严重的区间。为了对采集的音频信号进行降噪,电子设备可以基于音频信号A和音频信号B,确定该两个音频信号间的目标相干系数。
图4示出了电子设备确定的目标相干系数及其综合效果,如图4所示,电子设备确定的目标相干系数包括:COH_AS2,MSC,MSC_AMP,NPLD(即上述实施例中的(a)至(d)),由COH_AS2对应的平滑功率谱41、MSC对应的平滑功率谱42、MSC_AMP对应的平滑功率谱43、NPLD对应的平滑功率谱44可知,目标相干系数如上述不等式(6)指示的一样,展现出了不同的相似性判别倾向性;然后,电子设备可以通过对不同频带以不同的倾向性组合这四个特征,生成稳健性更高的期望音频的存在概率
Figure BDA0003833057110000152
Figure BDA0003833057110000153
对应的平滑功率谱如图4中的平滑功率谱45所示,进而电子设备可以根据该概率
Figure BDA0003833057110000151
搜素估计每个音频信号中的噪声频带。
图5示出了电子设备搜索估计的噪声频带及对应的风噪增益,如图5所示,音频信号A中的噪声频带为曲线52对应的频带,音频信号B中的噪声频带为曲线53对应的频带,曲线51对应的频带为估计的音频信号A中的噪声频带与音频信号B中的噪声频带的并集频带,显然该并集频带是过估计的,可以看出,每个噪声频带紧密地界定了噪声存在的频带;其中,平滑功率谱54为音频信号A中的噪声频带对应的风噪增益的平滑功率谱,平滑功率谱55为音频信号B中的噪声频带对应的风噪增益的平滑功率谱。
图6示出了电子设备对音频信号A和音频信号B进行降噪前后的语谱图,如图6所示,音频信号A中的风噪频带61经降噪处理后为频带63,音频信号B中的风噪频带62经降噪处理后为频带64,可以看出,立体声输入中的强噪声在立体声输出中得到了充分有效地抑制,并且受益于的传输通道信息的融合,低信风比处的音频信号得到了有效地保护,使其听感和音质连续自然。如此可以实现稳健地对音频信号的降噪,提升电子设备的降噪效果。
下面结合附图,对本申请实施例提供的音频信号处理方法的信息流进行示例性地说明。
示例性地,图7示出了是本申请实施例提供的音频信号处理方法应用于双麦立体声稳健风噪检测抑制的信息流示意图,如图7所示,电子设备在通过不同麦克风采集到音频信号Xi(ω)(即第一音频信号)和音频信号Yi(ω)(即第二音频信号)之后,可以根据该两个音频信号间的目标相干系数得到期望音频信号的存在概率
Figure BDA0003833057110000154
(ω),并可以根据
Figure BDA0003833057110000155
(ω)从低频到高频搜索并估计一个双麦并集风噪带宽Wunion
然后电子设备可以基于Pitch的谐波位置对单麦功率谱进行修正,以防止带宽过估计,并根据修正后的单麦功率谱在Wunion内搜索并估计单麦风和噪带宽WX(即第一音频信号的噪声频带)和WY(即第二音频信号的噪声频带);
从而电子设备可以基于WX和WY将频域(即目标频率范围)划分为:风噪带宽交集Bmeet(即第一频带)、外延风噪带宽差集Bdiff(即第二频带)、无风噪频带Bclean。对Bmeet,双麦均含有风噪,但通常一个传输通道(或麦克风)的风噪强度小于另一个传输通道的风噪强度,基于单麦风噪强度,可在风噪抑制前对该子带内的传输通道信息进行融合处理(即第一融合处理),即将弱风噪传输通道信息(包括幅度谱,风噪增益,稳噪增益等)以算数或几何平均方式(即第一权重或第二权重)叠加到强风噪传输通道信息上;对Bdiff,通常一个传输通道收到风噪污染,而另一个传输通道是不受风噪污染的,同样在风噪抑制前对该子带内的传输通道信息进行融合处理(即第人融合处理),即对该子带以更大的比例(即第三权重或第四权重)将无风噪传输通道信息叠加到有风噪传输通道信息上;对Bclean,不做风噪抑制。此外,电子设备还可以基于单麦风噪带宽,辨别极端风噪情形,在偶尔会出现的超大带宽或狂风情形下,原始音频信风比极低,极端的风噪抑制可靠性较差,此时风噪抑制要倾向于保守,低频风噪抑制减少,仅做部分高频段风噪抑制,以实现听感更加自然的降噪效果;
在电子设备进行传输通道信息融合之后,电子设备可以利用风噪增益(即第一增益和第二增益)作用在传输通道幅度谱上完成风噪抑制;然而经风噪抑制后的音频幅度谱连续性变差,取决于录制音频成分,会存在听感上间断或起伏现象,为此,电子设备可以在风噪抑制后的频带(即至少一个目标频带)内插入舒适噪声(即噪声补偿音频信号),以补偿一定量与相邻无风噪音频背景连续性较好的舒适噪声,从而可显著改善主观听感,如此可以完成风噪抑制,得到降噪后的音频信号Xo(ω)和Yo(ω)。
本申请实施例提供的音频信号处理方法,执行主体可以为音频信号处理装置。本申请实施例中以音频信号处理装置执行音频信号处理方法为例,说明本申请实施例提供的音频信号处理装置。
结合图8,本申请实施例提供一种音频信号处理装置80,该音频信号处理装置80可以包括划分模块81、融合模块82和降噪模块83。划分模块81,可以用于根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带,第一音频信号为第一麦克风采集目标音源得到的音频信号,第二音频信号为第二麦克风采集目标音源得到的音频信号。融合模块82,可以用于在第一频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第一融合处理。融合模块82,还可以用于在第二频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第二融合处理。降噪模块83,可以用于对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,目标音频信号包括第一音频信号和第二音频信号中的至少之一。
一种可能的实现方式中,还可以包括以下至少一项:第一频带可以为第一音频信号的噪声频带与第二音频信号的噪声频带的交集频带;第二频带可以为第一音频信号的噪声频带与第二音频信号的噪声频带的外延差集频带。
一种可能的实现方式中,融合模块82,具体可以用于:在第一子音频信号的噪声强度小于第二子音频信号的噪声强度的情况下,将第一子音频信号对应的传输通道信息,以第一权重叠加至第二子音频信号对应的传输通道信息;或者,在第一子音频信号的噪声强度大于第二子音频信号的噪声强度的情况下,将第二子音频信号对应的传输通道信息,以第二权重叠加至第一子音频信号对应的传输通道信息。其中,第一子音频信号为:第一音频信号在第一频带内的音频信号;第二子音频信号为:第二音频信号在第一频带内的音频信号。
一种可能的实现方式中,融合模块82,具体可以用于:在第三子音频信号为无噪声音频信号的情况下,将第三子音频信号对应的传输通道信息,以第三权重叠加至第四子音频信号对应的传输通道信息;或者,在第四子音频信号为无噪声音频信号的情况下,将第四子音频信号对应的传输通道信息,以第四权重叠加至第三子音频信号对应的传输通道信息。其中,第三子音频信号为:第一音频信号在第二频带内的音频信号;第四子音频信号为:第二音频信号在第二频带内的音频信号。
一种可能的实现方式中,第一融合处理的处理强度小于第二融合处理的处理强度。
一种可能的实现方式中,降噪模块83,具体可以用于在目标音频信号的信风比小于或等于预设阈值的情况下,以目标降噪方式对目标音频信号进行降噪。其中,目标降噪方式为:在第三频带内对目标音频信号进行第一降噪处理,且在第四频带内对目标音频信号进行第二降噪处理的降噪方式;第三频带的频率小于或等于第一频率阈值,第四频带的频率大于或等于第二频率阈值,第一降噪处理的处理强度小于第二降噪处理的处理强度。
一种可能的实现方式中,音频信号处理装置80还可以包括插入模块。插入模块,可以用于在降噪模块83对对应的传输通道信息进行融合处理后的目标音频信号进行降噪之后,在至少一个目标频带内插入噪声补偿音频信号。其中,每个目标频带为目标频率范围内,进行降噪的音频信号所在的一个频带;噪声补偿音频信号用于对对应目标频带内的音频信号进行补偿。
一种可能的实现方式中,第一音频信号的噪声频带和第二音频信号的噪声频带,是基于第一音频信号与第二音频信号间的目标相干系数得到的。
一种可能的实现方式中,目标相干系数可以包括以下至少一项:幅度平方相干系数;相对偏差系数;相对强度敏感系数;幅度谱的幅度平方相干系数;相位谱的幅度平方相干系数。
在本申请实施例提供的音频信号处理装置中,由于该音频信号处理装置在对不同麦克风采集的音频信号进行降噪处理之前,可以先基于划分的频带,以及每个音频信号对应的传输通道信息,进行传输通道信息的融合处理,然后再对对应的传输通道信息进行融合处理后的音频信号进行降噪,因此该音频信号处理装置在处理音频信号时可以无需基于单一音频信号的特征或多个音频信号的所有频点,而是可以结合划分的不同频带内不同音频信号对应的传输通道信息,从而可以提高处理音频信号的稳健性。
本申请实施例中的音频信号处理装置可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobilepersonal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,还可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的音频信号处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的音频信号处理装置能够实现图1至图7的方法实施例实现的各个过程,为避免重复,这里不再赘述。
如图9所示,本申请实施例还提供一种电子设备900,包括处理器901和存储器902,存储器902上存储有可在所述处理器901上运行的程序或指令,该程序或指令被处理器901执行时实现如上述音频信号处理方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图10为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备1000包括但不限于:射频单元1001、网络模块1002、音频输出单元1003、输入单元1004、传感器1005、显示单元1006、用户输入单元1007、接口单元1008、存储器1009、以及处理器1010等部件。
本领域技术人员可以理解,电子设备1000还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图10中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器1010,可以用于根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带,第一音频信号为第一麦克风采集目标音源得到的音频信号,第二音频信号为第二麦克风采集目标音源得到的音频信号;且可以用于在第一频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第一融合处理;且可以用于在第二频带内,对第一音频信号对应的传输通道信息和第二音频信号对应的传输通道信息进行第二融合处理;并可以用于对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,目标音频信号包括第一音频信号和第二音频信号中的至少之一。
一种可能的实现方式中,还可以包括以下至少一项:第一频带可以为第一音频信号的噪声频带与第二音频信号的噪声频带的交集频带;第二频带可以为第一音频信号的噪声频带与第二音频信号的噪声频带的外延差集频带。
一种可能的实现方式中,处理器1010,具体可以用于:在第一子音频信号的噪声强度小于第二子音频信号的噪声强度的情况下,将第一子音频信号对应的传输通道信息,以第一权重叠加至第二子音频信号对应的传输通道信息;或者,在第一子音频信号的噪声强度大于第二子音频信号的噪声强度的情况下,将第二子音频信号对应的传输通道信息,以第二权重叠加至第一子音频信号对应的传输通道信息。其中,第一子音频信号为:第一音频信号在第一频带内的音频信号;第二子音频信号为:第二音频信号在第一频带内的音频信号。
一种可能的实现方式中,处理器1010,具体可以用于:在第三子音频信号为无噪声音频信号的情况下,将第三子音频信号对应的传输通道信息,以第三权重叠加至第四子音频信号对应的传输通道信息;或者,在第四子音频信号为无噪声音频信号的情况下,将第四子音频信号对应的传输通道信息,以第四权重叠加至第三子音频信号对应的传输通道信息。其中,第三子音频信号为:第一音频信号在第二频带内的音频信号;第四子音频信号为:第二音频信号在第二频带内的音频信号。
一种可能的实现方式中,第一融合处理的处理强度小于第二融合处理的处理强度。
一种可能的实现方式中,处理器1010,具体可以用于在目标音频信号的信风比小于或等于预设阈值的情况下,以目标降噪方式对目标音频信号进行降噪。其中,目标降噪方式为:在第三频带内对目标音频信号进行第一降噪处理,且在第四频带内对目标音频信号进行第二降噪处理的降噪方式;第三频带的频率小于或等于第一频率阈值,第四频带的频率大于或等于第二频率阈值,第一降噪处理的处理强度小于第二降噪处理的处理强度。
一种可能的实现方式中,处理器1010,还可以用于在对对应的传输通道信息进行融合处理后的目标音频信号进行降噪之后,在至少一个目标频带内插入噪声补偿音频信号。其中,每个目标频带为目标频率范围内,进行降噪的音频信号所在的一个频带;噪声补偿音频信号用于对对应目标频带内的音频信号进行补偿。
一种可能的实现方式中,第一音频信号的噪声频带和第二音频信号的噪声频带,是基于第一音频信号与第二音频信号间的目标相干系数得到的。
一种可能的实现方式中,目标相干系数可以包括以下至少一项:幅度平方相干系数;相对偏差系数;相对强度敏感系数;幅度谱的幅度平方相干系数;相位谱的幅度平方相干系数。
在本申请实施例提供的电子设备中,由于该电子设备在对不同麦克风采集的音频信号进行降噪处理之前,可以先基于划分的频带,以及每个音频信号对应的传输通道信息,进行传输通道信息的融合处理,然后再对对应的传输通道信息进行融合处理后的音频信号进行降噪,因此该电子设备在处理音频信号时可以无需基于单一音频信号的特征或多个音频信号的所有频点,而是可以结合划分的不同频带内不同音频信号对应的传输通道信息,从而可以提高电子设备处理音频信号的稳健性。
本实施例中各种实现方式具有的有益效果具体可以参见上述方法实施例中相应实现方式所具有的有益效果,为避免重复,此处不再赘述。
应理解的是,本申请实施例中,输入单元1004可以包括图形处理器(GraphicsProcessing Unit,GPU)10041和麦克风10042,图形处理器10041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1006可包括显示面板10061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板10061。用户输入单元1007包括触控面板10071以及其他输入设备10072中的至少一种。触控面板10071,也称为触摸屏。触控面板10071可包括触摸检测装置和触摸控制器两个部分。其他输入设备10072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
存储器1009可用于存储软件程序以及各种数据。存储器1009可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器1009可以包括易失性存储器或非易失性存储器,或者,存储器1009可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请实施例中的存储器1009包括但不限于这些和任意其它适合类型的存储器。
处理器1010可包括一个或多个处理单元;可选的,处理器1010集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器1010中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现如上述音频信号处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如上述音频信号处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述音频信号处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (13)

1.一种音频信号处理方法,其特征在于,所述方法包括:
根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带,所述第一音频信号为第一麦克风采集目标音源得到的音频信号,所述第二音频信号为第二麦克风采集所述目标音源得到的音频信号;
在所述第一频带内,对所述第一音频信号对应的传输通道信息和所述第二音频信号对应的传输通道信息进行第一融合处理;
在所述第二频带内,对所述第一音频信号对应的传输通道信息和所述第二音频信号对应的传输通道信息进行第二融合处理;
对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,所述目标音频信号包括所述第一音频信号和所述第二音频信号中的至少之一。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括以下至少一项:
所述第一频带为所述第一音频信号的噪声频带与所述第二音频信号的噪声频带的交集频带;
所述第二频带为所述第一音频信号的噪声频带与所述第二音频信号的噪声频带的外延差集频带。
3.根据权利要求1或2所述的方法,其特征在于,所述在所述第一频带内,对所述第一音频信号对应的传输通道信息和所述第二音频信号对应的传输通道信息进行第一融合处理,包括:
在第一子音频信号的噪声强度小于第二子音频信号的噪声强度的情况下,将所述第一子音频信号对应的传输通道信息,以第一权重叠加至所述第二子音频信号对应的传输通道信息;或者,
在第一子音频信号的噪声强度大于第二子音频信号的噪声强度的情况下,将所述第二子音频信号对应的传输通道信息,以第二权重叠加至所述第一子音频信号对应的传输通道信息;
其中,所述第一子音频信号为:所述第一音频信号在所述第一频带内的音频信号,所述第二子音频信号为:所述第二音频信号在所述第一频带内的音频信号。
4.根据权利要求1或2所述的方法,其特征在于,所述在所述第二频带内,对所述第一音频信号对应的传输通道信息和所述第二音频信号对应的传输通道信息进行第二融合处理,包括:
在第三子音频信号为无噪声音频信号的情况下,将所述第三子音频信号对应的传输通道信息,以第三权重叠加至第四子音频信号对应的传输通道信息;或者,
在第四子音频信号为无噪声音频信号的情况下,将所述第四子音频信号对应的传输通道信息,以第四权重叠加至第三子音频信号对应的传输通道信息;
其中,所述第三子音频信号为:所述第一音频信号在所述第二频带内的音频信号;所述第四子音频信号为:所述第二音频信号在所述第二频带内的音频信号。
5.根据权利要求1或2中任一项所述的方法,其特征在于,所述第一融合处理的处理强度小于所述第二融合处理的处理强度。
6.根据权利要求1或2所述的方法,其特征在于,所述对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,包括:
在所述目标音频信号的信风比小于或等于预设阈值的情况下,以目标降噪方式对所述目标音频信号进行降噪;
其中,所述目标降噪方式为:在第三频带内对所述目标音频信号进行第一降噪处理,且在第四频带内对所述目标音频信号进行第二降噪处理的降噪方式;所述第三频带的频率小于或等于第一频率阈值,所述第四频带的频率大于或等于第二频率阈值,所述第一降噪处理的处理强度小于所述第二降噪处理的处理强度。
7.根据权利要求1或2所述的方法,其特征在于,所述对对应的传输通道信息进行融合处理后的目标音频信号进行降噪之后,所述方法还包括:
在至少一个目标频带内插入噪声补偿音频信号;
其中,每个目标频带为所述目标频率范围内,进行降噪的音频信号所在的一个频带;所述噪声补偿音频信号用于对对应目标频带内的音频信号进行补偿。
8.根据权利要求1或2所述的方法,其特征在于,所述第一音频信号的噪声频带和所述第二音频信号的噪声频带,是基于所述第一音频信号与所述第二音频信号间的目标相干系数得到的。
9.根据权利要求8所述的方法,其特征在于,所述目标相干系数包括以下至少一项:
幅度平方相干系数;
相对偏差系数;
相对强度敏感系数;
幅度谱的幅度平方相干系数;
相位谱的幅度平方相干系数。
10.一种音频信号处理装置,其特征在于,所述装置包括划分模块、融合模块和降噪模块;
所述划分模块,用于根据第一音频信号的噪声频带和第二音频信号的噪声频带,将目标频率范围划分为第一频带和第二频带,所述第一音频信号为第一麦克风采集目标音源得到的音频信号,所述第二音频信号为第二麦克风采集所述目标音源得到的音频信号;
所述融合模块,用于在所述第一频带内,对所述第一音频信号对应的传输通道信息和所述第二音频信号对应的传输通道信息进行第一融合处理;
所述融合模块,还用于在所述第二频带内,对所述第一音频信号对应的传输通道信息和所述第二音频信号对应的传输通道信息进行第二融合处理;
所述降噪模块,用于对对应的传输通道信息进行融合处理后的目标音频信号进行降噪,所述目标音频信号包括所述第一音频信号和所述第二音频信号中的至少之一。
11.根据权利要求10所述的装置,其特征在于,还包括以下至少一项:
所述第一频带为所述第一音频信号的噪声频带与所述第二音频信号的噪声频带的交集频带;
所述第二频带为所述第一音频信号的噪声频带与所述第二音频信号的噪声频带的外延差集频带。
12.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-9中任一项所述的音频信号处理方法的步骤。
13.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-9中任一项所述的音频信号处理方法的步骤。
CN202211095430.7A 2022-09-05 2022-09-05 音频信号处理方法、装置、电子设备及可读存储介质 Pending CN116095565A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211095430.7A CN116095565A (zh) 2022-09-05 2022-09-05 音频信号处理方法、装置、电子设备及可读存储介质
PCT/CN2023/115441 WO2024051521A1 (zh) 2022-09-05 2023-08-29 音频信号处理方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211095430.7A CN116095565A (zh) 2022-09-05 2022-09-05 音频信号处理方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN116095565A true CN116095565A (zh) 2023-05-09

Family

ID=86206937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211095430.7A Pending CN116095565A (zh) 2022-09-05 2022-09-05 音频信号处理方法、装置、电子设备及可读存储介质

Country Status (2)

Country Link
CN (1) CN116095565A (zh)
WO (1) WO2024051521A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024051521A1 (zh) * 2022-09-05 2024-03-14 维沃移动通信有限公司 音频信号处理方法、装置、电子设备及可读存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8428275B2 (en) * 2007-06-22 2013-04-23 Sanyo Electric Co., Ltd. Wind noise reduction device
CN106303837B (zh) * 2015-06-24 2019-10-18 联芯科技有限公司 双麦克风的风噪检测及抑制方法、系统
US9460727B1 (en) * 2015-07-01 2016-10-04 Gopro, Inc. Audio encoder for wind and microphone noise reduction in a microphone array system
US9721581B2 (en) * 2015-08-25 2017-08-01 Blackberry Limited Method and device for mitigating wind noise in a speech signal generated at a microphone of the device
WO2019112468A1 (en) * 2017-12-08 2019-06-13 Huawei Technologies Co., Ltd. Multi-microphone noise reduction method, apparatus and terminal device
CN113949955B (zh) * 2020-07-16 2024-04-09 Oppo广东移动通信有限公司 降噪处理方法、装置、电子设备、耳机及存储介质
US11721353B2 (en) * 2020-12-21 2023-08-08 Qualcomm Incorporated Spatial audio wind noise detection
CN113223554A (zh) * 2021-03-15 2021-08-06 百度在线网络技术(北京)有限公司 一种风噪检测方法、装置、设备和存储介质
CN113160846B (zh) * 2021-04-22 2024-05-17 维沃移动通信有限公司 噪声抑制方法和电子设备
CN113539285B (zh) * 2021-06-04 2023-10-31 浙江华创视讯科技有限公司 音频信号降噪方法、电子装置和存储介质
CN114596874A (zh) * 2022-03-03 2022-06-07 上海富瀚微电子股份有限公司 一种基于多麦克风的风噪抑制方法与装置
CN116095565A (zh) * 2022-09-05 2023-05-09 维沃移动通信有限公司 音频信号处理方法、装置、电子设备及可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024051521A1 (zh) * 2022-09-05 2024-03-14 维沃移动通信有限公司 音频信号处理方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
WO2024051521A1 (zh) 2024-03-14

Similar Documents

Publication Publication Date Title
CN110970057B (zh) 一种声音处理方法、装置与设备
US10142759B2 (en) Method and apparatus for processing audio with determined trajectory
CN105103218B (zh) 环境噪声均方根(rms)检测器
CN109994127B (zh) 音频检测方法、装置、电子设备及存储介质
CN113192527B (zh) 用于消除回声的方法、装置、电子设备和存储介质
CN111524498B (zh) 滤波方法、装置及电子设备
EP4068284A1 (en) Live broadcast audio processing method and apparatus, and electronic device and storage medium
CN112468633B (zh) 扬声器的调整方法、装置和电子设备
CN111968662A (zh) 音频信号的处理方法及装置、存储介质
CN110177317A (zh) 回声消除方法、装置、计算机可读存储介质和计算机设备
CN109756818B (zh) 双麦克风降噪方法、装置、存储介质及电子设备
CN112468924A (zh) 一种耳机降噪方法及装置
CN112233689B (zh) 音频降噪方法、装置、设备及介质
WO2020252629A1 (zh) 残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备
WO2024051521A1 (zh) 音频信号处理方法、装置、电子设备及可读存储介质
US20240046947A1 (en) Speech signal enhancement method and apparatus, and electronic device
WO2022143522A1 (zh) 音频信号处理方法、装置和电子设备
CN113160846B (zh) 噪声抑制方法和电子设备
CN112397082B (zh) 估计回声延迟的方法、装置、电子设备和存储介质
WO2024088142A1 (zh) 音频信号处理方法、装置、电子设备及可读存储介质
CN113470613A (zh) 合唱混音方法、装置、电子设备和存储介质
US9449616B2 (en) Noise reduction system, speech detection system, speech recognition system, noise reduction method, and noise reduction program
CN112233688A (zh) 音频降噪方法、装置、设备及介质
CN114040309B (zh) 风噪检测方法、装置、电子设备及存储介质
CN114067817A (zh) 低音增强方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination