CN115767346A - 耳机风噪处理方法、装置及存储介质 - Google Patents

耳机风噪处理方法、装置及存储介质 Download PDF

Info

Publication number
CN115767346A
CN115767346A CN202211430488.2A CN202211430488A CN115767346A CN 115767346 A CN115767346 A CN 115767346A CN 202211430488 A CN202211430488 A CN 202211430488A CN 115767346 A CN115767346 A CN 115767346A
Authority
CN
China
Prior art keywords
wind noise
power spectral
spectral density
earphone
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211430488.2A
Other languages
English (en)
Inventor
万成
张锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd, Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN202211430488.2A priority Critical patent/CN115767346A/zh
Publication of CN115767346A publication Critical patent/CN115767346A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本公开涉及一种耳机风噪处理方法、装置及存储介质,用以提升耳机风噪抑制效果。所述耳机至少包括第一麦克风和第二麦克风,所述方法包括:获取第一麦克风采集的第一音频信号对应的第一频谱数据和第二麦克风采集的第二音频信号对应的第二频谱数据;根据第一频谱数据和第二频谱数据,确定耳机是否存在风噪;在确定耳机存在风噪的情况下,基于目标平滑因子,确定第一频谱数据的第一自功率谱密度、第二频谱数据的第二自功率谱密度以及第一频谱数据和第二频谱数据的互功率谱密度;根据第一自功率谱密度、第二自功率谱密度和互功率谱密度,确定滤波器的滤波参数;根据确定出的滤波参数,对所述耳机接收的信号进行滤波处理,以得到风噪处理结果。

Description

耳机风噪处理方法、装置及存储介质
技术领域
本公开涉及风噪处理领域,尤其涉及耳机风噪处理方法、装置及存储介质。
背景技术
风噪声是气流碰撞耳机、手机等电子产品表面所形成的湍流,其能量集中于低频(1kHz以下),且属于非平稳信号,方向、大小不可预测。相关技术中,对于风噪的抑制,一般分为物理手段和软件算法:物理手段主要采用风道设计和加入防风罩等,但是,由于材料和物理尺寸的限制,物理方法的实现较为困难,可移植性低;软件算法包括单通道、多通道风噪抑制算法,大部分都基于传统的语音增强算法及其改进方法,但是,由于风噪的低频与非平稳特性,软件算法很难在鲁棒性、低功耗、风噪抑制能力间取得平衡。
发明内容
为克服相关技术中存在的问题,本公开提供一种耳机风噪处理方法、装置及存储介质。
根据本公开实施例的第一方面,提供一种耳机风噪处理方法,所述耳机至少包括第一麦克风和第二麦克风,所述方法包括:
获取所述第一麦克风采集的第一音频信号对应的第一频谱数据和所述第二麦克风采集的第二音频信号对应的第二频谱数据;
根据所述第一频谱数据和所述第二频谱数据,确定所述耳机是否存在风噪;
在确定所述耳机存在风噪的情况下,基于目标平滑因子,确定所述第一频谱数据的第一自功率谱密度、所述第二频谱数据的第二自功率谱密度以及所述第一频谱数据和所述第二频谱数据的互功率谱密度;
根据所述第一自功率谱密度、所述第二自功率谱密度和所述互功率谱密度,确定滤波器的滤波参数;
根据确定出的所述滤波参数,对所述耳机接收的信号进行滤波处理,以得到风噪处理结果。
可选地,所述根据所述第一自功率谱密度、所述第二自功率谱密度和所述互功率谱密度,确定滤波器的滤波参数,包括:
根据所述互功率谱密度与目标和值的比值,确定所述滤波器的权系数,得到所述滤波器的滤波参数,所述目标和值为所述第一自功率谱密度和所述第二自功率谱密度之和。
可选地,所述滤波器的滤波参数为所述滤波器的权系数;
所述根据确定出的所述滤波参数,对所述耳机接收的信号进行滤波处理,以得到风噪处理结果,包括:
根据确定出的所述权系数,对所述第二麦克风的所述第二频谱数据进行滤波处理,得到增强信号;
对所述增强信号进行短时傅里叶逆变换处理,得到所述增强信号对应的时域信号,作为所述风噪处理结果。
可选地,所述根据确定出的所述权系数,对所述第二麦克风的所述第二频谱数据进行滤波处理,得到增强信号,包括:
按照以下算式确定增强信号out(k,m):
out(k,m)=hH(k,m)t(k,m)
其中,h(k,m)为由确定出的所述权系数构成的权向量,hH(k,m)为h(k,m)的复共轭转置,t(k,m)为所述第二频谱数据,k为频谱数据的频点索引,m为音频信号的帧数索引。
可选地,所述目标平滑因子通过以下方式确定:
在确定所述耳机存在风噪的情况下,确定所述耳机是否处于纯风噪场景;
若确定所述耳机处于所述纯风噪场景,将第一平滑因子确定为所述目标平滑因子;
若确定所述耳机未处于所述纯风噪场景,将第二平滑因子确定为所述目标平滑因子;
其中,所述第一平滑因子大于所述第二平滑因子。
可选地,所述根据所述第一频谱数据和所述第二频谱数据,确定所述耳机是否存在风噪,包括:
确定所述第一频谱数据和所述第二频谱数据的互功率谱密度;
根据所述互功率谱密度、所述第一频谱数据和所述第二频谱数据,确定所述互功率谱密度对应的相位信息;
根据所述相位信息、已存储的风噪信号的频率上限值和频率下限值,确定相位方差;
根据所述相位方差,确定所述耳机是否存在风噪,其中,若所述相位方差超过第一预设阈值,则确定所述耳机存在风噪,若所述相位方差未超过所述第一预设阈值,则确定所述耳机不存在风噪。
可选地,所述第一频谱数据和所述第二频谱数据均包括以目标音频帧为起始帧的至少一个音频帧的数据;
所述方法还包括:
在确定所述耳机存在风噪的情况下,获取在所述目标音频帧之前预设数量的音频帧各自对应的相位方差;
若所述预设数量的相位方差均超过第二预设阈值,确定所述耳机处于所述纯风噪场景;
若所述预设数量的相位方差并未全部超过所述第二预设阈值,确定所述耳机未处于所述纯风噪场景。
根据本公开实施例的第二方面,提供一种耳机风噪处理装置,所述耳机至少包括第一麦克风和第二麦克风,所述装置包括:
第一获取模块,被配置为获取所述第一麦克风采集的第一音频信号对应的第一频谱数据和所述第二麦克风采集的第二音频信号对应的第二频谱数据;
第一确定模块,被配置为根据所述第一频谱数据和所述第二频谱数据,确定所述耳机是否存在风噪;
第二确定模块,被配置为在确定所述耳机存在风噪的情况下,基于目标平滑因子,确定所述第一频谱数据的第一自功率谱密度、所述第二频谱数据的第二自功率谱密度以及所述第一频谱数据和所述第二频谱数据的互功率谱密度;
第三确定模块,被配置为根据所述第一自功率谱密度、所述第二自功率谱密度和所述互功率谱密度,确定滤波器的滤波参数;
处理模块,被配置为根据确定出的所述滤波参数,对所述耳机接收的信号进行滤波处理,以得到风噪处理结果。
根据本公开实施例的第三方面,提供一种耳机风噪处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为运行所述存储器中的指令以实现本公开第一方面所述方法的步骤。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的耳机风噪处理方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
获取耳机上第一麦克风采集的第一音频信号对应的第一频谱数据和第二麦克风采集的第二音频信号对应的第二频谱数据,确定耳机是否存在风噪,并在确定耳机存在风噪的情况下,基于目标平滑因子,确定第一频谱数据的第一自功率谱密度、第二频谱数据的第二自功率谱密度以及第一频谱数据和第二频谱数据的互功率谱密度,并基于此确定滤波器的滤波参数,进而,根据确定出的滤波参数,对耳机接收的信号进行滤波处理,以得到风噪处理结果。由此,在确定耳机存在风噪的情况下,基于耳机双麦克风各自对应的频谱数据的互功率谱密度确定滤波器的滤波参数,并用于抑制风噪,基于这一方式,能够提供更强的风噪抑制能力,且风噪处理过程中无需进行大量复杂的计算,处理效率较高,对于是否存在风噪的判断结果的准确性的依赖较低,从而,在整体上提升了风噪抑制的效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的耳机风噪处理方法的流程图。
图2是根据一示例性实施例示出的耳机风噪处理装置的框图。
图3是根据一示例性实施例示出的耳机风噪处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
图1是根据一示例性实施例示出的耳机风噪处理方法的流程图。该方法可以应用于耳机,该耳机至少包括第一麦克风和第二麦克风。示例地,该耳机可以为具有多个麦克风的耳机,通过这些麦克风,可以采集耳机所处环境的音频信号。如上,该耳机至少包括第一麦克风和麦克风,其中,第一麦克风可以为前馈麦克风,第二麦克风可以为通话麦克风。
如图1所示,本公开提供的方法可以包括以下步骤11-步骤15。
在步骤11中,获取第一麦克风采集的第一音频信号对应的第一频谱数据和第二麦克风采集的第二音频信号对应的第二频谱数据。
通常情况下,音频信号在10-40ms之间近似满足短时平稳特性,可以使用其二阶统计量等信息,因此,可以对麦克风接收到的音频信号进行STFT(short-time Fouriertransform或short-term Fourier transform,短时傅里叶变换),即分帧加窗和FFT(fastFourier transform,快速傅里叶变换)。示例地,假设第一麦克风采集到的第一音频信号为f(n),第二麦克风采集到的第二音频信号为t(n),可以选取每一帧为32ms,相应地,帧长L为512,窗函数w(n)可以选用汉宁窗,其长度与帧长相同,帧移inc为帧长L的一半,即inc为256,则可以得到分帧加窗后两通道信号sf(n,m)、st(n,m)分别为:
sf(n,m)=f((m-1)*inc+n)*w(n)
st(n,m)=t((m-1)*inc+n)*w(n)
其中,m表示音频信号的帧数索引,n表示第m帧音频信号的数据点索引,且0≤n≤L-1。
此后,再分别对sf(n,m)、st(n,m)进行快速傅里叶变换,即可得到与第一麦克风对应的第一频谱数据F(k,m),以及,与第二麦克风对应的第二频谱数据T(k,m)。其中,k表示频点的索引。
上述内容仅为便于理解而提供的基于音频信号获得频谱数据的一种可能的实现方式,对于其他的方式本公开不进行限定。
在步骤12中,根据第一频谱数据和第二频谱数据,确定耳机是否存在风噪。
在一种可能的实施方式中,步骤12可以包括以下步骤:
确定第一频谱数据和第二频谱数据的互功率谱密度;
根据互功率谱密度、第一频谱数据和第二频谱数据,确定互功率谱密度对应的相位信息;
根据相位信息、已存储的风噪信号的频率上限值和频率下限值,确定相位方差;
根据相位方差,确定耳机是否存在风噪。
基于信号知识可知,第一频谱数据F(k,m)和第二频谱数据T(k,m)的互功率谱密度为φft(k,m)=F(k,m)T*(k,m),其中,可以采用自回归时间平滑的方式,按照下述算式确定第一频谱数据F(k,m)和第二频谱数据T(k,m)的互功率谱密度φft(k,m):
φft(k,m)=αφft(k,m-1)+(1-α)F(k,m)T*(k,m)
其中,α为目标平滑因子,T*(k,m)表示T(k,m)的复共轭。并且,α<1,可以根据实际的场景或需求进行设置。
在确定互功率谱密度后,可以根据互功率谱密度、第一频谱数据和第二频谱数据,确定互功率谱密度对应的相位信息。根据相位运算的等价关系可知,互功率谱的相位应等于第一频谱数据F(k,m)和第二频谱数据T(k,m)的相位之差,也就是说,按照如下算式确定互功率谱信息对应的相位
Figure BDA0003944970140000081
Figure BDA0003944970140000082
其中,∠为求相位符号。
由于第一麦克风、第二麦克风的接收信号中,语音内容具有相关性,且风噪成分不具备相关性,因此,假定纯风噪场景中互功率谱的相位近似均匀分布,则可以按照下述算式计算归一化的相位方差
Figure BDA0003944970140000083
Figure BDA0003944970140000084
其中,k1为风噪信号的频率下限值,k2为风噪信号的频率上限值。示例地,k1可以取1,k2可以取128。
进而,在确定上述相位方差后,即可确定耳机是否存在风噪。相位方差能够反映风噪信号在整体信号中所占的百分比,因此,若相位方差超过第一预设阈值,则可以确定耳机存在风噪,若相位方差未超过第一预设阈值,则可以确定耳机不存在风噪。
此外,还可以通过如频率质心、两通道差和比等方式确定耳机是否存在风噪,本公开不再详述。
在步骤13中,在确定耳机存在风噪的情况下,基于目标平滑因子,确定第一频谱数据的第一自功率谱密度、第二频谱数据的第二自功率谱密度以及第一频谱数据和第二频谱数据的互功率谱密度。
基于信号知识可知,第一频谱数据F(k,m)的自功率谱密度为φff(k,m)=F(k,m)F*(k,m),第二频谱数据T(k,m)的自功率谱密度为φtt(k,m)=T(k,m)T*(k,m)。其中,可以采用自回归时间平滑的方式,按照下述算式确定第一频谱数据F(k,m)的第一自功率谱密度φff(k,m)、以及第二频谱数据T(k,m)的第二自功率谱密度φtt(k,m):
φff(k,m)=αφff(k,m-1)+(1-α)F(k,m)F*(k,m)
φtt(k,m)=αφtt(k,m-1)+(1-α)T(k,m)T*(k,m)
以及,第一频谱数据F(k,m)和第二频谱数据T(k,m)的互功率谱密度φft(k,m)可以参考上文,此处不再赘述其计算方式。
上述算式中各参数含义均已在前文中给出,此处不再重复叙述。
在步骤14中,根据第一自功率谱密度、第二自功率谱密度和互功率谱密度,确定滤波器的滤波参数。
在一种可能的实施方式中,步骤14可以包括以下步骤:
根据互功率谱密度与目标和值的比值,确定滤波器的权系数,得到滤波器的滤波参数。
其中,目标和值为第一自功率谱密度和第二自功率谱密度之和。
示例地,通常情况下,麦克风接收的信号中语音和风噪是互不相干的,从而,基于自适应滤波中的多通道维纳滤波方法,可以按照如下算式确定滤波器的权系数H(k,m):
Figure BDA0003944970140000091
在计算出权系数后,可以利用该权系数组成权向量。
在步骤15中,根据确定出的滤波参数,对耳机接收的信号进行滤波处理,以得到风噪处理结果。
在一种可能的实施方式中,步骤15可以包括以下步骤:
根据确定出的权系数,对第二麦克风的第二频谱数据进行滤波处理,得到增强信号;
对增强信号进行短时傅里叶逆变换处理,得到增强信号对应的时域信号,作为风噪处理结果。
示例地,可以按照以下算式确定增强信号out(k,m):
out(k,m)=hH(k,m)t(k,m)
其中,h(k,m)为由确定出的权系数构成的权向量,hH(k,m)为h(k,m)的复共轭转置,t(k,m)为第二频谱数据,k为频谱数据的频点索引,m为音频信号的帧数索引。
此外,由上文所述,目标平滑因子可以根据实际需求、实际场景进行设置。目标平滑因子的取值应当与风噪、语音信号的存在情况有关,在只存在风噪时,目标平滑因子趋近于1能够达到较的降噪效果,若语音信号存在,则目标平滑因子应适当降低才能保证降噪后语音信号不受影响。
在一种可能的实施方式中,可以为目标平滑因子设置默认值,该默认值可以通过多次测试得到,且无论语音信号、风噪是否存在,该默认值均能够在较好的降噪效果和语音信号不受损之间取得较好的平衡。示例地,默认值可以设置为0.8。
在另一种可能的实施方式中,目标平滑因子可以通过以下方式确定:
在确定耳机存在风噪的情况下,确定耳机是否处于纯风噪场景;
若确定耳机处于纯风噪场景,将第一平滑因子确定为目标平滑因子;
若确定耳机未处于纯风噪场景,将第二平滑因子确定为目标平滑因子。
其中,第一平滑因子大于第二平滑因子。
在一种可能的实施方式中,第一频谱数据和第二频谱数据均包括以目标音频帧为起始帧的至少一个音频帧的数据,相应地,可以通过以下方式确定耳机是否处于纯风噪场景:
在确定耳机存在风噪的情况下,获取在目标音频帧之前预设数量的音频帧各自对应的相位方差;
若预设数量的相位方差均超过第二预设阈值,确定耳机处于纯风噪场景;
若预设数量的相位方差并未全部超过第二预设阈值,确定耳机未处于纯风噪场景。
其中,第二预设阈值可以与第一预设阈值设置为相同的值,也可以设置为不同的值。
在确定耳机处于纯风噪场景时,无需考虑是否会损伤到语音信号,因此,可以选用较大的第一平滑因子,以达到更好的降噪效果。而在确定耳机并未处于纯风噪场景时,由于需要避免对原本的语音信号产生损伤,需要选用稍小一些的第二平滑因子,以兼顾降噪效果和语音信号的完整性。
示例地,第一平滑因子可以为0.98,第二平滑因子可以为0.8。.
这样,通过选用合适的目标平滑因子,即便将无需进行风噪抑制的信号识别为需要抑制风噪,风噪处理结果中的语音内容也能够最大限度地保持完整性,不会因风噪抑制处理操作而受损,从而,可以有效减少对于风噪存在与否的检测结果的准确性的依赖,提升风噪抑制的效果。
通过上述技术方案,获取耳机上第一麦克风采集的第一音频信号对应的第一频谱数据和第二麦克风采集的第二音频信号对应的第二频谱数据,确定耳机是否存在风噪,并在确定耳机存在风噪的情况下,基于目标平滑因子,确定第一频谱数据的第一自功率谱密度、第二频谱数据的第二自功率谱密度以及第一频谱数据和第二频谱数据的互功率谱密度,并基于此确定滤波器的滤波参数,进而,根据确定出的滤波参数,对耳机接收的信号进行滤波处理,以得到风噪处理结果。由此,在确定耳机存在风噪的情况下,基于耳机双麦克风各自对应的频谱数据的互功率谱密度确定滤波器的滤波参数,并用于抑制风噪,基于这一方式,能够提供更强的风噪抑制能力,且风噪处理过程中无需进行大量复杂的计算,处理效率较高,对于是否存在风噪的判断结果的准确性的依赖较低,从而,在整体上提升了风噪抑制的效果。
图2是根据一示例性实施例示出的耳机风噪处理装置的框图。所述耳机至少包括第一麦克风和第二麦克风,参照图2,所述装置20包括:
第一获取模块21,被配置为获取所述第一麦克风采集的第一音频信号对应的第一频谱数据和所述第二麦克风采集的第二音频信号对应的第二频谱数据;
第一确定模块22,被配置为根据所述第一频谱数据和所述第二频谱数据,确定所述耳机是否存在风噪;
第二确定模块23,被配置为在确定所述耳机存在风噪的情况下,基于目标平滑因子,确定所述第一频谱数据的第一自功率谱密度、所述第二频谱数据的第二自功率谱密度以及所述第一频谱数据和所述第二频谱数据的互功率谱密度;
第三确定模块24,被配置为根据所述第一自功率谱密度、所述第二自功率谱密度和所述互功率谱密度,确定滤波器的滤波参数;
处理模块25,被配置为根据确定出的所述滤波参数,对所述耳机接收的信号进行滤波处理,以得到风噪处理结果。
可选地,所述第三确定模块24,包括:
第一确定子模块,被配置为根据所述互功率谱密度与目标和值的比值,确定所述滤波器的权系数,得到所述滤波器的滤波参数,所述目标和值为所述第一自功率谱密度和所述第二自功率谱密度之和。
可选地,所述滤波器的滤波参数为所述滤波器的权系数;
所述处理模块25,包括:
第一处理子模块,被配置为根据确定出的所述权系数,对所述第二麦克风的所述第二频谱数据进行滤波处理,得到增强信号;
第二处理子模块,被配置为对所述增强信号进行短时傅里叶逆变换处理,得到所述增强信号对应的时域信号,作为所述风噪处理结果。
可选地,所述第一处理子模块被配置为按照以下算式确定增强信号out(k,m):
out(k,m)=hH(k,m)t(k,m)
其中,h(k,m)为由确定出的所述权系数构成的权向量,hH(k,m)为h(k,m)的复共轭转置,t(k,m)为所述第二频谱数据,k为频谱数据的频点索引,m为音频信号的帧数索引。
可选地,所述目标平滑因子通过以下模块确定:
第四确定模块,被配置为在确定所述耳机存在风噪的情况下,确定所述耳机是否处于纯风噪场景;
第五确定模块,被配置为若确定所述耳机处于所述纯风噪场景,将第一平滑因子确定为所述目标平滑因子;
第六确定模块,被配置为若确定所述耳机未处于所述纯风噪场景,将第二平滑因子确定为所述目标平滑因子;
其中,所述第一平滑因子大于所述第二平滑因子。
可选地,所述第一确定模块22,包括:
第二确定子模块,被配置为确定所述第一频谱数据和所述第二频谱数据的互功率谱密度;
第三确定子模块,被配置为根据所述互功率谱密度、所述第一频谱数据和所述第二频谱数据,确定所述互功率谱密度对应的相位信息;
第四确定子模块,被配置为根据所述相位信息、已存储的风噪信号的频率上限值和频率下限值,确定相位方差;
第五确定子模块,被配置为根据所述相位方差,确定所述耳机是否存在风噪,其中,若所述相位方差超过第一预设阈值,则确定所述耳机存在风噪,若所述相位方差未超过所述第一预设阈值,则确定所述耳机不存在风噪。
可选地,所述第一频谱数据和所述第二频谱数据均包括以目标音频帧为起始帧的至少一个音频帧的数据;
所述装置20还包括:
第二获取模块,被配置为在确定所述耳机存在风噪的情况下,获取在所述目标音频帧之前预设数量的音频帧各自对应的相位方差;
第七确定模块,被配置为若所述预设数量的相位方差均超过第二预设阈值,确定所述耳机处于所述纯风噪场景;
第八确定模块,被配置为若所述预设数量的相位方差并未全部超过所述第二预设阈值,确定所述耳机未处于所述纯风噪场景。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的耳机风噪处理方法的步骤。
图3是根据一示例性实施例示出的耳机风噪处理装置800的框图。例如,装置800可以是耳机。参照图3,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
输入/输出接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述耳机风噪处理方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述耳机风噪处理方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的耳机风噪处理方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种耳机风噪处理方法,其特征在于,所述耳机至少包括第一麦克风和第二麦克风,所述方法包括:
获取所述第一麦克风采集的第一音频信号对应的第一频谱数据和所述第二麦克风采集的第二音频信号对应的第二频谱数据;
根据所述第一频谱数据和所述第二频谱数据,确定所述耳机是否存在风噪;
在确定所述耳机存在风噪的情况下,基于目标平滑因子,确定所述第一频谱数据的第一自功率谱密度、所述第二频谱数据的第二自功率谱密度以及所述第一频谱数据和所述第二频谱数据的互功率谱密度;
根据所述第一自功率谱密度、所述第二自功率谱密度和所述互功率谱密度,确定滤波器的滤波参数;
根据确定出的所述滤波参数,对所述耳机接收的信号进行滤波处理,以得到风噪处理结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一自功率谱密度、所述第二自功率谱密度和所述互功率谱密度,确定滤波器的滤波参数,包括:
根据所述互功率谱密度与目标和值的比值,确定所述滤波器的权系数,得到所述滤波器的滤波参数,所述目标和值为所述第一自功率谱密度和所述第二自功率谱密度之和。
3.根据权利要求1所述的方法,其特征在于,所述滤波器的滤波参数为所述滤波器的权系数;
所述根据确定出的所述滤波参数,对所述耳机接收的信号进行滤波处理,以得到风噪处理结果,包括:
根据确定出的所述权系数,对所述第二麦克风的所述第二频谱数据进行滤波处理,得到增强信号;
对所述增强信号进行短时傅里叶逆变换处理,得到所述增强信号对应的时域信号,作为所述风噪处理结果。
4.根据权利要求3所述的方法,其特征在于,所述根据确定出的所述权系数,对所述第二麦克风的所述第二频谱数据进行滤波处理,得到增强信号,包括:
按照以下算式确定增强信号out(k,m):
out(k,m)=hH(k,m)t(k,m)
其中,h(k,m)为由确定出的所述权系数构成的权向量,hH(k,m)为h(k,m)的复共轭转置,t(k,m)为所述第二频谱数据,k为频谱数据的频点索引,m为音频信号的帧数索引。
5.根据权利要求1所述的方法,其特征在于,所述目标平滑因子通过以下方式确定:
在确定所述耳机存在风噪的情况下,确定所述耳机是否处于纯风噪场景;
若确定所述耳机处于所述纯风噪场景,将第一平滑因子确定为所述目标平滑因子;
若确定所述耳机未处于所述纯风噪场景,将第二平滑因子确定为所述目标平滑因子;
其中,所述第一平滑因子大于所述第二平滑因子。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一频谱数据和所述第二频谱数据,确定所述耳机是否存在风噪,包括:
确定所述第一频谱数据和所述第二频谱数据的互功率谱密度;
根据所述互功率谱密度、所述第一频谱数据和所述第二频谱数据,确定所述互功率谱密度对应的相位信息;
根据所述相位信息、已存储的风噪信号的频率上限值和频率下限值,确定相位方差;
根据所述相位方差,确定所述耳机是否存在风噪,其中,若所述相位方差超过第一预设阈值,则确定所述耳机存在风噪,若所述相位方差未超过所述第一预设阈值,则确定所述耳机不存在风噪。
7.根据权利要求6所述的方法,其特征在于,所述第一频谱数据和所述第二频谱数据均包括以目标音频帧为起始帧的至少一个音频帧的数据;
所述方法还包括:
在确定所述耳机存在风噪的情况下,获取在所述目标音频帧之前预设数量的音频帧各自对应的相位方差;
若所述预设数量的相位方差均超过第二预设阈值,确定所述耳机处于所述纯风噪场景;
若所述预设数量的相位方差并未全部超过所述第二预设阈值,确定所述耳机未处于所述纯风噪场景。
8.一种耳机风噪处理装置,其特征在于,所述耳机至少包括第一麦克风和第二麦克风,所述装置包括:
第一获取模块,被配置为获取所述第一麦克风采集的第一音频信号对应的第一频谱数据和所述第二麦克风采集的第二音频信号对应的第二频谱数据;
第一确定模块,被配置为根据所述第一频谱数据和所述第二频谱数据,确定所述耳机是否存在风噪;
第二确定模块,被配置为在确定所述耳机存在风噪的情况下,基于目标平滑因子,确定所述第一频谱数据的第一自功率谱密度、所述第二频谱数据的第二自功率谱密度以及所述第一频谱数据和所述第二频谱数据的互功率谱密度;
第三确定模块,被配置为根据所述第一自功率谱密度、所述第二自功率谱密度和所述互功率谱密度,确定滤波器的滤波参数;
处理模块,被配置为根据确定出的所述滤波参数,对所述耳机接收的信号进行滤波处理,以得到风噪处理结果。
9.一种耳机风噪处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为运行所述存储器中的指令以实现权利要求1-7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
CN202211430488.2A 2022-11-15 2022-11-15 耳机风噪处理方法、装置及存储介质 Pending CN115767346A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211430488.2A CN115767346A (zh) 2022-11-15 2022-11-15 耳机风噪处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211430488.2A CN115767346A (zh) 2022-11-15 2022-11-15 耳机风噪处理方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN115767346A true CN115767346A (zh) 2023-03-07

Family

ID=85371824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211430488.2A Pending CN115767346A (zh) 2022-11-15 2022-11-15 耳机风噪处理方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115767346A (zh)

Similar Documents

Publication Publication Date Title
EP3839951A1 (en) Method and device for processing audio signal, terminal and storage medium
CN111128221B (zh) 一种音频信号处理方法、装置、终端及存储介质
CN109361828B (zh) 一种回声消除方法、装置、电子设备及存储介质
CN111968662A (zh) 音频信号的处理方法及装置、存储介质
CN111179960B (zh) 音频信号处理方法及装置、存储介质
CN111429933B (zh) 音频信号的处理方法及装置、存储介质
KR102497549B1 (ko) 오디오 신호 처리 방법 및 장치, 저장 매체
CN108845787B (zh) 音频调节的方法、装置、终端及存储介质
CN112037825B (zh) 音频信号的处理方法及装置、存储介质
CN111009257A (zh) 一种音频信号处理方法、装置、终端及存储介质
CN111883164A (zh) 模型训练方法、装置、电子设备及存储介质
CN114040285A (zh) 耳机的前馈滤波器参数生成方法、设备、耳机及存储介质
CN110931028A (zh) 一种语音处理方法、装置和电子设备
CN111292761B (zh) 语音增强方法及装置
CN112201267A (zh) 一种音频处理方法、装置、电子设备及存储介质
CN111724801A (zh) 音频信号处理方法及装置、存储介质
CN105244037B (zh) 语音信号处理方法及装置
CN114040309B (zh) 风噪检测方法、装置、电子设备及存储介质
CN115884030A (zh) 降噪方法、装置、耳机设备、存储介质及芯片
CN115767346A (zh) 耳机风噪处理方法、装置及存储介质
CN110580910A (zh) 一种音频处理方法、装置、设备及可读存储介质
CN113489854B (zh) 声音处理方法、装置、电子设备和存储介质
CN111667842B (zh) 音频信号处理方法及装置
CN115914517A (zh) 一种声音信号处理方法及电子设备
CN107958457B (zh) 评估图像质量的方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination