CN117854537A - 音频降噪方法、装置、电子设备及存储介质 - Google Patents

音频降噪方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117854537A
CN117854537A CN202311816253.1A CN202311816253A CN117854537A CN 117854537 A CN117854537 A CN 117854537A CN 202311816253 A CN202311816253 A CN 202311816253A CN 117854537 A CN117854537 A CN 117854537A
Authority
CN
China
Prior art keywords
audio
noise
volume
frequency band
personalized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311816253.1A
Other languages
English (en)
Inventor
黄润乾
彭子娇
陈东鹏
张伟彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Voiceai Technologies Co ltd
Original Assignee
Voiceai Technologies Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Voiceai Technologies Co ltd filed Critical Voiceai Technologies Co ltd
Priority to CN202311816253.1A priority Critical patent/CN117854537A/zh
Publication of CN117854537A publication Critical patent/CN117854537A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了一种音频降噪方法、装置、电子设备及存储介质,涉及音频处理技术领域。该方法包括:获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;获取音频噪声在所述预设频带下的噪声音量;基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;基于所述个性化减益因子确定降噪后的目标频谱;基于所述目标频谱获取目标音频。本方法实现了根据用户对声音的敏感程度对音频进行适配性的降噪,使得降噪程度与用户对声音的可接受频率尽可能匹配,提升了音频降噪的效果以及用户的个性化使用体验。

Description

音频降噪方法、装置、电子设备及存储介质
技术领域
本申请涉及音频处理技术领域,更具体地,涉及一种音频降噪方法、装置、电子设备及存储介质。
背景技术
随着音频降噪技术的发展,越来越多的音频输出设备配置有降噪功能。然而,不同用户对同一音频的听音感受可能会存在差异,因而,目前的音频降噪方式不能满足用户的个性化需求,影响用户体验。
发明内容
本申请提出了一种音频降噪方法、装置、电子设备及存储介质,以改善上述问题。
第一方面,本申请实施例提供了一种音频降噪方法,所述方法包括:获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;获取音频噪声在所述预设频带下的噪声音量;基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;基于所述个性化减益因子确定降噪后的目标频谱;基于所述目标频谱获取目标音频。
第二方面,本申请实施例提供了一种音频降噪装置,所述装置包括:敏感音量获取模块,用于获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;噪声音量获取模块,用于获取音频噪声在所述预设频带下的噪声音量;降噪参数获取模块,用于基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;降噪模块,用于基于所述个性化减益因子确定降噪后的目标频谱;目标音频获取模块,用于基于所述目标频谱获取目标音频。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述第一方面提供的音频降噪方法。
第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面提供的音频降噪方法。
本申请提供的一种音频降噪方法、装置、电子设备及存储介质,通过获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;获取音频噪声在所述预设频带下的噪声音量;基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;基于所述个性化减益因子确定降噪后的目标频谱;基于所述目标频谱获取目标音频。从而通过上述方式实现了可以根据用户对声音的敏感程度对音频进行适配性的降噪,使得降噪程度与用户对声音的可接受频率尽可能匹配,提升了音频降噪的效果以及用户的个性化使用体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一实施例提供的一种音频降噪方法的流程图。
图2示出了本申请另一实施例提供的一种音频降噪方法的流程图。
图3示出了本申请又一实施例提供的一种音频降噪方法的流程图。
图4示出了本申请实施例提供的获取在左右耳播放待处理音频时,待处理音频在预设频带下的敏感音量的效果图。
图5示出了本申请实施例提供的一种音频降噪装置的结构框图。
图6示出了本申请实施例提供的一种电子设备的结构框图。
图7示出了本申请实施例的用于保存或者携带实现根据本申请实施例的音频降噪方法的程序代码的存储单元。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
随着音频降噪技术的发展,越来越多的音频输出设备配置有降噪功能。然而,不同用户对同一音频的听音感受可能会存在差异,因而,目前的音频降噪方式不能满足用户的个性化需求,影响用户体验。
发明人经过长期的研究发现,可以通过获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;获取音频噪声在所述预设频带下的噪声音量;基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;基于所述个性化减益因子确定降噪后的目标频谱;基于所述目标频谱获取目标音频。从而通过上述方式实现了可以根据用户对声音的敏感程度对音频进行适配性的降噪,使得降噪程度与用户对声音的可接受频率尽可能匹配,提升音频降噪的效果以及用户的个性化使用体验。
因此,为了改善上述问题,发明人提出了本申请提供的可以根据用户对声音的敏感程度对音频进行适配性的降噪,提升音频降噪的效果以及用户的个性化使用体验的音频降噪方法、装置、电子设备及存储介质。
下面将结合附图具体描述本申请的各实施例。
请参阅图1,示出了本申请一实施例提供的一种音频降噪方法的流程图,本实施例提供一种音频降噪方法,可应用于电子设备,本申请实施方式中的电子设备可以为音频输出设备或者是可穿戴式音频输出设备等,例如电子设备可以为耳机、VR(Virtual Reality,虚拟现实技术)头盔等类型的设备,具体设备类型可以不作限定。该方法包括:
步骤S110:获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量。
其中,待处理音频可以为不同音频播放场景下的音频,具体的音频播放场景可以不作限定。例如,待处理音频可以为音乐播放场景下的音频(即音乐、或歌曲),也可以为通话场景下的语音。
预设频带可以理解为与待处理音频对应的声音频率范围。预设频带可以包括多个频带(具体数量可以不作限定),待处理音频由频率不同的多个音频(例如高频和低频)构成。作为一种实施方式,可以预先将待处理音频划分为多个声音频率范围,每个声音频率范围表征一个频带,多个声音频率范围构成预设频带。可选的,预设频带与待处理音频对应,不同的待处理音频对应的预设频带可以不同,具体的,不同的待处理音频对应的预设频带包括的频带个数可以不同。例如,音频A与音频B为不同类型的音频,音频A对应的预设频带可以包括6个频带,而音频B对应的预设频带可以包括8个频带。
本实施方式中,敏感音量表征用户能够听见声音的临界音量。作为一种方式,在预设频道的每个频带下,可以将待处理音频刚好能够被用户听见的音量作为待处理音频在该频带下的敏感音量,从而可以获取得到待处理音频在预设频带下的敏感音量。可选的,待处理音频在预设频带下的敏感音量可以是一个敏感音量集合。待处理音频在不同频带下的敏感音量可以相同,也可以不同。
步骤S120:获取音频噪声在所述预设频带下的噪声音量。
在通过音频输出设备播放待处理音频的过程中,音频输出设备可以实时的采集待处理音频的音频噪声。可选的,该音频噪声可以包括环境噪声以及待处理音频的噪声。本实施方式以该音频噪声为环境噪声为例进行说明。
为了便于确认音频噪声对预设频带下的敏感音量的听音影响(或干扰程度),可以获取音频噪声在预设频带下的噪声音量。
具体的,可以获取音频噪声在预设频带的每个频带下的音量。其中,对于任意一个频带,如果音频噪声在该频带下的音量小于待处理音频在该频带下的敏感音量,则可以认为音频噪声不会对用户听清该频带下的待处理音频造成影响,或者说影响可以忽略不计;而如果音频噪声在该频带下的音量大于或者等于待处理音频在该频带下的敏感音量,则认为音频噪声会对用户听清该频带下的待处理音频造成影响,此时需要对待处理音频进行降噪处理。
步骤S130:基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声。
其中,减益因子可以理解为降噪参数,个性化减益因子可以理解为个性化降噪参数,个性化减益因子用于减弱(削弱)待处理音频的音频噪声。
作为一种方式,如果音频噪声在一个频带下的音量大于或者等于待处理音频在该频带下的敏感音量,在对待处理音频进行降噪处理的过程中,可以先获取与用户对声音的可接受频率适配的降噪参数。具体的,可以先基于敏感音量与噪声音量获取个性化减益因子。
作为一种具体的实施方式,可以先基于敏感音量与噪声音量获取频带敏感系数,继而基于频带敏感系数获取个性化减益因子。
其中,频带敏感系数的计算方式可以表示如下:
其中,rn表示频带敏感系数,bn表示音频噪声在预设频带[f1,f2,f3,...,fN]下的噪声音量,afn表示待处理音频在预设频带下的敏感音量,[a1,a2,a3,...,aM]表示提前设置好的音量。bn包括[b1,b2,b3,...,bN],rn包括[r1,r2,r3,...,rN]。
其中,在基于频带敏感系数获取个性化减益因子的过程中,可以获取音频噪声在预设频带下的减益因子(为了便于描述,表示为un),继而将频带敏感系数与减益因子的乘积作为个性化减益因子,个性化减益因子的计算公式表示如下:
vn=rnun
其中,vn表示个性化减益因子,rn表示频带敏感系数,un表示音频噪声在预设频带下的减益因子。un包括[u1,u2,u3,...,uN],vn包括[v1,v2,v3,...,vN]。
作为一种实施方式,可以通过预先训练好的降噪网络获取音频噪声在预设频带下的减益因子,例如,un=F(bn),F表征预先训练好的降噪网络。或者可以基于信号处理的降噪算法获取音频噪声在预设频带下的减益因子。音频噪声在预设频带下的减益因子的获取过程在此不再赘述。
步骤S140:基于所述个性化减益因子确定降噪后的目标频谱。
在获取到个性化减益因子的情况下,可以基于个性化减益因子对待处理音频进行降噪处理,以实现基于个性化减益因子确定降噪后的目标频谱,目标频谱即对待处理音频进行降噪处理后得到的音频频谱。
为了便于计算,可以在基于个性化减益因子对待处理音频进行降噪处理之前,先获取与音频噪声对应的噪声频谱,即将音频噪声转换为噪声频谱,例如可以将音频噪声通过快速傅里叶变换得到噪声频谱(假设表示为M),M=FFT(noise),其中,FFT表示傅里叶变换,noise表示音频噪声。
由于音频噪声的来源比较广,因而噪声的维度通常是比较宽泛的,为了提升降噪处理的有效性,可以将个性化减益因子拓展到噪声频谱的维度,得到参考减益因子,参考减益因子的获取方式可以表示如下:
W=[w1,w2,...,wD]=guide([v1,v2,...,vN])
其中,W表示参考减益因子,guide为曲线拟合方法,可以是最小二乘法、最大似然法、核方法等。
进一步的,可以将噪声频谱与参考减益因子的乘积作为降噪后的目标频谱,具体计算公式表示如下:
Md=M·W
其中,Md表示降噪后的目标频谱,M表示噪声频谱,W表示参考减益因子。
步骤S150:基于所述目标频谱获取目标音频。
作为一种实施方式,可以对目标频谱进行反向傅里叶变换,得到目标音频。具体的,目标音频的获取方式可以表示如下:
noisenew=IFFT(Md)
其中,noisenew表示目标音频,IFFT表示反向傅里叶变换,Md表示降噪后的目标频谱。
需要说明的是,目标音频可以不包括噪声,即目标音频的噪声为零;目标音频也可以包括轻微噪声(在完全去掉噪声会让用户产生不适感的情况下,轻微噪声的具体大小以不影响用户正常使用为宜,具体可以不作限定)。
本实施例提供的音频降噪方法,通过获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;获取音频噪声在所述预设频带下的噪声音量;基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;基于所述个性化减益因子确定降噪后的目标频谱;基于所述目标频谱获取目标音频。从而通过上述方式实现了可以根据用户对声音的敏感程度对音频进行适配性的降噪,使得降噪程度与用户对声音的可接受频率尽可能匹配,提升了音频降噪的效果以及用户的个性化使用体验。
请参阅图2,示出了本申请另一实施例提供的一种音频降噪方法的流程图,本实施例提供一种音频降噪方法,可应用于电子设备,该方法包括:
步骤S210:在满足预设条件的情况下,开始获取待处理音频的在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量。
其中,预设条件可以包括初次使用音频输出设备或对音频输出设备进行了恢复出厂设置后的首次使用。
作为一种实施方式,若检测到音频输出设备为初次使用,可以判定满足预设条件,则可以触发开始获取待处理音频的在预设频带下的敏感音量。其中,音频输出设备若为初次使用,会与其他设备(例如手机)建立连接,可选的,可以在检测到音频输出设备与其他设备首次建立连接时,判定音频输出设备为初次使用。
同理,若检测到对音频输出设备进行了恢复出厂设置后的首次使用,也可以判定满足预设条件,并触发开始获取待处理音频的在预设频带下的敏感音量。
本实施方式中,音频输出设备可以具备个性化降噪功能,并且,可以为音频输出设备配置与该个性化降噪功能对应的功能按钮(可以是虚拟按钮或者是实体按钮)。在这种方式下,预设条件可以包括该个性化降噪功能对应的功能按钮处于开启状态。
那么,作为一种实施方式,若检测到音频输出设备的个性化降噪功能对应的功能按钮处于开启状态,则以判定满足预设条件,则可以触发开始获取待处理音频的在预设频带下的敏感音量。
步骤S220:获取音频噪声在所述预设频带下的噪声音量。
其中,步骤S220的具体实现可以参考前述实施例中步骤S120的相关描述,在此不再赘述。
步骤S230:基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声。
其中,步骤S230的具体实现可以参考前述实施例中步骤S130的相关描述,在此不再赘述。
步骤S240:基于所述个性化减益因子确定降噪后的目标频谱。
其中,步骤S240的具体实现可以参考前述实施例中步骤S140的相关描述,在此不再赘述。
步骤S250:基于所述目标频谱获取目标音频。
其中,步骤S250的具体实现可以参考前述实施例中步骤S150的相关描述,在此不再赘述。
本实施方式中,在音频噪声同时包括环境噪声以及待处理音频的噪声的情况下,可以分别对环境噪声以及待处理音频的噪声进行去噪,得到两个音频,再将这两个音频进行合成后传输给音频输出设备进行播放。其中,对环境噪声以及待处理音频的噪声分别进行去噪的实现过程可以参考前述实施例的相关描述,在此不再赘述。
例如,在一个具体的应用场景中,假设用户A与用户B正在通话,对于用户A侧的音频输出设备而言,可以对用户A周围的环境噪声进行上述降噪处理,得到第一音频;同时也可以对用户B传过去的音频中的噪声进行上述降噪处理,得到第二音频。然后可以将第一音频与第二音频进行拼接(或合并)后得到的音频作为最终的目标音频,然后用户A侧的音频输出设备对该目标音频进行播放。
本实施例提供的音频降噪方法,通过在满足预设条件的情况下,开始获取待处理音频的在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;获取音频噪声在所述预设频带下的噪声音量;基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;基于所述个性化减益因子确定降噪后的目标频谱;基于所述目标频谱获取目标音频。从而通过上述方式实现了可以根据用户对声音的敏感程度对音频进行适配性的降噪,使得降噪程度与用户对声音的可接受频率尽可能匹配,提升了音频降噪的效果以及用户的个性化使用体验。
通过在满足预设条件的情况下,才开始获取待处理音频的在预设频带下的敏感音量,进而对待处理音频进行降噪处理,可以避免重复检测,可以提升降噪的准确度以及灵敏度。
请参阅图3,示出了本申请又一实施例提供的一种音频降噪方法的流程图,本实施例提供一种音频降噪方法,可应用于电子设备,该方法包括:
步骤S310:将所述待处理音频划分为多个频带。
本实施方式中,在获取待处理音频的在预设频带下的敏感音量之前,需要先将待处理音频划分为多个频带。
作为一种实施方式,可以先确定待处理音频的类型,然后基于该类型将待待处理音频划分为多个声音频率范围,每个声音频率范围表征一个频带,多个声音频率范围构成预设频带。其中,每个声音频率范围的大小可以不同,例如频带A可以为125-250(hz),频带B可以为1千-2千(hz);不同类型的音频划分后得到的频带可以不同,例如,摇滚音乐的频带个数可以比轻音乐的频带个数多。
步骤S320:对于每个频带,递增该频带内的音频播放音量,在递增音频播放音量的过程中,若检测到指定响应操作,将所述指定响应操作的触发时刻对应的音频播放音量作为待处理音频在所述频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量。
作为一种方式,假设对待处理音频提前划分好的频带为[f1,f2,f3,...,fN],提前设置好的音量(即音频输出设备的音频播放音量)为[a1,a2,a3,...,aM],对于每个频带,可以递增该频带内的音频播放音量,在递增音频播放音量的过程中,若检测到指定响应操作,则可以将指定响应操作的触发时刻对应的音频播放音量作为待处理音频在该频带下的敏感音量。
其中,指定响应操作可以包括触控指定按钮、用户点头、用户摇头中的至少一种。可选的,为了避免误操作,指定响应操作可以包括至少两种操作,例如,指定响应操作可以为用户先点头再摇头,或者用户先触控指定按钮再点头。可选的,为了简化用户操作,指定响应操作可以只包括一种操作,例如,指定操作可以为触控指定按钮、用户点头或者用户摇头。需要说明的是,上述所列举的指定相应操作仅作为示例进行说明,实际实现时可以根据实际情况调整或修改指定响应操作,具体可以不作限定。
作为一种具体的实施方式,对于每个频带,可以将该频带内的音频播放音量从低到高依次递增,直到用户听到声音并做出相应操作(例如点击按钮,或者点头等操作)时,停止音量增加,并将触发该相应操作的时刻对应的音频播放音量作为待处理音频在该频带下的敏感音量。此时,可以记录频带fn的敏感音量为afn
步骤S330:获取音频噪声在所述预设频带下的噪声音量。
其中,步骤S330的具体实现可以参考前述实施例中步骤S120的相关描述,在此不再赘述。
步骤S340:基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声。
其中,步骤S340的具体实现可以参考前述实施例中步骤S130的相关描述,在此不再赘述。
步骤S350:基于所述个性化减益因子确定降噪后的目标频谱。
其中,步骤S350的具体实现可以参考前述实施例中步骤S140的相关描述,在此不再赘述。
步骤S360:基于所述目标频谱获取目标音频。
其中,步骤S360的具体实现可以参考前述实施例中步骤S150的相关描述,在此不再赘述。
在一个具体的应用场景中,以音频输出设备为耳机(默认为双耳机)为例,耳机包括左耳机与右耳机,分别对应输出左声道的音频以及右声道的音频。由于用户的左耳与右耳的听力水平通常会不同,那么左耳与右耳对同一频带的可接受频率也会存在差异。为了更好的根据用户对声音的可接受频率对待处理音频进行适配性的降噪,可以分别获取在左右耳播放待处理音频时,待处理音频在预设频带下的敏感音量,具体获取过程均可以参考前述相关描述,在此不再赘述。
请参阅图4,示出了本申请实施例提供的获取在左右耳播放待处理音频时,待处理音频在预设频带下的敏感音量的效果图(横坐标表示预设频带下的频率,纵坐标表示音频输出设备的音频播放音量)。如图4所示,可以看出,对于同一频带的待处理音频而言,左耳对应的敏感音量与右耳对应的敏感音量可以相同,例如,在频率为500Hz的时候,左耳对应的敏感音量为20dBHL,右耳对应的敏感音量也为20dBHL。可选的,对于同一频带的待处理音频而言,左耳对应的敏感音量与右耳对应的敏感音量也可以不相同,例如,在频率为2KHz的时候,左耳对应的敏感音量仍为20dBHL,而右耳对应的敏感音量为30dBHL。
通过将左右耳各自的敏感频带曲线以可视化的方式展示出来,可以便于用户查看,提升敏感音量获取的准确性,进而提升音频降噪的准确性。
本实施例提供的音频降噪方法,通过将所述待处理音频划分为多个频带;对于每个频带,递增该频带内的音频播放音量,在递增音频播放音量的过程中,若检测到指定响应操作,将所述指定响应操作的触发时刻对应的音频播放音量作为待处理音频在所述频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;获取音频噪声在所述预设频带下的噪声音量;基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;基于所述个性化减益因子确定降噪后的目标频谱;基于所述目标频谱获取目标音频。从而通过上述方式实现了可以根据用户对声音的敏感程度对音频进行适配性的降噪,使得降噪程度与用户对声音的可接受频率尽可能匹配,提升了音频降噪的效果以及用户的个性化使用体验。
同时,通过在递增音频播放音量的过程中,若检测到指定响应操作,才将指定响应操作的触发时刻对应的音频播放音量作为待处理音频在所述频带下的敏感音量,以及将左右耳各自的敏感频带曲线以可视化的方式展示出来,可以便于用户查看,提升敏感音量获取的准确性,进而提升音频降噪的准确性。
请参阅图5,为本申请实施例提供的一种音频降噪装置的结构框图,本实施例提供一种音频降噪装置400,可以运行于电子设备,所述装置400包括:敏感音量获取模块410、噪声音量获取模块420、降噪参数获取模块430、降噪模块440以及目标音频获取模块450:
敏感音量获取模块410,用于获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量。
作为一种实施方式,敏感音量获取模块410可以用于在满足预设条件的情况下,开始获取待处理音频的在预设频带下的敏感音量。
作为另一种实施方式,敏感音量获取模块410可以用于(预先)将所述待处理音频划分为多个频带;对于每个频带,递增该频带内的音频播放音量,在递增音频播放音量的过程中,若检测到指定响应操作,将所述指定响应操作的触发时刻对应的音频播放音量作为待处理音频在所述频带下的敏感音量。
噪声音量获取模块420,用于获取音频噪声在所述预设频带下的噪声音量。
降噪参数获取模块430,用于基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声。
作为一种实施方式,降噪参数获取模块430可以用于基于所述敏感音量与所述噪声音量获取频带敏感系数;基于所述频带敏感系数获取个性化减益因子。
其中,所述基于所述频带敏感系数获取个性化减益因子,可以包括:获取所述音频噪声在所述预设频带下的减益因子;将所述频带敏感系数与所述减益因子的乘积作为个性化减益因子。
降噪模块440,用于基于所述个性化减益因子确定降噪后的目标频谱。
可选的,装置400还可以包括噪声频谱获取模块,用于在基于所述个性化减益因子确定降噪后的目标频谱之前,获取与所述音频噪声对应的噪声频谱。在这种方式下,降噪模块440可以用于将所述个性化减益因子拓展到所述噪声频谱的维度,得到参考减益因子;将所述噪声频谱与所述参考减益因子的乘积作为降噪后的目标频谱。
目标音频获取模块450,用于基于所述目标频谱获取目标音频。
作为一种实现方式,目标音频获取模块450可以用于对所述目标频谱进行反向傅里叶变换,得到目标音频。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请参阅图6,基于上述的音频降噪方法及装置,本申请实施例还提供了一种可以执行前述音频降噪方法的电子设备100。电子设备100包括存储器102以及相互耦合的一个或多个(图中仅示出一个)处理器104,存储器102以及处理器104之间通信线路连接。存储器102中存储有可以执行前述实施例中内容的程序,而处理器104可以执行存储器102中存储的程序。
其中,处理器104可以包括一个或者多个处理核。处理器104利用各种接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存储器102内的指令、程序、代码集或指令集,以及调用存储在存储器102内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器104可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器104可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器104中,单独通过一块通信芯片进行实现。
存储器102可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器102可用于存储指令、程序、代码、代码集或指令集。存储器102可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现前述各个实施例的指令等。存储数据区还可以存储电子设备100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
请参考图7,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质500中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质500可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质500包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质500具有执行上述方法中的任何方法步骤的程序代码510的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码510可以例如以适当形式进行压缩。
综上所述,本申请实施例提供的一种音频降噪方法、装置、电子设备及存储介质,通过获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;获取音频噪声在所述预设频带下的噪声音量;基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;基于所述个性化减益因子确定降噪后的目标频谱;基于所述目标频谱获取目标音频。从而通过上述方式实现了可以根据用户对声音的敏感程度对音频进行适配性的降噪,使得降噪程度与用户对声音的可接受频率尽可能匹配,提升了音频降噪的效果以及用户的个性化使用体验。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种音频降噪方法,其特征在于,所述方法包括:
获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;
获取音频噪声在所述预设频带下的噪声音量;
基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;
基于所述个性化减益因子确定降噪后的目标频谱;
基于所述目标频谱获取目标音频。
2.根据权利要求1所述的方法,其特征在于,所述基于所述敏感音量与所述噪声音量获取个性化减益因子,包括:
基于所述敏感音量与所述噪声音量获取频带敏感系数;
基于所述频带敏感系数获取个性化减益因子。
3.根据权利要求2所述的方法,其特征在于,所述基于所述频带敏感系数获取个性化减益因子,包括:
获取所述音频噪声在所述预设频带下的减益因子;
将所述频带敏感系数与所述减益因子的乘积作为个性化减益因子。
4.根据权利要求1所述的方法,其特征在于,所述基于所述个性化减益因子确定降噪后的目标频谱之前,还包括:
获取与所述音频噪声对应的噪声频谱;
所述基于所述个性化减益因子确定降噪后的目标频谱,包括:
将所述个性化减益因子拓展到所述噪声频谱的维度,得到参考减益因子;
将所述噪声频谱与所述参考减益因子的乘积作为降噪后的目标频谱。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标频谱获取目标音频,包括:
对所述目标频谱进行反向傅里叶变换,得到目标音频。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述获取待处理音频在预设频带下的敏感音量,包括:
在满足预设条件的情况下,开始获取待处理音频的在预设频带下的敏感音量。
7.根据权利要求6所述的方法,其特征在于,所述获取待处理音频在预设频带下的敏感音量,包括:
将所述待处理音频划分为多个频带;
对于每个频带,递增该频带内的音频播放音量,在递增音频播放音量的过程中,若检测到指定响应操作,将所述指定响应操作的触发时刻对应的音频播放音量作为待处理音频在所述频带下的敏感音量。
8.一种音频降噪装置,其特征在于,所述装置包括:
敏感音量获取模块,用于获取待处理音频在预设频带下的敏感音量,所述敏感音量表征用户能够听见声音的临界音量;
噪声音量获取模块,用于获取音频噪声在所述预设频带下的噪声音量;
降噪参数获取模块,用于基于所述敏感音量与所述噪声音量获取个性化减益因子,所述个性化减益因子用于减弱所述待处理音频的音频噪声;
降噪模块,用于基于所述个性化减益因子确定降噪后的目标频谱;
目标音频获取模块,用于基于所述目标频谱获取目标音频。
9.一种电子设备,其特征在于,包括一个或多个处理器以及存储器;
一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行权利要求1-7任一所述的方法。
CN202311816253.1A 2023-12-26 2023-12-26 音频降噪方法、装置、电子设备及存储介质 Pending CN117854537A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311816253.1A CN117854537A (zh) 2023-12-26 2023-12-26 音频降噪方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311816253.1A CN117854537A (zh) 2023-12-26 2023-12-26 音频降噪方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117854537A true CN117854537A (zh) 2024-04-09

Family

ID=90537443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311816253.1A Pending CN117854537A (zh) 2023-12-26 2023-12-26 音频降噪方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117854537A (zh)

Similar Documents

Publication Publication Date Title
CN107105367B (zh) 一种音频信号处理方法及终端
CN108076226B (zh) 一种通话质量调整的方法、移动终端及存储介质
CN110809214B (zh) 音频播放方法、音频播放装置及终端设备
US11315582B2 (en) Method for recovering audio signals, terminal and storage medium
US9766852B2 (en) Non-audio notification of audible events
US10354651B1 (en) Head-mounted device control based on wearer information and user inputs
US8498429B2 (en) Acoustic correction apparatus, audio output apparatus, and acoustic correction method
CN109524016B (zh) 音频处理方法、装置、电子设备及存储介质
WO2022160715A1 (zh) 语音信号的处理方法及电子设备
CN109756818B (zh) 双麦克风降噪方法、装置、存储介质及电子设备
US10405114B2 (en) Automated detection of an active audio output
CN118285117A (zh) 音频渲染方法、音频渲染设备和电子设备
CN113170260A (zh) 音频处理方法、装置、存储介质及电子设备
CN109346102B (zh) 音频开头爆音的检测方法、装置及存储介质
JP5970125B2 (ja) 制御装置、制御方法及びプログラム
JP5717899B2 (ja) 携帯デバイスのオーディオ装置
CN114697849A (zh) 耳机佩戴检测方法、装置、耳机及存储介质
CN117854537A (zh) 音频降噪方法、装置、电子设备及存储介质
CN114286258B (zh) 电流音消除方法、装置、耳机及计算机可读存储介质
CN106170113B (zh) 一种消除噪声的方法和装置以及电子设备
CN112802453B (zh) 快速自适应预测拟合语音方法、系统、终端及存储介质
CN111757211B (zh) 降噪方法、终端设备及存储介质
KR101696997B1 (ko) Dsp 내장 코덱을 이용한 소음에 따른 출력 음향 크기 자동 조정 장치
CN109274826B (zh) 语音播放模式的切换方法、装置、终端和计算机可读存储介质
WO2018227560A1 (zh) 耳机控制方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination