CN114120951A - 自适应降噪方法、系统、设备及存储介质 - Google Patents
自适应降噪方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN114120951A CN114120951A CN202111267424.0A CN202111267424A CN114120951A CN 114120951 A CN114120951 A CN 114120951A CN 202111267424 A CN202111267424 A CN 202111267424A CN 114120951 A CN114120951 A CN 114120951A
- Authority
- CN
- China
- Prior art keywords
- noise reduction
- noise
- parameters
- adaptive
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1785—Methods, e.g. algorithms; Devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1787—General system configurations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1083—Reduction of ambient noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/10—Applications
- G10K2210/108—Communication systems, e.g. where useful sound is kept and noise is cancelled
- G10K2210/1081—Earphones, e.g. for telephones, ear protectors or headsets
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3038—Neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/01—Hearing devices using active noise cancellation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本发明公开了一种自适应降噪方法、系统、设备及存储介质,该方法包括以下步骤:获取当前的噪声音频数据;将所述当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;基于自适应降噪设备的降噪模式,利用所述降噪参数生成反相声波信号对所述当前的噪声音频数据进行自适应降噪;本发明解决了噪声识别率低的问题,提高了自适应降噪设备的降噪效果。
Description
技术领域
本发明涉及主动降噪耳机领域,尤其涉及一种自适应降噪方法、系统、设备及存储介质。
背景技术
降噪耳机根据其采用的降噪原理不同,分为主动降噪耳机和被动降噪耳机,其中主动降噪耳机又分为前馈式降噪、反馈时降噪以及混合式降噪三种。主动降噪耳机一般通过一个或多个麦克风来接收环境噪声,然后通过电子电路产生与噪声声波相位相反的信号,以此来消除外界进入耳道的噪声。但是现有技术的噪声识别率低,严重影响了耳机的降噪效果。
发明内容
有鉴于此,本申请实施例提供一种自适应降噪方法、系统、设备及存储介质,解决噪声识别率低的问题。
本申请实施例提供了一种自适应降噪方法,所述方法包括:
获取当前的噪声音频数据;
将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;
基于自适应降噪设备的降噪模式,利用降噪参数生成反相声波信号对当前的噪声音频数据进行自适应降噪。
可选地,将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数的步骤之前,包括:
构建音频降噪模型,具体包括:
获取不同噪声场景的场景音频数据;
将场景音频数据通过预设方法转换为对应的噪声频域响应;
将噪声频域响应通过级联滤波器的形式进行降噪参数的调试,获得不同噪声场景对应的降噪参数。
可选地,将噪声频域响应通过级联滤波器的形式进行降噪参数的调试,获得不同噪声场景对应的降噪参数的步骤之后,还包括:
利用降噪参数对不同噪声场景的场景音频数据进行消除验证,获得降噪误差值;
利用降噪误差值对降噪参数进行优化操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化,获得降噪优化参数,并将降噪优化参数作为降噪参数。
可选地,利用降噪误差值对降噪参数进行优化操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化,获得降噪优化参数,并将降噪优化参数作为降噪参数,包括:
对降噪误差值进行逆向迭代操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化;
获得每次逆向迭代操作后生成的降噪优化参数,并基于降噪优化参数以及逆向迭代次数获得降噪优化参数的平均值;
将降噪优化参数的平均值作为降噪参数。
可选地,利用降噪误差值对降噪参数进行优化操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化,获得降噪优化参数,并将降噪优化参数作为降噪参数,还包括:
对降噪误差值进行逆向迭代操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化;
获得最后一次逆向迭代操作后生成的降噪优化参数,并将降噪优化参数作为降噪参数。
可选地,将场景音频数据通过预设方法转换为对应的噪声频域响应,包括:
将每个场景音频数据通过预设方法转换为多个噪声频域响应;
获得多个噪声频域响应的平均值作为场景音频数据对应的噪声频域响应。
可选地,基于自适应降噪设备的降噪模式,利用降噪参数对当前的噪声音频数据进行自适应降噪,包括:
若自适应降噪设备的降噪模式为前馈式降噪,则利用降噪参数中的前馈式参数生成反相声波信号对当前的噪声音频数据进行自适应降噪;
若自适应降噪设备的降噪模式为反馈式降噪,则利用降噪参数中的反馈式参数生成反相声波信号对当前的噪声音频数据进行自适应降噪;
若自适应降噪设备的降噪模式为混合式降噪,则利用降噪参数中的混合式参数生成反相声波信号对当前的噪声音频数据进行自适应降噪。
为实现上述目的,还提供一种自适应降噪系统,所述系统,包括:
数据获取模块,用于获取当前的噪声音频数据;
降噪参数获取模块,用于将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;
自适应降噪模块,用于基于自适应降噪设备的降噪模式,利用降噪参数生成反相声波信号对当前的噪声音频数据进行自适应降噪。
为实现上述目的,还提供一种自适应降噪设备,所述自适应降噪设备包括:存储器、处理器及存储在存储器上并可在处理器上运行的自适应降噪方法程序,自适应降噪方法程序被处理器执行时实现上述任一项自适应降噪方法的步骤。
为实现上述目的,还提供一种计算机存储介质,所述计算机存储介质上存储有自适应降噪方法程序,自适应降噪方法程序被处理器执行时实现上述任一项自适应降噪方法的步骤。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:获取当前的噪声音频数据;将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;通过预先训练好的音频降噪模型,提高噪声识别率并获取高噪声识别率下的降噪参数,以供自适应降噪设备进行降噪;
基于自适应降噪设备的降噪模式,利用降噪参数生成反相声波信号对当前的噪声音频数据进行自适应降噪;其中,基于自适应降噪设备的降噪模式,利用降噪参数中降噪模式对应的参数,准确的生成反相声波信号,以完成对当前的噪声音频数据准确的自适应降噪,从而提高自适应降噪设备的降噪效果。
附图说明
图1为本申请自适应降噪方法的第一实施例的流程示意图;
图2为本申请自适应降噪方法第二实施例的流程示意图;
图3为本申请自适应降噪方法第二实施例中步骤S220的具体实施步骤的流程示意图;
图4为本申请自适应降噪方法第二实施例中步骤S220的另一具体实施步骤图的流程示意图;
图5为本申请自适应降噪方法步骤S225'的具体实施步骤的流程示意图;
图6为本申请自适应降噪方法步骤S225'的另一具体实施步骤的流程示意图;
图7为本申请自适应降噪方法步骤S222的具体实施步骤的流程示意图;
图8为本申请自适应降噪系统的示意图;
图9为本申请自适应降噪设备的示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取当前的噪声音频数据;将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;基于自适应降噪设备的降噪模式,利用降噪参数生成反相声波信号对当前的噪声音频数据进行自适应降噪;本发明解决了噪声识别率低的问题,提高了自适应降噪设备的降噪效果。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
参照图1,图1为本申请自适应降噪方法的第一实施例,所述方法包括:
步骤S110:获取当前的噪声音频数据;
具体地,对自适应降噪设备所处当前环境中能拾取到的音频进行预处理,获得当前的噪声音频数据,其中,噪声音频数据至少包括不同频谱特征、特定语音时长等信息。
步骤S120:将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;
具体地,预先训练好的音频降噪模型可以是基于深度神经网络(DNN)的降噪模型,可以用于上行通话降噪,通过设计适合语音增强领域的专用神经网络模型,基于谱映射的方法进行噪声消除。深度神经网络通过多层的学习网络(每个网络中拥有多个节点)实现对原始声音的处理输出,实现不同输入条件下语音分离。
步骤S130:基于自适应降噪设备的降噪模式,利用降噪参数生成反相声波信号对当前的噪声音频数据进行自适应降噪。
需要另外说明的是,在本实施例中的自适应降噪设备可以是耳机,其中耳机可以是入耳式,也可以是半入耳式,耳机形态不限于耳塞,也可以是头戴式耳机,在此并不限定;另外自适应降噪设备也可以是应用到虚拟现实(Virtual Reality,或VR),増强现实(Augmented Reality,或AR)或者介导现实(Mediated Realtiy,或MR)。
具体地,可以利用自适应降噪设备利用降噪参数生成信号强度相同且方向相反的声波信号以抵消当前的噪声音频数据,以起到自适应降噪的效果。
在本实施例中,获取当前的噪声音频数据;将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;通过预先训练好的音频降噪模型,提高噪声识别率并获取高噪声识别率下的降噪参数,以供自适应降噪设备进行降噪;
基于自适应降噪设备的降噪模式,利用降噪参数生成反相声波信号对当前的噪声音频数据进行自适应降噪;其中,基于自适应降噪设备的降噪模式,利用降噪参数中降噪模式对应的参数,准确的生成反相声波信号,以完成对当前的噪声音频数据准确的自适应降噪,从而提高自适应降噪设备的降噪效果。
参照图2,图2为本申请自适应降噪方法第二实施例,将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数的步骤之前,包括:
步骤S210:获取当前的噪声音频数据;
步骤S220:构建音频降噪模型;
具体地,通过构建音频降噪模型,可以是基于深度神经网络(DNN)的降噪模型,也可以是基于DNN-LSTM的混合降噪模型,也可以是现有技术中多个神经网络模型的集成学习降噪模型,以提高音频降噪模型的噪声识别效果,在此并不限定。
需要另外说明的是,在音频降噪模型映射学习的过程中,算法优化前期,学习率较大会加速学习效果,但在算法优化后期学习率较大会造成较大波动,出现围绕最优值徘徊而无法收敛的情况,因此,在本实施例中,音频降噪模型的训练过程中,随着训练的进行,学习率逐渐衰减。
具体地,音频降噪模型可以部署在云端,也可以部署在自适应降噪设备端,也就是本地端,在此并不作限定,根据具体设定进行调整。
步骤S230:将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;
步骤S240:基于自适应降噪设备的降噪模式,利用降噪参数生成反相声波信号对当前的噪声音频数据进行自适应降噪。
在其中一个实施例中,基于自适应降噪设备的降噪模式,利用降噪参数对当前的噪声音频数据进行自适应降噪,包括:
若自适应降噪设备的降噪模式为前馈式降噪,则利用降噪参数中的前馈式参数生成反相声波信号对当前的噪声音频数据进行自适应降噪;
若自适应降噪设备的降噪模式为反馈式降噪,则利用降噪参数中的反馈式参数生成反相声波信号对当前的噪声音频数据进行自适应降噪;
若自适应降噪设备的降噪模式为混合式降噪,则利用降噪参数中的混合式参数生成反相声波信号对当前的噪声音频数据进行自适应降噪。
其中,在反馈式降噪模式以及混合式降噪模式中,在生成反相声波信息后,获取残余噪声信号,并将残余噪声信号反馈至音频降噪模型中。
第二实施例与第一实施例相比,包括步骤S220,其他步骤在第一实施例中已经进行了阐述,在此不再赘述。
在本实施例中,通过构建音频降噪模型以调高噪声识别的准确率,从而达到更好的降噪效果。
参照图3,图3为本申请自适应降噪方法第二实施例中步骤S220的具体实施步骤,构建音频降噪模型,包括:
步骤S221:获取不同噪声场景的场景音频数据;
具体地,可以获取海量的不同噪声场景的场景音频数据作为训练集,以保证音频降噪模型训练的全面性。
步骤S222:将场景音频数据通过预设方法转换为对应的噪声频域响应;
具体地,将场景音频数据可以通过傅里叶变换转换为对应的噪声频域响应。其中,傅里叶变换可以是连续傅里叶变换和离散傅里叶变换,在此并不作限定。
步骤S223:将噪声频域响应通过级联滤波器的形式进行降噪参数的调试,获得不同噪声场景对应的降噪参数。
具体地,级联滤波器可以是将多个滤波器通过级联的方式连接在一起,其中,如果是两个以上完全相同滤波器级联,则可以增强其滤波效果;如果是两个以上不同的滤波器级联,则可以扩展其滤波频域,在本实施例中,并不限定上述的级联方式,可以根据需要动态调整。
在本实施例中,通过级联滤波器的形式进行对应的组合降噪参数的调试,以准确获得不同噪声场景对应的降噪参数。
参照图4,图4为本申请自适应降噪方法第二实施例中步骤S220的另一具体实施步骤,将噪声频域响应通过级联滤波器的形式进行降噪参数的调试,获得不同噪声场景对应的降噪参数的步骤之后,还包括:
步骤S221':获取不同噪声场景的场景音频数据;
步骤S222':将场景音频数据通过预设方法转换为对应的噪声频域响应;
步骤S223':将噪声频域响应通过级联滤波器的形式进行降噪参数的调试,获得不同噪声场景对应的降噪参数;
步骤S224':利用降噪参数对不同噪声场景的场景音频数据进行消除验证,获得降噪误差值;
具体地,消除验证可以是利用降噪参数使自适应降噪设备产生强度相同,方向相反的声波信号对不同噪声场景的场景音频数据进行噪声消除的验证。
步骤S225':利用降噪误差值对降噪参数进行优化操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化,获得降噪优化参数,并将降噪优化参数作为降噪参数。
具体地,预设次数在此并不限定,根据具体的音频降噪模型以及训练集的质量进行动态调整。
具体地,在另一实施例中,也可以是当降噪误差值在预设误差范围内时,停止对降噪参数进行优化,获得当前的降噪优化参数,并将降噪优化参数作为降噪参数。
与上一实施例相比,本实施例具体包含了步骤S224',以及步骤S225',其他步骤在上一实施例中已经进行了阐述,在此不再赘述。
在本实施例中,增加了对降噪参数的优化操作,提高降噪参数的精确度,从而进一步保证自适应降噪设备的降噪效果。
参照图5,图5为本申请自适应降噪方法步骤S225'的具体实施步骤,利用降噪误差值对降噪参数进行优化操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化,获得降噪优化参数,并将降噪优化参数作为降噪参数,包括:
步骤S225'-1:对降噪误差值进行逆向迭代操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化;
具体地,逆向迭代操作可以是基于逆向迭代器实现;其中预设次数在本实施例中并不限定,预设次数设置与降噪参数的优化效果成正相关,即预设次数越多,则优化效果越高,但会造成计算资源的浪费,所以预设次数的设置根据降噪效果来进行调整。
步骤S225'-2:获得每次逆向迭代操作后生成的降噪优化参数,并基于降噪优化参数以及逆向迭代次数获得降噪优化参数的平均值;
具体地,也可以是获得每次逆向迭代操作后生成的降噪优化参数,然后去掉降噪优化参数中的最大值以及最小值,求得剩余降噪优化参数的平均值,以保证降噪参数的合理性以及正确性。
步骤S225'-3:将降噪优化参数的平均值作为降噪参数。
在本实施例中通过获取降噪优化参数的平均值作为降噪参数,使降噪参数更加的合理,从而保证音频降噪模型的噪声识别率。
参照图6,图6为本申请自适应降噪方法步骤S225'的另一具体实施步骤,利用降噪误差值对降噪参数进行优化操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化,获得降噪优化参数,并将降噪优化参数作为降噪参数,还包括:
步骤S225'-11:对降噪误差值进行逆向迭代操作,直至逆向迭代次数达到预设次数,则停止对降噪参数进行优化;
步骤S225'-12:获得最后一次逆向迭代操作后生成的降噪优化参数,并将降噪优化参数作为降噪参数。
具体地,在本实施例中通过获取最后一次逆向迭代操作后生成的降噪优化参数作为降噪参数,保证降噪参数为最优值,从而保证音频降噪模型的噪声识别率,进一步提高自适应降噪设备的降噪效果。
参照图7,图7为本申请自适应降噪方法步骤S222的具体实施步骤,将场景音频数据通过预设方法转换为对应的噪声频域响应,包括:
步骤S222-1:将每个场景音频数据通过预设方法转换为多个噪声频域响应;
步骤S222-2:获得多个噪声频域响应的平均值作为场景音频数据对应的噪声频域响应。
具体地,在本实施例中通过获取多个噪声频域响应的平均值作为场景音频数据对应的噪声频域响应,使噪声频域响应更加合理以及准确。
本申请还保护一种自适应降噪系统,所述系统02,包括:
数据获取模块21,用于获取当前的噪声音频数据;
降噪参数获取模块22,用于将当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;
自适应降噪模块23,用于基于自适应降噪设备的降噪模式,利用降噪参数生成反相声波信号对当前的噪声音频数据进行自适应降噪。
图8所示系统包括数据获取模块21、降噪参数获取模块22、自适应降噪模块23,该系统可以执行图1至图7所示实施例的方法,本实施例未详细描述的部分,可参考对图1至图7所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1至图7所示实施例中的描述,在此不再赘述。
本申请还保护一种自适应降噪设备,所述自适应降噪设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自适应降噪方法程序,所述自适应降噪方法程序被所述处理器执行时实现上述任一项所述的自适应降噪方法的步骤。
本申请涉及的一种自适应降噪设备10包括如图9所示:至少一个处理器12、存储器11。
处理器12可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器12中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器12可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器11,处理器12读取存储器11中的信息,结合其硬件完成上述方法的步骤。
可以理解,本发明实施例中的存储器11可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ReadOnly Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本发明实施例描述的系统和方法的存储器11旨在包括但不限于这些和任意其它适合类型的存储器。
本申请还保护一种计算机存储介质,所述计算机存储介质上存储有自适应降噪方法程序,所述自适应降噪方法程序被处理器执行时实现上述任一项所述的自适应降噪方法的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种自适应降噪方法,其特征在于,所述方法包括:
获取当前的噪声音频数据;
将所述当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;
基于自适应降噪设备的降噪模式,利用所述降噪参数生成反相声波信号对所述当前的噪声音频数据进行自适应降噪。
2.如权利要求1所述的自适应降噪方法,其特征在于,所述将所述当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数的步骤之前,包括:
构建所述音频降噪模型,具体包括:
获取不同噪声场景的场景音频数据;
将所述场景音频数据通过预设方法转换为对应的噪声频域响应;
将所述噪声频域响应通过级联滤波器的形式进行降噪参数的调试,获得不同噪声场景对应的降噪参数。
3.如权利要求2所述的自适应降噪方法,其特征在于,所述将所述噪声频域响应通过级联滤波器的形式进行降噪参数的调试,获得不同噪声场景对应的降噪参数的步骤之后,还包括:
利用所述降噪参数对所述不同噪声场景的场景音频数据进行消除验证,获得降噪误差值;
利用所述降噪误差值对所述降噪参数进行优化操作,直至逆向迭代次数达到预设次数,则停止对所述降噪参数进行优化,获得降噪优化参数,并将所述降噪优化参数作为所述降噪参数。
4.如权利要求3所述的自适应降噪方法,其特征在于,所述利用所述降噪误差值对所述降噪参数进行优化操作,直至逆向迭代次数达到预设次数,则停止对所述降噪参数进行优化,获得降噪优化参数,并将所述降噪优化参数作为所述降噪参数,包括:
对所述降噪误差值进行逆向迭代操作,直至逆向迭代次数达到预设次数,则停止对所述降噪参数进行优化;
获得每次逆向迭代操作后生成的降噪优化参数,并基于所述降噪优化参数以及所述逆向迭代次数获得所述降噪优化参数的平均值;
将所述降噪优化参数的平均值作为所述降噪参数。
5.如权利要求3所述的自适应降噪方法,其特征在于,所述利用所述降噪误差值对所述降噪参数进行优化操作,直至逆向迭代次数达到预设次数,则停止对所述降噪参数进行优化,获得降噪优化参数,并将所述降噪优化参数作为所述降噪参数,还包括:
对所述降噪误差值进行逆向迭代操作,直至逆向迭代次数达到预设次数,则停止对所述降噪参数进行优化;
获得最后一次逆向迭代操作后生成的降噪优化参数,并将所述降噪优化参数作为所述降噪参数。
6.如权利要求2所述的自适应降噪方法,其特征在于,所述将所述场景音频数据通过预设方法转换为对应的噪声频域响应,包括:
将每个所述场景音频数据通过预设方法转换为多个噪声频域响应;
获得所述多个噪声频域响应的平均值作为所述场景音频数据对应的噪声频域响应。
7.如权利要求1所述的自适应降噪方法,其特征在于,所述基于自适应降噪设备的降噪模式,利用所述降噪参数对所述当前的噪声音频数据进行自适应降噪,包括:
若所述自适应降噪设备的降噪模式为前馈式降噪,则利用所述降噪参数中的前馈式参数生成反相声波信号对所述当前的噪声音频数据进行自适应降噪;
若所述自适应降噪设备的降噪模式为反馈式降噪,则利用所述降噪参数中的反馈式参数生成反相声波信号对所述当前的噪声音频数据进行自适应降噪;
若所述自适应降噪设备的降噪模式为混合式降噪,则利用所述降噪参数中的混合式参数生成反相声波信号对所述当前的噪声音频数据进行自适应降噪。
8.一种自适应降噪系统,其特征在于,所述系统,包括:
数据获取模块,用于获取当前的噪声音频数据;
降噪参数获取模块,用于将所述当前的噪声音频数据输入预先训练好的音频降噪模型,获得当前噪声场景对应的降噪参数;
自适应降噪模块,用于基于自适应降噪设备的降噪模式,利用所述降噪参数生成反相声波信号对所述当前的噪声音频数据进行自适应降噪。
9.一种自适应降噪设备,其特征在于,所述自适应降噪设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自适应降噪方法程序,所述自适应降噪方法程序被所述处理器执行时实现如权利要求1至7中任一项所述的自适应降噪方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有自适应降噪方法程序,所述自适应降噪方法程序被处理器执行时实现权利要求1至7中任一项所述的自适应降噪方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111267424.0A CN114120951A (zh) | 2021-10-28 | 2021-10-28 | 自适应降噪方法、系统、设备及存储介质 |
PCT/CN2021/138987 WO2023070899A1 (zh) | 2021-10-28 | 2021-12-17 | 自适应降噪方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111267424.0A CN114120951A (zh) | 2021-10-28 | 2021-10-28 | 自适应降噪方法、系统、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114120951A true CN114120951A (zh) | 2022-03-01 |
Family
ID=80377464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111267424.0A Pending CN114120951A (zh) | 2021-10-28 | 2021-10-28 | 自适应降噪方法、系统、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114120951A (zh) |
WO (1) | WO2023070899A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118368561A (zh) * | 2024-06-19 | 2024-07-19 | 深圳市澜科创科技有限公司 | 蓝牙耳机降噪处理方法、装置、设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150081287A1 (en) * | 2013-09-13 | 2015-03-19 | Advanced Simulation Technology, inc. ("ASTi") | Adaptive noise reduction for high noise environments |
CN112423176A (zh) * | 2019-08-20 | 2021-02-26 | Oppo广东移动通信有限公司 | 耳机降噪方法、装置、存储介质及降噪耳机 |
CN111800688B (zh) * | 2020-03-24 | 2022-04-12 | 深圳市豪恩声学股份有限公司 | 一种主动降噪方法、装置、电子设备及存储介质 |
CN113132847B (zh) * | 2021-04-13 | 2024-05-10 | 北京安声科技有限公司 | 主动降噪耳机的降噪参数确定方法及装置、主动降噪方法 |
-
2021
- 2021-10-28 CN CN202111267424.0A patent/CN114120951A/zh active Pending
- 2021-12-17 WO PCT/CN2021/138987 patent/WO2023070899A1/zh unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118368561A (zh) * | 2024-06-19 | 2024-07-19 | 深圳市澜科创科技有限公司 | 蓝牙耳机降噪处理方法、装置、设备及存储介质 |
CN118368561B (zh) * | 2024-06-19 | 2024-09-06 | 深圳市澜科创科技有限公司 | 蓝牙耳机降噪处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2023070899A1 (zh) | 2023-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Choi et al. | Phase-aware speech enhancement with deep complex u-net | |
JP5718251B2 (ja) | 分解されたオーディオ信号の再構成のためのシステムおよび方法 | |
Mertins et al. | Room impulse response shortening/reshaping with infinity-and $ p $-norm optimization | |
CN113436643B (zh) | 语音增强模型的训练及应用方法、装置、设备及存储介质 | |
EP3899936B1 (en) | Source separation using an estimation and control of sound quality | |
CN111031448B (zh) | 回声消除方法、装置、电子设备和存储介质 | |
US10755728B1 (en) | Multichannel noise cancellation using frequency domain spectrum masking | |
US20240177726A1 (en) | Speech enhancement | |
CN112614504A (zh) | 单声道语音降噪方法、系统、设备及可读存储介质 | |
CN111508519A (zh) | 一种音频信号人声增强的方法及装置 | |
CN116405823B (zh) | 一种骨传导耳机音频智能去噪增强方法 | |
US11538487B2 (en) | Voice signal enhancing method and device | |
CN114120951A (zh) | 自适应降噪方法、系统、设备及存储介质 | |
WO2021175267A1 (zh) | 一种实现主动噪声消除的方法、装置和电子设备 | |
CN112365900A (zh) | 一种语音信号增强方法、装置、介质和设备 | |
JP2024526679A (ja) | 発話向上のためのデータ増強 | |
WO2023086311A1 (en) | Control of speech preservation in speech enhancement | |
CN115440240A (zh) | 语音降噪的训练方法、语音降噪系统及语音降噪方法 | |
CN114121030A (zh) | 生成语音增强模型的方法和设备以及语音增强方法和设备 | |
CN111613211B (zh) | 特定词语音的处理方法及装置 | |
US20240363131A1 (en) | Speech enhancement | |
US20240127842A1 (en) | Apparatus, Methods and Computer Programs for Audio Signal Enhancement Using a Dataset | |
Jung et al. | Noise Reduction after RIR removal for Speech De-reverberation and De-noising | |
CN115376501B (zh) | 语音增强方法及装置、存储介质、电子设备 | |
US20240363132A1 (en) | High-performance small-footprint ai-based noise suppression model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |