CN112185409A - 一种双麦克风降噪方法和存储设备 - Google Patents

一种双麦克风降噪方法和存储设备 Download PDF

Info

Publication number
CN112185409A
CN112185409A CN202011101947.3A CN202011101947A CN112185409A CN 112185409 A CN112185409 A CN 112185409A CN 202011101947 A CN202011101947 A CN 202011101947A CN 112185409 A CN112185409 A CN 112185409A
Authority
CN
China
Prior art keywords
noise
layer
noise reduction
characteristic value
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011101947.3A
Other languages
English (en)
Inventor
陈晨
郑添来
石向军
兰忠文
蔡宗辉
姚明娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Ruiven Information Technology Co ltd
Original Assignee
Fujian Ruiven Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Ruiven Information Technology Co ltd filed Critical Fujian Ruiven Information Technology Co ltd
Priority to CN202011101947.3A priority Critical patent/CN112185409A/zh
Publication of CN112185409A publication Critical patent/CN112185409A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal

Abstract

本发明涉及数据处理技术领域,特别涉及一种双麦克风降噪方法和存储设备。所述一种双麦克风降噪方法,包括步骤:设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库;按所述降噪层层级先后顺序输入语音数据逐层进行处理;语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值。通过引入数据库存放所述降噪层每一层的降噪算法,每种算法的关键信息都在数据库中得以保存,即可以有针对性地对语音数据进行处理,又可以重复有效利用。

Description

一种双麦克风降噪方法和存储设备
技术领域
本发明涉及数据处理技术领域,特别涉及一种双麦克风降噪方法和存储设备。
背景技术
现有大规模应用的最普遍的降噪技术是双麦克风降噪技术,一般采用此技术的对讲机配有主、副两个性能相同的电容式麦克风,其中主MIC用于拾取通话的语音,副MIC用于背景声拾音,一般安装在手机话筒的背面,与主MIC物理隔离。开始发起对讲时,音源靠近主MIC,它产生较大的音频信号A,同时副MIC也会得到同样但是经过削弱的语音信号B,这个信号经过手机内部DSP做声相反相处理达到抵消噪声的作用。
传统的噪声抑制算法,是通过采样声音,将噪声与人声+噪音混合的信号进行比对计算,进而从所采集的人声+噪声中将噪声分离出去。这种计算是实时的,只进行一次。导致算法学习到的关键信息无法保留,无法可重复使用。
发明内容
为此,需要提供一种双麦克风降噪方法,用以解决现有双麦克风降噪处理过程,算法学习得到的关键信息无法保留,无法重复使用的问题。具体技术方案如下:
一种双麦克风降噪方法,包括步骤:
设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库;
按所述降噪层层级先后顺序输入语音数据逐层进行处理;
语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值;
所述噪声参数包括:信噪比差值。
进一步的,所述“按所述降噪层层级先后顺序输入语音数据逐层进行处理”,还包括步骤:
输入语音数据至所述降噪层的第一层进行预处理,按频率范围对每个语音数据进行切割,分离出不同频率范围的噪声;
所述不同频率范围的噪声包括以下中的一种或多种:低频噪声、中频噪声、高频噪声。
进一步的,所述“按所述降噪层层级先后顺序输入语音数据逐层进行处理”,还包括步骤:
输入第一层预处理后的语音数据至下一层,从数据库中获取该层降噪层的降噪算法对应的噪声特征值,根据所述噪声特征值对预处理后的语音数据进行去噪。
进一步的,自所述降噪层第二层起,每下一层的降噪算法对应的噪声特征值均为对上一层的降噪算法对应的噪声特征值的进一步细分。
进一步的,所述“设置两个以上的降噪层”,还包括步骤:设置三个的降噪层;
所述第二层的噪声特征值包括以下中的一种或多种:人声对应的噪声特征值、音乐声对应的噪声特征值、交通工具噪声特征值、建筑噪声特征值、工业噪声特征值、社会生活噪声特征值;
所述“根据所述噪声特征值对预处理后的语音数据进行去噪”,还包括步骤:获得降噪后的音频文件,用所述降噪后的音频文件替换旧音频文件,完成降噪。
进一步的,所述第三层的噪声特征值包括以下中的一种或多种:男声噪声特征值、女声噪声特征值、童声噪声特征值、小型汽车噪声特征值、摩托车噪声特征值、大型货运车噪声特征值、轨道交通噪声特征值、砖石堆砌解体噪声特征值、机械敲击噪声特征值、设备噪声噪声特征值、钢琴声特征值、竖琴声特征值、大提琴声特征值、中提琴声特征值、小提琴声特征值、低音提琴声特征值、口琴声特征值、凤凰琴声特征值、电子琴声特征值、木琴声特征值、钢片琴声特征值、颤音琴声特征值、竖琴声特征值、吉他声特征值、电吉他声特征值、贝司声特征值、长笛声特征值、短笛声特征值、木笛声特征值、陶瓷撞击噪声特征值、金属撞击噪声特征值、木制品撞击噪声特征值、玻璃制品撞击噪声特征值、石头撞击噪声特征值、陶瓷摩擦噪声特征值、金属摩擦噪声特征值、木制品摩擦噪声特征值、玻璃制品摩擦噪声特征值、石头摩擦噪声特征值、泡沫制品摩擦噪声特征值。
进一步的,所述“设置两个以上的降噪层”前,还包括步骤:
判断所述数据库是否存在更新,若所述数据库存在更新,则更新数据库。
进一步的,还包括步骤:
语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若低于预设阈值,则结束降噪,输出降噪处理后的语音数据。
为解决上述技术问题,还提供了一种存储设备,具体技术方案如下:
一种存储设备,其中存储有指令集,所述指令集用于执行:
设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库;
按所述降噪层层级先后顺序输入语音数据逐层进行处理;
语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值;
所述噪声参数包括:信噪比差值。
进一步的,所述指令集还用于执行:
所述“按所述降噪层层级先后顺序输入语音数据逐层进行处理”,还包括步骤:
输入语音数据至所述降噪层的第一层进行预处理,按频率范围对每个语音数据进行切割,分离出不同频率范围的噪声;
所述不同频率范围的噪声包括以下中的一种或多种:低频噪声、中频噪声、高频噪声。
本发明的有益效果是:设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库中;按所述降噪层层级先后顺序输入语音数据逐层进行处理;语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值;所述噪声参数包括:信噪比差值。通过引入数据库存放所述降噪层每一层的降噪算法,每种算法的关键信息都在数据库中得以保存,即可以有针对性地对语音数据进行处理,又可以重复有效利用。
附图说明
图1为具体实施方式所述一种双麦克风降噪方法的流程图;
图2为具体实施方式所述原始音频示意图;
图3为具体实施方式所述优化后的音频示意图;
图4为具体实施方式所述一种存储设备的模块示意图。
附图标记说明:
400、存储设备。
具体实施方式
为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
本申请的核心技术方案在于:通过引入数据库,并设计两个以上的降噪层,数据库中预先存储每个降噪层的降噪算法,当有新的算法更新时,亦会存入数据库中,当有语音数据需要处理时,按所述降噪层层级先后顺序输入语音数据逐层进行处理;其中每经过一层降噪层处理后,都会去判断经过该层处理后的语音数据是否达到了预先设置的降噪标准,若没有达到标准,则传入下一层继续降噪处理,若达到标准,则结束降噪处理,输出降噪处理后的语音数据。
其中数据库中预先为每个降噪层设置的算法,是通过前期大量实验得到的。而后期在持续获取到不同场景的语音数据后,会通过对这些语音数据的进一步分析处理,归结出其它的算法,定时将这些算法更新至数据库中。
传统的双麦克风主麦克用来采集手机通话的声音,副麦克采集环境噪声,通过采样声音,将噪声与人声+噪音混合的信号进行比对计算,进而从所采集的人声+噪声中将噪声分离出去。这种算法虽然可以有效抵御背景噪声,但在设计不当时,可能会影响正常的拾音质量,比如主副MIC隔离不好或者靠的太近又或者两个话筒的参数不完全一致,就可能导致正常通话也抵消一部分拾音,导致通话音量小。
而且因为环境的复杂性,固定的算法在遇到复杂的环境特别是人声频率较为接近混杂的环境时,可能错误的将本应拾取的人声进行错误的滤除,导致影响通话效果。
本发明专利算法的优势在于:
使用的是特征值提取过滤,针对不同特征值的干扰音进行有效的滤除,而且同时采用的双麦克,可以在干扰相对较小的前提下对不用位置人声进行进一步滤除,最大程度保留主麦克拾取的有效人声。
搭建噪声算法数据收集后台,用于采集各终端收集的噪声特征进而提取特征值,随着用户使用场景越多、特征值的不断收集,降噪效果可以进一步的提升。
首先对一些算法过程进行说明:
程序收到语音输入时,首先对语音数据分帧,每帧10ms,对每个帧的声音通过频率分离算法将高中低频声音进行分离。噪声分离后,根据预先集成的噪声特征值,对每帧噪声进行谱减计算。语音帧的组成为:
YIF(f)=∑[PIF(F)+NIF(F)]
对分离出语音帧进行谱减算法,得出最终输出的语音帧P(f)
即P(f)=Y(f)-N(f),Y(f)为分离后的原始帧,N(f)为分离后含有噪声特征值的帧。
我们采用分层级计算的噪声特征值对语音帧帧进行匹配:
匹配噪声特征值
Figure BDA0002725672420000061
δN(f)为噪声特征值关键字段,N(f)为待处理的带有噪声的语音,μH(UF)为降噪增益变量,根据我们的实验结果,在0-1之间取值。
t代表时间帧,δT(ft)为对应时间帧噪声失真补偿值。
因为使用场景的复杂性,对噪声的处理不能简单的相位抵消,否则可能造成不可预期的声音失真问题,所以在算法中引入了δT(ft)变量以便在不同时间帧对不同能量谱进行补偿。
Figure BDA0002725672420000062
匹配到特征噪声后,对其进行特征噪声谱减计算。
对于没有匹配到特征值的的语音帧,进行一般谱减计算,并将原始数据上传到服务器。
请参阅图1,在本实施方式中,一种双麦克风降噪方法可应用在一种存储设备上,所述存储设备包括但不限于:个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能移动终端、对讲终端等,具体实施方式如下:
步骤S101:设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库。
步骤S102:按所述降噪层层级先后顺序输入语音数据逐层进行处理。
步骤S103:语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值;所述噪声参数包括:信噪比差值。
设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库中;按所述降噪层层级先后顺序输入语音数据逐层进行处理;语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值;所述噪声参数包括:信噪比差值。通过引入数据库存放所述降噪层每一层的降噪算法,每种算法的关键信息都在数据库中得以保存,即可以有针对性地对语音数据进行处理,又可以重复有效利用。
在本实施方式中,优选地以设置三个降噪层来进行说明。在其它实施方式中,具体要采用多少层级的降噪层则取决于终端的运算能力和用户可接受的语音时延,层级越多得出的最终效果越好,但是同时也消耗更多的设备资源及运算时间。以下以设置三个降噪层来具体展开说明:
第一层的处理如下:
所述“按所述降噪层层级先后顺序输入语音数据逐层进行处理”,还包括步骤:输入语音数据至所述降噪层的第一层进行预处理,按频率范围对每个语音数据进行切割,分离出不同频率范围的噪声;所述不同频率范围的噪声包括以下中的一种或多种:低频噪声、中频噪声、高频噪声。其中每层的算法数据则根据数据库保留的频点特征与采集到的音频进行匹配,如:第二层的算法中,有三个是针对低频噪声,两个针对中频噪声,一个针对高频噪声,则各算法对自己匹配的频率噪声进行去噪。
故所述“按所述降噪层层级先后顺序输入语音数据逐层进行处理”,还包括步骤:输入第一层预处理后的语音数据至下一层,从数据库中获取该层降噪层的降噪算法对应的噪声特征值,根据所述噪声特征值对预处理后的语音数据进行去噪。
在本实施方式中,所述第二层的噪声特征值包括以下中的一种或多种:人声对应的噪声特征值、音乐声对应的噪声特征值、交通工具噪声特征值、建筑噪声特征值、工业噪声特征值、社会生活噪声特征值;
所述“根据所述噪声特征值对预处理后的语音数据进行去噪”,还包括步骤:获得降噪后的音频文件,用所述降噪后的音频文件替换旧音频文件,完成降噪。
其中,自所述降噪层第二层起,每下一层的降噪算法对应的噪声特征值均为对上一层的降噪算法对应的噪声特征值的进一步细分。如:第二层算法我们对环境中的餐厅/集会场所、公交地铁火车站、风噪、音乐噪声的特征信息进行匹配优化,第三层则对餐厅场景中的其他人声、器物噪声、音乐声等进一步匹配优化。
优选地,所述第三层的噪声特征值包括以下中的一种或多种:男声噪声特征值、女声噪声特征值、童声噪声特征值、小型汽车噪声特征值、摩托车噪声特征值、大型货运车噪声特征值、轨道交通噪声特征值、砖石堆砌解体噪声特征值、机械敲击噪声特征值、设备噪声噪声特征值、钢琴声特征值、竖琴声特征值、大提琴声特征值、中提琴声特征值、小提琴声特征值、低音提琴声特征值、口琴声特征值、凤凰琴声特征值、电子琴声特征值、木琴声特征值、钢片琴声特征值、颤音琴声特征值、竖琴声特征值、吉他声特征值、电吉他声特征值、贝司声特征值、长笛声特征值、短笛声特征值、木笛声特征值、陶瓷撞击噪声特征值、金属撞击噪声特征值、木制品撞击噪声特征值、玻璃制品撞击噪声特征值、石头撞击噪声特征值、陶瓷摩擦噪声特征值、金属摩擦噪声特征值、木制品摩擦噪声特征值、玻璃制品摩擦噪声特征值、石头摩擦噪声特征值、泡沫制品摩擦噪声特征值。
进一步的,为了确保最优的去噪效果,所述“设置两个以上的降噪层”前,还包括步骤:判断所述数据库是否存在更新,若所述数据库存在更新,则更新数据库。
同时为了避免算法冗余,语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若低于预设阈值,则结束降噪,输出降噪处理后的语音数据。
请参阅图2至图3,为本技术方案:一种双麦克风降噪方法应用在某对讲终端上的前后降噪效果。图2为原始音频,图3为优化后的效果。
请参阅图4,在本实施方式中,一种存储设备400的具体实施方式如下:
一种存储设备400,其中存储有指令集,所述指令集用于执行:设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库;按所述降噪层层级先后顺序输入语音数据逐层进行处理;语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值;所述噪声参数包括:信噪比差值。
设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库中;按所述降噪层层级先后顺序输入语音数据逐层进行处理;语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值;所述噪声参数包括:信噪比差值。通过引入数据库存放所述降噪层每一层的降噪算法,每种算法的关键信息都在数据库中得以保存,即可以有针对性地对语音数据进行处理,又可以重复有效利用。
在本实施方式中,优选地以设置三个降噪层来进行说明。在其它实施方式中,具体要采用多少层级的降噪层则取决于终端的运算能力和用户可接受的语音时延,层级越多得出的最终效果越好,但是同时也消耗更多的设备资源及运算时间。以下以设置三个降噪层来具体展开说明:
第一层的处理如下:
所述指令集还用于执行:所述“按所述降噪层层级先后顺序输入语音数据逐层进行处理”,还包括步骤:输入语音数据至所述降噪层的第一层进行预处理,按频率范围对每个语音数据进行切割,分离出不同频率范围的噪声;所述不同频率范围的噪声包括以下中的一种或多种:低频噪声、中频噪声、高频噪声。其中每层的算法数据则根据数据库保留的频点特征与采集到的音频进行匹配,如:第二层的算法中,有三个是针对低频噪声,两个针对中频噪声,一个针对高频噪声,则各算法对自己匹配的频率噪声进行去噪。
故所述指令集还用于执行:输入第一层预处理后的语音数据至下一层,从数据库中获取该层降噪层的降噪算法对应的噪声特征值,根据所述噪声特征值对预处理后的语音数据进行去噪。
在本实施方式中,所述第二层的噪声特征值包括以下中的一种或多种:人声对应的噪声特征值、音乐声对应的噪声特征值、交通工具噪声特征值、建筑噪声特征值、工业噪声特征值、社会生活噪声特征值;
所述“根据所述噪声特征值对预处理后的语音数据进行去噪”,还包括步骤:获得降噪后的音频文件,用所述降噪后的音频文件替换旧音频文件,完成降噪。
其中,自所述降噪层第二层起,每下一层的降噪算法对应的噪声特征值均为对上一层的降噪算法对应的噪声特征值的进一步细分。如:第二层算法我们对环境中的餐厅/集会场所、公交地铁火车站、风噪、音乐噪声的特征信息进行匹配优化,第三层则对餐厅场景中的其他人声、器物噪声、音乐声等进一步匹配优化。
优选地,所述第三层的噪声特征值包括以下中的一种或多种:男声噪声特征值、女声噪声特征值、童声噪声特征值、小型汽车噪声特征值、摩托车噪声特征值、大型货运车噪声特征值、轨道交通噪声特征值、砖石堆砌解体噪声特征值、机械敲击噪声特征值、设备噪声噪声特征值、钢琴声特征值、竖琴声特征值、大提琴声特征值、中提琴声特征值、小提琴声特征值、低音提琴声特征值、口琴声特征值、凤凰琴声特征值、电子琴声特征值、木琴声特征值、钢片琴声特征值、颤音琴声特征值、竖琴声特征值、吉他声特征值、电吉他声特征值、贝司声特征值、长笛声特征值、短笛声特征值、木笛声特征值、陶瓷撞击噪声特征值、金属撞击噪声特征值、木制品撞击噪声特征值、玻璃制品撞击噪声特征值、石头撞击噪声特征值、陶瓷摩擦噪声特征值、金属摩擦噪声特征值、木制品摩擦噪声特征值、玻璃制品摩擦噪声特征值、石头摩擦噪声特征值、泡沫制品摩擦噪声特征值。
进一步的,为了确保最优的去噪效果,所述“设置两个以上的降噪层”前,还包括步骤:判断所述数据库是否存在更新,若所述数据库存在更新,则更新数据库。
同时为了避免算法冗余,语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若低于预设阈值,则结束降噪,输出降噪处理后的语音数据。
请参阅图2至图3,为某对讲终端上的前后降噪效果。图2为原始音频,图3为优化后的效果。
需要说明的是,尽管在本文中已经对上述各实施例进行了描述,但并非因此限制本发明的专利保护范围。因此,基于本发明的创新理念,对本文所述实施例进行的变更和修改,或利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接地将以上技术方案运用在其他相关的技术领域,均包括在本发明的专利保护范围之内。

Claims (10)

1.一种双麦克风降噪方法,其特征在于,包括步骤:
设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库;
按所述降噪层层级先后顺序输入语音数据逐层进行处理;
语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值;
所述噪声参数包括:信噪比差值。
2.根据权利要求1所述的一种双麦克风降噪方法,其特征在于,所述“按所述降噪层层级先后顺序输入语音数据逐层进行处理”,还包括步骤:
输入语音数据至所述降噪层的第一层进行预处理,按频率范围对每个语音数据进行切割,分离出不同频率范围的噪声;
所述不同频率范围的噪声包括以下中的一种或多种:低频噪声、中频噪声、高频噪声。
3.根据权利要求2所述的一种双麦克风降噪方法,其特征在于,所述“按所述降噪层层级先后顺序输入语音数据逐层进行处理”,还包括步骤:
输入第一层预处理后的语音数据至下一层,从数据库中获取该层降噪层的降噪算法对应的噪声特征值,根据所述噪声特征值对预处理后的语音数据进行去噪。
4.根据权利要求3所述的一种双麦克风降噪方法,其特征在于,
自所述降噪层第二层起,每下一层的降噪算法对应的噪声特征值均为对上一层的降噪算法对应的噪声特征值的进一步细分。
5.根据权利要求3所述的一种双麦克风降噪方法,其特征在于,
所述“设置两个以上的降噪层”,还包括步骤:设置三个的降噪层;
所述第二层的噪声特征值包括以下中的一种或多种:人声对应的噪声特征值、音乐声对应的噪声特征值、交通工具噪声特征值、建筑噪声特征值、工业噪声特征值、社会生活噪声特征值;
所述“根据所述噪声特征值对预处理后的语音数据进行去噪”,还包括步骤:获得降噪后的音频文件,用所述降噪后的音频文件替换旧音频文件,完成降噪。
6.根据权利要求5所述的一种双麦克风降噪方法,其特征在于,
所述第三层的噪声特征值包括以下中的一种或多种:男声噪声特征值、女声噪声特征值、童声噪声特征值、小型汽车噪声特征值、摩托车噪声特征值、大型货运车噪声特征值、轨道交通噪声特征值、砖石堆砌解体噪声特征值、机械敲击噪声特征值、设备噪声噪声特征值、钢琴声特征值、竖琴声特征值、大提琴声特征值、中提琴声特征值、小提琴声特征值、低音提琴声特征值、口琴声特征值、凤凰琴声特征值、电子琴声特征值、木琴声特征值、钢片琴声特征值、颤音琴声特征值、竖琴声特征值、吉他声特征值、电吉他声特征值、贝司声特征值、长笛声特征值、短笛声特征值、木笛声特征值、陶瓷撞击噪声特征值、金属撞击噪声特征值、木制品撞击噪声特征值、玻璃制品撞击噪声特征值、石头撞击噪声特征值、陶瓷摩擦噪声特征值、金属摩擦噪声特征值、木制品摩擦噪声特征值、玻璃制品摩擦噪声特征值、石头摩擦噪声特征值、泡沫制品摩擦噪声特征值。
7.根据权利要求1至6任一所述的一种双麦克风降噪方法,其特征在于,所述“设置两个以上的降噪层”前,还包括步骤:
判断所述数据库是否存在更新,若所述数据库存在更新,则更新数据库。
8.根据权利要求1所述的一种双麦克风降噪方法,其特征在于,还包括步骤:
语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若低于预设阈值,则结束降噪,输出降噪处理后的语音数据。
9.一种存储设备,其中存储有指令集,其特征在于,所述指令集用于执行:
设置两个以上的降噪层,预先设置所述降噪层每一层的降噪算法,所述降噪算法存储在数据库;
按所述降噪层层级先后顺序输入语音数据逐层进行处理;
语音数据每经过一层降噪层处理后,判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值,若未低于预设阈值,则对上一层降噪处理后的语音数据继续下一层的降噪处理,直至降噪处理后的语音数据的噪声参数低于预设阈值;
所述噪声参数包括:信噪比差值。
10.根据权利要求9所述的一种存储设备,其特征在于,所述指令集还用于执行:
所述“按所述降噪层层级先后顺序输入语音数据逐层进行处理”,还包括步骤:
输入语音数据至所述降噪层的第一层进行预处理,按频率范围对每个语音数据进行切割,分离出不同频率范围的噪声;
所述不同频率范围的噪声包括以下中的一种或多种:低频噪声、中频噪声、高频噪声。
CN202011101947.3A 2020-10-15 2020-10-15 一种双麦克风降噪方法和存储设备 Pending CN112185409A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011101947.3A CN112185409A (zh) 2020-10-15 2020-10-15 一种双麦克风降噪方法和存储设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011101947.3A CN112185409A (zh) 2020-10-15 2020-10-15 一种双麦克风降噪方法和存储设备

Publications (1)

Publication Number Publication Date
CN112185409A true CN112185409A (zh) 2021-01-05

Family

ID=73950358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011101947.3A Pending CN112185409A (zh) 2020-10-15 2020-10-15 一种双麦克风降噪方法和存储设备

Country Status (1)

Country Link
CN (1) CN112185409A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575510A (zh) * 2015-02-04 2015-04-29 深圳酷派技术有限公司 降噪方法、降噪装置和终端
CN104811559A (zh) * 2015-05-05 2015-07-29 上海青橙实业有限公司 降噪方法、通信方法及移动终端
CN108335694A (zh) * 2018-02-01 2018-07-27 北京百度网讯科技有限公司 远场环境噪声处理方法、装置、设备和存储介质
CN109155135A (zh) * 2016-03-24 2019-01-04 诺基亚技术有限公司 用于降噪的方法、装置和计算机程序
CN110049403A (zh) * 2018-01-17 2019-07-23 北京小鸟听听科技有限公司 一种基于场景识别的自适应音频控制装置和方法
CN110085247A (zh) * 2019-05-06 2019-08-02 上海互问信息科技有限公司 一种针对复杂噪声环境的双麦克风降噪方法
CN110197670A (zh) * 2019-06-04 2019-09-03 大众问问(北京)信息科技有限公司 音频降噪方法、装置及电子设备
CN110706698A (zh) * 2019-09-24 2020-01-17 厦门华联电子股份有限公司 一种语音识别控制设备、装置、滤波器装置及方法
CN111710330A (zh) * 2020-07-29 2020-09-25 深圳波洛斯科技有限公司 基于深度神经网络的环境噪声消除方法、装置及存储介质
CN111753432A (zh) * 2020-07-01 2020-10-09 合肥学院 一种城市有轨电车声的降噪方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575510A (zh) * 2015-02-04 2015-04-29 深圳酷派技术有限公司 降噪方法、降噪装置和终端
CN104811559A (zh) * 2015-05-05 2015-07-29 上海青橙实业有限公司 降噪方法、通信方法及移动终端
CN109155135A (zh) * 2016-03-24 2019-01-04 诺基亚技术有限公司 用于降噪的方法、装置和计算机程序
CN110049403A (zh) * 2018-01-17 2019-07-23 北京小鸟听听科技有限公司 一种基于场景识别的自适应音频控制装置和方法
CN108335694A (zh) * 2018-02-01 2018-07-27 北京百度网讯科技有限公司 远场环境噪声处理方法、装置、设备和存储介质
CN110085247A (zh) * 2019-05-06 2019-08-02 上海互问信息科技有限公司 一种针对复杂噪声环境的双麦克风降噪方法
CN110197670A (zh) * 2019-06-04 2019-09-03 大众问问(北京)信息科技有限公司 音频降噪方法、装置及电子设备
CN110706698A (zh) * 2019-09-24 2020-01-17 厦门华联电子股份有限公司 一种语音识别控制设备、装置、滤波器装置及方法
CN111753432A (zh) * 2020-07-01 2020-10-09 合肥学院 一种城市有轨电车声的降噪方法
CN111710330A (zh) * 2020-07-29 2020-09-25 深圳波洛斯科技有限公司 基于深度神经网络的环境噪声消除方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN109065067B (zh) 一种基于神经网络模型的会议终端语音降噪方法
CN109326302B (zh) 一种基于声纹比对和生成对抗网络的语音增强方法
WO2020177371A1 (zh) 一种用于数字助听器的环境自适应神经网络降噪方法、系统及存储介质
JP7109542B2 (ja) 音声ノイズ軽減方法、装置、サーバー及び記憶媒体
EP2151821B1 (en) Noise-reduction processing of speech signals
CN108877823B (zh) 语音增强方法和装置
WO2022160593A1 (zh) 一种语音增强方法、装置、系统及计算机可读存储介质
CN104021798B (zh) 用于通过具有可变频谱增益和可动态调制的硬度的算法对音频信号隔音的方法
KR20050115857A (ko) 안정성 강제하에서 독립 성분 분석을 사용하여 음향을처리하는 시스템 및 방법
JP2003514263A (ja) マッピング・マトリックスを用いた広帯域音声合成
CN103236263A (zh) 一种改善通话质量的方法、系统及移动终端
CN108335702A (zh) 一种基于深度神经网络的音频降噪方法
KR20190096855A (ko) 사운드 처리 방법 및 장치
US20090257609A1 (en) Method for Noise Reduction and Associated Hearing Device
Yuliani et al. Speech enhancement using deep learning methods: A review
CN106878851A (zh) 一种基于通道补偿与语音识别的主动降噪耳机
WO2022027423A1 (zh) 一种融合骨振动传感器和双麦克风信号的深度学习降噪方法及系统
US11647344B2 (en) Hearing device with end-to-end neural network
CN113192535A (zh) 一种语音关键词检索方法、系统和电子装置
CN114067782A (zh) 音频识别方法及其装置、介质和芯片系统
Beritelli et al. A pattern recognition system for environmental sound classification based on MFCCs and neural networks
CN112185405B (zh) 一种基于差分运算和联合字典学习的骨导语音增强方法
CN111225317B (zh) 一种回声消除方法
CN112185409A (zh) 一种双麦克风降噪方法和存储设备
TW201312551A (zh) 語音增強方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination