CN113257268B - 结合频率跟踪和频谱修正的降噪和单频干扰抑制方法 - Google Patents

结合频率跟踪和频谱修正的降噪和单频干扰抑制方法 Download PDF

Info

Publication number
CN113257268B
CN113257268B CN202110748679.2A CN202110748679A CN113257268B CN 113257268 B CN113257268 B CN 113257268B CN 202110748679 A CN202110748679 A CN 202110748679A CN 113257268 B CN113257268 B CN 113257268B
Authority
CN
China
Prior art keywords
frequency
bin
frame
spectrum
frequency point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110748679.2A
Other languages
English (en)
Other versions
CN113257268A (zh
Inventor
胡岸
刘文通
高君效
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chipintelli Technology Co Ltd
Original Assignee
Chipintelli Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chipintelli Technology Co Ltd filed Critical Chipintelli Technology Co Ltd
Priority to CN202110748679.2A priority Critical patent/CN113257268B/zh
Publication of CN113257268A publication Critical patent/CN113257268A/zh
Application granted granted Critical
Publication of CN113257268B publication Critical patent/CN113257268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Abstract

结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,包括以下步骤:S1.对输入的带噪语音进行逐帧处理后得到频谱;S2.设置固定窗,逐帧计算每一个频点的噪声功率谱,并求得该帧每一频点语音概率;S3.根据S2得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;S4.根据单频干扰中心频点跟踪算法找出单频干扰中心频点;S5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;S6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。本发明通过频率跟踪,确定单频干扰最大的频点,通过频谱修正来抑制单频干扰,从而实现在降噪的同时实现单频干扰抑制。

Description

结合频率跟踪和频谱修正的降噪和单频干扰抑制方法
技术领域
本发明属于人工智能技术领域,涉及语音识别,具体涉及一种结合频率跟踪和频谱修正的降噪和单频干扰抑制方法。
背景技术
语音通话场景的需求日益增加,不同的应用场景往往都是伴随着噪声的,在某些会议场景下,还会由于硬件限制、硬件故障等出现单频干扰并严重影响听觉感受。这些语音听觉场景需要对语音的背景噪声有一个较为舒适的滤除,并对单频干扰的抑制有一定需求。因此需要一种方法,其一能对背景噪声进行滤除并提升听觉体验,其二能够通过软件手段对单频干扰进行检测并滤除。
发明内容
为克服现有技术存在的缺陷,本发明公开了一种结合频率跟踪和频谱修正的降噪和单频干扰抑制方法。
本发明所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,包括以下步骤:
S1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;
S2.设置固定窗,对窗内逐帧计算每一个频点的噪声功率谱,并求得该帧每一个频点的语音概率;
S3.根据S2 得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;
S4.根据单频干扰中心频点跟踪算法找出带噪功率谱最强的若干个频点作为单频干扰中心频点;
S5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;
S6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。
优选的:所述步骤S2中,噪声功率谱更新方式如下:
S21.以第一帧的每个频点的频谱幅度| Y(k,l)|2作为噪声功率谱的初
始值;
S22.从第二帧开始到固定窗尾,把该帧每个频点的频谱幅度
| Y(k,l)|2与该帧的最小功率谱值PSDmin(k,l)的比值和第一阈值比较;
若比值大于第一阈值TH1则判断为语音,根据(1)式更新语音概率;
p(k,l)=1+α1*(1-p(k,l-1)) ----(1)
若比值不大于第一阈值TH1;根据(2)式更新语音概率;
p(k,l)= α1*p(k,l-1) ----(2);
p(k,l)是第l帧第k个频点的语音概率;
p(k,l-1)是第l-1帧第k个频点的语音概率;
α1为语音概率更新系数;
S23.通过(3)式计算噪声功率谱值;
噪声功率谱值λ(k,l)=α3*λ(k,l-1)+(1-α3)* | Y(k,l)|2----(3)
其中,α3 = α2 + (1-α2)*p(k,l)
α2为噪声平滑系数的平滑系数;
α3为噪声平滑系数;
优选的:所述步骤S3具体为:
S31.根据公式(4)更新后验信噪比:
后验信噪比post_snr(k,l)= α4* | Y(k,l)|2/λ(k,l)----(4)
α4为后验信噪比衰减系数;
S32.根据公式(5)更新先验信噪比:
先验信噪比
pri_snr(k,l)= α5* pri_snr(k,l-1)+(1-α5) *post_snr(k,l)--- (5)。
α5为先验信噪比平滑系数;
pri_snr(k,l) 和pri_snr(k,l-1)分别表示第l帧和第(l-1)帧第k个频点的先验信噪比;
S33.再根据公式(6)求出初步最优幅度谱增益估计gain1(k,l):
gain1(k,l)=pri_snr(k,l)/[1+pri_snr(k,l)] ----(6)
S34.再根据公式(7)求出最终最优幅度谱增益估计gain2(k,l):
gain2(k,l)=p(k,l)*gain1(k,l)+(1-p(k,l))*gain_min ----(7)
p(k,l)是第l帧第k个频点的语音概率;gain_min是增益最小限定值。
优选的:所述步骤S4中单频干扰中心频点跟踪的方法如下:
S41.将步骤S1得到的频谱划分为若干个频带,对每一频带,重复以下步骤S42-S44,得到各个频带的单频干扰中心频点binm,下标m表示不同频带;
划分频带宽度和边界的依据为:根据可能出现的单频干扰中心频点位置,使划分的每一频带尽可能只出现一个单频干扰中心频点;
对每一频带,重复以下步骤S42-S44进行最大单频干扰中心频点跟踪:
S42.找出该频带内的最大带噪功率谱值的最大频点max_index及其带噪功率谱值psd_max;带噪功率谱最大值计数器数组用max_cal表示;
所述带噪功率谱最大值计数器数组max_cal中包括多个带噪功率谱计数器,每一带噪功率谱计数器对应一个频点,且带噪功率谱计数器初始值均为0;
设置频率跟踪标志位detect_flag,定义当找到单频干扰中心频点时该值为1,未找到则为零。
S43.如当前频率跟踪标志位detect_flag为0,对当前频带的最大带噪功率谱值所在的最大值频点max_index进行逐帧统计,设置帧计数器count初始值为零;
帧计数器count逐帧加1,在帧计数器count小于统计长度LENGTH 且当前帧的带噪功率谱值psd_max与当前最小噪声功率谱值λmin比值大于第二阈值TH2时,对各帧的每一最大值频点,设定该最大值频点对应的带噪功率谱计数器 max_cal(max_index)值加1,当count值等于统计长度LENGTH时,统计各个带噪功率谱计数器中max_cal(max_index)中的最大值;
如最大值大于次数门限COUNT_TH,则将该频点置为单频干扰中心频点binm, 并将频率跟踪标志位detect_flag置为1;
S44.如当前频率跟踪标志位detect_flag为1,判断当前得到的该频带的功率谱值最大的最大值频点是否和已找到的单频干扰中心频点binm相同;
如果相同则不作处理;如果不同,则对最大值频点对应的带噪功率谱计数器max_cal(max_index)值减1,直到当max_cal(max_index)=0时,将频率跟踪标志位detect_flag重新置为0,开始重新跟踪单频干扰中心频点;
重复以上步骤S42-S44,得到各个频带的单频干扰中心频点记为binm,下标m表示不同频带。
优选的:所述步骤S5具体为:
对单频干扰中心频点及其邻近频点进行以下操作:
S51.对正频率频点部分的修正量如下
compensate(binm,l)= α6*λ(binm,l)----(8)
λ(binm,l)表示第l帧,频点为binm的噪声功率谱值
对负频率频点处的修正量计算如下:
compensate(FFTSize-binm,l)= -α6*λ(binm,l)----(9)
其中FFTSize为傅里叶变换长度,α6为频谱修正系数;
对于正频率频点,修正后频谱
YC(binm,l)= Y(binm,l)+ compensate(binm,l)
Y(binm,l)表示修正前的第l帧,频点为binm的频谱;
对于负频率频点,修正后频谱
YC(FFTSize-binm,l)= Y(FFTSize-binm,l)+ compensate(FFTSize-binm,l)
S52.修正后频点的新相位new_phase(binm,l)计算方式采用修正后的频谱计算如下:
new_phase(binm,l)=YC(binm,l)/| YC(binm,l)|
S53.降噪幅度谱根据(10)式求得:
|fft_out(binm,l)|=|YC(binm,l)|*gain2(binm,l) ----(10)
gain2(binm,l)为第l帧,频点为binm的最终最优幅度谱增益估计;
将(10)式中得到的降噪幅度谱乘之前得到的新相位new_phase(binm,l):得到输出频谱:
fft_out(binm,l)=| fft_out(binm,l)|*new_phase(binm,l) ----(11)
本发明利用固定窗背景噪声估计,结合维纳滤波对噪声进行降噪的同时,在各个频带进行单频干扰检测,并通过估计的噪声功率谱来对相位带噪语音的相位进行修正得出新相位,从而在降噪的同时实现了指定频点的单频干扰抑制。
附图说明
图1是本发明所述降噪和单频干扰抑制方法的一个具体实施方式流程示意图;
图2是根据本发明实施方式得到的一个实际场景处理效果。
具体实施方式
下面对本发明的具体实施方式作进一步的详细说明。
本发明所述的结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,包括以下步骤:
S1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;
S2.设置固定窗,对窗内逐帧计算每一个频点的噪声功率谱,并求得该帧每一个频点的语音概率;
S3.根据S2 得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;
S4.根据单频干扰中心频点跟踪算法找出带噪功率谱最强的若干个频点作为单频干扰中心频点;
S5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;
S6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。
如图1所示为本发明一个具体实施方式的整体流程示意图,步骤S1中,对输入的带噪语音y进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱值Y(k,l);
其频谱幅度为| Y(k,l)|2。其中k代表的是频点,l代表的是帧数。
步骤S2具体为,
S21.以第一帧的每个频点的频谱幅度| Y(k,l)|2作为噪声功率谱的初始值;
S22.从第二帧开始到固定窗尾,把该帧每个频点的频谱幅度
| Y(k,l)|2与该帧的最小功率谱值PSDmin(k,l)的比值和门限值比较;
若比值大于第一阈值TH1则判断为语音,再根据
p(k,l)=1+α1*(1-p(k,l-1)) ----(1)
更新语音概率;p(k,l)是第l帧第k个频点的语音概率,p(k,l)初始值为0,并进行逐帧更新。
若比值不大于第一阈值TH1;
则按照p(k,l)= α1*pl(k,l-1) ----(2)进行更新,
α1为语音概率更新系数;
S23.最终通过如下公式计算噪声功率谱值;
噪声功率谱值λ(k,l)=α3*λ(k,l-1)+(1-α3)* | Y(k,l)|2----(3)
α3 = α2 + (1-α2)*p(k,l)
α2为噪声平滑系数的平滑系数;
α3为噪声平滑系数;
更新噪声功率谱值λ(k,l);本具体实施方式中把第一阈值TH1设置为5,α1设置为0.95,α2设置为0.96。
以下给出步骤S3中先验信噪比的平滑以及最优估计的一个具体流程:
S31.根据公式(4)更新后验信噪比:
后验信噪比post_snr(k,l)= α4* | Y(k,l)|2/λ(k,l)----(4)
α4为后验信噪比衰减系数;
S32.并根据公式(5)更新先验信噪比:
先验信噪比pri_snr(k,l)= α5* pri_snr(k,l-1)+(1-α5) *post_snr(k,l)----(5)。
α5为先验信噪比平滑系数;
本具体实施中的α4为0.8,α5为0.65,上述参数值均为经验值,实际应用中可根据需求调整。
S33.再根据公式(6)求出初步最优幅度谱增益估计
gain1(k,l)=pri_snr(k,l)/[1+pri_snr(k,l)] ----(6)
S34. 根据公式(7)求得最终最优幅度谱增益估计:
gain2(k,l)=p(k,l)*gain1(k,l)+(1-p(k,l))*gain_min ----(7)
p(k,l)是第l帧第k个频点的语音概率;gain_min是增益最小限定值,为一个设定常数,例如可以设置为0.15。
以下给出步骤S4中单频干扰中心频点跟踪算法的一个具体流程:
S41.将频谱划分为若干个频带,例如将0-8000Hz的频谱划分为0-2000Hz/2000-4000Hz/4000-8000Hz三个频带,分别对应频点1-64,65-128,129-256。
频带的边界和宽度根据可能出现的单频干扰中心频点设定,使每一频带尽可能只出现一个单频干扰中心频点,从而满足后续跟踪过程中的算法环境。
例如0-8000Hz的频谱范围内,可能出现的单频干扰中心频点为500 Hz,2500 Hz,5000Hz,则可以划分为0-2000Hz/2000-4000Hz/4000-8000Hz三个频带;使每一频带包括一个可能的单频干扰中心频点。
对每一频带,重复以下步骤S42-S44进行最大单频干扰中心频点跟踪:
S42.找出该频带内的最大带噪功率谱值的最大频点max_index及其带噪功率谱值psd_max;带噪功率谱最大值计数器数组用一计数器数组max_cal来表示。
带噪功率谱最大值计数器数组max_cal中包括多个带噪功率谱计数器,每一带噪功率谱计数器对应一个频点,例如对256个频点组成的三个频带, max_cal包括256个带噪功率谱计数器,且带噪功率谱计数器初始值都为0。
设置频率跟踪标志位detect_flag,定义当找到单频干扰中心频点时该值为1,未找到则为零。
S43.如当前频率跟踪标志位detect_flag为0,对当前频带的最大带噪功率谱值所在的最大值频点max_index进行逐帧统计,设置帧计数器count初始值为零;
帧计数器count逐帧加1,在帧计数器count小于统计长度LENGTH 且当前帧的带噪功率谱值psd_max与当前最小噪声功率谱值λmin比值大于第二阈值TH2时,对各帧的每一最大值频点,设定该最大值频点对应的带噪功率谱计数器 max_cal(max_index)值加1。本实施例中的第二阈值TH2可设置为3.5;统计长度LENGTH为设定的参数值,例如可以设置为20;最小噪声功率谱值λmin为步骤2中求得的噪声功率谱最小值。
当count值等于统计长度LENGTH时,统计各个带噪功率谱计数器中max_cal(max_index)中的最大值;
如最大值大于次数门限COUNT_TH,则将该频点置为单频干扰中心频点binm, 并将频率跟踪标志位detect_flag置为1。
例如在4000-8000Hz频带中,该频带对应max_cal计数器数组中的第129-256位计数器,统计长度LENGTH=20帧,逐帧统计各帧的每一最大值频点max_index,达到统计长度LENGTH后,带噪功率谱计数器max_cal[150]值为15,max_cal[200]为3,max_cal[220]为2。即第150频点是 max_cal(max_index)中的最大值,第150个频点就是4000-8000Hz频带内的单频干扰中心频点。
由于单频干扰所在的中心频点的功率谱值极强且几乎连续在同一频点附近出现,因此以单频点内带噪功率谱计数器max_cal(K)中的最大值对应的频点作为单频干扰中心频点 binm,且要求该最大值大于次数门限COUNT_TH, COUNT_TH一般设置为5左右。
无单频干扰出现时, 功率分布比较分散,不会像单频干扰那样集中在单频干扰中心频点,无单频干扰情况下,每一帧的最大带噪功率谱所在频点不固定,即每一帧的max_index频点大概率不同。
同时设置第二阈值TH2和次数门限COUNT_TH的目的是滤除部分能量不大的频点,没有单频干扰的情况下, 每一帧的max_index频点都可能不同,即使偶然接近或相同的,也很难同时满足第二阈值TH2和次数门限COUNT_TH两个条件。这样在没有单频干扰的情况下,不会误定义出单频干扰中心频点。
找到单频干扰中心频点后,标记detect_flag为1。
S44.如当前频率跟踪标志位detect_flag为1,即已经有一个单频干扰中心频点binm,则需要判断当前得到的该频带的功率谱值最大的最大值频点是否和binm相同。
如果相同则表示单频干扰中心频点未变化,则不作处理;如果不同,则对最大值频点对应的带噪功率谱计数器max_cal(max_index)值减1,直到当max_cal(max_index)=0时,此时将频率跟踪标志位detect_flag重新置为0,既开始重新跟踪单频干扰中心频点。
上述S44步骤的意义在于:detect_flag=1标志着已在S43步骤中找到单频干扰中心频点 bin,此时只需要对比当前帧的功率谱最大值所在的频点max_index是不是S43步骤中找到的单频干扰中心频点 bin,如果相同表示还处于单频干扰中心频点的区间;如果不同则对max_cal(K)减1,直到减为0,即退出找到单频干扰中心频点的状态,detect_flag重新回归为零;表示当前没有单频干扰。
在单频干扰频点附近,可能出现个别不是最大值的频点,因此不适宜在偶然未达到最大值时将detect_flag重新迅速回归为零,但是在没有单频干扰的情况下,特别是由于频带划分使每一频带通常只出现一个单频干扰频点的情况下,极不可能出现连续密集分布的多个最大值,在没有单频干扰的情况下功率分布趋于分散,不会出现单频干扰或类似情况,即不会出现连续多个功率谱最大值, max_cal(max_index)持续降低,减到0后再将detect_flag置零。
重复以上步骤,得到各个频带的单频干扰中心频点记为binm,下标m表示不同频带。
根据前面步骤S2求得的噪声功率谱值λ(k,l),对各个单频干扰中心频点的频谱进行修正,以下给出通过频谱修正来实现单频干扰抑制的一个具体流程:
在步骤S5中,考虑到频谱泄露,需要对单频干扰中心频点及其临近若干个频点的频谱按照如下方式进行修正并重新计算相位,α5为修正系数。
S51.对正频率频点部分的修正量如下
compensate(binm,l)= α6*λ(binm,l)----(8)
对负频率频点处的修正量计算如下:
compensate(FFTSize-binm,l)= -α6*λ(binm,l)----(9)
其中FFTSize为傅里叶变换长度,例如可以设置为512。
本具体实施例中的α5可设置为0.05,上述参数值均为经验值,实际应用中可根据需求调整。
具体的频点修正公式:
对于正频率频点,修正后频谱
YC(binm,l)= Y(binm,l)+ compensate(binm,l)
对于负频率频点,修正后频谱
YC(FFTSize-binm,l)= Y(FFTSize-binm,l)+ compensate(FFTSize-binm,l)
S52.修正后频点的新相位用new_phase(binm,l)表示,其计算方式采用修正后的频谱计算如下:
new_phase(binm,l)=YC(binm,l)/| YC(binm,l)|
S53.降噪幅度谱根据如下式可求得:
|fft_out(binm,l)|=|Y(binm,l)|*gain2(binm,l) ----(10)
将(10)式中得到的降噪幅度谱乘之前得到的新相位new_phase(binm,l):得到输出频谱:
fft_out(binm,l)=| fft_out(binm,l)|*new_phase(binm,l) ----(11)
输出频谱消除了单频干扰,实现降噪降单频干扰一体化。
最终得到输出频谱fft_out(binm,l),进行合窗并进行反傅里叶变换输出相位更新后的频谱。
本发明通过噪声估计求得最优估计,以及对语音单频干扰中心频点的频谱进行修正后,得出新的相位取代原始带噪语音的相位,更新后的频谱在实现降噪的同时实现单频干扰抑制,具体效果如图2,图2为一张语谱图,上半部分是原始录制语音,下半部分是降噪加降单频干扰后的语音,箭头所指的地方为单频干扰,从图2中可以看出图2下半部分的单频干扰几乎被完全消除,且语谱图中的背景噪声已经被抑制。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (4)

1.结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于,包括以下步骤:
S1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;
S2.设置固定窗,对窗内逐帧计算每一个频点的噪声功率谱,并求得该帧每一个频点的语音概率;
S3.根据S2 得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;
S4.根据单频干扰中心频点跟踪算法找出带噪功率谱最强的若干个频点作为单频干扰中心频点;
步骤S4中单频干扰中心频点跟踪的方法如下:
S41.将步骤S1得到的频谱划分为若干个频带,对每一频带,重复以下步骤S42-S44,得到各个频带的单频干扰中心频点binm,下标m表示不同频带;
划分频带宽度和边界的依据为:根据可能出现的单频干扰中心频点位置,使划分的每一频带尽可能只出现一个单频干扰中心频点;
对每一频带,重复以下步骤S42-S44进行最大单频干扰中心频点跟踪:
S42.找出该频带内的最大带噪功率谱值的最大频点max_index及其带噪功率谱值psd_max;带噪功率谱最大值计数器数组用max_cal表示;
所述带噪功率谱最大值计数器数组max_cal中包括多个带噪功率谱计数器,每一带噪功率谱计数器对应一个频点,且带噪功率谱计数器初始值均为0;
设置频率跟踪标志位detect_flag,定义当找到单频干扰中心频点时该值为1,未找到则为零;
S43.如当前频率跟踪标志位detect_flag为0,对当前频带的最大带噪功率谱值所在的最大值频点max_index进行逐帧统计,设置帧计数器count初始值为零;
帧计数器count逐帧加1,在帧计数器count小于统计长度LENGTH 且当前帧的带噪功率谱值psd_max与当前最小噪声功率谱值λmin比值大于第二阈值TH2时,对各帧的每一最大值频点,设定该最大值频点对应的带噪功率谱计数器 max_cal(max_index)值加1,当count值等于统计长度LENGTH时,统计各个带噪功率谱计数器中max_cal(max_index)中的最大值;
如最大值大于次数门限COUNT_TH,则将该频点置为单频干扰中心频点binm, 并将频率跟踪标志位detect_flag置为1;
S44.如当前频率跟踪标志位detect_flag为1,判断当前得到的该频带的功率谱值最大的最大值频点是否和已找到的单频干扰中心频点binm相同;
如果相同则不作处理;如果不同,则对最大值频点对应的带噪功率谱计数器max_cal(max_index)值减1,直到当max_cal(max_index)=0时,将频率跟踪标志位detect_flag重新置为0,开始重新跟踪单频干扰中心频点;
重复以上步骤S42-S44,得到各个频带的单频干扰中心频点记为binm,下标m表示不同频带
S5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;
S6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。
2.根据权利要求1所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于:所述步骤S2中,噪声功率谱更新方式如下:
S21.以第一帧的每个频点的频谱幅度| Y(k,l)|2作为噪声功率谱的初
始值;
S22.从第二帧开始到固定窗尾,把该帧每个频点的频谱幅度
| Y(k,l)|2与该帧的最小功率谱值PSDmin(k,l)的比值和第一阈值比较;
若比值大于第一阈值TH1则判断为语音,根据(1)式更新语音概率;
p(k,l)=1+α1*(1-p(k,l-1)) ----(1)
若比值不大于第一阈值TH1;根据(2)式更新语音概率;
p(k,l)= α1*p(k,l-1) ----(2);
p(k,l)是第l帧第k个频点的语音概率;
p(k,l-1)是第l-1帧第k个频点的语音概率;
α1为语音概率更新系数;
S23.通过(3)式计算噪声功率谱值;
噪声功率谱值λ(k,l)=α3*λ(k,l-1)+(1-α3)* | Y(k,l)|2----(3)
其中,α3 = α2 + (1-α2)*p(k,l)
α2为噪声平滑系数的平滑系数;
α3为噪声平滑系数。
3.根据权利要求2所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于:所述步骤S3具体为:
S31.根据公式(4)更新后验信噪比:
后验信噪比post_snr(k,l)= α4* | Y(k,l)|2/λ(k,l)----(4)
α4为后验信噪比衰减系数;
S32.根据公式(5)更新先验信噪比:
先验信噪比
pri_snr(k,l)= α5* pri_snr(k,l-1)+(1-α5) *post_snr(k,l)--- (5);
α5为先验信噪比平滑系数;
pri_snr(k,l) 和pri_snr(k,l-1)分别表示第l帧和第(l-1)帧第k个频点的先验信噪比;
S33.再根据公式(6)求出初步最优幅度谱增益估计gain1(k,l):
gain1(k,l)=pri_snr(k,l)/[1+pri_snr(k,l)] ----(6)
S34.再根据公式(7)求出最终最优幅度谱增益估计gain2(k,l):
gain2(k,l)=p(k,l)*gain1(k,l)+(1-p(k,l))*gain_min ----(7)
p(k,l)是第l帧第k个频点的语音概率;gain_min是增益最小限定值。
4.根据权利要求1所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于:所述步骤S5具体为:
对单频干扰中心频点及其邻近频点进行以下操作:
S51.对正频率频点部分的修正量如下
compensate(binm,l)= α6*λ(binm,l)----(8)
λ(binm,l)表示第l帧,频点为binm的噪声功率谱值
对负频率频点处的修正量计算如下:
compensate(FFTSize-binm,l)= -α6*λ(binm,l)----(9)
其中FFTSize为傅里叶变换长度,α6为频谱修正系数;
对于正频率频点,修正后频谱
YC(binm,l)= Y(binm,l)+ compensate(binm,l)
Y(binm,l)表示修正前的第l帧,频点为binm的频谱;
对于负频率频点,修正后频谱
YC(FFTSize-binm,l)= Y(FFTSize-binm,l)+ compensate(FFTSize-binm,l)
S52.修正后频点的新相位new_phase(binm,l)计算方式采用修正后的频谱计算如下:
new_phase(binm,l)=YC(binm,l)/| YC(binm,l)|
S53.降噪幅度谱根据(10)式求得:
|fft_out(binm,l)|=|YC(binm,l)|*gain2(binm,l) ----(10)
gain2(binm,l)为第l帧,频点为binm的最终最优幅度谱增益估计;
将(10)式中得到的降噪幅度谱乘之前得到的新相位new_phase(binm,l):得到输出频谱:
fft_out(binm,l)=| fft_out(binm,l)|*new_phase(binm,l) ----(11)。
CN202110748679.2A 2021-07-02 2021-07-02 结合频率跟踪和频谱修正的降噪和单频干扰抑制方法 Active CN113257268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110748679.2A CN113257268B (zh) 2021-07-02 2021-07-02 结合频率跟踪和频谱修正的降噪和单频干扰抑制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110748679.2A CN113257268B (zh) 2021-07-02 2021-07-02 结合频率跟踪和频谱修正的降噪和单频干扰抑制方法

Publications (2)

Publication Number Publication Date
CN113257268A CN113257268A (zh) 2021-08-13
CN113257268B true CN113257268B (zh) 2021-09-17

Family

ID=77190417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110748679.2A Active CN113257268B (zh) 2021-07-02 2021-07-02 结合频率跟踪和频谱修正的降噪和单频干扰抑制方法

Country Status (1)

Country Link
CN (1) CN113257268B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113613112B (zh) * 2021-09-23 2024-03-29 三星半导体(中国)研究开发有限公司 抑制麦克风的风噪的方法和电子装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751925A (zh) * 2008-12-10 2010-06-23 华为技术有限公司 一种语音解码方法及装置
CN102473417A (zh) * 2010-06-09 2012-05-23 松下电器产业株式会社 频带扩展方法、频带扩展装置、程序、集成电路及音频解码装置
CN103456310A (zh) * 2013-08-28 2013-12-18 大连理工大学 一种基于谱估计的瞬态噪声抑制方法
CN106908840A (zh) * 2017-05-09 2017-06-30 吉林大学 基于主成分分析的地震资料工频干扰自动识别与压制方法
CN108390678A (zh) * 2018-01-23 2018-08-10 北京睿信丰科技有限公司 一种基于两级自适应门限判决的频域去干扰方法及装置
WO2020089523A1 (en) * 2018-11-01 2020-05-07 Nokia Technologies Oy Apparatus, methods and computer programs for encoding spatial metadata
CN111128215A (zh) * 2019-12-24 2020-05-08 声耕智能科技(西安)研究院有限公司 一种单通道实时降噪方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6637926B2 (ja) * 2017-06-05 2020-01-29 キヤノン株式会社 音声処理装置及びその制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751925A (zh) * 2008-12-10 2010-06-23 华为技术有限公司 一种语音解码方法及装置
CN102473417A (zh) * 2010-06-09 2012-05-23 松下电器产业株式会社 频带扩展方法、频带扩展装置、程序、集成电路及音频解码装置
CN103456310A (zh) * 2013-08-28 2013-12-18 大连理工大学 一种基于谱估计的瞬态噪声抑制方法
CN106908840A (zh) * 2017-05-09 2017-06-30 吉林大学 基于主成分分析的地震资料工频干扰自动识别与压制方法
CN108390678A (zh) * 2018-01-23 2018-08-10 北京睿信丰科技有限公司 一种基于两级自适应门限判决的频域去干扰方法及装置
WO2020089523A1 (en) * 2018-11-01 2020-05-07 Nokia Technologies Oy Apparatus, methods and computer programs for encoding spatial metadata
CN111128215A (zh) * 2019-12-24 2020-05-08 声耕智能科技(西安)研究院有限公司 一种单通道实时降噪方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Doppler correction of wave frequency Spectra measured by underway vessels";C.O.Collins;《AMS》;20170201;全文 *
"基于DSP的轨道移频信号频率检测设备的设计";马纳吉;《中国优秀硕士学位论文全文数据库 信息科技辑》;20131015;全文 *
"基于双递归自适应滤波的高精度频率估计算法";梁国龙;《哈尔滨工程大学学报》;20130224;第34卷(第2期);全文 *

Also Published As

Publication number Publication date
CN113257268A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
CN103871421B (zh) 一种基于子带噪声分析的自适应降噪方法与系统
US8983833B2 (en) Method and apparatus for masking wind noise
US10614788B2 (en) Two channel headset-based own voice enhancement
Lin et al. Adaptive noise estimation algorithm for speech enhancement
US7158932B1 (en) Noise suppression apparatus
KR100860805B1 (ko) 음성 강화 시스템
US8396234B2 (en) Method for reducing noise in an input signal of a hearing device as well as a hearing device
KR100414841B1 (ko) 잡음저감방법및장치
CN101901602B (zh) 一种利用受损听力的听阈进行降噪的方法
KR950034057A (ko) 음성 신호의 잡음 저감 방법 및 잡음 구간 검출 방법
US9443533B2 (en) Measuring and improving speech intelligibility in an enclosure
CN104919525B (zh) 用于评估退化语音信号的可理解性的方法和装置
EP3074975A1 (en) Method of operating a hearing aid system and a hearing aid system
CN104867499A (zh) 一种用于助听器的分频段维纳滤波去噪方法和系统
CN112242147A (zh) 一种语音增益控制方法及计算机存储介质
CN113257268B (zh) 结合频率跟踪和频谱修正的降噪和单频干扰抑制方法
US9495973B2 (en) Speech recognition apparatus and speech recognition method
JP2004341339A (ja) 雑音抑圧装置
CN107045874B (zh) 一种基于相关性的非线性语音增强方法
CN117321681A (zh) 嘈杂环境中的语音优化
US7646912B2 (en) Method and device for ascertaining feature vectors from a signal
KR20050053139A (ko) 피크 및 딥 성분을 이용한 음장 보정 방법 및 그 장치
US20190348060A1 (en) Apparatus and method for enhancing a wanted component in a signal
WO2022150286A1 (en) Determining dialog quality metrics of a mixed audio signal
CN117351986A (zh) 一种噪声抑制方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant