CN112652322A - 一种语音信号增强方法 - Google Patents

一种语音信号增强方法 Download PDF

Info

Publication number
CN112652322A
CN112652322A CN202011538743.6A CN202011538743A CN112652322A CN 112652322 A CN112652322 A CN 112652322A CN 202011538743 A CN202011538743 A CN 202011538743A CN 112652322 A CN112652322 A CN 112652322A
Authority
CN
China
Prior art keywords
noise
signal
voice
speech
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011538743.6A
Other languages
English (en)
Inventor
王昂
肖宛昂
兰玉燕
周维新
马万康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Jicui Intelligent Integrated Circuit Design Technology Research Institute Co ltd
Original Assignee
Jiangsu Jicui Intelligent Integrated Circuit Design Technology Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Jicui Intelligent Integrated Circuit Design Technology Research Institute Co ltd filed Critical Jiangsu Jicui Intelligent Integrated Circuit Design Technology Research Institute Co ltd
Priority to CN202011538743.6A priority Critical patent/CN112652322A/zh
Publication of CN112652322A publication Critical patent/CN112652322A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本发明公开了一种语音信号增强方法,其可提高语音存在性判断的准确性,从而提高估计噪声的准确性,同时可有效消除语音信号中的音乐噪声,该方法包括:采集带噪语音信号,带噪语音信号包括的噪声为加性噪声,采用加权叠接相加滤波器组将时域信号转换为频域信号,采用本发明提出的噪声估计算法对加性噪声信号的功率谱估计值进行更新,采用多子带谱减算法对带噪语音进行功率谱的谱减,得到纯净语音的功率谱估计值,利用带噪语音的相位和纯净语音的幅度谱的估计值,还原纯净语音的频域信号,采用加权叠接相加滤波器组将频域信号重新转换为时域信号,得到语音增强后的纯净语音。

Description

一种语音信号增强方法
技术领域
本发明涉及语音信号处理技术领域,具体为一种语音信号增强方法。
背景技术
在语音系统中,噪声往往是最让人讨厌的,因此,语音增强是语音处理系统中最关键的技术之一。语音增强由噪声估计和噪声消除两部分组成。
传统噪声估计是基于语音存在性的噪声估计,该方法只在无语音段进行噪声估计,仅对平稳噪声有较好的效果,对于非平稳噪声无法实现准确跟踪噪声。基于此,S.Rangachari提出了一个运算量较小,比较适合硬件实现的噪声估计方法,最小值控制的递归平均算法(Minima-Controlled Recursive Averaging, MCRA-2),该方法首先利用最小值跟踪方法实时跟踪噪声,得到一个估计噪声,再利用这个估计噪声判断语音存在概率,基于这个概率计算一个平滑因子,用于时间迭代平均算法,得到新的估计噪声,作为最终的噪声估计。该方法虽然可以跟踪非平稳噪声,但是因为语音存在性判断是根据经验设置的固定的信噪比阈值来判断,在不同背景噪声信噪比下,语音存在性判断准确性会存在差异。
传统的噪声消除方法包括谱减法,由于对噪声估计过大,导致语音的过减出现负值,经过半波整流后,通常会引入类似水流声的音乐噪声。这种音乐噪声产生主要在于频谱相邻帧剧烈变化而导致某些帧噪声估计过大,对此 Latchman Singh提出多子带谱减,该方法将频谱按频段划分为子带,因为频段相邻帧的变化要比频点相邻帧的变化要平缓,从而降低了音乐噪声。但由于传统实时语音系统一般采用短时傅里叶变换(Short-TimeFourier Transform,STFT) 进行时域-频域转换,帧长大约20~30ms,在这个帧长下,各频段相邻帧的变化还是可能会出现一定程度的剧烈变化,在某些情况下仍会出现音乐噪声。
发明内容
针对现有技术中存在的现有语音噪声消除方法对语音存在性的判断准确性较差,影响语音噪声估计准确性,产生的音乐噪声不易消除的问题,本发明提供了一种语音信号增强方法,其可提高语音存在性判断的准确性,从而提高估计噪声的准确性,同时可有效消除语音信号中的音乐噪声。
为实现上述目的,本发明采用如下技术方案:
一种语音信号增强方法,其特征在于,该方法包括:
步骤a:采集带噪语音信号y(n),所述带噪语音信号为时域信号,其中,所述带噪语音信号包括的噪声为加性噪声d(n),纯净语音为x(n),n为离散时间。
步骤b:采用加权叠接相加滤波器组将时域信号转换为频域信号:Y(k)= D(k)+X(k);
步骤c:采用噪声估计算法对所述加性噪声信号的功率谱估计值
Figure BDA0002854317940000021
进行更新;
步骤d:采用多子带谱减算法对带噪语音进行功率谱的谱减,得到所述纯净语音的功率谱估计值
Figure BDA0002854317940000022
步骤e:利用所述带噪语音的相位和所述纯净语音的幅度谱的估计值,还原所述纯净语音的频域信号
Figure BDA0002854317940000023
步骤f:采用加权叠接相加滤波器组将频域信号
Figure BDA0002854317940000024
重新转换为时域信号,得到语音增强后的纯净语音的估计信号
Figure BDA0002854317940000025
其进一步特征在于,步骤c中所述噪声估计算法包括:
c1:对所述带噪语音信号的带噪语音功率谱进行平滑,得到平滑后的带噪信号的功率谱P(λ,k),λ为离散时间,k为频域子带;
c2:采用非线性平滑方法跟踪平滑后的所述带噪信号的能量谱最小值,得到最小值跟踪能量谱Pmin(λ,k);
c3:计算所述带噪语音功率谱与所述最小值跟踪能量谱的比值Sr(λ,k);
c4:对所述比值进行平滑,作为判断所述语音存在性的阈值Sth(λ,k);
c5:对比c3中所述比值和c4中所述阈值,得到语音存在性信号V(λ,k);
c6:对所述语音存在性信号进行平滑,获取Vs(λ,k),防止存在性在0和1 之间突变,导致噪声估计值出现突变,从而引入新的噪声;
c7:采用平滑后的所述语音存在性信号对所述平滑因子α(λ,k)进行实时更新;
c8:采用时间迭代方式计算得到噪声功率谱估计值
Figure BDA0002854317940000031
步骤d:利用多子带谱减算法对带噪语音进行功率谱的谱减,得到纯净语音的功率谱估计值
Figure BDA0002854317940000032
包括:d1,对各子带进行通道组合,并对各子带的带噪语音幅度谱Yi(k)做平滑:
Figure BDA0002854317940000033
其中k代表子带,i代表当前子带 k所处的通道;
d2,在所述带噪语音信号功率谱上对各子带进行谱减,对于噪声估计过大,导致过减的情况,执行半波整流,整流公式如下:
Figure BDA0002854317940000034
其中,β为谱下限参数,αi和δi分别为各子带的过减因子和减法因子,αi和δi的计算公式如下:
Figure BDA0002854317940000041
Figure BDA0002854317940000042
其中,SNRi为通道i的信噪比,fi为通道i的中心频率,Fs为采样率。
步骤e:利用所述带噪语音信号y(n)的相位
Figure BDA0002854317940000043
和所述纯净语音的幅度谱的估计值
Figure BDA0002854317940000044
还原所述纯净语音的频域信号
Figure BDA0002854317940000045
Figure BDA0002854317940000046
所述带噪语音信号的采样率为16KHz或32KHz,所述加权叠接相加分析滤波器组和加权叠接相加综合滤波器组的帧长为16或32个点,每一帧的时间为 0.5ms、1ms或2ms。;
c1中,所述带噪语音功率谱P(λ,k)=αpP(λ-1,k)+(1-αp)|Y(λ,k)|2
c2中,计算所述最小值跟踪能量谱Pmin(λ,k):
if Pmin(λ-1,k)<P(λ,k)
Figure BDA0002854317940000047
else
Pmin(λ,k)=P(λ,k)
其中,βt为更新系数,γt为平滑系数。
c3中,所述比值Sr(λ,k)=P(λ,k)/Pmin(λ,k);
c4中,所述阈值Sth(λ,k)=αsSr(λ-1,k)+(1-αs)Sr(λ,k);
c5中,计算所述语音存在性信号V(λ,k):
Figure BDA0002854317940000051
c6中,所述Vs(λ,k)=αvV(λ-1,k)+(1-αv)V(λ,k);其中,αv为平滑系数。
c7中,所述平滑因子α(λ,k)=αd+(1-αd)Vs(λ,k),其中,αd为平滑系数;
c8中,所述噪声功率谱估计值
Figure BDA0002854317940000052
Figure BDA0002854317940000053
采用本发明上述方法可以达到如下有益效果,采用加权叠接相加结构的滤波器组代替传统短时傅里叶变换进行时域-频域相互转换,加权叠接相加结构的滤波器组帧长较短,可有效降低各频段相邻帧的突变,避免出现噪声过估计,从而减小了音乐噪声的引入,提高了语音增强效果;采用噪声估计算法对加性噪声信号的功率谱估计值进行更新,不论在高信噪比还是在低信噪比的背景噪声情况下,都会实时更新语音存在性的阈值,因此能更加准确地判断语音存在性,从而提高了噪声估计的准确性。本申请语音信号增强方法运算单元简单,适合硬件实现。
附图说明
图1为本发明语音信号增强方法对带噪语音信号进行处理的流程图;
图2为本发明采用噪声估计算法对带噪语音信号进行估计的流程图;
图3为本发明语音信号增强方法应用于助听器的系统框图;
图4为将本发明语音信号增强方法应用于助听器前后的效果图。
具体实施方式
见图1,一种语音信号增强方法,该语音增强实现步骤如下:
步骤a:采集带噪语音信号y(n),噪语音信号y(n)为时域信号,该噪语音信号y(n)包含的噪声为加性噪声d(n)和纯净语音为x(n),其中,n为离散时间;
步骤b:采用加权叠接相加(WOLA)分析滤波器组将时域信号转换为频域信号,频域信号Y(k)=D(k)+X(k);
步骤c:采用噪声估计算法更新加性噪声功率谱的估计值
Figure BDA0002854317940000061
步骤d:利用多子带谱减算法对带噪语音进行功率谱的谱减,得到纯净语音的功率谱估计值
Figure BDA0002854317940000062
首先对各子带的带噪语音幅度谱Yi(k)做平滑:
Figure BDA0002854317940000063
在功率谱上对各子带进行谱减,对于噪声估计过大,导致过减的情况,执行半波整流:
Figure BDA0002854317940000064
其中,αi和δi分别为各子带的过减因子和减法因子,计算公式如下:
Figure BDA0002854317940000065
Figure BDA0002854317940000066
采用步骤c、步骤d对频域信号中的噪声进行消除,
步骤e:利用带噪语音y的相位
Figure BDA0002854317940000067
和纯净语音的幅度谱的估计值
Figure BDA0002854317940000068
还原纯净语音的频域信号
Figure BDA0002854317940000069
Figure BDA00028543179400000610
步骤e用于对纯净语音进行相位还原;
步骤f:采用加权叠接相加(WOLA)综合滤波器组将频域信号重新转换为时域信号,得到语音增强后的纯净语音的估计信号
Figure BDA0002854317940000071
见图2,上述步骤c的噪声估计算法具体实现步骤如下:
c1:对带噪语音功率谱进行平滑,得到平滑后的带噪信号的功率谱P(λ,k):
P(λ,k)=αpP(λ-1,k)+(1-αp)|Y(λ,k)|2
其中,αp为平滑因子λ代表时间,k代表子带。
c2:采用非线性平滑方法跟踪平滑后的带噪信号的能量谱最小值,得到最小值跟踪能量谱Pmin(λ,k):
if Pmin(λ-1,k)<P(λ,k)
Figure BDA0002854317940000072
else
Pmin(λ,k)=P(λ,k)
其中,βt为更新系数,γt为平滑系数。
c3:计算带噪语音功率谱与最小值跟踪能量谱的比值Sr(λ,k):
Sr(λ,k)=P(λ,k)/Pmin(λ,k)
c4:对上述比值进行平滑,作为判断语音存在性的阈值Sth(λ,k):
Sth(λ,k)=αsSr(λ-1,k)+(1-αs)Sr(λ,k)
c5:对比步骤3产生的比值和步骤4产生的阈值,得到语音存在性信号V(λ,k):
Figure BDA0002854317940000073
c6:对语音存在性信号进行平滑,获取Vs(λ,k),防止存在性在0和1之间突变,导致噪声估计值出现突变,从而引入新的噪声:
Vs(λ,k)=ΔvV(λ-1,k)+(1-αv)V(λ,k),
其中,αv为平滑系数。
c7:采用平滑后的语音存在性信号对噪声更新的平滑因子α(λ,k)进行实时更新:
α(λ,k)=αd+(1-αd)Vs(λ,k)
其中,αd为平滑系数。
c8:采用时间迭代方式计算得到噪声功率谱估计值
Figure BDA0002854317940000081
Figure BDA0002854317940000082
本发明专利可应用在任何需要硬件实现的实时语音处理应用中,图3为其在助听器应用的框图,带噪语音信号输入至加权叠接相加分析滤波器组进行转换,转换后获得的频域信号依次经语音增强(采用上述语音信号增强方法)、听力补偿(可采用现有的补偿曲线对增强后的语音信号进行补偿,获得补偿信号)、频率压缩(对补偿后的压缩信号进行压缩处理),再采用加权叠接相加综合滤波器组将压缩后的信号转换时域信号后输出,时域信号输出时对其进行反馈抑制,以防止其产生的啸叫。本申请方法为了解决噪声估计时,不同信噪比的背景噪声下,语音存在性估计不准确的问题,在最小值跟踪算法的基础上,引用了噪声估计算法,该算法通过计算语音存在性判断阈值,获取语音存在性,并采用时间迭代更新噪声。该方法不论在高信噪比还是在低信噪比的背景噪声情况下,都会实时更新阈值,因此能更加准确地判断语音存在性。且该方法没有复杂的运算单元,适合硬件实现。
将上述语音增强方法应用于语音处理系统,实现效果见图4,在纯净语音上增加一个噪声,得到一个信噪比为5dB的带噪语音信号,经过上述语音增强系统,得到一个失真度较低,降噪效果较好,且没有引入音乐噪声的增强信号,图4中横轴表示时间,纵轴表示幅度,从上至下依次为原始语音信号、带噪语音信号、增强语音信号,其中增强语音信号为采用本申请方法对带噪语音信号处理后的语音信号,从图4中可以看出,增强语音信号接近于原始语音信号,失真度交底,同时去除了原始语音信号中微小的噪声,采用本申请方法可以起到有效去除噪声的效果。
为解决多子带谱减下噪声残留的问题,采用帧长更短的加权叠接相加结构的滤波器组代替传统短时傅里叶变换(STFT),加权叠接相加滤波器组(WOLA) 的采样率为16KHz,帧长为16个点,因此帧长为1ms,远小于短时傅里叶变换 (STFT)的20~30ms帧长,即采用加权叠接相加结构的滤波器组使帧长从 20~30ms降低到了0.5~2ms,降低了各频段相邻帧的突变,起到了减小音乐噪声的目的。上述方法所需硬件资源更少,功耗更低,更加适合低成本低功耗应用。
以上所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。

Claims (6)

1.一种语音信号增强方法,其特征在于,该方法包括:
采集带噪语音信号y(n),所述带噪语音信号为时域信号,其中,所述带噪语音信号包括的噪声为加性噪声d(n),纯净语音为x(n),n为离散时间;
采用加权叠接相加分析滤波器组将所述时域信号转换为频域信号:Y(k)=D(k)+X(k),其中,D(k)为所述加性噪声的频域信号,X(k)为所述纯净语音的频域信号,k为频域子带;
采用噪声估计算法对所述加性噪声信号的功率谱估计值
Figure FDA0002854317930000011
进行更新;
采用多子带谱减算法对带噪语音进行功率谱的谱减,得到所述纯净语音的功率谱估计值
Figure FDA0002854317930000012
利用所述带噪语音的相位和所述纯净语音的幅度谱的估计值,还原所述纯净语音的频域信号
Figure FDA0002854317930000013
采用加权叠接相加综合滤波器组将频域信号
Figure FDA0002854317930000014
重新转换为时域信号,得到语音增强后的纯净语音的估计信号
Figure FDA0002854317930000015
2.根据权利要求1所述的一种语音信号增强方法,其特征在于,所述噪声估计算法包括:
对所述带噪语音信号的带噪语音功率谱进行平滑,得到平滑后的带噪信号的功率谱P(λ,k),λ为离散时间,k为频域子带;
采用非线性平滑方法跟踪平滑后的所述带噪信号的能量谱最小值,得到最小值跟踪能量谱Pmin(λ,k);
计算所述带噪语音功率谱与所述最小值跟踪能量谱的比值Sr(λ,k);
对所述比值进行平滑,作为判断所述语音存在性的阈值Sth(λ,k);
对比c3中所述比值和c4中所述阈值,得到语音存在性信号V(λ,k);
对所述语音存在性信号进行平滑,获取Vs(λ,k);
采用平滑后的所述语音存在性信号对所述平滑因子α(λ,k)进行实时更新;
采用时间迭代方式计算得到噪声功率谱估计值
Figure FDA0002854317930000021
3.根据权利要求2所述的所述一种语音信号增强方法,其特征在于,所述带噪语音功率谱P(λ,k)=αpP(λ-1,k)+(1-αp)|Y(λ,k)|2
计算所述最小值跟踪能量谱Pmin(λ,k):
if Pmin(λ-1,k)<P(λ,k)
Figure FDA0002854317930000022
Pmin(λ,k)=P(λ,k)
其中,βt为更新系数,γt为平滑系数;
所述比值Sr(λ,k)=P(λ,k)/Pmin(λ,k);
所述阈值Sth(λ,k)=αsSr(λ-1,k)+(1-αs)Sr(λ,k);
计算所述语音存在性信号V(λ,k):
Figure FDA0002854317930000023
所述Vs(λ,k)=αvV(λ-1,k)+(1-αv)V(λ,k),其中,αv为平滑系数;
所述平滑因子α(λ,k)=αd+(1-αd)Vs(λ,k),其中,αd为平滑系数;
所述噪声功率谱估计值
Figure FDA0002854317930000024
4.根据权利要求1或3所述的一种语音信号增强方法,其特征在于,利用多子带谱减算法对带噪语音进行功率谱的谱减,得到纯净语音的功率谱估计值
Figure FDA0002854317930000025
包括:对各子带进行通道组合,并对各子带的带噪语音幅度谱Yi(k)做平滑:
Figure FDA0002854317930000031
其中k代表子带,i代表当前子带k所处的通道。
在所述带噪语音信号功率谱上对各子带进行谱减,并对因估计噪声过大导致的过减情况采用半波整流进行调节,整流公式如下:
Figure FDA0002854317930000032
其中,β为谱下限参数,αi和δi分别为各子带的过减因子和减法因子,αi和δi的计算公式如下:
Figure FDA0002854317930000033
Figure FDA0002854317930000034
其中,SNRi为通道i的信噪比,fi为通道i的中心频率,Fs为采样率。
5.根据权利要求4所述的一种语音信号增强方法,其特征在于,采用所述带噪语音信号y(n)的相位
Figure FDA0002854317930000035
和所述的幅度谱的估计值
Figure FDA0002854317930000036
还原所述纯净语音的频域信号
Figure FDA0002854317930000037
Figure 1
6.根据权利要求2所述的一种语音信号增强方法,其特征在于,所述带噪语音的采样率为16KHz或32KHz,所述加权叠接相加分析滤波器组和所述加权叠接相加综合滤波器组的帧长为16个点或32个点,每一帧的时间为0.5ms、1ms或2ms。
CN202011538743.6A 2020-12-23 2020-12-23 一种语音信号增强方法 Pending CN112652322A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011538743.6A CN112652322A (zh) 2020-12-23 2020-12-23 一种语音信号增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011538743.6A CN112652322A (zh) 2020-12-23 2020-12-23 一种语音信号增强方法

Publications (1)

Publication Number Publication Date
CN112652322A true CN112652322A (zh) 2021-04-13

Family

ID=75359798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011538743.6A Pending CN112652322A (zh) 2020-12-23 2020-12-23 一种语音信号增强方法

Country Status (1)

Country Link
CN (1) CN112652322A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113963710A (zh) * 2021-10-19 2022-01-21 北京融讯科创技术有限公司 一种语音增强方法、装置、电子设备和存储介质
CN114005457A (zh) * 2021-11-09 2022-02-01 西安邮电大学 一种基于幅度估计与相位重构的单通道语音增强方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040078199A1 (en) * 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction
CN1565144A (zh) * 2001-08-08 2005-01-12 数字信号处理工厂有限公司 使用过采样滤波器组的定向音频信号处理
CN101030384A (zh) * 2007-03-27 2007-09-05 西安交通大学 一种自动电子喉的电子喉语音增强系统与控制方法
CN101901602A (zh) * 2010-07-09 2010-12-01 中国科学院声学研究所 一种利用受损听力的听阈进行降噪的方法
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
CN108735213A (zh) * 2018-05-29 2018-11-02 太原理工大学 一种基于相位补偿的语音增强方法及系统
CN110310656A (zh) * 2019-05-27 2019-10-08 重庆高开清芯科技产业发展有限公司 一种语音增强方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1565144A (zh) * 2001-08-08 2005-01-12 数字信号处理工厂有限公司 使用过采样滤波器组的定向音频信号处理
US20040078199A1 (en) * 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction
CN101030384A (zh) * 2007-03-27 2007-09-05 西安交通大学 一种自动电子喉的电子喉语音增强系统与控制方法
CN101901602A (zh) * 2010-07-09 2010-12-01 中国科学院声学研究所 一种利用受损听力的听阈进行降噪的方法
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
CN108735213A (zh) * 2018-05-29 2018-11-02 太原理工大学 一种基于相位补偿的语音增强方法及系统
CN110310656A (zh) * 2019-05-27 2019-10-08 重庆高开清芯科技产业发展有限公司 一种语音增强方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SUNDARRAJAN RANGACHARI等: "A noise-estimation algorithm for highly non-stationary environments", SPEECH COMMUNICATION, vol. 48, no. 2, pages 220 - 231 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113963710A (zh) * 2021-10-19 2022-01-21 北京融讯科创技术有限公司 一种语音增强方法、装置、电子设备和存储介质
CN114005457A (zh) * 2021-11-09 2022-02-01 西安邮电大学 一种基于幅度估计与相位重构的单通道语音增强方法

Similar Documents

Publication Publication Date Title
RU2329550C2 (ru) Способ и устройство для улучшения речевого сигнала в присутствии фонового шума
US8010355B2 (en) Low complexity noise reduction method
US8521530B1 (en) System and method for enhancing a monaural audio signal
US7133825B2 (en) Computationally efficient background noise suppressor for speech coding and speech recognition
EP2031583B1 (en) Fast estimation of spectral noise power density for speech signal enhancement
Soon et al. Speech enhancement using 2-D Fourier transform
JP5153886B2 (ja) 雑音抑圧装置および音声復号化装置
CA2549744A1 (en) System for adaptive enhancement of speech signals
US9390718B2 (en) Audio signal restoration device and audio signal restoration method
CN113160845A (zh) 基于语音存在概率和听觉掩蔽效应的语音增强算法
CN112652322A (zh) 一种语音信号增强方法
Wolfe et al. Towards a perceptually optimal spectral amplitude estimator for audio signal enhancement
CN114005457A (zh) 一种基于幅度估计与相位重构的单通道语音增强方法
Upadhyay et al. Spectral subtractive-type algorithms for enhancement of noisy speech: an integrative review
Upadhyay et al. The spectral subtractive-type algorithms for enhancing speech in noisy environments
JP2002140100A (ja) 騒音抑圧装置
Nahma et al. Improved a priori snr estimation in speech enhancement
Upadhyay et al. Single channel speech enhancement utilizing iterative processing of multi-band spectral subtraction algorithm
Akhaee et al. Speech enhancement by adaptive noise cancellation in the wavelet domain
Nahma et al. Convex combination framework for a priori SNR estimation in speech enhancement
Dong et al. Speech denoising based on perceptual weighting filter
Esch et al. Wideband noise suppression supported by artificial bandwidth extension techniques
Rao et al. Speech enhancement using perceptual Wiener filter combined with unvoiced speech—A new Scheme
Xuchu et al. Speech enhancement using harmonic regeneration
Jiang et al. Adaptive Noise Reduction of Speech Signals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination