CN110808059A - 一种基于谱减法和小波变换的语音降噪方法 - Google Patents
一种基于谱减法和小波变换的语音降噪方法 Download PDFInfo
- Publication number
- CN110808059A CN110808059A CN201910960089.9A CN201910960089A CN110808059A CN 110808059 A CN110808059 A CN 110808059A CN 201910960089 A CN201910960089 A CN 201910960089A CN 110808059 A CN110808059 A CN 110808059A
- Authority
- CN
- China
- Prior art keywords
- wavelet
- noise
- signal
- speech
- spectral subtraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000003595 spectral effect Effects 0.000 title claims abstract description 33
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000003672 processing method Methods 0.000 claims abstract description 11
- 230000009466 transformation Effects 0.000 claims abstract description 10
- 238000010606 normalization Methods 0.000 claims abstract description 7
- 238000013519 translation Methods 0.000 claims abstract description 7
- 238000005070 sampling Methods 0.000 claims description 5
- 150000001875 compounds Chemical class 0.000 claims description 3
- 238000009432 framing Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 11
- 238000011410 subtraction method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种基于谱减法和小波变换的语音降噪方法:去除输入的纯净语音信号的直流分量,对幅值进行归一化处理;对处理后的语音信号叠加高斯白噪声,得到含噪语音信号;设置前导无话段,计算出前导无话段的帧数;使用谱减法对含噪语音信号进行处理;对得到的谱减后的语音信号进行小波分解得到离散伸缩因子,离散平移因子的小波信号;根据小波信号中的低频分量和各个分解层的高频分量,得到低频系数和各个分解层的高频系数,对各个分解层的高频系数分别使用置零处理方法和软阈值处理方法进行处理,得到处理后的各个分解层的高频系数;进行小波逆变换,得到最终降噪后的语音信号。本发明能够显著地减少“音乐噪声”,并且只存在少量的高频失真,进一步提高降噪能力。
Description
技术领域
本发明涉及一种语音降噪方法。特别是涉及一种基于谱减法和小波变换的语音降噪方法。
背景技术
语音通信过程中经常会受到各种噪声的影响而导致通信质量的下降。语音降噪的主要目的是从带噪语音中提取出尽可能纯净的原始语音,提高识别率。语音增强一直是人们研究的热点,并且不断有新的方法出现。目前,常见的语音降噪的方法有基于自相关方法的语音降噪,基于谱减法的语音降噪,基于小波变换的语音降噪,基于自适应滤波的语音降噪以及基于维纳滤波法的语音降噪等。其中,基于自相关方法的语音降噪虽然可以使语音信号的能量集中在少数的共振峰内,在频域上最大程度地提高了信噪比,对于与语音同频的噪声去除较有利,但是其去噪阈值较难确定,会对语音造成伤害。基于谱减法降噪后的语音信号虽然几乎不存在失真的情况,但是降噪后存在明显的“音乐噪声”,而基于小波变换降噪后的信号存在严重的高频失真。
发明内容
本发明所要解决的技术问题是,提供一种能够提高信号的信噪比和可懂度的基于谱减法和小波变换的语音降噪方法。
本发明所采用的技术方案是:一种基于谱减法和小波变换的语音降噪方法,包括如下步骤:
1)去除输入的纯净语音信号的直流分量,再对幅值进行归一化处理;
2)对归一化处理后的语音信号叠加高斯白噪声,得到含噪语音信号;
3)设置前导无话段,即噪声段的时长为IS,并计算出前导无话段的帧数NIS:
式中,IS表示前导无话段时长,fs表示采样频率,N表示每帧数据长度,即帧长,inc表示每帧数据移动长度,即帧移;
4)使用谱减法对含噪语音信号进行处理;
其中,离散小波序列Ψm,r(t)是对小波序列Ψp,q(t)中的伸缩因子p和平移因子q进行离散化得到;式中,
小波序列Ψp,q(t)是将基小波函数Ψ(t)进行伸缩和平移运算得到;
根据小波信号中的低频分量和各个分解层的高频分量,得到低频系数和各个分解层的高频系数,对各个分解层的高频系数分别使用置零处理方法和软阈值处理方法进行处理,得到处理后的各个分解层的高频系数,其中,软阈值处理方法中的软阈值T1,即为谱减后的语音信号经过小波变换后得到的低频分量的算术平均值;然后依据处理后的各个分解层的高频系数与小波信号的最后一层的低频系数进行小波逆变换,得到最终降噪后的语音信号。
步骤4)包括:
(1)对含噪语音信号进行加窗分帧;
式中,Xi(k)表示第i帧含噪语音信号第k个点的离散傅里叶变换,k∈0,1,…,N-1,n∈0,1,…,N-1;
式中,a和b是两个常数,a是过减因子,b是增益补偿因子;
本发明的一种基于谱减法和小波变换的语音降噪方法,降噪效果好,可懂性高。基于谱减法和小波变换的语音降噪方法能克服基于谱减法和基于小波变换这两种方法单独降噪存在的不足之处,去除了含噪信号中的低频和高频噪声,同时尽量少地损害语音信号。使用本发明的方法首先使用谱减法对含噪信号进行处理,再对使用谱减法后的含噪信号进行小波变换得到最终的降噪后的语音信号,能够显著地减少“音乐噪声”,并且只存在少量的高频失真,进一步提高降噪能力。
附图说明
图1是纯净语音信号波形图;
图2是信噪比为-10dB的含噪信号波形图;
图3是使用谱减法对含噪信号进行降噪后的波形图;
图4是使用小波变换方法降噪后的信号波形图;
图5是使用本发明的方法降噪后的波形图;
图6是纯语音信号频谱图;
图7是信噪比为-10dB语音信号频谱图;
图8是使用谱减法降噪后的信号频谱图;
图9是使用小波变换方法降噪后的信号频谱图;
图10是使用本发明的方法降噪后的信号频谱图。
具体实施方式
下面结合实例和附图对本发明的一种基于谱减法和小波变换的语音降噪方法做出详细说明。
本发明的一种基于谱减法和小波变换的语音降噪方法,包括如下步骤:
1)去除输入的纯净语音信号的直流分量,再对幅值进行归一化处理;
2)对归一化处理后的语音信号叠加高斯白噪声,得到含噪语音信号;
3)设置前导无话段,即噪声段的时长为IS,并计算出前导无话段的帧数NIS:
式中,IS表示前导无话段时长,fs表示采样频率,N表示每帧数据长度,即帧长,inc表示每帧数据移动长度,即帧移;
4)使用谱减法对含噪语音信号进行处理;包括:
(1)对含噪语音信号进行加窗分帧;
由于语音信号是一种典型的非平稳信号,但是与声波振动的速度相比,发声器官的运动非常缓慢,通常认为在时间段中,语音信号是平稳信号,因此对待测含噪语音信号作分帧加窗处理。
式中,Xi(k)表示第i帧含噪语音信号第k个点的离散傅里叶变换,k∈0,1,…,N-1,n∈0,1,…,N-1;
(3)根据幅值|Xi(k)|和噪声段的能量D(k)计算进行谱减后的幅值
式中,a和b是两个常数,a是过减因子,b是增益补偿因子;
其中,离散小波序列Ψm,r(t)是对小波序列Ψp,q(t)中的伸缩因子p和平移因子q进行离散化得到;式中,
小波序列Ψp,q(t)是将基小波函数Ψ(t)进行伸缩和平移运算得到;
根据小波信号中的低频分量和各个分解层的高频分量,得到低频系数和各个分解层的高频系数,对各个分解层的高频系数分别使用置零处理方法和软阈值处理方法进行处理,得到处理后的各个分解层的高频系数,其中,软阈值处理方法中的软阈值T1,即为谱减后的语音信号经过小波变换后得到的低频分量的算术平均值;然后依据处理后的各个分解层的高频系数与对小波信号的最后一层的低频系数进行小波逆变换,得到最终降噪后的语音信号。
下面给出具体实例:
本实例采用一段安静环境下的标准男音“蓝天白云”作为纯净语音输入,实验中取过减因子a=4,增益补偿因子b=0.001,前导无话段长度IS=0.25,采样率fs=8000Hz,帧长N=200,帧移inc=80。
具体实施步骤如下:
(1)读取纯净语音信号,波形图如图1所示;
(2)对纯净语音信号添加高斯噪声,信噪比设为-10dB,波形图如图2所示;
(3)对信号进行分帧加窗处理,每帧200个采样点,加200点的汉明窗;
(7)使用coif5小波基对含噪语音信号进行小波分解,小波分解层数为7层,对1-3层的高频系数置零,对4-7的高频系数采用阈值T1进行判决,得到进行小波变换后降噪的语音信号,波形图如图4所示。
图6是纯净语音信号的频谱图,图7是信噪比为-10dB语音信号的频谱图,图8是使用谱减法对含噪信号降噪后的信号的频谱图,图9是使用小波变换方法对含噪语音信号降噪后的信号的频谱图,图10是使用本方法对含噪语音信号降噪后的信号的频谱图。
从图5中可以明显看出,含有噪声的信号经过本发明的方法进行降噪后,时域波形清晰。从图10中可以看出,含有噪声的信号经过本发明的方法进行降噪后得到的频谱中有效地去除噪声频率分量。
信噪比反映方法的降噪性能,降噪后得到的信噪比越大,方法的降噪性能就越好。表1列出了各个方法在不同的含噪声信号上进行降噪处理后得到的信号的信噪比。
表1不同方法的降噪效果
由表1可以看出,对于相同信噪比的含噪声信号,使用谱减法、小波变换方法和本发明的方法对其进行降噪时,本发明的方法进行降噪得到的降噪语音信号有更高的信噪比,可懂度更高。
Claims (2)
1.一种基于谱减法和小波变换的语音降噪方法,其特征在于,包括如下步骤:
1)去除输入的纯净语音信号的直流分量,再对幅值进行归一化处理;
2)对归一化处理后的语音信号叠加高斯白噪声,得到含噪语音信号;
3)设置前导无话段,即噪声段的时长为IS,并计算出前导无话段的帧数NIS:
式中,IS表示前导无话段时长,fs表示采样频率,N表示每帧数据长度,即帧长,inc表示每帧数据移动长度,即帧移;
4)使用谱减法对含噪语音信号进行处理;
其中,离散小波序列Ψm,r(t)是对小波序列Ψp,q(t)中的伸缩因子p和平移因子q进行离散化得到;式中,
小波序列Ψp,q(t)是将基小波函数Ψ(t)进行伸缩和平移运算得到;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910960089.9A CN110808059A (zh) | 2019-10-10 | 2019-10-10 | 一种基于谱减法和小波变换的语音降噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910960089.9A CN110808059A (zh) | 2019-10-10 | 2019-10-10 | 一种基于谱减法和小波变换的语音降噪方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110808059A true CN110808059A (zh) | 2020-02-18 |
Family
ID=69488244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910960089.9A Pending CN110808059A (zh) | 2019-10-10 | 2019-10-10 | 一种基于谱减法和小波变换的语音降噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110808059A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111477241A (zh) * | 2020-04-15 | 2020-07-31 | 南京邮电大学 | 一种面向家居噪声环境的分层自适应去噪方法及系统 |
CN112033656A (zh) * | 2020-08-27 | 2020-12-04 | 杭州电子科技大学 | 一种基于宽带谱处理的机械系统故障检测方法 |
CN113488070A (zh) * | 2021-09-08 | 2021-10-08 | 中国科学院自动化研究所 | 篡改音频的检测方法、装置、电子设备及存储介质 |
CN113658604A (zh) * | 2021-08-27 | 2021-11-16 | 上海互问信息科技有限公司 | 一种利用数理统计和深度网络结合的语音降噪通用方法 |
CN113947855A (zh) * | 2021-09-18 | 2022-01-18 | 中标慧安信息技术股份有限公司 | 一种基于语音识别的智能楼宇人员安全报警系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101866652A (zh) * | 2010-05-11 | 2010-10-20 | 天津大学 | 一种语音降噪方法 |
CN104269178A (zh) * | 2014-08-08 | 2015-01-07 | 华迪计算机集团有限公司 | 对语音信号进行自适应谱减和小波包消噪处理的方法和装置 |
CN105827504A (zh) * | 2015-11-30 | 2016-08-03 | 维沃移动通信有限公司 | 一种语音信息的传输方法、移动终端和系统 |
CN106328161A (zh) * | 2016-08-22 | 2017-01-11 | 维沃移动通信有限公司 | 一种音频数据处理方法及移动终端 |
CN108231084A (zh) * | 2017-12-04 | 2018-06-29 | 重庆邮电大学 | 一种基于Teager能量算子的改进小波阈值函数去噪方法 |
CN108564965A (zh) * | 2018-04-09 | 2018-09-21 | 太原理工大学 | 一种抗噪语音识别系统 |
-
2019
- 2019-10-10 CN CN201910960089.9A patent/CN110808059A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101866652A (zh) * | 2010-05-11 | 2010-10-20 | 天津大学 | 一种语音降噪方法 |
CN104269178A (zh) * | 2014-08-08 | 2015-01-07 | 华迪计算机集团有限公司 | 对语音信号进行自适应谱减和小波包消噪处理的方法和装置 |
CN105827504A (zh) * | 2015-11-30 | 2016-08-03 | 维沃移动通信有限公司 | 一种语音信息的传输方法、移动终端和系统 |
CN106328161A (zh) * | 2016-08-22 | 2017-01-11 | 维沃移动通信有限公司 | 一种音频数据处理方法及移动终端 |
CN108231084A (zh) * | 2017-12-04 | 2018-06-29 | 重庆邮电大学 | 一种基于Teager能量算子的改进小波阈值函数去噪方法 |
CN108564965A (zh) * | 2018-04-09 | 2018-09-21 | 太原理工大学 | 一种抗噪语音识别系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111477241A (zh) * | 2020-04-15 | 2020-07-31 | 南京邮电大学 | 一种面向家居噪声环境的分层自适应去噪方法及系统 |
CN112033656A (zh) * | 2020-08-27 | 2020-12-04 | 杭州电子科技大学 | 一种基于宽带谱处理的机械系统故障检测方法 |
CN113658604A (zh) * | 2021-08-27 | 2021-11-16 | 上海互问信息科技有限公司 | 一种利用数理统计和深度网络结合的语音降噪通用方法 |
CN113488070A (zh) * | 2021-09-08 | 2021-10-08 | 中国科学院自动化研究所 | 篡改音频的检测方法、装置、电子设备及存储介质 |
US11636871B2 (en) | 2021-09-08 | 2023-04-25 | Institute Of Automation, Chinese Academy Of Sciences | Method and electronic apparatus for detecting tampering audio, and storage medium |
CN113947855A (zh) * | 2021-09-18 | 2022-01-18 | 中标慧安信息技术股份有限公司 | 一种基于语音识别的智能楼宇人员安全报警系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107274908B (zh) | 基于新阈值函数的小波语音去噪方法 | |
CN110808059A (zh) | 一种基于谱减法和小波变换的语音降噪方法 | |
Sheikhzadeh et al. | An improved wavelet-based speech enhancement system | |
US8010355B2 (en) | Low complexity noise reduction method | |
EP2031583B1 (en) | Fast estimation of spectral noise power density for speech signal enhancement | |
CN110634500B (zh) | 一种先验信噪比的计算方法、电子设备及存储介质 | |
CN111091833A (zh) | 一种降低噪声影响的端点检测方法 | |
Soon et al. | Wavelet for speech denoising | |
WO2001031631A1 (en) | Mel-frequency domain based audible noise filter and method | |
CN110808057A (zh) | 一种基于约束朴素生成对抗网络的语音增强方法 | |
US20030078772A1 (en) | Noise reduction method | |
Choi | Noise reduction algorithm in speech by Wiener filter | |
CN109102823B (zh) | 一种基于子带谱熵的语音增强方法 | |
Lei et al. | Speech enhancement for nonstationary noises by wavelet packet transform and adaptive noise estimation | |
Yang et al. | A speech enhancement algorithm combining spectral subtraction and wavelet transform | |
Kirubagari et al. | Speech enhancement using minimum mean square error filter and spectral subtraction filter | |
Akhaee et al. | Speech enhancement by adaptive noise cancellation in the wavelet domain | |
CN113066483B (zh) | 一种基于稀疏连续约束的生成对抗网络语音增强方法 | |
Alam et al. | Speech enhancement based on novel two-step a priori SNR estimators. | |
Shao et al. | A versatile speech enhancement system based on perceptual wavelet denoising | |
CN106997766B (zh) | 一种基于宽带噪声的同态滤波语音增强方法 | |
Esch et al. | Combined reduction of time varying harmonic and stationary noise using frequency warping | |
Khalil et al. | Enhancement of speech signals using multiple statistical models | |
Liu et al. | An improved spectral subtraction method | |
Joorabchi et al. | Speech Denoising Based on Wavelet Transform and Wiener Filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200218 |