CN108428456A - 语音降噪算法 - Google Patents
语音降噪算法 Download PDFInfo
- Publication number
- CN108428456A CN108428456A CN201810274913.0A CN201810274913A CN108428456A CN 108428456 A CN108428456 A CN 108428456A CN 201810274913 A CN201810274913 A CN 201810274913A CN 108428456 A CN108428456 A CN 108428456A
- Authority
- CN
- China
- Prior art keywords
- frame data
- current frame
- energy
- signal
- energy spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 60
- 238000001514 detection method Methods 0.000 claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 claims abstract description 5
- 230000009466 transformation Effects 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000000034 method Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000009432 framing Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 abstract 1
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种语音降噪算法:使用仿真软件采集声音样本,并进行A/D转换;将经过AD采样后的带噪语音进行短时傅里叶变换,并对每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,利用先验信噪比结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,根据纯净语音能量谱与当前帧数据的相位谱,进行短时傅里叶反变换并合成,形成连续的纯净语音信号。本发明利用多种端点监测算法结合噪声进行估计,进而提高噪声估计的准确度。
Description
技术领域:
本发明涉及一种算法,特别是涉及一种语音降噪算法。
背景技术:
无论身处何处,我们都被噪声所包围,噪声可以是平稳的,即不随时间而改变,如电脑风扇噪声;噪声也可以是非平稳的,比如餐馆里面的北京噪声,很多人说话的同时还夹杂着厨房里传出来的声音,这种餐馆噪声的频域以及时域特征随着周围餐桌上人们的对话以及服务员与顾客交流内容的改变而改变。
发明内容:
本发明所要解决的技术问题是:克服现有技术的不足,提供一种能够提高噪声估计的准确度的语音降噪算法。
本发明为解决技术问题所采取的技术方案是:
一种语音降噪算法,包括以下步骤:
(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;
(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;
其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;
(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;
(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:
其中Yi 2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;
(1)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α为平滑因子,一般取0.9-1.0,这里取0.95,ξi-1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;
(2)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:
其中ξi(k)为当前帧数据频率分量k的先验信噪比,为当前帧数据后验信噪比的维纳估计,Yi(k)为当前帧数据频率分量k的带噪语音的能量谱,Xk为当前帧数据频率分量k的纯净语音的能量谱;
(3)根据计算出的纯净语音能量谱与计算出的当前帧数据的相位谱,进行短时傅里叶反变换,将信号从频域转换到时域,再对每一帧数据进行合成,形成连续的纯净语音信号。
步骤(3)中的VAD检测,使用能熵比进行检测,具体能熵比计算过程如下所示:
(1)计算当前帧数据的每个频率分量的归一化谱概率密度函数,如下式所示:
其中Yi(k)为第k条谱线频率分量fk的能量谱,为所有频率分量的能量和,pi(k)为第i帧第k个频率分量fk对应的概率密度,N为短时傅里叶变换的分辨率,这里取N=128;
(2)计算当前帧数据的短时谱熵,如下式所示:
其中Hi为当前帧数据的短时谱熵;
(3)计算当前帧数据的能量,如下式所示:
LEi=log10(1+AMRi/a)
其中Yi 2(k)是当前帧数据的能量,AMPi为当前帧数据的能量,LEi是改进的能量关系,a是一个常数,这里取1.5:
(4)计算当前帧数据的能熵比,如下式所示:
其中EEFi就是当前帧数据的能熵比,根据EEFi的值,判断是否为有效语音,如果是,则不更新噪声估计的能量谱,如果不是,这里取EEFi<1.6为无效语音,则更新噪声能量谱λd(k):
λd(k)=0.9*λd-1(k)+0.1*Yi 2(k)
在进行语音降噪算法的过程中,选择使用数字信号处理器TMS320VC5509A作为主处理芯片,使用音频编解码器TLV320AIC23B作为AD/DA芯片。
本发明的积极有益效果是:
噪声估计是所有降噪算法中的重中之重,提高噪声估计的准确度能明显提高处理后的语音的信噪比与可懂性,本发明使用多种端点检测算法结合对噪声进行估计,进而提高噪声估计的准确度,提高了语音降噪的效果。
附图说明:
图1为本发明语音降噪算法的算法过程框图。
具体实施方式:
下面结合附图1和具体实施例对本发明作进一步的解释和说明:
实施例:一种语音降噪算法,包括以下步骤:
(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;
(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;
其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;
(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;
(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:
其中Yi 2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;
(4)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α为平滑因子,一般取0.9-1.0,这里取0.95,ξi-1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;
(5)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:
其中ξi(k)为当前帧数据频率分量k的先验信噪比,为当前帧数据后验信噪比的维纳估计,Yi(k)为当前帧数据频率分量k的带噪语音的能量谱,Xk为当前帧数据频率分量k的纯净语音的能量谱;
(6)根据计算出的纯净语音能量谱与计算出的当前帧数据的相位谱,进行短时傅里叶反变换,将信号从频域转换到时域,再对每一帧数据进行合成,形成连续的纯净语音信号。
步骤(3)中的VAD检测,使用能熵比进行检测,具体能熵比计算过程如下所示:
(1)计算当前帧数据的每个频率分量的归一化谱概率密度函数,如下式所示:
其中Yi(k)为第k条谱线频率分量fk的能量谱,为所有频率分量的能量和,pi(k)为第i帧第k个频率分量fk对应的概率密度,N为短时傅里叶变换的分辨率,这里取N=128;
(2)计算当前帧数据的短时谱熵,如下式所示:
其中Hi为当前帧数据的短时谱熵;
(3)计算当前帧数据的能量,如下式所示:
LEi=log10(1+AMPi/a)
其中Yi 2(k)是当前帧数据的能量,AMPi为当前帧数据的能量,LEi是改进的能量关系,a是一个常数,这里取1.5:
(4)计算当前帧数据的能熵比,如下式所示:
其中EEFi就是当前帧数据的能熵比,根据EEFi的值,判断是否为有效语音,如果是,则不更新噪声估计的能量谱,如果不是,这里取EEFi<1.6为无效语音,则更新噪声能量谱λd(k):
λd(k)=0.9*λd-1(k)+0.1*Yi 2(k)
在进行语音降噪算法的过程中,选择使用数字信号处理器TMS320VC5509A作为主处理芯片,使用音频编解码器TLV320AIC23B作为AD/DA芯片。
语音降噪过程中,先使用仿真软件采集声音样本,并进行A/D转换;随后进行短时傅里叶变换,并对每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,然后根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,利用先验信噪比结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,根据纯净语音能量谱与当前帧数据的相位谱,进行短时傅里叶反变换并合成,形成连续的纯净语音信号。
以上所述,仅是本发明的优先实施例而已,并未对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的保护范围内。
Claims (3)
1.一种语音降噪算法,包括以下步骤:
(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;
(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;
其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;
(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;
(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:
其中Yi 2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;
(5)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α为平滑因子,一般取0.9-1.0,这里取0.95,ξi-1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;
(6)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:
其中ξi(k)为当前帧数据频率分量k的先验信噪比,为当前帧数据后验信噪比的维纳估计,Yi(k)为当前帧数据频率分量k的带噪语音的能量谱,Xk为当前帧数据频率分量k的纯净语音的能量谱;
(7)根据计算出的纯净语音能量谱与计算出的当前帧数据的相位谱,进行短时傅里叶反变换,将信号从频域转换到时域,再对每一帧数据进行合成,形成连续的纯净语音信号。
2.根据权利要求1所述的语音降噪算法,其特征是:步骤(3)中的VAD检测,使用能熵比进行检测,具体能熵比计算过程如下所示:
(1)计算当前帧数据的每个频率分量的归一化谱概率密度函数,如下式所示:
其中Yi(k)为第k条谱线频率分量fk的能量谱,为所有频率分量的能量和,pi(k)为第i帧第k个频率分量fk对应的概率密度,N为短时傅里叶变换的分辨率,这里取N=128;
(2)计算当前帧数据的短时谱熵,如下式所示:
其中Hi为当前帧数据的短时谱熵;
(3)计算当前帧数据的能量,如下式所示:
LEi=log10(1+AMPi/a)
其中Yi 2(k)是当前帧数据的能量,AMPi为当前帧数据的能量,LEi是改进的能量关系,a是一个常数,这里取1.5:
(4)计算当前帧数据的能熵比,如下式所示:
其中EEFi就是当前帧数据的能熵比,根据EEFi的值,判断是否为有效语音,如果是,则不更新噪声估计的能量谱,如果不是,这里取EEFi<1.6为无效语音,则更新噪声能量谱λd(k),λd(k)=0.9*λd-1(k)+0.1*Yi 2(k)
3.根据权利要求1所述的语音降噪算法,其特征是:在进行语音降噪算法的过程中,选择使用数字信号处理器TMS320VC5509A作为主处理芯片,使用音频编解码器TLV320AIC23B作为AD/DA芯片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810274913.0A CN108428456A (zh) | 2018-03-29 | 2018-03-29 | 语音降噪算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810274913.0A CN108428456A (zh) | 2018-03-29 | 2018-03-29 | 语音降噪算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108428456A true CN108428456A (zh) | 2018-08-21 |
Family
ID=63160070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810274913.0A Pending CN108428456A (zh) | 2018-03-29 | 2018-03-29 | 语音降噪算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108428456A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109378002A (zh) * | 2018-10-11 | 2019-02-22 | 平安科技(深圳)有限公司 | 声纹验证的方法、装置、计算机设备和存储介质 |
CN109611703A (zh) * | 2018-10-19 | 2019-04-12 | 宁波市鄞州利帆灯饰有限公司 | 一种便于安装的led灯 |
CN110101407A (zh) * | 2019-04-16 | 2019-08-09 | 华南师范大学 | 一种胎心音去噪方法、系统、装置及存储介质 |
CN110164467A (zh) * | 2018-12-18 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 语音降噪的方法和装置、计算设备和计算机可读存储介质 |
CN111477243A (zh) * | 2020-04-16 | 2020-07-31 | 维沃移动通信有限公司 | 音频信号处理方法及电子设备 |
CN112053702A (zh) * | 2020-09-30 | 2020-12-08 | 北京大米科技有限公司 | 一种语音处理的方法、装置及电子设备 |
CN112669877A (zh) * | 2020-09-09 | 2021-04-16 | 珠海市杰理科技股份有限公司 | 噪声检测及压制方法、装置、终端设备和系统、芯片 |
CN112955951A (zh) * | 2018-11-15 | 2021-06-11 | 深圳市欢太科技有限公司 | 语音端点检测方法、装置、存储介质及电子设备 |
CN113611319A (zh) * | 2021-04-07 | 2021-11-05 | 珠海市杰理科技股份有限公司 | 基于语音成分实现的风噪抑制方法、装置、设备及系统 |
WO2022105570A1 (zh) * | 2020-11-17 | 2022-05-27 | 深圳壹账通智能科技有限公司 | 语音端点检测方法、装置、设备及计算机可读存储介质 |
CN116929449A (zh) * | 2023-07-21 | 2023-10-24 | 大地(宁夏)数字科技有限公司 | 基于鸡绿色健康养殖技术的环境监测系统 |
WO2024017110A1 (zh) * | 2022-07-21 | 2024-01-25 | 广州市百果园信息技术有限公司 | 语音降噪方法、模型训练方法、装置、设备、介质及产品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853666A (zh) * | 2009-03-30 | 2010-10-06 | 华为技术有限公司 | 一种语音增强的方法和装置 |
CN103295582A (zh) * | 2012-03-02 | 2013-09-11 | 联芯科技有限公司 | 噪声抑制方法及其系统 |
CN103632676A (zh) * | 2013-11-12 | 2014-03-12 | 广州海格通信集团股份有限公司 | 一种低信噪比语音降噪方法 |
CN105702262A (zh) * | 2014-11-28 | 2016-06-22 | 上海航空电器有限公司 | 一种头戴式双麦克风语音增强方法 |
-
2018
- 2018-03-29 CN CN201810274913.0A patent/CN108428456A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853666A (zh) * | 2009-03-30 | 2010-10-06 | 华为技术有限公司 | 一种语音增强的方法和装置 |
CN103295582A (zh) * | 2012-03-02 | 2013-09-11 | 联芯科技有限公司 | 噪声抑制方法及其系统 |
CN103632676A (zh) * | 2013-11-12 | 2014-03-12 | 广州海格通信集团股份有限公司 | 一种低信噪比语音降噪方法 |
CN105702262A (zh) * | 2014-11-28 | 2016-06-22 | 上海航空电器有限公司 | 一种头戴式双麦克风语音增强方法 |
Non-Patent Citations (3)
Title |
---|
宋知用: "《MATLAB语音信号分析与合成 第2版》", 31 January 2018 * |
李战明等: "一种基于语音端点检测的维纳滤波语音增强算法", 《电子设计工程》 * |
高毅等: "《语音增强 理论与实践》", 31 December 2012 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020073518A1 (zh) * | 2018-10-11 | 2020-04-16 | 平安科技(深圳)有限公司 | 声纹验证的方法、装置、计算机设备和存储介质 |
CN109378002B (zh) * | 2018-10-11 | 2024-05-07 | 平安科技(深圳)有限公司 | 声纹验证的方法、装置、计算机设备和存储介质 |
CN109378002A (zh) * | 2018-10-11 | 2019-02-22 | 平安科技(深圳)有限公司 | 声纹验证的方法、装置、计算机设备和存储介质 |
CN109611703A (zh) * | 2018-10-19 | 2019-04-12 | 宁波市鄞州利帆灯饰有限公司 | 一种便于安装的led灯 |
CN112955951A (zh) * | 2018-11-15 | 2021-06-11 | 深圳市欢太科技有限公司 | 语音端点检测方法、装置、存储介质及电子设备 |
CN110164467A (zh) * | 2018-12-18 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 语音降噪的方法和装置、计算设备和计算机可读存储介质 |
CN110101407B (zh) * | 2019-04-16 | 2021-09-07 | 华南师范大学 | 一种胎心音去噪方法、系统、装置及存储介质 |
CN110101407A (zh) * | 2019-04-16 | 2019-08-09 | 华南师范大学 | 一种胎心音去噪方法、系统、装置及存储介质 |
CN111477243A (zh) * | 2020-04-16 | 2020-07-31 | 维沃移动通信有限公司 | 音频信号处理方法及电子设备 |
CN112669877B (zh) * | 2020-09-09 | 2023-09-29 | 珠海市杰理科技股份有限公司 | 噪声检测及压制方法、装置、终端设备和系统、芯片 |
CN112669877A (zh) * | 2020-09-09 | 2021-04-16 | 珠海市杰理科技股份有限公司 | 噪声检测及压制方法、装置、终端设备和系统、芯片 |
CN112053702A (zh) * | 2020-09-30 | 2020-12-08 | 北京大米科技有限公司 | 一种语音处理的方法、装置及电子设备 |
CN112053702B (zh) * | 2020-09-30 | 2024-03-19 | 北京大米科技有限公司 | 一种语音处理的方法、装置及电子设备 |
WO2022105570A1 (zh) * | 2020-11-17 | 2022-05-27 | 深圳壹账通智能科技有限公司 | 语音端点检测方法、装置、设备及计算机可读存储介质 |
CN113611319B (zh) * | 2021-04-07 | 2023-09-12 | 珠海市杰理科技股份有限公司 | 基于语音成分实现的风噪抑制方法、装置、设备及系统 |
CN113611319A (zh) * | 2021-04-07 | 2021-11-05 | 珠海市杰理科技股份有限公司 | 基于语音成分实现的风噪抑制方法、装置、设备及系统 |
WO2024017110A1 (zh) * | 2022-07-21 | 2024-01-25 | 广州市百果园信息技术有限公司 | 语音降噪方法、模型训练方法、装置、设备、介质及产品 |
CN116929449A (zh) * | 2023-07-21 | 2023-10-24 | 大地(宁夏)数字科技有限公司 | 基于鸡绿色健康养殖技术的环境监测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108428456A (zh) | 语音降噪算法 | |
CN106486131B (zh) | 一种语音去噪的方法及装置 | |
CN106340292B (zh) | 一种基于连续噪声估计的语音增强方法 | |
CN108831499A (zh) | 利用语音存在概率的语音增强方法 | |
CN109410977B (zh) | 一种基于EMD-Wavelet的MFCC相似度的语音段检测方法 | |
WO2021114733A1 (zh) | 一种分频段进行处理的噪声抑制方法及其系统 | |
Shao et al. | A generalized time–frequency subtraction method for robust speech enhancement based on wavelet filter banks modeling of human auditory system | |
CN105489226A (zh) | 一种用于拾音器的多窗谱估计的维纳滤波语音增强方法 | |
CN105575405A (zh) | 一种双麦克风语音激活检测方法及语音采集设备 | |
Gerkmann et al. | Speech presence probability estimation based on temporal cepstrum smoothing | |
Sørensen et al. | Speech enhancement with natural sounding residual noise based on connected time-frequency speech presence regions | |
Gupta et al. | Speech enhancement using MMSE estimation and spectral subtraction methods | |
CN109102823A (zh) | 一种基于子带谱熵的语音增强方法 | |
Bahadur et al. | Performance measurement of a hybrid speech enhancement technique | |
Zhang et al. | Spectral subtraction on real and imaginary modulation spectra | |
CN103971697A (zh) | 基于非局部均值滤波的语音增强方法 | |
Jie et al. | Suitability of speech quality evaluation measures in speech enhancement | |
Meher et al. | Dynamic spectral subtraction on AWGN speech | |
Zheng et al. | SURE-MSE speech enhancement for robust speech recognition | |
Zengyuan et al. | A speech denoising algorithm based on harmonic regeneration | |
Löllmann et al. | Efficient ML-estimator for blind reverberation time estimation | |
Lee et al. | On using multivariate polynomial regression model with spectral difference for statistical model-based speech enhancement | |
Liu | A new wavelet threshold denoising algorithm in speech recognition | |
Wan et al. | Robust speech recognition based on multi-band spectral subtraction | |
Liu et al. | Multiresolution cochleagram speech enhancement algorithm using improved deep neural networks with skip connections |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180821 |
|
RJ01 | Rejection of invention patent application after publication |