CN112259112A - 一种结合声纹识别和深度学习的回声消除方法 - Google Patents
一种结合声纹识别和深度学习的回声消除方法 Download PDFInfo
- Publication number
- CN112259112A CN112259112A CN202011041974.6A CN202011041974A CN112259112A CN 112259112 A CN112259112 A CN 112259112A CN 202011041974 A CN202011041974 A CN 202011041974A CN 112259112 A CN112259112 A CN 112259112A
- Authority
- CN
- China
- Prior art keywords
- signal
- signals
- echo
- far
- echo cancellation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000013135 deep learning Methods 0.000 title claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 32
- 230000000306 recurrent effect Effects 0.000 claims abstract description 21
- 238000003062 neural network model Methods 0.000 claims abstract description 18
- 238000001914 filtration Methods 0.000 claims abstract description 12
- 238000002592 echocardiography Methods 0.000 claims abstract description 3
- 230000008030 elimination Effects 0.000 claims abstract description 3
- 238000003379 elimination reaction Methods 0.000 claims abstract description 3
- 230000007787 long-term memory Effects 0.000 claims description 11
- 230000006403 short-term memory Effects 0.000 claims description 11
- 230000000873 masking effect Effects 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 3
- 230000006399 behavior Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/18—Artificial neural networks; Connectionist approaches
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
本发明公开了一种结合声纹识别和深度学习的回声消除方法,1)从目标说话人的语音片段中提取声学特征,通过预先训练好的包含递归神经网络模型的声纹编码器得到表征说话人信息的嵌入式向量,即声纹向量;2)从接收的信号中提取声学特征,所述信号包括近端信号和远端信号,通过AEC算法估计出出现的回声信号,即估计回声信号,同时得到线性方式消除后的包含残留回声的近端信号,即线性过滤信号;本发明提供的一种结合声纹识别和深度学习的回声消除方法,能够在双讲和非现性失真等情况下实现回声消除,即使在远端信号包含人声的情况下,大大地提高回声消除的效果。
Description
技术领域
本发明涉及回声消除技术领域,进一步说,尤其涉及一种结合声纹识别和深度学习的回声消除方法。
背景技术
智能音箱在播放音频节目时,麦克风采集进来的信号既包含了目标说话人的信号(近端信号),也包含了扬声器播放出的音频信号(远端回声),这种情况下语音识别模块几乎无法工作。通常需要引入回声消除的方法把回声消除干净,同时保护近端的语音信号不受损失。目前主流的回声消除方法是借助硬件回路采集到的参考信号,来估计麦克风信号中存在的回声信号,将估计到的回声信号和原始信号做减法得到估计的近端信号,最后通过一个后置的非线性滤波器来抑制回声消除后残留的回声。在实际情况中,远端信号常常包含人声,后置的非线形滤波器根据信号成分很难区分多少成分是近端信号的人声,多少成分是回声信号中的人声。这种混淆严重影响了回声消除的效果。
经过检索,申请号为201810708151.0、名称为一种智能家居设备控制方法、智能音箱及智能家居系统的技术方案,仅仅解决了可以根据用户的行为习惯信息,主动提问用户是否开启相应的受控目标,简化了操作步骤,提升了用户体验等技术问题,其采用的技术方案是:采集用户的身份认证信息;对所述身份认证信息进行识别,获得身份认证结果;调取与所述身份认证结果对应的第一行为习惯信息;根据所述第一行为习惯信息,输出是否开启相应的受控目标的提示信息;其中,所述第一行为习惯信息是预先通过对所述用户的语音信息进行深度学习得到的。接收用户的声纹信息;调取与所述声纹信息对应的第二行为习惯信息;根据所述第二行为习惯信息,对相应的受控目标进行控制;其中,所述第二行为习惯信息为预先对所述用户的不同情感状态下的所述声纹信息进行深度学习得到的。
发明内容
为了解决远端信号包含人声时回声消除的效果不好的技术问题,本公开提供了一种结合声纹识别和深度学习的回声消除方法。
1)从目标说话人的语音片段中提取声学特征,通过预先训练好的包含递归神经网络模型的声纹编码器得到表征说话人信息的嵌入式向量,即声纹向量;
2)从接收的信号中提取声学特征,所述信号包括近端信号和远端信号,通过AEC算法估计出出现的回声信号,即估计回声信号,同时得到线性方式消除后的包含残留回声的近端信号,即线性过滤信号;
3)将估计回声信号、线性过滤信号以及远端信号声学特征合并,通过预先训练的二维卷积网络得到一组新的特征向量,将新的特征向量与声纹向量做特征合并;
4)合并后的特征向量通过预先训练的多层的递归神经网络模型中进行迭代运算,计算所述声学特征的掩膜;
5)采用所述掩膜对所述线性过滤信号的声学特征进行掩蔽;
6)将经过掩蔽后的所述声学特征与所述麦克风信号的相位进行合成,得到经过回声消除后的近端信号。
上述的一种结合声纹识别和深度学习的回声消除方法,其中:2)步中,从接收的麦克风信号中提取声学特征,所述麦克风信号包括近端信号和远端信号。
上述的一种结合声纹识别和深度学习的回声消除方法,其中:1)步中,预先训练好的包含长短期记忆的递归神经网络模型的声纹编码器构建方法为:收集多个说话人的语音信号,并以此建立语音训练集,通过长短期记忆的递归神经网络对所述语音训练集进行训练;步骤包含:根据所述语音信号的提取单句的声学向量,并与相同说话人和不同的说话人做区分训练,得到一个区分表达声学向量的模型。
上述的一种结合声纹识别和深度学习的回声消除方法,其中:3)步中,预先训练的卷积神经网络和长短期记忆的递归神经网络模型的构建方法包括:确定进行训练时的说话人声为近端和远端参考信号;收集远端信号、近端信号,并以此建立语音训练集,其中所述远端信号为回声信号,所述近端信号与所述回声信号形成麦克风信号;获取近端信号中目标说话人的其他音频信号的声纹向量,将通过估计回声信号、线性过滤信号和参考信号合并后通过所述二维卷积网路,在通过具有长短期记忆的递归神经网络模型得到估计的掩膜,将所述掩膜对所述线性过滤信号的声学特征进行掩蔽,目标就是将掩蔽后的声学特征逼近干净的近端信号声学特征,具体损失函数为幂律压缩重建误差:
本发明相对于现有技术具有如下有益效果:
在进行回声消除时,从接收的麦克风信号中提取声学特征,将声学特征通过预先训练的卷积神经网络得到稳定的多项声学特征向量,再与声纹向量合并,通过预先训练好的长短期记忆递归神经网络模型中进行迭代运算,计算声学特征的掩膜后,采用该掩膜对声学特征进行掩蔽。再将经过掩蔽后的声学特征与麦克风信号的相位进行合成,实现回声消除。由于该方案中采用了目标说话人的声纹信息、卷积神经网络获取稳定的多项特征信息,以及预先训练的递归神经网络模型,从而能够在双讲和非现性失真等情况下实现回声消除,即使在远端信号包含人声的情况下,也可以大大地提高回声消除的效果。
附图说明
图1为具体实施例示意图,长方形框内的操作表示仅在训练时需要计算,灰色底部分的操作包含可训练参数。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
首先,从目标说话人的语音片段中提取声学特征,通过预先训练好的包含递归神经网络模型的声纹编码器,得到表征说话人信息的嵌入式向量,即声纹向量;
在实际工作中,从接收的麦克风信号中提取声学特征,所述麦克风信号包括近端信号和远端信号,通过传统的AEC算法,如通过线性回声消除器,估计出麦克风出现的回声信号,即估计回声信号,同时得到线性方式消除后的包含残留回声的近端信号,即线性过滤信号。
将估计回声信号、线性过滤信号以及远端信号声学特征合并,通过预先训练的二维卷积网络得到一组新的特征向量,将新的特征向量与声纹向量做特征合并;
合并后的特征向量通过预先训练的多层的递归神经网络模型中进行迭代运算,计算所述声学特征的掩膜;
采用所述掩膜对所述线性过滤信号的声学特征进行掩蔽;
将经过掩蔽后的所述声学特征与所述麦克风信号的相位进行合成,得到经过回声消除后的近端信号。
预先训练的包含长短期记忆的递归神经网络模型的声纹编码器构建方法包括:
收集多个说话人的语音信号,并以此建立语音训练集,通过长短期记忆的递归神经网络对所述语音训练集进行训练;
步骤包含:根据所述语音信号的提取单句的声学向量,并与相同说话人和不同的说话人做区分训练,得到一个可以区分表达声学向量的模型;
预先训练的卷积神经网络和长短期记忆的递归神经网络模型的构建方法包括:
确定进行训练时的说话人声为近端和远端(参考)信号;收集远端信号、近端信号,并以此建立语音训练集,其中所述远端信号为回声信号,所述近端信号与所述回声信号形成麦克风信号;获取近端信号中目标说话人的其他音频信号的声纹向量,将通过估计回声信号、线性过滤信号和参考信号合并后通过所述二维卷积网路,在通过具有长短期记忆的递归神经网络模型得到估计的掩膜,将所述掩膜对所述线性过滤信号的声学特征进行掩蔽,目标就是将掩蔽后的声学特征逼近干净的近端信号声学特征,具体损失函数为幂律压缩(power-law compressed)重建误差:
图1为具体实施例示意图,长方形框内的操作表示仅在训练时需要计算,灰色底部分的操作包含可训练参数。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的修改和完善,因此本发明的保护范围当以权利要求书所界定的为准。
Claims (4)
1.一种结合声纹识别和深度学习的回声消除方法,其特征在于:
1)从目标说话人的语音片段中提取声学特征,通过预先训练好的包含递归神经网络模型的声纹编码器得到表征说话人信息的嵌入式向量,即声纹向量;
2)从接收的信号中提取声学特征,所述信号包括近端信号和远端信号,通过AEC算法估计出出现的回声信号,即估计回声信号,同时得到线性方式消除后的包含残留回声的近端信号,即线性过滤信号;
3)将估计回声信号、线性过滤信号以及远端信号声学特征合并,通过预先训练的二维卷积网络得到一组新的特征向量,将新的特征向量与声纹向量做特征合并;
4)合并后的特征向量通过预先训练的多层的递归神经网络模型中进行迭代运算,计算所述声学特征的掩膜;
5)采用所述掩膜对所述线性过滤信号的声学特征进行掩蔽;
6)将经过掩蔽后的所述声学特征与所述麦克风信号的相位进行合成,得到经过回声消除后的近端信号。
2.如权利要求1所述的一种结合声纹识别和深度学习的回声消除方法,其特征在于:2)步中,从接收的麦克风信号中提取声学特征,所述麦克风信号包括近端信号和远端信号。
3.如权利要求2所述的一种结合声纹识别和深度学习的回声消除方法,其特征在于:1)步中,预先训练好的包含长短期记忆的递归神经网络模型的声纹编码器构建方法为:收集多个说话人的语音信号,并以此建立语音训练集,通过长短期记忆的递归神经网络对所述语音训练集进行训练;步骤包含:根据所述语音信号的提取单句的声学向量,并与相同说话人和不同的说话人做区分训练,得到一个区分表达声学向量的模型。
4.如权利要求2所述的一种结合声纹识别和深度学习的回声消除方法,其特征在于:3)步中,预先训练的卷积神经网络和长短期记忆的递归神经网络模型的构建方法包括:确定进行训练时的说话人声为近端和远端参考信号;收集远端信号、近端信号,并以此建立语音训练集,其中所述远端信号为回声信号,所述近端信号与所述回声信号形成麦克风信号;获取近端信号中目标说话人的其他音频信号的声纹向量,将通过估计回声信号、线性过滤信号和参考信号合并后通过所述二维卷积网路,在通过具有长短期记忆的递归神经网络模型得到估计的掩膜,将所述掩膜对所述线性过滤信号的声学特征进行掩蔽,目标就是将掩蔽后的声学特征逼近干净的近端信号声学特征,具体损失函数为幂律压缩重建误差:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011041974.6A CN112259112A (zh) | 2020-09-28 | 2020-09-28 | 一种结合声纹识别和深度学习的回声消除方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011041974.6A CN112259112A (zh) | 2020-09-28 | 2020-09-28 | 一种结合声纹识别和深度学习的回声消除方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112259112A true CN112259112A (zh) | 2021-01-22 |
Family
ID=74234272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011041974.6A Pending CN112259112A (zh) | 2020-09-28 | 2020-09-28 | 一种结合声纹识别和深度学习的回声消除方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112259112A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634933A (zh) * | 2021-03-10 | 2021-04-09 | 北京世纪好未来教育科技有限公司 | 一种回声消除方法、装置、电子设备和可读存储介质 |
CN112687276A (zh) * | 2021-03-11 | 2021-04-20 | 北京世纪好未来教育科技有限公司 | 一种音频信号处理方法、装置及存储介质 |
CN113436633A (zh) * | 2021-06-30 | 2021-09-24 | 平安科技(深圳)有限公司 | 说话人识别方法、装置、计算机设备及存储介质 |
CN113744748A (zh) * | 2021-08-06 | 2021-12-03 | 浙江大华技术股份有限公司 | 一种网络模型的训练方法、回声消除方法及设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006033789A (ja) * | 2004-06-16 | 2006-02-02 | Nippon Telegr & Teleph Corp <Ntt> | 反響路結合量推定方法、反響路結合量推定装置、反響路結合量推定プログラム、エコー抑圧方法、エコー抑圧装置、エコー抑圧プログラム、エコーサプレス方法、エコーサプレッサ、エコーサプレッサプログラム、通信路上の損失量制御方法、通信路上の損失量制御装置、通信路上の損失制御プログラム、多チャネルエコー抑圧方法、多チャネルエコー抑圧装置、多チャネルエコー抑圧プログラム、記録媒体 |
WO2007086360A1 (ja) * | 2006-01-27 | 2007-08-02 | Nap Enterprise Co., Ltd. | 発振・エコーキャンセラーシステム |
CN105915738A (zh) * | 2016-05-30 | 2016-08-31 | 宇龙计算机通信科技(深圳)有限公司 | 回声消除方法、回声消除装置和终端 |
WO2016141773A1 (zh) * | 2015-03-09 | 2016-09-15 | 电信科学技术研究院 | 一种近端语音信号检测方法及装置 |
US9595997B1 (en) * | 2013-01-02 | 2017-03-14 | Amazon Technologies, Inc. | Adaption-based reduction of echo and noise |
CN108022597A (zh) * | 2017-12-15 | 2018-05-11 | 北京远特科技股份有限公司 | 一种声音处理系统、方法及车辆 |
CN109087661A (zh) * | 2018-10-23 | 2018-12-25 | 南昌努比亚技术有限公司 | 语音处理方法、装置、系统及可读存储介质 |
CN109326302A (zh) * | 2018-11-14 | 2019-02-12 | 桂林电子科技大学 | 一种基于声纹比对和生成对抗网络的语音增强方法 |
CN109841206A (zh) * | 2018-08-31 | 2019-06-04 | 大象声科(深圳)科技有限公司 | 一种基于深度学习的回声消除方法 |
CN110838295A (zh) * | 2019-11-17 | 2020-02-25 | 西北工业大学 | 一种模型生成方法、声纹识别方法及对应装置 |
-
2020
- 2020-09-28 CN CN202011041974.6A patent/CN112259112A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006033789A (ja) * | 2004-06-16 | 2006-02-02 | Nippon Telegr & Teleph Corp <Ntt> | 反響路結合量推定方法、反響路結合量推定装置、反響路結合量推定プログラム、エコー抑圧方法、エコー抑圧装置、エコー抑圧プログラム、エコーサプレス方法、エコーサプレッサ、エコーサプレッサプログラム、通信路上の損失量制御方法、通信路上の損失量制御装置、通信路上の損失制御プログラム、多チャネルエコー抑圧方法、多チャネルエコー抑圧装置、多チャネルエコー抑圧プログラム、記録媒体 |
WO2007086360A1 (ja) * | 2006-01-27 | 2007-08-02 | Nap Enterprise Co., Ltd. | 発振・エコーキャンセラーシステム |
US9595997B1 (en) * | 2013-01-02 | 2017-03-14 | Amazon Technologies, Inc. | Adaption-based reduction of echo and noise |
WO2016141773A1 (zh) * | 2015-03-09 | 2016-09-15 | 电信科学技术研究院 | 一种近端语音信号检测方法及装置 |
CN105915738A (zh) * | 2016-05-30 | 2016-08-31 | 宇龙计算机通信科技(深圳)有限公司 | 回声消除方法、回声消除装置和终端 |
CN108022597A (zh) * | 2017-12-15 | 2018-05-11 | 北京远特科技股份有限公司 | 一种声音处理系统、方法及车辆 |
CN109841206A (zh) * | 2018-08-31 | 2019-06-04 | 大象声科(深圳)科技有限公司 | 一种基于深度学习的回声消除方法 |
CN109087661A (zh) * | 2018-10-23 | 2018-12-25 | 南昌努比亚技术有限公司 | 语音处理方法、装置、系统及可读存储介质 |
CN109326302A (zh) * | 2018-11-14 | 2019-02-12 | 桂林电子科技大学 | 一种基于声纹比对和生成对抗网络的语音增强方法 |
CN110838295A (zh) * | 2019-11-17 | 2020-02-25 | 西北工业大学 | 一种模型生成方法、声纹识别方法及对应装置 |
Non-Patent Citations (1)
Title |
---|
范亚超: "《噪声环境下阵列麦克风去混响算法研究》" * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634933A (zh) * | 2021-03-10 | 2021-04-09 | 北京世纪好未来教育科技有限公司 | 一种回声消除方法、装置、电子设备和可读存储介质 |
CN112634933B (zh) * | 2021-03-10 | 2021-06-22 | 北京世纪好未来教育科技有限公司 | 一种回声消除方法、装置、电子设备和可读存储介质 |
CN112687276A (zh) * | 2021-03-11 | 2021-04-20 | 北京世纪好未来教育科技有限公司 | 一种音频信号处理方法、装置及存储介质 |
CN112687276B (zh) * | 2021-03-11 | 2021-06-15 | 北京世纪好未来教育科技有限公司 | 一种音频信号处理方法、装置及存储介质 |
CN113436633A (zh) * | 2021-06-30 | 2021-09-24 | 平安科技(深圳)有限公司 | 说话人识别方法、装置、计算机设备及存储介质 |
CN113436633B (zh) * | 2021-06-30 | 2024-03-12 | 平安科技(深圳)有限公司 | 说话人识别方法、装置、计算机设备及存储介质 |
CN113744748A (zh) * | 2021-08-06 | 2021-12-03 | 浙江大华技术股份有限公司 | 一种网络模型的训练方法、回声消除方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107123430B (zh) | 回声消除方法、装置、会议平板及计算机存储介质 | |
CN109841206B (zh) | 一种基于深度学习的回声消除方法 | |
CN109727604B (zh) | 用于语音识别前端的频域回声消除方法及计算机储存介质 | |
CN112259112A (zh) | 一种结合声纹识别和深度学习的回声消除方法 | |
CN109326299B (zh) | 基于全卷积神经网络的语音增强方法、装置及存储介质 | |
Benesty et al. | Speech enhancement | |
Lee et al. | DNN-based residual echo suppression. | |
CN111885275B (zh) | 语音信号的回声消除方法、装置、存储介质以及电子装置 | |
US20190222691A1 (en) | Data driven echo cancellation and suppression | |
EP1443498B1 (en) | Noise reduction and audio-visual speech activity detection | |
US8392184B2 (en) | Filtering of beamformed speech signals | |
CN107636758A (zh) | 声学回声消除系统和方法 | |
EP1885154A1 (en) | Dereverberation of microphone signals | |
CN112634923B (zh) | 基于指挥调度系统的音频回声消除方法、设备、存储介质 | |
CN107483761A (zh) | 一种回波抑制方法及装置 | |
CN111798860B (zh) | 音频信号处理方法、装置、设备及存储介质 | |
CN107134281A (zh) | 一种自适应回声消除中自适应滤波器系数更新方法 | |
DE60319796T2 (de) | Rauschreduzierung und audiovisuelle Sprachaktivitätsdetektion | |
CN113241085B (zh) | 回声消除方法、装置、设备及可读存储介质 | |
CN112037809A (zh) | 基于多特征流结构深度神经网络的残留回声抑制方法 | |
CN110931027A (zh) | 音频处理方法、装置、电子设备及计算机可读存储介质 | |
CN106796803A (zh) | 用于在音频通信中将语音数据与背景数据分离的方法和装置 | |
CN114792524B (zh) | 音频数据处理方法、装置、程序产品、计算机设备和介质 | |
CN115132215A (zh) | 一种单通道语音增强方法 | |
CN110503967A (zh) | 一种语音增强方法、装置、介质和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |