CN109767783A - 语音增强方法、装置、设备及存储介质 - Google Patents
语音增强方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109767783A CN109767783A CN201910117712.4A CN201910117712A CN109767783A CN 109767783 A CN109767783 A CN 109767783A CN 201910117712 A CN201910117712 A CN 201910117712A CN 109767783 A CN109767783 A CN 109767783A
- Authority
- CN
- China
- Prior art keywords
- signal
- voice signal
- voice
- via voice
- road
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000004927 fusion Effects 0.000 claims abstract description 112
- 238000001914 filtration Methods 0.000 claims abstract description 66
- 239000004568 cement Substances 0.000 claims abstract description 35
- 238000004422 calculation algorithm Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 15
- 238000009499 grossing Methods 0.000 claims description 13
- 238000002156 mixing Methods 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 13
- 230000008569 process Effects 0.000 description 16
- 238000001228 spectrum Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 210000000988 bone and bone Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 244000187801 Carpobrotus edulis Species 0.000 description 1
- 101001120757 Streptococcus pyogenes serotype M49 (strain NZ131) Oleate hydratase Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 229940083712 aldosterone antagonist Drugs 0.000 description 1
- 201000007201 aphasia Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供一种语音增强方法、装置、设备及存储介质。该方法,包括:采集第一路语音信号和第二路语音信号;获取所述第一路语音信号的信噪比;根据所述第一路语音信号的信噪比,确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数;根据所述融合系数,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。从而实现了根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数,从而改善语音融合后的信号质量,提升语音增强的效果。
Description
技术领域
本申请涉及语音处理技术领域,尤其涉及一种语音增强方法、装置、设备及存储介质。
背景技术
语音增强是语音信号处理的重要环节,通过对语音信号的增强,可以提高噪声环境下语音的清晰度,可懂度和舒适度,从而改善人的听觉感知效果。在语音处理系统中,对各种语音信号进行处理之前,往往需要先进行语音增强处理,从而减小噪声对语音处理系统的影响。
目前,一般采用将非空气传导语音传感器和空气传导语音传感器结合的方式来改善语音质量。根据非空气传导语音传感器确定有声/无声段,并将确定的有声段表示应用于空气传导语音传感器,以取出其中的语音信号。
但是,非空气传导语音传感器的高频语音信号容易受到高频噪声的干扰,导致高频部分的语音信号损失严重,从而影响输出的语音信号的质量。
发明内容
本发明提供一种语音增强方法、装置、设备及存储介质,可以根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数,从而改善语音融合后的信号质量,提升语音增强的效果。
第一方面,本发明实施例提供一种语音增强方法,包括:
采集第一路语音信号和第二路语音信号;
获取所述第一路语音信号的信噪比;
根据所述第一路语音信号的信噪比,确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数;
根据所述融合系数,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。
可选地,采集第一路语音信号和第二路语音信号,包括:
通过空气传导语音传感器采集第一路语音信号,通过非空气传导语音传感器采集第二路语音信号;其中,所述非空气传导语音传感器包括:骨传导语音感器;所述空气传导语音传感器包括:麦克风。
可选地,获取所述第一路语音信号的信噪比,包括:
对所述第一路语音信号进行预处理,得到预处理信号;
对所述预处理信号进行傅里叶转换处理,得到对应的频域信号;
估计所述频域信号的噪声功率,并基于所述噪声功率得到所述第一路语音信号的信噪比。
可选地,在获取所述第一路语音信号的信噪比之后,还包括:
根据所述第一路语音信号的信噪比,确定所述第一路语音信号对应的第一滤波器的截止频率,以及所述第二路语音信号对应的第二滤波器的截止频率;
通过所述第一滤波器对所述第一路语音信号进行滤波处理,得到第一滤波信号;通过所述第二滤波器对所述第二路语音信号进行滤波处理,得第二滤波信号。
可选地,根据所述第一路语音信号的信噪比,确定所述第一路语音信号对应的第一滤波器的截止频率,以及所述第二路语音信号对应的第二滤波器的截止频率,包括:
获取所述第一路语音信号的每一帧语音的先验信噪比;
确定预设的频段范围内,先验信噪比连续变大的频点数;
根据所述频率数、所述第一路语音信号的采样频率、傅里叶变换的采样点数,计算得到所述第一滤波器和第二滤波器的截止频率。
可选地,根据所述第一路语音信号的信噪比,确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数,包括:
构建融合系数的解算模型,所述融合系数的解算模型如下:
kλ=γkλ-1+(1-γ)f(SNR)
其中:f(SNR)=0.5·tanh(0.025·SNR)+0.5
kλ=max[0,f(SNR)]或者kλ=min[f(SNR),1]
其中:kλ为第λ帧语音信号的融合系数,γ为融合系数的平滑因子,kλ-1为第λ-1帧语音信号的融合系数,f(SNR)为给定信噪比SNR和融合系数kλ之间的映射函数。
可选地,根据所述融合系数,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号,包括:
采用预设的语音融合算法,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理;其中,预设的语音融合算法的计算公式如下:
s=sbc+k·sac
其中:s为融合后的语音增强信号,sac为第一路语音信号对应的滤波信号,sbc为第二路语音信号对应的滤波信号,k为融合系数。
第二方面,本发明实施例提供一种语音增强装置,包括:
采集模块,用于采集第一路语音信号和第二路语音信号;
获取模块,用于获取所述第一路语音信号的信噪比;
确定模块,用于根据所述第一路语音信号的信噪比,确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数;
融合模块,用于根据所述融合系数,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。
可选地,所述采集模块,具体用于:
通过空气传导语音传感器采集第一路语音信号,通过非空气传导语音传感器采集第二路语音信号;其中,所述非空气传导语音传感器包括:骨传导语音感器;所述空气传导语音传感器包括:麦克风。
可选地,所述获取模块,具体用于:
对所述第一路语音信号进行预处理,得到预处理信号;
对所述预处理信号进行傅里叶转换处理,得到对应的频域信号;
估计所述频域信号的噪声功率,并基于所述噪声功率得到所述第一路语音信号的信噪比。
可选地,还包括:
滤波模块,用于根据所述第一路语音信号的信噪比,确定所述第一路语音信号对应的第一滤波器的截止频率,以及所述第二路语音信号对应的第二滤波器的截止频率;
通过所述第一滤波器对所述第一路语音信号进行滤波处理,得到第一滤波信号;通过所述第二滤波器对所述第二路语音信号进行滤波处理,得第二滤波信号。
可选地,根据所述第一路语音信号的信噪比,确定所述第一路语音信号对应的第一滤波器的截止频率,以及所述第二路语音信号对应的第二滤波器的截止频率,包括:
获取所述第一路语音信号的每一帧语音的先验信噪比;
确定预设的频段范围内,先验信噪比连续变大的频点数;
根据所述频率数、所述第一路语音信号的采样频率、傅里叶变换的采样点数,计算得到所述第一滤波器和第二滤波器的截止频率。
可选地,所述确定模块,具体用于:
构建融合系数的解算模型,所述融合系数的解算模型如下:
kλ=γkλ-1+(1-γ)f(SNR)
其中:f(SNR)=0.5·tanh(0.025·SNR)+0.5
kλ=max[0,f(SNR)]或者kλ=min[f(SNR),1]
其中:kλ为第λ帧语音信号的融合系数,γ为融合系数的平滑因子,kλ-1为第λ-1帧语音信号的融合系数,f(SNR)为给定信噪比SNR和融合系数kλ之间的映射函数。
可选地,所述融合模块,具体用于:
采用预设的语音融合算法,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理;其中,预设的语音融合算法的计算公式如下:
s=sbc+k·sac
其中:s为融合后的语音增强信号,sac为第一路语音信号对应的滤波信号,sbc为第二路语音信号对应的滤波信号,k为融合系数。
第三方面,本发明实施例提供一种语音增强设备,包括:信号处理器和存储器;所述存储器中存储有算法程序,所述信号处理器用于调取所述存储器中的算法程序,执行如第一方面中任一项所述的语音增强方法。
第四方面,本发明实施例提供一种计算机可读存储介质,包括:程序指令,当其在计算机上运行时,使得计算机执行所述程序指令,以实现如第一方面中任一项所述的语音增强方法。
本发明提供的语音增强方法、装置、设备及存储介质,通过采集第一路语音信号和第二路语音信号;获取所述第一路语音信号的信噪比;根据所述第一路语音信号的信噪比,确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数;根据所述融合系数,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。从而实现了根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数,从而改善语音融合后的信号质量,提升语音增强的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一应用场景的原理示意图;
图2为本发明实施例一提供的语音增强方法的流程图;
图3为本发明实施例二提供的语音增强方法的流程图;
图4为本发明实施例提供的高通滤波器和低通滤波器设计图;
图5为本发明实施例三提供的语音增强装置的结构示意图;
图6为本发明实施例四提供的语音增强装置的结构示意图;
图7为本发明实施例五提供的语音增强设备的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开提到的概念。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例,能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面以具体的实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
语音增强是语音信号处理的重要环节,通过对语音信号的增强,可以提高噪声环境下语音的清晰度,可懂度和舒适度,从而改善人的听觉感知效果。在语音处理系统中,对各种语音信号进行处理之前,往往需要先进行语音增强处理,从而减小噪声对语音处理系统的影响。
目前,一般采用将非空气传导语音传感器和空气传导语音传感器结合的方式来改善语音质量。根据非空气传导语音传感器确定有声/无声段,并将确定的有声段表示应用于空气传导语音传感器,以取出其中的语音信号。这是利用在带噪情况下,空气传导语音传感器语音的频谱很杂乱,没有规律。而骨传导传感器语音,具有低频信号完整、频谱干净的特点,且不易受外界噪声的影响。
但是,现有的传统单通道降噪性能严重依赖于噪声估计的准确性,噪声估计过大容易噪声语音损失,残留音乐噪声,噪声估计过小则残留噪声严重,影响语音的可懂度;而现有根据骨传导语音的特点,将非空气传导传感器语音的低频代替受噪声干扰的空气传导传感器低频,然后与空气传导传感器语音高频叠加,重新合成语音信号。这种做法在空气传导传感器语音的高频同样受到严重噪声干扰,很难得到高质量的语音;而现有的骨传导语音和空气传导语音之间的融合并没有考虑SNR(Signal to Noise Ratio,信噪比)的影响并且融合系数固定,很难具有对环境的自适应;此外骨传导传感器语音、空气传导传感器干净语音和带噪语音之间映射虽然效果很好,但是模型的建立比较复杂,算法资源开销太大,不利于可穿戴设备的采用。
本发明提供一种语音增强方法,可以根据环境噪声SNR来自适应的调整骨传导语音和空气传导语音的融合系数,这种做法可以避免单通道语音增强中对于噪声估计的依赖,可以适应环境噪声的变化和空气传导语音的高频受到严重噪声干扰的场景,能很好的消除背景噪声和残余音乐噪声。本发明提供的语音增强方法,能够运用于语音信号处理技术领域,并适用于低功耗语音增强、语音识别、语音交互产品中,包括但不限于耳机、助听器、手机、可穿戴设备、智能家居等。
在具体的实现过程中,图1为本发明一应用场景的原理示意图,如图1所示,yac表示通过空气传导语音传感器采集的第一路语音信号,ybc表示通过非空气传导语音传感器采集的第二路语音信号。其中,非空气传导语音传感器包括:骨传导语音感器;空气传导语音传感器包括:麦克风。然后,对一路语音信号进行处理,获取第一路语音信号的信噪比SNR。具体地,对第一路语音信号进行预处理,得到预处理信号;对预处理信号傅里叶转换处理,得到对应的频域信号;估计频域信号的噪声功率,并基于噪声功率得到第一路语音信号的信噪比。然后,根据第一路语音信号的信噪比,确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数k。可选地,还可以根据第一路语音信号的信噪比自适应地计算出滤波器的截止频率,从而通对应的滤波器得到第一滤波信号sac和得第二滤波信号sbc。最后,根据融合系数k,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号S。
应用上述方法可以实现根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数,从而改善语音融合后的信号质量,提升语音增强的效果。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图2为本发明实施例一提供的语音增强方法的流程图,如图2所示,本实施例中的方法可以包括:
S101、采集第一路语音信号和第二路语音信号。
本实施例中,通过空气传导语音传感器采集第一路语音信号,通过非空气传导语音传感器采集第二路语音信号;其中,非空气传导语音传感器包括:骨传导语音感器;空气传导语音传感器包括:麦克风。
S102、获取第一路语音信号的信噪比。
本实施例中,对第一路语音信号进行预处理,得到预处理信号;对预处理信号进行傅里叶转换处理,得到对应的频域信号;估计频域信号的噪声功率,并基于噪声功率得到第一路语音信号的信噪比。
具体地,首先对通过空气传导语音传感器采集第一路语音信号进行预处理,主要包括预加重处理,滤除低频成分,增强高频语音成分、重叠加窗处理,以避免帧与帧信号之间重叠导致突变的情况。然后,通过傅里叶转换处理,进行时域信号与频域信号之间的互相转换,以得到第一路信号的频域信号。然后,通过噪声功率估计,尽可能准确估计空气传导的噪声信号,例如采用最小值跟踪方法、时间递归平均算法、基于直方图的算法进行噪声估计。最后,根据估计噪声来计算空气传导语音信号的信噪比,尽可能计算带噪语音信号的信噪比。这里计算信噪比的方法有很多,比如计算每帧信噪比、通过判决引导法计算先验信噪比等。
本实施例中,输入数据流采样率为Fs=8000Hz,数据长度一般处理数据为8ms~30ms之间,本实施例处理数据为64点并且重叠上一帧64个点,则系统算法实际一次处理128个点。首先,需要对原始数据进行预加重处理,提高语音的高频成分,预加重的方法很多,本实施例具体的运算为:
其中,α为平滑因子,取值为0.98,yac(n-1)为预处理前n-1时刻的空气传导语音信号,yac(n)为预处理前n时刻的空气传导语音信号,为预处理以后n时刻空气传导语音信号,n为第n时刻。
预处理中的窗函数必须为保幂映射,即语音信号重叠部分的窗口平方和必须为1,如下所示
w2(N)+w2(N+M)=1
其中,w2(N)为窗函数在第N点取值的平方,w2(N+M)为窗函数在第N+M点取值的平方,N是FFT处理的点数,本发明取值为128,M是帧长度取值为64。窗函数设计根据不同运用场景可选择矩形窗,汉明窗、汉宁窗和高斯窗函数等,实际设计中可灵活选择,本实施例采用恺撒窗(Kaiser Window),重叠50%。
由于本发明的噪声估计和信噪比计算都在频域进行处理,所以在将加权预处理后的信号进行加窗处理,并加加窗后的数据通过FFT变换到频域。
其中,k代表频谱点数,w(n)为窗函数,yw(n,m)为第m帧语音乘窗函数以后n时刻的空气传导语音信号,Yac(m)为空气传导语音信号FFT变换以后频点m处的频谱。
经典的噪声估计主要有基于最小值跟踪算法、时间递归平均算法和基于直方图的算法。本实施例根据实际需求,采用时间递归平均算法MCRA,具体做法如下:
计算平滑带噪语音功率谱密度S(λ,k)
S(λ,k)=αs·S(λ-1,k)+(1-αs)·Sf(λ,k)
其中,λ代表帧数,k代表频点数,S(λ-1,k)为第λ-1帧在频点k处功率谱密度,Sf(λ,k)为第λ帧空气传导语音信号频点平滑以后频点k的功率谱密度,Yac(λ,k-i)为第λ帧频点k-i的空气传导语音信号的频谱。αs为平滑因子,取值为0.8,w(i)为窗函数,窗函数为2Lw+1(Lw=1),本发明选取汉明窗。局部最小值Smin(λ,k)通过在一个D帧(D=100)的固定窗口长度上,通过与过去每一个S(λ,k)值进行对比得到。根据平滑功率谱S(λ,k)与其局部最小值倍数5·Smin(λ,k)之间比较来确定语音存在的概率。当S(λ,k)≥5·Smin(λ,k),p(λ,k)=1,否则p(λ,k)=0。最后得到估计的噪声功率
其中,αd(λ,k)为第λ帧频点k处噪声的平滑系数,为第λ-1帧频点k处估计的噪声功率,Yac(λ,k)为第λ帧频点k的空气传导语音信号的频谱,α为平滑常数,为第λ帧频点k处估计得到的语音存在的概率,为第λ-1帧频点k处估计得到的语音存在的概率,平滑因子αp=0.2,α=0.95。
本实施例需要计算每一帧语音的先验信噪比ξ(λ,k)和整帧信噪比SNR(λ)。每一帧语音的先验信噪比ξ(λ,k)的计算主要采用改进判决引导方法,具体做法如下:
其中,γ(λ,k)为其每一帧的后验信噪比,aξ为平滑因子,取值为0.98,ξmin取值为-15dB;为第λ帧频点k处的先验信噪比,为第λ-1帧频点k处计算的纯净语音信号频谱。
整帧信噪比SNR(λ)的计算公式如下:
S103、根据第一路语音信号的信噪比,确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数。
本实施例中,构建融合系数的解算模型,融合系数的解算模型如下:
kλ=γkλ-1+(1-γ)f(SNR)
其中:f(SNR)=0.5·tanh(0.025·SNR)+0.5
kλ=max[0,f(SNR)]或者kλ=min[f(SNR),1]
其中:kλ为第λ帧语音信号的融合系数,γ为融合系数的平滑因子,kλ-1为第λ-1帧语音信号的融合系数,f(SNR)为给定信噪比SNR和融合系数kλ之间的映射函数。本实施例中,平滑常数γ选择0.95。
S104、根据融合系数,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。
本实施例中,采用预设的语音融合算法,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理;其中,预设的语音融合算法的计算公式如下:
s=sbc+k·sac
其中:s为融合后的语音增强信号,sac为第一路语音信号对应的滤波信号,sbc为第二路语音信号对应的滤波信号,k为融合系数。
本实施例,通过采集第一路语音信号和第二路语音信号;获取第一路语音信号的信噪比;根据第一路语音信号的信噪比,确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数;根据融合系数,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。从而实现了根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数,从而改善语音融合后的信号质量,提升语音增强的效果。
图3为本发明实施例二提供的语音增强方法的流程图,如图3所示,本实施例中的方法可以包括:
S201、采集第一路语音信号和第二路语音信号。
S202、获取第一路语音信号的信噪比。
本实施例中,步骤S201~步骤S202的具体实现过程和技术原理请参见图2所示的方法中步骤S101~步骤S102中的相关描述,此处不再赘述。
S203、根据第一路语音信号的信噪比,得到第一滤波信号和得第二滤波信号。
本实施例中,根据第一路语音信号的信噪比,确定第一路语音信号对应的第一滤波器的截止频率,以及第二路语音信号对应的第二滤波器的截止频率;通过第一滤波器对第一路语音信号进行滤波处理,得到第一滤波信号;通过第二滤波器对第二路语音信号进行滤波处理,得第二滤波信号。
在一种可选的实施方式中,获取第一路语音信号的每一帧语音的先验信噪比;确定预设的频段范围内,先验信噪比连续变大的频点数;根据频率数、第一路语音信号的采样频率、傅里叶变换的采样点数,计算得到第一滤波器和第二滤波器的截止频率。
具体地,高通滤波器和低通滤波器的截止频率受每一帧语音的先验信噪比ξ(λ,k)的自适应调整。具体处理流程如下所示:
首先,选取ξ(λ,k)的低频部分然后,计算两点之间的斜率。然后,选取斜率连续变大或者寻找到先验信噪比连续变大的频点数k。图4为本发明实施例提供的高通滤波器和低通滤波器设计图,如图4所示,低通滤波器和高通滤波器的截止频率为:
fcl=min[k·fs/N+200,2000]
fch=max[k·fs/N-200,800]
其中,fcl为低通滤波器的截止频率,fch为高通滤波器的截止频率,N代表FFT的点数,fs为采样率,此处fs=8000Hz。
S204、根据第一路语音信号的信噪比,确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数。
S205、根据融合系数,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。
本实施例中,步骤S204~步骤S205的具体实现过程和技术原理请参见图2所示的方法中步骤S103~步骤S104中的相关描述,此处不再赘述。
本实施例,通过采集第一路语音信号和第二路语音信号;获取第一路语音信号的信噪比;根据第一路语音信号的信噪比,确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数;根据融合系数,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。从而实现了根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数,从而改善语音融合后的信号质量,提升语音增强的效果。
另外,本实施还可以根据第一路语音信号的信噪比,确定第一路语音信号对应的第一滤波器的截止频率,以及第二路语音信号对应的第二滤波器的截止频率;通过第一滤波器对第一路语音信号进行滤波处理,得到第一滤波信号;通过第二滤波器对第二路语音信号进行滤波处理,得第二滤波信号。从而改善语音融合后的信号质量,提升语音增强的效果。
图5为本发明实施例三提供的语音增强装置的结构示意图,如图5所示,本实施例的语音增强装置可以包括:
采集模块31,用于采集第一路语音信号和第二路语音信号;
获取模块32,用于获取第一路语音信号的信噪比;
确定模块33,用于根据第一路语音信号的信噪比,确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数;
融合模块34,用于根据融合系数,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。
可选地,采集模块31,具体用于:
通过空气传导语音传感器采集第一路语音信号,通过非空气传导语音传感器采集第二路语音信号;其中,非空气传导语音传感器包括:骨传导语音感器;空气传导语音传感器包括:麦克风。
可选地,获取模块32,具体用于:
对第一路语音信号进行预处理,得到预处理信号;
对预处理信号傅里叶转换处理,得到对应的频域信号;
估计频域信号的噪声功率,并基于噪声功率得到第一路语音信号的信噪比。
可选地,确定模块33,具体用于:
构建融合系数的解算模型,融合系数的解算模型如下:
kλ=γkλ-1+(1-γ)f(SNR)
其中:f(SNR)=0.5·tanh(0.025·SNR)+0.5
kλ=max[0,f(SNR)]或者kλ=min[f(SNR),1]
其中:kλ为第λ帧语音信号的融合系数,γ为融合系数的平滑因子,kλ-1为第λ-1帧语音信号的融合系数,f(SNR)为给定信噪比SNR和融合系数kλ之间的映射函数。
可选地,融合模块34,具体用于:
采用预设的语音融合算法,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理;其中,预设的语音融合算法的计算公式如下:
s=sbc+k·sac
其中:s为融合后的语音增强信号,sac为第一路语音信号对应的滤波信号,sbc为第二路语音信号对应的滤波信号,k为融合系数。
本实施例的语音增强装置,可以执行图2所示方法中的技术方案,其具体实现过程和技术原理参见图2所示方法中的相关描述,此处不再赘述。
本实施例,通过采集第一路语音信号和第二路语音信号;获取第一路语音信号的信噪比;根据第一路语音信号的信噪比,确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数;根据融合系数,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。从而实现了根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数,从而改善语音融合后的信号质量,提升语音增强的效果。
图6为本发明实施例四提供的语音增强装置的结构示意图,如图6所示,本实施例的语音增强装置在图5所示装置的基础上,还可以包括:
滤波模块35,用于根据第一路语音信号的信噪比,确定第一路语音信号对应的第一滤波器的截止频率,以及第二路语音信号对应的第二滤波器的截止频率;
通过第一滤波器对第一路语音信号进行滤波处理,得到第一滤波信号;通过第二滤波器对第二路语音信号进行滤波处理,得第二滤波信号。
可选地,根据第一路语音信号的信噪比,确定第一路语音信号对应的第一滤波器的截止频率,以及第二路语音信号对应的第二滤波器的截止频率,包括:
获取第一路语音信号的每一帧语音的先验信噪比;
确定预设的频段范围内,先验信噪比连续变大的频点数;
根据频率数、第一路语音信号的采样频率、傅里叶变换的采样点数,计算得到第一滤波器和第二滤波器的截止频率。
本实施例的语音增强装置,可以执行图2、图3所示方法中的技术方案,其具体实现过程和技术原理参见图2、图3所示方法中的相关描述,此处不再赘述。
本实施例,通过采集第一路语音信号和第二路语音信号;获取第一路语音信号的信噪比;根据第一路语音信号的信噪比,确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数;根据融合系数,对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。从而实现了根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数,从而改善语音融合后的信号质量,提升语音增强的效果。
另外,本实施还可以根据第一路语音信号的信噪比,确定第一路语音信号对应的第一滤波器的截止频率,以及第二路语音信号对应的第二滤波器的截止频率;通过第一滤波器对第一路语音信号进行滤波处理,得到第一滤波信号;通过第二滤波器对第二路语音信号进行滤波处理,得第二滤波信号。从而改善语音融合后的信号质量,提升语音增强的效果。
图7为本发明实施例五提供的语音增强设备的结构示意图,如图7所示,本实施例中的语音增强设备40包括:
信号处理器41以及存储器42;其中:
存储器42,用于存储可执行指令,该存储器还可以是flash(闪存)。
信号处理器41,用于执行存储器存储的可执行指令,以实现上述实施例涉及的方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。
可选地,存储器42既可以是独立的,也可以跟信号处理器41集成在一起。
当存储器42是独立于信号处理器41之外的器件时,语音增强设备40还可以包括:
总线43,用于连接存储器42和信号处理器41。
本实施例中的语音增强设备可以执行图2、图3所示的方法,其具体实现过程和技术原理参见图2、图3所示方法中的相关描述,此处不再赘述。
此外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当用户设备的至少一个信号处理器执行该计算机执行指令时,用户设备执行上述各种可能的方法。
其中,计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于应用专用集成电路(ASIC)中。另外,该应用专用集成电路可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。
Claims (16)
1.一种语音增强方法,其特征在于,包括:
采集第一路语音信号和第二路语音信号;
获取所述第一路语音信号的信噪比;
根据所述第一路语音信号的信噪比,确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数;
根据所述融合系数,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。
2.根据权利要求1所述的方法,其特征在于,采集第一路语音信号和第二路语音信号,包括:
通过空气传导语音传感器采集第一路语音信号,通过非空气传导语音传感器采集第二路语音信号;其中,所述非空气传导语音传感器包括:骨传导语音感器;所述空气传导语音传感器包括:麦克风。
3.根据权利要求1所述的方法,其特征在于,获取所述第一路语音信号的信噪比,包括:
对所述第一路语音信号进行预处理,得到预处理信号;
对所述预处理信号进行傅里叶转换处理,得到对应的频域信号;
估计所述频域信号的噪声功率,并基于所述噪声功率得到所述第一路语音信号的信噪比。
4.根据权利要求1所述的方法,其特征在于,在获取所述第一路语音信号的信噪比之后,还包括:
根据所述第一路语音信号的信噪比,确定所述第一路语音信号对应的第一滤波器的截止频率,以及所述第二路语音信号对应的第二滤波器的截止频率;
通过所述第一滤波器对所述第一路语音信号进行滤波处理,得到第一滤波信号;通过所述第二滤波器对所述第二路语音信号进行滤波处理,得第二滤波信号。
5.根据权利要求4所述的方法,其特征在于,根据所述第一路语音信号的信噪比,确定所述第一路语音信号对应的第一滤波器的截止频率,以及所述第二路语音信号对应的第二滤波器的截止频率,包括:
获取所述第一路语音信号的每一帧语音的先验信噪比;
确定预设的频段范围内,先验信噪比连续变大的频点数;
根据所述频率数、所述第一路语音信号的采样频率、傅里叶变换的采样点数,计算得到所述第一滤波器和第二滤波器的截止频率。
6.根据权利要求1所述的方法,其特征在于,根据所述第一路语音信号的信噪比,确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数,包括:
构建融合系数的解算模型,所述融合系数的解算模型如下:
kλ=γkλ-1+(1-γ)f(SNR)
其中:f(SNR)=0.5·tanh(0.025·SNR)+0.5
kλ=max[0,f(SNR)]或者kλ=min[f(SNR),1]
其中:kλ为第λ帧语音信号的融合系数,γ为融合系数的平滑因子,kλ-1为第λ-1帧语音信号的融合系数,f(SNR)为给定信噪比SNR和融合系数kλ之间的映射函数。
7.根据权利要求6所述的方法,其特征在于,根据所述融合系数,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号,包括:
采用预设的语音融合算法,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理;其中,预设的语音融合算法的计算公式如下:
s=sbc+k·sac
其中:s为融合后的语音增强信号,sac为第一路语音信号对应的滤波信号,sbc为第二路语音信号对应的滤波信号,k为融合系数。
8.一种语音增强装置,其特征在于,包括:
采集模块,用于采集第一路语音信号和第二路语音信号;
获取模块,用于获取所述第一路语音信号的信噪比;
确定模块,用于根据所述第一路语音信号的信噪比,确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数;
融合模块,用于根据所述融合系数,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理,得到语音增强信号。
9.根据权利要求8所述的装置,其特征在于,所述采集模块,具体用于:
通过空气传导语音传感器采集第一路语音信号,通过非空气传导语音传感器采集第二路语音信号;其中,所述非空气传导语音传感器包括:骨传导语音感器;所述空气传导语音传感器包括:麦克风。
10.根据权利要求8所述的装置,其特征在于,所述获取模块,具体用于:
对所述第一路语音信号进行预处理,得到预处理信号;
对所述预处理信号进行傅里叶转换处理,得到对应的频域信号;
估计所述频域信号的噪声功率,并基于所述噪声功率得到所述第一路语音信号的信噪比。
11.根据权利要求8所述的装置,其特征在于,还包括:
滤波模块,用于根据所述第一路语音信号的信噪比,确定所述第一路语音信号对应的第一滤波器的截止频率,以及所述第二路语音信号对应的第二滤波器的截止频率;
通过所述第一滤波器对所述第一路语音信号进行滤波处理,得到第一滤波信号;通过所述第二滤波器对所述第二路语音信号进行滤波处理,得第二滤波信号。
12.根据权利要求11所述的装置,其特征在于,根据所述第一路语音信号的信噪比,确定所述第一路语音信号对应的第一滤波器的截止频率,以及所述第二路语音信号对应的第二滤波器的截止频率,包括:
获取所述第一路语音信号的每一帧语音的先验信噪比;
确定预设的频段范围内,先验信噪比连续变大的频点数;
根据所述频率数、所述第一路语音信号的采样频率、傅里叶变换的采样点数,计算得到所述第一滤波器和第二滤波器的截止频率。
13.根据权利要求8所述的装置,其特征在于,所述确定模块,具体用于:
构建融合系数的解算模型,所述融合系数的解算模型如下:
kλ=γkλ-1+(1-γ)f(SNR)
其中:f(SNR)=0.5·tanh(0.025·SNR)+0.5
kλ=max[0,f(SNR)]或者kλ=min[f(SNR),1]
其中:kλ为第λ帧语音信号的融合系数,γ为融合系数的平滑因子,kλ-1为第λ-1帧语音信号的融合系数,f(SNR)为给定信噪比SNR和融合系数kλ之间的映射函数。
14.根据权利要求13所述的装置,其特征在于,所述融合模块,具体用于:
采用预设的语音融合算法,对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理;其中,预设的语音融合算法的计算公式如下:
s=sbc+k·sac
其中:s为融合后的语音增强信号,sac为第一路语音信号对应的滤波信号,sbc为第二路语音信号对应的滤波信号,k为融合系数。
15.一种语音增强设备,其特征在于,包括:信号处理器和存储器;所述存储器中存储有算法程序,所述信号处理器用于调取所述存储器中的算法程序,执行如权利要求1-7中任一项所述的语音增强方法。
16.一种计算机可读存储介质,其特征在于,包括:程序指令,当其在计算机上运行时,使得计算机执行所述程序指令,以实现如权利要求1-7中任一项所述的语音增强方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910117712.4A CN109767783B (zh) | 2019-02-15 | 2019-02-15 | 语音增强方法、装置、设备及存储介质 |
EP19204922.9A EP3696814A1 (en) | 2019-02-15 | 2019-10-23 | Speech enhancement method and apparatus, device and storage medium |
US16/661,935 US11056130B2 (en) | 2019-02-15 | 2019-10-23 | Speech enhancement method and apparatus, device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910117712.4A CN109767783B (zh) | 2019-02-15 | 2019-02-15 | 语音增强方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109767783A true CN109767783A (zh) | 2019-05-17 |
CN109767783B CN109767783B (zh) | 2021-02-02 |
Family
ID=66456728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910117712.4A Active CN109767783B (zh) | 2019-02-15 | 2019-02-15 | 语音增强方法、装置、设备及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11056130B2 (zh) |
EP (1) | EP3696814A1 (zh) |
CN (1) | CN109767783B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110265056A (zh) * | 2019-06-11 | 2019-09-20 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备、装置 |
CN110782912A (zh) * | 2019-10-10 | 2020-02-11 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备 |
CN111009253A (zh) * | 2019-11-29 | 2020-04-14 | 联想(北京)有限公司 | 一种数据处理方法和装置 |
CN111464918A (zh) * | 2020-01-31 | 2020-07-28 | 美律电子(深圳)有限公司 | 耳机及耳机组 |
CN111524524A (zh) * | 2020-04-28 | 2020-08-11 | 平安科技(深圳)有限公司 | 声纹识别方法、装置、设备及存储介质 |
CN111565349A (zh) * | 2020-04-21 | 2020-08-21 | 深圳鹤牌光学声学有限公司 | 一种基于骨传导传声装置的重低音传声方法 |
CN111988702A (zh) * | 2020-08-25 | 2020-11-24 | 歌尔科技有限公司 | 音频信号的处理方法、电子设备及存储介质 |
CN112289337A (zh) * | 2020-11-03 | 2021-01-29 | 北京声加科技有限公司 | 一种滤除机器学习语音增强后的残留噪声的方法及装置 |
WO2021043412A1 (en) * | 2019-09-05 | 2021-03-11 | Huawei Technologies Co., Ltd. | Noise reduction in a headset by employing a voice accelerometer signal |
CN112562635A (zh) * | 2020-12-03 | 2021-03-26 | 云知声智能科技股份有限公司 | 解决语音合成中拼接处产生脉冲信号的方法、装置及系统 |
CN112581970A (zh) * | 2019-09-12 | 2021-03-30 | 深圳市韶音科技有限公司 | 用于音频信号生成的系统和方法 |
WO2021068120A1 (zh) * | 2019-10-09 | 2021-04-15 | 大象声科(深圳)科技有限公司 | 一种融合骨振动传感器和麦克风信号的深度学习语音提取和降噪方法 |
CN112714376A (zh) * | 2019-10-24 | 2021-04-27 | 瑞昱半导体股份有限公司 | 收音装置及方法 |
CN112767963A (zh) * | 2021-01-28 | 2021-05-07 | 歌尔科技有限公司 | 一种语音增强方法、装置、系统及计算机可读存储介质 |
CN113421580A (zh) * | 2021-08-23 | 2021-09-21 | 深圳市中科蓝讯科技股份有限公司 | 降噪方法、存储介质、芯片及电子设备 |
CN113421583A (zh) * | 2021-08-23 | 2021-09-21 | 深圳市中科蓝讯科技股份有限公司 | 降噪方法、存储介质、芯片及电子设备 |
US11902759B2 (en) | 2019-09-12 | 2024-02-13 | Shenzhen Shokz Co., Ltd. | Systems and methods for audio signal generation |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112599145A (zh) * | 2020-12-07 | 2021-04-02 | 天津大学 | 基于生成对抗网络的骨传导语音增强方法 |
CN112992167A (zh) * | 2021-02-08 | 2021-06-18 | 歌尔科技有限公司 | 音频信号的处理方法、装置及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090164212A1 (en) * | 2007-12-19 | 2009-06-25 | Qualcomm Incorporated | Systems, methods, and apparatus for multi-microphone based speech enhancement |
CN101685638A (zh) * | 2008-09-25 | 2010-03-31 | 华为技术有限公司 | 一种语音信号增强方法及装置 |
CN101807404A (zh) * | 2010-03-04 | 2010-08-18 | 清华大学 | 一种电子耳蜗前端指向性语音增强的预处理系统 |
CN109102822A (zh) * | 2018-07-25 | 2018-12-28 | 出门问问信息科技有限公司 | 一种基于固定波束形成的滤波方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2458586A1 (en) | 2010-11-24 | 2012-05-30 | Koninklijke Philips Electronics N.V. | System and method for producing an audio signal |
CN102347027A (zh) * | 2011-07-07 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及其语音增强方法 |
US8880394B2 (en) * | 2011-08-18 | 2014-11-04 | Texas Instruments Incorporated | Method, system and computer program product for suppressing noise using multiple signals |
CN110070880B (zh) * | 2016-01-14 | 2023-07-28 | 深圳市韶音科技有限公司 | 用于分类的联合统计模型的建立方法及应用方法 |
WO2017190219A1 (en) | 2016-05-06 | 2017-11-09 | Eers Global Technologies Inc. | Device and method for improving the quality of in- ear microphone signals in noisy environments |
US10224053B2 (en) | 2017-03-24 | 2019-03-05 | Hyundai Motor Company | Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering |
-
2019
- 2019-02-15 CN CN201910117712.4A patent/CN109767783B/zh active Active
- 2019-10-23 US US16/661,935 patent/US11056130B2/en active Active
- 2019-10-23 EP EP19204922.9A patent/EP3696814A1/en not_active Ceased
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090164212A1 (en) * | 2007-12-19 | 2009-06-25 | Qualcomm Incorporated | Systems, methods, and apparatus for multi-microphone based speech enhancement |
CN101685638A (zh) * | 2008-09-25 | 2010-03-31 | 华为技术有限公司 | 一种语音信号增强方法及装置 |
CN101807404A (zh) * | 2010-03-04 | 2010-08-18 | 清华大学 | 一种电子耳蜗前端指向性语音增强的预处理系统 |
CN109102822A (zh) * | 2018-07-25 | 2018-12-28 | 出门问问信息科技有限公司 | 一种基于固定波束形成的滤波方法及装置 |
Non-Patent Citations (2)
Title |
---|
JUNLEI SONG ET AL.: "《Research on Digital Hearing Aid Speech Enhancement Algorithm》", 《PROCEEDINGS OF THE 37TH CHINESE CONTROL CONFERENCE》 * |
王方杰等: "《基于谐波重构滤波的数字助听器语音增强算法》", 《电子器件》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110265056B (zh) * | 2019-06-11 | 2021-09-17 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备、装置 |
CN110265056A (zh) * | 2019-06-11 | 2019-09-20 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备、装置 |
WO2021043412A1 (en) * | 2019-09-05 | 2021-03-11 | Huawei Technologies Co., Ltd. | Noise reduction in a headset by employing a voice accelerometer signal |
US11902759B2 (en) | 2019-09-12 | 2024-02-13 | Shenzhen Shokz Co., Ltd. | Systems and methods for audio signal generation |
CN112581970A (zh) * | 2019-09-12 | 2021-03-30 | 深圳市韶音科技有限公司 | 用于音频信号生成的系统和方法 |
WO2021068120A1 (zh) * | 2019-10-09 | 2021-04-15 | 大象声科(深圳)科技有限公司 | 一种融合骨振动传感器和麦克风信号的深度学习语音提取和降噪方法 |
KR102429152B1 (ko) * | 2019-10-09 | 2022-08-03 | 엘레복 테크놀로지 컴퍼니 리미티드 | 골진동 센서 및 마이크로폰 신호를 융합한 딥 러닝 음성 추출 및 노이즈 저감 방법 |
KR20210043485A (ko) * | 2019-10-09 | 2021-04-21 | 엘레복 테크놀로지 컴퍼니 리미티드 | 골진동 센서 및 마이크로폰 신호를 융합한 딥 러닝 음성 추출 및 노이즈 저감 방법 |
CN110782912A (zh) * | 2019-10-10 | 2020-02-11 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备 |
CN112714376A (zh) * | 2019-10-24 | 2021-04-27 | 瑞昱半导体股份有限公司 | 收音装置及方法 |
CN112714376B (zh) * | 2019-10-24 | 2023-07-25 | 瑞昱半导体股份有限公司 | 收音装置及方法 |
CN111009253B (zh) * | 2019-11-29 | 2022-10-21 | 联想(北京)有限公司 | 一种数据处理方法和装置 |
CN111009253A (zh) * | 2019-11-29 | 2020-04-14 | 联想(北京)有限公司 | 一种数据处理方法和装置 |
CN111464918A (zh) * | 2020-01-31 | 2020-07-28 | 美律电子(深圳)有限公司 | 耳机及耳机组 |
CN111565349A (zh) * | 2020-04-21 | 2020-08-21 | 深圳鹤牌光学声学有限公司 | 一种基于骨传导传声装置的重低音传声方法 |
CN111524524B (zh) * | 2020-04-28 | 2021-10-22 | 平安科技(深圳)有限公司 | 声纹识别方法、装置、设备及存储介质 |
CN111524524A (zh) * | 2020-04-28 | 2020-08-11 | 平安科技(深圳)有限公司 | 声纹识别方法、装置、设备及存储介质 |
CN111988702A (zh) * | 2020-08-25 | 2020-11-24 | 歌尔科技有限公司 | 音频信号的处理方法、电子设备及存储介质 |
CN111988702B (zh) * | 2020-08-25 | 2022-02-25 | 歌尔科技有限公司 | 音频信号的处理方法、电子设备及存储介质 |
WO2022041485A1 (zh) * | 2020-08-25 | 2022-03-03 | 歌尔股份有限公司 | 音频信号的处理方法、电子设备及存储介质 |
CN112289337B (zh) * | 2020-11-03 | 2023-09-01 | 北京声加科技有限公司 | 一种滤除机器学习语音增强后的残留噪声的方法及装置 |
CN112289337A (zh) * | 2020-11-03 | 2021-01-29 | 北京声加科技有限公司 | 一种滤除机器学习语音增强后的残留噪声的方法及装置 |
CN112562635B (zh) * | 2020-12-03 | 2024-04-09 | 云知声智能科技股份有限公司 | 解决语音合成中拼接处产生脉冲信号的方法、装置及系统 |
CN112562635A (zh) * | 2020-12-03 | 2021-03-26 | 云知声智能科技股份有限公司 | 解决语音合成中拼接处产生脉冲信号的方法、装置及系统 |
WO2022160593A1 (zh) * | 2021-01-28 | 2022-08-04 | 歌尔股份有限公司 | 一种语音增强方法、装置、系统及计算机可读存储介质 |
CN112767963A (zh) * | 2021-01-28 | 2021-05-07 | 歌尔科技有限公司 | 一种语音增强方法、装置、系统及计算机可读存储介质 |
CN113421583B (zh) * | 2021-08-23 | 2021-11-05 | 深圳市中科蓝讯科技股份有限公司 | 降噪方法、存储介质、芯片及电子设备 |
US11664003B2 (en) | 2021-08-23 | 2023-05-30 | Shenzhen Bluetrum Technology Co., Ltd. | Method for reducing noise, storage medium, chip and electronic equipment |
US11670279B2 (en) | 2021-08-23 | 2023-06-06 | Shenzhen Bluetrum Technology Co., Ltd. | Method for reducing noise, storage medium, chip and electronic equipment |
CN113421580B (zh) * | 2021-08-23 | 2021-11-05 | 深圳市中科蓝讯科技股份有限公司 | 降噪方法、存储介质、芯片及电子设备 |
CN113421583A (zh) * | 2021-08-23 | 2021-09-21 | 深圳市中科蓝讯科技股份有限公司 | 降噪方法、存储介质、芯片及电子设备 |
CN113421580A (zh) * | 2021-08-23 | 2021-09-21 | 深圳市中科蓝讯科技股份有限公司 | 降噪方法、存储介质、芯片及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
EP3696814A1 (en) | 2020-08-19 |
US20200265857A1 (en) | 2020-08-20 |
CN109767783B (zh) | 2021-02-02 |
US11056130B2 (en) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109767783A (zh) | 语音增强方法、装置、设备及存储介质 | |
ES2347760T3 (es) | Procedimiento y dispositivo de reduccion de ruido. | |
CN103632677B (zh) | 带噪语音信号处理方法、装置及服务器 | |
EP2416315A1 (en) | Noise suppression device | |
KR20220062598A (ko) | 오디오 신호 생성을 위한 시스템 및 방법 | |
CN103544961B (zh) | 语音信号处理方法及装置 | |
JP6374120B2 (ja) | 発話の復元のためのシステムおよび方法 | |
WO2020168981A1 (zh) | 风噪声抑制方法及装置 | |
CN105845149A (zh) | 声音信号中主音高的获取方法及系统 | |
CN109473091A (zh) | 一种语音样本生成方法及装置 | |
CN108847253A (zh) | 车辆型号识别方法、装置、计算机设备及存储介质 | |
US6701291B2 (en) | Automatic speech recognition with psychoacoustically-based feature extraction, using easily-tunable single-shape filters along logarithmic-frequency axis | |
CN112259116A (zh) | 一种音频数据的降噪方法、装置、电子设备及存储介质 | |
KR20110021419A (ko) | 복소 스펙트럼 잡음 제거 장치 및 방법 | |
CN111968651A (zh) | 一种基于wt的声纹识别方法及系统 | |
WO2020024787A1 (zh) | 音乐噪声抑制方法及装置 | |
RU2616534C2 (ru) | Ослабление шума при передаче аудиосигналов | |
KR101295727B1 (ko) | 적응적 잡음추정 장치 및 방법 | |
US9159336B1 (en) | Cross-domain filtering for audio noise reduction | |
CN108806721A (zh) | 信号处理器 | |
CN117219102A (zh) | 一种基于听觉感知的低复杂度语音增强方法 | |
CN106782588A (zh) | 一种基于听觉小波包的毫米波生物雷达语音增强方法 | |
CN116168719A (zh) | 一种基于语境分析的声音增益调节方法及系统 | |
CN114566179A (zh) | 一种时延可控的语音降噪方法 | |
Shankar et al. | Noise dependent super gaussian-coherence based dual microphone speech enhancement for hearing aid application using smartphone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |