CN111341340A - 基于相干性和能量比的鲁棒gsc方法 - Google Patents

基于相干性和能量比的鲁棒gsc方法 Download PDF

Info

Publication number
CN111341340A
CN111341340A CN202010129648.4A CN202010129648A CN111341340A CN 111341340 A CN111341340 A CN 111341340A CN 202010129648 A CN202010129648 A CN 202010129648A CN 111341340 A CN111341340 A CN 111341340A
Authority
CN
China
Prior art keywords
coherence
energy ratio
signal
gsc
robust
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010129648.4A
Other languages
English (en)
Inventor
蒋青松
周翊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202010129648.4A priority Critical patent/CN111341340A/zh
Publication of CN111341340A publication Critical patent/CN111341340A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及一种基于相干性和能量比的鲁棒GSC方法,属于麦克风阵列语音增强技术领域,包括以下步骤:S1:在上支路部分使用超指向固定波束形成器输出期望信号,并与原始信号求相干性;S2:使用延迟求和固定波束形成器输出信号,并与原始信号在一定频率范围内求信干能量比;S3:用求出的相干性与能量比联合控制自适应噪声相消器ANC的更新。相比于传统的GSC算法,本方案具有更好的低频特性和波束指向性,通过相干性与能量比联合控制ANC更新,防止了ANC在语音段对期望信号的误消问题,具有更强的鲁棒性。

Description

基于相干性和能量比的鲁棒GSC方法
技术领域
本发明属于麦克风阵列语音增强技术领域,涉及一种基于相干性和能量比的鲁棒GSC方法。
背景技术
近年来,随着人工智能的火热发展,语音作为人机交互的重要入口受到了广泛关注,国内外对于语音交互的研究又掀起了一个新的高潮。从亚马逊的智能音箱Echo到小米的智能音箱小爱同学,再到百度的小度小度,这些语音交互产品都已经慢慢融入到了我们的生活,而且前端去燥主要用麦克风阵列来抑制噪声,达到语音增强的目的。麦克风阵列利用了语音信号的空间信息,比单通道语音信号有更多的空时信息,具有更高的增益、波束灵活性、抑制噪声能力强等优点。自从上个世纪七十年代以来,麦克风阵列技术已经广泛应用于语音增强,主要包括盲源分离、声源定位、去混响以及鸡尾酒会效应等。
自适应波束形成算法主要有最小方差无失真响应(Minimum VarianceDistortionless Response,MVDR)波束形成算法,线性约束最小方差(LinearlyConstrained Minimun Variance,LCMV)波束形成算法和广义旁瓣消除(GeneralizedSidelobe Cancelling,GSC)波束形成算法,由于GSC把波束形成中的约束问题转化为无约束问题且不需要噪声的先验信息,在工程中应用广泛。在传统的GSC算法中,由于存在下支路期望信号泄露、麦克风不匹配、房间混响、语音段估计不准等问题,容易造成期望信号误消,为解决这一问题,Sven等人提出仅在干扰噪声占据主导时更新自适应噪声相消器,Hoshuyama提出用自适应阻塞矩阵输出来约束滤波器的更新,Cohen等人提出从源信号到麦克风阵列的声学传递函数来避免期望信号对消,但仍存在不足。
发明内容
有鉴于此,本发明的目的在于提供一种新的自适应滤波器系数更新算法,首先用固定波束形成(FBF)后的信号与原始信号求相干性,然后再用FBF后信号与原始信号在一定频率范围内求能量比,最后用信号的相干性和功率比来联合控制自适应噪声相消器的更新,从而进一步提升麦克风阵列算法对不同角度、不同噪声干扰的抑制,并提高鲁棒性。
为达到上述目的,本发明提供如下技术方案:
一种基于相干性和能量比的鲁棒GSC方法,包括以下步骤:
S1:在上支路部分使用超指向波束形成器输出期望信号,并与原始信号求相干性;
S2:使用延迟求和波束形成器输出信号,并与原始信号在一定频率范围内求信干能量比;
S3:用信号的相干性与能量比联合控制自适应噪声相消器(Adaptive NoiseCanceller,ANC)上下的更新。
进一步,步骤S1中所述超指向波束形成器采用超指向波束形成算法,鲁棒性超指向权值矢量为
Figure BDA0002395441350000021
其中,Φn为噪声的归一化协方差矩阵,IM为M阶单位矩阵,ε为经验值常数,输出为
Figure BDA0002395441350000022
进一步,步骤S1中所述求相干性,具体包括:
超指向波束形成器输出后为防止对弱语音段的误判,进行帧间递归平滑,表示为:
Figure BDA0002395441350000023
其中,k为频点,
Figure BDA0002395441350000029
为时间帧,α为平滑因子;
原始信号对齐后为:
Figure BDA0002395441350000028
其中,符号.*为点乘操作,
Figure BDA00023954413500000210
为M个麦克风圆阵的接收信号向量形式,
Figure BDA00023954413500000211
T为转置操作,d(f,θ)为阵列导向矢量,
Figure BDA0002395441350000024
j为虚数单位,ω为角频率,r为圆阵半径,θ为期望方向角速度,φ为麦克风相对于x轴的角度,c为麦克风相对于x轴的声速,上标*表示共轭;
同理,对式(4)进行帧间递归平滑为:
Figure BDA0002395441350000025
对式(3)和(4)求相干取模值得到:
Figure BDA0002395441350000026
其中,ε为很小的常数,防止分母为零;
为防止频点间值突变,对式(6)频点平滑为:
Figure BDA0002395441350000031
式中,min为对大于1的值取值为1,conv为卷积操作,hanning为汉宁窗,L为频点平滑的点数,取L=5;
对相干性系数进行语音段判决,大于一定阈值判定为语音段,小于一定阈值判定为噪声段,中间值则进行线性映射,得到:
Figure BDA0002395441350000032
其中,speech_exist、noise_exist分别为语音、噪声存在判决阈值,取0.7和0.3。
进一步,步骤S2中,所述延迟求和波束形成器采用延迟求和波束形成算法,权值矢量表示为
WDSB=d(f,θ)/M (9)
输出为
Figure BDA0002395441350000038
进一步,步骤S2中,所述求信干能量比,具体包括:
固定波束形成器输出后,输出信号与原始对齐信号每帧能量分别为:
Figure BDA0002395441350000033
Figure BDA0002395441350000034
帧间递归平滑后为:
Figure BDA0002395441350000035
Figure BDA0002395441350000036
对每帧信号在一定频点范围内求能量和之比为:
Figure BDA0002395441350000037
其中,bins_a、bins_b为频点值,同理对能量比系数进行语音段判决得到:
Figure BDA0002395441350000041
进一步,步骤S3中,具体包括:
由式(10)和式(16)已经求出相干性和能量比的语音存在帧,联合自适应步长控制因子为
Figure BDA0002395441350000045
则基于相干性和能量比的改进GSC输出信号为
Figure BDA0002395441350000046
式中,
Figure BDA0002395441350000047
为阻塞矩阵输出,
Figure BDA0002395441350000048
为(M-1)×M维的阻塞矩阵;
ANC的权矢量通过NLMS算法更新,归一化处理得到
Figure BDA0002395441350000043
其中,
Figure BDA0002395441350000044
式中,γ为遗忘因子,μ为步长因子。
本发明的有益效果在于:相比于传统的GSC算法,本方案具有更好的低频特性和波束指向性,通过相干性与能量比联合控制ANC更新,防止了ANC在语音段对期望信号的误消问题,具有更强的鲁棒性。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为传统GSC算法结构框图;
图2为本发明所述基于相干性和能量比的鲁棒GSC结构框图;
图3为不同背景噪声下三种GSC算法的PESQ均值对比图;
图4为三种GSC算法的频域分段信噪比均值对比图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
如图1所示,传统的GSC主要分为三个部分:第一部分是固定波束形成器(FixedBeamformer,FBF),称为上支路,主要作用为输出期望信号,一般会残留部分干扰噪声;第二部分是阻塞矩阵(Blocking Matrix,BM),称为下支路,主要作用是阻塞期望信号的通过,留下参考噪声;第三部分是自适应噪声相消器(Adaptive Noise Canceller,ANC),上下支路的输出信号进入该相消器得到进一步增强后的信号。
固定波束形成算法主要有延迟求和波束形成(Delay and Sum Beamformer,DSB)和超指向波束形成(Superdirective Beamformer,SPD),延迟求和波束形成算法是对每路信号在期望方向进行延迟补偿,再求和除以麦克风个数得到最后输出。超指向波束形成是最大化阵列指向性因子,比DSB有更好的指向性且具有更好的低频特性。不失一般性,假设圆阵有M个麦克风,则第m个麦克风接收到的信号为:
zm(t)=x(t-τm)+nm(t),m=1,2,...,M (1)
其中,x(t-τm),nm(t)和τm分别为第m个麦克风接收到的期望信号、干扰噪声和相对于参考位置的时延。
对语音分帧加窗,短时傅里叶变换得到
Figure BDA0002395441350000064
其中,
Figure BDA0002395441350000065
分别为麦克风接收信号,期望信号和噪声信号的短时傅里叶变换。dm(f,θ)为参考补偿,k为频点,
Figure BDA0002395441350000066
为时间帧。对于多个麦克风,将(2)写成向量形式为
Figure BDA0002395441350000067
其中,
Figure BDA0002395441350000068
Figure BDA0002395441350000061
Figure BDA0002395441350000069
T为转置操作,j为虚数单位,ω为角频率,r为圆阵半径,θ为期望方向角速度,φ为麦克风相对于x轴的角度,c为麦克风相对于x轴的声速,d(f,θ)为阵列导向矢量。
延迟求和是最简单也是最容易实现的固定波束形成算法,在上述条件下,权值矢量可表示为WDSB=d(f,θ)/M (7)
输出为
Figure BDA00023954413500000610
超指向波束形成算法比传统的固定波束形成算法有更大的阵列增益和更好的低频特性,本发明的GSC上支路采用该算法,鲁棒性超指向权值矢量为
Figure BDA0002395441350000062
其中,Φn为噪声的归一化协方差矩阵,IM为M阶单位矩阵,ε为经验值常数,输出为
Figure BDA0002395441350000063
阻塞矩阵的作用就是阻塞期望信号的通过,留下干扰噪声,最常用的阻塞矩阵是Griffiths-Jim矩阵,定义为(M-1)×M维矩阵
Figure BDA0002395441350000071
阻塞矩阵输出为
Figure BDA0002395441350000076
由公式(8)和(12)得到GSC的输出信号为
Figure BDA0002395441350000077
式中,ANC的权矢量一般通过NLMS算法更新,归一化处理得到
Figure BDA0002395441350000072
其中
Figure BDA0002395441350000073
式中,γ为遗忘因子,μ为步长因子,上标*表示共轭。
在上述传统GSC算法框架上,本发明提出一种改进的鲁棒GSC算法,在上支路用鲁棒超指向固定波束形成器,并求出与原始信号的相干性。根据在语音段相干性高,在噪声段相干性低来控制ANC的更新。由于FBF后会残留部分噪声,所以在部分噪声段也会有弱相干性,再用另外一个固定波束形成器与原始信号求信干能量比,语音段能量比大,噪声段能量比特别小,进一步控制ANC的跟新,通过相干性和能量比联合控制ANC更新,防止了ANC在语音段对期望信号的误消问题,具有更强的鲁棒性。本文改进算法的结构框图如图2所示。
固定波束形成器1输出后为防止对弱语音段的误判,进行帧间递归平滑,表示为
Figure BDA0002395441350000074
原始信号对齐后为
Figure BDA0002395441350000078
同理,对式(17)进行帧间递归平滑为
Figure BDA0002395441350000075
其中α为平滑因子,符号.*为点乘操作。
对式(16)和(17)求相干取模值得到
Figure BDA0002395441350000081
其中,ε为很小的常数,防止分母为零。
为防止频点间值突变,对式(19)频点平滑为:
Figure BDA0002395441350000082
式中,min为对大于1的值取值为1,conv为卷积操作,hanning为汉宁窗,L为频点平滑的点数,一般取L=5。
对相干性系数进行语音段判决,大于一定阈值判定为语音段,小于一定阈值判定为噪声段,中间值则进行线性映射,得到:
Figure BDA0002395441350000083
其中,speech_exist、noise_exist分别为语音、噪声存在判决阈值,一般取0.7和0.3。
固定波束形成器2输出后,输出信号与原始对齐信号每帧能量分别为:
Figure BDA0002395441350000084
Figure BDA0002395441350000085
帧间递归平滑后为:
Figure BDA0002395441350000086
Figure BDA0002395441350000087
对每帧信号在一定频点范围内求能量和之比为:
Figure BDA0002395441350000088
其中,bins_a、bins_b为频点值,同理对能量比系数进行语音段判决得到:
Figure BDA0002395441350000091
由式(21)和式(27)已经求出相干性和能量比的语音存在帧,联合自适应步长控制因子为
Figure BDA0002395441350000093
则本实施例基于相干性和能量比的改进GSC输出信号为
Figure BDA0002395441350000094
Figure BDA0002395441350000092
本发明实施例画出期望信号在0度,音乐干扰在120度时的语音帧数存在图
Figure BDA0002395441350000095
本发明改进鲁棒GSC算法通过所示语音帧存在图来控制ANC的更新,在语音帧不更新,在噪声帧更新,在语音帧不跟新时,得到的是超指向固定波束形成算法结果,故本发明GSC算法比传统GSC算法有更好的低频特性和波束指向性。
如图3给出了在期望方向角度为0°、干扰角度为120°时四种背景噪声下的PESQ值。从图中可以得到,传统GSC和GSC-NBF对PESQ有一定的提升,本发明的算法(GSC-CP)在各种噪声条件下对PESQ提升明显,特别是在人声干扰情况下。
图4中可以看出,本发明算法在各个背景噪声场景中频域分段信噪比提升明显,尤其是在高信噪比情况下。其它两种算法提升效果有限,原因可能是期望信号的误消和干扰噪声抑制不彻底。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种基于相干性和能量比的鲁棒GSC方法,其特征在于:包括以下步骤:
S1:在上支路部分使用超指向固定波束形成器输出期望信号,并与原始信号求相干性;
S2:使用延迟求和固定波束形成器输出信号,并与原始信号在一定频率范围内求信干能量比;
S3:用求得的相干性与能量比联合控制自适应噪声相消器ANC的更新。
2.根据权利要求1所述的基于相干性和能量比的鲁棒GSC方法,其特征在于:步骤S1中所述超指向波束形成器采用超指向波束形成算法,鲁棒性超指向权值矢量为
Figure FDA0002395441340000011
其中,Φn为噪声的归一化协方差矩阵,IM为M阶单位矩阵,ε为经验值常数,输出为
Figure FDA0002395441340000012
3.根据权利要求2所述的基于相干性和能量比的鲁棒GSC方法,其特征在于:步骤S1中所述求相干性,具体包括:
超指向波束形成器输出后为防止对弱语音段的误判,进行帧间递归平滑,表示为:
Figure FDA0002395441340000013
其中,k为频点,
Figure FDA0002395441340000017
为时间帧,α为平滑因子;
原始信号对齐后为:
Figure FDA0002395441340000016
其中,符号.*为点乘操作,
Figure FDA0002395441340000019
为M个麦克风圆阵的接收信号向量形式,
Figure FDA0002395441340000018
T为转置操作,d(f,θ)为阵列导向矢量,
Figure FDA0002395441340000014
j为虚数单位,ω为角频率,r为圆阵半径,θ为期望方向角速度,φ为麦克风相对于x轴的角度,c为麦克风相对于x轴的声速,上标*表示共轭;
同理,对式(4)进行帧间递归平滑为:
Figure FDA0002395441340000015
对式(3)和(4)求相干取模值得到:
Figure FDA0002395441340000021
其中,ε为很小的常数,防止分母为零;
为防止频点间值突变,对式(6)频点平滑为:
Figure FDA0002395441340000022
式中,min为对大于1的值取值为1,conv为卷积操作,hanning为汉宁窗,L为频点平滑的点数,取L=5;
对相干性系数进行语音段判决,大于一定阈值判定为语音段,小于一定阈值判定为噪声段,中间值则进行线性映射,得到:
Figure FDA0002395441340000023
其中,speech_exist、noise_exist分别为语音、噪声存在判决阈值,取0.7和0.3。
4.根据权利要求3所述的基于相干性和能量比的鲁棒GSC方法,其特征在于:步骤S2中,所述延迟求和波束形成器采用延迟求和波束形成算法,权值矢量表示为
WDSB=d(f,θ)/M (9)
输出为
Figure FDA0002395441340000028
5.根据权利要求4所述的基于相干性和能量比的鲁棒GSC方法,其特征在于:步骤S2中,所述求信干能量比,具体包括:
固定波束形成器输出后,输出信号与原始对齐信号每帧能量分别为:
Figure FDA0002395441340000024
Figure FDA0002395441340000025
帧间递归平滑后为:
Figure FDA0002395441340000026
Figure FDA0002395441340000027
对每帧信号在一定频点范围内求能量和之比为:
Figure FDA0002395441340000031
其中,bins_a、bins_b为频点值,同理对能量比系数进行语音段判决得到:
Figure FDA0002395441340000032
6.根据权利要求5所述的基于相干性和能量比的鲁棒GSC方法,其特征在于:步骤S3中,具体包括:
由式(10)和式(16)已经求出相干性和能量比的语音存在帧,联合自适应步长控制因子为
Figure FDA0002395441340000036
则基于相干性和能量比的改进GSC输出信号为
Figure FDA0002395441340000037
式中,
Figure FDA0002395441340000038
为阻塞矩阵输出,
Figure FDA0002395441340000039
Figure FDA0002395441340000033
为(M-1)×M维的阻塞矩阵;
ANC的权矢量通过NLMS算法更新,归一化处理得到
Figure FDA0002395441340000034
其中,
Figure FDA0002395441340000035
式中,γ为遗忘因子,μ为步长因子。
CN202010129648.4A 2020-02-28 2020-02-28 基于相干性和能量比的鲁棒gsc方法 Pending CN111341340A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010129648.4A CN111341340A (zh) 2020-02-28 2020-02-28 基于相干性和能量比的鲁棒gsc方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010129648.4A CN111341340A (zh) 2020-02-28 2020-02-28 基于相干性和能量比的鲁棒gsc方法

Publications (1)

Publication Number Publication Date
CN111341340A true CN111341340A (zh) 2020-06-26

Family

ID=71184104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010129648.4A Pending CN111341340A (zh) 2020-02-28 2020-02-28 基于相干性和能量比的鲁棒gsc方法

Country Status (1)

Country Link
CN (1) CN111341340A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113299301A (zh) * 2021-04-21 2021-08-24 北京搜狗科技发展有限公司 一种语音处理方法、装置和用于语音处理的装置
WO2022105571A1 (zh) * 2020-11-17 2022-05-27 深圳壹账通智能科技有限公司 语音增强方法、装置、设备及计算机可读存储介质
CN114811453A (zh) * 2022-04-20 2022-07-29 安徽理工大学 一种基于延迟求和的管道泄漏声波定位方法
CN116320947A (zh) * 2023-05-17 2023-06-23 杭州爱听科技有限公司 一种应用于助听器的频域双通道语音增强方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106782595A (zh) * 2016-12-26 2017-05-31 上海语知义信息技术有限公司 一种降低语音泄露的鲁棒阻塞矩阵方法
CN108877828A (zh) * 2017-05-16 2018-11-23 福州瑞芯微电子股份有限公司 语音增强方法/系统、计算机可读存储介质及电子设备
CN108922554A (zh) * 2018-06-04 2018-11-30 南京信息工程大学 基于对数谱估计的lcmv频率不变波束形成语音增强算法
CN109389991A (zh) * 2018-10-24 2019-02-26 中国科学院上海微系统与信息技术研究所 一种基于麦克风阵列的信号增强方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106782595A (zh) * 2016-12-26 2017-05-31 上海语知义信息技术有限公司 一种降低语音泄露的鲁棒阻塞矩阵方法
CN108877828A (zh) * 2017-05-16 2018-11-23 福州瑞芯微电子股份有限公司 语音增强方法/系统、计算机可读存储介质及电子设备
CN108922554A (zh) * 2018-06-04 2018-11-30 南京信息工程大学 基于对数谱估计的lcmv频率不变波束形成语音增强算法
CN109389991A (zh) * 2018-10-24 2019-02-26 中国科学院上海微系统与信息技术研究所 一种基于麦克风阵列的信号增强方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QINGSONG JIANG: ""A Robust GSC for Microphone Array Using Coherence and Signal-to-Interference Ratio"" *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022105571A1 (zh) * 2020-11-17 2022-05-27 深圳壹账通智能科技有限公司 语音增强方法、装置、设备及计算机可读存储介质
CN113299301A (zh) * 2021-04-21 2021-08-24 北京搜狗科技发展有限公司 一种语音处理方法、装置和用于语音处理的装置
CN114811453A (zh) * 2022-04-20 2022-07-29 安徽理工大学 一种基于延迟求和的管道泄漏声波定位方法
CN116320947A (zh) * 2023-05-17 2023-06-23 杭州爱听科技有限公司 一种应用于助听器的频域双通道语音增强方法
CN116320947B (zh) * 2023-05-17 2023-09-01 杭州爱听科技有限公司 一种应用于助听器的频域双通道语音增强方法

Similar Documents

Publication Publication Date Title
CN111341340A (zh) 基于相干性和能量比的鲁棒gsc方法
US9966059B1 (en) Reconfigurale fixed beam former using given microphone array
US7171008B2 (en) Reducing noise in audio systems
CN109817209B (zh) 一种基于双麦克风阵列的智能语音交互系统
US9472180B2 (en) Headset and a method for audio signal processing
US7386135B2 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
US10395667B2 (en) Correlation-based near-field detector
CN110140359B (zh) 使用波束形成的音频捕获
CN105493518A (zh) 具有端射麦克风阵列的头戴式耳机以及端射阵列的自动校准
US20220189497A1 (en) Bone conduction headphone speech enhancement systems and methods
US11812237B2 (en) Cascaded adaptive interference cancellation algorithms
CN110856072A (zh) 一种耳机通话降噪方法及耳机
CN110660404B (zh) 基于零陷滤波预处理的语音通信和交互应用系统、方法
CN110830870B (zh) 一种基于传声器技术的耳机佩戴者语音活动检测系统
Nakajima et al. Real-time sound source orientation estimation using a 96 channel microphone array
Priyanka et al. Adaptive Beamforming Using Zelinski-TSNR Multichannel Postfilter for Speech Enhancement
CN115346548A (zh) 一种广义旁瓣抵消器及语音增强方法
CN115472151A (zh) 一种基于视频信息辅助的目标语音提取方法
Jung et al. Adaptive microphone array system with two-stage adaptation mode controller
Yamamoto et al. Spherical microphone array post-filtering for reverberation suppression using isotropic beamformings
CN116320947B (zh) 一种应用于助听器的频域双通道语音增强方法
Jiang et al. A Robust GSC for Microphone Array Using Coherence and Signal-to-Interference Ratio
CN117219108A (zh) 基于二阶差分麦克风阵列的自适应降噪方法
CN113329288B (zh) 一种基于陷波技术的蓝牙耳机降噪方法
Stolbov et al. Dual-microphone speech enhancement system attenuating both coherent and diffuse background noise

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200626