CN108922554A - 基于对数谱估计的lcmv频率不变波束形成语音增强算法 - Google Patents

基于对数谱估计的lcmv频率不变波束形成语音增强算法 Download PDF

Info

Publication number
CN108922554A
CN108922554A CN201810562313.4A CN201810562313A CN108922554A CN 108922554 A CN108922554 A CN 108922554A CN 201810562313 A CN201810562313 A CN 201810562313A CN 108922554 A CN108922554 A CN 108922554A
Authority
CN
China
Prior art keywords
speech
signal
frequency
noise
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810562313.4A
Other languages
English (en)
Other versions
CN108922554B (zh
Inventor
郭业才
王婷
王超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201810562313.4A priority Critical patent/CN108922554B/zh
Publication of CN108922554A publication Critical patent/CN108922554A/zh
Application granted granted Critical
Publication of CN108922554B publication Critical patent/CN108922554B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)

Abstract

本发明公开了一种基于对数谱估计的LCMV频率不变波束形成语音增强算法,其特征在于,包括如下步骤:一、利用线性约束最小方差频率不变波束形成算法无失真接收语音信号并对语音信号进行空域滤波;二、利用优化修正对数谱估计算法抑制与理想信号来自同一方向的残余噪声。本发明利用线性约束最小方差频率不变波束形成算法无失真接收语音信号的特性并对接收信号进行空域滤波;当瞬时干扰和语音来自同一方向时,利用OM‑LSA噪声估计算法,准确跟踪输入中快速变化的信号,能够有效地估计瞬态信号的功率谱,进而抑制瞬时干扰;实验仿真表明该算法具有较好的鲁棒性,能有效地瞬态抑制干扰和背景噪声,达到语音增强的目的。

Description

基于对数谱估计的LCMV频率不变波束形成语音增强算法
技术领域
本发明涉及阵列信号处理方法,尤其涉及一种基于对数谱估计的LCMV频率不变波束形成语音增强算法。
背景技术
语音是人类日常生活中进行信息交换使用最广泛的工具,但在实际环境中,语音总会受到环境噪声的干扰,降低语音质量,所以有必要对被噪声干扰的语音信号进行去噪处理,即语音增强。其应用领域非常普遍,如:数字移动电话、远程电视电话会议、为听力障碍者降低背景干扰、声音识别等都要用到这项技术。
70-80年代,经典的语音增强算法有:维纳滤波法、谱减法、Malah和Ephraim 提出的基于最小均方误差估计的短时幅度谱方法(Minimum Mean-Square Error, MMSE)。但这些经典算法用于非平稳噪声场景下时,语音增强效果会受到很大影响,2001年BaruchBerdugo通过利用子带中的语音存在概率函数,对平均功率谱值进行估计,提出最佳修正对数谱幅度语音估计方法(Optimally-Modied Log-Spectral Amplitude,OM-LSA)和最小控制递归平均噪声估计方法(Minima Controlled Recursive Averaging,MCRA),并应用于非平稳噪声情景中。2003 年,Israel Cohen对平滑参数进行改进,调整信号存在概率提出了一种改进的最小控制递归平均方法(Improved Minima Controlled RecursiveAveraging,IMCRA),并应用在非平稳噪声环境下条件下。2012年Israel Cohen将OM-LSA算法进行扩展,提出一种抑制瞬态干扰和为平稳噪声的语音增强算法。随着麦克风阵列信号处理的发展,波束形成算法越来越多地被应用到语音增强算法中,王东霞,曾庆宁,Weiss等诸多学者将宽带波束形成技术用于语音增强方面,如混响抑制、低信噪比情况下语音增强、声源定位等,Benesty和S.Siva Priyanka在最新研究成果中对波束形成用于语音增强算法的发展历程做了综述,并且对各种算法进行了仿真对比,为以后的研究奠定了基础。
发明内容
发明目的:针对现有技术存在的问题,本发明的目的在于提供一种将波束形成算法与对数谱估计算法相结合的基于对数谱估计的LCMV频率不变波束形成语音增强算法,利用线性约束最小方差频率不变波束形成算法无失真接收语音信号的特性并对接收信号进行空域滤波;当瞬时干扰和语音来自同一方向时,利用 OM-LSA噪声估计算法,准确跟踪输入中快速变化的信号,能够有效地估计瞬态信号的功率谱,进而抑制瞬时干扰。
技术方案:一种基于对数谱估计的LCMV频率不变波束形成语音增强算法,其特征在于,包括如下步骤:
步骤一、利用线性约束最小方差频率不变波束形成算法无失真接收语音信号并对语音信号进行空域滤波;
步骤二、利用优化修正对数谱估计算法抑制与理想信号来自同一方向的残余噪声,达到语音增强的目的。
所述步骤一中,麦克风阵列响应最优权向量wopt的获取步骤如下:
(1.1)将线性约束最小方差波束形成问题表示为:
其中,min表示取最小值;s.t.表示约束条件,Rxx为麦克风接收数据协方差矩阵;C为约束矩阵,w为权向量,F为阵列响应向量,满足某一元素为1,不满足则为0,()H表示矩阵的共轭转置;
(1.2)定义空间响应偏差函数表示为:
其中,a(f,θ)为频率为f,角度为θ的导向矢量,a(fr,θ)为在参考频率点fr处沿θ方向入射时的导向矢量;通过等间隔选取角度和频率信息,将空间响应偏差函数写为离散形式,有:
其中,fr表示参考频率;P和K分别表示频率和角度离散点数;wHQ1w与最小方差约束wHRxxw具有相同的形式,通过设置权重因子对两个目标wHQ1w,wHRxxw同时进行优化;
(1.3)将具有频率不变特性的宽带LCMV波束形成算法描述为:
min wH[ρRxx+(1-ρ)Q1]w
s.t.wHa(fr0)=1
其中,频率不变约束参数ρ满足0≤ρ≤1;θ0为期望信号入射方向;a(fr0) 为算法在参考频率点fr处沿θ0方向入射时的导向矢量,通过参考频率点在期望方向上的约束增益来实现算法在期望方向的无失真输出,即wHa(fr0)=1。
(1.4)利用拉格朗日乘子法,求解步骤(1.3)中具有频率不变特性的宽带 LCMV波束形成算法最优权矢量得:
所述步骤二包括增益函数估计和噪声估计。
其中,增益函数估计的具体步骤为:
假设语音信号和瞬时干扰是相互独立的,则波束形成后语音y(n)表示为:
y(n)=x(n)+d(n)
其中,x(n)是纯净语音,d(n)是瞬时干扰信号;为了避免分帧产生的截断效应,在短时傅立叶变换之前加上汉明窗进行加窗分帧处理,帧长为N,帧移为M=N/2,然后再进行短时傅里叶变换,得到:
Y(k,l)=X(k,l)+D(k,l)
Y(k,l),X(k,l),D(k,l)分辨表示第l帧语音进行短时傅立叶变换后的第k个频谱分量,其中k=1,2,…,N;
对数谱估计(LSA)准则表达式为:
其中,为A(k,l)语音频谱的估计值;
假设两个函数分别为:
H0(k,l):Y(k,l)=D(k,l)
H1(k,l):Y(k,l)=X(k,l)+D(k,l)
H0(k,l)代表无语音信号,H1(k,l)代表有语音信号;
概率密度函数分别表示为:
其中,λd(k,l)=E[|D(k,l)|2]和λx(k,l)=E[|X(k,l)|2|H1(k,l)]分别表示语音频谱分量的方差和干扰频谱分量;基于二进制假设模型和概率密度函数,得到:
其中,GH(k,l)是有语音时的增益,定义为:
Gmin是无语音时的增益,为主观变量;p(k,l)为条件语音存在概率,定义为:
其中,q(k,l)是先验无语音概率,v(k,l)定义为:
ε(k,l)和γ(k,l)分别代表先验和后验信噪比;ε(k,l)的估计值由下式得到:
谱增益可表示为:
估计语音信号表示为:
其次,所述噪声估计优选采用最小值控制递归平均法,当语音存在时,不更新噪声谱;当检测到语音不存在时,更新噪声功率谱:
利用语音段条件概率p'(k,l)=p(H1'(k,l)|Y(k,l)),将上式改写为:
其中,αd=0.7~0.9;是基于频率的随时间变化的平滑参数,由语音段条件概率调节;
当语音缺失时,将式H1'(k,l):中得到的噪声估计乘以偏差补偿系数β作为最终的噪声估计,
所述噪声估计的具体步骤如下:
(2.1)在频域内用下式对每一帧信号进行平滑:
式中,b为加权系数,Y(k,l)为第l帧第k个频率点的幅度,2w+1是频域平滑的相邻频点数;
(2.2)用一阶递归进行时域平滑:
S(k,l)=αsS(k,l)+(1-αs)Sf(k,l)
其中,αs为平滑参数,S(k,l-1)为前一帧带噪信号的功率谱;
(2.3)在固定窗长度内搜索S(k,l)的最小值:
Smin(k,l)=min{S(k,l')|l-D+1≤l'≤l}
(2.4)基于第一层的迭代平滑值和跟踪最小值,初步计算语音存在概率 I(k,l),计算公式如下:
其中,定义γmin(k,l)和ζ(k,l)如下:
式中,系数Bmin为常数1.66,γ0等于4.6,ζ0等于1.67;
(2.5)进行第二层平滑迭代运算:
在时域用一阶递归平均:
(2.6)第二次最小值跟踪:
(2.7)计算语音缺失概率如下:
其中,定义为
代入式中,得到条件段语音概率p'(k,l),即可估计出带噪语音中的噪声信号功率。
有益效果:本发明和现有技术相比,显著进步在于:利用线性约束最小方差频率不变波束形成算法无失真接收语音信号的特性并对接收信号进行空域滤波;当瞬时干扰和语音来自同一方向时,利用OM-LSA噪声估计算法,准确跟踪输入中快速变化的信号,能够有效地估计瞬态信号的功率谱,进而抑制瞬时干扰;实验仿真表明该算法具有较好的鲁棒性,能有效地瞬态抑制干扰和背景噪声,达到语音增强的目的。
附图说明
图1为本发明的算法原理图;
图2为本发明实施例的原始信号仿真示意图;
图3为加噪声和干扰后信号仿真示意图;
图4为波束形成后信号仿真示意图;
图5为瞬时干扰信号估计仿真示意图;
图6为语音增强信号。
具体实施方式
以下结合附图和具体实施例对本发明中的关键技术和具体实现方法进行详细说明。
本实施例中,采用11个全向性麦克风组成的均匀线性阵列,每个阵元后接 FIR滤波器阶数为31,信号采样频率为16KHz,阵元间距为最高频率的半波长。如图2所示为原始信号,在原始信号中加入噪声和干扰后信号,设左边第一个麦克风接收语音为参考信号如图3所示。
如图1所示为本发明基于对数谱估计的LCMV-FIB语音增强算法的原理图:
第一阶段,利用LCMV-FIB波束形成算法对麦克风接收信号进行空域滤波。其关键在于最优权向量wopt的获取,步骤如下:
步骤(a):将线性约束最小方差波束形成问题表示为:其中,min表示取最小值;s.t.表示约束条件,Rxx为麦克风接收数据协方差矩阵;C为约束矩阵,w为权向量,F为阵列响应向量,满足某一元素为1,不满足则为0,()H表示矩阵的共轭转置。
步骤(b):定义空间响应偏差函数表示为
式中,a(f,θ)为频率为f,角度为θ的导向矢量,a(fr,θ)为在参考频率点fr处沿θ方向入射时的导向矢量。通过等间隔选取角度和频率信息,将空间响应偏差函数写为离散形式,有
式中,fr表示参考频率;P和K分别表示频率和角度离散点数。wHQ1w与最小方差约束wHRxxw具有相同的形式,通过设置权重因子对两个目标同时进行优化。
步骤(c):具有频率不变特性的宽带LCMV波束形成算法可描述为
min wH[ρRxx+(1-ρ)Q1]w (3)
s.t.wHa(fr0)=1 (4)
式中,频率不变约束参数ρ满足0≤ρ≤1。其中:θ0为期望信号入射方向; a(fr0)为算法在参考频率点fr处沿θ0方向入射时的导向矢量,通过参考频率点在期望方向上的约束增益来实现算法在期望方向的无失真输出,即 wHa(fr0)=1。
步骤(d):利用拉格朗日乘子法,求解步骤(c)中具有频率不变特性的宽带LCMV波束形成算法最优权矢量得
图4为波束形成后语音信号,可以看出LCMV-FIB波束形成算法可以对图3 中含噪声和干扰语音信号的高斯噪声有效抑制,但是波束形成后的语音信号中瞬时干扰依然存在。
第二阶段,采用对数谱估计算法对波束形成后的语音信号做进一步处理,可以有效估计出语音信号中的瞬时干扰,该阶段可分为两步:增益函数估计和噪声估计。
步骤(a):增益函数估计。假设语音信号和瞬时干扰是相互独立的,则波束形成后语音y(n)表示为
y(n)=x(n)+d(n) (6)
其中,x(n)是纯净语音,d(n)是瞬时干扰信号。为了避免分帧产生的截断效应,在短时傅立叶变换之前加上汉明窗进行加窗分帧处理,帧长为N,帧移为M=N/2,然后再进行短时傅里叶变换,得到
Y(k,l)=X(k,l)+D(k,l) (7)
Y(k,l),X(k,l),D(k,l)分辨表示第l帧语音进行短时傅立叶变换后的第k个频谱分量,其中k=1,2,…,N。
对数谱估计(LSA)准则表达式为
式中,为A(k,l)语音频谱的估计值。
假设两个函数分别为
H0(k,l):Y(k,l)=D(k,l) (9)
H1(k,l):Y(k,l)=X(k,l)+D(k,l) (10)
H0(k,l)代表无语音信号,H1(k,l)代表有语音信号。概率密度函数可分别表示为
其中,λd(k,l)=E[|D(k,l)|2]和λx(k,l)=E[|X(k,l)|2|H1(k,l)]分别表示语音频谱分量的方差和干扰频谱分量。基于二进制假设模型和概率密度函数,可以得到
其中,是有语音时的增益,定义为
Gmin是无语音时的增益,其为主观变量,p(k,l)为条件语音存在概率,定义为
其中,q(k,l)是先验无语音概率,v(k,l)可定义为
ε(k,l)和γ(k,l)分别代表先验和后验信噪比。ε(k,l)的估计值由下式得到:
谱增益可表示为
估计语音信号可表示为
步骤(b):噪声估计。本发明采用最小值控制递归平均法。当语音存在时,噪声谱不更新;检测到语音不存在时,则更新噪声功率谱,如下
利用语音段条件概率p'(k,l)=p(H1'(k,l)|Y(k,l)),可将上式改写为:
其中,αd=0.7~0.9。它是基于频率的随时间变化的平滑参数,由语音段条件概率调节。当语音缺失时,将式 H′1(k,l):中得到的噪声估计乘以偏差补偿系数β作为最终的噪声估计,
噪声估计的具体步骤如下:
第一步,在频域内用下式对每一帧信号进行平滑
式中b为加权系数,Y(k,l)为第l帧第k个频率点的幅度,2w+1是频域平滑的相邻频点数。
第二步,用一阶递归进行时域平滑:
S(k,l)=αsS(k,l)+(1-αs)Sf(k,l) (24)
其中,αs为平滑参数,S(k,l-1)为前一帧带噪信号的功率谱。
第三步,在固定窗长度内搜索S(k,l)的最小值。
Smin(k,l)=min{S(k,l')|l-D+1≤l'≤l} (25)
第四步,基于第一层的迭代平滑值和跟踪最小值,初步计算语音存在概率I(k,l),计算公式如下
其中,定义γmin(k,l)和ζ(k,l)如下
上式中,系数Bmin为常数1.66,γ0等于4.6,ζ0等于1.67。
第五步,进行第二层平滑迭代运算。
在时域用一阶递归平均
第六步,第二次最小值跟踪。
第七步,计算语音缺失概率如下
其中定义为
代入式中,得到条件段语音概率p'(k,l),即可估计出带噪语音中的噪声信号功率。采用对数谱估计算法对波束形成后的语音信号做进一步处理,可以有效估计出语音信号中的瞬时干扰。图5为瞬时干扰信号估计,图6为语音增强信号。本发明提出基于对数谱估计的LCMV频率不变波束形成语音增强算法可以对噪声和瞬时干扰有效抑制,达到语音增强的目的。

Claims (5)

1.一种基于对数谱估计的LCMV频率不变波束形成语音增强算法,其特征在于,包括如下步骤:
步骤一、利用线性约束最小方差频率不变波束形成算法无失真接收语音信号并对语音信号进行空域滤波;
步骤二、利用优化修正对数谱估计算法抑制与理想信号来自同一方向的残余噪声。
2.根据权利要求1所述的基于对数谱估计的LCMV频率不变波束形成语音增强算法,其特征在于,所述步骤一中,麦克风阵列响应最优权向量wopt的获取步骤如下:
(1.1)将线性约束最小方差波束形成问题表示为:
其中,min表示取最小值;s.t.表示约束条件,Rxx为麦克风接收数据协方差矩阵;C为约束矩阵,w为权向量,F为阵列响应向量,满足某一元素为1,不满足则为0,()H表示矩阵的共轭转置;
(1.2)定义空间响应偏差函数表示为:
其中,a(f,θ)为频率为f,角度为θ的导向矢量,a(fr,θ)为在参考频率点fr处沿θ方向入射时的导向矢量;通过等间隔选取角度和频率信息,将空间响应偏差函数写为离散形式,有:
其中,fr表示参考频率;P和K分别表示频率和角度离散点数;wHQ1w与最小方差约束wHRxxw具有相同的形式,通过设置权重因子对两个目标wHQ1w,wHRxxw同时进行优化;
(1.3)将具有频率不变特性的宽带LCMV波束形成算法描述为:
min wH[ρRxx+(1-ρ)Q1]w
s.t.wHa(fr0)=1
其中,频率不变约束参数ρ满足0≤ρ≤1;θ0为期望信号入射方向;a(fr0)为算法在参考频率点fr处沿θ0方向入射时的导向矢量。
(1.4)利用拉格朗日乘子法,求解步骤(1.3)中具有频率不变特性的宽带LCMV波束形成算法最优权矢量得:
3.根据权利要求1所述的基于对数谱估计的LCMV频率不变波束形成语音增强算法,其特征在于,所述步骤二包括增益函数估计和噪声估计。
4.根据权利要求3所述的基于对数谱估计的LCMV频率不变波束形成语音增强算法,其特征在于,所述增益函数估计的具体步骤为:
假设语音信号和瞬时干扰是相互独立的,则波束形成后语音y(n)表示为:
y(n)=x(n)+d(n)
其中,x(n)是纯净语音,d(n)是瞬时干扰信号;在短时傅立叶变换之前加上汉明窗进行加窗分帧处理,帧长为N,帧移为M=N/2,然后再进行短时傅里叶变换,得到:
Y(k,l)=X(k,l)+D(k,l)
Y(k,l),X(k,l),D(k,l)分辨表示第l帧语音进行短时傅立叶变换后的第k个频谱分量,其中k=1,2,…,N;
对数谱估计(LSA)准则表达式为:
其中,为A(k,l)语音频谱的估计值;
假设两个函数分别为:
H0(k,l):Y(k,l)=D(k,l)
H1(k,l):Y(k,l)=X(k,l)+D(k,l)
H0(k,l)代表无语音信号,H1(k,l)代表有语音信号;
概率密度函数分别表示为:
其中,λd(k,l)=E[|D(k,l)|2]和λx(k,l)=E[|X(k,l)|2|H1(k,l)]分别表示语音频谱分量的方差和干扰频谱分量;基于二进制假设模型和概率密度函数,得到:
其中,是有语音时的增益,定义为:
Gmin是无语音时的增益,为主观变量;p(k,l)为条件语音存在概率,定义为:
其中,q(k,l)是先验无语音概率,v(k,l)定义为:
ε(k,l)和γ(k,l)分别代表先验和后验信噪比;ε(k,l)的估计值由下式得到:
谱增益可表示为:
估计语音信号表示为:
5.根据权利要求3所述的基于对数谱估计的LCMV频率不变波束形成语音增强算法,其特征在于,所述噪声估计采用最小值控制递归平均法,当语音存在时,不更新噪声谱;当检测到语音不存在时,更新噪声功率谱:
H′0(k,l):
H′1(k,l):
利用语音段条件概率p'(k,l)=p(H′1(k,l)|Y(k,l)),将上式改写为:
其中,αd=0.7~0.9;是基于频率的随时间变化的平滑参数,由语音段条件概率调节;
当语音缺失时,将式H′1(k,l):中得到的噪声估计乘以偏差补偿系数β作为最终的噪声估计,
所述噪声估计的具体步骤如下:
(2.1)在频域内用下式对每一帧信号进行平滑:
式中,b为加权系数,Y(k,l)为第l帧第k个频率点的幅度,2w+1是频域平滑的相邻频点数;
(2.2)用一阶递归进行时域平滑:
S(k,l)=αsS(k,l)+(1-αs)Sf(k,l)
其中,αs为平滑参数,S(k,l-1)为前一帧带噪信号的功率谱;
(2.3)在固定窗长度内搜索S(k,l)的最小值:
Smin(k,l)=min{S(k,l')|l-D+1≤l'≤l}
(2.4)基于第一层的迭代平滑值和跟踪最小值,初步计算语音存在概率I(k,l),计算公式如下:
其中,定义γmin(k,l)和ζ(k,l)如下:
式中,系数Bmin为常数1.66,γ0等于4.6,ζ0等于1.67;
(2.5)进行第二层平滑迭代运算:
在时域用一阶递归平均:
(2.6)第二次最小值跟踪:
(2.7)计算语音缺失概率如下:
其中,定义为
代入式中,得到条件段语音概率p'(k,l),估计出带噪语音中的噪声信号功率。
CN201810562313.4A 2018-06-04 2018-06-04 基于对数谱估计的lcmv频率不变波束形成语音增强算法 Active CN108922554B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810562313.4A CN108922554B (zh) 2018-06-04 2018-06-04 基于对数谱估计的lcmv频率不变波束形成语音增强算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810562313.4A CN108922554B (zh) 2018-06-04 2018-06-04 基于对数谱估计的lcmv频率不变波束形成语音增强算法

Publications (2)

Publication Number Publication Date
CN108922554A true CN108922554A (zh) 2018-11-30
CN108922554B CN108922554B (zh) 2022-08-23

Family

ID=64419544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810562313.4A Active CN108922554B (zh) 2018-06-04 2018-06-04 基于对数谱估计的lcmv频率不变波束形成语音增强算法

Country Status (1)

Country Link
CN (1) CN108922554B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109473118A (zh) * 2018-12-24 2019-03-15 苏州思必驰信息科技有限公司 双通道语音增强方法及装置
CN110111811A (zh) * 2019-04-18 2019-08-09 腾讯音乐娱乐科技(深圳)有限公司 音频信号检测方法、装置和存储介质
CN110600051A (zh) * 2019-11-12 2019-12-20 乐鑫信息科技(上海)股份有限公司 用于选择麦克风阵列的输出波束的方法
CN111048106A (zh) * 2020-03-12 2020-04-21 深圳市友杰智新科技有限公司 基于双麦克风的拾音方法、装置和计算机设备
CN111341340A (zh) * 2020-02-28 2020-06-26 重庆邮电大学 基于相干性和能量比的鲁棒gsc方法
CN111402913A (zh) * 2020-02-24 2020-07-10 北京声智科技有限公司 降噪方法、装置、设备和存储介质
CN111968659A (zh) * 2020-07-23 2020-11-20 天津大学 一种基于优化imcra的麦克风阵列语音增强方法
CN112289335A (zh) * 2019-07-24 2021-01-29 阿里巴巴集团控股有限公司 语音信号的处理方法、装置及拾音设备
CN112530451A (zh) * 2020-10-20 2021-03-19 国网黑龙江省电力有限公司伊春供电公司 基于去噪自编码器的语音增强方法
CN113932912A (zh) * 2021-10-13 2022-01-14 国网湖南省电力有限公司 一种变电站噪声抗干扰估计方法、系统及介质
WO2022012367A1 (zh) * 2020-07-13 2022-01-20 紫光展锐(重庆)科技有限公司 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端
CN114694675A (zh) * 2022-03-15 2022-07-01 大连理工大学 一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法
CN115954012A (zh) * 2023-03-03 2023-04-11 成都启英泰伦科技有限公司 一种周期性瞬态干扰事件检测方法
CN111564154B (zh) * 2020-03-23 2023-08-08 北京邮电大学 基于语音增强算法的对抗样本攻击防御方法及装置
CN117388835A (zh) * 2023-12-13 2024-01-12 湖南赛能环测科技有限公司 一种多拼融合的声雷达信号增强方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001085011A2 (en) * 2000-05-11 2001-11-15 Technion Research & Development Foundation Ltd. Wavelet depulsing of ultrasound echo sequences
CN103456310A (zh) * 2013-08-28 2013-12-18 大连理工大学 一种基于谱估计的瞬态噪声抑制方法
CN105223544A (zh) * 2015-08-26 2016-01-06 南京信息工程大学 近场线性约束最小方差自适应加权频率不变波束形成方法
CN105681972A (zh) * 2016-01-14 2016-06-15 南京信息工程大学 线性约束最小方差对角加载的稳健频率不变波束形成方法
EP3186274A1 (en) * 2014-08-27 2017-07-05 Dana-Farber Cancer Institute, Inc. Intracellular osteopontin regulates the lineage commitment of lymphoid subsets

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001085011A2 (en) * 2000-05-11 2001-11-15 Technion Research & Development Foundation Ltd. Wavelet depulsing of ultrasound echo sequences
CN103456310A (zh) * 2013-08-28 2013-12-18 大连理工大学 一种基于谱估计的瞬态噪声抑制方法
EP3186274A1 (en) * 2014-08-27 2017-07-05 Dana-Farber Cancer Institute, Inc. Intracellular osteopontin regulates the lineage commitment of lymphoid subsets
CN105223544A (zh) * 2015-08-26 2016-01-06 南京信息工程大学 近场线性约束最小方差自适应加权频率不变波束形成方法
CN105681972A (zh) * 2016-01-14 2016-06-15 南京信息工程大学 线性约束最小方差对角加载的稳健频率不变波束形成方法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109473118B (zh) * 2018-12-24 2021-07-20 思必驰科技股份有限公司 双通道语音增强方法及装置
CN109473118A (zh) * 2018-12-24 2019-03-15 苏州思必驰信息科技有限公司 双通道语音增强方法及装置
CN110111811A (zh) * 2019-04-18 2019-08-09 腾讯音乐娱乐科技(深圳)有限公司 音频信号检测方法、装置和存储介质
CN112289335A (zh) * 2019-07-24 2021-01-29 阿里巴巴集团控股有限公司 语音信号的处理方法、装置及拾音设备
CN110600051A (zh) * 2019-11-12 2019-12-20 乐鑫信息科技(上海)股份有限公司 用于选择麦克风阵列的输出波束的方法
CN111402913A (zh) * 2020-02-24 2020-07-10 北京声智科技有限公司 降噪方法、装置、设备和存储介质
CN111402913B (zh) * 2020-02-24 2023-09-12 北京声智科技有限公司 降噪方法、装置、设备和存储介质
CN111341340A (zh) * 2020-02-28 2020-06-26 重庆邮电大学 基于相干性和能量比的鲁棒gsc方法
CN111048106A (zh) * 2020-03-12 2020-04-21 深圳市友杰智新科技有限公司 基于双麦克风的拾音方法、装置和计算机设备
CN111564154B (zh) * 2020-03-23 2023-08-08 北京邮电大学 基于语音增强算法的对抗样本攻击防御方法及装置
WO2022012367A1 (zh) * 2020-07-13 2022-01-20 紫光展锐(重庆)科技有限公司 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端
CN111968659A (zh) * 2020-07-23 2020-11-20 天津大学 一种基于优化imcra的麦克风阵列语音增强方法
CN111968659B (zh) * 2020-07-23 2023-10-31 天津大学 一种基于优化imcra的麦克风阵列语音增强方法
CN112530451A (zh) * 2020-10-20 2021-03-19 国网黑龙江省电力有限公司伊春供电公司 基于去噪自编码器的语音增强方法
CN113932912A (zh) * 2021-10-13 2022-01-14 国网湖南省电力有限公司 一种变电站噪声抗干扰估计方法、系统及介质
CN113932912B (zh) * 2021-10-13 2023-09-12 国网湖南省电力有限公司 一种变电站噪声抗干扰估计方法、系统及介质
CN114694675A (zh) * 2022-03-15 2022-07-01 大连理工大学 一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法
CN115954012A (zh) * 2023-03-03 2023-04-11 成都启英泰伦科技有限公司 一种周期性瞬态干扰事件检测方法
CN115954012B (zh) * 2023-03-03 2023-05-09 成都启英泰伦科技有限公司 一种周期性瞬态干扰事件检测方法
CN117388835A (zh) * 2023-12-13 2024-01-12 湖南赛能环测科技有限公司 一种多拼融合的声雷达信号增强方法
CN117388835B (zh) * 2023-12-13 2024-03-08 湖南赛能环测科技有限公司 一种多拼融合的声雷达信号增强方法

Also Published As

Publication number Publication date
CN108922554B (zh) 2022-08-23

Similar Documents

Publication Publication Date Title
CN108922554B (zh) 基于对数谱估计的lcmv频率不变波束形成语音增强算法
US10446171B2 (en) Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments
CN108986838B (zh) 一种基于声源定位的自适应语音分离方法
CN107993670B (zh) 基于统计模型的麦克风阵列语音增强方法
Doclo et al. GSVD-based optimal filtering for single and multimicrophone speech enhancement
CN102938254B (zh) 一种语音信号增强系统和方法
US11373667B2 (en) Real-time single-channel speech enhancement in noisy and time-varying environments
Gannot et al. Adaptive beamforming and postfiltering
CN110148420A (zh) 一种适用于噪声环境下的语音识别方法
CN110517701B (zh) 一种麦克风阵列语音增强方法及实现装置
US20130142343A1 (en) Sound source separation device, sound source separation method and program
US20140025374A1 (en) Speech enhancement to improve speech intelligibility and automatic speech recognition
Wang et al. Noise power spectral density estimation using MaxNSR blocking matrix
CN112530451A (zh) 基于去噪自编码器的语音增强方法
CN112331226B (zh) 一种针对主动降噪系统的语音增强系统及方法
CN111681665A (zh) 一种全向降噪方法、设备及存储介质
Spriet et al. Stochastic gradient-based implementation of spatially preprocessed speech distortion weighted multichannel Wiener filtering for noise reduction in hearing aids
CN114242104A (zh) 语音降噪的方法、装置、设备及存储介质
Priyanka et al. Adaptive Beamforming Using Zelinski-TSNR Multichannel Postfilter for Speech Enhancement
EP3225037B1 (en) Method and apparatus for generating a directional sound signal from first and second sound signals
Delcroix et al. Multichannel speech enhancement approaches to DNN-based far-field speech recognition
Zhao et al. Closely coupled array processing and model-based compensation for microphone array speech recognition
Pan et al. On estimation of time-varying variances of source and noise for sensor array processing
Lorenzelli et al. Broadband array processing using subband techniques
Huy et al. A New Approach for Enhancing MVDR Beamformer’s Performance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant