CN113362846A - 一种基于广义旁瓣相消结构的语音增强方法 - Google Patents

一种基于广义旁瓣相消结构的语音增强方法 Download PDF

Info

Publication number
CN113362846A
CN113362846A CN202110722390.3A CN202110722390A CN113362846A CN 113362846 A CN113362846 A CN 113362846A CN 202110722390 A CN202110722390 A CN 202110722390A CN 113362846 A CN113362846 A CN 113362846A
Authority
CN
China
Prior art keywords
signal
noise
signals
formula
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110722390.3A
Other languages
English (en)
Other versions
CN113362846B (zh
Inventor
于�玲
常雅婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning University of Technology
Original Assignee
Liaoning University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning University of Technology filed Critical Liaoning University of Technology
Priority to CN202110722390.3A priority Critical patent/CN113362846B/zh
Publication of CN113362846A publication Critical patent/CN113362846A/zh
Application granted granted Critical
Publication of CN113362846B publication Critical patent/CN113362846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明属于语音信号处理技术领域,提供一种基于广义旁瓣相消器的语音增强方法。其特征是首先分别获得两路信号,其中一路是纯净语音信号,另一路信号为噪声信号,经过时延估计和时延补偿将信号对齐。信号进入广义旁瓣相消器的主通道通过LCMV波束形成器抑制干扰和噪声,再经辅助通道的阻塞矩阵过滤掉语音信号得到噪声信号,此噪声信号作为自适应滤波器的参考信号,基于新的变步长lms算法估计噪声,再由维纳滤波器去掉非相干噪声,最终得到理想语音信号。本发明对噪声的抑制能力更强,可以输出更具信噪比的语音信号,满足实际需求。

Description

一种基于广义旁瓣相消结构的语音增强方法
技术领域
本发明属于语音信号处理技术领域,涉及到自适应波束形成语音增强方法,特别涉及一种使用广义旁瓣相消结构的语音增强方法。
背景技术
语音增强技术作为一项核心技术广泛应用于语音信号处理中。语音增强技术包括单通道语音增强、多通道语音增强和基于深度学习的语音增强三大类。在免提电话、视频会议等语音通信系统中,麦克风接收到的语音信号通常已被各种噪声污染,例如周期噪声、脉冲噪声和高斯白噪声等,这些噪声干扰人类的学习与工作。语音增强技术是利用麦克风接收语音信号,然后利用自适应滤波或波束形成等算法对信号进行处理,抑制噪声和干扰,达到增强目标语音信号的目的。
语音增强的分类方法有很多,其中按照使用的麦克风个数可将其分为单通道语音增强算法和多通道语音增强算法。单通道语音增强技术只需要对一个麦克风接收到的语音信号进行处理。虽然对硬件设备的要求简单,但可利用的语音信息较少,所以单通道语音增强技术对噪声的抑制效果并不理想。所谓多通道语音增强,即利用麦克风阵列对语音信号进行增强处理。麦克风阵列可以根据麦克风的空间位置以及语音信号的时域和频域等信息,利用波束形成准则对阵元接收到的每一通道的语音信号分别施加权重,在目标方向形成一个波束使其增益最大,使波束外的噪声信号得以消除。波束形成技术又可根据加权值是否随着语音信息改变分为固定波束成形和自适应波束成形。固定波束成形的权值与语音信号无关,只与声源和麦克风之间的距离有关,而自适应波束成形语音信号改变时加权值也可以自适应更新。其优点是使用少量的麦克风就可以对干扰噪声产生抑制。综上所述,本文拟针对传统自适应波束形成算法进行改进,使得改进后算法可以更好地抑制噪声,提高输出语音的信噪比,提高后续基于语音的应用的效果。
发明内容
针对现有技术的不足,本发明提供一种基于广义旁瓣相消结构的语音增强方法,是一种自适应波束形成的语音增强方法,本方法采用广义旁瓣相消器,并用LCMV(线性约束最小方差)波束形成器代替广义旁瓣相消器中上支路的固定波束形成器。提出一种GSC-LCMV语音增强方法,GSC为广义旁瓣相消器。
本发明的技术方案为:
一种GSC-LCMV自适应的语音增强方法,主要包括以下步骤:
第一步,分别获得两路信号,其中一路是纯净语音信号,另一路信号为噪声信号,经过时延估计和时延补偿将信号对齐。
第二步,带噪信号进入广义旁瓣相消器进行降噪处理。
2.1利用主通道的LCMV波束形成器对噪声和干扰进行抑制。
2.2利用辅助通道的阻塞矩阵过滤掉语音信号得到噪声信号。
2.3利用噪声抵消模块估计噪声。
第三步,经广义旁瓣相消器输出的信号进入维纳滤波器去掉非相干噪声,最后得到所求的语音增强之后的信号。
其优点在于:
本方法对噪声的抑制能力更强,可以输出更具信噪比的语音信号,满足实际需求。
附图说明
图1是本发明的算法流程图。
图2是本发明中LCMV波束形成方向图。
图3是本发明中带噪语音波形图和经过本发明语音增强之后的语音波形图。
具体实施方式
为使本发明实施例的目的、技术方案及其优点更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整的描述,整体算法流程图如图1所示:
第一步,时延估计和时延补偿。
按公式(1)计算各麦克风与参考麦克风的时延差值;按公式(1)给每路信号加上时延补偿时间。
Figure BDA0003137223200000021
因麦克风之间的位置不同,各麦克风收集到的信号会存在相对时延。其中,假设阵列中心的麦克风为参考麦克风,其时延为零,τn为各麦克风相对于参考麦克风的时延差值,D表示相邻麦克风间距离;c表示声速,θ表示声源与y轴方向的夹角。
第二步,带噪信号进入广义旁瓣相消器进行降噪处理。
2.1LCMV波束形成器的约束方程可以表示为公式(2)。
Wopt=argminwWHRxW (2)。
s.t.WHC=f (3)。
其中,C表示约束矩阵,f表示约束矢量,Rx表示采样协方差矩阵,WH表示波束形成权系数矢量,阵列的采样快拍是统计独立同分布的复高斯随机矢量,由公式(4)求出联合概率密度函数。
Figure BDA0003137223200000022
通过公式(4)对联合概率密度函数取对数,求得协方差矩阵最大似然估计为公式(5);
Figure BDA0003137223200000031
利用拉格朗日子算法求得公式(6)的最优权矢量。
Figure BDA0003137223200000032
公式(7)求得经过LCMV波束形成器输出的语音信号。
b(k)=wLCMVx(k) (7)。
2.2按照公式(8)构造阻塞矩阵B,阻塞矩阵将语音信号过滤掉输出噪声信号,通过公式(9)求出带噪语音信号b(k)经阻塞矩阵求得噪声信号z(k)。
Figure BDA0003137223200000033
zk=B·b(k) (9)。
2.3阻塞矩阵输出的信号z(k)作为参考信号通过公式(10)输入到基于新的变步长lms自适应滤波器中。
y(k)=WT(k)X(k)
e(k)=d(k)-y(k)=d(k)-WT(k)X(n)
Figure BDA0003137223200000034
β(k)=λβ(k-1)+(1-λ)Δe(k) (10)。
Figure BDA0003137223200000035
W(k+1)=W(k)+μX(k)e(k)
其中X(k)表示k时刻的输入信号,y(k)表示k时刻的输出信号,d(k)表示k时刻的期望信号,e(k)表示期望信号与输出信号的差,WT表示采样信号对应时刻的系数,μ为步长因子,λ表示相关矩阵最大特征值,α(k),β(k)均表示控制步长因子的系数,Δe(k)表示前一时刻与当前时刻的期望信号与输出信号的差。
第三步,进入维纳滤波器去掉非相干噪声。
公式(11)通过Wiener-Hopf方程(维纳-霍普夫)求解相应系数。
Figure BDA0003137223200000041
其中Rxx(k)为麦克风阵列接受信号的自相关函数,Rss(k)表示阵列接收信号的语音的自相关函数。
本发明属于语音信号处理技术领域,提供一种基于广义旁瓣相消器的语音增强方法。其特征是首先分别获得两路信号,其中一路是纯净语音信号,另一路信号为噪声信号,经过时延估计和时延补偿将信号对齐。信号进入广义旁瓣相消器的主通道通过LCMV波束形成器抑制干扰和噪声,再经辅助通道的阻塞矩阵过滤掉语音信号得到噪声信号,此噪声信号作为自适应滤波器的参考信号,基于新的变步长lms(最小均方自适应滤波)算法估计噪声,再由维纳滤波器去掉非相干噪声,最终得到理想语音信号。本发明对噪声的抑制能力更强,可以输出更具信噪比的语音信号,满足实际需求。

Claims (1)

1.一种基于广义旁瓣相消结构的语音增强方法,其特征在于包括下列步骤:
第一步,时延估计和时延补偿;
按公式(1)计算各麦克风与参考麦克风的时延差值;按公式(1)给每路信号加上时延补偿时间;
Figure FDA0003137223190000011
其中,设阵列中心的麦克风为参考麦克风,其时延为零,τn为各麦克风相对于参考麦克风的时延差值,D表示相邻麦克风间距离;c表示声速,θ表示声源与y轴方向的夹角;
第二步,带噪信号进入广义旁瓣相消器进行降噪处理;
2.1LCMV波束形成器的约束方程可以表示为公式(2);
Wopt=argminwWHRxW (2);
s.t.WHC=f (3);
其中,C表示约束矩阵,f表示约束矢量,Rx表示采样协方差矩阵,WH表示波束形成权系数矢量,阵列的采样快拍是统计独立同分布的复高斯随机矢量,由公式(4)求出联合概率密度函数;
Figure FDA0003137223190000012
通过公式(4)对联合概率密度函数取对数,求得协方差矩阵最大似然估计为公式(5);
Figure FDA0003137223190000013
利用拉格朗日子算法求得公式(6)的最优权矢量;
Figure FDA0003137223190000014
公式(7)求得经过LCMV波束形成器输出的语音信号;
b(k)=wLCMVx(k) (7)
2.2按照公式(8)构造阻塞矩阵B,阻塞矩阵将语音信号过滤掉输出噪声信号,通过公式(9)求出带噪语音信号b(k)经阻塞矩阵求得噪声信号z(k);
Figure FDA0003137223190000021
zk=B·b(k) (9);
2.3阻塞矩阵输出的信号z(k)作为参考信号通过公式(10)输入到基于新的变步长lms自适应滤波器中;
y(k)=WT(k)X(k)
e(k)=d(k)-y(k)=d(k)-WT(k)X(n)
Figure FDA0003137223190000022
β(k)=λβ(k-1)+(1-λ)Δe(k) (10);
Figure FDA0003137223190000023
W(k+1)=W(k)+μX(k)e(k)
其中X(k)表示k时刻的输入信号,y(k)表示k时刻的输出信号,d(k)表示k时刻的期望信号,e(k)表示期望信号与输出信号的差,WT表示采样信号对应时刻的系数,μ为步长因子,λ表示相关矩阵最大特征值,α(k),β(k)表示控制步长因子的系数,Δe(k)表示前一时刻与当前时刻的期望信号与输出信号的差;
第三步,进入维纳滤波器去掉非相干噪声;
公式(11)通过Wiener-Hopf方程求解相应系数;
Figure FDA0003137223190000024
其中Rxx(k)麦克风阵列接受信号的自相关函数,Rss(k)表示阵列接收信号的语音的自相关函数。
CN202110722390.3A 2021-06-29 2021-06-29 一种基于广义旁瓣相消结构的语音增强方法 Active CN113362846B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110722390.3A CN113362846B (zh) 2021-06-29 2021-06-29 一种基于广义旁瓣相消结构的语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110722390.3A CN113362846B (zh) 2021-06-29 2021-06-29 一种基于广义旁瓣相消结构的语音增强方法

Publications (2)

Publication Number Publication Date
CN113362846A true CN113362846A (zh) 2021-09-07
CN113362846B CN113362846B (zh) 2022-09-20

Family

ID=77536916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110722390.3A Active CN113362846B (zh) 2021-06-29 2021-06-29 一种基于广义旁瓣相消结构的语音增强方法

Country Status (1)

Country Link
CN (1) CN113362846B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114613385A (zh) * 2022-05-07 2022-06-10 广州易而达科技股份有限公司 一种远场语音降噪方法、云服务器及音频采集设备
CN114694675A (zh) * 2022-03-15 2022-07-01 大连理工大学 一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130332156A1 (en) * 2012-06-11 2013-12-12 Apple Inc. Sensor Fusion to Improve Speech/Audio Processing in a Mobile Device
CN103701515A (zh) * 2013-12-11 2014-04-02 北京遥测技术研究所 一种数字多波束形成方法
CN104715758A (zh) * 2015-02-06 2015-06-17 哈尔滨工业大学深圳研究生院 一种分部处理式阵列式语音定位和增强方法
CN105590631A (zh) * 2014-11-14 2016-05-18 中兴通讯股份有限公司 信号处理的方法及装置
CN106842237A (zh) * 2017-01-18 2017-06-13 南京理工大学 快速任意形状方向图主瓣保形自适应波束形成方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130332156A1 (en) * 2012-06-11 2013-12-12 Apple Inc. Sensor Fusion to Improve Speech/Audio Processing in a Mobile Device
CN103701515A (zh) * 2013-12-11 2014-04-02 北京遥测技术研究所 一种数字多波束形成方法
CN105590631A (zh) * 2014-11-14 2016-05-18 中兴通讯股份有限公司 信号处理的方法及装置
CN104715758A (zh) * 2015-02-06 2015-06-17 哈尔滨工业大学深圳研究生院 一种分部处理式阵列式语音定位和增强方法
CN106842237A (zh) * 2017-01-18 2017-06-13 南京理工大学 快速任意形状方向图主瓣保形自适应波束形成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈伟等: "基于波束域LC-GSC的降秩波束形成算法", 《软件导刊》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114694675A (zh) * 2022-03-15 2022-07-01 大连理工大学 一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法
CN114613385A (zh) * 2022-05-07 2022-06-10 广州易而达科技股份有限公司 一种远场语音降噪方法、云服务器及音频采集设备

Also Published As

Publication number Publication date
CN113362846B (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
EP3357256B1 (en) Apparatus using an adaptive blocking matrix for reducing background noise
US10446171B2 (en) Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments
US9443532B2 (en) Noise reduction using direction-of-arrival information
US8468018B2 (en) Apparatus and method for canceling noise of voice signal in electronic apparatus
US11373667B2 (en) Real-time single-channel speech enhancement in noisy and time-varying environments
JP4957810B2 (ja) 音処理装置、音処理方法及び音処理プログラム
WO2018119467A1 (en) Multiple input multiple output (mimo) audio signal processing for speech de-reverberation
CN113362846B (zh) 一种基于广义旁瓣相消结构的语音增强方法
US10129410B2 (en) Echo canceller device and echo cancel method
CN112331226B (zh) 一种针对主动降噪系统的语音增强系统及方法
CN109326297B (zh) 自适应后滤波
Herbordtt et al. Joint optimization of LCMV beamforming and acoustic echo cancellation for automatic speech recognition
CN113658605B (zh) 一种基于深度学习辅助rls滤波处理的语音增强方法
US11195540B2 (en) Methods and apparatus for an adaptive blocking matrix
US10692514B2 (en) Single channel noise reduction
Tan et al. Kronecker Product Based Linear Prediction Kalman Filter for Dereverberation and Noise Reduction
CN112951260B (zh) 一种双麦克风语音增强的方法
CN118571244A (zh) 一种基于自适应步长lms滤波器的广义旁瓣消除方法
Trong An Additive Equalizer for GSC Beamformer
CN117238306A (zh) 一种基于双麦克风的语音活动检测与环境噪声消除方法
CN118824277A (zh) 基于三元麦克风阵列的自适应语音降噪方法
CN116320947A (zh) 一种应用于助听器的频域双通道语音增强方法
CN113851141A (zh) 一种用麦克风阵列进行噪声抑制的新方法和装置
Mohammed et al. Real-time implementation of new adaptive beamformer sensor array for speech enhancement in hearing aid
Schmidt Part 3: Beamforming

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
OL01 Intention to license declared
OL01 Intention to license declared