CN113362846A - 一种基于广义旁瓣相消结构的语音增强方法 - Google Patents
一种基于广义旁瓣相消结构的语音增强方法 Download PDFInfo
- Publication number
- CN113362846A CN113362846A CN202110722390.3A CN202110722390A CN113362846A CN 113362846 A CN113362846 A CN 113362846A CN 202110722390 A CN202110722390 A CN 202110722390A CN 113362846 A CN113362846 A CN 113362846A
- Authority
- CN
- China
- Prior art keywords
- signal
- noise
- signals
- formula
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 230000003044 adaptive effect Effects 0.000 claims abstract description 9
- 230000000903 blocking effect Effects 0.000 claims abstract description 8
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 claims abstract description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000005311 autocorrelation function Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 238000007476 Maximum Likelihood Methods 0.000 claims description 2
- 230000005764 inhibitory process Effects 0.000 abstract description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明属于语音信号处理技术领域,提供一种基于广义旁瓣相消器的语音增强方法。其特征是首先分别获得两路信号,其中一路是纯净语音信号,另一路信号为噪声信号,经过时延估计和时延补偿将信号对齐。信号进入广义旁瓣相消器的主通道通过LCMV波束形成器抑制干扰和噪声,再经辅助通道的阻塞矩阵过滤掉语音信号得到噪声信号,此噪声信号作为自适应滤波器的参考信号,基于新的变步长lms算法估计噪声,再由维纳滤波器去掉非相干噪声,最终得到理想语音信号。本发明对噪声的抑制能力更强,可以输出更具信噪比的语音信号,满足实际需求。
Description
技术领域
本发明属于语音信号处理技术领域,涉及到自适应波束形成语音增强方法,特别涉及一种使用广义旁瓣相消结构的语音增强方法。
背景技术
语音增强技术作为一项核心技术广泛应用于语音信号处理中。语音增强技术包括单通道语音增强、多通道语音增强和基于深度学习的语音增强三大类。在免提电话、视频会议等语音通信系统中,麦克风接收到的语音信号通常已被各种噪声污染,例如周期噪声、脉冲噪声和高斯白噪声等,这些噪声干扰人类的学习与工作。语音增强技术是利用麦克风接收语音信号,然后利用自适应滤波或波束形成等算法对信号进行处理,抑制噪声和干扰,达到增强目标语音信号的目的。
语音增强的分类方法有很多,其中按照使用的麦克风个数可将其分为单通道语音增强算法和多通道语音增强算法。单通道语音增强技术只需要对一个麦克风接收到的语音信号进行处理。虽然对硬件设备的要求简单,但可利用的语音信息较少,所以单通道语音增强技术对噪声的抑制效果并不理想。所谓多通道语音增强,即利用麦克风阵列对语音信号进行增强处理。麦克风阵列可以根据麦克风的空间位置以及语音信号的时域和频域等信息,利用波束形成准则对阵元接收到的每一通道的语音信号分别施加权重,在目标方向形成一个波束使其增益最大,使波束外的噪声信号得以消除。波束形成技术又可根据加权值是否随着语音信息改变分为固定波束成形和自适应波束成形。固定波束成形的权值与语音信号无关,只与声源和麦克风之间的距离有关,而自适应波束成形语音信号改变时加权值也可以自适应更新。其优点是使用少量的麦克风就可以对干扰噪声产生抑制。综上所述,本文拟针对传统自适应波束形成算法进行改进,使得改进后算法可以更好地抑制噪声,提高输出语音的信噪比,提高后续基于语音的应用的效果。
发明内容
针对现有技术的不足,本发明提供一种基于广义旁瓣相消结构的语音增强方法,是一种自适应波束形成的语音增强方法,本方法采用广义旁瓣相消器,并用LCMV(线性约束最小方差)波束形成器代替广义旁瓣相消器中上支路的固定波束形成器。提出一种GSC-LCMV语音增强方法,GSC为广义旁瓣相消器。
本发明的技术方案为:
一种GSC-LCMV自适应的语音增强方法,主要包括以下步骤:
第一步,分别获得两路信号,其中一路是纯净语音信号,另一路信号为噪声信号,经过时延估计和时延补偿将信号对齐。
第二步,带噪信号进入广义旁瓣相消器进行降噪处理。
2.1利用主通道的LCMV波束形成器对噪声和干扰进行抑制。
2.2利用辅助通道的阻塞矩阵过滤掉语音信号得到噪声信号。
2.3利用噪声抵消模块估计噪声。
第三步,经广义旁瓣相消器输出的信号进入维纳滤波器去掉非相干噪声,最后得到所求的语音增强之后的信号。
其优点在于:
本方法对噪声的抑制能力更强,可以输出更具信噪比的语音信号,满足实际需求。
附图说明
图1是本发明的算法流程图。
图2是本发明中LCMV波束形成方向图。
图3是本发明中带噪语音波形图和经过本发明语音增强之后的语音波形图。
具体实施方式
为使本发明实施例的目的、技术方案及其优点更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整的描述,整体算法流程图如图1所示:
第一步,时延估计和时延补偿。
按公式(1)计算各麦克风与参考麦克风的时延差值;按公式(1)给每路信号加上时延补偿时间。
因麦克风之间的位置不同,各麦克风收集到的信号会存在相对时延。其中,假设阵列中心的麦克风为参考麦克风,其时延为零,τn为各麦克风相对于参考麦克风的时延差值,D表示相邻麦克风间距离;c表示声速,θ表示声源与y轴方向的夹角。
第二步,带噪信号进入广义旁瓣相消器进行降噪处理。
2.1LCMV波束形成器的约束方程可以表示为公式(2)。
Wopt=argminwWHRxW (2)。
s.t.WHC=f (3)。
其中,C表示约束矩阵,f表示约束矢量,Rx表示采样协方差矩阵,WH表示波束形成权系数矢量,阵列的采样快拍是统计独立同分布的复高斯随机矢量,由公式(4)求出联合概率密度函数。
通过公式(4)对联合概率密度函数取对数,求得协方差矩阵最大似然估计为公式(5);
利用拉格朗日子算法求得公式(6)的最优权矢量。
公式(7)求得经过LCMV波束形成器输出的语音信号。
b(k)=wLCMVx(k) (7)。
2.2按照公式(8)构造阻塞矩阵B,阻塞矩阵将语音信号过滤掉输出噪声信号,通过公式(9)求出带噪语音信号b(k)经阻塞矩阵求得噪声信号z(k)。
zk=B·b(k) (9)。
2.3阻塞矩阵输出的信号z(k)作为参考信号通过公式(10)输入到基于新的变步长lms自适应滤波器中。
y(k)=WT(k)X(k)
e(k)=d(k)-y(k)=d(k)-WT(k)X(n)
β(k)=λβ(k-1)+(1-λ)Δe(k) (10)。
W(k+1)=W(k)+μX(k)e(k)
其中X(k)表示k时刻的输入信号,y(k)表示k时刻的输出信号,d(k)表示k时刻的期望信号,e(k)表示期望信号与输出信号的差,WT表示采样信号对应时刻的系数,μ为步长因子,λ表示相关矩阵最大特征值,α(k),β(k)均表示控制步长因子的系数,Δe(k)表示前一时刻与当前时刻的期望信号与输出信号的差。
第三步,进入维纳滤波器去掉非相干噪声。
公式(11)通过Wiener-Hopf方程(维纳-霍普夫)求解相应系数。
其中Rxx(k)为麦克风阵列接受信号的自相关函数,Rss(k)表示阵列接收信号的语音的自相关函数。
本发明属于语音信号处理技术领域,提供一种基于广义旁瓣相消器的语音增强方法。其特征是首先分别获得两路信号,其中一路是纯净语音信号,另一路信号为噪声信号,经过时延估计和时延补偿将信号对齐。信号进入广义旁瓣相消器的主通道通过LCMV波束形成器抑制干扰和噪声,再经辅助通道的阻塞矩阵过滤掉语音信号得到噪声信号,此噪声信号作为自适应滤波器的参考信号,基于新的变步长lms(最小均方自适应滤波)算法估计噪声,再由维纳滤波器去掉非相干噪声,最终得到理想语音信号。本发明对噪声的抑制能力更强,可以输出更具信噪比的语音信号,满足实际需求。
Claims (1)
1.一种基于广义旁瓣相消结构的语音增强方法,其特征在于包括下列步骤:
第一步,时延估计和时延补偿;
按公式(1)计算各麦克风与参考麦克风的时延差值;按公式(1)给每路信号加上时延补偿时间;
其中,设阵列中心的麦克风为参考麦克风,其时延为零,τn为各麦克风相对于参考麦克风的时延差值,D表示相邻麦克风间距离;c表示声速,θ表示声源与y轴方向的夹角;
第二步,带噪信号进入广义旁瓣相消器进行降噪处理;
2.1LCMV波束形成器的约束方程可以表示为公式(2);
Wopt=argminwWHRxW (2);
s.t.WHC=f (3);
其中,C表示约束矩阵,f表示约束矢量,Rx表示采样协方差矩阵,WH表示波束形成权系数矢量,阵列的采样快拍是统计独立同分布的复高斯随机矢量,由公式(4)求出联合概率密度函数;
通过公式(4)对联合概率密度函数取对数,求得协方差矩阵最大似然估计为公式(5);
利用拉格朗日子算法求得公式(6)的最优权矢量;
公式(7)求得经过LCMV波束形成器输出的语音信号;
b(k)=wLCMVx(k) (7)
2.2按照公式(8)构造阻塞矩阵B,阻塞矩阵将语音信号过滤掉输出噪声信号,通过公式(9)求出带噪语音信号b(k)经阻塞矩阵求得噪声信号z(k);
zk=B·b(k) (9);
2.3阻塞矩阵输出的信号z(k)作为参考信号通过公式(10)输入到基于新的变步长lms自适应滤波器中;
y(k)=WT(k)X(k)
e(k)=d(k)-y(k)=d(k)-WT(k)X(n)
β(k)=λβ(k-1)+(1-λ)Δe(k) (10);
W(k+1)=W(k)+μX(k)e(k)
其中X(k)表示k时刻的输入信号,y(k)表示k时刻的输出信号,d(k)表示k时刻的期望信号,e(k)表示期望信号与输出信号的差,WT表示采样信号对应时刻的系数,μ为步长因子,λ表示相关矩阵最大特征值,α(k),β(k)表示控制步长因子的系数,Δe(k)表示前一时刻与当前时刻的期望信号与输出信号的差;
第三步,进入维纳滤波器去掉非相干噪声;
公式(11)通过Wiener-Hopf方程求解相应系数;
其中Rxx(k)麦克风阵列接受信号的自相关函数,Rss(k)表示阵列接收信号的语音的自相关函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110722390.3A CN113362846B (zh) | 2021-06-29 | 2021-06-29 | 一种基于广义旁瓣相消结构的语音增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110722390.3A CN113362846B (zh) | 2021-06-29 | 2021-06-29 | 一种基于广义旁瓣相消结构的语音增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113362846A true CN113362846A (zh) | 2021-09-07 |
CN113362846B CN113362846B (zh) | 2022-09-20 |
Family
ID=77536916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110722390.3A Active CN113362846B (zh) | 2021-06-29 | 2021-06-29 | 一种基于广义旁瓣相消结构的语音增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113362846B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114613385A (zh) * | 2022-05-07 | 2022-06-10 | 广州易而达科技股份有限公司 | 一种远场语音降噪方法、云服务器及音频采集设备 |
CN114694675A (zh) * | 2022-03-15 | 2022-07-01 | 大连理工大学 | 一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130332156A1 (en) * | 2012-06-11 | 2013-12-12 | Apple Inc. | Sensor Fusion to Improve Speech/Audio Processing in a Mobile Device |
CN103701515A (zh) * | 2013-12-11 | 2014-04-02 | 北京遥测技术研究所 | 一种数字多波束形成方法 |
CN104715758A (zh) * | 2015-02-06 | 2015-06-17 | 哈尔滨工业大学深圳研究生院 | 一种分部处理式阵列式语音定位和增强方法 |
CN105590631A (zh) * | 2014-11-14 | 2016-05-18 | 中兴通讯股份有限公司 | 信号处理的方法及装置 |
CN106842237A (zh) * | 2017-01-18 | 2017-06-13 | 南京理工大学 | 快速任意形状方向图主瓣保形自适应波束形成方法 |
-
2021
- 2021-06-29 CN CN202110722390.3A patent/CN113362846B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130332156A1 (en) * | 2012-06-11 | 2013-12-12 | Apple Inc. | Sensor Fusion to Improve Speech/Audio Processing in a Mobile Device |
CN103701515A (zh) * | 2013-12-11 | 2014-04-02 | 北京遥测技术研究所 | 一种数字多波束形成方法 |
CN105590631A (zh) * | 2014-11-14 | 2016-05-18 | 中兴通讯股份有限公司 | 信号处理的方法及装置 |
CN104715758A (zh) * | 2015-02-06 | 2015-06-17 | 哈尔滨工业大学深圳研究生院 | 一种分部处理式阵列式语音定位和增强方法 |
CN106842237A (zh) * | 2017-01-18 | 2017-06-13 | 南京理工大学 | 快速任意形状方向图主瓣保形自适应波束形成方法 |
Non-Patent Citations (1)
Title |
---|
陈伟等: "基于波束域LC-GSC的降秩波束形成算法", 《软件导刊》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114694675A (zh) * | 2022-03-15 | 2022-07-01 | 大连理工大学 | 一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法 |
CN114613385A (zh) * | 2022-05-07 | 2022-06-10 | 广州易而达科技股份有限公司 | 一种远场语音降噪方法、云服务器及音频采集设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113362846B (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3357256B1 (en) | Apparatus using an adaptive blocking matrix for reducing background noise | |
US10446171B2 (en) | Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments | |
US9443532B2 (en) | Noise reduction using direction-of-arrival information | |
US8468018B2 (en) | Apparatus and method for canceling noise of voice signal in electronic apparatus | |
US11373667B2 (en) | Real-time single-channel speech enhancement in noisy and time-varying environments | |
JP4957810B2 (ja) | 音処理装置、音処理方法及び音処理プログラム | |
WO2018119467A1 (en) | Multiple input multiple output (mimo) audio signal processing for speech de-reverberation | |
CN113362846B (zh) | 一种基于广义旁瓣相消结构的语音增强方法 | |
US10129410B2 (en) | Echo canceller device and echo cancel method | |
CN112331226B (zh) | 一种针对主动降噪系统的语音增强系统及方法 | |
CN109326297B (zh) | 自适应后滤波 | |
Herbordtt et al. | Joint optimization of LCMV beamforming and acoustic echo cancellation for automatic speech recognition | |
CN113658605B (zh) | 一种基于深度学习辅助rls滤波处理的语音增强方法 | |
US11195540B2 (en) | Methods and apparatus for an adaptive blocking matrix | |
US10692514B2 (en) | Single channel noise reduction | |
Tan et al. | Kronecker Product Based Linear Prediction Kalman Filter for Dereverberation and Noise Reduction | |
CN112951260B (zh) | 一种双麦克风语音增强的方法 | |
CN118571244A (zh) | 一种基于自适应步长lms滤波器的广义旁瓣消除方法 | |
Trong | An Additive Equalizer for GSC Beamformer | |
CN117238306A (zh) | 一种基于双麦克风的语音活动检测与环境噪声消除方法 | |
CN118824277A (zh) | 基于三元麦克风阵列的自适应语音降噪方法 | |
CN116320947A (zh) | 一种应用于助听器的频域双通道语音增强方法 | |
CN113851141A (zh) | 一种用麦克风阵列进行噪声抑制的新方法和装置 | |
Mohammed et al. | Real-time implementation of new adaptive beamformer sensor array for speech enhancement in hearing aid | |
Schmidt | Part 3: Beamforming |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
OL01 | Intention to license declared | ||
OL01 | Intention to license declared |