CN113870884B - 单麦克风噪声抑制方法和装置 - Google Patents

单麦克风噪声抑制方法和装置 Download PDF

Info

Publication number
CN113870884B
CN113870884B CN202111455641.2A CN202111455641A CN113870884B CN 113870884 B CN113870884 B CN 113870884B CN 202111455641 A CN202111455641 A CN 202111455641A CN 113870884 B CN113870884 B CN 113870884B
Authority
CN
China
Prior art keywords
signal
sequence
spectrum
noise
odd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111455641.2A
Other languages
English (en)
Other versions
CN113870884A (zh
Inventor
梁民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Net Cloud Service Co Ltd
Original Assignee
G Net Cloud Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Net Cloud Service Co Ltd filed Critical G Net Cloud Service Co Ltd
Priority to CN202111455641.2A priority Critical patent/CN113870884B/zh
Publication of CN113870884A publication Critical patent/CN113870884A/zh
Application granted granted Critical
Publication of CN113870884B publication Critical patent/CN113870884B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明公开了一种单麦克风噪声抑制方法和装置。所述方法包括:根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数;利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号;将所述目标语音谱信号进行时域变换,得到目标语音信号。本发明通过单麦克风接收的观测信号的奇偶序列谱信号来设计一个降噪滤波器的噪声抑制增益函数,用之对含噪的观察信号的谱信号进行滤波处理,以自适应抑制运行环境的相干与不相干噪声以及散射噪声,实现单麦克风接收的观察信号中语音信号的增强。

Description

单麦克风噪声抑制方法和装置
技术领域
本发明涉及通信技术领域,尤其涉及一种单麦克风噪声抑制方法和装置。
背景技术
会议通信系统运行的环境异常繁多、复杂,客户端麦克风拾取的语音信号通常含有环境噪声干扰,这些噪声干扰的存在严重地影响了会议通话质量。为此,需要对这些噪声干扰进行抑制处理,以提升会议通信系统的通话质量。
目前,基于单麦克风的含噪语音信号增强技术中,最为著名的单麦克风降噪技术有谱减法、Wiener(维纳)滤波法和MMSE(Minimum Mean Squared Error,最小均方误差)法,它们均利用语音的间歇性和噪声的平稳性之假设来估计噪声的功率谱,进而估计含噪语音信号的信噪比,并据此来进行噪声抑制。然而,上述方案在实际应用中会产生音乐噪声,特别是在非平稳和强干扰电平的噪声场景下。于是基于麦克风阵列的降噪技术便应运而生,其中最为代表性的是波束赋性技术。波束赋型技术是利用目标声源的方位信息,让麦克风阵列在目标声源方向上形成空间选择性,来选通目标声源而滤除噪声。众多的波束赋型算法中,GSC(Generalized Sidelobe Canceller,广义旁瓣相消器)算法和Frost算法展现出可靠的性能。尽管基于麦克风阵列的多声道降噪算法的性能可以通过增加阵列的麦克风数目来进一步地加以改善,但大量的麦克风数目意味着波束赋型算法的计算复杂度剧烈增大,从而难以在现有的商用DSP(Digital Signal Processor,数字信号处理器)芯片上实现。此外,波束赋型算法对麦克风阵列运行环境中的相干方向性噪声源具有良好的滤波或抑制能力,但对非相干噪声的抑制通常较差,因此波束赋型器对噪声的抑制量受限于其中的非相干噪声。
发明内容
为了解决上述问题,本发明提供了一种单麦克风噪声抑制方法和装置,能够有效抑制运行环境的相干与不相干噪声以及散射噪声,实现单麦克风接收的观察信号中语音信号的增强。
本发明的第一方面涉及一种单麦克风噪声抑制方法,包括:
根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数;
利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号;
将所述目标语音谱信号进行时域变换,得到目标语音信号。
可选地,所述根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数,包括:
根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号;
根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱;
估计所述观测信号中噪声信号的奇偶序列互功率谱幅度;
根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度;
根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
可选地,所述根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号,包括:
根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号
Figure DEST_PATH_IMAGE001
进行分解,得到所述观测信号的奇序列谱信号
Figure 115145DEST_PATH_IMAGE002
和偶序列谱信号
Figure DEST_PATH_IMAGE003
Figure 927113DEST_PATH_IMAGE004
(1)
Figure DEST_PATH_IMAGE005
(2)
其中,
Figure 255326DEST_PATH_IMAGE006
,k = 0, 1, 2, …, 2L-1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2L, 信号帧长为L。
可选地,所述根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱,包括:
根据如下公式(3)估计所述观测信号的奇偶序列互功率谱
Figure DEST_PATH_IMAGE007
Figure 270686DEST_PATH_IMAGE008
(3)
其中,
Figure 444179DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,*为复共轭运算符,
Figure 720439DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,α为预设的平滑因子常数,
Figure DEST_PATH_IMAGE009
可选地,根据如下公式(4)估计所述观测信号的奇偶序列互功率谱
Figure 621485DEST_PATH_IMAGE007
Figure 983197DEST_PATH_IMAGE010
(4)
其中,
Figure 960380DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 966513DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,
Figure DEST_PATH_IMAGE011
为根据如下公式(5)计算得到的平滑参数:
Figure 636529DEST_PATH_IMAGE012
(5)
其中,
Figure DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数。
可选地,所述估计观测信号中噪声信号的奇偶序列互功率谱幅度,包括:
根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 875749DEST_PATH_IMAGE014
(6)
其中,Med{·}为中值滤波的运算符,
Figure DEST_PATH_IMAGE015
Figure 656623DEST_PATH_IMAGE016
为中值滤波器窗口长度、并定义为奇数。
可选地,所述估计观测信号中噪声信号的奇偶序列互功率谱幅度,包括:
将中值滤波器窗口划分为q个子窗口
Figure DEST_PATH_IMAGE017
,每个子窗口
Figure 48422DEST_PATH_IMAGE017
的窗口长度为
Figure 623759DEST_PATH_IMAGE018
,且
Figure DEST_PATH_IMAGE019
Figure 225642DEST_PATH_IMAGE016
为中值滤波器窗口长度;
根据如下公式(7)计算每个子窗口
Figure 279049DEST_PATH_IMAGE017
中的观测信号的奇偶序列互功率谱幅度的算数平均值
Figure 509042DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE021
(7)
根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 520860DEST_PATH_IMAGE022
(8)
其中,Med{·}为中值滤波的运算符。
可选地,所述根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度,包括:
根据如下公式(9),估计后验信噪比
Figure DEST_PATH_IMAGE023
Figure 219826DEST_PATH_IMAGE024
(9)
根据如下公式(10)、(11),估计先验信噪比
Figure DEST_PATH_IMAGE025
Figure 608082DEST_PATH_IMAGE026
(10)
Figure DEST_PATH_IMAGE027
(11)
根据如下公式(12),进行维纳滤波器函数
Figure 958161DEST_PATH_IMAGE028
估计:
Figure DEST_PATH_IMAGE029
(12)
根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:
Figure 875301DEST_PATH_IMAGE030
(13)
其中,
Figure 186197DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号、
Figure 846985DEST_PATH_IMAGE003
为偶序列谱信号;
Figure DEST_PATH_IMAGE031
为所述噪声信号的奇偶序列互功率谱幅度;
Figure 802303DEST_PATH_IMAGE032
根据如下公式
Figure 155924DEST_PATH_IMAGE012
计算得到;
Figure 422957DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数,
Figure DEST_PATH_IMAGE033
为t-1帧时刻的维纳滤波器函数。
可选地,所述根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数,包括:
根据如下公式(14),估计噪声抑制增益函数
Figure 277649DEST_PATH_IMAGE034
Figure DEST_PATH_IMAGE035
(14)
其中,
Figure 212107DEST_PATH_IMAGE036
为所述观测信号的奇序列自功率谱,
Figure DEST_PATH_IMAGE037
为观测信号的偶序列自功率谱;
Figure 736630DEST_PATH_IMAGE036
Figure 631904DEST_PATH_IMAGE037
根据如下公式(15)、(16)估计得到:
Figure 634495DEST_PATH_IMAGE038
(15)
Figure DEST_PATH_IMAGE039
(16)
Figure 689039DEST_PATH_IMAGE040
为所述语音信号的奇偶序列互功率谱幅度。
本发明的第二方面涉及一种单麦克风噪声抑制装置,包括:
噪声抑制估计模块,用于根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数;
噪声频域滤波模块,用于利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号;
时域变换模块,用于将所述目标语音谱信号进行时域变换,得到目标语音信号。
可选地,所述噪声抑制估计模块包括:
奇偶分解单元,用于根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号;
第一功率谱估计单元,用于根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱;
第二功率谱估计单元,用于估计所述观测信号中噪声信号的奇偶序列互功率谱幅度;
第三功率谱估计单元,用于根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度;
噪声抑制估计单元,用于根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
可选地,所述奇偶分解单元用于根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号
Figure 509097DEST_PATH_IMAGE001
进行分解,得到所述观测信号的奇序列谱信号
Figure 485143DEST_PATH_IMAGE002
和偶序列谱信号
Figure 291425DEST_PATH_IMAGE003
Figure 200475DEST_PATH_IMAGE004
(1)
Figure 801221DEST_PATH_IMAGE005
(2)
其中,
Figure 671088DEST_PATH_IMAGE006
,k = 0, 1, 2, …, 2L-1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2L, 信号帧长为L。
可选地,所述第一功率谱估计单元用于根据如下公式(3)估计所述观测信号的奇偶序列互功率谱
Figure 15481DEST_PATH_IMAGE007
Figure 513459DEST_PATH_IMAGE008
(3)
其中,
Figure 285106DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 766903DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,α为预设的平滑因子常数,
Figure 39621DEST_PATH_IMAGE009
可选地,所述第一功率谱估计单元用于根据如下公式(4)估计所述观测信号的奇偶序列互功率谱
Figure 657684DEST_PATH_IMAGE007
Figure 600232DEST_PATH_IMAGE010
(4)
其中,
Figure 303746DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 989942DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,
Figure 603457DEST_PATH_IMAGE011
为根据如下公式(5)计算得到的平滑参数:
Figure 716907DEST_PATH_IMAGE012
(5)
其中,
Figure 907717DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数。
可选地,所述第二功率谱估计单元用于根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure DEST_PATH_IMAGE041
(6)
其中,Med{·}为中值滤波的运算符,
Figure 787817DEST_PATH_IMAGE015
Figure 380472DEST_PATH_IMAGE016
为中值滤波器窗口长度、并定义为奇数。
可选地,所述第二功率谱估计单元用于将中值滤波器窗口划分为q个子窗口
Figure 930402DEST_PATH_IMAGE017
,每个子窗口
Figure 342929DEST_PATH_IMAGE017
的窗口长度为
Figure 370928DEST_PATH_IMAGE018
,且
Figure 693456DEST_PATH_IMAGE019
Figure 414287DEST_PATH_IMAGE016
为中值滤波器窗口长度;
根据如下公式(7)计算每个子窗口
Figure 579690DEST_PATH_IMAGE017
中的观测信号的奇偶序列互功率谱幅度的算数平均值
Figure 411379DEST_PATH_IMAGE020
Figure 447468DEST_PATH_IMAGE021
(7)
根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 463835DEST_PATH_IMAGE042
(8)
其中,Med{·}为中值滤波的运算符。
可选地,所述第三功率谱估计单元用于根据如下公式(9),估计后验信噪比
Figure 116533DEST_PATH_IMAGE023
Figure 486335DEST_PATH_IMAGE024
(9)
根据如下公式(10)、(11),估计先验信噪比
Figure 908089DEST_PATH_IMAGE025
Figure DEST_PATH_IMAGE043
(10)
Figure 846089DEST_PATH_IMAGE044
(11)
根据如下公式(12),进行维纳滤波器函数
Figure 720504DEST_PATH_IMAGE028
估计:
Figure 159575DEST_PATH_IMAGE029
(12)
根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:
Figure 435836DEST_PATH_IMAGE030
(13)
其中,
Figure 794005DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号、
Figure 890137DEST_PATH_IMAGE003
为偶序列谱信号;
Figure 601741DEST_PATH_IMAGE031
为所述噪声信号的奇偶序列互功率谱幅度;
Figure 998087DEST_PATH_IMAGE032
根据公式
Figure 402524DEST_PATH_IMAGE012
计算得到;
Figure 126897DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数,
Figure 642192DEST_PATH_IMAGE033
为t-1帧时刻的维纳滤波器函数。
可选地,所述噪声抑制估计单元用于根据如下公式(14),估计噪声抑制增益函数
Figure 893045DEST_PATH_IMAGE034
Figure 468383DEST_PATH_IMAGE035
(14)
其中,
Figure 539107DEST_PATH_IMAGE036
为所述观测信号的奇序列自功率谱,
Figure 982727DEST_PATH_IMAGE037
为观测信号的偶序列自功率谱;
Figure 88086DEST_PATH_IMAGE036
Figure 834325DEST_PATH_IMAGE037
根据如下公式(15)、(16)估计得到:
Figure 392345DEST_PATH_IMAGE038
(15)
Figure 249443DEST_PATH_IMAGE039
(16)
Figure 84675DEST_PATH_IMAGE040
为所述语音信号的奇偶序列互功率谱幅度。
本发明的第三方面涉及一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述的方法。
本发明的第四方面涉及一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法。
本发明通过单麦克风接收的观测信号的奇偶序列谱信号来设计一个降噪滤波器的噪声抑制增益函数,用之对含噪的观察信号的谱信号进行滤波处理,以自适应抑制运行环境的相干与不相干噪声以及散射噪声,实现单麦克风接收的观察信号中语音信号的增强。
附图说明
图1为根据本发明一实施例的单麦克风噪声抑制方法的流程示意图;
图2为根据本发明一实施例的噪声抑制增益函数估计方法的流程示意图;
图3为根据本发明一实施例的单麦克风噪声抑制装置的结构示意图;
图4为根据本发明一实施例的噪声抑制估计模块的结构示意图;
图5为根据本发明另一实施例的单麦克风噪声抑制方法的流程示意图;
图6为根据本发明一实施例的单麦克风噪声抑制器的原理系统框图;
图7为能够实施本发明实施例的示例性电子设备的方框示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
参考图1,其示出了根据本发明一实施例的单麦克风噪声抑制方法的流程示意图。如图1所示,本发明一实施例提供了一种单麦克风噪声抑制方法,包括:S101、根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数;S102、利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号;S103、将所述目标语音谱信号进行时域变换,得到目标语音信号。实际应用中,目标语音信号为增强的语音信号。本发明实施例提供的单麦克风噪声抑制,通过单麦克风接收的观测信号的奇偶序列谱信号来设计一个降噪滤波器的噪声抑制增益函数,用之对含噪的观察信号的谱信号进行滤波处理,以自适应抑制运行环境的相干与不相干噪声以及散射噪声,从而实现单麦克风接收的观察信号中语音信号的增强。
参考图2,其示出了根据本发明一实施例的噪声抑制增益函数估计方法的流程示意图。如图2所示,本发明一实施例提供了一种噪声抑制增益函数估计方法,包括:
S201、根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号。
可以理解的是,单麦克风接收到的含噪语音观测信号y(n)在数学上可表示为:
Figure DEST_PATH_IMAGE045
,其中s(n)和v(n)分别为语音信号和噪声信号,不失一般性,假设它们之间不相关;n为时域离散的样本点索引。那么在采样率不变的条件下,可将y(n)分解成奇序列
Figure 267395DEST_PATH_IMAGE046
和偶序列
Figure DEST_PATH_IMAGE047
可以理解的是,
Figure 968503DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE049
,其中,m为非负整数,
Figure 629292DEST_PATH_IMAGE050
Figure DEST_PATH_IMAGE051
分别为序列x(n)按上述方法分解的奇偶序列,这里x(n)可分别表示信号y(n)、s(n)和 v(n)。
因而有如下关系式:
Figure 709243DEST_PATH_IMAGE052
Figure DEST_PATH_IMAGE053
Figure 203810DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE055
Figure 2001DEST_PATH_IMAGE056
对上述关系式的两边进行STFT(Short-Time Fourier Tansform,短时傅里叶变换),可得下述的关系式:
Figure DEST_PATH_IMAGE057
Figure 591115DEST_PATH_IMAGE058
Figure DEST_PATH_IMAGE059
Figure 525572DEST_PATH_IMAGE060
Figure DEST_PATH_IMAGE061
其中, X(k,t) 表示信号x(n)的STFT频谱信号,x(n)可分别表示信号y(n)、s(n)、v(n)、
Figure 191040DEST_PATH_IMAGE062
Figure DEST_PATH_IMAGE063
Figure 210949DEST_PATH_IMAGE064
Figure DEST_PATH_IMAGE065
Figure 479119DEST_PATH_IMAGE066
Figure DEST_PATH_IMAGE067
,k = 0, 1, 2, …, 2L-1为频点的索引,t为信号帧索引;STFT中使用的窗函数的窗长为2L, 信号帧长为L。
本发明的一些实施例中,可以将单麦克风接收的观测信号y(n)视作两个麦克风分别拾取的2路观测信号
Figure 658297DEST_PATH_IMAGE062
Figure 88141DEST_PATH_IMAGE063
,应用互功率谱差降噪技术来抑制
Figure 595346DEST_PATH_IMAGE062
Figure 276994DEST_PATH_IMAGE063
中的噪声信号
Figure 654885DEST_PATH_IMAGE066
Figure 521210DEST_PATH_IMAGE067
本发明的一些实施例中,可以对单麦克风接收的观测信号进行奇偶分解;分别对分解得到的奇序列时域信号和偶序列时域信号进行频域变换,得到所述观测信号的奇序列谱信号和偶序列谱信号。
本发明的一些实施例中,可以采用STFT进行短时频域变换。相应地,本发明的一些实施例中,在通过步骤S103对目标语音谱信号进行时域变换过程中,可以采用逆STFT把目标语音谱信号变换回时域。进一步地,本发明的一些实施例中,可以应用逆STFT和重叠相加技术把目标语音谱信号变换回时域。可以理解的是,STFT、逆STFT和重叠相加技术均为本领域技术人员常用的时频间的变换技术,此处不再详述。
本发明的一些实施例中,在采样率保持不变的条件下,可将观测信号的谱信号Y(k, t)直接分解成其奇序列和偶序列时域信号对应的两个短时频域的谱信号。具体地,可以根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号
Figure 250132DEST_PATH_IMAGE001
进行分解,得到所述观测信号的奇序列谱信号
Figure 860105DEST_PATH_IMAGE002
和偶序列谱信号
Figure 358082DEST_PATH_IMAGE003
Figure 254363DEST_PATH_IMAGE004
(1)
Figure 736160DEST_PATH_IMAGE005
(2)
其中,
Figure 884244DEST_PATH_IMAGE068
,k = 0, 1, 2, …, 2L-1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2L, 信号帧长为L。这样,可以降低在时域分解并对其分解的时域子信号分别进行频域变换的方法复杂度。
S202、根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱。
本发明的一些实施例中,可以根据如下公式(3)估计所述观测信号的奇偶序列互功率谱
Figure 502308DEST_PATH_IMAGE007
Figure DEST_PATH_IMAGE069
(3)
其中,
Figure 320222DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 23736DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,*为复共轭运算符,α为预设的平滑因子常数,
Figure 975511DEST_PATH_IMAGE009
。实际应用中,通常
Figure 448081DEST_PATH_IMAGE070
可选地,本发明的一些实施例中,可以根据如下公式(4)估计所述观测信号的奇偶序列互功率谱
Figure 561530DEST_PATH_IMAGE007
Figure 408133DEST_PATH_IMAGE010
(4)
其中,
Figure 38965DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 631621DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,
Figure 181551DEST_PATH_IMAGE011
为根据如下公式(5)计算得到的平滑参数:
Figure 328498DEST_PATH_IMAGE012
(5)
其中,
Figure 622076DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数。
S203、估计所述观测信号中噪声信号的奇偶序列互功率谱幅度。
本发明的一些实施例中,可以根据如下关系式来估计所述观测信号中噪声信号的奇偶序列互功率谱
Figure DEST_PATH_IMAGE071
Figure 471170DEST_PATH_IMAGE072
其中,
Figure 192001DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 91824DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,
Figure DEST_PATH_IMAGE073
为预设的另一平滑因子常数,
Figure 64459DEST_PATH_IMAGE074
。实际应用中,通常
Figure DEST_PATH_IMAGE075
。继而,根据估计的奇偶序列互功率谱
Figure 366128DEST_PATH_IMAGE071
,获得观测信号中噪声信号的奇偶序列互功率谱幅度。
实际应用中,通过上述方式估计观测信号中噪声信号的奇偶序列互功率谱
Figure 257860DEST_PATH_IMAGE071
,需要在VAD(Voice activity detection,语音活性检测器)的协助下进行。由于VAD的误检存在,使得估计的精度有限;此外,实际运行环境中噪声的频谱特征可能一直在变化,这便要求无论存在语音信号与否,噪声互功率谱的估计都必须可持续地进行。虽然应用R. Martin提出的最小统计量技术可持续地估计噪声互功率谱而无需VAD,但在环境噪声能量发生突增的情况下,最小统计量方法无法及时地跟踪这一变化;另外,最小统计量技术获得的噪声互功率谱估计通常为亚估计(under-estimation),需要一个补偿因子对之进行修正;而精确计算这一补偿因子通常较为困难。因此,本发明的一些实施例中,可以选用基于分位数的噪声估计(QNE)技术来估计噪声的互功率谱,特别是分位数估计器中的中值估计技术,具有更好的鲁棒特性。
具体地,可以根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 644979DEST_PATH_IMAGE076
(6)
其中,Med{·}为中值滤波的运算符,
Figure 404994DEST_PATH_IMAGE015
Figure 561169DEST_PATH_IMAGE016
为中值滤波器窗口长度、并定义为奇数。
考虑中值滤波技术中排序运算涉及大量计算量,不利于实时在线实现。可选地,为降低长窗口的中值滤波运算量,从而可实时在线实现,可以采用线性滤波与小窗口中值滤波的级联方式来近似实现长窗口中值滤波。
具体地,本发明的一些实施例中,可将中值滤波器窗口划分为q个子窗口
Figure 623803DEST_PATH_IMAGE017
,每个子窗口
Figure 498218DEST_PATH_IMAGE017
的窗口长度为
Figure 671710DEST_PATH_IMAGE018
,且
Figure 823337DEST_PATH_IMAGE019
Figure 791293DEST_PATH_IMAGE016
为中值滤波器窗口长度;
继而,根据如下公式(7)计算每个子窗口
Figure 418583DEST_PATH_IMAGE017
中的观测信号的奇偶序列互功率谱幅度的算数平均值
Figure 130187DEST_PATH_IMAGE020
Figure 526534DEST_PATH_IMAGE021
(7)
进而,根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 55604DEST_PATH_IMAGE022
(8)
其中,Med{·}为中值滤波的运算符。
本发明的一些实施例中,可以划分为3个子窗口,采用3阶中值滤波器的方式来估计噪声信号的奇偶序列互功率谱幅度。
通过本发明实施例提供的噪声信号的奇偶序列互功率谱幅度方法,无需VAD的协助而可持续地进行估计,并能快速跟踪噪声统计特性的变化,因而不仅适合平稳的环境噪声场景,还适合非平稳的环境噪声场景。
S204、根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度。
本发明的一些实施例中,可以将噪声信号的奇偶序列互功率谱估计
Figure 639032DEST_PATH_IMAGE071
的幅度从观测信号的奇偶序列互功率谱估计
Figure DEST_PATH_IMAGE077
的幅度中减去,可得语音信号
Figure 685485DEST_PATH_IMAGE064
Figure 670759DEST_PATH_IMAGE065
之间互功率谱
Figure 121463DEST_PATH_IMAGE078
幅度估计
Figure DEST_PATH_IMAGE079
具体地,根据关系式
Figure 457766DEST_PATH_IMAGE080
估计语音信号的奇偶序列互功率谱幅度。
为缓解音乐噪声问题,可选地,本发明的一些实施例中,可以应用决策引导技术预先进行先验信噪比估计,并由此构造一个维纳滤波器来从观测信号的奇偶序列互功率谱中提取语音信号的奇偶序列互功率谱。具体地,可以根据如下公式(9),先估计后验信噪比
Figure 776752DEST_PATH_IMAGE023
Figure 6745DEST_PATH_IMAGE024
(9)
继而,根据如下公式(10)、(11),估计先验信噪比
Figure 752984DEST_PATH_IMAGE025
Figure 311005DEST_PATH_IMAGE026
(10)
Figure 168102DEST_PATH_IMAGE044
(11)
这样,可以基于估计的先验信噪比,根据如下公式(12),进行维纳滤波器函数
Figure 393547DEST_PATH_IMAGE028
估计:
Figure 186054DEST_PATH_IMAGE029
(12)
继而,根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:
Figure 231370DEST_PATH_IMAGE030
(13)
其中,
Figure 626580DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号、
Figure 706531DEST_PATH_IMAGE003
为偶序列谱信号;
Figure 794573DEST_PATH_IMAGE031
为所述噪声信号的奇偶序列互功率谱幅度;
Figure 451819DEST_PATH_IMAGE032
根据如下公式
Figure 916298DEST_PATH_IMAGE012
计算得到;
Figure 585177DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数,
Figure 844120DEST_PATH_IMAGE033
为t-1帧时刻的维纳滤波器函数。通过本发明实施例提供的上述方式来估计先验信噪比,可以克服决策引导技术中存在的估计滞后一帧的缺陷。
S205、根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
本发明的一些实施例中,通过步骤S204获取语音信号的奇偶序列互功率谱幅度之后,可以考虑用语音信号的奇偶序列互功率谱估计替换掉用于估计两路观测信号
Figure 864029DEST_PATH_IMAGE062
Figure 866620DEST_PATH_IMAGE063
之间的相干系数函数计算公式中观测信号的奇偶序列互功率谱估计这一分子项(即
Figure 530950DEST_PATH_IMAGE081
),从而获得一个修订的相干系数函数估计值
Figure DEST_PATH_IMAGE082
为:
Figure DEST_PATH_IMAGE084
这样,将修订的相干系数函数幅值
Figure 491953DEST_PATH_IMAGE085
用作降噪滤波器的噪声抑制增益函数
Figure 123792DEST_PATH_IMAGE034
。具体地,可以根据如下公式(14),估计噪声抑制增益函数
Figure 664495DEST_PATH_IMAGE034
Figure 307965DEST_PATH_IMAGE035
(14)
其中,
Figure 174290DEST_PATH_IMAGE040
为所述语音信号的奇偶序列互功率谱幅度;
Figure 903212DEST_PATH_IMAGE036
为所述观测信号的奇序列自功率谱,
Figure 388551DEST_PATH_IMAGE037
为观测信号的偶序列自功率谱。
本发明的一些实施例中,可以根据如下公式(15)、(16)来估计观测信号的奇序列信号的自功率谱以及观测信号的偶序列自功率谱:
Figure 620949DEST_PATH_IMAGE038
(15)
Figure 658175DEST_PATH_IMAGE039
(16)
其中,平滑参数
Figure 874393DEST_PATH_IMAGE011
根据公式
Figure 22478DEST_PATH_IMAGE012
计算得到。
这样,后续可以利用噪声抑制增益函数
Figure 374962DEST_PATH_IMAGE034
,对所述观测信号的谱信号进行降噪滤波,可以自适应抑制运行环境的相干与不相干噪声以及散射噪声,实现单麦克风接收的观察信号中语音信号的增强。本发明实施例提供的噪声抑制增益函数计算方法,利用提取的语音信号的奇偶互功率谱来计算噪声抑制增益函数,极大地减小了增强后的语音信号中残留的音乐噪声。
参考图3,其示出了根据本发明一实施例的单麦克风噪声抑制装置的结构示意图;如图3所示,本发明一实施例提供了一种单麦克风噪声抑制装置,包括:噪声抑制估计模块301、噪声频域滤波模块302和时域变换模块303。
其中,噪声抑制估计模块301用于根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数。
噪声频域滤波模块302用于利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号。
时域变换模块303用于将所述目标语音谱信号进行时域变换,得到目标语音信号。
参考图4,其示出了根据本发明一实施例的噪声抑制估计模块的结构示意图;如图4所示,本发明一实施例提供了一种噪声抑制估计模块,包括:奇偶分解单元401、第一功率谱估计单元402、第二功率谱估计单元403、第三功率谱估计单元404和噪声抑制估计单元405。
奇偶分解单元401用于根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号。
第一功率谱估计单元402用于根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱。
第二功率谱估计单元403用于估计所述观测信号中噪声信号的奇偶序列互功率谱幅度。
第三功率谱估计单元404用于根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度。
噪声抑制估计单元405用于根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
本发明一些实施例中,所述奇偶分解单元401可以根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号
Figure 707723DEST_PATH_IMAGE001
进行分解,得到所述观测信号的奇序列谱信号
Figure 411237DEST_PATH_IMAGE002
和偶序列谱信号
Figure 363012DEST_PATH_IMAGE003
Figure 570002DEST_PATH_IMAGE004
(1)
Figure 949031DEST_PATH_IMAGE005
(2)
其中,
Figure 15207DEST_PATH_IMAGE006
,k = 0, 1, 2, …, 2L-1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2L, 信号帧长为L。
本发明一些实施例中,所述第一功率谱估计单元402可以根据如下公式(3)估计所述观测信号的奇偶序列互功率谱
Figure 505095DEST_PATH_IMAGE007
Figure 97750DEST_PATH_IMAGE008
(3)
其中,
Figure 116521DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 794627DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,*为复共轭运算符,α为预设的平滑因子常数,
Figure 212839DEST_PATH_IMAGE009
可选地,本发明一些实施例中,所述第一功率谱估计单元402可以根据如下公式(4)估计所述观测信号的奇偶序列互功率谱
Figure 660001DEST_PATH_IMAGE007
Figure 115253DEST_PATH_IMAGE010
(4)
其中,
Figure 15076DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 846766DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,
Figure 289380DEST_PATH_IMAGE011
为根据如下公式(5)计算得到的平滑参数:
Figure 181112DEST_PATH_IMAGE012
(5)
其中,
Figure 302652DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数。
本发明的一些实施例中,所述第二功率谱估计单元403可以根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 938033DEST_PATH_IMAGE014
(6)
其中,Med{·}为中值滤波的运算符,
Figure 359787DEST_PATH_IMAGE015
Figure 547055DEST_PATH_IMAGE016
为中值滤波器窗口长度、并定义为奇数。
可选地,本发明的一些实施例中,所述第二功率谱估计单元403可以将中值滤波器窗口划分为q个子窗口
Figure 421470DEST_PATH_IMAGE017
,每个子窗口
Figure 594962DEST_PATH_IMAGE017
的窗口长度为
Figure 605643DEST_PATH_IMAGE018
,且
Figure 839179DEST_PATH_IMAGE019
Figure 76256DEST_PATH_IMAGE016
为中值滤波器窗口长度;
根据如下公式(7)计算每个子窗口
Figure 53439DEST_PATH_IMAGE017
中的观测信号的奇偶序列互功率谱幅度的算数平均值
Figure 918627DEST_PATH_IMAGE020
Figure 323064DEST_PATH_IMAGE021
(7)
根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 172071DEST_PATH_IMAGE022
(8)
其中,Med{·}为中值滤波的运算符。
本发明的一些实施例中,所述第三功率谱估计单元404可以根据如下公式(9),估计后验信噪比
Figure 77579DEST_PATH_IMAGE023
Figure 797273DEST_PATH_IMAGE024
(9)
根据如下公式(10)、(11),估计先验信噪比
Figure 372611DEST_PATH_IMAGE025
Figure 708915DEST_PATH_IMAGE026
(10)
Figure 27900DEST_PATH_IMAGE044
(11)
根据如下公式(12),进行维纳滤波器函数
Figure 867680DEST_PATH_IMAGE028
估计:
Figure 489286DEST_PATH_IMAGE029
(12)
根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:
Figure 312885DEST_PATH_IMAGE030
(13)
其中,
Figure 169983DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号、
Figure 129849DEST_PATH_IMAGE003
为偶序列谱信号;
Figure 46989DEST_PATH_IMAGE031
为所述噪声信号的奇偶序列互功率谱幅度;
Figure 216939DEST_PATH_IMAGE032
根据如下公式
Figure 877728DEST_PATH_IMAGE012
计算得到;
Figure 957679DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数,
Figure 780142DEST_PATH_IMAGE033
为t-1帧时刻的维纳滤波器函数。
本发明的一些实施例中,所述噪声抑制估计405可以根据如下公式(14),估计噪声抑制增益函数
Figure 312754DEST_PATH_IMAGE034
Figure 652600DEST_PATH_IMAGE035
(14)
其中,
Figure 587058DEST_PATH_IMAGE036
为所述观测信号的奇序列自功率谱,
Figure 580422DEST_PATH_IMAGE037
为观测信号的偶序列自功率谱;
Figure 600330DEST_PATH_IMAGE036
Figure 602921DEST_PATH_IMAGE037
根据如下公式(15)、(16)估计得到:
Figure 516519DEST_PATH_IMAGE038
(15)
Figure 211943DEST_PATH_IMAGE039
(16)
Figure 453569DEST_PATH_IMAGE040
为所述语音信号的奇偶序列互功率谱幅度。
可以理解的是,本发明的上述实施例提供的单麦克风噪声抑制装置的各模块,以及各模块的各单元用于对应地实现上述单麦克风噪声抑制方法中的各步骤,具体内容在此不再赘述。
基于上述实施例提供的单麦克风噪声抑制方法,参考图5,其示出了根据本发明另一实施例的单麦克风噪声抑制方法的流程示意图。如图5所示,本发明一实施例提供了另一种单麦克风噪声抑制方法,包括:
S501、初始化信号帧索引t=0;
S502、更新信号帧索引t:t=t+1;
S503、对第t帧观测信号进行STFT变换获得对应的谱信号,根据公式(1)、(2)对获得谱信号进行分解获得奇序列谱信号和偶序列谱信号;
S504、根据公式(5)计算自适应平滑参数,根据公式(4)估计观测信号的奇偶序列互功率谱,以及根据公式(15)、(16)估计观测信号的奇序列自功率谱以及偶序列自功率谱;
S505、根据公式(7)、(8)估计噪声信号的奇偶序列互功率谱幅度;
S506、根据公式(9)-(14)计算噪声抑制增益函数;
S507、利用噪声抑制增益函数,对观测信号的谱信号进行降噪滤波,得到目标语音谱信号,并应用ISTFT变换和重叠相加技术获取第t帧的增强语音信号;
S508、判断处理过程是否结束,如是,则结束处理,如否,则执行步骤S502。
本发明实施例提供的单麦克风抑制方案,在采样率保持不变的条件下,用观测信号的谱信号分解的奇序列谱信号和偶序列谱信号来设计一个降噪滤波器的短时频域抑制增益函数,用之对含噪信号的谱信号进行增强处理,以自适应地抑制其中运行环境的相干和不相干噪声以及散射噪声。
基于上述实施例提供的单麦克风噪声抑制方法,参考图6,其示出了根据本发明一实施例的单麦克风噪声抑制器的结构示意图。如图6所示,本发明一实施例提供了另种单麦克风噪声抑制器,包括:STFT变换器601、频谱奇偶分解器602、观测信号奇偶序列互功率谱估计器603、噪声奇偶序列互功率谱估计器604、观测信号奇偶序列自功率谱估计器605、噪声抑制增益计算器606和逆STFT变换器加重叠相加处理单元607。
其中,STFT变换器601用于对观测信号进行STFT变换获得对应的谱信号,并输出。
频谱奇偶分解器602用于对STFT变换器601输出的观测信号的谱信号进行分解,并输出。
观测信号奇偶序列互功率谱估计器603用于根据频谱奇偶分解器602输出的观测信号的奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱,并输出。
噪声奇偶序列互功率谱估计器604用于根据观测信号奇偶序列互功率谱估计器603输出的观测信号的奇偶序列互功率谱,估计所述观测信号中噪声信号的奇偶序列互功率谱幅度,并输出。
观测信号奇偶序列自功率谱估计器605用于根据频谱奇偶分解器602输出的观测信号的奇序列谱信号和偶序列谱信号,估计观测信号的奇序列自功率谱以及偶序列自功率谱,并输出。
噪声抑制增益计算器606用于根据观测信号奇偶序列互功率谱估计器603输出的观测信号的奇偶序列互功率谱、噪声奇偶序列互功率谱估计器604输出的噪声信号的奇偶序列互功率谱幅度和观测信号奇偶序列自功率谱估计器605输出的观测信号的奇序列自功率谱以及偶序列自功率谱,估计噪声抑制增益函数。
在利用输出的噪声抑制增益函数对STFT变换器601输出的观测信号的谱信号进行降噪滤波得到增强语音谱信号后,逆STFT变换器加重叠相加处理单元607用于对增强语音谱信号应用逆STFT变换以及重叠相加技术,得到增强的语音信号。
可以理解的是,本发明实施例提供的单麦克风噪声抑制器的各部分的具体实现可参考上述实施例提供的单麦克风噪声抑制方法的各步骤,具体内容在此不再赘述。
本发明的一些实施例中,还提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如上所述的单麦克风噪声抑制方法。进一步地,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的单麦克风噪声抑制方法。图7示出了可以用来实施本公开的实施例的电子设备700的示意性框图。如图7所示,电子设备700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的计算机程序指令或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序指令,来执行各种适当的动作和处理。在RAM 703中,还可以存储电子设备700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
电子设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理单元701执行上文所描述的各个方法和处理。例如,在一些实施例中,方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由CPU 701执行时,可以执行上文描述的方法的一个或多个步骤。备选地,在其他实施例中,CPU 701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)等等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (19)

1.一种单麦克风噪声抑制方法,其特征在于,包括:
根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数;
利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号;
将所述目标语音谱信号进行时域变换,得到目标语音信号;
所述根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数,包括:
根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号;
根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱;
估计所述观测信号中噪声信号的奇偶序列互功率谱幅度;
根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度;
根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
2.根据权利要求1所述的方法,其特征在于,所述根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号,包括:
根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号
Figure 809399DEST_PATH_IMAGE001
进行分解,得到所述观测信号的奇序列谱信号
Figure 992118DEST_PATH_IMAGE002
和偶序列谱信号
Figure 912801DEST_PATH_IMAGE003
Figure 308010DEST_PATH_IMAGE004
(1)
Figure 387962DEST_PATH_IMAGE005
(2)
其中,
Figure 476004DEST_PATH_IMAGE006
,k = 0, 1, 2, …, 2L-1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2L, 信号帧长为L。
3.根据权利要求2所述的方法,其特征在于,所述根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱,包括:
根据如下公式(3)估计所述观测信号的奇偶序列互功率谱
Figure 743037DEST_PATH_IMAGE007
Figure 207516DEST_PATH_IMAGE008
(3)
其中,
Figure 876395DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 259972DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,*为复共轭运算符,α为预设的平滑因子常数,
Figure 279880DEST_PATH_IMAGE009
4.根据权利要求2所述的方法,其特征在于,根据如下公式(4)估计所述观测信号的奇偶序列互功率谱
Figure 16892DEST_PATH_IMAGE007
Figure 805857DEST_PATH_IMAGE010
(4)
其中,
Figure 501280DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 742906DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,
Figure 158975DEST_PATH_IMAGE011
为根据如下公式(5)计算得到的平滑参数:
Figure 68025DEST_PATH_IMAGE012
(5)
其中,
Figure 403191DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数。
5.根据权利要求4所述的方法,其特征在于,所述估计所述观测信号中噪声信号的奇偶序列互功率谱幅度,包括:
根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 397692DEST_PATH_IMAGE014
(6)
其中,Med{·}为中值滤波的运算符,
Figure 742086DEST_PATH_IMAGE015
Figure 240063DEST_PATH_IMAGE016
为中值滤波器窗口长度、并定义为奇数。
6.根据权利要求4所述的方法,其特征在于,所述估计所述观测信号中噪声信号的奇偶序列互功率谱幅度,包括:
将中值滤波器窗口划分为q个子窗口
Figure 401923DEST_PATH_IMAGE017
,每个子窗口
Figure 618141DEST_PATH_IMAGE017
的窗口长度为
Figure 500646DEST_PATH_IMAGE018
,且
Figure 118709DEST_PATH_IMAGE019
Figure 326837DEST_PATH_IMAGE016
为中值滤波器窗口长度;
根据如下公式(7)计算每个子窗口
Figure 764771DEST_PATH_IMAGE017
中的观测信号的奇偶序列互功率谱幅度的算数平均值
Figure 326334DEST_PATH_IMAGE020
Figure 64483DEST_PATH_IMAGE021
(7)
根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 177932DEST_PATH_IMAGE022
(8)
其中,Med{·}为中值滤波的运算符。
7.根据权利要求1-6任一所述的方法,其特征在于,所述根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度,包括:
根据如下公式(9),估计后验信噪比
Figure 368742DEST_PATH_IMAGE023
Figure 858629DEST_PATH_IMAGE024
(9)
根据如下公式(10)、(11),估计先验信噪比
Figure 920126DEST_PATH_IMAGE025
Figure 594690DEST_PATH_IMAGE026
(10)
Figure 272796DEST_PATH_IMAGE027
(11)
根据如下公式(12),进行维纳滤波器函数
Figure 300795DEST_PATH_IMAGE028
估计:
Figure 747957DEST_PATH_IMAGE029
(12)
根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:
Figure 203209DEST_PATH_IMAGE030
(13)
其中,
Figure 103032DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号、
Figure 810088DEST_PATH_IMAGE003
为偶序列谱信号;
Figure 377335DEST_PATH_IMAGE031
为所述噪声信号的奇偶序列互功率谱幅度;平滑参数
Figure 737909DEST_PATH_IMAGE011
根据公式
Figure 390608DEST_PATH_IMAGE012
计算得到;
Figure 25988DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数,
Figure 916584DEST_PATH_IMAGE032
为t-1帧时刻的维纳滤波器函数。
8.根据权利要求7所述的方法,其特征在于,所述根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数,包括:
根据如下公式(14),估计噪声抑制增益函数
Figure 103852DEST_PATH_IMAGE033
Figure 978267DEST_PATH_IMAGE034
(14)
其中,
Figure 151759DEST_PATH_IMAGE035
为所述观测信号的奇序列自功率谱,
Figure 428020DEST_PATH_IMAGE036
为观测信号的偶序列自功率谱;
Figure 661555DEST_PATH_IMAGE035
Figure 757687DEST_PATH_IMAGE036
根据如下公式(15)、(16)估计得到:
Figure 610236DEST_PATH_IMAGE037
(15)
Figure 741003DEST_PATH_IMAGE038
(16)
Figure 879861DEST_PATH_IMAGE039
为所述语音信号的奇偶序列互功率谱幅度。
9.一种单麦克风噪声抑制装置,实现权利要求1所述的一种单麦克风噪声抑制方法,其特征在于,包括:
噪声抑制估计模块,用于根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数;
噪声频域滤波模块,用于利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号;
时域变换模块,用于将所述目标语音谱信号进行时域变换,得到目标语音信号。
10.根据权利要求9所述的装置,其特征在于,所述噪声抑制估计模块包括:
奇偶分解单元,用于根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号;
第一功率谱估计单元,用于根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱;
第二功率谱估计单元,用于估计所述观测信号中噪声信号的奇偶序列互功率谱幅度;
第三功率谱估计单元,用于根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度;
噪声抑制估计单元,用于根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
11.根据权利要求10所述的装置,其特征在于,所述奇偶分解单元用于根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号
Figure 728868DEST_PATH_IMAGE001
进行分解,得到所述观测信号的奇序列谱信号
Figure 244163DEST_PATH_IMAGE002
和偶序列谱信号
Figure 229437DEST_PATH_IMAGE003
Figure 929408DEST_PATH_IMAGE004
(1)
Figure 265712DEST_PATH_IMAGE005
(2)
其中,
Figure 319118DEST_PATH_IMAGE006
,k = 0, 1, 2, …, 2L-1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2L, 信号帧长为L。
12.根据权利要求11所述的装置,其特征在于,所述第一功率谱估计单元用于根据如下公式(3)估计所述观测信号的奇偶序列互功率谱
Figure 424478DEST_PATH_IMAGE007
Figure 170717DEST_PATH_IMAGE040
(3)
其中,
Figure 463158DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 461201DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,α为预设的平滑因子常数,
Figure 155487DEST_PATH_IMAGE009
13.根据权利要求11所述的装置,其特征在于,所述第一功率谱估计单元用于根据如下公式(4)估计所述观测信号的奇偶序列互功率谱
Figure 72628DEST_PATH_IMAGE007
Figure 383523DEST_PATH_IMAGE041
(4)
其中,
Figure 778733DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号,
Figure 593105DEST_PATH_IMAGE003
为所述观测信号的偶序列谱信号,
Figure 71360DEST_PATH_IMAGE011
为根据如下公式(5)计算得到的平滑参数:
Figure 338393DEST_PATH_IMAGE012
(5)
其中,
Figure 802872DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数。
14.根据权利要求13所述的装置,其特征在于,所述第二功率谱估计单元用于根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 471751DEST_PATH_IMAGE014
(6)
其中,Med{·}为中值滤波的运算符,
Figure 730694DEST_PATH_IMAGE015
Figure 750603DEST_PATH_IMAGE016
为中值滤波器窗口长度、并定义为奇数。
15.根据权利要求13所述的装置,其特征在于,所述第二功率谱估计单元用于将中值滤波器窗口划分为q个子窗口
Figure 628560DEST_PATH_IMAGE017
,每个子窗口
Figure 151945DEST_PATH_IMAGE017
的窗口长度为
Figure 847369DEST_PATH_IMAGE018
,且
Figure 88994DEST_PATH_IMAGE019
Figure 629697DEST_PATH_IMAGE016
为中值滤波器窗口长度;
根据如下公式(7)计算每个子窗口
Figure 538747DEST_PATH_IMAGE017
中的观测信号的奇偶序列互功率谱幅度的算数平均值
Figure 873913DEST_PATH_IMAGE020
Figure 4767DEST_PATH_IMAGE021
(7)
根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:
Figure 349160DEST_PATH_IMAGE022
(8)
其中,Med{·}为中值滤波的运算符。
16.根据权利要求10~15任一所述的装置,其特征在于,所述第三功率谱估计单元用于根据如下公式(9),估计后验信噪比
Figure 112717DEST_PATH_IMAGE023
Figure 618785DEST_PATH_IMAGE024
(9)
根据如下公式(10)、(11),估计先验信噪比
Figure 100582DEST_PATH_IMAGE025
Figure 983087DEST_PATH_IMAGE026
(10)
Figure 476516DEST_PATH_IMAGE027
(11)
根据如下公式(12),进行维纳滤波器函数
Figure 684644DEST_PATH_IMAGE028
估计:
Figure 388158DEST_PATH_IMAGE029
(12)
根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:
Figure 808775DEST_PATH_IMAGE030
(13)
其中,
Figure 546924DEST_PATH_IMAGE002
为所述观测信号的奇序列谱信号、
Figure 785007DEST_PATH_IMAGE003
为偶序列谱信号;
Figure 710238DEST_PATH_IMAGE031
为所述噪声信号的奇偶序列互功率谱幅度;
Figure 200125DEST_PATH_IMAGE042
根据如下公式
Figure 527201DEST_PATH_IMAGE012
计算得到;
Figure 77131DEST_PATH_IMAGE013
为t-1帧时刻的噪声抑制增益函数,
Figure 755237DEST_PATH_IMAGE032
为t-1帧时刻的维纳滤波器函数。
17.根据权利要求16所述的装置,其特征在于,所述噪声抑制估计单元用于根据如下公式(14),估计噪声抑制增益函数
Figure 658602DEST_PATH_IMAGE033
Figure 840185DEST_PATH_IMAGE034
(14)
其中,
Figure 561016DEST_PATH_IMAGE035
为所述观测信号的奇序列自功率谱,
Figure 460839DEST_PATH_IMAGE036
为观测信号的偶序列自功率谱;
Figure 292529DEST_PATH_IMAGE035
Figure 594197DEST_PATH_IMAGE036
根据如下公式(15)、(16)估计得到:
Figure 220350DEST_PATH_IMAGE037
(15)
Figure 997682DEST_PATH_IMAGE038
(16)
Figure 367484DEST_PATH_IMAGE039
为所述语音信号的奇偶序列互功率谱幅度。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~8中任一项所述的方法。
19.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~8中任一项所述的方法。
CN202111455641.2A 2021-12-01 2021-12-01 单麦克风噪声抑制方法和装置 Active CN113870884B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111455641.2A CN113870884B (zh) 2021-12-01 2021-12-01 单麦克风噪声抑制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111455641.2A CN113870884B (zh) 2021-12-01 2021-12-01 单麦克风噪声抑制方法和装置

Publications (2)

Publication Number Publication Date
CN113870884A CN113870884A (zh) 2021-12-31
CN113870884B true CN113870884B (zh) 2022-03-08

Family

ID=78985419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111455641.2A Active CN113870884B (zh) 2021-12-01 2021-12-01 单麦克风噪声抑制方法和装置

Country Status (1)

Country Link
CN (1) CN113870884B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404160A (zh) * 2008-11-21 2009-04-08 北京科技大学 一种基于音频识别的语音降噪方法
CN110858478A (zh) * 2019-10-12 2020-03-03 杭州智芯科微电子科技有限公司 语音特征提取的处理方法、装置、计算机设备和存储介质
CN111968664A (zh) * 2020-08-21 2020-11-20 武汉大晟极科技有限公司 一种语音降噪方法及均衡滤波器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404160A (zh) * 2008-11-21 2009-04-08 北京科技大学 一种基于音频识别的语音降噪方法
CN110858478A (zh) * 2019-10-12 2020-03-03 杭州智芯科微电子科技有限公司 语音特征提取的处理方法、装置、计算机设备和存储介质
CN111968664A (zh) * 2020-08-21 2020-11-20 武汉大晟极科技有限公司 一种语音降噪方法及均衡滤波器

Also Published As

Publication number Publication date
CN113870884A (zh) 2021-12-31

Similar Documents

Publication Publication Date Title
CN111418010B (zh) 一种多麦克风降噪方法、装置及终端设备
CN108172231B (zh) 一种基于卡尔曼滤波的去混响方法及系统
US10123113B2 (en) Selective audio source enhancement
US7313518B2 (en) Noise reduction method and device using two pass filtering
CN102938254B (zh) 一种语音信号增强系统和方法
US8712074B2 (en) Noise spectrum tracking in noisy acoustical signals
JP6502581B2 (ja) 過渡ノイズを抑制するシステムおよび方法
US11373667B2 (en) Real-time single-channel speech enhancement in noisy and time-varying environments
CN106161751B (zh) 一种噪声抑制方法及装置
JP2006003899A (ja) ゲイン制約ノイズ抑圧
JP6225245B2 (ja) 信号処理装置、方法及びプログラム
CN110556125B (zh) 基于语音信号的特征提取方法、设备及计算机存储介质
CN105144290A (zh) 信号处理装置、信号处理方法和信号处理程序
RU2616534C2 (ru) Ослабление шума при передаче аудиосигналов
CN109102823A (zh) 一种基于子带谱熵的语音增强方法
JP5787126B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
CN113870884B (zh) 单麦克风噪声抑制方法和装置
Chen et al. Study of the noise-reduction problem in the Karhunen–Loève expansion domain
CN112669869B (zh) 噪声抑制方法、设备、装置及存储介质
Braun et al. Low complexity online convolutional beamforming
Djendi An efficient wavelet-based adaptive filtering algorithm for automatic blind speech enhancement
CN114822577B (zh) 语音信号基频估计方法和装置
Esch et al. Model-based speech enhancement exploiting temporal and spectral dependencies
Dionelis On single-channel speech enhancement and on non-linear modulation-domain Kalman filtering
Buragohain et al. Single Channel Speech Enhancement System using Convolutional Neural Network based Autoencoder for Noisy Environments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant