CN103238180A - 信号处理设备、信号处理方法及信号处理程序 - Google Patents

信号处理设备、信号处理方法及信号处理程序 Download PDF

Info

Publication number
CN103238180A
CN103238180A CN2011800568616A CN201180056861A CN103238180A CN 103238180 A CN103238180 A CN 103238180A CN 2011800568616 A CN2011800568616 A CN 2011800568616A CN 201180056861 A CN201180056861 A CN 201180056861A CN 103238180 A CN103238180 A CN 103238180A
Authority
CN
China
Prior art keywords
signal
background sound
illustrative embodiments
noise
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800568616A
Other languages
English (en)
Inventor
杉山昭彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN103238180A publication Critical patent/CN103238180A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明的目的是通过在考虑背景声音的同时抑制不希望的声音来获得高质量的输出信号。本申请中所公开的信号处理设备提供有抑制装置,该抑制装置用于通过处理其中含有第一信号和第二信号的混合信号来执行对第二信号的抑制。此外,所述信号处理设备提供有背景声音估计装置,该背景声音估计装置用于估计被包含在所述混合信号中的背景声音信号。另外,该信号处理设备提供有限制装置,该限制装置用于限制对所述第二信号的抑制,从而使得抑制装置的抑制结果不会变得小于背景声音。

Description

信号处理设备、信号处理方法及信号处理程序
技术领域
本发明涉及信号处理技术,其用于通过抑制带噪语音信号中的第二信号来强调第一信号。
背景技术
关于带噪语音信号(其中第二信号叠加于第一信号之上的信号),存在众所周知的噪声抑制技术用于抑制带噪语音信号中含有的第二信号并且输出经强调的信号(通过强调第一信号而产生的信号)。噪声抑制器是用于抑制叠加在期望音频信号上的噪声的系统。此类噪声抑制器用于诸如移动电话的各种音频终端。
关于此类技术,专利文献(PTL)1公开了通过将输入信号乘以谱增益来抑制噪声的方法,其中每个谱增益具有小于“1”的值。PTL2公开了通过从带噪语音信号中直接减去估计的噪声来抑制噪声的方法。
引文列表
专利文献
【PTL 1】日本专利第4282227号
【PTL 2】日本专利申请公开第1996-221092号
发明内容
技术问题
然而,存在的问题在于,作为使用PTL 1中所公开的方法来抑制噪声的结果,输出信号有时变得小于背景声音,从而使输出信号听上去让收听者感到不自然。该问题在离散噪声被去除时变得更加显著。这是因为,虽然因抑制噪声而产生的输出信号小于背景声音,但因不抑制噪声而产生的信号却大于背景声音,因此其不连续性易于被察觉到。
鉴于上述情况,本发明的目标在于提供一种使解决上述问题成为可能的信号处理技术。
解决方案
为了解决上述问题,本发明的设备包括:抑制装置,用于通过处理混合信号来执行对第二信号的抑制,在该混合信号中含有第一信号和第二信号;背景声音估计装置,用于估计所述混合信号中的背景声音信号;以及限制装置,用于限制对所述第二信号的所述抑制,以使得由所述抑制装置输出的抑制结果不会变得小于估计的所述背景声音信号。
为了解决上述问题,本发明的方法包括:接收混合信号,在该混合信号中包含有第一信号和第二信号;估计被包含在所述混合信号中的背景声音信号;以及执行对所述第二信号的抑制并限制对所述第二信号的所述抑制,从而使输出不会变得小于估计的所述背景声音信号。
为了解决上述问题,本发明的程序导致计算机执行处理,包括:接收步骤,用于接收混合信号,在该混合信号中包含有第一信号和第二信号;背景声音估计步骤,用于估计被包含在所述混合信号中的背景声音信号;以及抑制步骤,用于执行对所述第二信号的抑制并限制对所述第二信号的所述抑制,从而使输出不会变得小于估计的所述背景声音信号。
发明有益效果
根据本发明的一些方面,有可能通过考虑到背景声音来执行噪声抑制而获得更高质量的输出信号。
附图说明
图1为图示根据本发明第一示例性实施方式的信号处理设备的配置的框图。
图2为图示根据本发明第二示例性实施方式的噪声抑制设备的配置的框图。
图3为图示根据本发明第二示例性实施方式的变换单元的配置的框图。
图4为图示根据本发明第二示例性实施方式的逆变换单元的配置的框图。
图5为图示根据本发明第二示例性实施方式的噪声估计单元的配置的框图。
图6为图示根据本发明第二示例性实施方式的估计噪声计算器的配置的框图。
图7为图示根据本发明第二示例性实施方式的更新确定单元的配置的框图。
图8为图示根据本发明第二示例性实施方式的加权带噪语音计算器的配置的框图。
图9为图示根据本发明第二示例性实施方式的非线性函数的示例的示图。
图10为图示根据本发明第三示例性实施方式的噪声抑制设备的配置的框图。
图11为图示根据本发明第四示例性实施方式的噪声抑制设备的配置的框图。
图12为图示根据本发明第五示例性实施方式的噪声抑制设备的配置的框图。
图13为图示根据本发明第六示例性实施方式的噪声抑制设备的配置的框图。
图14为图示根据本发明第七示例性实施方式的噪声抑制设备的配置的框图。
图15为图示根据本发明第七示例性实施方式的谱增益生成单元的配置的框图。
图16为图示根据本发明第七示例性实施方式的估计先验SNR计算器的配置的框图。
图17为图示根据本发明第七示例性实施方式的加权加法器的配置的框图。
图18为图示根据本发明第七示例性实施方式的谱增益计算器的配置的框图。
图19为图示根据本发明第八示例性实施方式的噪声抑制设备的配置的框图。
图20为图示根据本发明第九示例性实施方式的噪声抑制设备的配置的框图。
图21为图示根据本发明第十示例性实施方式的噪声抑制设备的配置的框图。
图22为图示根据本发明第十一示例性实施方式的噪声抑制设备的配置的框图。
图23为图示根据本发明第十二示例性实施方式的噪声抑制设备的配置的框图。
图24为图示根据本发明第十三示例性实施方式的噪声抑制设备的配置的框图。
图25为图示根据本发明第十四示例性实施方式的噪声抑制设备的配置的框图。
图26为图示根据本发明第十五示例性实施方式的噪声抑制设备的配置的框图。
图27为图示根据本发明第十六示例性实施方式的噪声抑制设备的配置的框图。
图28为图示根据本发明第十七示例性实施方式的噪声抑制设备的配置的框图。
图29为图示根据本发明第十八示例性实施方式的噪声抑制设备的配置的框图。
图30为图示根据本发明第十九示例性实施方式的噪声抑制设备的配置的框图。
图31为图示根据本发明的另一示例性实施方式的噪声抑制设备的配置的框图。
具体实施方式
在下文中,将参照附图,说明性地描述本发明的示例性实施方式。然而应当注意,以下示例性实施方式中所描述的组件仅为范例,而并不旨在将本发明的技术范围仅限于这些组件。
(第一示例性实施方式)
将使用图1来描述作为本发明第一示例性实施方式的信号处理设备100。
信号处理设备100是这样的设备:其用于通过处理在其中混有第一信号和第二信号的混合信号来抑制第二信号。
如图1中所示,信号处理设备100包含背景声音估计单元101、抑制限制单元102及信号抑制单元103。背景声音估计单元101估计混合信号中所含有的背景声音信号。抑制限制单元102限制对第二信号的抑制,从而使抑制结果不会变得小于背景声音信号。信号抑制单元103通过处理所述混合信号来抑制第二信号。
在如上所述的配置中,信号处理设备100可在保持背景声音信号不变的情况下,以更高的质量执行信号处理。
(第二示例性实施方式)
将使用图2至图11来描述作为本发明第二示例性实施方式的噪声抑制设备。本示例性实施方式的噪声抑制设备200还作为诸如数码相机、膝上型计算机和移动电话之类的设备的一部分而工作。然而,本发明并不限于此类设备,而是可应用于需要从输入信号中去除噪声的任何种类的信号处理设备。
<整体配置>
图2为图示噪声抑制设备200的整体配置的框图。如图2中所示,噪声抑制设备200包含:输入端子201、变换单元202、逆变换单元203、输出端子204、噪声抑制单元205、噪声估计单元206、背景声音估计单元207和噪声校正单元208。将带噪语音信号(混合信号,在其中混有作为第一信号的期望信号和作为第二信号的噪声)供应至输入端子201作为一系列样本值。使供应至输入端子201的带噪语音信号在变换单元202中经受诸如傅里叶变换之类的变换,并将其分解为多个频率分量。所述多个频率分量中的每一个都得到独立处理。在此,将集中关注特定频率分量来继续描述。将所述特定频率分量的振幅谱,即带噪语音信号振幅谱220,供应至噪声抑制单元205;并将其相位谱,即带噪语音信号相位谱230,供应至逆变换单元203。在此,虽然向噪声抑制单元205供应带噪语音信号振幅谱220,但本发明并不限于该配置,而是可将相当于其平方的功率谱供应至噪声抑制单元205。
噪声估计单元206通过使用从变换单元202供应的带噪语音信号振幅谱220来估计噪声,并生成噪声信息250(估计的噪声)作为估计的第二信号的实例。此外,背景声音估计单元207通过使用从变换单元202供应的带噪语音信号振幅谱220来估计背景声音,并将通过从输入的带噪语音信号振幅谱220中减去背景声音而产生的值α供应至噪声校正单元208。此外,噪声校正单元208针对各频率选择α值与噪声信息X1之中的较小者,并将其供应至噪声抑制单元205。噪声校正单元208执行调节,以使噪声信息不超过值α(在此,α=输入-背景声音)。亦即,噪声校正单元208使噪声的抑制程度适度,从而使噪声抑制结果不会变得小于背景声音。具体而言,噪声校正单元208在值α小于噪声信息X1的情况下将值α供应至噪声抑制单元205,而在值α大于噪声信息X1的情况下将噪声信息X1供应至噪声抑制单元205。
背景声音估计单元207迭代地估计背景声音并更新估计的背景声音。背景声音估计单元207可通过对带噪语音信号的振幅求平均来获得估计出的背景声音。作为用于求平均的技术,背景声音估计单元207利用的是使用基于有限样本量的滑动窗口的方法,或者是使用漏积分(leaky integration)的方法。前者在信号处理领域被称为有限冲击响应滤波器的算术运算。滤波器的抽头的数目对应于滑动窗口的长度。在将有限样本量表示为L时,背景声音估计单元207可通过使用以下公式(1)获得平均值:
x &OverBar; k 2 = 1 L &Sigma; j = k - L + 1 k x j 2 - - - ( 1 )
当使用漏积分时,背景声音估计单元207例如使用诸如以下描述的公式(2)之类的一阶漏积分:
x &OverBar; k 2 = &beta; &CenterDot; x &OverBar; k - 1 2 + ( 1 - &beta; ) &CenterDot; x k 2 - - - ( 2 )
在此,β为满足0<β<1的常数。
背景声音估计单元207可仅在带噪语音信号的振幅接近于背景声音估值时,亦即,当这两个值的比率或这两个值之间的差值落入预定值之间的范围内时,才估计背景声音。背景声音估计单元207可计算背景声音估值的初始值作为带噪语音信号的振幅的平均值。在获得该初始值之后,背景声音估计单元207仅使用各自具有接近于背景声音估值的振幅的带噪语音信号来用于求平均运算。
将通过校正而产生的噪声信息260供应至噪声抑制单元205,并于此将其从带噪语音信号振幅谱220中减去,以便输出经强调的信号振幅谱240,其被供应至逆变换单元203。逆变换单元203对从变换单元202供应的带噪语音信号相位谱230和经强调的信号振幅谱240加以合成,并对结果进行逆变换以输出经强调的信号,其被供应至输出端子204。
<变换单元的配置>
图3为图示变换单元202的配置的框图。如图3中所示,变换单元202包含帧分解单元301、加窗单元302和傅里叶变换单元303。将带噪语音信号样本供应至帧分解单元301,并于此将其分解为各自具有K/2个样本的多个帧。在此,K为偶数。将被分解为帧的带噪语音信号样本供应至加窗单元302,并于此将其乘以窗口函数W(t)。以下公式(3)给出了利用第n帧中的输入信号yn(t)(t=0,1,...,K/2-1)和w(t)进行加窗而产生的信号:
y &OverBar; n ( t ) = w ( t ) y n ( t ) - - - ( 3 )
此外,加窗单元302可使每两个连续帧彼此部分地重叠并继而执行加窗。假设重叠长度为帧长度的50%,则以下公式(4)的左侧部分表示t=0,1,...,K/2-1时加窗单元302的输出。
y &OverBar; n ( t ) = w ( t ) y n - 1 ( t + K / 2 ) y &OverBar; n ( t + K / 2 ) = w ( t + K / 2 ) y n ( t ) - - - ( 4 )
关于实数信号,加窗单元302可使用对称窗口函数。此外,将窗口函数设计成使得当在MMSE STSA方法中将谱增益设置为1时或者在SS方法中减去0时,输入信号与输出信号除计算误差之外相匹配。这意味着满足公式:w(t)+w(t+K/2)=1。
在下文中,将通过在其中执行加窗以使每两个连续帧重叠50%帧长度的示例方式来继续描述。
例如,加窗单元302可使用汉宁(Hanning)窗作为w(t),该Hanning窗由以下公式(5)表示:
Figure BPA00001719282600091
其他诸如汉明(Hamming)窗、凯塞(Kaiser)窗和布拉克曼(Blackman)窗等各种窗函数也是公知的。将通过加窗而获得的输出供应至傅里叶变换单元303,并于此将其变换成带噪语音信号谱Yn(k)。将该带噪语音信号谱Yn(k)分成相位和振幅,以便将带噪语音信号相位谱arg Yn(k)供应至逆变换单元203,以及将带噪语音信号振幅谱|Yn(k)|供应至噪声估计单元206。如前所述,可使用功率谱作为对振幅谱的替代。
<逆变换单元的配置>
图4为图示逆变换单元203的配置的框图。如图4中所示,逆变换单元203包含逆傅里叶变换单元401、加窗单元402以及帧合成单元403。逆傅里叶变换单元401将从噪声抑制单元205供应的经强调的信号振幅谱240乘以从变换单元202供应的带噪语音信号相位谱230,从而获得经强调的信号(以下公式(6)的左侧部分)。
X &OverBar; n ( k ) = | X &OverBar; n ( k ) | &CenterDot; arg Y n ( k ) - - - ( 6 )
逆傅里叶变换单元401对所获得的经强调的信号执行逆傅里叶变换,并向加窗单元402供应一系列时域样本值:xn(t)(t=0,1,...,K-1),每一帧包含K个样本。加窗单元402将xn(t)乘以窗口函数w(t)。以下公式(7)的左侧部分给出了利用第n帧输入信号xn(t)(t=0,1,...,K/2-1)和w(t)进行加窗而获得的信号。
x &OverBar; n ( k ) = w ( t ) x n ( t ) - - - ( 7 )
还广泛进行将两个连续帧彼此部分地重叠并加窗。假设帧长度的50%为重叠长度,则以下公式(8)的左侧部分对应于加窗单元402在t=0,1,...,K/2-1时的输出,该输出被传送至帧合成单元403。
x &OverBar; n ( t ) = w ( t ) x n - 1 ( t + K / 2 ) x &OverBar; n ( t + K / 2 ) = w ( t + K / 2 ) x n ( t ) - - - ( 8 )
帧合成单元403从加窗单元402的输出之中的相应两个相邻帧里取出两组K/2个样本,并使该两组K/2个样本相重叠而在t=0,1,...,K-1获得输出信号(以下公式(9)的左侧部分)。将所获得的输出信号从帧合成单元403传输至输出端子204。
x ^ n ( t ) = x &OverBar; n ( t + K / 2 ) + x &OverBar; n ( t ) - - - ( 9 )
在图3和图4中,将变换单元202和逆变换单元203中的每一个中所执行的变换描述为傅里叶变换,但是亦可使用诸如余弦变换、修正余弦变换、哈达玛(Hadamard)变换、哈尔(Haar)变换、小波变换之类的不同变换作为对傅里叶变换的替代。例如,余弦变换与修正余弦变换各自仅输出振幅作为变换结果。因此在图2中,从变换单元202至逆变换单元203的路径变得不必要。在各变换单元202和逆变换单元203均使用Haar变换的情况下,乘法变得不必要。因此,在将变换单元202和逆变换单元203中的每一个集成到LSI中时,可将由此占据的面积做得更小。在各变换单元202和逆变换单元203均使用小波变换的情况下,有可能预期噪声抑制效果的改善。这是因为对于相应频率可将时间分辨率改变为彼此不同的分辨率。
<噪声估计单元的配置>
图5为图示图2的噪声估计单元206的配置的框图。噪声估计单元206包含估计噪声计算器501、加权带噪语音计算器502和计数器503。将供应至噪声估计单元206的带噪语音功率谱传输至估计噪声计算器501和加权带噪语音计算器502。加权带噪语音计算器502通过使用供应的带噪语音功率谱和估计的噪声功率谱来计算加权带噪语音功率谱,并将算得到的加权带噪语音功率谱传输至估计噪声计算器501。估计噪声计算器501通过使用带噪语音功率谱、加权带噪语音功率谱和从计数器503供应的计数值来估计噪声的功率谱,输出估计的噪声功率谱,以及进一步将其反馈至加权带噪语音计算器502。
图6为图示图5中的估计噪声计算器501的配置的框图。估计噪声计算器501具有更新确定单元601、寄存器长度存储单元602、估计噪声存储单元603、开关604、移位寄存器605、加法器606、最小值选择单元607、除法器608和计数器609。为开关604供应加权带噪语音功率谱。当开关604闭合其电路时,将加权带噪语音功率谱传输至移位寄存器605。移位寄存器605响应于从更新确定单元601供应的控制信号而将其每个内部寄存器所存储的值移位至相邻的内部寄存器。移位寄存器长度等于存储在以下描述的寄存器长度存储单元602中的值。移位寄存器605的所有寄存器输出都供应至加法器606。加法器606对供应的所有寄存器输出执行加法,并将加法结果传输至除法器608。
与此同时,为更新确定单元601供应计数值、频率依赖的带噪语音功率谱和频率依赖的估计的噪声功率谱。更新确定单元601持续输出值信号“1”直到计数值达到预设值。在计数值达到预设值之后,更新确定单元601在输入的带噪语音信号被确定为噪声的情况下输出值信号“1”;否则,更新确定单元601输出值信号“0”。此外,更新确定单元601将输出的值信号传输至计数器609、开关604和移位寄存器605。开关604在从更新确定单元供应的值信号为“1”时闭合其电路,而在从更新确定单元供应的值信号为“0”时断开其电路。计数器609在从更新确定单元供应的值信号为“1”时递增其计数值,而在从更新确定单元供应的值信号为“0”时不改变其计数值。当从更新确定单元供应的值信号为“1”时,移位寄存器605接受从开关604供应的一个信号样本,并于此同时,将其内部寄存器中的每一个所存储的值移位至与之相邻的内部寄存器。为最小值选择单元607供应计数器609的输出和寄存器长度存储单元602的输出。
最小值选择单元607选择供应的计数值与寄存器长度之中的较小者,并将所选择的计数值或寄存器长度传输至除法器608。除法器608将供应自加法器606的带噪语音功率谱的加法结果值除以所述计数值与寄存器长度之中的较小者,并输出其商作为频率依赖的估计的噪声功率谱λn(k)。假定Bn(k)(n=0,1,...,N-1)为移位寄存器605中所存储的带噪语音功率谱的各样本值,则λn(k)由以下公式(10)给出:
&lambda; n ( k ) = 1 N &Sigma; n = 0 N - 1 B n ( k ) - - - ( 10 )
在此,N为计数值与寄存器长度之中的较小者的值。由于计数值从0开始并单调递增,因此除法器608最初将加法结果值除以计数值,继而将其除以寄存器长度。当除以寄存器长度时,除法器608计算存储在移位寄存器中的值的平均值。最初,在移位寄存器605中尚未存储足够多的值,因此除法器608将加法结果值除以实际存储有值的寄存器元件的数目。实际存储有值的寄存器元件的数目在计数值小于寄存器长度时等于计数值,而在计数值变得大于寄存器长度时等于寄存器长度。
图7为图示图6中的更新确定单元601的配置的框图。更新确定单元601包含逻辑加法计算器701、比较器702和704、阈值存储单元705和703以及阈值计算器706。将从图5中所示计数器503供应的计数值传输至比较器702。还将作为阈值存储单元703的输出的阈值传输至比较器702。比较器702对供应的计数值和阈值加以比较,从而使比较器702在计数值小于阈值的情况下向逻辑加法计算器701传输“1”,而在计数值大于阈值的情况下向其传输“0”。与此同时,阈值计算器706根据从图6中所示估计噪声存储单元603供应的估计的噪声功率谱计算出一个值,并将算得的值输出至阈值存储单元705作为阈值。计算阈值的最简单方法是将估计的噪声功率谱乘以常数。
阈值计算器706可通过使用高次多项式或非线性函数来计算阈值。阈值存储单元705在其中存储从阈值计算器706输出的阈值,并向比较器704输出在处理最后一帧时存储的阈值。比较器704对供应自阈值存储单元705的阈值和供应自变换单元202的带噪语音功率谱加以比较,并在带噪语音功率谱小于阈值时向逻辑加法计算器701输出“1”,而在带噪语音功率谱大于阈值时向其输出“0”。亦即,比较器704基于估计的噪声功率谱来确定带噪语音信号是否为噪声。逻辑加法计算器701计算比较器702的输出值与比较器704的输出值的逻辑和,并将计算结果输出至图6中所示的开关604、移位寄存器605和计数器609。以这种方式,更新确定单元601不仅在初始状态和静默期中输出“1”,而且甚至在非静默期中当带噪语音功率很小时也输出“1”。因此,对估计的噪声的更新得到执行。由于针对每个频率计算阈值,因此有可能针对各频率更新估计的噪声。
图8为图示加权带噪语音计算器502的配置的框图。加权带噪语音计算器502包含估计噪声存储单元801、频率依赖的SNR计算器802、非线性处理单元804和乘法器803。估计噪声存储单元801在其中存储从图5中所示估计噪声计算器501供应的估计的噪声功率谱,并向频率依赖的SNR计算器802输出在处理最后一帧时存储的估计的噪声功率谱。频率依赖的SNR计算器802通过使用从估计噪声存储单元801供应的估计的噪声功率谱和从变换单元202供应的带噪语音功率谱而针对每个频带计算信噪比(SNR),并将算得到的SNR输出至非线性处理单元804。具体而言,频率依赖的SNR计算器802根据以下公式(11),通过将供应的带噪语音功率谱除以供应的估计的噪声功率谱来计算频率依赖的
Figure BPA00001719282600141
在此,λn-1(k)为在处理最后一帧时存储的估计的噪声功率谱。
&gamma; ^ n ( k ) = | Y n ( k ) | 2 &lambda; n - 1 ( k ) - - - ( 11 )
非线性处理单元804通过使用从频率依赖的SNR计算器802供应的SNR来计算权重系数向量,并将算得的权重系数向量输出至乘法器803。乘法器803针对各频带计算从变换单元202供应的带噪语音功率谱与从非线性处理单元804供应的权重系数向量的乘积,并向图5中所示的估计噪声计算器501输出加权带噪语音功率谱。
非线性处理单元804发挥根据各多路复用输入值而输出实数值的非线性函数的作用。在图9中,图示了非线性函数的示例。当假设f1作为输入值时,图9中所示非线性函数的输出值f2由以下公式(12)表示。在此,a与b分别为预定实数。
f 2 = 1 , f 1 &le; a f 1 - b a - b , a < f 1 &le; b 0 , b < f 1 - - - ( 12 )
非线性处理单元804通过使用非线性函数而将供应自频率依赖的SNR计算器802的频率依赖的SNR变换成加权系数,并将该加权系数传输至乘法器803。亦即,非线性处理单元804输出根据SNR而从“1”到“0”之间取值的加权系数。非线性处理单元804在SNR小于或等于a时输出“1”,而在SNR大于b时输出“0”。
在图8中所示乘法器803中带噪语音功率谱所乘以的加权系数为取决于SNR的值,并且SNR越大,即,带噪语音中包含的语音分量的量越大,则加权系数的值越小。一般而言,带噪语音功率谱用于估计噪声的更新。然而,在本示例性实施方式中,乘法器803依赖于SNR对用于估计噪声的更新的带噪语音功率谱进行加权。以这种方式,噪声抑制设备200可使带噪语音功率谱中所包含的语音分量的影响变得更小,从而支持对噪声的更准确估计。在以上示例中,加权带噪语音计算器502通过使用非线性函数来计算加权系数,但还可通过使用除非线性函数以外的函数来执行计算,该函数以诸如线性函数或高次多项式等不同形式来表示SNR的函数。
以上述方式,根据本示例性实施方式的配置,噪声抑制设备200可实现具有高质量的信号处理,不会使其输出信号小于背景声音,而且不导致其输出信号的不连续性被感知。
(第三示例性实施方式)
图10为图示作为本发明第三示例性实施方式的噪声抑制设备1000的示意性配置的框图。根据本示例性实施方式的噪声抑制设备1000按以下配置:不同于第二示例性实施方式的情况,噪声抑制单元205的输出反馈至背景声音估计单元1007。
背景声音估计单元1007根据是否存在期望信号而确定对背景声音的估计是否必要。亦即,背景声音估计单元1007仅在不存在期望信号时更新背景声音信息。除了该操作之外,背景声音估计单元1007的操作与第二示例性实施方式的背景声音估计中所描述的操作相同,因而在此省略其详细描述。
以上述方式,根据本示例性实施方式的噪声抑制设备1000除了具有第二示例性实施方式的有益效果之外,还具有可高效和准确地估计背景声音的有益效果。
(第四示例性实施方式)
图11为图示作为本发明第四示例性实施方式的噪声抑制设备1100的示意性配置的框图。根据本示例性实施方式的噪声抑制设备1100按以下配置:不同于第二示例性实施方式的情况,噪声校正单元208使用从噪声存储单元1106读出的噪声信息来执行校正。由于它的其它组件和操作均与第二示例性实施方式中的相同,因此由与第二示例性实施方式中相同的对应参考符号来指示与第二示例性实施方式中相同的组件,并在此省略其详细描述。
噪声存储单元1106包含诸如半导体存储器之类的存储器元件,并在其中存储噪声信息(有关噪声特性的信息)。噪声存储单元1106在其中存储噪声谱的形状作为噪声信息。除了该谱之外,噪声存储单元1106还可在其中存储特征量,诸如相位的频率特性、特定频率的强度以及时间变化。此外,噪声信息可为任何一种或多种统计(最大值、最小值、方差和中值)等。在谱被以1024个频率分量表示的情况下,有关于振幅(或功率)的1024段数据存储在噪声存储单元1106中。将噪声存储单元1106中所记录的噪声信息250供应至噪声校正单元208。
噪声校正单元208针对每个频率分量选择α(在此,α=输入-背景声音)与X2(在此,X2=存储的噪声)之中的较小者,并将所选择的α或X2输出至噪声抑制单元205。
根据本示例性实施方式的噪声抑制设备1100可实现具有高质量的信号处理,正如第二示例性实施方式的情况那样,不会使其输出信号小于背景声音,而且不导致其输出信号的不连续性被感知。
(第五示例性实施方式)
图12为图示作为本发明第五示例性实施方式的噪声抑制设备1200的示意性配置的框图。根据本示例性实施方式的噪声抑制设备1200按以下配置:不同于第四示例性实施方式的情况,噪声抑制单元205的输出反馈至背景声音估计单元1007。由于噪声抑制设备1200的其它组件和操作均与第四示例性实施方式中的相同,因此由与第四示例性实施方式中相同的对应参考符号来指示与第四示例性实施方式中相同的组件,并在此省略其详细描述。
背景声音估计单元1007仅在不存在期望信号时更新背景声音信息。除了该操作之外,背景声音估计单元1007的操作与第二示例性实施方式的背景声音估计中所描述的相同,因而在此省略其详细描述。
噪声校正单元208针对各频率分量选择α与X2中的较小者,并将所选择的α或X2输出至噪声抑制单元205。
以上述方式,根据本示例性实施方式的噪声抑制设备1200除了具有第四示例性实施方式的有益效果之外,还具有可高效和准确地估计背景声音的有益效果。
(第六示例性实施方式)
图13为图示作为本发明第六示例性实施方式的噪声抑制设备1300的示意性配置的框图。根据本示例性实施方式的噪声抑制设备1300按以下配置:不同于第四示例性实施方式的情况,在噪声修改单元1301中修改噪声存储单元1106的输出,并继而将其供应至噪声校正单元208。由于它的其它组件和操作均与第四示例性实施方式中的相同,因此由与第四示例性实施方式中相同的对应参考符号来指示与第四示例性实施方式中相同的组件,并在此省略其详细描述。
噪声修改单元1301接收从噪声抑制单元205供应的经强调信号振幅谱240,并根据噪声抑制结果的反馈来修改噪声。具体而言,噪声修改单元1301更新噪声修改信息以便使噪声抑制结果为0。噪声校正单元208针对各频率分量选择α与X3(在此,X3=经修改的噪声)之中的较小者,并将所选择的α或X3输出至噪声抑制单元205。
根据本示例性实施方式,正如第四示例性实施方式的情况那样,噪声抑制设备1300可实现具有高质量的信号处理,不会使其输出信号小于背景声音,而且不导致其输出信号的不连续性被感知,并且此外,可通过根据抑制结果修改噪声而实现更为准确的噪声抑制。
此外,在本示例性实施方式中,如由带箭头的虚线所指示,噪声抑制单元205的输出可反馈至背景声音估计单元207。在这种情况下,背景声音估计单元207仅在不存在期望信号时更新背景声音信息。背景声音估计单元207被配置成使得其针对每个频率分量,在期望信号较大时不更新背景声音。另外,背景声音估计单元207在周围环境带噪时不估计背景声音。一旦背景声音估计单元207对背景声音进行了估计,其继而在带噪语音信号的振幅接近于估计的背景声音时(当两者的比率或差值落入预定值之间的范围内时)对背景声音执行新的估计操作。新的估计操作仅在带噪语音信号的振幅接近于估计的背景声音时才执行。作为该操作的结果,除了前述的有益效果之外,噪声抑制设备1300还具有可高效和准确地估计背景声音的有益效果。
(第七示例性实施方式)
图14为图示作为本发明第七示例性实施方式的噪声抑制设备1400的示意性配置的框图。在比较图2与图14时,根据本示例性实施方式的噪声抑制设备1400与第二示例性实施方式的情况不同,配置成包含谱增益生成单元1410,该谱增益生成单元1410通过使用噪声信息和带噪语音信号来生成谱增益。另外,根据本示例性实施方式的噪声抑制设备1400包含执行乘法的噪声抑制单元1405。由于它的其它组件和操作均与第二示例性实施方式中的相同,因此由与第二示例性实施方式中相同的对应参考符号来指示与第二示例性实施方式中相同的组件,并在此省略其详细描述。
谱增益生成单元的配置
图15为图示图14中所包含的谱增益生成单元1410的配置的框图。如图15中所示,谱增益生成单元1410包含后验SNR计算器1501、估计先验SNR计算器1502、谱增益计算器1503和无语音概率存储单元1504。
后验SNR计算器1501针对每个频率,通过使用输入的带噪语音功率谱和输入的估计的噪声功率谱来计算后验SNR,并将算得的后验SNR供应至估计先验SNR计算器1502和谱增益计算器1503。估计先验SNR计算器1502通过使用输入的后验SNR和从谱增益计算器1503反馈的谱增益来估计先验SNR,并将该先验SNR传输至谱增益计算器1503作为估计的先验SNR。谱增益计算器1503通过使用作为输入而供应的后验SNR和估计的先验SNR以及从无语音概率存储单元1504供应的无语音概率来生成谱增益,并输出生成的谱增益作为谱增益
Figure BPA00001719282600191
图16为图示图15中所包含的估计先验SNR计算器1502的配置的框图。估计先验SNR计算器1502包含范围限制处理单元1601、后验SNR存储单元1602、谱增益存储单元1603、乘法器1604和1605、权重存储单元1606、加权加法单元1607以及加法器1608。将从后验SNR计算器1501供应的后验SNRγn(k)(k=0,1,...,M-1)传输至后验SNR存储单元1602和加法器1608。后验SNR存储单元1602在其中存储处于第n帧的后验SNRγn(k),并同时向乘法器1605传输处于第(n-1)帧的后验SNR γn-1(k)。
谱增益存储单元1603在其中存储处于第n帧的谱增益
Figure BPA00001719282600192
并同时向乘法器1604传输处于第(n-1)帧的谱增益
Figure BPA00001719282600193
乘法器1604通过对供应的
Figure BPA00001719282600194
求平方来计算,并将该Gn-1 2(k)传输至乘法器1605。乘法器1605通过将乘以γn-1(k)来计算
Figure BPA00001719282600196
在k=0,1,...,M-1,并将计算结果传输至加权加法单元1607作为过去的估计SNR。
为加法器1608的另一端子供应“-1”,并向范围限制处理单元1601传输加法结果γn(k)-1。范围限制处理单元1601使用范围限制算子P[*]对供应自加法器1608的加法结果γn(k)-1执行算术运算,并将结果所得的P[γn(k)-1]传输至加权加法单元1607作为即时估计的SNR。P[x]由以下公式(13)所确定。
P [ x ] = x , x 1 > 0 0 , x &le; 0 - - - ( 13 )
此外,为加权加法单元1607供应来自权重存储单元1606的权重。加权加法单元1607通过使用即时估计SNR、过去的估计SNR和权重作为输入来计算估计先验SNR。当权重和
Figure BPA00001719282600202
相应地对应于α和估计先验SNR时,可通过使用以下公式(14)来计算
Figure BPA00001719282600203
在此,满足公式:Gn-12(k)γ-1(k)横杠=1。
&xi; ^ n ( k ) = &alpha; &gamma; n - 1 ( k ) G &OverBar; n - 1 2 ( k ) + ( 1 - &alpha; ) P [ &gamma; n ( k ) - 1 ] - - - ( 14 )
图17为图示图16中所包含的加权加法单元1607的配置的框图。加权加法单元1607包含乘法器1701和1703、固定数乘法器1705以及加法器1702和1704。将来自图16中所示范围限制处理单元1601的频带依赖即时估计SNR、来自图16中所示乘法器1605的频带依赖SNR和来自图16中所示权重存储单元1606的权重,作为输入供应给权重加法单元1607。将具有α值的权重传输至固定数乘法器1705和乘法器1703。固定数乘法器1705将通过输入信号乘以“-1”得到的“-α”传输至加法器1704。此外,加法器1704的另一输入为“1”,从而使加法器1704的输出成为作为两者之和的“1-α”。此外,将“1-α”供应至乘法器1701,并在此乘以另一输入,即,频带依赖即时估计SNR P[γn(k)-1],从而将其乘积,即(1-α)P[γn(k)-1]传输至加法器1702。与此同时,在乘法器1703中,将作为权重而被供应的α乘以过去的估计SNR,并将其乘积,即
Figure BPA00001719282600205
传输至加法器1702。加法器1702输出(1-α)P[γn(k)-1]与
Figure BPA00001719282600206
之和作为频带依赖估计先验SNR。
图18为图示图15中所包含的谱增益计算器1503的框图。谱增益计算器1503包含MMSE STSA增益函数值计算器1801、广义似然比计算器1802和谱增益计算器1803。在下文中,将基于在IEEETRANSACTIONS ON ACOUSTICS,SPEECH,AND SIGNALPROCESSING,Vol.32,No.6,pp.1109-1121,1984年12月中所描述的计算公式来描述用于计算谱增益的方法。
N表示帧数目而k表示频率数目。γn(k)表示从后验SNR计算器1501供应的频率依赖的后验SNR;
Figure BPA00001719282600211
表示从估计先验SNR计算器1502供应的频率依赖的估计先验SNR;而q表示从无语音概率存储单元1504供应的无语音概率。
在此,满足以下公式:
Figure BPA00001719282600212
和vn(k)=(ηn(k)γn(k))/(1+ηn(k))。
MMSE STSA增益函数值计算器1801基于从后验SNR计算器1501供应的后验SNRγn(k)、从估计先验SNR计算器1502供应的估计先验以及从无语音概率存储单元1504供应的无语音概率q,针对每个频带计算MMSE STSA增益函数值,并且MMSESTSA增益函数值计算器1801将算得的MMSE STSA增益函数值输出至谱增益计算器1803。以下公式(15)给出了每个频带的MMSESTSA增益函数值Gn(k)。
G n ( k ) = &pi; 2 v n ( k ) &gamma; n ( k ) + 1 exp ( - v n ( k ) 2 ) [ ( 1 + v n ( k ) ) I 0 ( v n ( k ) 2 ) + v n ( k ) I 1 ( v n ( k ) 2 ) ] - - - ( 15 )
在此,I0(z)为零阶修正贝塞尔函数,而I1(z)为一阶修正贝塞尔函数。修正贝塞尔函数在“Iwanami Sugaku Jiten”(以日文书写),Iwanami Shoten,Publishers,374,G page(其英文版为EncyclopedicDictionary of Mathematics)中有述。
广义似然比计算器1802基于从后验SNR计算器1501供应的后验SNRγn(k)、从估计先验SNR计算器1502供应的估计先验SNR
Figure BPA00001719282600221
和从无语音概率存储单元1504供应的无语音概率q,针对每个频带计算广义似然比,并将该广义似然比传输至谱增益计算器1803。以下公式(16)给出了针对各频带的广义似然比Λn(k)。
&Lambda; n ( k ) = 1 - q q exp ( v n ( k ) ) 1 + &eta; n ( k ) - - - ( 16 )
谱增益计算器1803通过从MMSE STSA增益函数值计算器1801供应的MMSE STSA增益函数值Gn(k)和从广义似然比计算器1802供应的广义似然比Λn(k),针对每个频带计算谱增益。以下公式(17)给出了针对每个频带的谱增益
Figure BPA00001719282600223
G &OverBar; n ( k ) = &Lambda; n ( k ) q &Lambda; n ( k ) + 1 G n ( k ) - - - ( 17 )
谱增益计算器1803可计算SNR,其对于包含多个频带的宽频带是公共的,并可使用该SNR来代替针对各频带的计算SNR。
在如上所述的配置中,噪声抑制设备1400还在噪声抑制中使用谱增益来进行控制,以便使噪声根据期望信号与噪声的比率而变小,从而可实现具有高质量的信号处理。亦即,根据本示例性实施方式的噪声抑制设备1400可实现具有高质量的信号处理,其不会使其输出信号小于背景声音,而且不导致其输出信号的不连续性被感知,正如第二示例性实施方式的情况那样,并且此外,可实现更为准确的噪声抑制。
(第八示例性实施方式)
图19为图示作为本发明第八示例性实施方式的噪声抑制设备1900的示意性配置的框图。根据本示例性实施方式的噪声抑制设备1900按以下配置:不同于第七示例性实施方式(图14)的情况,噪声抑制单元1405的输出反馈至背景声音估计单元1007。
背景声音估计单元1007仅在不存在期望信号时更新背景声音信息。背景声音估计单元1007配置成使得其针对各频率分量,在期望信号较大时不更新背景声音。另外,背景声音估计单元1007在周围环境带噪时不估计背景声音。一旦背景声音估计单元1007估计了背景声音,则其继而在带噪语音信号的振幅接近于估计的背景声音时(当两者之间的比率或差值落入预定值之间的范围内时)对背景声音执行新的估计操作。背景声音估计单元1007仅在带噪语音信号的振幅接近于估计的背景声音时执行新的估计操作。
作为该操作的结果,除了前述有益效果之外,噪声抑制设备1900还具有可高效和准确地估计背景声音的有益效果。
(第九示例性实施方式)
图20为图示作为本发明第九示例性实施方式的噪声抑制设备2000的示意性配置的框图。根据本示例性实施方式的噪声抑制设备2000按以下配置:不同于第七示例性实施方式(图14)的情况,其不包含噪声校正单元208,并且因此作为替代而包含谱增益修改单元2001,该单元2001根据背景声音来修改从谱增益生成单元1410供应的谱增益。此外,背景声音估计单元2007从变换单元202接收带噪语音信号的振幅,并估计背景声音。背景声音估计单元2007还计算背景声音估计值与输入的比率β,并将该比率β供应至谱增益修改单元2001。由于它的其它组件和操作均与第五示例性实施方式中的相同,因此由与第五示例性实施方式中相同的对应参考符号来指示与第五示例性实施方式中相同的组件,并在此省略其详细描述。
谱增益修改单元2001根据输入信号(频率)的重要度来修改由谱增益生成单元1410生成的谱增益。
以这种方式,谱增益修改单元2001针对如下频率分量信号使谱增益变小,在该频率分量信号中背景声音信号被估计为存在,并从而限制由噪声抑制单元1405执行的对信号的抑制。
类似地,以这种方式,在使用谱增益的噪声抑制中,谱增益得到控制,以便根据期望信号与噪声的比率而使谱增益变小,从而可实现具有高质量的信号处理。亦即,根据本示例性实施方式,噪声抑制设备2000正如第二示例性实施方式的情况那样,亦可实现不使其输出信号小于背景声音并且不引起其输出信号的不连续性被感知的具有高质量的信号处理,并且此外,可实现更为准确的噪声抑制。
(第十示例性实施方式)
图21为图示作为本发明第十示例性实施方式的噪声抑制设备2100的示意性配置的框图。根据本示例性实施方式的噪声抑制设备2100配置成除了第九示例性实施方式(图20)的配置之外,噪声抑制单元1405的输出反馈至背景声音估计单元2107。
背景声音估计单元2107仅在不存在期望信号时更新背景声音信息。背景声音估计单元2107配置成使其针对各频率分量,在期望信号较大时不更新背景声音。另外,背景声音估计单元2107在周围环境带噪时不估计背景声音。一旦背景声音估计单元2107对背景声音进行了估计,其继而在带噪语音信号的振幅接近于估计的背景声音时(当两者的比率或差值落入预定值之间的范围内时)对背景声音执行新的估计操作。背景声音估计单元2107仅在带噪语音信号的振幅接近于估计的背景声音时执行新的估计操作。
作为该操作的结果,除了前述第九示例性实施方式的有益效果之外,噪声抑制设备2100还具有可高效和准确地估计背景声音的有益效果。
(第十一示例性实施方式)
图22为图示作为本发明第十一示例性实施方式的噪声抑制设备2200的示意性配置的框图。与第七示例性实施方式(图14)的配置相比,根据本示例性实施方式的噪声抑制设备2200不包含噪声估计单元206。噪声校正单元208通过使用从噪声存储单元1106读出的噪声信息来执行校正。由于它的其它组件和操作均与第二示例性实施方式中的相同,因此由与第二示例性实施方式中相同的对应参考符号来指示与第二示例性实施方式中相同的组件,并在此省略其详细描述。噪声校正单元208针对每个频率分量选择α(=输入-背景声音)与X2(=存储的噪声)之中的较小者,并将所选择的α或X2输出至谱增益生成单元1410。
类似地,根据本示例性实施方式,噪声抑制设备2200进行控制,以便正如第七示例性实施方式的情况那样,根据期望信号与噪声的比率而使噪声变小,从而可实现具有高质量的信号处理。
(第十二示例性实施方式)
图23为图示作为本发明第十二示例性实施方式的噪声抑制设备2300的示意性配置的框图。根据本示例性实施方式的噪声抑制设备2300配置成除了第十一示例性实施方式(图22)的配置之外,噪声抑制单元1405的输出被反馈至背景声音估计单元1007。
背景声音估计单元1007仅在不存在期望信号时更新背景声音信息。背景声音估计单元1007配置成使其针对各频率分量,在期望信号较大时不更新背景声音。另外,背景声音估计单元1007在周围环境带噪时不估计背景声音。一旦背景声音估计单元1007对背景声音进行了估计,则其随后在带噪语音信号的振幅接近于估计的背景声音时(当两者的比率或差值落入预定值之间的范围内时)对背景声音执行新的估计操作。背景声音估计单元1007仅在带噪语音信号的振幅接近于估计的背景声音时执行新的估计操作。
作为该操作的结果,除了前述第十一示例性实施方式的有益效果之外,噪声抑制设备2300还具有可高效和准确地估计背景声音的有益效果。
(第十三示例性实施方式)
图24为图示作为本发明第十三示例性实施方式的噪声抑制设备2400的示意性配置的框图。当比较图20与图24时,根据本示例性实施方式的噪声抑制设备2400不包含第九示例性实施方式(图20)的噪声估计单元206。谱增益生成单元1410通过使用从噪声存储单元1106读出的噪声信息来生成谱增益。由于它的其它组件和操作均与第九示例性实施方式中的相同,因此由与第九示例性实施方式中相同的对应参考符号来指示与第九示例性实施方式中相同的组件,并在此省略其详细描述。
类似地,根据本示例性实施方式,噪声抑制设备2400进行控制,以便正如第九示例性实施方式中的情况那样,根据期望信号与噪声的比率而使噪声变小,从而可实现具有高质量的信号处理。
(第十四示例性实施方式)
图25为图示作为本发明第十四示例性实施方式的噪声抑制设备2500的示意性配置的框图。根据本示例性实施方式的噪声抑制设备2500配置成除了第十三示例性实施方式(图24)的配置之外,噪声抑制单元1405的输出反馈至背景声音估计单元2107。
背景声音估计单元2107仅在不存在期望信号时更新背景声音信息。背景声音估计单元2107被配置成使其针对每个频率分量,在期望信号较大时不更新背景声音。另外,背景声音估计单元2107在周围环境带噪时不估计背景声音。一旦背景声音估计单元2107对背景声音进行了估计,则其继而在带噪语音信号的振幅接近于估计的背景声音时(当两者之间的比率或差值落入预定值之间的范围内时)对背景声音执行新的估计操作。背景声音估计单元2107仅在带噪语音信号的振幅接近于估计的背景声音时执行新的估计操作。
作为该操作的结果,除了前述第十三示例性实施方式的有益效果之外,噪声抑制设备2500还具有可高效和准确地估计背景声音的有益效果。
(第十五示例性实施方式)
图26为图示作为本发明第十五示例性实施方式的噪声抑制设备2600的示意性配置的框图。根据本示例性实施方式的噪声抑制设备2600配置成除了第十四示例性实施方式(图25)的配置之外,由谱增益修改单元2001中的修改所产生的谱增益反馈至谱增益生成单元2610。谱增益生成单元2610通过使用反馈的谱增益来生成下一谱增益。该操作增加了谱增益的准确性,并因此导致声音质量的提高。
由于噪声抑制设备2600的其它组件和操作均与第十四示例性实施方式中的相同,因此由与第十四示例性实施方式中相同的对应参考符号来指示与第十四示例性实施方式中相同的组件,并在此省略其详细描述。
类似地,根据本示例性实施方式,噪声抑制设备2600进行控制,以便正如第十四示例性实施方式的情况那样,根据期望信号与噪声的比率而使噪声变小,从而可实现具有高质量的信号处理,并且此外可实现更为准确的噪声抑制。
(第十六示例性实施方式)
图27为图示作为本发明第十六示例性实施方式的噪声抑制设备2700的示意性配置的框图。根据本示例性实施方式的噪声抑制设备2700配置成除了第十五示例性实施方式(图26)的配置之外,噪声抑制单元1405的输出被反馈至背景声音估计单元2107。
背景声音估计单元2107仅在不存在期望信号时更新背景声音信息。背景声音估计单元2107配置成使其针对每个频率分量,在期望信号较大时不更新背景声音。另外,背景声音估计单元2107在周围环境带噪时不估计背景声音。一旦背景声音估计单元2107对背景声音进行了估计,则其随后在带噪语音信号的振幅接近于估计的背景声音时(当两者之间的比率或差值落入预定值之间的范围内时)对背景声音执行新的估计操作。背景声音估计单元2107仅在带噪语音信号的振幅接近于估计的背景声音时执行新的估计操作。
作为该操作的结果,除了前述第十五示例性实施方式的有益效果之外,噪声抑制设备2700还具有可高效和准确地估计背景声音的有益效果。
(第十七示例性实施方式)
图28为图示作为本发明第十七示例性实施方式的噪声抑制设备2800的示意性配置的框图。根据本示例性实施方式的噪声抑制设备2800除了第十一示例性实施方式(图22)的配置之外,还包含噪声修改单元1301。噪声抑制设备2800致使噪声校正单元1301修改来自噪声存储单元1106的输出,并将修改的噪声信息供应至噪声校正单元208。噪声校正单元1301接收来自噪声抑制单元1405的输出240,并根据噪声抑制结果的反馈来修改噪声。
由于噪声抑制设备2800的其它组件和操作均与第十一示例性实施方式中的相同,因此由与第十一示例性实施方式中相同的对应参考符号来指示与第十一示例性实施方式中相同的组件,并在此省略其详细描述。
类似地,根据本示例性实施方式,噪声抑制设备2800进行控制,以便正如第十一示例性实施方式的情况那样,根据期望信号与噪声的比率而使噪声变小,从而可实现具有高质量的信号处理,并且此外,根据抑制结果来修改噪声,从而可实现更为准确的噪声抑制。
(第十八示例性实施方式)
图29为图示作为本发明第十八示例性实施方式的噪声抑制设备2900的示意性配置的框图。根据本示例性实施方式的噪声抑制设备2900除了第十三示例性实施方式(图24)的配置之外,还包含噪声修改单元1301。噪声抑制设备2900致使噪声修改单元1301修改噪声存储单元1106的输出,并将修改的噪声信息供应至谱增益生成单元1410。噪声修改单元1301接收来自噪声抑制单元1405的输出240,并根据噪声抑制结果的反馈来修改噪声。
由于噪声抑制设备2900的其它组件和操作均与第十三示例性实施方式中的相同,因此由与第十三示例性实施方式中相同的对应参考符号来指示与第十三示例性实施方式中相同的组件,并在此省略其详细描述。
类似地,根据本示例性实施方式,噪声抑制设备2900进行控制,以便正如第十一示例性实施方式的情况那样,根据期望信号与噪声的比率而使噪声变小,从而可实现具有高质量的信号处理,并且此外,根据抑制结果来修改噪声,从而可实现更为准确的噪声抑制。
(第十九示例性实施方式)
图30为图示作为本发明第十九示例性实施方式的噪声抑制设备3000的示意性配置的框图。根据本示例性实施方式的噪声抑制设备3000包含第十八示例性实施方式(图29)的配置,并且此外将通过谱增益修改单元2001中的修改而产生的谱增益反馈至谱增益生成单元2610。谱增益生成单元2610通过使用反馈的谱增益来生成下一谱增益。该操作增加了谱增益的准确性,并进一步导致声音质量的提高。
由于它的其它组件和操作均与第十八示例性实施方式中的相同,因此由与第十八示例性实施方式中相同的对应参考符号来指示与第十八示例性实施方式中相同的组件,并在此省略其详细描述。
类似地,根据本示例性实施方式,噪声抑制设备3000进行控制,以便正如第十八示例性实施方式的情况那样,根据期望信号与噪声的比率而使噪声变小,从而可实现具有高质量的信号处理,并且此外,由于谱增益的反馈而可实现更为准确的噪声抑制。
(其它实施方式)
在以上第一至第十九示例性实施方式中,描述了具有相应的不同特征的噪声抑制设备,但本发明的范围还包括各自通过任意地组合所述特征而产生的噪声抑制设备。
此外,本发明可应用于包含多个设备的系统,并且还可应用于单一设备。另外,本发明还可应用于信号处理程序被直接或从远程供应至系统或设备的情况,该信号处理程序为用以实现前述示例性实施方式的功能的软件。相应地,为了致使计算机实现根据本发明各方面的功能,本发明的范围还包括安装在计算机内的程序、在其中存储该程序的介质以及允许将该程序下载到计算机的WWW服务器。
图31为执行信号处理程序的计算机3100的框图,在该情况中由所述信号处理程序来实现第一示例性实施方式。计算机3100包含输入单元3101、CPU 3102、存储器3103和输出单元3104。
CPU 3102通过读入信号处理程序来控制计算机3100的操作。
亦即,CPU 3102执行存储于存储器3103中的信号处理程序,从而接收在其中混有第一信号和第二信号的混合信号(S3111)。接下来,CPU 3102估计混合信号中所含有的背景声音信号(S3112)。随后,CPU 3102按照如下限制来抑制第二信号,从而使抑制的结果不会变得小于估计的背景声音信号(S3113)。以这种方式,有可能获得与第一示例性实施方式的有益效果相同的有益效果。
在上文中,已参考本发明的示例性实施方式对本发明进行了描述,但本发明并不限于这些示例性实施方式。在本发明的范围内可对本发明的配置和细节做出为本领域技术人员所理解的各种改变。
本申请基于在2010年11月25日提交的日本专利申请第2010-263022号并且要求其优先权的权益,该申请的公开内容通过引用而整体并入本文。

Claims (9)

1.一种信号处理设备,包括:
抑制装置,用于通过处理混合信号来执行对第二信号的抑制,在所述混合信号中包含有第一信号和所述第二信号;
背景声音估计装置,用于估计所述混合信号中的背景声音信号;以及
限制装置,用于限制对所述第二信号的所述抑制,以使得由所述抑制装置输出的抑制结果不会变得小于估计的所述背景声音信号。
2.根据权利要求1所述的信号处理设备,还包括:
估计装置,用于估计被包含在所述混合信号中的所述第二信号,
其中所述限制装置根据所述背景声音信号来校正从所述估计装置输出的估计的所述第二信号,并且
所述抑制装置从所述混合信号中减去经校正的估计的所述第二信号以限制所述抑制。
3.根据权利要求1所述的信号处理设备,还包括:
存储装置,用于在其中存储估计的第二信号,估计的所述第二信号被估计为被包含在所述混合信号中,
其中所述限制装置根据所述背景声音信号来校正估计的所述第二信号,并且
所述抑制装置从所述混合信号中减去经校正的估计的所述第二信号以限制所述抑制。
4.根据权利要求3所述的信号处理设备,还包括:
修改装置,用于修改被存储在所述存储装置中的估计的所述第二信号,
其中所述限制装置校正经修改的估计的所述第二信号。
5.根据权利要求2至4中任一项所述的信号处理设备,还包括:
谱增益生成装置,用于基于估计的所述第二信号来生成谱增益,
其中所述抑制装置通过将所述混合信号乘以所述谱增益来抑制被包含在所述混合信号中的所述第二信号。
6.根据权利要求2至4中任一项所述的信号处理设备,还包括:
谱增益生成装置,用于基于估计的所述第二信号来生成谱增益;以及
谱增益修改装置,用于根据所述背景声音信号来修改所述谱增益,
其中所述抑制装置通过将所述混合信号乘以由所述谱增益修改装置修改的所述谱增益,来抑制被包含在所述混合信号中的所述第二信号。
7.根据权利要求1至6中任一项所述的信号处理设备,
其中所述背景声音估计装置在由所述抑制装置输出的所述抑制结果满足预定条件的情况下,不估计所述背景声音。
8.一种信号处理方法,包括:
接收混合信号,在所述混合信号中包含有第一信号和第二信号;
估计被包含在所述混合信号中的背景声音信号;以及
执行对所述第二信号的抑制同时限制对所述第二信号的所述抑制,以使得输出不会变得小于估计的所述背景声音信号。
9.一种信号处理程序,其引起计算机执行处理,所述处理包括:
接收步骤,用于接收混合信号,在所述混合信号中包含有第一信号和第二信号;
背景声音估计步骤,用于估计被包含在所述混合信号中的背景声音信号;以及
抑制步骤,用于执行对所述第二信号的抑制同时限制对所述第二信号的所述抑制,以使得输出不会变得小于估计的所述背景声音信号。
CN2011800568616A 2010-11-25 2011-11-21 信号处理设备、信号处理方法及信号处理程序 Pending CN103238180A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010-263022 2010-11-25
JP2010263022 2010-11-25
PCT/JP2011/077285 WO2012070670A1 (ja) 2010-11-25 2011-11-21 信号処理装置、信号処理方法、及び信号処理プログラム

Publications (1)

Publication Number Publication Date
CN103238180A true CN103238180A (zh) 2013-08-07

Family

ID=46146005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800568616A Pending CN103238180A (zh) 2010-11-25 2011-11-21 信号处理设备、信号处理方法及信号处理程序

Country Status (4)

Country Link
US (1) US20130246060A1 (zh)
JP (1) JPWO2012070670A1 (zh)
CN (1) CN103238180A (zh)
WO (1) WO2012070670A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106486134A (zh) * 2015-08-31 2017-03-08 富士通株式会社 话语状态确定装置及方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9666206B2 (en) * 2011-08-24 2017-05-30 Texas Instruments Incorporated Method, system and computer program product for attenuating noise in multiple time frames
US9449615B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Externally estimated SNR based modifiers for internal MMSE calculators
US9449609B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Accurate forward SNR estimation based on MMSE speech probability presence
US9449610B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Speech probability presence modifier improving log-MMSE based noise suppression performance
US10347273B2 (en) * 2014-12-10 2019-07-09 Nec Corporation Speech processing apparatus, speech processing method, and recording medium
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1115528A (zh) * 1993-12-25 1996-01-24 索尼公司 噪声减少方法、噪声减少装置和电话机
JPH09269799A (ja) * 1996-03-29 1997-10-14 Toshiba Corp 雑音抑圧処理機能を備えた音声符号化回路
JP2000099096A (ja) * 1998-09-18 2000-04-07 Toshiba Corp 音声信号の成分分離方法及びこれを用いた音声符号化方法
US20020064288A1 (en) * 2000-10-24 2002-05-30 Alcatel Adaptive noise level estimator
JP2004289614A (ja) * 2003-03-24 2004-10-14 Fujitsu Ltd 音声強調装置
CN1736039A (zh) * 2003-11-11 2006-02-15 三菱电机株式会社 回波抑制装置
CN101346896A (zh) * 2005-10-26 2009-01-14 日本电气株式会社 回声抑制方法及设备
JP2009069503A (ja) * 2007-09-13 2009-04-02 Fujitsu Ltd 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム
WO2009087923A1 (ja) * 2008-01-11 2009-07-16 Nec Corporation 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3396393B2 (ja) * 1997-04-30 2003-04-14 沖電気工業株式会社 エコー・雑音成分除去装置
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
JP5413575B2 (ja) * 2009-03-03 2014-02-12 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1115528A (zh) * 1993-12-25 1996-01-24 索尼公司 噪声减少方法、噪声减少装置和电话机
JPH09269799A (ja) * 1996-03-29 1997-10-14 Toshiba Corp 雑音抑圧処理機能を備えた音声符号化回路
JP2000099096A (ja) * 1998-09-18 2000-04-07 Toshiba Corp 音声信号の成分分離方法及びこれを用いた音声符号化方法
US20020064288A1 (en) * 2000-10-24 2002-05-30 Alcatel Adaptive noise level estimator
JP2004289614A (ja) * 2003-03-24 2004-10-14 Fujitsu Ltd 音声強調装置
CN1736039A (zh) * 2003-11-11 2006-02-15 三菱电机株式会社 回波抑制装置
CN101346896A (zh) * 2005-10-26 2009-01-14 日本电气株式会社 回声抑制方法及设备
JP2009069503A (ja) * 2007-09-13 2009-04-02 Fujitsu Ltd 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム
WO2009087923A1 (ja) * 2008-01-11 2009-07-16 Nec Corporation 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106486134A (zh) * 2015-08-31 2017-03-08 富士通株式会社 话语状态确定装置及方法
CN106486134B (zh) * 2015-08-31 2019-07-19 富士通株式会社 话语状态确定装置及方法

Also Published As

Publication number Publication date
US20130246060A1 (en) 2013-09-19
WO2012070670A1 (ja) 2012-05-31
JPWO2012070670A1 (ja) 2014-05-19

Similar Documents

Publication Publication Date Title
CN103238180A (zh) 信号处理设备、信号处理方法及信号处理程序
CN101091209B (zh) 抑制噪声的方法及装置
US10811026B2 (en) Noise suppression method, device, and program
US20200349964A1 (en) Detection and suppression of keyboard transient noise in audio streams with aux keybed microphone
Erkelens et al. Minimum mean-square error estimation of discrete Fourier coefficients with generalized Gamma priors
Kanaya et al. Estimation of stochastic volatility models by nonparametric filtering
CN103250208B (zh) 信号处理装置和信号处理方法
CN112309426B (zh) 语音处理模型训练方法及装置和语音处理方法及装置
Strake et al. Speech enhancement by LSTM-based noise suppression followed by CNN-based speech restoration
US20150230023A1 (en) Noise estimation apparatus of obtaining suitable estimated value about sub-band noise power and noise estimating method
CN103354937A (zh) 包括噪声抑制增益的中值滤波的后处理
CN103325380A (zh) 用于信号增强的增益后处理
CN103229236B (zh) 信号处理装置、信号处理方法
US20140114650A1 (en) Method for Transforming Non-Stationary Signals Using a Dynamic Model
CN105144290A (zh) 信号处理装置、信号处理方法和信号处理程序
JP6300031B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
CN101147122A (zh) 用于创建对线性依赖于值平方的计算结果的表示的方法
CN102598126A (zh) 信息处理装置及其附属设备、信息处理系统及其控制方法和控制程序
Xiaohui et al. An algorithm of generating random number by wavelet denoising method and its application
Li et al. Robust Non‐negative matrix factorization with β‐divergence for speech separation
McElroy et al. A local spectral approach for assessing time series model misspecification
Yechuri et al. Single channel speech enhancement using iterative constrained NMF based adaptive wiener gain
JPWO2013032025A1 (ja) 信号処理装置、信号処理方法、およびコンピュータ・プログラム
EP3836027A1 (en) Method and device for generating frequency component vector of time-series data
Muraka et al. A risk-estimation-based formulation for speech enhancement and its relation to wiener filtering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130807