CN103137136B - 声音处理装置 - Google Patents

声音处理装置 Download PDF

Info

Publication number
CN103137136B
CN103137136B CN201210478375.XA CN201210478375A CN103137136B CN 103137136 B CN103137136 B CN 103137136B CN 201210478375 A CN201210478375 A CN 201210478375A CN 103137136 B CN103137136 B CN 103137136B
Authority
CN
China
Prior art keywords
desired value
voice signal
value
unit
regulated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210478375.XA
Other languages
English (en)
Other versions
CN103137136A (zh
Inventor
近藤多伸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Publication of CN103137136A publication Critical patent/CN103137136A/zh
Application granted granted Critical
Publication of CN103137136B publication Critical patent/CN103137136B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/12Arrangements for producing a reverberation or echo sound using electronic time-delay networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

在声音处理装置中,指标值计算单元计算第一指标值和第二指标值,所述第一指标值以第一跟随度跟随声音信号的变化,所述第二指标值以低于第一跟随度的第二跟随度跟随声音信号的变化。调节值计算单元基于所述第一指标值和所述第二指标值之差计算能够有效调节声音信号的混响分量的调节值。混响调节单元将所述调节值应用于声音信号。

Description

声音处理装置
技术领域
本发明涉及处理声音信号的技术,具体来说涉及对声音信号在包含的混响分量进行抑制或增强的技术。
背景技术
已经提出了对声音信号中包含的混响分量进行抑制的技术。例如,专利文献1公开了一种使用预测滤波器系数的概率模型来估计声音信号中包含的混响分量的预测滤波器系数从而估计混响分量、并且使用估计的预测滤波器抑制混响分量的技术。此外,非专利文献1公开了一种对从发声源到声音接收点的传递函数的反向滤波器进行估计并且将估计后的反向滤波器应用于声音信号以抑制混响分量的技术。
[专利文献1]日本专利申请公开第2009-212599号
[非专利文献1]K.Fu ruya,et  al.″Robust speechdereverberation using multichannel blind deconvolutionwith spectral subtraction”,IEEE Transactions on Audio,Speech,and  Language  Processing,vol.15,no.5,p.1579-1591,2007
发明内容
为了高精度地估计专利文献1的预测滤波器系数或者非专利文献1的反向滤波器,需要执行大量的操作。考虑到该问题而提出了本发明,本发明的一个目的是通过简单的处理调节(抑制或增强)声音信号的混响分量。
为了解决上述问题,根据本发明的声音处理装置包括:指标值计算单元,其配置为计算第一指标值和第二指标值,所述第一指标值以第一跟随度跟随声音信号的变化,所述第二指标值以低于第一跟随度的第二跟随度跟随声音信号的变化;调节值计算单元,其配置为基于所述第一指标值和所述第二指标值之差计算能够有效调节声音信号的混响分量的调节值;和混响调节单元,其配置为将所述调节值应用于声音信号。在上述结构中,能够基于跟随声音信号的时间变化的第一指标值和第二指标值之差来计算噪声分量的调节值,因此能够通过与专利文献1的技术和非专利文献1的技术相比较为简单的处理来调节声音信号的噪声分量。
具体来说,能够根据如下构造来抑制声音信号的混响分量,其中调节值计算单元配置为在第一指标值超过第二指标值的情况下(例如在部分SA中)计算第一调节值,并且配置为在第一指标值低于第二指标值的情况下(例如在部分SB中)计算第二调节值,并且所述混响调节单元配置为将第二调节值应用于声音信号,从而相比混响调节单元将第一调节值应用于声音信号的情况对声音信号做出更大的抑制。
例如,调节值计算单元包括:比值计算单元,其配置为计算第一指标值与第二指标值的比值;和阈值处理单元,其配置为在该比值超过预定值的情况下将调节值设置为预定值(例如预定值Gmax),并且配置为在该比值低于预定值的情况下将调节值设置为该比值。
另一方面,根据如下构造可以增强(提取)声音信号的混响分量,其中调节值计算单元配置为在第一指标值超过第二指标值的情况下(例如在部分SA中)计算第一调节值,并且配置为在第一指标值低于第二指标值的情况下(例如在部分SB中)计算第二调节值,并且所述混响调节单元配置为将第一调节值应用于声音信号,从而相比混响调节单元将第二调节值应用于声音信号的情况对声音信号做出更大的抑制。
在本发明的优选实施例中,所述声音处理装置还包括:频带分割单元,其配置为在时域将声音信号分割成对应于多个频带的多个频带分量;频率分析单元,其配置为连续计算声音信号的频谱;和调节处理单元,其配置为根据所述调节值计算单元计算的调节值来计算与所述多个频带对应的多个调节值,其中所述指标值计算单元配置为在声音信号的频谱的每个频率计算与声音信号的幅度的时间序列相对应的第一指标值和第二指标值。根据此实施例,能够有利地抑制混响分量在调节之前和之后的延迟。该实施例的具体示例将在后文(如说明书中的第六实施例)进行说明。
在本发明的第一方面,指标值计算单元包括:第一平滑单元,其配置为通过第一时间常数(例如时间序列τ1)对声音信号的强度的时间序列进行平滑以计算第一指标值;和第二平滑单元,其配置为通过大于第一时间常数的第二时间常数(例如时间序列τ2)对声音信号的强度的时间序列进行平滑以计算第二指标值。在以上方面,通过第一平滑单元执行的平滑的时间常数和通过第二平滑单元执行的平滑的时间常数设置为使得通过第一平滑单元执行的平滑的时间常数和通过第二平滑单元执行的平滑的时间常数彼此不同,因此能够简单地计算第一指标值和第二指标值。同时,声音信号的信号强度表示声音信号的幅度或者幅度的乘方(例如幅度的平方或四次方)。
在第一方面的一个具体示例中,第一平滑单元配置为计算在沿着声音信号的强度的时间序列移动的第一周期内声音信号的强度的移动平均(例如简单移动平均或加权移动平均)以获得第一指标值,第二平滑单元配置为计算在沿着声音信号的强度的时间序列移动的设置为大于第一周期的第二周期内声音信号的强度的移动平均以获得第二指标值。
此外,优选的是第一平滑单元利用第一平滑系数(例如平滑系数α1)计算声音信号的强度的指数平均以获得第一指标值,第二平滑单元利用设置为小于第一平滑系数的第二平滑系数(例如平滑系数α2)计算声音信号的强度的指数平均以获得第二指标值。第一方面的具体示例将在下文作为例如第一实施例进行说明。
在本发明的第二方面,指标值计算单元配置为通过第一方式平滑声音信号的强度的时间序列来生成第一指标值,并且配置为通过与所述第一方式不同的第二方式平滑声音信号的强度的时间序列来生成第二指标值,使得第二指标值的时间变化相比第一指标值延迟。在上述方面,能够通过相对第一指标值延迟第二指标值的简单构造来计算第一指标值和第二指标值。第二方面的具体示例将在下文作为例如第二实施例进行说明。
在本发明的第三方面,声音处理装置配置为对声音信号进行处理,所述声音信号是由第一信号(例如声音信号XL(t))和第二信号(例如声音信号XR(t))构成的立体声信号,其中所述指标值计算单元包括:互相关计算单元,其配置为顺序计算第一信号和第二信号之间的空间互相关;自相关计算单元,其配置为顺序计算第一信号或者第二信号的空间自相关;第一平滑单元,其配置为对空间互相关的时间序列进行平滑以计算第一指标值;和第二平滑单元,其配置为对空间自相关的时间序列进行平滑以计算第二指标值。在上述方面中,对第一信号和第二信号之间的空间互相关进行平滑以计算第一指标值,并且对第一信号和/或第二信号的空间自相关进行平滑以计算第二指标值,因此与例如通过平滑共同的信号强度来计算第一指标值和第二指标值的构造相比,能够有效调节混响分量。同时,第三方面的具体示例将在下文中作为第三实施例进行说明。
在本发明的优选方面中,指标值计算单元配置为计算与声音信号中包含的多个频率分量相对应的多个第一指标值和多个第二指标值,所述调节值计算单元配置为根据所述与声音信号中包含的多个频率分量相对应的多个第一指标值和多个第二指标值来计算多个调节值,并且所述混响调节单元配置为将每个调节值应用于声音信号中包含的每个相应的频率分量。根据本发明的这一方面,针对每个频率(每个频带)计算调节值并将其应用于声音信号的每个频率分量。因此能够在声音信号的每个频率处单独地调节混响分量。
例如,优选提供如下构造,其中指标值计算单元配置为利用用于平滑声音信号的、针对声音信号的每个频率单独设置的第一时间常数来计算每个第一指标值,并且配置为利用用于平滑声音信号的、针对声音信号的每个频率单独设置的第二时间常数来计算每个第二指标值。例如,在考虑到混响分量在低频范围较显著的倾向时,在包含第一平滑单元和第一平滑单元的构造中,在每个频率单独设置时间常数,以使得频率越高,第一平滑单元执行平滑的时间常数和第二平滑单元执行平滑的时间常数彼此越接近。根据上述构造,调节值在混响分量显著的低频范围中快速变化,因此可以有效地调节混响分量。
在本发明的优选方面中,指标值计算单元配置为利用用于平滑声音信号的、沿着声音信号的时间通道可变设置的第一时间常数来计算每个第一指标值,并且配置为利用用于平滑声音信号的、沿着声音信号的时间通道可变设置的第二时间常数来计算每个第二指标值。根据上述方面,可以随着时间变化改变混响分量的调节程度。例如,计算第一指标值的时间常数与计算第二指标值的时间常数之差越大,调节值的改变越迅速。根据随着时间变化相比计算第二指标值的时间常数增大计算第一指标值的时间常数的构造,可以快速调节混响分量。
在本发明的优选方面中,调节值计算单元配置为连续计算与声音信号的单位间隔的时间序列相对应的多个调节值,所述混响调节单元配置为将一个单位间隔的调节值应用于位于所述一个单位间隔之前的另一个单位间隔的声音信号。根据上述方面,将一个单位间隔的调节值应用于过去的声音信号,即使在混响分量平缓变化的情况下也能够有效调节混响分量。上述方面的具体示例将在下文作为例如第五实施例进行说明。
在本发明的优选实施例中,混响调节单元配置为将调节值应用于声音信号,以使得声音信号中包含后一个混响周期,其中调节值计算单元配置为顺序计算与声音信号的各单位间隔的时间序列相对应的调节值的时间序列,从而在相应的单位间隔属于所述后一个混响周期之外的周期的情况下,调节值计算单元计算能够以第一抑制效果有效调节混响分量的调节值,并且在相应的单位间隔属于所述后一个混响周期的情况下,调节值计算单元计算能够以超过第一抑制效果的第二抑制效果有效调节混响分量的调节值。根据该实施例,由于在后一个混响周期抑制了音量的变化,因此能够有利地避免在混响调节之后再现声音时的质量降低。上述实施例的具体示例将在下文作为例如第七实施例进行说明。
存在多种用于确定每个单位间隔是否属于后一个混响周期的方法。例如,调节值计算单元配置为通过将对应于每个单位间隔的第一指标值与预定阈值进行比较,来判定每个单位间隔是否属于后一个混响周期。或者,指标值计算单元配置为计算第三指标值,该第三指标值以设置为第一指标值和第二指标值之间的第三跟随度跟随声音信号的变化,并且该指标值计算单元配置为根据该第三指标值来判定每个单位间隔是否属于后一个混响周期。
根据上述每个方面的声音处理装置是通过硬件(电子电路)实现的,所述硬件是例如专用于处理声音信号的数字信号处理器(DSP),另外还可以通过通用操作处理装置(如中央处理单元(CPU))与程序的组合来实现。根据本发明的程序使得计算机能够执行如下处理:计算第一指标值和第二指标值,所述第一指标值以第一跟随度跟随声音信号的变化,所述第二指标值以低于第一跟随度的第二跟随度跟随声音信号的变化;基于所述第一指标值和所述第二指标值之差计算能够有效调节声音信号的混响分量的调节值;和将所述调节值应用于声音信号。上述程序实现与根据本发明的声音处理装置相同的运算和效果。同时,根据本发明的程序以如下形式提供,其中程序存储在可以被计算机读取的机器可读非暂态记录介质中,使得程序能够安装在计算机中,另外还可以通过通信网络分发以使得程序能够安装在计算机中的形式提供程序。
附图说明
图1是根据本发明第一实施例的声音处理装置的框图。
图2是第一实施例中的分析处理单元的框图。
图3(A)-图3(C)是例示了第一指标值、第二指标值和调节值之间的关系的示图。
图4是本发明第二实施例中的分析处理单元的框图。
图5(A)-图5(C)是例示了本发明第二实施例中的第一指标值、第二指标值和调节值之间的关系的示图。
图6是根据本发明第二实施例的变型例的指标值计算单元的框图。
图7是根据本发明第三实施例的声音处理装置的框图。
图8是本发明第三实施例中的分析处理单元的框图。
图9是示出了空间互相关和空间自相关之间的关系的示图。
图10是根据本发明第四实施例的声音处理装置的框图。
图11是根据本发明第五实施例的声音处理装置的框图。
图12是根据本发明第六实施例的声音处理装置的框图。
图13是第六实施例中的分析处理单元的框图。
图14是示出了声音信号和频谱之间的时间关系的说明示意图。
图15是示出了第六实施例中的混响分量的抑制效果的示意图。
图16是示出了第七实施例中的调节值计算单元的操作的流程图。
具体实施方式
<第一实施例>
图1是根据本发明第一实施例的声音处理装置100的框图。如图1所示,信号供应装置12和发声装置14连接至声音处理装置100。信号供应装置12将声音信号x(t)(t:时间)提供给声音处理装置100。声音信号x(t)是时域信号,其表示将在声学空间内反射后到达声音接收点的混响(初始反射声音和后混响声音)叠加到从声音发生源直接到达声音接收点的直接声音所获得的声音的波形。例如可以适当使用通过将混响效果应用于诸如记录声音或合成声音的已有声音所获得的声音的声音信号x(t),或者在具有混响效果的声学空间(例如音乐厅)中实际记录的声音的声音信号x(t)。信号供应装置12可以包括各种装置,如接收环境声音以生产声音信号x(t)的声音接收仪器,从便携式或内置记录介质获取声音信号x(t)并将获取的声音信号提供至声音处理装置100的再现装置,或者从通信网络接收声音信号x(t)并将所接收的声音信号提供至声音处理装置100的通信装置。
根据本发明第一实施例的声音处理装置100是一种混响抑制装置,其生成其中抑制了声音信号x(t)的混响分量(尤其是后混响声音)的声音信号(其中直接声音或者初始反射声音得到增强的声音信号)。发声装置14(例如扬声器或耳机)再现与声音处理装置100生成的声音信号ys(t)对应的声波。同时为了简明起见,没有示出将声音信号ys(t)从数字转换成模拟的数模(D/A)转换器。
如图1所示,声音处理装置100由包含运算处理装置22和存储装置24的计算机系统实现。存储装置24存储由运算处理装置22执行的程序PGM以及运算处理装置22使用的各种数据。可以可选地采用已知记录介质(如半导体存储介质和磁存储介质)以及多种机器可读非暂态记录介质来作为存储装置24。在存储装置24中存储声音信号x(t)的构造(从而可以省去信号供应装置12)也是优选的。
运算处理装置22执行存储在存储装置24中的程序PGM以实现从输入声音信号x(t)生成输出声音信号ys(t)的多种功能(频率分析单元32、分析处理单元34、混响调节单元36和波形合成单元38)。同时,将运算处理装置22的各个功能分散到多个集成电路中的构造或者由专用电子电路(DSP)实现各种功能的构造也可以采用。
频率分析单元32顺序生成声音信号x(t)在时间轴上每个单位间隔(帧)上的频谱(复合频谱)X(k,m)。符号k表示指定频率轴上的任意频率(频带)的变量,符号m表示指定时间轴上的任意单位间隔(时间轴上的特定时间点)的变量。可以可选地采用公知的频率分析(如快速傅立叶变换)来生成频谱X(k,m)。同时,由具有不同通带的多个带通滤波器构成的滤波器组可以用作频率分析单元32。
分析处理单元34计算与每单位间隔中每个频率处的频谱X(k,m)对应的声音信号x(t)的调节值Gs(k,m)。第一实施例的调节值Gs(k,m)是抑制声音信号x(t)的混响分量(尤其是后混响声音)的变量。总体而言,存在着混响分量(后混响声音)在第m单位间隔的声音信号x(t)的第k频率分量中占比越大,则调节值Gs(k,m)越小的趋向。
混响调节单元36将分析处理单元34计算的调节值Gs(k,m)应用于声音信号x(t)。混响调节单元36的调节针对每单位间隔中的每个频率顺序执行。具体来说,混响调节单元36将声音信号x(t)的频谱X(k,m)乘以调节值Gs(k,m)以计算声音信号y s(t)的频谱Ys(k,m)(Ys(k,m)=Gs(k,m)X(k,m)),该调节值Gs(k,m)是针对相应频谱X(k,m)共有的单位间隔和频率计算的。即,调节值Gs(k,m)相当于声音信号x(t)的频谱X(k,m)的增益。
波形合成单元38根据混响调节单元36在每个单位间隔生成的频谱Ys(k,m)来生成时域声音信号ys(t)。即,波形合成单元38通过快速逆傅立叶变换将每个单位间隔的频谱Ys(k,m)转换成时域信号,并将前后排列的单位间隔互相连接以生成声音信号ys(t)。通过波形合成单元38生成的声音信号ys(t)被提供至发声装置14,并通过发声装置14再现为声波。
图2是本发明第一实施例的分析处理单元34的框图。如图2所示,本发明第一实施例的分析处理单元34包括指标值计算单元42A和调节值计算单元44。指标值计算单元42A顺序计算对应于声音信号x(t)的第一指标值Q1(k,m)和第二指标值Q2(k,m)。具体来说,指标值计算单元42A包括第一平滑单元51和第二平滑单元52。第一平滑单元51对声音信号x(t)的乘方|X(k,m)|2的时间序列进行平滑,以顺序计算每单位间隔中的每个频率的第一指标值Q1(k,m)。按照相同的方式,第二平滑单元52对声音信号x(t)的乘方|X(k,m)|2的时间序列进行平滑,以顺序计算每单位间隔中的每个频率的第二指标值Q2(k,m)。
如下式(1A)所定义的,第一指标值Q1(k,m)是乘方|X(k,m)|2在由N1(N1是大于等于1的自然数)个前后排列的单位间隔构成的第一周期内的移动平均(简单移动平均)。第一周期是具有例如以第m个单位间隔为最后一个的N1个单位间隔的组。另一方面,如下式(1B)所定义的,第二指标值Q2(k,m)是乘方|X(k,m)|2在由N2(N2是大于等于2的自然数)个前后排列的单位间隔构成的第二周期内的移动平均(简单移动平均)。第二周期是具有例如以第m个单位间隔为最后一个的N2个单位间隔的组。通过上述说明可以理解,第一平滑单元51和第二平滑单元52等价于有限脉冲响应(FIR)型低通滤波器。可以将单位间隔的数量N1设为1。在这种情况下,声音信号x(t)的乘方|X(k,m)|2可以直接用作第一指标值Q1(k,m)。
Q 1 ( k , m ) = 1 N 1 &Sigma; i = 0 N 1 - 1 | X ( k , m - i ) | 2 . . . ( 1 A )
Q 2 ( k , m ) = 1 N 2 &Sigma; i = 0 N 2 - 1 | X ( k , m - i ) | 2 . . . ( 1 B )
用于计算第二指标值Q2(k,m)的数量N2超过用于计算第一指标值Q1(k,m)的单位间隔的数量N1(N2>N1)。也即第二周期大于第一周期。例如,第一周期设置为从100毫秒左右到300毫秒左右的时间跨度,和第二周期设置为从300毫秒左右到600毫秒左右的时间跨度。因此,第二平滑单元52执行的平滑的时间常数为τ2超过第一平滑单元51执行平滑的时间常数τ1(τ2>τ1)。在第一平滑单元51和第二平滑单元52通过低通滤波器实现的情况下,第二平滑单元52的截止频率可以低于第一平滑单元51的截止频率。
图3(B)是示出了在声音信号x(t)的任意频率处计算的第一指标值Q1(k,m)和第二指标值Q2(k,m)的时间变化的示图。第一指标值Q1(k,m)和第二指标值Q2(k,m)是在将其乘方|X(k,m)|2(功率密度)如图3(A)所示指数衰减的房间脉冲响应(RIR)提供给声音处理装置100作为声音信号x(t)的情况下计算的。
从图3(B)可以看出,第一指标值Q1(k,m)和第二指标值Q2(k,m)跟随声音信号x(t)的乘方|X(k,m)|2(功率密度)随时间变化。由于第二平滑单元52执行的平滑的时间常数τ2超过第一平滑单元51执行的平滑的时间常数τ1,因此第二指标值Q2(k,m)相比第一指标值Q1(k,m)以较低的跟随度(较低的变化率)跟随声音信号x(t)的乘方|X(k,m)|2(功率密度)的时间变化。具体地如图3(B)所示,在紧接着房间脉冲响应开始的时间点t0之后部分,第一指标值Q1(k,m)以超过第二指标值Q2(k,m)的变化率增加。然后,第一指标值Q1(k,m)和第二指标值Q2(k,m)在时间轴上的不同时间点到达峰值,并且第一指标值Q1(k,m)以超过第二指标值Q2(k,m)的变化率降低。
由于第一指标值Q1(k,m)和第二指标值Q2(k,m)如上所述以不同的变化率发生时变,因此第一指标值Q1(k,m)和第二指标值Q2(k,m)的等级(level)在时间轴上的特定时间点tx处翻转。也即,在从时间点t0到时间点tx的部分SA中,第一指标值Q1(k,m)超过第二指标值Q2(k,m),而在时间点tx之后的部分SB中,第二指标值Q2(k,m)超过第一指标值Q1(k,m)。部分SA等于是房间脉冲响应的直接声音和初始反射声音存在的周期,而部分SB等于是房间脉冲响应的后混响声音存在的周期。
图2的调节值计算单元44顺序计算与指标值计算单元42A针对每单位间隔中的每个频率计算的第一指标值Q1(k,m)和第二指标值Q2(k,m)相对应的调节值Gs(k,m)。本发明第一实施例的调节值计算单元44包括比值计算单元62和阈值处理单元64。
比值计算单元62计算第一指标值Q1(k,m)与第二指标值Q2(k,m)的比值R(k,m)。具体如下式(2)所示,比值计算单元62计算每单位间隔中第一指标值Q1(k,m)与第二指标值Q2(k,m)的比值R(k,m)。
R ( k , m ) = Q 1 ( k , m ) Q 2 ( k , m ) . . . ( 2 )
图2的阈值处理单元64计算调节值Gs(k,m),调节值Gs(k,m)对应于每单位间隔中通过比值计算单元62计算的比值R(k,m)与预定值Gmax之间的比较结果以及比值R(k,m)与另一预定值Gmi n之间的比较结果。预定值Gmax和预定值Gmin是例如根据用户指令预设的阈值,以便与比值R(k,m)相比较。在第一实施例中例示了将预定值Gmax设为1的情况。预定值Gmin设为低于预定值Gmax的值(不小于0且小于1)。
具体来说,阈值处理单元64运算如下公式(3)。首先在比值R(k,m)超过预定值Gmax(Gmax=1)(R(k,m)≥Gmax(Gmax=1))的情况下,阈值处理单元64将预定值Gmax设为调节值Gs(k,m)。其次,在比值R(k,m)低于预定值Gmin(Gmax=1)(R(k,m)≤Gmin))的情况下,阈值处理单元64将预定值Gmin设为调节值Gs(k,m)。第三,在比值R(k,m)是处在预定值Gmax和预定值Gmin之间的值(Gmin<R(k,m)<Gmax)的情况下,阈值处理单元64将比值R(k,m)设为调节值Gs(k,m)。
Gs ( k , m ) = G max ( R ( k , m ) &GreaterEqual; G max ) R ( k , m ) ( G min < R ( k , m ) < G max ) G min ( R ( k , m ) &le; G min ) - - - ( 3 )
在第一指标值Q1(k,m)和第二指标值Q2(k,m)如图3(B)所示变化的情况下,调节值Gs(k,m)的变化如图3(C)所示。通过图3(C)可以理解,总体来说,其中第一指标值Q1(k,m)超过第二指标值Q2(k,m)(部分SA)的情况下的第一调节值Gs(k,m)大于其中第一指标值Q1(k,m)低于第二指标值Q2(k,m)(部分SB)的情况下的第二调节值Gs(k,m)。具体来说,由于在第一指标值Q1(k,m)超过第二指标值Q2(k,m)的部分SA中,比值R超过预定值Gmax(Gmax=1),因此调节值Gs(k,m)维持在预定值Gmax。此外在第一指标值Q1(k,m)低于第二指标值Q2(k,m)的部分SB中的比值R超过预定值Gmi n的部分SB1中,调节值Gs(k,m)设为比值R(k,m)并且随时间减小。此外,在部分SB的比值R低于预定值Gmin的部分SB2,调节值Gs(k,m)维持在预定值Gmin。
也即,第一实施例的调节值Gs(k,m)在存在直接声音和初始反射声音的部分SA中被设为预定值(最大值)Gmax,并且在存在后混响声音的部分SB中随时间降低至预定值(最小值)Gmin。因此,混响调节单元36将调节值Gs(k,m)应用于输入声音信号x(t)以生成输出声音信号ys(t),在输出声音信号ys(t)中声音信号x(t)的混响分量得到抑制(增强了直接声音或者初始反射声音)。
在上述第一实施例中,基于跟随声音信号x(t)的时间变化的第一指标值Q1(k,m)与第二指标值Q2(k,m)的比值R(k,m)来计算调节值Gs(k,m),因此与专利文献1的估计混响分量的预测滤波器系数的技术以及非专利文献1的估计传递函数以生成反向滤波器的技术相比,能够通过简单处理来抑制声音信号x(t)的混响分量。同时,混响分量会降低声音信号x(t)的声源分离和特征提取(如音高检测)的精度。如果针对在第一实施例中抑制了混响分量之后的声音信号ys(t)来执行声源分离和特征提取,则能够实现高精度的声源分离和特征提取。此外,由于在声学上将啸叫视为混响分量,因此还可以通过在第一实施例中抑制混响分量来抑制啸叫随时间的增加。
同时作为与混响抑制形成对比的技术,已经提出了在语音通信(如电话学)中进行声学回声消除或声学回声抑制来消除声学回声。不过,声学回声消除或声学回声抑制与混响抑制根本不同。例如,在声学回声消除中,使用例如自适应算法估计声音接收环境中的声学特性(房间脉冲响应),并在发射侧应用基于估计结果的滤波器,以从声音接收后的声音信号中减去声学回声,从而消除声学回声。此外在声学回声抑制中,使用诸如频谱减法方法来对上述作为预处理执行的声学回声消除中未被消除的声学回声进行抑制。另一方面,在第一实施例的混响抑制中,无需估计声音接收环境中的声学特性地来抑制混响分量。另外在声学回声消除或声学回声抑制中,除了反射声音在声学空间反射后到达声音接收点的延迟所导致的声学回声,还对从声音发生源直接到达声音接收点的延迟所导致的声学回声进行处理。也就是说,声学回声消除或声学回声抑制是针对从声音发生源到达声音接收点的声音整体执行的。另一方面,混响抑制是针对在声学空间反射后到达声音接收点的声音(尤其是后混响声音)执行的,但不针对直接从声音发生源到达声音接收点的声音执行处理。通过上述说明可以看出,第一实施例的混响抑制根本不同于公知的声学回声消除或声学回声抑制。
<第一实施例的变型例>
(1)尽管在上述说明中计算声音信号x(t)的乘方|X(k,m)|2的简单移动平均来作为第一指标值Q1(k,m)与第二指标值Q2(k,m),但计算第一指标值Q1(k,m)与第二指标值Q2(k,m)的方法不限于以上示例。例如下式(4A)和(4B)所示,还可以计算声音信号x(t)的乘方|X(k,m)|2的指数平均(指数移动平均)来作为第一指标值Q1(k,m)与第二指标值Q2(k,m)。
Q1(k,m)=α1·|X(k,m)|2+(1-α1)·Q1(k,m-1)…(4A)
Q2(k,m)=α2·|X(k,m)|2+(1-α2)·Q2(k,m-1)…(4B)
也即,第一平滑单元51和第二平滑单元52等同于有限脉冲响应(IIR)型低通滤波器。公式(4A)的符号α1和公式(4B)的符号α2是平滑系数(健忘(forgetfulness)系数)。具体来说,平滑系数α1表示针对过去的第一指标值Q1(k,m)的当前乘方|X(k,m)|2的权重,与,平滑系数α2表示针对过去的第二指标值Q2(k,m)的当前乘方|X(k,m)|2的权重。平滑系数α2设为低于平滑系数α1的值(α21)。按照与第一实施例相同的方式,第二平滑单元52执行平滑的时间常数为τ2平滑超过第一平滑单元51执行平滑的时间常数τ1(τ2>τ1)。即,相比第一指标值Q1(k,m),第二指标值Q2(k,m)以较低的跟随度跟随声音信号x(t)的乘方|X(k,m)|2。可以将平滑系数α1设为1。在这种情况下,声音信号x(t)的乘方|X(k,m)|2直接用作第一指标值Q1(k,m)。
(2)如下式(5A)和(5B)所示,还可以计算声音信号x(t)的乘方|X(k,m)|2的加权移动平均来作为第一指标值Q1(k,m)与第二指标值Q2(k,m)。公式(5A)的符号w1(i)和公式(5B)的符号w2(i)表示对第m个单位间隔之前的第i个单位间隔的加权值。第二周期大于第一周期(N2>N1)的条件与上述示例相同。
Q 1 ( k , m ) = 1 N 1 &Sigma; i = 0 N 1 - 1 w 1 ( I ) | X ( k , m - i ) | 2 . . . ( 5 A )
Q 2 ( k , m ) = 1 N 2 &Sigma; i = 0 N 2 w 2 ( i ) | X ( k , m - i ) | 2 . . . ( 5 B )
<第二实施例>
下面对本发明的第二实施例进行说明。同时,下文所例示的每个实施例的元素中在操作和功能上与第一实施例相同的那些将参照第一实施例的参考标号来表示,并将适当省略其具体描述。
图4是本发明第二实施例的分析处理单元34的框图。第二实施例的分析处理单元34包括指标值计算单元42B来代替第一实施例的分析处理单元34的指标值计算单元42A。指标值计算单元42B是顺序计算每单位间隔中的第一指标值Q1(k,m)和第二指标值Q2(k,m)的元件。指标值计算单元42B包括第一平滑单元51和第二平滑单元52。调节值计算单元44在构造和操作上与第一实施例相同。
按照与第一实施例相同的方式,第一平滑单元51对声音信号x(t)的乘方|X(k,m)|2的时间序列进行平滑,以顺序计算每单位间隔中的第一指标值Q1(k,m)。延迟单元54是用于将声音信号x(t)的频谱X(k,m)延迟等于d(d为自然数)个单位间隔的时间的存储电路。第二平滑单元52对延迟单元54延迟后的频谱X(k,m)的乘方|X(k,m)|2的时间序列进行平滑,以顺序计算每单位间隔中的第二指标值Q2(k,m)。然而在第二实施例中,第二平滑单元52执行平滑的时间常数τ2等于第一平滑单元51执行平滑的时间常数τ1(τ2=τ1)。因此,第二指标值Q2(k,m)的时间变化对应于延迟了d个单位间隔的第一指标值Q1(k,m)(Q2(k,m)=Q1(k,m))。
图5(B)是示出了将与图3(A)相同的房间脉冲响应(图5(A))提供给根据本发明第二实施例的声音处理装置100来作为声音信号x(t)的情况下的第一指标值Q1(k,m)和第二指标值Q2(k,m)的曲线图。
从图5(B)可以理解,第一指标值Q1(k,m)和第二指标值Q2(k,m)的时间变化模式(波形)是相同的,但是第二指标值Q2(k,m)的时间变化相比第一指标值Q1(k,m)的时间变化延迟d个单位间隔。即第二指标值Q2(k,m)相比于第一指标值Q1(k,m)以较低的跟随度跟随声音信号x(t)的乘方|X(k,m)|2。因此,按照与第一实施例相同的方式,第一指标值Q1(k,m)和第二指标值Q2(k,m)的等级在时间轴上的特点时间点tx处翻转。也即,在时间点tx之前的部分SA中,第一指标值Q1(k,m)超过第二指标值Q2(k,m),而在时间点tx之后的部分SB中,第二指标值Q2(k,m)超过第一指标值Q1(k,m)。
通过比值计算单元62执行的比值R(k,m)的计算(公式(2))和通过阈值处理单元64执行的调节值Gs(k,m)的计算(公式(3))与第一实施例相同。因此如图5(C)所示,调节值Gs(k,m)在存在直接声音和初始反射声音的部分SA中被设为预定值Gmax,并且在存在后混响声音的部分SB中随时间降低至预定值Gmin。混响调节单元36将如前文所述的调节值Gs(k,m)应用于声音信号x(t)以生成声音信号y s(t),在声音信号ys(t)中混响分量得到抑制。
第二实施例实现了与第一实施例相同的效果。同时,通过图5(C)和图3(C)的比较能够理解,第二实施例的调节值Gs(k,m)在部分SB(SB1)中相比第一实施例的调节值Gs(k,m)更陡峭地降低。因此根据第二实施例,能够相比第一实施例更加强化混响分量的抑制效果。另一方面,在第一实施例中不需要图4的延迟单元54,因此可以简化声音处理装置100的构造。
<第二实施例的变型例>
(1)尽管在第二实施例中通过延迟单元54来延迟声音信号x(t)的频谱X(k,m),但还可以采用将延迟单元54布置在第二平滑单元52的后级,以使得通过第二平滑单元52计算的第二指标值Q2(k,m)被延迟单元54延迟的结构。
(2)如图6所示,还可以省去图4的第二平滑单元52。图6的指标值计算单元42B包括第一平滑单元51和延迟单元54。延迟单元54将通过第一平滑单元51计算的第一指标值Q1(k,m)延迟d个单位间隔,以计算第二指标值Q2(k,m)(Q2(k,m)=Q1(k,m-d))。
(3)对第一平滑单元51和第二平滑单元52执行的操作方式进行适当改变。例如,可以通过公式(4A)和公式(4B)的指数平均的运算或者公式(5A)和公式(5B)的加权移动平均的运算来计算第一指标值Q1(k,m)和第二指标值Q2(k,m)。
(4)第一平滑单元51执行平滑的时间常数τ1可以与第二平滑单元52执行平滑的时间常数τ2不同。例如在与第一实施例相同的时间常数τ2超过时间常数τ1的情况下,与时间常数τ1等于时间常数τ2的情况相比,可以降低通过延迟单元54延迟的时间。
<第三实施例>
图7是根据本发明第三实施例的声音处理装置100的框图。如图7所示,第三实施例的输入声音信号x(t)是包括左声道声音信号xL(t)和右声道声音信号xR(t)的立体声信号。声音处理装置100生成抑制了声音信号xL(t)的混响分量的输出左声道声音信号ysL(t)和抑制了声音信号xR(t)的混响分量的输出右声道声音信号ysR(t)。
图7的频率分析单元32生成每单位间隔中的声音信号xL(t)的频谱XL(k,m)和声音信号xR(t)的频谱XR(k,m)。图7的分析处理单元34计算与每单位间隔中的频谱XL(k,m)和频谱XR(k,m)对应的调节值Gs(k,m)。混响调节单元36将调节值Gs(k,m)应用于声音信号xL(t)和声音信号xR(t)。具体来说,混响调节单元36将声音信号xL(t)的频谱XL(k,m)乘以调节值Gs(k,m)以计算声音信号ysL(t)的频谱YsL(k,m)(YsL(k,m)=Gs(k,m)XL(k,m))。此外,混响调节单元36将声音信号xR(t)的频谱XR(k,m)乘以调节值Gs(k,m)以计算声音信号ysR(t)的频谱YsR(k,m)(YsR(k,m)=Gs(k,m)XR(k,m))。波形合成单元38根据每单位间隔的频谱YsL(k,m)来生成声音信号ysL(t)。此外,波形合成单元38根据每单位间隔的频谱YsR(k,m)来生成声音信号ysR(t)。
图8是本发明第三实施例中的分析处理单元34的框图。第三实施例的分析处理单元34包括指标值计算单元42C来代替第一实施例的分析处理单元34的指标值计算单元42A。调节值计算单元44在构造和操作上与第一实施例的调节值计算单元相同。
如图8所示,第三实施例的标值计算单元42C包括互相关计算单元56、自相关计算单元57、第一平滑单元51和第二平滑单元52。互相关计算单元56针对每单位间隔中的每个频率计算声音信号xL(t)的频谱XL(k,m)与声音信号xR(t)的频谱XR(k,m)之间(左右声道之间的)的空间互相关Cc(k,m)。另一方面,自相关计算单元57计算声音信号xL(t)的频谱XL(k,m)与声音信号xR(t)的频谱XR(k,m)之间的空间自相关的加和值Ca(k,m)。具体来说,空间互相关Cc(k,m)由下式(6A)表示,空间自相关(声道之间的和)Ca(k,m)由下式(6B)表示。公式(6A)的符号*表示复共轭。从公式(6B)可以理解,空间自相关Ca(k,m)是左、右声道的乘方|XL(k,m)|2与|XR(k,m)|2的总和。
C c ( k , m ) = X L ( k , m ) X R * ( k , m ) . . . ( 6 A )
Ca(k,m)=|XL(k,m)|2+|XR(k,m)|2…(6B)
图8的第一平滑单元51平滑通过互相关计算单元56计算的空间互相关Cc(k,m)的时间序列,以顺序计算每单位间隔中的每个频率的第一指标值Q1(k,m)。按照相同的方式,第二平滑52平滑通过自相关计算单元57计算的空间自相关Ca(k,m)的时间序列,以顺序计算每单位间隔中的每个频率的第二指标值Q2(k,m)。按照与第一实施例相同的方式,第二平滑单元52执行平滑的时间常数τ2大于第一平滑单元51执行平滑的时间常数τ1(τ2>τ1)。调节值计算单元44在构造和操作上与第一实施例的调节值计算单元相同。调节值计算单元44计算与第一指标值Q1(k,m)和第二指标值Q2(k,m)对应的调节值Gs(k,m)。
图9是示出了在提供房间脉冲响应作为声音信号x(t)(xL(t),xR(t))的情况下,空间互相关Cc(k,m)和空间自相关Ca(k,m)的时间变化的典型视图。直接声音或者初始反射声音以清晰的指向性到达声音接收点,但是在不同方向到达达声音接收点的后混响声音具有不清晰的指向性。因此,左声道声音信号xL(t)和右声道声音信号xR(t)之间的相关性(空间相关性)可能由于上述指向性的降低而降低混响分量的后部分。即,空间互相关Cc(k,m)由于声音信号x(t)的功率衰减以及指向性的降低而随时间降低。另一方面,空间自相关Ca(k,m)随时间的降低仅由于声音信号x(t)的功率衰减引起。如从图9可以看出,由于上述差别,空间互相关Cc(k,m)比空间自相关Ca(k,m)更陡峭地降低。
因此在第三实施例中,与第一实施例中通过平滑共同的乘方|X(k,m)|2来计算第一指标值Q1(k,m)和第二指标值Q2(k,m)相比,在具有后混响声音的部分SB中第一指标值Q1(k,m)比第二指标值Q2(k,m)更陡峭地降低。即在第一实施例中,第一指标值Q1(k,m)和第二指标值Q2(k,m)按照与时间常数τ1和时间常数τ2相同的情况下相同的方式变化。然而在第三实施例中,即使在时间常数τ1和时间常数τ2相同的情况下,第一指标值Q1(k,m)也将比第二指标值Q2(k,m)更陡峭地变化。从上述说明可以理解,根据第三实施例,与第一实施例相比,调节值Gs(k,m)在部分SB中更陡峭地降低。因此能够相比第一实施例更加强化混响分量的抑制效果。
尽管在上述说明中以声音信号xL(t)和声音信号xR(t)的空间自相关(乘方)的总和来作为空间自相关Ca(k,m),但自相关计算单元57还可以计算声音信号xL(t)或声音信号xR(t)的空间自相关来作为空间自相关Ca(k,m)。即,自相关计算单元57被包括作为计算声音信号xL(t)和/或声音信号xR(t)的空间自相关Ca(k,m)的元件。
<第四实施例>
图10是根据本发明第四实施例的声音处理装置100的框图。如图10所示,根据第四实施例的声音处理装置100生成抑制了输入声音信号x(t)的混响分量的输出声音信号ys(t)以及增强了输入声音信号x(t)的混响分量的另一输出声音信号ye(t)。
第四实施例的分析处理单元34(调节值计算单元44)针对每单位间隔中的每个频率顺序计算与第一指标值Q1(k,m)和第二指标值Q2(k,m)对应的调节值Gs(k,m)和调节值Ge(k,m)。计算用于混响抑制的调节值Gs(k,m)的方法与第一实施例相同。调节值Ge(k,m)是增强(提取)声音信号x(t)的混响分量的变量。
总体而言,调节值计算单元44计算调节值Ge(k,m),使得混响分量(后混响声音)在第m单位间隔的声音信号x(t)的第k频率分量中占比越大,则调节值Ge(k,m)越大。具体来说,调节值计算单元44(阈值处理单元64)从预定值(下面的示例中为1)减去通过公式(3)计算的用于混响抑制的调节值Gs(k,m),以计算用于混响增强的调节值Ge(k,m)(Ge(k,m)=1-Gs(k,m))。因此,调节值Ge(k,m)在存在直接声音或者初始反射声音的部分SA中保持为零,而在存在后混响声音的部分SB中随时间增加至预定值1-Gmin。即,第一指标值Q1(k,m)超过第二指标值Q2(k,m)(部分SA中)的情况下的第一调节值Ge(k,m)小于低于大于第一指标值Q1(k,m)第二指标值Q2(k,m)(部分SB中)的情况下的第二调节值Ge(k,m)。指标值计算单元42A在构造和操作上与第一实施例的指标值计算单元相同。
混响调节单元36将调节值Ge(k,m)和调节值Gs(k,m)应用于声音信号x(t)(频谱X(k,m))。具体来说,按照与第一实施例相同的方式,混响调节单元36将声音信号x(t)的频谱X(k,m)乘以调节值Gs(k,m)以计算频谱Ys(k,m)。此外混响调节单元36将声音信号x(t)的频谱X(k,m)乘以调节值Ge(k,m)来计算频谱Ye(k,m)(Ye(k,m)=Ge(k,m)X(k,m))。波形合成单元38根据频谱Ys(k,m)生成声音信号ys(t)。此外,波形合成单元38根据频谱Ye(k,m)生成声音信号ye(t)。由于相比存在后混响声音的部分SB将存在直接声音和初始反射声音的部分SA中的调节值Gs(k,m)设为较低的值(零),因此生成了其中增强了声音信号x(t)的混响分量的声音信号ye(t)(其中抑制了直接声音和初始反射声音)。即将声音信号x(t)分成混响分量得到抑制的声音信号ys(t)以及混响分量得到增强的声音信号ye(t)。根据例如用户指令将声音信号ys(t)和声音信号ye(t)选择性地提供给发声装置14。
第四实施例实现了与第一实施例相同的效果。此外在第四实施例中,基于根据声音信号x(t)的时间变化的第一指标值Q1(k,m)和第二指标值Q2(k,m)来生成用于混响增强的调节值Ge(k,m)。因此能够通过简单处理增强(提取)声音信号x(t)的混响分量,而不必执行例如混响分量估计的复杂处理。
尽管在上述示例中对声音信号ys(t)和声音信号ye(t)选择性地进行再现,但使用声音信号ys(t)和声音信号ye(t)的方法不限于上述示例。例如在围绕听众布置多个扬声器的环绕系统中,针对左声道声音信号xL(t)和右声道声音信号xR(t)来生成声音信号ys(t)和声音信号ye(t)。通过左侧扬声器来再现左声道声音信号ys(t),并通过左后扬声器来再现左声道声音信号ye(t)。按照相同的方式,通过右侧扬声器来再现右声道声音信号ys(t),并通过右后扬声器来再现右声道声音信号ye(t)。根据上述构造,能够根据两个左声道声音信号x(t)和两个右声道声音信号x(t)生成四声道环绕信号,以形成具有高度真实性的声场。此外在将不同的声音效果应用于声音信号ys(t)和声音信号ye(t)、然后混合声音信号ys(t)和声音信号ye(t)的情况下,能够实现各种声音效果。
在上述说明中尽管例示了生成声音信号ys(t)和声音信号ye(t)的构造,但还可以仅生成增强了混响分量的声音信号ye(t)。即,分析处理单元34计算每单位间隔的用于混响分量增强的调节值Ge(k,m),并且混响调节单元36将调节值Ge(k,m)应用于声音信号x(t)的频谱X(k,m),以生成混响分量得到增强的声音信号ye(t)的频谱Ye(k,m)。此外,第四实施例的计算调节值Ge(k,m)以及将调节值Ge(k,m)应用于声音信号x(t)的构造可以按照相同的方式应用于第二实施例和第三实施例。
<第五实施例>
图11是根据本发明第五实施例的声音处理装置100的框图。第五实施例的声音处理装置100通过将延迟单元35添加至第一实施例的声音处理装置100来构造。延迟单元35是将频率分析单元32生成的频谱X(k,m)延迟等于δ个单位间隔的时间的存储电路。分析处理单元34在构造上与第一实施例的分析处理单元相同。
在从分析处理单元34向混响调节单元36传递(direct)第m个单位间隔的调节值Gs(k,m)的时间点,从延迟单元35向混响调节单元36传递处在第m个单位间隔之前δ个单位间隔的单位间隔(第(m-δ)个单位间隔)的频谱X(k,m-δ)。混响调节单元36将调节值Gs(k,m)乘以声音信号x(t)的频谱X(k,m-δ)以生成频谱Ys(k,m-δ)。第五实施例实现与第一实施例相同的效果。同时,第五实施例的延迟声音信号x(t)的构造可以按照相同的方式应用于第二实施例、第三实施例和第四实施例。
在第一平滑单元51的时间常数τ1和第二平滑单元52的时间常数τ2较长的情况下,第一指标值Q1(k,m)和第二指标值Q2(k,m)平缓改变,因此调节值Gs(k,m)的时间变化可以相对声音信号x(t)延迟。因此,在将每个单位间隔的调节值Gs(k,m)应用于该单位间隔的声音信号x(t)(频谱X(k,m))的构造中,混响分量可能不会被充分调节(抑制或增强)。在第五实施例中,将每个单位间隔的调节值Gs(k,m)应用于过去单位间隔的声音信号x(t)(频谱X(k,m-δ)),因此即使在时间常数τ1和时间常数τ2较长的情况下,也能够充分调节混响分量。同时还可以采用相同的构造来生成第四实施例中的声音信号ye(t)。
<第六实施例>
图12是根据本发明第六实施例的声音处理装置100的框图。根据本发明第六实施例的声音处理装置100配置为将频带分割单元72添加到与第一实施例的元件(频率分析单元32、分析处理单元34A、混响调节单元36和波形合成单元38)类似的元件中。频带分割单元72将从信号供应装置12提供的声音信号x(t)分割成与不同频带对应的B个时域频带分量Z1(t)至ZB(t)(后文中称为“分割频带”)。第b(b=1至B)个频带分量Zb(t)是在频率轴上划定的B个分割频带中的第b个分割频带的时域声音分量。具体来说,优选使用由B个具有不同通带的带通滤波器(如FIR型或IIR型滤波器)构成的滤波器作为频带分割单元72。每个分割频带包含多个频率(分页,bin),并针对每个频率计算调节值Gs(k,m)。例如,每个分割频带的带宽设置为约数百Hz。同时,如果分割频带的数量过小,则混响分量的抑制效果降低。另一方面,如果分割频带的数量太大,则运算量会增大。例如在声音信号x(t)的采样频率为44.1kHz的情况下,分割频带的总数优选设为大约数十个。频率轴上的相邻分割频带可以部分重叠。此外,每个分割频带的带宽可以不同。
按照与第一实施例相同的方式,图12的频率分析单元32针对每个单位间隔顺序生成声音信号x(t)的频谱X(k,m)。同时,每个单位间隔的持续时间优选为约数十毫秒。针对每个单位间隔中的每个分割频带,分析处理单元34A根据频率分析单元32生成的频谱X(k,m)顺序生成调节值Gs(b,m)(Gs(1,m)至Gs(B,m))。
如图13所示,第六实施例的分析处理单元34A配置为将调节处理单元46添加到第一实施例中例示的分析处理单元34的元件(指标值计算单元42A和调节值计算单元44)中。按照与第一实施例相同的方式,指标值计算单元42A和调节值计算单元44基于第一指标值Q1(k,m)和第二指标值Q2(k,m)顺序生成与频率分析单元32在每个单位间隔中生成的频谱X(k,m)相对应的调节值Gs(k,m)。具体来说,指标值计算单元42A使用不同的时间常数计算第一指标值Q1(k,m)和第二指标值Q2(k,m)来平滑声音信号x(t)的频谱X(k,m)的每个频率的乘方|X(k,m)|2,调节值计算单元44基于指标值计算单元42A计算的第一指标值Q1(k,m)和第二指标值Q2(k,m),针对每单位间隔中的每个频率顺序计算调节值Gs(k,m)。
图13的调节处理单元46根据调节值计算单元44在每个频率处计算的调节值Gs(k,m)来生成每个分割频带的调节值Gs(b,m)。具体来说,计算与第b个分割频带中的每个频率对应的调节值Gs(k,m)的代表值(通常为平均值)来作为调节值Gs(b,m)。同时,还可以计算第b个分割频带中每个频率的调节值Gs(k,m)的加权和来作为调节值Gs(b,m)。例如,优选将每个调节值Gs(k,m)的加权和作为第b个分割频带的调节值Gs(b,m),其中使用第b个分割频带中一个频率的幅度|X(k,m)|与该分割频带中每个频率的幅度|X(k,m)|的总和∑|X(k,m)|的相对比值(|X(k,m)|/∑|X(k,m)|)来作为加权值。
混响调节单元36将通过分析处理单元34A(调节处理单元46)生成的调节值Gs(b,m)顺序应用于频带分割单元72在每个单位间隔生成的各个频带分量Z1(t)至ZB(t)。具体来说,混响调节单元36执行在每个分割频带将频带分量Zb(t)乘以调节值Gs(b,m)的幅度调节处理。频带分量Zb(t)的混响分量通过乘以调节值Gs(b,m)得到抑制。波形合成单元38对经过混响调节单元36执行调节之后(混响分量抑制之后)的B个频带分量Gs(b,m)Zb(t)(Gs(1,m)Z1(t)至Gs(B,m)ZB(t))进行合成(例如,相加)以生成声音信号ys(t)。
通过上述说明可以理解,根据第六实施例,声音信号x(t)的频谱X(k,m)是用于计算调节值Gs(b,m),而不是直接应用于生成声音信号ys(t)(时域倍增)。因此根据第六实施例,不必要求计算其每个频谱X(k,m)的单位间隔在时间轴上彼此重叠。
图14是例示了任意频带分量Zb(t)和调节值Gs(b,m)之间的基于时间关系的示图。由于需要声音信号x(t)的第m个单位间隔的全部样本来计算任意频谱X(k,m),因此通过频率分析单元32执行的频谱X(k,m)的计算相比声音信号x(t)延迟一个单位间隔。因此,与第m个单位间隔对应的调节值Gs(b,m)可以用于在相比第m个单位间隔的开始点q(m)延迟两个单位间隔的时间点p(m)调节频带分量Zb(t)。另一方面,频带分割单元72在时域中生成每个频带分量Zb(t),因此不会在每个频带分量Zb(t)出现延迟。因此在第六实施例的的混响调节单元36中,将与第m个单位间隔对应的调节值Gs(b,m)应用于频带分量Zb(t)的第(m+2)个单位间隔。在调节值Gs(b,m)的计算未开始的阶段(例如在声音信号x(t)的第一和第二单位间隔中),将预定值(例如1)用作调节值Gs(b,m)。
在图15中,示出了声音信号x(t)的声谱P1、经过根据第六实施例的声音处理装置执行混响抑制之后的声音信号ys(t)的声谱P2及其差值(P2-P1)。差值(P2-P1)意味着显示层次越低,则该值(即通过声音处理装置执行处理抑制的混响分量)越小。通过频谱P1和频谱P2之间的比较或差值(P2-P1)可以看出,根据第六实施例,能够有效抑制声音信号x(t)的混响分量,而不需考虑调节值Gs(b,m)相对频带分量Zb(t)延迟的构造。
第六实施例还实现了与第一实施例相同的效果。此外在第六实施例中,通过频带分割单元72(滤波器组)将声音信号x(t)分成B个频带分量Z1(t)至ZB(t),并使用调节值Gs(b,m)进行处理。与将调节值Gs(k,m)应用于通过频率分析单元32生成的频谱X(k,m)的第一实施例相比,第六实施例具有能够抑制声音信号ys(t)相对声音信号x(t)的延迟的效果。例如,假设在对同时记录的声音信号x(t)和视频信号进行再现的情景(例如在远程会议系统的通信终端之间发送和接收声音信号x(t)和视频信号的情景)时,如果混响抑制之后的声音信号ys(t)相对声音信号x(t)延迟,则声音信号ys(t)和视频信号可能无法彼此精确同步。根据第六实施例,声音信号ys(t)相对声音信号x(t)的延迟被抑制,因此能够精确同步声音信号ys(t)和视频信号。
同时,在如前文例示的将不同的调节值Gs(b,m)应用于频带分量Zb(t)的每个单位间隔的构造中,通过混响调节单元36执行调节之后的频带分量Gs(b,m)Zb(t)的音量会在各个单位间隔之间的每个交界处不连续地改变,导致声音信号ys(t)的再现声音不自然。为此,在前后排列的各个单位间隔中进行调节值Gs(b,m)的平滑过渡的构造是优选的。例如,调节处理单元46随时间增加任意单位间隔的调节值Gs(b,m),另外随时间降低前一单位间隔的调节值Gs(b,m-1),将增加的调节值Gs(b,m)与降低的调节值Gs(b,m-1)相加并将所得值应用于频带分量Zb(t)。根据上述构造,可以抑制频带分量Gs(b,m)Zb(t)在音量上的不连续变化,因此可以生成再现声音自然的声音信号ys(t)。尽管在上述说明中例示了基于第一实施例的构造,但第二至第五实施例的构造也可以应用于第六实施例。
<第七实施例>
在声音信号x(t)的混响时间较长的情况下,第一指标值Q1(k,m)相比第二指标值Q2(k,m)在后一个混响周期改变,因此比值R(k,m)(调节值Gs(k,m))不稳定。于是,声音信号y s(t)的音量可能会波动,使得再现声音的声音质量降低。根据第七实施例,考虑到上述趋向,对声音信号ys(t)的音量在后一混响周期的波动进行抑制。
第七实施例的调节值计算单元44在对后一混响周期中的单位间隔以及后一混响周期之外的单位间隔进行区分的同时计算每个单位间隔的调节值Gs(k,m),以抑制声音信号ys(t)的音量在后一混响周期的波动。具体来说,调节值计算单元44计算声音信号x(t)的每个单位间隔的调节值Gs(k,m),使得在单位间隔属于后一混响周期的情况下的调节值Gs(k,m)小于单位间隔不属于后一混响周期的情况下的调节值Gs(k,m)(即,通过前一调节值Gs(k,m)获得的混响分量的第一抑制效果超过通过后一调节值Gs(k,m)获得的混响分量的第二抑制效果)。图16是示出了通过第七实施例的调节值计算单元44执行的处理的流程图。
如图16所示,调节值计算单元44通过公式(2)和公式(3)的运算来计算每个单位间隔的调节值Gs(k,m)(ST1),以判定每个单位间隔是否属于声音信号x(t)的后一混响周期(ST2)。具体来说,考虑到第一指标值Q1(k,m)在后一混响周期低至一个较小值的趋向,调节值计算单元44将第一阈值Q1(k,m)与预定阈值QTH进行比较,以确定该单位间隔是否对应于后一混响周期。即,在第一阈值Q1(k,m)超过阈值QTH(Q1(k,m)≥QTH)的情况下,判定该单位间隔不对应于后一混响周期(对应于初始反射周期)。另一方面,在第一阈值Q1(k,m)小于阈值QTH(Q1(k,m)<QTH)的情况下,判定该单位间隔属于后一混响周期。
调节值计算单元44基于步骤ST2的判定结果对在步骤ST1计算的调节值Gs(k,m)进行校正。具体来说,调节值计算单元44将不属于后一混响周期的单位间隔(Q1(k,m)≥QTH)的调节值Gs(k,m)固定为通过公式(3)计算的值(公式(7A)),该调节值Gs(k,m)从针对判定为属于后一混响周期的单位间隔(Q1(k,m)<QTH)通过公式(3)计算的值开始降低(公式(7B))。具体来说,调节值计算单元44将在后一混响周期中的每个单位间隔中通过公式(3)计算的调节值Gs(k,m)乘以系数γ。系数γ是小于1的正数(0<γ<1)。因此,在声音信号ys(t)对应于声音信号x(t)的后一混响周期的部分音量降低,从而听众不会感觉到再现声音的音质降低。
第七实施例实现了与第一实施例相同的效果。此外根据第七实施例,降低了声音信号ys(t)在后一混响周期的音量,因此即使在后也能够抑制声音信号y s(t)的再现声音的音质降低。同时,第二至第六实施例的构造可以应用于第七实施例。
<第七实施例的变型例>
(1)判定每个单位间隔是否属于后一混响周期的构造或方法是可选的。例如,还可以在判定单位间隔是否属于后一混响周期时,使用以处在第一指标值Q1(k,m)和第二指标值Q2(k,m)之间的跟随度跟随声音信号x(t)的乘方|X(k,m)|2的第三指标值Q3(k,m)。
在使用上述公式(1A)和公式(1B)计算第一指标值Q1(k,m)和第二指标值Q2(k,m)的构造中,指标值计算单元42A通过例如下式(1C)的运算来计算第三指标值Q3(k,m)。用于计算第三指标值Q3(k,m)的单位间隔的数量N3设为处在计算(公式(1A))第一指标值Q1(k,m)的单位间隔的数量N1和计算(公式(1B))第二指标值Q2(k,m)的单位间隔的数量N2之间(N1<N3<N2)。因此,第三指标值Q3(k,m)以处在第一指标值Q1(k,m)的时间常数τ1和第二指标值Q2(k,m)的时间常数τ2之间的时间常数τ3(τ1<τ3<τ2)来跟随声音信号x(t)的乘方|X(k,m)|2。同时还可以使用公式(5A)和公式(5B)的相同的加权移动平均来计算第三指标值Q3(k,m)。
Q 3 ( k , m ) = 1 N 3 &Sigma; i = 0 N 3 - 1 | X ( k , m - i ) | 2 . . . ( 1 C )
此外在使用上述公式(1A)和公式(1B)计算第一指标值Q1(k,m)和第二指标值Q2(k,m)的构造中,通过例如下式(4C)来计算第三指标值Q3(k,m)。用于计算第三指标值Q3(k,m)的平滑系数α3设为处在计算第一指标值Q1(k,m)的平滑系数α1(公式(4A))和计算第二指标值Q2(k,m)的平滑系数α2(公式(4B))之间(α231)。因此,第三指标值Q3(k,m)以处在第一指标值Q1(k,m)的时间常数τ1和第二指标值Q2(k,m)的时间常数τ2之间的时间常数τ3(τ1<τ3<τ2)来跟随声音信号x(t)的乘方|X(k,m)|2
Q3(k,m)=α3·|X(k,m)|2+(1-α3)·Q3(k,m-1)…(4C)
如上所述,第三指标值Q3(k,m)以处在第一指标值Q1(k,m)和第二指标值Q2(k,m)之间的跟随度跟随声音信号x(t)的乘方|X(k,m)|2。因此在后一混响周期的每个单位间隔中,期望第三指标值Q3(k,m)超过第一指标值Q1(k,m)(Q3(k,m)>Q1(k,m))。考虑到上述趋向,调节值计算单元44将第三指标值Q3(k,m)与第一指标值Q1(k,m)进行比较以判定该单位间隔是否对应于后一混响周期(图16的步骤ST2)。具体来说,在第三指标值Q3(k,m)低于第一指标值Q1(k,m)(Q3(k,m)≤Q1(k,m))的情况下,判定单位间隔不属于后一混响周期。另一方面,在第三指标值Q3(k,m)超过第一指标值Q1(k,m)(Q3(k,m)>Q1(k,m))的情况下,判定单位间隔对应于后一混响周期。按照与上述实施例相同的方式,将处在后一混响周期之外的单位间隔(Q3(k,m)≤Q1(k,m))的调节值Gs(k,m)固定为通过公式(3)计算的值(公式(7A)),并针对后一混响周期中的单位间隔(Q3(k,m)>Q1(k,m))基于系数γ校正调节值Gs(k,m)(公式(7B))。
(2)降低后一混响周期中每个单位间隔的调节值Gs(k,m)的构造或方法不限于上述示例。例如,在上述使用公式(1C)和公式(4C)计算第三指标值Q3(k,m)的构造中,还可以使用如下所示的公式(8A)和公式(8B)来计算每个单位间隔的调节值Gs(k,m)。同时,在使用公式(8A)和公式(8B)计算调节值Gs(k,m)的情况下,省略了通过公式(2)执行的比值R(k,m)的计算。
公式(8A)和公式(8B)中的符号min{A,B}表示选择值A和值B中的最小值的运算符。通过公式(8A)和公式(8B)可以理解,按照与第一实施例相同的方式针对处在后一混响周期之外的每个单位间隔计算调节值Gs(k,m),并且针对后一混响周期中的每个单位间隔计算小于比值R(k,m)的调节值Gs(k,m)。同时,还可以利用公式(8C)代替公式(8B)(其中公式(8B)的分母相乘变成相加)。
min { Q 1 ( k , m ) Q 2 ( k , m ) + Q 3 ( k , m ) , 1.0 } . . . ( 8 C )
(3)尽管在上述示例中根据与处在后一混响周期之外的每个单位间隔的调节值Gs(k,m)的比较来降低后一混响周期中的每个单位间隔的调节值Gs(k,m),但抑制声音信号ys(t)的音量在后一混响周期中的波动的构造不限于此。例如,可以采用使用上述方法来判定每个单位间隔是否属于后一混响周期,并且在时域中降低通过波形合成单元38生成的声音信号ys(t)的后一混响周期的单位间隔的音量的构造,或者在频域中降低通过混响调节单元36执行调节之后的频谱Ys(k,m)在后一混响周期中的频谱Ys(k,m)的音量的构造。调节值Gs(k,m)的计算与第一实施例相同。
<变型例>
上述各个实施例可以进行各种变型。具体变型例将在下文给出示例。从后文的示例中任意选择的两种或两种以上变型例可以适当组合。
(1)尽管在上述各实施例中通过第一平滑单元51执行平滑的时间常数τ1和通过第二平滑单元52执行平滑的时间常数τ2在多个频率上相同,但还可以在每个频率(每个频带)分别设置时间常数τ1和时间常数τ2。
通过公式(2)和公式(3)可以理解,在第二指标值Q2(k,m)超过第一指标值Q1(k,m)的部分SB中,第一指标值Q1(k,m)和第二指标值Q2(k,m)之差(时间常数τ1和时间常数τ2之差)越大,则调节值Gs(k,m)越小,因此混响分量的抑制效果提高。另一方面,混响分量在低频范围比在高频范围显著。因此,尽量增加低频带侧的频率的时间常数τ1和时间常数τ2之差的构造(尽可能快速降低低频带侧的频率的调节值Gs(k,m)的构造)是优选的。例如,在关注频率轴上的第k1频率f(k1)和超过频率f(k1)的频率f(k2)的衰减的情况下,对应于f(k1)的时间常数τ1(k1)和时间常数τ2(k1)之差超过对应于f(k2)的时间常数τ1(k2)和时间常数τ2(k2)之差。
(2)还可以随时间改变时间常数τ1、时间常数τ2或者二者。例如,由于存在时间常数τ1和时间常数τ2之差越大(时间常数τ2大于时间常数τ1)则调节值Gs(k,m)降低越快的趋向,如前文所述,因此相比时间常数τ1增加时间常数τ2的构造是优选的。在上述构造中,加速了调节值Gs(k,m)的降低。例如,即使在混响分量的时间长度足够长的情况下,也可以有效抑制混响分量。同时,时间常数τ1和时间常数τ2在例如声音信号x(t)的声音抬升的时间点(例如调节值Gs(k,m)从降低到提高的翻转时间点)被初始化。
(3)基于第一指标值Q1(k,m)和第二指标值Q2(k,m)计算调节值Gs(k,m)和调节值Ge(k,m)的方法是可选的。例如,可以采样通过将第一指标值Q1(k,m)和第二指标值Q2(k,m)作为变量的预定运算以及将比值R(k,m)作为变量的预定运算来计算调节值Gs(k,m)和调节值Ge(k,m)的构造。此外尽管在上述各个实施例中基于第一指标值Q1(k,m)与第二指标值Q2(k,m)的比值R(k,m)来计算调节值Ge(k,m),但也可以在例如将第二指标值Q2(k,m)与第一指标值Q1(k,m)的比值R(k,m)应用于公式(3)的运算的情况下,按照与第四实施例相同的方式计算用于混响增强的调节值Ge(k,m)。
通过上述说明能够理解,调节值计算单元44被包括作为基于第一指标值Q1(k,m)和第二指标值Q2(k,m)计算调节值Gs(k,m)和Ge(k,m),以便调节(抑制或增强)声音信号x(t)的混响分量的元件。例如,在抑制混响分量的构造中,计算调节值Gs(k,m),使得相比第一指标值Q1(k,m)超过第二指标值Q2(k,m)的情况(部分SA),在第一指标值Q1(k,m)低于第二指标值Q2(k,m)(部分SB)的情况下抑制声音信号x(t)。另一方面,在增强混响分量的构造中,计算调节值Ge(k,m),使得相比第一指标值Q1(k,m)低于第二指标值Q2(k,m)(部分SB)的情况,在第一指标值Q1(k,m)超过第二指标值Q2(k,m)的情况(部分SA)的情况下抑制声音信号x(t)。
(4)尽管在上述各个实施例中,对声音信号x(t)的乘方|X(k,m)|2的时间序列进行平滑以计算第一指标值Q1(k,m)和第二指标值Q2(k,m),但第一平滑单元51或第二平滑单元52不仅仅平滑乘方|X(k,m)|2。例如可以采样对声音信号x(t)的幅度|X(k,m)|或者幅度的四次方|X(k,m)|4进行平滑的构造来计算第一指标值Q1(k,m)或第二指标值Q2(k,m)。即上述每个实施例的第一平滑单元51或第二平滑单元52被包括作为对声音信号x(t)的信号强度的时间序列进行平滑的元件,该信号强度除了声音信号x(t)的乘方|X(k,m)|2还包括幅度|X(k,m)|或者幅度的四次方|X(k,m)|4。此外,尽管在上述各个实施例中将调节值Gs(k,m)或调节值Ge(k,m)应用于声音信号x(t)的频谱X(k,m),但还可以将调节值Gs(k,m)或调节值Ge(k,m)应用于例如声音信号x(t)的乘方|X(k,m)|2
(5)尽管在上述各个实施例中例示了调节(抑制或增强)混响分量的构造,但还可以将本发明应用于调节随时间衰减的任意声音分量(下文中称作“衰减分量”)。除了上述各个实施例所示的混响分量,该衰减分量可以包括例如通过乐器演奏的声音的分量(谐振分量)。具体来说,还可以按照与上述各个实施例相同的方式,将本发明应用于调节通过诸如钢琴的键盘乐器的发声板生成的谐振分量,或者弦乐器(如小提琴)的谐振分量(体混响或盒混响)。通过上述说明能够理解,本申请说明书中描述的“混响分量”是指随着时间衰减的分量“衰减分量”。

Claims (19)

1.一种声音处理装置,用于处理声音信号,所述声音处理装置包括:
指标值计算单元,其配置为计算第一指标值和第二指标值,所述第一指标值以第一跟随度跟随声音信号的变化,所述第二指标值以低于第一跟随度的第二跟随度跟随声音信号的变化;
调节值计算单元,其配置为基于所述第一指标值和所述第二指标值之差计算能够有效调节声音信号的混响分量的调节值;和
混响调节单元,其配置为通过将声音信号的频谱或功率密度乘以所述调节值来将所述调节值应用于声音信号;
其中,所述跟随度表示指标值跟随声音信号的功率密度的时间变化的变化率。
2.根据权利要求1的声音处理装置,还包括:
频带分割单元,其配置为在时域将声音信号分割成对应于多个频带的多个频带分量;
频率分析单元,其配置为连续计算声音信号的频谱;和
调节处理单元,其配置为根据所述调节值计算单元计算的调节值来计算与所述多个频带对应的多个调节值,其中
所述指标值计算单元配置为在所述声音信号的频谱的每个频率计算与声音信号的幅度的时间序列相对应的第一指标值和第二指标值,
所述调节值计算单元配置为基于与所述频谱的每个频率相对应的第一指标值和第二指标值来计算针对所述频谱的每个频率的调节值,并且
所述混响调节单元配置为将所述多个调节值应用于所述声音信号的多个相应频带分量。
3.根据权利要求1或2的声音处理装置,其中
所述调节值计算单元配置为在第一指标值超过第二指标值的情况下计算第一调节值,并且配置为在第一指标值低于第二指标值的情况下计算第二调节值,并且
所述混响调节单元配置为将第二调节值应用于所述声音信号,从而相比混响调节单元将第一调节值应用于所述声音信号的情况对声音信号做出更大的抑制。
4.根据权利要求1或2的声音处理装置,其中所述调节值计算单元包括:
比值计算单元,其配置为计算第一指标值与第二指标值的比值;和
阈值处理单元,其配置为在所述比值超过预定值的情况下将所述调节值设置为所述预定值,并且配置为在所述比值低于所述预定值的情况下将所述调节值设置为所述比值。
5.根据权利要求1或2的声音处理装置,其中
所述混响调节单元配置为将所述调节值应用于所述声音信号,以使得所述声音信号中包含后一个混响周期,其中
所述调节值计算单元配置为顺序计算与声音信号的各单位间隔的时间序列相对应的调节值的时间序列,从而在相应的单位间隔属于所述后一个混响周期之外的周期的情况下,调节值计算单元计算能够以第一抑制效果有效调节混响分量的调节值,并且在相应的单位间隔属于所述后一个混响周期的情况下,调节值计算单元计算以超过第一抑制效果的第二抑制效果有效调节混响分量的调节值。
6.根据权利要求5的声音处理装置,其中所述调节值计算单元配置为通过将对应于每个单位间隔的第一指标值与预定阈值进行比较,来判定每个单位间隔是否属于后一个混响周期。
7.根据权利要求5的声音处理装置,其中
所述指标值计算单元配置为计算第三指标值,所述第三指标值以设置为第一指标值和第二指标值之间的第三跟随度跟随所述声音信号的变化,并且
调节值计算单元配置为根据所述第三指标值来判定每个单位间隔是否属于后一个混响周期。
8.根据权利要求1或2的声音处理装置,其中
所述调节值计算单元配置为在第一指标值超过第二指标值的情况下计算第一调节值,并且配置为在第一指标值低于第二指标值的情况下计算第二调节值,并且
所述混响调节单元配置为将第一调节值应用于声音信号,从而相比混响调节单元将第二调节值应用于声音信号的情况对声音信号做出更大的抑制。
9.根据权利要求1或2的声音处理装置,其中所述指标值计算单元包括:
第一平滑单元,其配置为通过第一时间常数对声音信号的强度的时间序列进行平滑以计算第一指标值;和
第二平滑单元,其配置为通过大于第一时间常数的第二时间常数对声音信号的强度的时间序列进行平滑以计算第二指标值。
10.根据权利要求9的声音处理装置,其中
第一平滑单元配置为计算在沿着声音信号的强度的时间序列移动的第一周期内声音信号的强度的移动平均以获得第一指标值,并且
第二平滑单元配置为计算在沿着声音信号的强度的时间序列移动的设置为大于第一周期的第二周期内声音信号的强度的移动平均以获得第二指标值。
11.根据权利要求9的声音处理装置,其中
第一平滑单元配置为利用第一平滑系数计算声音信号的强度的指数平均以获得第一指标值,并且
第二平滑单元配置为利用设置为小于第一平滑系数的第二平滑系数计算声音信号的强度的指数平均以获得第二指标值。
12.根据权利要求1或2的声音处理装置,其中所述指标值计算单元配置为通过第一方式平滑声音信号的强度的时间序列来生成第一指标值,并且配置为通过与所述第一方式不同的第二方式平滑声音信号的强度的时间序列来生成第二指标值,使得第二指标值的时间变化相比第一指标值的时间变化延迟。
13.根据权利要求1或2的声音处理装置,其中
声音处理装置配置为对声音信号进行处理,所述声音信号是由第一信号和第二信号构成的立体声信号,其中
所述指标值计算单元包括:
互相关计算单元,其配置为顺序计算第一信号和第二信号之间的空间互相关;
自相关计算单元,其配置为顺序计算第一信号或者第二信号的空间自相关;
第一平滑单元,其配置为对空间互相关的时间序列进行平滑以计算第一指标值;和
第二平滑单元,其配置为对空间自相关的时间序列进行平滑以计算第二指标值。
14.根据权利要求1或2的声音处理装置,其中
所述指标值计算单元配置为计算与声音信号中包含的多个频率分量相对应的多个第一指标值和多个第二指标值,
所述调节值计算单元配置为根据所述与声音信号中包含的多个频率分量相对应的多个第一指标值和多个第二指标值来计算多个调节值,并且
所述混响调节单元配置为将每个调节值应用于声音信号中包含的每个相应的频率分量。
15.根据权利要求14的声音处理装置,其中所述指标值计算单元配置为利用用于平滑声音信号的、针对声音信号的每个频率单独设置的第一时间常数来计算每个第一指标值,并且配置为利用用于平滑声音信号的、针对声音信号的每个频率单独设置的第二时间常数来计算每个第二指标值。
16.根据权利要求14的声音处理装置,其中所述指标值计算单元配置为利用用于平滑声音信号的、沿着声音信号的时间通道可变设置的第一时间常数来计算每个第一指标值,并且配置为利用用于平滑声音信号的、沿着声音信号的时间通道可变设置的第二时间常数来计算每个第二指标值。
17.根据权利要求15的声音处理装置,其中所述指标值计算单元配置为利用用于平滑声音信号的、沿着声音信号的时间通道可变设置的第一时间常数来计算每个第一指标值,并且配置为利用用于平滑声音信号的、沿着声音信号的时间通道可变设置的第二时间常数来计算每个第二指标值。
18.根据权利要求1或2的声音处理装置,其中
所述调节值计算单元配置为连续计算与声音信号的各单位间隔的时间序列相对应的多个调节值,并且
所述混响调节单元配置为将一个单位间隔的调节值应用于位于所述一个单位间隔之前的另一个单位间隔的声音信号。
19.一种对声音信号进行处理的声音处理方法,包括:
计算第一指标值和第二指标值,所述第一指标值以第一跟随度跟随声音信号的变化,所述第二指标值以低于第一跟随度的第二跟随度跟随声音信号的变化;
基于所述第一指标值和所述第二指标值之差计算能够有效调节声音信号的混响分量的调节值;和
通过将声音信号的频谱或功率密度乘以所述调节值来将所述调节值应用于声音信号;
其中,所述跟随度表示指标值跟随声音信号的功率密度的时间变化的变化率。
CN201210478375.XA 2011-11-22 2012-11-22 声音处理装置 Expired - Fee Related CN103137136B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011255402 2011-11-22
JP2011-255402 2011-11-22
JP2012-199269 2012-09-11
JP2012199269A JP6019969B2 (ja) 2011-11-22 2012-09-11 音響処理装置

Publications (2)

Publication Number Publication Date
CN103137136A CN103137136A (zh) 2013-06-05
CN103137136B true CN103137136B (zh) 2015-07-22

Family

ID=47627877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210478375.XA Expired - Fee Related CN103137136B (zh) 2011-11-22 2012-11-22 声音处理装置

Country Status (4)

Country Link
US (1) US9454956B2 (zh)
EP (1) EP2597639A3 (zh)
JP (1) JP6019969B2 (zh)
CN (1) CN103137136B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5884473B2 (ja) * 2011-12-26 2016-03-15 ヤマハ株式会社 音響処理装置および音響処理方法
JP5915281B2 (ja) * 2012-03-14 2016-05-11 ヤマハ株式会社 音響処理装置
JP6036141B2 (ja) * 2012-10-11 2016-11-30 ヤマハ株式会社 音響処理装置
EP2962299B1 (en) * 2013-02-28 2018-10-31 Nokia Technologies OY Audio signal analysis
FR3009121B1 (fr) * 2013-07-23 2017-06-02 Arkamys Procede de suppression de la reverberation tardive d'un signal sonore
JP6299279B2 (ja) * 2014-02-27 2018-03-28 ヤマハ株式会社 音響処理装置および音響処理方法
EP3128766A4 (en) * 2014-04-02 2018-01-03 Wilus Institute of Standards and Technology Inc. Audio signal processing method and device
JP6371167B2 (ja) * 2014-09-03 2018-08-08 リオン株式会社 残響抑制装置
CN108305603B (zh) * 2017-10-20 2021-07-27 腾讯科技(深圳)有限公司 音效处理方法及其设备、存储介质、服务器、音响终端
JP7264594B2 (ja) 2018-02-23 2023-04-25 リオン株式会社 残響抑制装置及び補聴器
DE102018210143A1 (de) * 2018-06-21 2019-12-24 Sivantos Pte. Ltd. Verfahren zur Unterdrückung eines akustischen Nachhalls in einem Audiosignal

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4670903A (en) * 1981-06-30 1987-06-02 Nippon Electric Co., Ltd. Echo canceller for attenuating acoustic echo signals on a frequency divisional manner
CN1783214A (zh) * 2004-12-01 2006-06-07 哈曼贝克自动系统-威美科公司 混响估计和抑制系统
CN101064974A (zh) * 2006-04-28 2007-10-31 雅马哈株式会社 声场控制装置
CN102047689A (zh) * 2008-06-02 2011-05-04 雅马哈株式会社 音响回波消除器和音响回波消除方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5433511Y2 (zh) * 1974-10-03 1979-10-16
JPS5361380A (en) * 1976-11-13 1978-06-01 Takayoshi Hirata Device for measuring time of reverberation
JPS55154422A (en) * 1979-05-19 1980-12-02 Nippon Gakki Seizo Kk Reverberation characteristic measuring apparatus
JPH039227A (ja) * 1990-01-26 1991-01-17 Yoichi Ando 音響装置
JP2995374B2 (ja) 1993-02-26 1999-12-27 日本電気エンジニアリング株式会社 周波数別agc回路
JPH08204619A (ja) * 1995-01-26 1996-08-09 Nec Corp エコーサプレッサ
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6163608A (en) * 1998-01-09 2000-12-19 Ericsson Inc. Methods and apparatus for providing comfort noise in communications systems
JP4249729B2 (ja) * 2004-10-01 2009-04-08 日本電信電話株式会社 自動利得制御方法、自動利得制御装置、自動利得制御プログラム及びこれを記録した記録媒体
US7508948B2 (en) * 2004-10-05 2009-03-24 Audience, Inc. Reverberation removal
EP2061153B1 (en) * 2007-11-15 2010-05-19 Aisin Seiki Kabushiki Kaisha Apparatus for stopping adaptive filtering when valid received signal detected and for limiting signal to be demodulated
JP5627241B2 (ja) * 2008-01-21 2014-11-19 パナソニック株式会社 音声信号処理装置および方法
JP4977062B2 (ja) 2008-02-29 2012-07-18 日本電信電話株式会社 残響除去装置とその方法と、そのプログラムと記録媒体
US8189965B2 (en) * 2008-11-17 2012-05-29 Image Trends, Inc. Image processing handheld scanner system, method, and computer readable medium
JP5434120B2 (ja) * 2009-02-16 2014-03-05 ヤマハ株式会社 インパルス応答加工装置、残響付与装置およびプログラム
JP5915281B2 (ja) * 2012-03-14 2016-05-11 ヤマハ株式会社 音響処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4670903A (en) * 1981-06-30 1987-06-02 Nippon Electric Co., Ltd. Echo canceller for attenuating acoustic echo signals on a frequency divisional manner
CN1783214A (zh) * 2004-12-01 2006-06-07 哈曼贝克自动系统-威美科公司 混响估计和抑制系统
CN101064974A (zh) * 2006-04-28 2007-10-31 雅马哈株式会社 声场控制装置
CN102047689A (zh) * 2008-06-02 2011-05-04 雅马哈株式会社 音响回波消除器和音响回波消除方法

Also Published As

Publication number Publication date
JP6019969B2 (ja) 2016-11-02
CN103137136A (zh) 2013-06-05
EP2597639A3 (en) 2017-12-13
EP2597639A2 (en) 2013-05-29
US20130129099A1 (en) 2013-05-23
US9454956B2 (en) 2016-09-27
JP2013130857A (ja) 2013-07-04

Similar Documents

Publication Publication Date Title
CN103137136B (zh) 声音处理装置
US10242692B2 (en) Audio coherence enhancement by controlling time variant weighting factors for decorrelated signals
US8041045B2 (en) Unnatural reverberation
JP5018193B2 (ja) 雑音抑圧装置およびプログラム
CN108172231A (zh) 一种基于卡尔曼滤波的去混响方法及系统
JP2008517317A (ja) オーディオデータ処理システム、方法、プログラム要素、及びコンピュータ読み取り可能媒体
CN112712816A (zh) 语音处理模型的训练方法和装置以及语音处理方法和装置
US11386911B1 (en) Dereverberation and noise reduction
CN117219102A (zh) 一种基于听觉感知的低复杂度语音增强方法
Romoli et al. A novel decorrelation approach for multichannel system identification
Greenblatt et al. A hybrid reverberation crossfading technique
Czyzewski et al. Adaptive personal tuning of sound in mobile computers
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置
US8351615B2 (en) Impulse response processing device, reverberation applying device and program
JP2013182161A (ja) 音響処理装置およびプログラム
CN113613143B (zh) 适用于移动终端的音频处理方法、装置及存储介质
US11380345B2 (en) Real-time voice timbre style transform
JP4504892B2 (ja) 反響消去方法、反響消去装置、プログラム、記録媒体
US20210319800A1 (en) Frequency band expansion device, frequency band expansion method, and storage medium storing frequency band expansion program
JP5463924B2 (ja) 音響処理装置
WO2024006778A1 (en) Audio de-reverberation
CN115662455A (zh) 音频处理模型的训练方法、音频处理方法及装置
Roberts How Smooth Can You Go, Can You Go Down Low?: an analysis on the frequency-dependent roughness of velvet-noise
CN115942224A (zh) 声场扩展方法和系统、电子设备
JP2015004959A (ja) 音響処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150722

Termination date: 20181122