CN116647788A - 用于抑制音频信号中的声学混响的方法 - Google Patents

用于抑制音频信号中的声学混响的方法 Download PDF

Info

Publication number
CN116647788A
CN116647788A CN202310141335.4A CN202310141335A CN116647788A CN 116647788 A CN116647788 A CN 116647788A CN 202310141335 A CN202310141335 A CN 202310141335A CN 116647788 A CN116647788 A CN 116647788A
Authority
CN
China
Prior art keywords
level measurement
audio signal
level
reverberation
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310141335.4A
Other languages
English (en)
Inventor
O·德斯勒
T·D·罗森克兰兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sivantos Pte Ltd
Original Assignee
Sivantos Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sivantos Pte Ltd filed Critical Sivantos Pte Ltd
Publication of CN116647788A publication Critical patent/CN116647788A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种用于抑制音频信号中的声学混响的方法,其中,提供音频信号,其中,实施音频信号的第一电平测量,其中,在第一电平测量期间,实施音频信号的第二电平测量,其中,第一电平测量通过第一校准参数和第一衰减参数如此实施,使得第一电平测量具有第一校准时间和第一衰减时间,其中,第二电平测量通过第二校准参数和第二衰减参数如此实施,使得第二电平测量具有与第一校准时间相同的第二校准时间和大于第一衰减时间的第二衰减时间,并且其中,构造第一电平测量与第二电平测量之差值。在此规定,基于该差值并且基于第二电平测量估计混响干扰电平,并且基于第一电平测量并且基于混响干扰电平确定用于音频信号的放大参数。

Description

用于抑制音频信号中的声学混响的方法
技术领域
本发明涉及一种用于抑制音频信号中的声学混响的方法,其中,实施音频信号的第一电平测量,其中,在第一电平测量期间,实施音频信号的第二电平测量,其中,第一电平测量具有第一校准时间和第一衰减时间,其中,第二电平测量具有与第一校准时间相同的第二校准时间和大于第一衰减时间的第二衰减时间,并且其中,构造第一电平测量与第二电平测量之差值。
背景技术
声学混响通常出现在封闭或者至少部分封闭的房间内,这是由于产生它的声音事件在房间的墙壁上以及在房间内存在的其它物体上的多次反射。在此,视房间及其墙壁的几何形状而定并且视房间内存在的物体的类型、数量和几何形状而定,混响的衰减时间不同,该衰减时间还受房间内存在的表面的性质影响。在此,与可以被区分开地感知为产生它的声音事件的一种“重复”的回声不同,混响形成声音事件的基本上连续的“回响”。
虽然为了尤其是音乐的愉快的声响感觉甚至希望最低限度的混响,以便抵抗太“干”的断音式的声响,但声学混响通常不利于语音贡献的可理解性,因为用于区分尤其是各个单独的辅音的典型声音事件只具有很短的时长,并且与混响的相应叠加在此可能部分显著地歪曲频谱信息。视衰减时间而定,这甚至可能对用于识别元音的共振峰的区分成为问题。
在为佩戴者再现音频信号的听力设备中,对佩戴者而言尽可能可容易理解地再现佩戴者的对话伙伴的语音贡献(Sprachbeitrag)特别重要,因为对语音贡献的缺乏的声学理解和随之带来的佩戴者可识别的信息损失可能被感到特别明显并且因此特别令人不快。这尤其适用于“狭义”的助听器,所述助听器通常用于补偿相关佩戴者的听力损失。因此,在听力设备、主要是所提到的助听器中通常使用技术来提高语音贡献的可理解性。
但刚好在频繁使用动态压缩的情况下,声学混响可能以特别的程度损害因此是重要的语音可理解性:动态压缩应当尤其有助于,将佩戴者几乎感知不到或不再感知到的小声的声音事件(无论是由于佩戴者的听力损失还是由于声音事件的基本上较低的声级)放大到足够的可感知性,而不对足够大声的声音事件进行相同的放大,这些足够大声的声音事件可以被佩戴者没有较大问题地感知到,并且因此进一步放大可能导致令人不快的响度。
但这种动态压缩也“压缩”声学混响,从而声学混响经历相应地比产生它的声音事件更高的放大。由此,一方面,佩戴者感到在当前环境中的衰减时间较长,并且另一方面,由于上述关系,语音贡献的可理解性受到损害。
在专利文献DE 10 2018 210 143 A1中公开了抑制音频信号中的混响,方式为以不同的时间常数实施混响的两个电平测量,并且基于电平测量的差值实施音频信号的减弱。
发明内容
本发明所要解决的技术问题是改进上述用于抑制音频信号中混响的方法。
根据本发明,该技术问题通过一种用于抑制音频信号中的声学混响的方法,其中,提供音频信号,其中,实施音频信号的第一电平测量,其中,在第一电平测量期间,实施音频信号的第二电平测量,其中,第一电平测量通过第一校准参数和第一衰减参数如此实施,使得第一电平测量具有第一校准时间和第一衰减时间,其中,第二电平测量通过第二校准参数和第二衰减参数如此实施,使得第二电平测量具有与第一校准时间相同的第二校准时间和大于第一衰减时间的第二衰减时间,并且其中,由第一电平测量与第二电平测量形成差值(或者说构造第一电平测量与第二电平测量之差值)。
在此规定,根据或者说基于该差值并且基于第二电平测量估计混响干扰电平,并且基于第一电平测量并且基于混响干扰电平确定用于音频信号的放大参数。有利的和部分单独有创造性的设计方案是以下描述的主题。
抑制音频信号中的声学混响在此尤其包括抑制音频信号中那些由于声学混响而在由音频信号反映的真实声学情况中出现的信号贡献。音频信号在此尤其通过一个或多个电声的转换器(或者说变换器)提供,这些变换器将所述的真实声学情况转换成一个或多个尤其电气的信号。在此,为了基于一个或多个如此产生的、尤其电气的信号提供音频信号,还可以进行预处理,所述预处理可以包括例如数字化、放大、动态压缩或噪音抑制。声学混响在此尤其包括产生它的声音事件的声音在例如至少部分封闭的房间的墙壁和/或物体上的反射,其中,由于传播的由声音事件产生的声音在固定位置上的多次反射出现声音事件的连续或几乎连续的衰减。
在本文中,电平测量尤其包括,通过电平测量构造数学函数,或者电平测量可以表示为这样的函数,通过该函数,音频信号的振幅和/或振幅的包络线和/或振幅的数值平方以优选严格单调的方式并且特别优选无拐点地映射到相应的电平值。在此尤其也要考虑这样的函数,在该函数的情况下,其输入量和映射的电平值之间的关系不只具有对数性质,而且在此电平测量的术语还包括更一般的具有适当单调特性的函数。
电平测量的衰减时间在此尤其理解为在音频信号中的信号贡献和电平测量的相应的电平偏移之后直到电平测量在音频信号中没有另外的信号贡献的情况下下降到零或者下降到电平偏移的预设的极小部分所经过的时间。电平测量的校准时间尤其理解为在音频信号中的自发开始的固定的信号贡献之后直到电平测量已达到信号电平的与固定信号贡献相对应的渐近极限值的预设份额所经过的时间。在此,较短的校准时间尤其是指电平测量对音频信号中自发开始的信号贡献的较快反应。
校准时间和衰减时间在此针对两个电平测量中的每一个通过相应的校准或衰减参数来调节。例如,如果电平测量分别由振幅的不对称的、起平滑作用的函数(例如递归平均值函数或类似的函数)实现,则校准参数可以由上升沿的分别下一个振幅贡献的加权系数给出,并且衰减参数可以相应地由下降沿的分别下一个振幅贡献的加权系数给出。
声音事件尤其包括在真实声学情况中的任何产生声音的事件,该事件由音频信号反映和/或通过相应的变换器转换以便提供音频信号,其中,可以为产生声音的事件在时间上分配(或者说配置)清楚的结束。在这个意义上,抑制声音事件在音频信号中的声学混响尤其是指抑制那些在真实声学情况中对应于声音事件的声学混响的信号贡献。
两个电平测量的基于各自的衰减时间被特征化的衰减特性在此取决于在其中记录所提供的音频信号的房间的具体特性。紧接在声音事件发生之后,首先第一波前直接地并且在没有进一步反射的情况下进入音频信号,随后在房间中的不同边界和/或物体上发生第一反射,该第一反射的传播时间延迟尤其取决于房间的尺寸。这些仍然表示原始声音事件的一种衰减和延迟的版本的第一反射这时一方面进入音频信号,但另一方面产生另外的、级联式的反射。在此,随着反射级增加和各个单独的波前的重叠,各个单独的反射的可区分性丧失;由此在大多数还能区分开的较早的反射之后形成(几乎)连续的、扩散的混响尾部(德语:Nachhallfahne),该混响尾部呈指数下降。
基于两个电平测量的差值,尤其在适当地选择两个衰减时间的情况下,可以至少近似并且隐含地确定音频信号中的扩散混响的贡献。这尤其适用于这样的情况,即,第二衰减时间通过第二衰减参数(优选针对当前环境或当前房间估计所述第二衰减参数)优选如此调节,使得第二电平测量的衰减特性基本上由原始声音事件的贡献决定,这些贡献逐渐越来越少地进入第二电平测量。第一衰减时间优选通过第一衰减参数如此调节,使得第一电平测量的衰减特性至少在较早的反射的短时间之后基本上由扩散混响的贡献决定,这些贡献进一步“供给”衰减的第一电平测量。尤其地,较早的反射的短时间在此可以基于两个电平测量的差值与随后的或者从中转变的扩散混响同样地被识别。
如果扩散混响的贡献或者在第二电平测量中的声音事件的衰减的贡献是已知的,方式为例如对第二电平测量与第一电平测量的差值(该差值通常为负)应用所谓的最小跟踪器,并且附加地确定何时再次离开达到的最小值(或者以预设的最低值超出),则可以从该认知基于第二电平测量估计混响干扰电平,该混响干扰电平尤其可以表示第二电平测量中的(基本上)基于或对应于扩散混响的贡献(而非实际的、衰减的声音事件)的比例或者说份额。
随后,混响干扰电平可以用于确定放大参数,以便尤其针对音频信号中声音事件的贡献,通过根据放大参数减弱音频信号来抑制音频信号中的声音事件的声学和尤其扩散的混响。放大参数可以被确定为放大因子,例如根据作为干扰信号的混响干扰电平并且根据作为有效信号的第一电平测量被确定,该放大因子被应用于音频信号。
适宜地,第一电平测量和/或第二电平测量在此由加权平均值函数实现。由此可以在相同的校准特性的情况下特别简单地实现电平测量的不同的衰减特性,方式为分别针对下降沿将递归的不同的加权系数应用于音频信号的新添加到第一或第二电平测量中的贡献。在此优选地,用于加权平均值函数的后续值的加权系数根据上升或下降的电平“不对称”地选择,即,例如将在一时间点的音频信号的值与在该时间点按照加权平均值函数存在的电平值进行比较,并且用于将音频信号的新值输入电平测量中的加权系数根据音频信号的值大于还是小于电平测量的当前值来选择。
有利地,第一电平测量或第二电平测量由优选一阶的不对称的递归的低通滤波器实现。对于在离散时域中的音频信号a(n),相应的电平测量pj(j=p1,p2)可以表示为
(i)pj2(n)=(1–c(n))·a2(n)+c(n)·pj2(n-1),其中
如果a2(n)>pj2(n-1),则c(n)=csteig,否则c(n)=cfall
其中,pj2(n)表示相对于离散时间角标n的电平测量pj的电平值,并且c(n)表示陡度参数,该陡度参数根据上述针对a2(n)的条件设置为两个常数csteig、cfall之一。
适宜地确定当前环境的物理衰减时间常数,在该环境中,作为音频信号的基础的声音信号(即尤其是这样的声音信号,从该声音信号产生音频信号)的声级已经下降到初始值的预设份额,其中,第二衰减参数选择为,使得第二电平测量的第二衰减时间由用于当前环境的所述物理衰减时间常数给出。优选地,在此将下降60dB用作下降到初始值的预设份额,这对应于时间常数T60。60dB的下降在此通常对应于完全衰减直至噪声基底(或者说噪底;德语:Rauschuntergrund)。
有利地,将第一电平测量值与第二电平测量值之差值与确定的第一极限值进行比较,其中,在两个电平测量的差值的数值(Betrag)超过第一极限值的数值的情况下,确定存在扩散混响的贡献和/或在第二电平测量中存在声音事件的衰减的贡献。这尤其包括构造差值,并且在差值为负的情况下,如果该差值低于这时同样为负的第一极限值,则确定扩散混响的存在。一旦差值再次超过第一极限值(或者说差值的数值低于第一极限值的数值),在该实现中就不再存在扩散混响,从而优选也不再发生减弱。对音频信号的减弱在此优选根据所述差值与第一极限值的比较来控制。
在此优选地,在两个电平测量的差值的数值超过第一极限值的数值的情况下,所述差值的数值与极限值的数值之间的差异被确定为第二电平测量中声音事件的衰减的贡献。这尤其包括,在电平测量的差值为负的情况下,差值低于第一极限值的值被确定为扩散混响的贡献,该贡献尤其定量地进入混响干扰电平中。换而言之,第一极限值在此一方面为声音事件的扩散混响或衰减的贡献究竟是否存在提供二元标准,并且另一方面在存在的情况下为所述衰减的贡献提供定量的量度。在此尤其可以将最小跟踪器用于所述差值,并且将所确定的最小值例如与第一极限值进行比较。声音事件的衰减的贡献在此尤其包括第二电平测量中的那些基本上或只基于实际的声音事件并且由于时间延迟由于平滑处理才逐渐减少或消失的分量。在此尤其有利的是,第二电平测量的第二衰减时间选择为衰减时间常数T60;因此,在较晚的、尤其扩散混响的阶段中,最初针对较早反射具有较快的第一衰减时间(和因此较快的衰减特性)的第一电平测量由于扩散混响的声功率也以该衰减速率在房间内衰减。
在此优选地,基于声音事件的衰减的贡献并且尤其基于第一极限值的数值,产生与时间相关的校正函数,其中,混响干扰电平基于从第二电平测量减去校正函数产生。与时间相关的校正函数在此尤其可以由基础值给出,该基础值与第一极限值和衰减的声音事件的如上所述确定的贡献相关。
有利地,放大参数基于频谱减法确定,尤其将混响干扰电平与第一电平测量的商用于该减法。随后,放大参数可以例如给出为
(ii) G (n) = 1 – prn (n) / p1 (n)
其中,prn(n)=p2(n)–d(n)为混响干扰电平,p1和p2为第一和第二电平测量,并且d(n)为根据
(iii)d(n)=min[p1(n)–p2(n),th1]
的校正函数,其具有(负的)第一极限值th1。
在一种有利的设计方案中,将音频信号分解为多个频带,其中,第一电平测量和第二电平测量分别分频带地实施,其中,针对多个频带确定相应的放大参数,尤其通过分频带地构造两个电平测量的差值来确定,基于所述差值确定频带中声音事件的相应的衰减的贡献并且由该贡献确定相应的混响干扰电平,并且其中,在该频带中将相应的放大参数应用于音频信号的信号分量,以便抑制声学混响。在这种情况下,方程(ii)中的放大参数G(n)应当被时频域中的相应的多个放大参数G(n,k)替代,其中,k为带角标(Bandindex)。
本发明还提供一种用于抑制听力设备、尤其是助听器的音频信号中的声学混响的方法,其中,基于听力设备的输入变换器由环境的声音信号提供音频信号,并且其中,通过前述方法抑制音频信号中的声学混响,本发明还提供一种听力设备,其尤其可以作为助听器给出,该听力设备具有用于产生音频信号的输入变换器和设置用于实施前述方法的信号处理单元。
听力设备中的方法和听力设备本身具有上述用于抑制混响的方法的优点。针对用于抑制音频信号中的声学混响的方法及其扩展设计给出的优点在此可以按照意义转用于听力设备中的方法和听力设备本身。
附图说明
以下根据附图更详细地阐述本发明的实施例。在附图中分别示意性地:
图1在时间图中示出同一音频信号的第一电平测量和第二电平测量,所述第一电平测量和第二电平测量具有相同的校准时间并且分别具有不同的衰减时间;
图2在时间图中示出根据图1的两个电平测量的差值和由此确定的校正函数;
图3在时间图中示出第二电平测量和基于根据图2的校正函数确定的混响干扰电平;
图4在时间图中示出根据图3的混响干扰电平和第一电平测量;并且
图5在方框图中示出听力设备。
彼此相应的部件和尺寸在所有附图中分别配设有相同的附图标记。
具体实施方式
在图1中示意性地在时间图中相对于时间t示出第一电平测量p1(实线)和第二电平测量p2(虚线)的电平值P,所述第一和第二电平测量分别在未详细示出的音频信号上实施。在时间点T0,在音频信号中存在独立或者说区分开的声音事件4(打点线),该声音事件一方面具有清楚定义的结束,并且另一方面由于物理环境而引起音频信号中的声学混响的贡献(未示出),音频信号为了产生被记录在该物理环境中。声音事件4在此应当只具有非常短的时长z。因此,声音事件4的全部声能集中在该时长z中。例如对于爆炸、敲击、拍打并且也对于语音的辅音、尤其爆破音以及对于持续时间很短的类似噪声可能是这种情况。
第一电平测量p1具有第一校准时间6,该第一校准时间在声音事件4开始的时间点T0之后流逝直到第一电平测量占据了渐近电平10的预设份额8,其中,渐近电平10对应于第一电平测量针对具有与声音事件4相同的信号电平的固定的、连续的声音事件会占据的那个电平。第二电平测量p2的第二校准时间12在本例中与第一电平测量的第一校准时间6相同。
因此,第一电平测量p1和第二电平测量p2具有相同的校准特性,并且因此在标记时长z的结束和因此标记声音事件4的结束的时间点T1,第一和第二电平测量占据或者说具有针对电平的相同的最大值14,该最大值刚好低于渐近电平10。
在时间点T1,这时在由音频信号反映的真实声学情况中开始存在受混响影响的衰减特性,因此第一电平测量p1和第二电平测量p2这时也按照各自的衰减时间转变为其衰减特性。
第一和第二电平测量p1、p2的校准特性和衰减特性在此示意性地线性显示,由此,对于该视图,在从校准特性向衰减特性的转变处也产生峰值。然而,校准特性在所述转变之前已经可以较慢地上升,并且该转变尤其也可以进行平滑处理。
第一电平测量p1和第二电平测量p2在此具有第一衰减时间16或第二衰减时间18,其中,第二衰减时间18大于第一衰减时间16。第二衰减时间可以在以下程度中与衰减时间常数T60有关,在该衰减时间常数之后,声级从最大值开始减少了60dB并且通常被用作房间内的衰减的量度。第二电平测量的“衰减速率”由最大值14和初始值24的差值除以第二衰减时间18给出;在本例中,该衰减速率对应于60dB/T60的速率。第一衰减时间16在此可以例如由第二衰减时间18的一半(或类似值)给出,并且在此尤其决定第一电平测量p1的衰减特性的开始15(参见用于第一衰减时间16的外推的打点线)。
第一和第二电平测量p1、p2在此分别实现为一阶的不对称的递归的低通滤波器,因此,通过滤波器的相应的衰减参数可以调节各自的衰减时间16、18,该衰减参数控制对于电平测量p1、p2中的分别下一个时间点的现有电平值的保留(参见上文的等式(i))。对于第二电平测量p2,如此调节的第二衰减时间18在此足够慢,使得衰减特性由滤波器的线性下降给出。混响尾部的扩散混响的声学贡献在此虽然可以为第二电平测量p2的值提供贡献,但不决定其衰减特性。
与之相反,对于第一电平测量p1,第一衰减时间16是这样的,即,在对应于最大值14并且由声音事件4给出的第一峰值15之后,并且在对应于第一衰减时间16的快速下降17之后(在该下降期间,音频信号中的第一和较早的反射必要时仍提供贡献),在时间点T2发生向较平缓的边沿19的转变。在该边沿中,扩散混响的逐渐减少的贡献实际上“供给”第一电平测量p1,并且因此决定第一电平测量在该范围内的衰减特性。
在第一电平测量p1的较平缓的边沿19中,衰减特性因此实际上由扩散混响决定,该扩散混响在房间内以衰减时间T60衰减,因此,这个从时间点T2起的呈指数的衰减特性在第一电平测量p1的对数视图中与第二电平测量p2的衰减特性平行,直至第一电平测量在时间点T3下降到声音事件4之前的初始值24,在其中产生音频信号的房间内的扩散混响因此逐渐消失。与此相反,由于较长的第二衰减时间18,第二电平测量p2在较晚的时间点T4才下降到初始值24。所述初始值24在此可以例如由音频信号的噪声背景给出。
在图2中在时间图中示意性地示出根据图1的第一电平测量p1和第二电平测量p2(虚线)的差值Δ。由于p1和p2直至时间点T0均等于初始值24并且由于相同的第一和第二校准时间6、12直至时间点T1具有相同的衰减特性的事实,差值Δ=p1-p2直至时间点T1正好等于0。由于不同的第一和第二衰减时间16、18(参见图1),该差值Δ直至时间点T2下降到最小值min<0并且由于两个电平测量p1、p2在时间点T2和T3之间的相同的衰减特性(参见图1,平行走向)保持在所述最小值min。在时间点T3之后,该差值Δ的数值才再次减小,即,直至时间点T4,该差值Δ再次升高到零,从时间点T3起,第一电平测量p1已经占据初始值24,第二电平测量p2还下降,直到时间点T4下降到该初始值(参见图1)。
这时将该差值Δ与第一极限值th1进行比较,其中,基于该比较应该以尚待描述的方式确定第二电平测量p2中的扩散混响的贡献。第一极限值的数值小于最小值min的数值,即|th1|<|min|,或0>th1>min。
第一极限值th1在此应当优选如此选择,使得差值Δ的最小值min可以可靠地通过相应的比较来识别。因此认为,对于Δ<th1的情况(即当差值Δ低于第一极限值th1时),在音频信号中存在扩散混响的贡献30,因为一方面,在相关的时间点T2和T3之间的时间段中,第一电平测量p1的衰减特性直接由所述扩散混响给出,而第二电平测量p2的衰减特性由于缓慢的第二衰减时间18还在很大程度上由原始声音事件4给出,但其中,扩散混响的贡献30也进入第二电平测量p2。
这时基于差值Δ=p1-p2和第一极限值根据等式(iii)构造校正函数d(实线)。这个校正函数d直至时间点T1'>T1(同时T1'<T2)由第一极限值th1构成,并且当t>T1'时转变为差值Δ。在时间点T3'>T3时(同时T3'<T4),校正函数d又由第一极限值th1给出。
该校正函数d的使用根据图3说明:在图3中示意性地在时间图中示出如图1所示的第二电平测量p2(实线)。此外,示出混响干扰电平prn(虚线),该混响干扰电平由第二电平测量p2给出,从所述第二电平测量中减去了根据图2的校正函数d。由于在时间点T2和T3之间的时间段中第一电平测量p1由扩散混响的贡献决定,并且在该时间段中所述贡献虽然同样进入第二电平测量p2,但该第二电平测量主要由声音事件4的按照第二衰减时间18衰减的贡献(即“独立的”衰减的贡献,而没有新添加的声音贡献)决定,因此校正函数d在时间点T2和T3之间(或者转变式地已经在T1'和T3之间)基本上由第二电平测量p2中的声音事件4的衰减的贡献给出。换而言之,在时间点T2和T3之间,实际声功率基本上等于第一电平测量p1,因此,(负的)校正函数d被添加到第二电平测量p2中,以便在混响干扰电平prn中在该区间内同样得到实际声功率。在此,第二电平测量p2始终高于实际声功率并且因此也高于扩散混响的功率。
因此,混响干扰电平prn=p2+d在所述时间段中基本上由扩散混响给出。在时间点T1'之前和在时间点T3'之后,混响干扰电平prn由校正函数d中的由于第一极限值th1而恒定的偏移给出。
在图4中示意性地在时间图中示出混响干扰电平prn(虚线)和第一电平测量p1(实线)。在时间点T2和T3之间的时间段中,所提到的两条线基本上重合,在该时间段中,第一电平测量p1由扩散混响决定。即使在此示出示意性的、理想化的视图,真实的情况也是类似的,即,两条线在扩散混响的区域中分别提供几乎相同的值。
如果这时根据等式(ii)在一个频带中确定放大因子并且将其应用于音频信号50在该频带中的信号分量,则扩散混响(在时间点T2和T3之间)可以被抑制,而音频信号50在该频带中的其它贡献保持不变,因为在那里适用p1>prn。
根据图1示出的用于抑制音频信号中的声学混响的方法在此尤其可以分频带地实施。为此将音频信号分别划分为各个单独的频带,在这些频带中分别如所显示的那样实施第一和第二电平测量p1、p2。随后,音频信号的减弱可以针对每个频带单独地基于在该频带中根据校准特性和衰减特性分别确定的放大参数G来控制。
在图5中示意性地在方框图中示出听力设备40,该听力设备具有输入变换器42、信号处理单元44和输出变换器46。在本例中由麦克风给出的输入变换器42由环境的声音信号48产生音频信号50,具体的声音事件4也进入所述声音信号。音频信号50中的声音信号48的声学混响这时能够以根据图1或图2描述的方式在信号处理单元44中被抑制。由此产生的信号被进一步处理,尤其经历动态压缩和与频带相关的放大,并且从中产生输出信号52,所述输出信号由输出变换器46转换为输出声音信号54。
尽管本发明已经详细地通过优选的实施例被图解和描述,但本发明并不受此实施例的限制。在不脱离本发明的保护范围的情况下,本领域的技术人员可以从中推导出其它变型。
附图标记列表
4 声音事件
6 第一校准时间
8 预设份额
10 渐进电平
12 第二校准时间
14 最大值
15 峰值
16 第一衰减时间
17 下降
18 第二衰减时间
19 较平缓的边沿
24 噪声背景
40 助听器
42 输入变换器
44 信号处理单元
46 输出变换器
48 声音信号
50 音频信号
52 输出信号
54 输出声音信号
d 校正函数
min 最小值
P 电平值
p1 第一电平测量
p2 第二电平测量
prn 混响干扰电平
t 时间
th1 第一极限值
T0-T4 时间点
T1'、T3' 时间点
z 时长
Δ 差值

Claims (15)

1.一种用于抑制音频信号(50)中的声学混响的方法,
-其中,提供音频信号(50),
-其中,实施音频信号(50)的第一电平测量(p1),
-其中,在第一电平测量(p1)期间,实施音频信号(50)的第二电平测量(p2),
-其中,第一电平测量(p1)通过第一校准参数和第一衰减参数如此实施,使得第一电平测量(p1)具有第一校准时间(6)和第一衰减时间(16),
-其中,第二电平测量(p2)通过第二校准参数和第二衰减参数如此实施,使得第二电平测量(p2)具有与第一校准时间(6)相同的第二校准时间(12)和大于第一衰减时间(16)的第二衰减时间(18),并且
-其中,构造第一电平测量(p1)与第二电平测量(p2)之差值(Δ),
其特征在于,
-基于该差值(Δ)并且基于第二电平测量(p2)估计混响干扰电平,并且
-基于第一电平测量(p1)并且基于混响干扰电平(prn)确定用于音频信号(50)的放大参数。
2.根据权利要求1所述的方法,
其中,针对音频信号(50)中的声音事件(4)的贡献,通过根据放大参数减弱音频信号(50)、尤其通过将放大参数应用于音频信号(50)来抑制音频信号(50)中的声音事件(4)的声学混响。
3.根据权利要求1或2所述的方法,
其中,第一电平测量(p1)和/或第二电平测量(p2)由加权平均值函数实现。
4.根据权利要求3所述的方法,
其中,根据上升或下降的电平选择用于加权平均值函数的后续值的加权系数。
5.根据前述权利要求中任一项所述的方法,
其中,第一电平测量(p1)或第二电平测量(p2)由优选一阶的不对称的递归的低通滤波器实现。
6.根据前述权利要求中任一项所述的方法,
其中,确定当前环境的物理衰减时间常数,在该环境中,作为音频信号(50)的基础的声音信号(48)的声级已经下降到初始值的预设份额,
其中,第二衰减参数选择为,使得第二电平测量(p2)的第二衰减时间(18)由用于当前环境的所述物理衰减时间常数给出。
7.根据前述权利要求中任一项所述的方法,
其中,基于第一电平测量(p1)与第二电平测量(p2)之差值确定音频信号(50)中扩散混响的贡献(30)的存在和/或第二电平测量(p2)中声音事件(4)的衰减的贡献的存在。
8.根据权利要求7所述的方法,
其中,将第一电平测量值(p1)与第二电平测量值(p2)之差值与确定的第一极限值(th1)进行比较,并且
在两个电平测量值(p1、p2)的差值(Δ)的数值超过第一极限值(th1)的数值的情况下,
确定在音频信号(50)中存在扩散混响的贡献(30)或者在第二电平测量(p2)中存在声音事件(4)的衰减的贡献。
9.根据权利要求7或8所述的方法,
其中,在两个电平测量(p1、p2)的差值(Δ)的数值超过第一极限值(th1)的数值的情况下,所述差值(Δ)的数值与极限值(th1)的数值之间的差异被确定为第二电平测量(p2)中声音事件(4)的衰减的贡献。
10.根据权利要求7至9中任一项所述的方法,
其中,对第一电平测量(p1)与第二电平测量(p2)的差值应用最小跟踪器,并且从中确定音频信号(50)中扩散混响的一个贡献(30)和/或多个贡献(30)的存在或第二电平测量(p2)中声音事件(4)的一个衰减的贡献和/或多个衰减的贡献的存在。
11.根据权利要求9或10所述的方法,
其中,基于声音事件(4)的衰减的贡献产生与时间相关的校正函数(d),并且
其中,混响干扰电平(prn)基于校正函数(d)与第二电平测量(p2)的相加产生。
12.根据前述权利要求中任一项所述的方法,
其中,放大参数基于频谱的减法确定,尤其将混响干扰电平(prn)与第一电平测量(p1)的商用于该减法。
13.根据前述权利要求中任一项所述的方法,
其中,将音频信号(50)分解为多个频带,
其中,第一电平测量(p1)和第二电平测量(p2)分别分频带地实施,
其中,针对多个频带确定相应的放大参数,并且将该放大参数应用于音频信号(50)在相应频带中的信号分量,以便抑制声学混响。
14.一种用于抑制听力设备(40)的音频信号(50)中的声学混响的方法,
其中,基于听力设备(40)的输入变换器(42)由环境的声音信号(48)提供音频信号(50),并且
其中,通过根据前述权利要求中任一项所述的方法抑制音频信号(50)中的声学混响。
15.一种听力设备(40),具有用于产生音频信号(50)的输入变换器(42)和设置用于实施根据权利要求1至10中任一项所述的方法的信号处理单元(44)。
CN202310141335.4A 2022-02-24 2023-02-21 用于抑制音频信号中的声学混响的方法 Pending CN116647788A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102022201943.1 2022-02-24
DE102022201943.1A DE102022201943A1 (de) 2022-02-24 2022-02-24 Verfahren zur Unterdrückung eines akustischen Nachhalls in einem Audiosignal

Publications (1)

Publication Number Publication Date
CN116647788A true CN116647788A (zh) 2023-08-25

Family

ID=85199406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310141335.4A Pending CN116647788A (zh) 2022-02-24 2023-02-21 用于抑制音频信号中的声学混响的方法

Country Status (4)

Country Link
US (1) US20230269546A1 (zh)
EP (1) EP4235664A1 (zh)
CN (1) CN116647788A (zh)
DE (1) DE102022201943A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7508948B2 (en) 2004-10-05 2009-03-24 Audience, Inc. Reverberation removal
DE102018210143A1 (de) * 2018-06-21 2019-12-24 Sivantos Pte. Ltd. Verfahren zur Unterdrückung eines akustischen Nachhalls in einem Audiosignal

Also Published As

Publication number Publication date
DE102022201943A1 (de) 2023-08-24
US20230269546A1 (en) 2023-08-24
EP4235664A1 (de) 2023-08-30

Similar Documents

Publication Publication Date Title
EP1312162B1 (en) Voice enhancement system
EP1709734B1 (en) System for audio signal processing
EP1680781B1 (en) System and method for audio signal processing
EP2226794B1 (en) Background noise estimation
EP2747081A1 (en) An audio processing device comprising artifact reduction
EP1720249A1 (en) Audio enhancement system and method
JP2000347688A (ja) 雑音抑圧装置
WO2012120815A1 (ja) ハウリング検出装置、ハウリング抑制装置、およびハウリング検出方法
US6999920B1 (en) Exponential echo and noise reduction in silence intervals
CN110636408B (zh) 用于抑制音频信号中的声音混响的方法
JP5490704B2 (ja) ハウリング抑圧装置、ハウリング抑圧方法、プログラム、及び集積回路
KR20160113224A (ko) 오디오 신호를 압축하는 오디오 압축 시스템
JP2016054421A (ja) 残響抑制装置
JP2014513320A (ja) オーディオ信号におけるドミナント周波数を減衰する方法及び装置
WO2013054459A1 (ja) ハウリング抑圧装置、補聴器、ハウリング抑圧方法、及び集積回路
JPH10503908A (ja) オーディオ信号の調性を決定するための方法および装置
EP2230664A1 (en) Method and apparatus for attenuating noise in an input signal
US11195539B2 (en) Forced gap insertion for pervasive listening
CN116647788A (zh) 用于抑制音频信号中的声学混响的方法
US11503415B1 (en) Detection of feedback path change
CN108024185B (zh) 电子装置及特定频段补偿增益方法
JP7264594B2 (ja) 残響抑制装置及び補聴器
NL2021071B1 (en) Method for processing an audio signal for a hearing aid
CN114143667A (zh) 音量调节方法、存储介质及电子设备
JP4666320B2 (ja) リミッタ・コンプレッサ装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination