CN110140294B - 用于均衡音频信号的方法和装置 - Google Patents

用于均衡音频信号的方法和装置 Download PDF

Info

Publication number
CN110140294B
CN110140294B CN201680091392.4A CN201680091392A CN110140294B CN 110140294 B CN110140294 B CN 110140294B CN 201680091392 A CN201680091392 A CN 201680091392A CN 110140294 B CN110140294 B CN 110140294B
Authority
CN
China
Prior art keywords
audio signal
energy
echo
correction data
echo estimate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680091392.4A
Other languages
English (en)
Other versions
CN110140294A (zh
Inventor
阿兰·迪恩·米歇尔
杰森·陈
西蒙·刘
宋柏勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman International Industries Inc
Original Assignee
Harman International Industries Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harman International Industries Inc filed Critical Harman International Industries Inc
Publication of CN110140294A publication Critical patent/CN110140294A/zh
Application granted granted Critical
Publication of CN110140294B publication Critical patent/CN110140294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本发明公开了一种用于均衡音频信号的方法和装置,其中所述方法包括:获得音频信号(S401);获取由从一个或多个对象离开的声音反射而引起的回声估计(S403);基于所述音频信号和所述回声估计获取校正数据(S405);以及基于所述校正数据来均衡所述音频信号(S407)。因此,借助于用于均衡音频信号的方法和装置,可以实时地自动执行均衡以便在考虑到空间声学(诸如间接回声)的情况下将音频信号与期望的参考频率响应相匹配。

Description

用于均衡音频信号的方法和装置
技术领域
本发明涉及音频数据处理,并且更具体地涉及一种用于均衡音频信号的方法和装置。
背景技术
常规上音频均衡是手动执行的,并且因此音频均衡的质量取决于用户的辨别良好声学的听觉能力。基于用户所期望的频率响应来确定音频均衡的质量。在现有技术中,存在一些自动均衡系统代替手动均衡。通常,房间中的音频均衡需要在房间中将麦克风设置在与扬声器相距一定距离处,理想情况是收听者将收听的地方。然而,一旦麦克风被移动或房间内的环境改变,必须再次执行自动音频均衡设置,因为均衡是基于一个位置或环境进行的。
发明内容
本发明使用安装在扬声器中的麦克风,其中麦克风侦听来自扬声器的直接音频,以及从房间和房间内的对象的音频反射。通过分离这两个音频信号,扬声器可以被均衡,其中基于房间内的反射和对象的扬声器输出影响收听者从扬声器感知的音频频率响应。
本发明的实施例提供一种用于均衡音频信号的方法,所述方法包括:获得音频信号;获取由从一个或多个对象(例如,墙、桌子、门)离开的声音反射而引起的回声估计;基于所述音频信号和所述回声估计获取校正数据;以及基于所述校正数据来均衡所述音频信号。
在一些实施例中,获取所述回声估计包括:获得针对先前音频信号的完整回声估计;以及截断所述完整回声估计以移除直接回声估计以便获得对应于间接回声的回声估计。
在一些实施例中,周期性地获得所述完整回声估计,其中基于先前回声估计的残差来确定所述周期。
在一些实施例中,基于所述音频信号和所述回声估计获取所述校正数据包括:获取所述音频信号的能量和所述回声估计的能量;以及基于所述音频信号的能量、所述回声估计的能量和与设备类型或声学环境相关的预设参考频率响应来获取所述校正数据。
在一些实施例中,基于所述音频信号的能量、所述回声估计的能量和所述预设参考频率响应来获取所述校正数据包括:获取所述音频信号的能量与所述回声估计的能量之间的能量差;以及基于所述能量差与所述预设参考频率响应之间的差值来获取所述校正数据。
在一些实施例中,基于所述校正数据来均衡所述音频信号包括:基于一组校正因子来均衡所述音频信号,所述一组校正因子是基于所述校正数据获取的。
在一些实施例中,均衡所述音频信号包括基于所述一组校正因子改变所述音频信号的一组增益。
在一些实施例中,均衡所述音频信号包括基于所述一组校正因子的一部分改变所述音频信号的一组增益。
本发明实施例还提供了一种用于均衡音频信号的装置,包括:能量获取电路,其被配置成获取音频信号;间接回声获取电路,其被配置成获取由从一个或多个对象离开的声音反射而引起的回声估计;校正数据获取电路,其被配置成基于所述音频信号和所述回声估计获取校正数据;以及均衡器,其被配置成基于所述校正数据均衡所述音频信号。
在一些实施例中,所述间接回声获取电路获取所述回声估计包括:获得针对先前音频信号的完整回声估计;以及截断完整回声估计,移除直接音频路径和换能器响应,以获取房间的回声估计。
在一些实施例中,所述间接回声获取电路周期性地获得所述完整回声估计,其中所述周期是基于先前回声估计的残差确定的。
在一些实施例中,所述能量获取电路还被配置成获取所述音频信号的能量和所述回声估计的能量。
在一些实施例中,所述校正数据获取电路获取所述校正数据包括:基于所述音频信号的能量、所述回声估计的能量和与设备类型或声学环境相关的预设参考频率响应来获取所述校正数据。
在一些实施例中,所述校正数据获取电路获取所述校正数据包括:获得所述音频信号的能量与所述回声估计的能量之间的能量差;以及基于所述能量差与所述预设参考频率响应之间的差值来获取所述校正数据。
在一些实施例中,所述均衡器均衡所述音频信号包括:基于所述校正数据获取一组校正因子;以及基于所述一组校正因子均衡所述音频信号。
在一些实施例中,基于所述一组校正因子来均衡所述音频信号包括:基于所述一组校正因子改变所述音频信号的频带的一组增益。
在一些实施例中,基于所述一组校正因子来均衡所述音频信号包括:基于所述一组校正因子的一部分改变所述音频信号的频带的一组增益。
借助于本发明中的用于均衡音频信号的方法和装置,可以实时地自动执行均衡以便在考虑到空间声学(诸如间接回声)的情况下将音频信号与期望的参考频率响应相匹配。
附图说明
结合附图,根据以下描述和所附权利要求,本发明的前述和其他特征将变得更加明显。应理解,这些附图仅描绘了根据本发明的若干实施例并且因此不应被视为对其范围的限制,将通过使用附图以附加的特征和细节来描述本发明。
图1示意性地示出了根据本发明的实施例的音频系统的框图;
图2a示意性地示出了根据本发明的实施例的数据处理器的框图;
图2b示意性地示出了根据本发明的另一个实施例的数据处理器的框图;
图3示意性地示出了根据本发明的实施例的1/3倍频程实时均衡器的框图;以及
图4示意性地示出了根据本发明的实施例的用于均衡音频信号的方法的流程图。
具体实施方式
在以下详细描述中,参考了附图,附图形成了本发明的一部分。在附图中,除非上下文另有指示,否则类似的符号通常标识类似的部件。在具体实施方式、附图和权利要求书中描述的示意性实施例并非意在进行限制。在不脱离本文呈现的主题的精神或范围的情况下,可以利用其他实施例,并且可以进行其他改变。将容易理解,如本文一般描述并且在附图中示出的,本发明的各方面可能以各种不同的配置来布置、替换、组合和设计,所有这些都是明确预期的并且作为本发明的一部分。
图1示意性地示出了根据本发明的实施例的音频系统100的框图。音频系统100包括音频源101、1/3倍频程实时均衡器102(即,图形均衡器)、扬声器103、麦克风104、回声消除器105和数据处理器106。
在一些实施例中,音频源101可以为数据处理器106和1/3倍频程实时均衡器102提供第一音频信号。然后,1/3倍频程实时均衡器102为扬声器103和回声消除器105提供第一均衡音频信号。扬声器103将第一均衡音频信号转换成第一音频并播放第一音频。
具体地,回声消除器105被配置成基于第一均衡音频信号和先前回声估计的残差来获取完整回声估计。回声消除器105对于本领域普通技术人员来说是公知的。
音频系统100包括加法器107,其中加法器107被配置成从麦克风音频信号中减去由回声消除器105获得的先前回声估计,其中在第一均衡音频信号之前,基于先前均衡音频信号获取先前回声估计。因此,获取先前回声估计的残差并将其馈送回到回声消除器105。然后,回声消除器105基于第一均衡音频信号和残差进行完整回声估计,并且向数据处理器106提供完整回声估计。
实际上,麦克风104可以接收其他音频,包括第一音频的回声。在一些实施例中,第一音频的回声可以包括一组直接回声和一组间接回声。具体而言,该组直接回声包括直接从扬声器103到麦克风104的回声或者借助从扬声器103附近的对象离开的反射而从扬声器103到麦克风104的一组间接回声,其中反射可能不受空间声学影响。此外,该组间接回声可以包括借助从空间内的一个或多个对象离开的反射而从扬声器103到麦克风104的一个或多个回声,其中反射受空间声学影响。
由回声消除器105获得的完整回声估计包括对应于该组直接回声的直接回声估计和对应于该组间接回声的间接回声估计。
在一些实施例中,回声消除器105可以周期性地向数据处理器106提供回声估计。可以基于从加法器107获取的残差自适应地设置周期,并且例如,如果残差很小,则施加长周期,诸如1分钟、或5分钟、或10分钟或超过10分钟;如果残差很大,则施加短周期,诸如5秒、或15秒、或30秒。
数据处理器106被配置成基于第一音频信号和完整回声估计生成校正数据,并且还提供用于1/3倍频程实时均衡器102的校正数据,以便用于在第一音频信号之后均衡来自音频源101的下一音频信号。
图2a示意性地示出了根据本发明的实施例的数据处理器106的框图。数据处理器106包括间接回声获取电路201、能量获取电路203和校正数据获取电路205。
在一些实施例中,间接回声获取电路201被配置成获得完整回声估计,并且然后从完整回声估计中获取间接回声估计。
在一些实施例中,能量获取电路203被配置成获得第一音频信号和间接回声估计,并且然后获取第一音频信号的能量和间接回声估计的能量。
在一些实施例中,校正数据获取电路205被配置成基于第一音频信号的能量和间接回声估计的能量来获取校正数据。
图2b示意性地示出了根据本发明的另一个实施例的数据处理器106的框图。数据处理器106包括间接回声获取电路201、能量获取电路203和校正数据获取电路205,其中间接回声获取电路201包括时间窗口2011、第一分析滤波器2013,能量获取电路203包括第一1/3倍频程对数能量计算器2031、第二分析滤波器2033、第二1/3倍频程对数能量计算器2035,并且校正数据获取电路205包括1/3倍频程参考频率响应2051。
在一些实施例中,时间窗口2011可以通过根据回声的时间序列移除直接回声估计来截断完整回声估计。
在一些实施例中,在从完整回声估计的开始时间点到开始时间点后的约10到20毫秒的时间段内,时间窗口2011可以通过移除回声估计来截断完整回声估计。具体来说,在声音以343米/秒,或每秒1000英尺传播的情况下,假设扬声器103的脉冲响应相当短,其中截止频率等于或高于100Hz并且衰减,并且进一步假设麦克风104位于扬声器103的一英尺内,超过约10到20毫秒的完整回声估计的部分可以被认为是间接回声估计。在一些实施例中,在从完整回声估计的开始时间点到开始时间点后的20毫秒的时间段内,时间窗口201可以通过移除回声估计来截断完整回声估计。具体来说,对于10英尺×10英尺或更大的房间,超过20毫秒的完整回声估计的部分主要包括从墙到墙在房间周围反弹并被房间中的对象吸收的反射,其中声能由于吸收而衰减。在一些实施例中,时间窗口2011的大小可以基于诸如房间的高度、房间中的对象布置等的实际情况来确定。时间窗口2011可以提供用于第一分析滤波器2013的截断回声估计。
第一分析滤波器2013被配置成通过执行傅立叶变换(例如,FFT算法)将已截断回声估计从时域表示转换成频域表示,并且然后通过应用包括低通滤波器、高通滤波器和一组带通滤波器的滤波器组将已截断回声估计分成一组子带已截断回声估计。然后,第一分析滤波器203可以为第一1/3倍频程对数能量计算器2031提供该组子带已截断回声估计。
在一些实施例中,第一1/3倍频程对数能量计算器2031被配置成基于该组子带已截断回声估计来获取每个1/3倍频程频带中的一组能量,并且将所获取的该组能量转换成分贝表示。具体地,只要在所有频带中随时间存在能量,回声消除器105通常在调整所有频率的回声估计方面做得很好。如果某些频段相对于其他频段其中没有太多的短期能量,则回声消除器105将倾向于尤其强调最小化具有高能级的回声估计中的误差。通常,回声消除器被设计成使总回声能量最小化,使得与具有高能级的频带相比,具有低能级的频带具有更差的估计。因此,应用对数能量以确保不过度强调具有高能级的频带,并且不忽略具有低能级的频带。
在一些实施例中,为第二分析滤波器2033提供第一音频信号。第二分析滤波器2033被配置成通过执行傅里叶变换(例如FFT算法)将第一音频信号从时域表示转换成频域表示,并且然后通过应用包括低通滤波器、高通滤波器和一组带通滤波器的滤波器组将第一音频信号分成一组子带第一音频信号。然后,第二分析滤波器2033为第二1/3倍频程对数能量计算器2035提供该组子带第一音频信号。
在一些实施例中,第二1/3倍频程对数能量计算器2035被配置成基于该组子带第一音频信号来获取每个1/3倍频程频带中的一组能量,并且将所获取的该组能量转换成分贝表示。
进一步参考图2b,在一些实施例中,能量获取电路203还可以包括第一加法器2037,其中第一加法器2037被配置成获取从第一1/3倍频程对数能量计算器2031获取的一组对数能量与从第二1/3倍频程对数能量计算器2035获取的一组对数能量之间的差值以便获得一组净对数能量,其中该组净对数能量包括一组1/3倍频程对数能量。
在一些实施例中,校正数据获取电路205还可以包括第二加法器2053,其中第二加法器2053被配置成获取该组净对数能量与1/3倍频程参考频率响应2051的对数频率响应之间的差值,其中可以根据音频偏好(诸如用户用于优化耳机的音频质量的曲线、或者诸如特定型号扬声器的产品的特定要求)来选择参考频率响应2051。具体地,差值基于该组净对数能量指示到1/3倍频程参考频率响应2051的对数频率响应的距离。
在一些实施例中,可能以校正数据的方式为1/3倍频程实时均衡器102提供差值,并且1/3倍频程实时均衡器102可以基于校正数据来均衡下一个音频信号,以便将下一个音频信号与参考频率响应2051进行匹配。图3示意性地示出了根据本发明的实施例的1/3倍频程实时均衡器102的框图。1/3倍频程实时均衡器102包括低通滤波器301、一组带通滤波器303、高通滤波器305和增益因子生成器307。
本领域普通技术人员应理解,可以通过根据标准文本公式的计算来获取低通滤波器301、该组带通滤波器303中的带通滤波器、和高通滤波器305的系数。低通滤波器301、该组带通滤波器303中的带通滤波器、和高通滤波器305被预先配置用于1/3倍频程实时均衡器102并实时保持恒定。在下一个音频信号通过低通滤波器301、该组带通滤波器303中的带通滤波器、和高通滤波器305之后,获得一组子带下一音频信号。
在一些实施例中,增益因子生成器307可以生成与低通滤波器301、该组带通滤波器303的带通滤波器和高通滤波器305相对应的一组因子,以便修改该组子带下一音频信号的增益以实时均衡下一个音频信号。用于生成该组因子的算法对于本领域普通技术人员来说是众所周知的。在一些实施例中,增益因子生成器307可以周期性地生成该组因子,其中可以基于诸如房间大小、音频质量要求等实际情况确定周期。在一些实施例中,增益因子生成器307可以基于校正数据获取一组校正因子,并且可以基于该组校正因子来获取该组因子。在一些实施例中,该组因子可以是该组校正因子。在一些实施例中,该组因子可以是该组校正因子的一部分。以此方式,可以实现稳定的均衡过程,并且可以避免过度补偿和不稳定。
在一些实施例中,增益因子生成器307可以设置在1/3倍频程实时均衡器102之外。在一些实施例中,增益因子生成器307可以设置在数据处理器106中。
在一个实施例中,增益因子生成器307可以基于在每5秒内获得的校正数据的平均值来每5秒生成一组校正因子,并且在随后步骤中应用10%的该组校正因子。在这种情况下,在200秒内,可以实现均衡音频信号与1/3倍频程参考频率响应2051的对数频率响应的匹配率为98%,并且可以在400秒内实现均衡音频信号与1/3倍频程参考频率响应2051的对数频率响应的匹配率为99.9%。在一些实施例中,可以应用其他时间段(例如,10秒、20秒、1分钟、5分钟)和该组校正因子的其他分数百分比(例如,5%、20%、40%)。
1/3倍频程实时均衡器102还包括加权求和子单元309,其包括一组乘法器和加法器,其中加权求和子单元309执行分别乘以该组因子的该组子带下一音频信号的加权求和。
因此,基于从数据处理器106输出的校正数据,1/3倍频程实时均衡器102可以在每个时间段自动均衡音频信号以便将音频信号的频率响应与期望的参考频率响应的频率响应相匹配,其中数据处理器106基于来自回声消除器105的回声估计实时生成校正数据。
本发明的实施例还提供一种用于均衡音频信号的方法。图4示意性地示出了根据本发明的实施例的用于均衡音频信号的方法400的流程图。
在S401中,数据处理器从音频源获得音频信号。
在S403中,数据处理器获取由从一个或多个对象离开的声音反射而引起的回声估计。具体地,在S4031中,从回声消除器获得先前音频信号的完整回声估计,并且在S4033中,截断完整回声估计以获取回声估计。
在一些实施例中,周期性地获得完整回声估计,其中基于回声消除器的先前回声估计的残差来确定周期。
在S405中,数据处理器基于音频信号和回声估计获取校正数据。具体地,在S4051中,获取音频信号的能量和回声估计的能量,并且在S4053中,基于音频信号的能量、回声估计的能量和与设备类型或声学环境相关的预设参考频率响应来获取校正数据。
具体地,在S4053a中,获取音频信号的能量与回声估计的能量之间的能量差,并且在S4053b中,基于能量差与预设参考频率响应之间的差值来获取校正数据。
在S407中,均衡器基于校正数据来均衡音频信号。具体地,基于一组校正因子来均衡音频信号,该组校正因子是基于校正数据获取的。在一些实施例中,通过基于该组校正因子改变音频信号的一组增益来均衡音频信号。在一些实施例中,通过基于该组校正因子的一部分改变音频信号的一组增益来均衡音频信号。
虽然本文已经公开了各个方面和实施例,但是其他方面和实施例对于本领域技术人员来说将是明显的。本文公开的各个方面和实施例是出于说明的目的而不是限制性的,其中真正的范围和精神由所附权利要求指示。

Claims (13)

1.一种用于均衡音频信号的方法,其特征在于,包括:
获得音频信号;
获取由从一个或多个对象离开的声音反射而引起的回声估计;
基于所述音频信号和所述回声估计获取校正数据;以及
基于所述校正数据来均衡所述音频信号,
所述获取所述回声估计包括:获得针对先前音频信号的完整回声估计;以及截断所述完整回声估计以获取所述回声估计,
其中,周期性地获得所述完整回声估计,并基于先前回声估计的残差来确定所述周期。
2.根据权利要求1所述的方法,其特征在于,基于所述音频信号和所述回声估计获取所述校正数据包括:获取所述音频信号的能量和所述回声估计的能量;以及基于所述音频信号的所述能量、所述回声估计的所述能量和与设备类型或声学环境相关的预设参考频率响应来获取所述校正数据。
3.根据权利要求2所述的方法,其特征在于,基于所述音频信号的所述能量、所述回声估计的所述能量和所述预设参考频率响应来获取所述校正数据包括:
获取所述音频信号的所述能量与所述回声估计的所述能量之间的能量差;以及
基于所述能量差与所述预设参考频率响应之间的差值来获取所述校正数据。
4.根据权利要求1所述的方法,其特征在于,基于所述校正数据来均衡所述音频信号包括:基于一组校正因子来均衡所述音频信号,所述一组校正因子是基于所述校正数据获取的。
5.根据权利要求4所述的方法,其特征在于,均衡所述音频信号包括基于所述一组校正因子改变所述音频信号的一组增益。
6.根据权利要求4所述的方法,其特征在于,均衡所述音频信号包括基于所述一组校正因子的一部分改变所述音频信号的一组增益。
7.一种用于均衡音频信号的装置,其特征在于,包括:
能量获取电路,其被配置成获取音频信号;
间接回声获取电路,其被配置成获取由从一个或多个对象离开的声音反射而引起的回声估计;
校正数据获取电路,其被配置成基于所述音频信号和所述回声估计获取校正数据;以及
均衡器,其被配置成基于所述校正数据均衡所述音频信号,
所述间接回声获取电路获取所述回声估计包括:
获得针对先前音频信号的完整回声估计;以及
截断所述完整回声估计以获取所述回声估计,
其中,所述间接回声获取电路周期性地获得所述完整回声估计,且所述周期是基于先前回声估计的残差确定的。
8.根据权利要求7所述的装置,其特征在于,所述能量获取电路还被配置成获取所述音频信号的能量和所述回声估计的能量。
9.根据权利要求8所述的装置,其特征在于,所述校正数据获取电路获取所述校正数据包括:
基于所述音频信号的所述能量、所述回声估计的所述能量和与设备类型或声学环境相关的预设参考频率响应来获取所述校正数据。
10.根据权利要求9所述的装置,其特征在于,所述校正数据获取电路获取所述校正数据包括:
获得所述音频信号的所述能量与所述回声估计的所述能量之间的能量差;以及
基于所述能量差与所述预设参考频率响应之间的差值来获取所述校正数据。
11.根据权利要求10所述的装置,其特征在于,所述均衡器均衡所述音频信号包括:
基于所述校正数据获取一组校正因子;以及
基于所述一组校正因子均衡所述音频信号。
12.根据权利要求11所述的装置,其特征在于,基于所述一组校正因子均衡所述音频信号包括:
基于所述一组校正因子改变所述音频信号的一组增益。
13.根据权利要求11所述的装置,其特征在于,基于所述一组校正因子均衡所述音频信号包括:
基于所述一组校正因子的一部分改变所述音频信号的一组增益。
CN201680091392.4A 2016-12-06 2016-12-06 用于均衡音频信号的方法和装置 Active CN110140294B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/108635 WO2018102976A1 (en) 2016-12-06 2016-12-06 Method and device for equalizing audio signals

Publications (2)

Publication Number Publication Date
CN110140294A CN110140294A (zh) 2019-08-16
CN110140294B true CN110140294B (zh) 2023-06-27

Family

ID=62491708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680091392.4A Active CN110140294B (zh) 2016-12-06 2016-12-06 用于均衡音频信号的方法和装置

Country Status (4)

Country Link
US (1) US10916257B2 (zh)
EP (1) EP3549259B1 (zh)
CN (1) CN110140294B (zh)
WO (1) WO2018102976A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112298030A (zh) * 2020-10-16 2021-02-02 中国第一汽车股份有限公司 一种电动汽车低速提示音装置频率响应测试系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102947878A (zh) * 2010-06-01 2013-02-27 高通股份有限公司 用于音频均衡的系统、方法、装置、设备和计算机程序产品
CN104969537A (zh) * 2012-12-21 2015-10-07 微软技术许可有限责任公司 回声抑制
CN105393560A (zh) * 2013-07-22 2016-03-09 哈曼贝克自动系统股份有限公司 自动音色、响度以及均衡控制
CN106105272A (zh) * 2014-03-17 2016-11-09 搜诺思公司 基于环境的音频设定

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR930011742B1 (ko) * 1991-07-23 1993-12-18 삼성전자 주식회사 청취공간 상태에 따른 재생 음성신호의 주파수 특성 보정장치
JP4668118B2 (ja) 2006-04-28 2011-04-13 ヤマハ株式会社 音場制御装置
EP1858295B1 (en) 2006-05-19 2013-06-26 Nuance Communications, Inc. Equalization in acoustic signal processing
US20090110218A1 (en) 2007-10-31 2009-04-30 Swain Allan L Dynamic equalizer
EP2444967A1 (en) 2010-10-25 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Echo suppression comprising modeling of late reverberation components

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102947878A (zh) * 2010-06-01 2013-02-27 高通股份有限公司 用于音频均衡的系统、方法、装置、设备和计算机程序产品
CN104969537A (zh) * 2012-12-21 2015-10-07 微软技术许可有限责任公司 回声抑制
CN105393560A (zh) * 2013-07-22 2016-03-09 哈曼贝克自动系统股份有限公司 自动音色、响度以及均衡控制
CN106105272A (zh) * 2014-03-17 2016-11-09 搜诺思公司 基于环境的音频设定

Also Published As

Publication number Publication date
WO2018102976A1 (en) 2018-06-14
EP3549259A4 (en) 2019-11-20
EP3549259A1 (en) 2019-10-09
EP3549259B1 (en) 2023-10-25
US10916257B2 (en) 2021-02-09
US20200082839A1 (en) 2020-03-12
CN110140294A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
US10891931B2 (en) Single-channel, binaural and multi-channel dereverberation
US10225657B2 (en) Subband spatial and crosstalk cancellation for audio reproduction
US20130129100A1 (en) Processing audio signals
CN112235695B (zh) 用于音频信号串扰处理的方法、系统及介质
US8761410B1 (en) Systems and methods for multi-channel dereverberation
CN111354368B (zh) 补偿处理后的音频信号的方法
CN106797517B (zh) 用于净化音频信号的多耳mmse分析技术
CN110140294B (zh) 用于均衡音频信号的方法和装置
US9848274B2 (en) Sound spatialization with room effect
CN109791773B (zh) 音频输出产生系统、音频通道输出方法和计算机可读介质
Wallin et al. Perceptual quality of hybrid echo canceler/suppressor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant