CN109545233A - 用于处理音频信号以在音频装置上重放的系统和方法 - Google Patents

用于处理音频信号以在音频装置上重放的系统和方法 Download PDF

Info

Publication number
CN109545233A
CN109545233A CN201811064528.XA CN201811064528A CN109545233A CN 109545233 A CN109545233 A CN 109545233A CN 201811064528 A CN201811064528 A CN 201811064528A CN 109545233 A CN109545233 A CN 109545233A
Authority
CN
China
Prior art keywords
signal
subband signal
drc
premenstrual
feed voltage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811064528.XA
Other languages
English (en)
Other versions
CN109545233B (zh
Inventor
尼古拉斯·R·克拉克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mimi Hearing Technologies GmbH
Original Assignee
Mimi Hearing Technologies GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mimi Hearing Technologies GmbH filed Critical Mimi Hearing Technologies GmbH
Publication of CN109545233A publication Critical patent/CN109545233A/zh
Application granted granted Critical
Publication of CN109545233B publication Critical patent/CN109545233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/20Combinations of two or more types of control, e.g. gain control and tone control in frequency-selective amplifiers
    • H03G9/24Combinations of two or more types of control, e.g. gain control and tone control in frequency-selective amplifiers having semiconductor devices
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/26Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifying stages as well as in frequency-selective amplifying stages
    • H03G9/30Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifying stages as well as in frequency-selective amplifying stages all amplifying stages having semiconductor devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/35Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
    • H04R25/356Amplitude, e.g. amplitude shift or compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/041Adaptation of stereophonic signal reproduction for the hearing impaired
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Abstract

提供用于处理音频信号以在音频装置上重放的系统和方法。使用带通滤波器将音频信号频谱分解为多个子带信号。将所述子带信号中的每一个提供到相应的调制器,并且随后从调制器输出端提供到包括第一动态范围压缩器DRC的相应的第一处理路径。通过相应的所述第一DRC前馈压缩每个子带信号以获得经前馈压缩的子带信号,其中相对于瞬时DRC来减慢所述第一DRC。随后,将每个经前馈压缩的子带信号提供到包括第二DRC的第二处理路径,其中通过相应的所述第二DRC压缩所述经前馈压缩的子带信号并将其输出到相应的所述调制器。然后,根据所述第二处理路径的输出来执行所述子带信号的调制。最后,重组所述经前馈压缩的子带信号。

Description

用于处理音频信号以在音频装置上重放的系统和方法
发明领域
本发明总体涉及数字信号处理(DSP)、音频工程和听力学领域,更具体地,涉及用于处理音频信号以在音频装置上重放(例如,用于在音频装置上提供增强的收听体验)的系统和方法。
背景技术
传统的DSP声音个性化方法通常依赖于根据用户的听力曲线来应用补偿频率增益的均衡技术(参见例如美国专利第9,138,178号、第9,468,401号、第9,680,438号、第9898248号)。典型地,采用纯音阈值(PTT)听力测试来识别用户表现出提高的听力阈值的频率。基于听力图数据,然后相应地调制频率输出。在这方面,增强用户的声音体验的方法是一维的。增益可以使得用户能够重新捕获先前无法听到的频率,但是他们随后可能经历响度不适。虽然听力阈值提高,但是相较正常听力的收听者来说,具有感觉神经性听力损失的收听者典型地具有类似的或甚至减少的不适阈值。就此而言,它们动态范围较窄,并且从长远看,简单地添加EQ增益将不利于对其听觉健康(图1)。
动态范围压缩(DRC)可以用于通过放大更安静的声音、同时降低响亮声音的音量来解决此问题,从而缩小音频的动态范围。然而,这可能会造成问题,因为低频的隆隆声可能阻止感兴趣的高频声音的放大。出于这个原因,助听器处理器采用宽动态范围压缩,其中最微弱的声音被显著地放大,而高强度的声音则没有放大。就此而言,常规的助听器被设计为用于现实世界的情况,其中宽动态范围的声音与收听者相关,即,收听者想要理解声波信息,诸如在他们面前大声说话的人,同时,他们希望能够在街上行走时检测到从远处接近他们的汽车的微弱声音。虽然这适用于实际的现实世界,但是在移动装置或其它类似的装置上消耗的音频内容与人们日常生活中将遇到的在声音上有非常不同的信号统计,因此要求采用不同的处理策略来向收听者具有有益的个性化体验。
数字地重建健康人类听觉的功能处理的能力将使得能够为听力受损(HI)的用户提供更自然且更清晰的收听体验。直到最近,人耳的物理特性才得到了良好的表征。人耳将声音预处理成对于传输到大脑以理解声音环境来说最佳的格式。预处理可以被建模为多个分层信号处理和反馈回路,其中许多是非线性的,以产生复杂的非线性系统。虽然听力损失典型地在较高的频率下开始,但是知道他们有听力损失的收听者典型地不抱怨不存在高频率的声音。相反,他们报告在嘈杂的环境中和在复杂的声音混合体中听出细节(诸如在音频流中)的收听困难。本质上,对于HI个体来说,越限频率声音更容易地用其它频率的能量掩蔽信息—曾经清晰且细节丰富的音乐变得混乱。这是因为音乐本身是高度自我掩蔽的。
随着听力恶化,耳朵的信号调节能力开始下降,并且因此HI收听者需要花费更多的精力来理解复杂的声学场景中的感兴趣的声音(或完全地错过信息)。听力图中的提高的阈值不仅是听觉敏感度的降低,也还是听觉系统内的一些更深层的过程的故障的结果,听觉系统具有超出微弱声音的检测的影响。
最近的研究试图更好地模拟人耳的物理模型,以为基底膜、内侧橄榄耳蜗复合体以及中耳内的内毛细胞和外毛细胞的互连建模。基于助听器格式技术,Clark等人(2012)开发一种算法来更好地模拟人类听力,以模仿内侧橄榄耳蜗对基底膜的衰减效应,来自前述的数据表明这可能会提高噪声下语音的稳健性(参见:Clark等人,A frequency-selectivefeedback model of auditory efferent suppression and its implications for therecognition of speech in noise,Journal of the acoustical society of America,第132卷,第3期,第1535至1541页,2012)。这个结果通过在频谱分解系统内对双共振非线性(DRNL)算法实现延迟反馈衰减控制(DFAC)来实现(对于DRNL,参见:E.Lopez-Poveda和R.Meddis,A human nonlinear cochlear filterbank,Journal of the acousticalsociety of America,第110卷,第6期,第3107至3118页,2001)。DRNL算法包括瞬时动态范围压缩。
然而,这种算法仅用作用于对听力系统建模的框架,而非专门用于声音增强。就此而言,由于缺乏对失真产物的控制而导致的主观听力体验存在一些缺点。这些包括用于控制失真的能力的降低、有限的频率分辨率,以及可能导致声音的时间拖尾(如果与窄带滤波器结合地使用)和因此降低的清晰度的相位失真。即,虽然这个算法如果由听力困难的用户使用,那么可能潜在地改进现实世界用例的某些方面,但是它将无法改进在音频情景中更广泛的类别的收听者的收听体验。因此,本发明的目的是创建一种为收听者提供有益的声音个性化的改进的、生物上启发的DSP。
发明内容
在如下所述的本发明中将至少部分地解决已知的现有技术中产生的问题。根据本发明的特征在独立权利要求中进行指定,其有利的实现方式将在从属权利要求中示出。可以以任何技术上有意义的方式组合权利要求的特征,并且可以考虑来自以下描述的解释以及示出本发明的另外的实施方案的附图的特征。
通过创建更接近地模仿健康人耳的功能处理的改进的、生物上启发的DSP算法,所提出的技术解决现有技术DSP方法中固有的局限性,即,由带之间的群延迟差异导致的不良的频率分辨率和时间拖尾。就此而言,本发明在音频装置上为听力困难的收听者以及具有低到中度听力损失的个体两者提供了增强的收听体验,它们会体验到更清晰的收听体验。
一般,该技术具有用于处理音频信号以在音频装置上重放的方法。具体地讲,方法可以是处理音频信号以在音频装置上(例如,当在音频装置上重放时)提供增强的听力体验的方法。
根据一个方面,一种处理音频信号以在音频装置上重放的方法可以包括a)使用带通滤波器(例如,输入带通滤波器)将音频信号频谱分解以形成多个频带(例如,形成多个子带信号,每个子带信号在相应的频带中)。方法还可以包括b)针对每个频带,将频带中的音频信号(例如,子带信号)提供到相应的调制器,并且从调制器输出端将频带中的音频信号提供到相应的第一动态范围压缩器(例如,作为第一DRC的示例的前馈DRC)。前馈DRC可以是用于相应的频带(或子带信号)的第一处理路径的部分,并且可以将频带中的(经调制的)音频信号(例如,子带信号)提供到第一处理路径。第一处理路径可以称为前馈路径。方法还可以包括c)针对每个频带,前馈压缩频带中的经调制的音频信号(例如,经调制的子带信号)以获得在相应的频带中的经前馈压缩的音频信号(例如,经前馈压缩的子带信号)。其中,相对于瞬时DRC来减慢前馈DRC。这种减慢可以直接地或间接地完成。由于这种对动态范围压缩的减慢,可以控制谐波失真和互调失真产物的频谱扩展。可以将经前馈压缩的频带(例如,在频带中的经前馈压缩的音频信号,或经前馈压缩的子带信号)提供到相应的压缩输出。方法还可以包括d)针对每个频带,从相应的压缩输出反馈压缩每个经前馈压缩的频带。为此,可以将每个经前馈压缩的频带提供到包括相应的第二DRC的相应的第二处理路径。第二处理路径可以称为反馈路径。第二DRC可以称为反馈DRC(作为第二DRC的示例)。此外,可以相对于前馈DRC来延迟反馈DRC。也就是说,可以例如通过延迟元件(诸如像缓冲器)故意地延迟第二处理路径的输出。可以在反馈DRC之前或之后插入延迟。然后,将(延迟的)经反馈压缩的频带提供到用于相应的频带的调制器。一般,将第二处理路径的输出提供到相应的调制器。调制器可以根据第二处理路径的输出(例如,在其控制下)来操作。调制器可以根据第二处理路径的输出来在步骤c的压缩输入处提供衰减。方法还可以包括:e)重组经前馈压缩的频带(例如,在频带中的经前馈压缩的音频信号,或经前馈压缩的子带信号)。
如上配置,所提出的方法具有为用户提供增强的收听体验的优点和技术效果。这是通过使用模拟健康人类听觉系统的功能处理的技术处理音频信号来实现的。
在一个实施方案中,输入带通滤波器是相位线性的。在另一个实施方案中,相位线性输入带通滤波器是在频域中操作的有限脉冲响应滤波器。
根据另一方面,一种处理音频信号以在音频装置上(例如,当在音频装置上重放时)提供增强的听力体验的方法可以包括:将未处理的音频信号分到第一信号通路和第二信号通路中;处理第一信号通路中的音频信号;以及将第一信号通路和第二信号通路的输出按一定比率重组。第一信号通路中的处理可以包括:a)使用带通滤波器执行音频信号的频谱分解以形成多个子带信号。第一信号通路中的处理还可以包括:b)针对每个子带信号,将子带信号提供到相应的调制器,并且从调制器输出端将子带信号提供到包括第一动态范围压缩器DRC的相应的第一处理路径。第一处理路径可以称为前馈路径。第一信号通路中的处理还可以包括:c)针对每个子带信号,通过相应的第一DRC前馈压缩子带信号以获得在相应的频带中的经前馈压缩的子带信号(例如,经前馈压缩的子带信号)。其中,相对于瞬时DRC来减慢前馈DRC。这种减慢可以直接地或间接地完成。由于这种对动态范围压缩的减慢,可以控制谐波失真和互调失真产物的频谱扩展。可以将经前馈压缩的频带(例如,在频带中的经前馈压缩的音频信号,或经前馈压缩的子带信号)提供到相应的压缩输出。第一信号通路中的处理还可以包括:d)从相应的压缩输出反馈压缩每个经前馈压缩的频带。为此,可以将每个经前馈压缩的频带提供到包括相应的第二DRC的相应的第二处理路径。第二处理路径可以称为反馈路径。第二DRC可以称为反馈DRC(作为第二DRC的示例)。此外,可以相对于前馈DRC来延迟反馈DRC。也就是说,可以例如通过延迟元件(诸如像缓冲器)故意地延迟第二处理路径的输出。可以在反馈DRC之前或之后插入延迟。然后,将(延迟的)经反馈压缩的频带提供到用于相应的频带的调制器。一般,将第二处理路径的输出提供到相应的调制器。调制器可以根据第二处理路径的输出(例如,在其控制下)来操作。调制器可以根据第二处理路径的输出来在步骤c的压缩输入处提供衰减。在第一信号通路中处理还可以包括:e)重组经前馈压缩的频带(例如,在频带中的经前馈压缩的音频信号,或经前馈压缩的子带信号)。
在一个实施方案中,输入带通滤波器是相位线性的。在另一个实施方案中,相位线性输入带通滤波器是在频域中操作的有限脉冲响应滤波器。
根据另一方面,在一种处理音频信号以在音频装置上(例如,当在音频装置上重放时)提供增强的听力体验的方法中,还可以将子带信号本身分到第一信号通路和第二信号通路中,并且将它们按一定比率重组。因此,方法可以包括a)使用带通滤波器执行音频信号的频谱分解以形成多个子带信号。方法还可以包括b)针对每个子带信号,将子带信号分到第一信号通路和第二信号通路中,处理第一信号通路中的子带信号,并且将第一信号通路和第二信号通路按一定比率重组以获得经处理的子带信号。处理第一信号通路中的子带信号可以包括b1)将频带中的音频信号(例如,子带信号)提供到相应的调制器,并且从调制器输出端将频带中的音频信号提供到相应的第一动态范围压缩器(例如,提供到第一DRC的示例的前馈DRC)。前馈DRC可以是用于相应的频带(或子带信号)的第一处理路径的部分,并且可以将频带中的(经调制的)音频信号(例如,子带信号)提供到第一处理路径。第一处理路径可以称为前馈路径。处理第一信号通路中的子带信号还可以包括b2)通过相应的第一DRC前馈压缩频带中的音频信号(例如,经调制的子带信号)以获得经前馈压缩的音频信号(例如,经前馈压缩的子带信号)。其中,相对于瞬时DRC来减慢前馈DRC。这种减慢可以直接地或间接地完成。由于这种对动态范围压缩的减慢,可以控制谐波失真和互调失真产物的频谱扩展。可以将经前馈压缩的频带(例如,在频带中的经前馈压缩的音频信号,或经前馈压缩的子带信号)提供到相应的压缩输出。处理第一信号通路中的子带信号还可以包括b3)从相应的压缩输出反馈压缩每个经前馈压缩的频带。为此,可以将经前馈压缩的频带提供到包括相应的第二DRC的相应的第二处理路径。第二处理路径可以称为反馈路径。第二DRC可以称为反馈DRC(作为第二DRC的示例)。此外,可以相对于前馈DRC来延迟反馈DRC。也就是说,可以例如通过延迟元件(诸如像缓冲器)故意地延迟第二处理路径的输出。可以在反馈DRC之前或之后插入延迟。然后,将(延迟的)经反馈压缩的频带提供到用于相应的频带的调制器。一般,将第二处理路径的输出提供到相应的调制器。调制器可以根据第二处理路径的输出(例如,在其控制下)来操作。调制器可以根据第二处理路径的输出来在步骤b3的压缩输入处提供衰减。方法还可以包括:c)重组经前馈压缩的频带(例如,在频带中的经前馈压缩的音频信号,或经前馈压缩的子带信号)。
在一个实施方案中,输入带通滤波器是相位线性的。在另一个实施方案中,相位线性输入带通滤波器是在频域中操作的有限脉冲响应滤波器。
根据另一方面,一种处理音频信号以在音频装置上(例如,当在音频装置上重放时)提供增强的听力体验的方法可以包括a)使用带通滤波器(例如,输入带通滤波器)将音频信号频谱分解以形成多个频带(例如,形成多个子带信号,每个子带信号在相应的频带中)。方法还可以包括b)针对每个频带,将频带中的音频信号(例如,子带信号)提供到相应的调制器,并且从调制器输出端将频带中的音频信号提供到相应的第一动态范围压缩器(例如,作为第一DRC的示例的前馈DRC)。前馈DRC可以是用于相应的频带(或子带信号)的第一处理路径的部分,并且可以将频带中的(经调制的)音频信号(例如,子带信号)提供到第一处理路径。第一处理路径可以称为前馈路径。方法还可以包括c)针对每个频带,前馈压缩频带中的经调制的音频信号(例如,经调制的子带信号)以获得在相应的频带中的经前馈压缩的音频信号(例如,经前馈压缩的子带信号)。其中,相对于瞬时DRC来减慢前馈DRC。这种减慢可以直接地或间接地完成。由于这种对动态范围压缩的减慢,可以控制谐波失真和互调失真产物的频谱扩展。可以将经前馈压缩的频带(例如,在频带中的经前馈压缩的音频信号,或经前馈压缩的子带信号)提供到相应的压缩输出。方法还可以包括d)针对每个频带,将经前馈压缩的子带信号提供到包括第二DRC的第二处理路径,并还将来自相邻频带的一个或多个经前馈压缩的子带信号提供到第二处理路径,每个经前馈压缩的子带信号用相应的加权因子加权。其中,在第二处理路径中,通过相应的第二DRC压缩经前馈压缩的子带信号和来自相邻频率子带的加权的经前馈压缩的子带信号。第二DRC可以称为反馈DRC(作为第二DRC的示例)。此外,可以相对于前馈DRC来延迟反馈DRC。也就是说,可以例如通过延迟元件(诸如像缓冲器)故意地延迟第二处理路径的输出。可以在反馈DRC之前或之后插入延迟。然后,将(延迟的)经反馈压缩的频带提供到用于相应的频带的调制器。一般,将第二处理路径的输出提供到相应的调制器。调制器可以根据第二处理路径的输出(例如,在其控制下)来操作。调制器可以根据第二处理路径的输出来在步骤c的压缩输入处提供衰减。方法还可以包括:e)重组经前馈压缩的频带(例如,在频带中的经前馈压缩的音频信号,或经前馈压缩的子带信号)。
在一个实施方案中,输入带通滤波器是相位线性的。在另一个实施方案中,相位线性输入带通滤波器是在频域中操作的有限脉冲响应滤波器。
模仿健康人类的功能处理的DSP方法对于创建丰富的客观收听体验和主观收听体验是至关重要的。通过声音处理更精确地重建基底膜和MOC的动作,HI收听者和健康的收听者两者在音频装置上享受更清晰、更自然的声音。
除非另外定义,否则本文使用的所有技术术语和科学术语具有与本公开所属的领域的普通技术人员通常所理解的相同的含义。
如本文所用的术语“音频装置”被定义为输出音频的任何装置,包括但不限于:移动电话、计算机、电视机、助听器、耳机和/或扬声器系统。
如本文所用的短语“动态范围压缩”或“DRC”被定义为减小音频信号的动态范围的音频过程。压缩器可以具有前馈设计或反馈设计。动态范围压缩可以瞬间发生,或速率可以通过调整压缩器的起始和释放时间常数来控制。
如本文所用的短语“间接地减慢”被定义为通过除调整压缩器的开始和释放时间之外的手段(诸如通过多速率信号处理)来减慢DRC。
如本文所用的短语“直接地减慢”被定义为通过调整压缩器的起始和释放时间常数来减慢DRC。
如本文所用的短语“带通滤波器”被定义为(基本上)使特定范围内的频率通过并衰减该范围之外的频率的装置。
如本文所用的短语“相位线性”被定义为如下性质,其中滤波器的相位响应是频率的线性函数,使得输入信号的所有频率分量在时间上偏移相同的恒定量,以不造成相位失真。
如本文所用的短语“谐波失真”被定义为产生由非线性系统导致的原始频率的倍数。
如本文所用的短语“互调失真”被定义为产生当两个或更多个信号在非线性系统中混合时所产生的叉积频率。
如本文所用的短语“计算机可读存储介质”被定义为固态非暂时存储介质,包括但不限于:具有闪存存储器的USB存储装置、CD-ROM、DVD或磁盘或磁带。它还可以是用户可访问的服务器中的物理存储地点,例如,以进行下载来在她的装置上安装计算机程序或进行云计算。
附图说明
为了描述可以获得本公开的上述和其它优点和特征的方式,将通过参考其特定的实施方案来呈现以上简要地描述的原理的更具体的描述,其特定的实施方案在随附附图中示出。应理解,这些附图仅示出了本公开的示例实施方案,并且因此不应认为是对其范围的限制,通过使用随附附图,用附加的特征和细节来描述和解释本文的原理,其中:
图1示出了显示听力受损的收听者的动态范围减小的图;
图2示出了听觉系统的处理模型以及影响听力调制的传入通路和传出通路;
图3示出了现有技术助听器电路;
图4示出了由基底膜和内侧橄榄耳蜗复合体启发的核心数字信号处理电路;
图5示出了一个示例实施方案,其中信号被频谱分解、并行压缩和重组;
图6示出了使用图5的配置减少频率失真的频谱图;
图7示出了本文公开的生物设计的DSP技术的示例,其锐化了HI对象的心理测量调谐曲线;
图8示出了来自两个压缩的测试信号的失真模式;当测试信号偏移到更接近带通滤波器的假设边缘处时,失真模式在不采用输出带通滤波器时更对称;
图9示出了另一个实施方案,其中信号被分到第一信号通路和第二信号通路(经处理的通路和未处理的通路)中,并且随后按用户限定的比率重组;
图10示出了另一个实施方案,其中信号被分到第一信号通路和第二信号通路中,并且随后按用户限定的比率重组;
图11示出了另外的实施方案,其中在每个频带中,信号被分到第一信号通路和第二信号通路中,其随后可以根据频带按各种用户限定的比率重组;
图12示出了使用在经频谱分解的音频信号中使用图11的结构的技术的更广泛的示例;
图13示出了其中反馈DRC中的控制信号可以包括相邻频带中的相同信号的加权版本的示例;
图14示出了用于实现本技术的某些方面的系统的示例。
具体实施方式
以下详细地讨论本公开的各种示例实施方案。虽然讨论了特定的实现方式,但是应理解,这仅是出于说明目的进行的。相关领域的技术人员将认识到,在不脱离本公开的精神和范围的情况下,可以使用其它部件和配置。
为了创建模仿人耳的功能处理的音频处理算法,必须首先开发健康听觉的框架。一般,正常听力模型由级联级组成,以模拟听觉系统中的信号处理通路的生理部分。该模型由Meddis,R.开发(参见Meddis,R.,N.R.Clark,W.Lecluyse和T.Jürgens,“BioAid–ABiologically Inspired Hearing Aid”,Audiological Acoustics 52:2013,148-152,2013),旨在提供听觉神经发放模式的忠实表示,如图2中的听觉外周的模型中所见。最初,对声学输入信号进行滤波—模仿外耳和中耳201对声压进行频率相关传递以使镫骨位移。随后,使用滤波器组202将信号分解为频带。滤波器组由非线性路径组成,以为外毛细胞的贡献和线性路径建模,来为基底膜的被动响应建模。随后的阶段模拟立体位移、内毛细胞203潜在波动,并且最后递质释放到位于内毛细胞与听觉神经205之间的突触间隙204中。
为了对同侧声反射(AR)206和同侧内侧橄榄耳蜗反射(MOC)207建模,添加两个传出反馈回路。MOC 207反馈回路音调上实现为滤波器组的非线性路径中的活动衰减—衰减量由脑干208级别上的对应频带中的总尖峰活动控制。BM响应的MOC衰减在声刺激的稳定部分期间累积,并且在刺激偏移之后以50ms的时间常数衰减。在刺激开始和MOC衰减开始之间的10ms延迟用于模拟突触潜伏期。声反射206被实现为对所有神经元的总活动的镫骨反应的衰减。
这种健康听力模型形成了Meddis等人的“BioAid算法”的基础,如图3所示。首先,在控制输入301处提供音频信号,然后,通过输入带通滤波器303(其为递归的无限脉冲响应(IIR)滤波器,并且因此引入相位失真)将音频信号频谱分解302以形成多个频带。在具有全都相同的运算器但具有不同的参数的示意性地示出的多个并行信道中处理每个频带。在压缩输入304处提供每个相应的频带,压缩输入304由瞬时动态范围压缩器305(具有时间常数零)前馈压缩。从压缩输出306,音频信号由反馈DRC 307处理,其中反馈DRC 307相对于瞬时DRC 305被延迟。随后,经由调制器308调制经压缩的音频信号以衰减提供到瞬时前馈DRC的音频信号。
延迟反馈DRC处理被表征为两个可调整的参数:阈值参数和强度参数。阈值参数指定来自瞬时前馈DRC的输出的电平,在该电平下,反馈处理开始工作。管控在反馈处理活动时应用的衰减量的强度参数是一个标量,其乘以反馈处理过程的输入相对于反馈处理阈值的比率(以dB计)(从而得出以dB计的衰减值)。
来自压缩输出306的此经压缩的音频信号通过输出IIR带通滤波器309以控制失真的频谱扩展。这个次级IIR滤波器309具有与输入IIR带通滤波器303相同的通带。随后,经压缩的频带通过增益310调制,并且最后在运算器311中重组以形成再次在控制输出处提供的全宽带音频信号。
如前讨论,这种算法在由IIR滤波器303、309和瞬时DRC 305的使用和布置导致的主观听力体验上具有缺点。这个配置引起可听失真的不受约束的扩展,以引起对感知到的质量的负面影响,特别是对于具有较轻程度的听力损失的用户来说(参见例如图6、图8)。该算法被设计为助听器算法,以帮助在现实世界用例(例如,噪声中的语音)中的听力困难的收听者,并且因此将会是用于个性化音频内容的不良模型。就此而言,本发明的目的是改进广泛的NH和HI收听者的客观收听体验和主观收听体验。
在图4和图5中,示出了本发明的示例实施方案。在处理输入401处提供宽带音频信号,并且然后将其频谱分解501以形成多个频带(例如,形成多个子带信号,每个子带信号在相应的频带中)。例如,可以通过输入带通滤波器402、502执行频谱分解。
在压缩输入403处提供每个相应的频带,压缩输入403是通过前馈DRC 404前馈压缩的。相对于瞬时DRC来减慢前馈DRC 404(或由DRC 404施加的动态范围压缩)。这种减慢可能是直接的或间接的。可以通过除调整DRC的起始和/或释放时间常数之外的手段实现间接地减慢的前馈压缩。这可以通过使用有限脉冲响应滤波器、接着进行信号过采样来实现,这具有相对于瞬时DRC来减慢前馈压缩的净效果。在这种情况下,经压缩的频带被下采样,例如,下采样到原始的采样速率和/或足够的速率以进行进一步处理且实现声音质量。这种技术不仅提高算法计算效率,而且还提供独立于分析带宽参数化失真扩展的机会。在另一个实施方案中,通过调整DRC 404的起始和/或释放时间常数来直接地减慢前馈DRC 404。在两种情况下,这种减慢的压缩造成相对于现有技术的谐波失真和互调失真产物的频谱扩展的减少。
重要地,这种布置也替代了对输出带通滤波器309的需要,输出带通滤波器309造成剩余的谐波失真的更对称的分布。在健康听觉系统中,自然失真在基底膜的所有频率区域处对称地发散,因为耳蜗过程本身可以被认为是具有变化特性的连续性的共振系统。如图8所示,当给定频率的失真模式朝向输出带通滤波器的带边缘之一移动时,参见面板802、803,失真模式不对称地缩减,参见面板802。当不存在输出带通滤波器时,可以更好地保留谐波对称性。从而更好地仿真由基底膜产生的自然失真。
从压缩输出405,通过反馈DRC 406处理音频信号。相对于前馈DRC来延迟反馈DRC406。从前馈DRC过程的输出分出反馈通路。可以通过阈值化来衰减反馈通路以获得高于特定阈值的信号部分。然后,可以对这个信号低通滤波以进行时间平滑,并且可以将其乘以标量因子。可以通过使用缓冲器(诸如环形缓冲器)来实现前述延迟。这造成了衰减值流,以通过它们的延迟来模拟MOC反馈系统的突触延迟。随后,这个值流用于调制在每个频带内提供到前馈DRC 404的音频信号。调制、前馈压缩和反馈压缩以连续的方式进行。因此,反馈回路动态地使压缩适应音频信号电平,以使得能够更有效地减轻越限频率声音掩蔽(这是在听觉系统中生理上发生的过程)。
可以通过增益408调制经压缩的频带,并且最后在运算器503中重组以形成再次在控制输出504处提供的全宽音频带信号。每个频带可以具有其自己的不同参数,例如增益、衰减因子等。
图9中示出了本发明的另一个示例实施方案,其中根据图4至图5的配置处理的声音被分到第一信号发送通路和第二信号发送通路(或信号通路)中。具体地说,在处理输入901处提供宽带音频信号,并且然后将宽带音频信号分到第一通路(第一信号通路)902和第二通路(第二信号通路)903中。在这个示例中,第二通路903仅经受延迟904和保护限制器905。相比之下,在第一通路902中,将来自控制输入901的音频信号频谱分解并根据图4的配置进行处理。每个通路902、903可以分别包括加权运算器906和907。例如,这些加权运算器906和907可以通过公共函数相关,公共函数可以由用户通过单一控制变量910来调整。然后,在运算器908中根据这些通路902和903的加权因子将它们重组并提供到处理输出909。
并行压缩提供的益处是允许用户将“干”未处理或略处理的声音与“湿”经处理的声音混合,以使得能够根据主观偏好定制处理。例如,这使得听力受损的用户能够使用重度处理的声音相对于具有中度至低听力损失的用户的高比率。此外,通过调出最柔和的声音而不是降低最高尖峰来减小音频信号的动态范围,就可以为声音提供可听细节。人耳对音量突然减小的声音是敏感的,但是对音量增大的柔和声音不太敏感,并且这种混合方法利用了此发现,以相较孤立地使用动态范围压缩器来说而产生更自然的声音降低。另外,并行压缩对于语音理解和/或对于用完整的原始音色收听音乐是特别有用的。
要混合两个不同的信号通路就要求通路中的信号符合相位线性,或使用相位失真进入通路的相同相位,或通路混合调制器涉及相位校正网络,以便防止在对相关信号求和时发送任何相位抵消以向控制输出提供音频信号。值得注意的是,使用现有技术中的方法进行并行压缩是有问题的,因为递归的输入IIR带通滤波器和输出IIR带通滤波器将相位失真引入音频信号中。具有类似的音频信号的相位失真的信号的叠加可能导致所谓的梳状滤波效应,这不利地影响结果的音质。用户对这些效应是敏感的,这有损于主观听力体验。
图10中示出了本发明的另一个示例实施方案,其中在处理输入1001处提供宽带音频信号,并且然后利用与图3相同的处理配置将宽带音频信号分到第一经处理的通路1002(第一信号发送通路,或第一信号通路)和第二经处理的通路1003(第一信号发送通路或第一信号通路)中。类似于图9中的配置,每个经处理的通路的相位必须同步,以便防止相位抵消和梳状滤波效应。第二经处理的通路1003可以包括例如声音增强算法,诸如语音理解算法,以允许用户调整通路比率来为在相应的背景噪声环境中的用户实现更好的语音理解和/或具有主观上更舒适的音乐收听体验。另一示例还可以包括使用图4中所示的配置的不同地参数化的过程。一般,任何声音处理算法(诸如助听器算法,优选地具有线性相位特性)可以与第一经处理的通路1002混合。两个经处理的通路必须符合以下规则之一。每个通路中的信号必须(i)符合相位线性,(ii)引入相同的相位失真,或(iii)涉及相位校正网络,以便防止在对相关信号求和时发生任何相位抵消以形成输出。优选地,实现选项(i)或选项(ii),因为这允许了精简且简单的实现方式。
图11和图12中示出了本发明的另一个示例实施方案,其中在处理输入1101、1201处提供宽带音频信号,并且然后将其频谱分解以形成多个频带(例如,形成多个子带信号,每个子带信号在相应的频带中)。例如,可以通过输入带通滤波器1202来执行频谱分解。将每个相应的频带(例如,子带信号)分到第一通路(第一信号通路)1103和第二通路(第二信号通路)1104中。在这个示例中,轻度处理第二通路1104,因为它仅包括延迟1105和保护限制器1106。相比之下,类似于图5中所示的配置来处理第一通路1103的处理。即,在压缩输入处提供第一通路频带,压缩输入是通过前馈DRC 404前馈压缩的。从压缩输出,通过反馈DRC406处理音频信号,其中可以相对于前馈DRC 404来延迟反馈DRC 406。也就是说,可以例如通过延迟元件(诸如像缓冲器)故意地延迟反馈处理通路的输出。可以在反馈DRC之前或之后插入延迟。随后,可以经由调制器407调制经压缩的音频信号以衰减提供到前馈DRC 404的音频信号。然后,可以通过增益408、1107来调制经压缩的频带。第一频带通路和第二频带通路可以分别包括加权运算器1108和1109。这里,这些加权运算器1108和1109可以通过公共函数相关,公共函数可以由用户通过单一控制变量1112来调整。然后,在运算器1110中根据这些通路1103和1104的加权因子将它们重组并提供到处理输出1111。最后,在运算器1203中重组频带(例如,子带信号)以形成再次在控制输出1204处提供的全宽音频带信号。图11和图12的配置重要地允许用户更多地控制在信号的音频频谱中处理哪些频率。例如,在具有强烈高音的音乐作品中,可能优选地处理在较高的频率范围内的声音。相反,在集中在人类语音(大致约150Hz至4kHz)上时,处理可能集中在较窄频谱上。一般,出于计算节约目的,可以调整频谱处理。
图13中示出了本发明的另一个示例实施方案。在处理输入1301处提供宽带音频信号,并且然后将其频谱分解以形成多个频带(例如,形成多个子带信号,每个子带信号在相应的频带中)。例如,可以通过输入带通滤波器1302来执行频谱分解。在压缩输入1303处提供每个相应的频带,压缩输入1303是通过前馈DRC 1304前馈压缩的。相对于瞬时DRC来减慢前馈DRC 1304。这可以直接地或间接地发生,例如,以上述的方式发生。从多个频带1306的压缩输出1305(其中来自相应的频带的每个压缩输出被分配了单独的加权1307、1308、1309),通过反馈压缩1314处理相应的音频信号。虽然图13示出了仅针对单一频带从相邻频带馈送加权的经前馈压缩的音频信号,但是应理解,每个频带中的反馈压缩可以接收加权的经前馈压缩的音频信号作为来自相应的相邻频带的输入。可以相对于前馈DRC 1304来延迟反馈DRC 1314。也就是说,可以例如通过延迟元件(诸如像缓冲器)故意地延迟反馈DRC的输出。可以在反馈DRC之前或之后插入延迟。可以经由调制器1310调制多个延迟的经反馈压缩的音频信号以衰减提供到前馈DRC 1304的音频信号。然后,可以通过增益1311调制经压缩的频带,并且最后在运算器1312中重组以形成再次在控制输出1313处提供的全宽音频带信号。作为包括一个或多个相邻频带中的信号电平的函数来衰减给定频带中的音频信号的能力为增强的听力体验提供了更精细参数化程度。此外,这个过程在耳朵中的橄榄耳蜗系统中自然地发生(Effects of electrical stimulation of efferent olivochoclearneurons on cat auditory-nerve fibers.III,Tuning curves and thresholds at CF,Guinan&Gifford,1988)—并且因此这种音频处理配置更接近地为听觉干中的健康听力建模。
图14示出了计算系统1400(例如,音频装置、智能电话等)的示例,其中该系统的部件使用连接1405彼此通信。连接1405可以是经由总线的物理连接,或通向处理器1410中的直接连接,诸如在芯片组架构中。连接1405还可以是虚拟连接、网络连接或逻辑连接。
在一些实施方案中,计算系统1400是分布式系统,其中本公开中描述的功能可以分布在一个数据中心、多个数据中心、对等网络等中。在一些实施方案中,所述的系统部件中的一个或多个代表许多这样的部件,每个这样的部件都执行该部件被描述用于的功能的一些或全部。在一些实施方案中,部件可以是物理装置或虚拟装置。
示例系统1400包括至少一个处理单元(CPU或处理器)1410和连接1405,连接1405将包括系统存储器1415的各种系统部件(诸如只读存储器(ROM)和随机存取存储器(RAM))耦接到处理器1410。计算系统1400可以包括与处理器1410直接地连接、紧密接近处理器1410或集成为处理器1410的部分的高速存储器的高速缓存。
处理器1410可以包括任何通用处理器和被配置为控制处理器1410的硬件服务或软件服务(诸如存储在存储装置1430中的服务1432、1434和1436),以及其中软件指令结合到实际的处理器设计中的专用处理器。处理器1410可以基本上是完全地独立的计算系统,含有多个核心或处理器、总线、存储器控制器、高速缓存等。多核心处理器可以是对称的或非对称的。
为了实现用户交互,计算系统1400包括输入装置1445,其可以表示任何数量的输入机制,诸如用于语音的麦克风、用于手势或图形输入的触敏屏幕、键盘、鼠标、动作输入、语音等。在一些示例中,输入装置还可以包括音频信号,诸如通过音频插孔等等。计算系统1400还可以包括输出装置1435,输出装置1435可以是本领域的技术人员已知的多种输出机制中的一种或多种。在一些情况下,多模式系统可以使得用户能够提供多种类型的输入/输出以与计算系统1400通信。计算系统1400可以包括通信接口1440,通信接口1440通常可以管控和管理用户输入和系统输出。在一些示例中,通信接口1440可以被配置为经由一个或多个网络(例如,蓝牙、互联网等)接收一个或多个音频信号。对任何特定的硬件布置进行操作不存在限制,并且因此这里的基本特征在它们被开发时可以很容易地取代改进的硬件或固件布置。
存储装置1430可以是非易失性存储装置,并且可以是硬盘或可存储可由计算机访问的数据的其它类型的计算机可读介质,诸如磁带盒、闪存卡、固态存储装置、数字多功能磁盘、盒式磁带、随机存取存储器(RAM)、只读存储器(ROM)和/或这些装置的某种组合。
存储装置1430可以包括软件服务、服务器、服务等,当限定这样的软件的代码由处理器1410执行时,其致使系统执行功能。在一些实施方案中,执行特定的功能的硬件服务可以包括存储在计算机可读介质中的软件部件,其与必要的硬件部件(诸如处理器1410、连接1405、输出装置1435等)结合以执行功能。
为了解释清楚,在一些情况中,本技术可以被呈现为包括单独的功能块,单独的功能块包括如下的功能块,包括装置、装置部件、在软件中体现的方法中的步骤或例程,或硬件和软件的组合。
所提出的技术创建更接近地模仿健康人耳的功能处理的改进的、生物上启发的DSP算法。本发明避免了现有技术DSP方法中固有的限制,即,不受约束的频率失真和相位失真。就此而言,本发明为听力困难的个体以及听力健康的个体两者提供增强的收听体验,这些个体会体验到更丰富、更清晰的音频内容收听体验。
附加的实施方案
本公开的另外示例实施方案在以下列出的列举示例实施方案(EEE)中概述。
第一EEE涉及一种用于处理音频信号以在音频装置上重放的方法,所述方法包括:a)使用带通滤波器(402、502)执行所述音频信号(501)的频谱分解以形成多个子带信号;b)针对每个子带信号,将所述子带信号提供到相应的调制器(407),并且从调制器输出端将所述子带信号提供到包括第一动态范围压缩器DRC(404)的相应的第一处理路径;c)针对每个子带信号,通过相应的所述第一DRC(404)前馈压缩所述子带信号以获得经前馈压缩的子带信号;d)针对每个子带信号,将所述经前馈压缩的子带信号提供到包括第二DRC(406)的第二处理路径,通过相应的所述第二DRC(406)压缩所述经前馈压缩的子带信号,并且将所述第二处理路径的输出提供到相应的所述调制器(407),其中通过相应的所述调制器(407)调制所述子带信号是根据所述第二处理路径的所述输出来执行;以及e)重组所述经前馈压缩的子带信号,其中前馈压缩包括:针对每个子带信号,相对于瞬时DRC来减慢相应的所述第一DRC(404)。
第二EEE涉及一种处理音频信号以在音频装置上重放的方法,所述方法包括:将未处理的音频信号分到第一信号通路(903、1003)和第二信号通路(902、1002)中,处理所述第一信号通路(902、903)中的所述音频信号,以及将所述第一信号通路(903、1003)和所述第二信号通路(902、1002)的输出按一定比率(910、1004)重组,其中在所述第一信号通路(902、1002)中所述处理包括:a)使用带通滤波器(402、502)执行所述音频信号(501)的频谱分解以形成多个子带信号;b)针对每个子带信号,将所述子带信号提供到相应的调制器(407),并且从调制器输出端将所述子带信号提供到包括第一动态范围压缩器DRC(404)的相应的第一处理路径;c)针对每个子带信号,通过相应的所述第一DRC(404)前馈压缩所述子带信号以获得经前馈压缩的子带信号;d)针对每个子带信号,将所述经前馈压缩的子带信号提供到包括第二DRC(406)的第二处理路径,通过相应的所述第二DRC(406)压缩所述经前馈压缩的子带信号,并且将所述第二处理路径的输出提供到相应的所述调制器(407),其中通过相应的所述调制器(407)调制所述子带信号是根据所述第二处理路径的所述输出来执行;以及e)重组所述经前馈压缩的子带信号,其中前馈压缩包括:针对每个子带信号,相对于瞬时DRC来减慢相应的所述第一DRC(404)。
第三EEE涉及第二EEE的方法,其中所述比率(910、1004)是用户限定的比率。
第四EEE涉及根据第二EEE或第三EEE的方法,其中所述第二信号通路(903)具有延迟,并且延迟信号经受保护限制器。
第五EEE涉及根据EEE 2至4的方法,其中在所述第一信号通路(902、1002)中处理仅在125Hz与12,000Hz之间的频率。
第六EEE涉及一种用于处理音频信号以在音频装置上重放的方法,所述方法包括:a)使用带通滤波器(1102、1202)执行所述音频信号的频谱分解(1202)以形成多个子带信号;b)针对每个子带信号,将所述子带信号分到第一信号通路(1103)和第二信号通路(1103)中,处理所述第一信号通路(1103)中的所述子带信号,并且将所述第一信号通路(1103)和所述第二信号通路(1104)按一定比率重组以获得经处理的子带信号;以及c)重组所述经处理的子带信号,其中,针对每个子带信号,所述处理所述第一信号通路(1103)中的所述子带信号包括:b1)将所述子带信号提供到相应的调制器(407),并且从调制器输出端将所述子带信号提供到包括第一动态范围压缩器DRC(404)的相应的第一处理路径;b2)通过相应的所述第一DRC(404)前馈压缩所述子带信号以获得经前馈压缩的子带信号;以及b3)将所述经前馈压缩的子带信号提供到包括第二DRC(406)的第二处理路径,通过相应的所述第二DRC(406)压缩所述经前馈压缩的子带信号,并且将所述第二处理路径的输出提供到相应的所述调制器(407),其中调制所述子带信号是根据所述第二处理路径的所述输出来执行,并且其中前馈压缩包括:针对每个子带信号,相对于瞬时DRC来减慢相应的所述第一DRC(404)。
第七EEE涉及根据第六EEE的方法,其中所述第二信号通路(1104)具有延迟,并且延迟信号经受保护限制器。
第八EEE涉及一种用于处理音频信号以在音频装置上重放的方法,所述方法包括:a)使用带通滤波器执行所述音频信号的频谱分解(1302)以形成多个子带信号;b)针对每个子带信号,将所述子带信号提供到相应的调制器(407),并且从调制器输出端将所述子带信号提供到包括第一动态范围压缩器DRC(1304)的相应的第一处理路径;c)针对每个子带信号,通过相应的所述第一DRC(1304)前馈压缩所述子带信号以获得经前馈压缩的子带信号;d)针对每个子带信号,将所述经前馈压缩的子带信号提供到包括第二DRC(1314)的第二处理路径,并还将来自相邻频带的一个或多个经前馈压缩的子带信号提供到所述第二处理路径,每个经前馈压缩的子带信号用相应的加权因子加权,在所述第二处理路径中,通过相应的所述第二DRC(1314)压缩所述经前馈压缩的子带信号和来自相邻频率子带的所述加权的经前馈压缩的子带信号,并且将所述第二处理路径的输出提供到相应的所述调制器,其中调制所述子带信号是根据所述第二处理路径的所述输出来执行;以及e)重组所述经前馈压缩的音频信号,其中前馈压缩包括:针对每个子带信号,相对于瞬时DRC来减慢相应的所述第一DRC(1304)。
第九EEE涉及根据前述EEE中任一项的方法,还包括:针对每个子带信号,延迟相应的所述第二处理路径的所述输出(406)。
第十EEE涉及根据前述EEE中任一项的方法,其中针对每个子带信号,将相应的所述第二处理路径的所述输出延迟了在5ms至20ms的间隔中的延迟量。
第十一EEE涉及根据前述EEE中任一项的方法,其中所述带通滤波器(402、502)是相位线性的。
第十二EEE涉及根据前述EEE中任一项的方法,其中所述带通滤波器(402、502)是在频域中操作的有限脉冲响应滤波器。
第十三EEE涉及根据前述EEE中任一项的方法,其中作为所述频谱分解过程的部分,通过多速率信号处理来减慢所述第一DRC(404)。
第十四EEE涉及根据EEE 1至12中任一项的方法,其中通过改变所述第一DRC(404)的起始和/或释放时间常数来减慢所述第一DRC(404)。
第十五EEE涉及根据前述EEE中任一项的方法,其中所述音频装置是以下之一:移动电话、平板计算机、计算机、电视机、一副耳机、助听器或扬声器系统。
第十六EEE涉及根据前述EEE中任一项的方法,其中每一频带采用仅一个带通滤波器。
第十七EEE涉及一种音频输出装置,包括:处理器,所述处理器用于根据前述EEE中任一项的方法处理音频信号。
第十八EEE涉及一种计算机可读存储介质,所述算机可读存储介质存储致使音频输出装置根据EEE 1至16中任一项的方法执行音频处理的程序。
附图标记列表
201 外耳和中耳
202 滤波器组
203 内毛细胞(IHC)
204 IHC突触
205 听觉神经
206 声反射
207 MOC反射
208 脑干
301 控制输入
302 频谱分解
303 IIR输入带通滤波器
304 压缩输入
305 瞬时DRC
306 压缩输出
307 反馈DRC
308 调制器
309 IIR输出带通滤波器
310 增益
311 运算器
401 控制输入
402 输入带通滤波器
403 压缩输入
404 前馈DRC
405 压缩输出
406 反馈DRC
407 调制器
408 增益
501 频谱分解
502 输入带通滤波器
503 运算器
504 控制输出
601 频谱图—来自瞬时压缩(IC)输出端的失真(1kHz输入)
602 频谱图—来自具有输入IIR带通滤波器和输出IIR带通滤波器的IC输出端的失真
603 频谱图-来自具有输入FIR带通滤波器的DRC的失真
701 在暴露于根据权利要求1的算法之前和之后来自对象的心理物理调谐曲线—左耳
702 在暴露于根据权利要求1的算法之前和之后来自对象的心理物理调谐曲线—右耳
801 失真经过带通滤波器—处于中心
802 失真经过带通滤波器—从中心偏移
803 失真–无带通滤波器—处于中心
804 失真–无带通滤波器—从中心偏移
901 控制输入
902 经处理的通路
903 未处理的通路
904 延迟
905 保护限制器
906 经处理的通路加权运算器
907 未处理的通路加权运算器
908 重组两个通路
909 控制输出
910 单一控制变量
1001 控制输入
1002 经处理的通路1
1003 经处理的通路2
1004 控制变量
1101 控制输入
1102 输入带通滤波器
1103 经处理的频带通路
1104 未处理的频带通路
1105 延迟
1106 保护限制器
1107 增益
1108 经处理的频带通路加权运算器
1109 未处理的频带通路加权运算器
1110 单一控制变量
1111 控制输出
1201 控制输入
1202 输入带通滤波器
1203 重组频带
1204 控制输出
1301 控制输入
1302 输入带通滤波器
1303 主频带的压缩输入
1304 前馈DRC
1305 反馈DRC
1306 替代频带
1307 加权1
1308 加权2
1309 加权3
1310 调制器
1311 增益
1312 重组频带
1313 控制输出
1314 反馈DRC

Claims (20)

1.一种处理音频信号以在音频装置上重放的方法,所述方法包括:
使用带通滤波器执行所述音频信号的频谱分解以形成多个子带信号;
针对所述多个子带信号中的每个子带信号:
将所述子带信号提供到调制器,并且从调制器输出端将所述经调制的子带信号提供到包括第一动态范围压缩器(DRC)的第一处理路径;
通过所述第一DRC前馈压缩所述经调制的子带信号以获得经前馈压缩的子带信号,其中前馈压缩包括相对于瞬时DRC来减慢所述第一DRC;
将所述经前馈压缩的子带信号提供到包括第二DRC的第二处理路径,通过所述第二DRC压缩所述经前馈压缩的子带信号,以及
将所述第二处理路径的输出提供到所述调制器,其中通过所述调制器调制所述经前馈压缩的子带信号是根据所述第二处理路径的所述输出来执行;以及
重组所述经前馈压缩的子带信号。
2.如权利要求1所述的方法,所述方法还包括:
将未处理的音频信号分到第一信号通路和第二信号通路中,处理所述第一信号通路中的所述未处理的音频信号,并且将所述第一信号通路和所述第二信号通路的输出按一定比率重组。
3.如权利要求2所述的方法,其中所述比率是用户限定的比率。
4.如权利要求2所述的方法,其中所述第二信号通路具有延迟,并且延迟信号经受保护限制器。
5.如权利要求2所述的方法,其中在所述第一信号通路中处理在125Hz与12,000Hz之间的频率。
6.如权利要求1所述的方法,所述方法还包括:
针对所述多个子带信号中的每个子带信号:
将所述经前馈压缩的子带信号提供到包括第二DRC的第二处理路径;
将来自相邻频带的一个或多个经前馈压缩的子带信号提供到所述第二处理路径,每个经前馈压缩的子带信号用加权因子加权;以及在所述第二处理路径中,通过所述第二DRC压缩所述经前馈压缩的子带信号和来自相邻频率子带的所述加权的经前馈压缩的子带信号。
7.如权利要求1所述的方法,所述方法还包括:针对每个子带信号,延迟所述第二处理路径的所述输出。
8.如权利要求1所述的方法,其中针对每个子带信号,将所述第二处理路径的所述输出延迟了在5ms至20ms的间隔中的延迟量。
9.如权利要求1所述的方法,其中所述带通滤波器是相位线性的。
10.如权利要求1所述的方法,其中所述带通滤波器是在频域中操作的有限脉冲响应滤波器。
11.如权利要求1所述的方法,其中作为所述频谱分解过程的部分,通过多速率信号处理来减慢所述第一DRC。
12.如权利要求1所述的方法,其中通过改变所述第一DRC的起始和/或释放时间常数来减慢所述第一DRC。
13.如权利要求1所述的方法,其中所述音频装置是以下之一:移动电话、平板计算机、计算机、电视机、一副耳机、助听器或扬声器系统。
14.如权利要求1所述的方法,其中每一频带采用仅一个带通滤波器。
15.一种音频输出装置,所述音频输出装置包括:
至少一个处理器;以及
至少一个存储器,所述至少一个存储器存储指令,所述指令在执行时致使所述至少一个处理器:
使用带通滤波器执行音频信号的频谱分解以形成多个子带信号;
针对所述多个子带信号中的每个子带信号:
将所述子带信号提供到调制器,并且从调制器输出端将所述经调制的子带信号提供到包括第一动态范围压缩器(DRC)的第一处理路径;
通过所述第一DRC前馈压缩所述经调制的子带信号以获得经前馈压缩的子带信号,其中前馈压缩包括相对于瞬时DRC来减慢所述第一DRC;
将所述经前馈压缩的子带信号提供到包括第二DRC的第二处理路径,通过所述第二DRC压缩所述经前馈压缩的子带信号,以及
将所述第二处理路径的输出提供到所述调制器,其中通过所述调制器调制所述经前馈压缩的子带信号是根据所述第二处理路径的所述输出来执行;以及
重组所述经前馈压缩的子带信号。
16.如权利要求15所述的装置,所述装置还包括指令,所述指令在由所述至少一个处理器执行时致使所述至少一个处理器:
将未处理的音频信号分到第一信号通路和第二信号通路中,处理所述第一信号通路中的所述未处理的音频信号,并且将所述第一信号通路和所述第二信号通路的输出按一定比率重组。
17.如权利要求15所述的装置,所述装置还包括指令,所述指令在由所述至少一个处理器执行时致使所述至少一个处理器:
针对所述多个子带信号中的每个子带信号:
将所述经前馈压缩的子带信号提供到包括第二DRC的第二处理路径;
将来自相邻频带的一个或多个经前馈压缩的子带信号提供到所述第二处理路径,每个经前馈压缩的子带信号用加权因子加权;以及在所述第二处理路径中,通过所述第二DRC压缩所述经前馈压缩的子带信号和来自相邻频率子带的所述加权的经前馈压缩的子带信号。
18.至少一个非暂时计算机可读存储介质,所述至少一个非暂时计算机可读存储介质存储指令,所述指令在由至少一个处理器执行时致使所述处理器:
使用带通滤波器执行音频信号的频谱分解以形成多个子带信号;
针对所述多个子带信号中的每个子带信号:
将所述子带信号提供到调制器,并且从调制器输出端将所述经调制的子带信号提供到包括第一动态范围压缩器(DRC)的第一处理路径;
通过所述第一DRC前馈压缩所述经调制的子带信号以获得经前馈压缩的子带信号,其中前馈压缩包括相对于瞬时DRC来减慢所述第一DRC;
将所述经前馈压缩的子带信号提供到包括第二DRC的第二处理路径,通过所述第二DRC压缩所述经前馈压缩的子带信号,以及
将所述第二处理路径的输出提供到所述调制器,其中通过所述调制器调制所述经前馈压缩的子带信号是根据所述第二处理路径的所述输出来执行;以及
重组所述经前馈压缩的子带信号。
19.如权利要求18所述的至少一个非暂时计算机可读存储介质,所述至少一个非暂时计算机可读存储介质还包括指令,所述指令在由所述至少一个处理器执行时致使所述至少一个处理器:
将未处理的音频信号分到第一信号通路和第二信号通路中,处理所述第一信号通路中的所述未处理的音频信号,并且将所述第一信号通路和所述第二信号通路的输出按一定比率重组。
20.如权利要求18所述的至少一个非暂时计算机可读存储介质,所述至少一个非暂时计算机可读存储介质还包括指令,所述指令在由所述至少一个处理器执行时致使所述至少一个处理器:
针对所述多个子带信号中的每个子带信号:
将所述经前馈压缩的子带信号提供到包括第二DRC的第二处理路径;
将来自相邻频带的一个或多个经前馈压缩的子带信号提供到所述第二处理路径,每个经前馈压缩的子带信号用加权因子加权;以及在所述第二处理路径中,通过所述第二DRC压缩所述经前馈压缩的子带信号和来自相邻频率子带的所述加权的经前馈压缩的子带信号。
CN201811064528.XA 2018-06-20 2018-09-12 用于处理音频信号以在音频装置上重放的系统和方法 Active CN109545233B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP18178873.8A EP3584927B1 (en) 2018-06-20 2018-06-20 Systems and methods for processing an audio signal for replay on an audio device
EP18178873.8 2018-06-20
US16/019,230 2018-06-26
US16/019,230 US10199047B1 (en) 2018-06-20 2018-06-26 Systems and methods for processing an audio signal for replay on an audio device

Publications (2)

Publication Number Publication Date
CN109545233A true CN109545233A (zh) 2019-03-29
CN109545233B CN109545233B (zh) 2020-04-07

Family

ID=62748753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811064528.XA Active CN109545233B (zh) 2018-06-20 2018-09-12 用于处理音频信号以在音频装置上重放的系统和方法

Country Status (4)

Country Link
US (1) US10199047B1 (zh)
EP (1) EP3584927B1 (zh)
KR (1) KR102343447B1 (zh)
CN (1) CN109545233B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111741410A (zh) * 2020-06-15 2020-10-02 中科上声(苏州)电子有限公司 一种扬声器均衡中动态范围压缩器的配置方法及装置
CN113270105A (zh) * 2021-05-20 2021-08-17 东南大学 一种基于混合调制的类语音数据传输方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10687155B1 (en) 2019-08-14 2020-06-16 Mimi Hearing Technologies GmbH Systems and methods for providing personalized audio replay on a plurality of consumer devices
EP3614379B1 (en) 2018-08-20 2022-04-20 Mimi Hearing Technologies GmbH Systems and methods for adaption of a telephonic audio signal
EP3614380B1 (en) 2018-08-22 2022-04-13 Mimi Hearing Technologies GmbH Systems and methods for sound enhancement in audio systems
EP3765954A4 (en) * 2018-08-30 2021-10-27 Hewlett-Packard Development Company, L.P. SPACE CHARACTERISTICS OF MULTI-CHANNEL AUDIO SOURCE
US11330377B2 (en) 2019-08-14 2022-05-10 Mimi Hearing Technologies GmbH Systems and methods for fitting a sound processing algorithm in a 2D space using interlinked parameters
US20210329387A1 (en) 2020-04-16 2021-10-21 Mimi Hearing Technologies GmbH Systems and methods for a hearing assistive device
US20210326099A1 (en) 2020-04-16 2021-10-21 Mimi Hearing Technologies GmbH Systems and methods for providing content-specific, personalized audio replay on consumer devices
EP4061012A1 (en) 2021-03-16 2022-09-21 Mimi Hearing Technologies GmbH Systems and methods for fitting a sound processing algorithm in a 2d space using interlinked parameters
US11832061B2 (en) * 2022-01-14 2023-11-28 Chromatic Inc. Method, apparatus and system for neural network hearing aid
US11950056B2 (en) 2022-01-14 2024-04-02 Chromatic Inc. Method, apparatus and system for neural network hearing aid

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5259033A (en) * 1989-08-30 1993-11-02 Gn Danavox As Hearing aid having compensation for acoustic feedback
US5606642A (en) * 1992-09-21 1997-02-25 Aware, Inc. Audio decompression system employing multi-rate signal analysis
US5832444A (en) * 1996-09-10 1998-11-03 Schmidt; Jon C. Apparatus for dynamic range compression of an audio signal
CN102354497A (zh) * 2010-04-09 2012-02-15 奥迪康有限公司 使用频率变换通过移动包络对声音感知的改进
CN105164918A (zh) * 2013-04-29 2015-12-16 杜比实验室特许公司 具有动态阈值的频带压缩
CN106856623A (zh) * 2017-02-20 2017-06-16 鲁睿 基带语音信号通讯噪声抑制方法及系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240192B1 (en) * 1997-04-16 2001-05-29 Dspfactory Ltd. Apparatus for and method of filtering in an digital hearing aid, including an application specific integrated circuit and a programmable digital signal processor
US6219427B1 (en) * 1997-11-18 2001-04-17 Gn Resound As Feedback cancellation improvements
US6868163B1 (en) * 1998-09-22 2005-03-15 Becs Technology, Inc. Hearing aids based on models of cochlear compression
US6993480B1 (en) * 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
US6947509B1 (en) * 1999-11-30 2005-09-20 Verance Corporation Oversampled filter bank for subband processing
CA2354755A1 (en) * 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
CA2621940C (en) * 2005-09-09 2014-07-29 Mcmaster University Method and device for binaural signal enhancement
US8000487B2 (en) * 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
US8229125B2 (en) * 2009-02-06 2012-07-24 Bose Corporation Adjusting dynamic range of an audio system
US8626516B2 (en) * 2009-02-09 2014-01-07 Broadcom Corporation Method and system for dynamic range control in an audio processing system
US9138178B2 (en) 2010-08-05 2015-09-22 Ace Communications Limited Method and system for self-managed sound enhancement
US9706314B2 (en) * 2010-11-29 2017-07-11 Wisconsin Alumni Research Foundation System and method for selective enhancement of speech signals
US20150281853A1 (en) * 2011-07-11 2015-10-01 SoundFest, Inc. Systems and methods for enhancing targeted audibility
US8861760B2 (en) * 2011-10-07 2014-10-14 Starkey Laboratories, Inc. Audio processing compression system using level-dependent channels
CN104937954B (zh) 2013-01-09 2019-06-28 听优企业 用于自管理声音增强的方法和系统
US9680438B2 (en) 2015-07-01 2017-06-13 Meq Inc. Method and device for playing modified audio signals

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5259033A (en) * 1989-08-30 1993-11-02 Gn Danavox As Hearing aid having compensation for acoustic feedback
US5606642A (en) * 1992-09-21 1997-02-25 Aware, Inc. Audio decompression system employing multi-rate signal analysis
US5832444A (en) * 1996-09-10 1998-11-03 Schmidt; Jon C. Apparatus for dynamic range compression of an audio signal
CN102354497A (zh) * 2010-04-09 2012-02-15 奥迪康有限公司 使用频率变换通过移动包络对声音感知的改进
CN105164918A (zh) * 2013-04-29 2015-12-16 杜比实验室特许公司 具有动态阈值的频带压缩
CN106856623A (zh) * 2017-02-20 2017-06-16 鲁睿 基带语音信号通讯噪声抑制方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111741410A (zh) * 2020-06-15 2020-10-02 中科上声(苏州)电子有限公司 一种扬声器均衡中动态范围压缩器的配置方法及装置
CN111741410B (zh) * 2020-06-15 2021-08-20 中科上声(苏州)电子有限公司 一种扬声器均衡中动态范围压缩器的配置方法及装置
CN113270105A (zh) * 2021-05-20 2021-08-17 东南大学 一种基于混合调制的类语音数据传输方法
CN113270105B (zh) * 2021-05-20 2022-05-10 东南大学 一种基于混合调制的类语音数据传输方法

Also Published As

Publication number Publication date
EP3584927B1 (en) 2021-03-10
US10199047B1 (en) 2019-02-05
EP3584927A1 (en) 2019-12-25
KR102343447B1 (ko) 2021-12-24
CN109545233B (zh) 2020-04-07
KR20190143333A (ko) 2019-12-30

Similar Documents

Publication Publication Date Title
CN109545233A (zh) 用于处理音频信号以在音频装置上重放的系统和方法
Moore et al. Use of a loudness model for hearing-aid fitting. I. Linear hearing aids
JP5248512B2 (ja) 補聴処理装置、調整装置、補聴処理システム、補聴処理方法、プログラム、及び集積回路
JP6441796B2 (ja) マルチバンドの音声圧縮システムと方法
Kates An auditory model for intelligibility and quality predictions
Kates et al. The hearing-aid audio quality index (HAAQI)
JP7237993B2 (ja) オーディオデバイスで再生するためのオーディオ信号を処理するシステム及び方法
Ferry et al. A computer model of medial efferent suppression in the mammalian auditory system
EP3595172B1 (en) Systems and methods for processing an audio signal for replay on an audio device
Strydom et al. An analysis of the effects of electrical field interaction with an acoustic model of cochlear implants
WO2010000042A1 (en) Linear gain amplification for mid-to-high intensity sounds in a compressive sound processor
Patel et al. Compression Fitting of Hearing Aids and Implementation
US20110257704A1 (en) Equal Loudness Contour with Channel Specific Map Laws
CN114286271B (zh) 一种基于掩蔽与音频均衡的耳鸣治疗声生成方法
US8428743B2 (en) Equal loudness contour with channel specific map laws
Lai et al. Adaptive dynamic range compression for improving envelope-based speech perception: Implications for cochlear implants
Levitt Future directions in hearing aid research
Yang et al. Psychophysical evaluation of an ultra-low power, analog biomimetic cochlear implant processor filterbank architecture with across channels AGC
Negi et al. Comparative Analysis of Octave and Band Pass Filter for Improving Hearing Capability of Deaf People
Mendhakar et al. Hearing Aids of the Future: A Simulation Study
Sokolova Applications of Open Source Software for Hearing Aid Amplification and Hearing Loss Simulation
CN111510837A (zh) 一种助听器听力康复方法、康复系统、存储介质及助听器
Leung Physiological Assessment of Hearing Aid Compression Schemes
Chung et al. Hearing impairment simulation for the performance evaluation of hearing aid system
Moore Modeling loudness for impaired ears and applications to fitting hearing aids

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant