CN110875055A - 具有过冲抑制的多频带音频信号动态范围压缩 - Google Patents
具有过冲抑制的多频带音频信号动态范围压缩 Download PDFInfo
- Publication number
- CN110875055A CN110875055A CN201910004852.0A CN201910004852A CN110875055A CN 110875055 A CN110875055 A CN 110875055A CN 201910004852 A CN201910004852 A CN 201910004852A CN 110875055 A CN110875055 A CN 110875055A
- Authority
- CN
- China
- Prior art keywords
- input
- overshoot
- output
- signal
- compressor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006835 compression Effects 0.000 title claims abstract description 51
- 238000007906 compression Methods 0.000 title claims abstract description 51
- 230000005236 sound signal Effects 0.000 title claims abstract description 43
- 230000001629 suppression Effects 0.000 title abstract description 11
- 238000009499 grossing Methods 0.000 claims description 35
- 238000001514 detection method Methods 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 6
- 238000000034 method Methods 0.000 description 35
- 238000012545 processing Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 238000013459 approach Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 208000033999 Device damage Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/12—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
- H03G9/18—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
本公开涉及具有过冲抑制的多频带音频信号动态范围压缩。提供音频信号动态范围压缩系统。输入线接受输入信号。耦合到输入线的滤波器组将输入信号分到一组频带中,该一组频带包括第一频带和第二频带。压缩器具有接收第一频带的第一输入端、第二输入端和输出端。加法器具有耦合到压缩器的输出端的第一输入端、耦合到第二频带的第二输入端和输出端。过冲估计模块具有耦合到加法器的输出端的输入端和耦合到压缩器的第二输入端的输出端。过冲估计模块的输出端提供指示在过冲估计模块的输入端处的信号与指定阈值之间的比较的结果的过冲信号。
Description
发明领域
本发明除其他方面之外涉及用于音频信号处理,例如用于具有相关过冲(overshooting)抑制的音频信号动态范围压缩的多频带处理的系统、方法和技术。
背景
当单个动态范围压缩器(DRC)应用于音频信号的整个带宽时,所得到的增益降低应用于整个信号(即,跨越它的整个频谱)。这个效果类似于调低音量控制,但是自动地和响应于信号电平的增加,例如,以便试图避免回放失真和/或设备损坏,或者仅仅避免可能干扰他人的过大音量。不幸的是,从范围压缩的这种过分简单化的方法产生的一个问题是,例如源自单个乐器(诸如底鼓)的单独的大声事件(loud event)可能触发整个音频信号的增益降低,即使音频的其他分量不需要或者不期望在音量上降低以便实现期望效果。例如,作为这种整个信号处理的结果,音频信号中的声音可能在增益降低被应用的时段期间降低到不可接受地低的水平。
这个问题照惯例通过替代地使用多频带动态范围压缩器来减轻,该压缩器对不同频带采用不同的压缩器。使用这种方法,在一个频带中的大声事件仅触发该频带中的增益降低,而保持其他频带基本上不受影响。例如,来自底鼓的大声事件将仅被仅覆盖特定低频带的压缩器压缩,其中在该特定低频带中出现了相应的信号能量爆发,而不管在其他频带(例如,中频和高频带)中出现的声音。
如图1所示,传统的多频带压缩器10包括一组滤波器12(包括单独的滤波器12A-12C),其将音频信号分成两个或更多个频带(在本示例中为三个)。每个频带然后由它自己的单独压缩器处理(其中每个滤波器12A-12C的输出端分别耦合到压缩器14A-14C中的一个)。来自这些压缩器14A-14C的输出在加法器15中重新组合以形成输出信号18。
不幸的是,多频带压缩器例如压缩器10具有的一个重要问题是,压缩信号18常常超过目标压缩阈值。这种情况主要是由于在频带的交叉或重叠区域内的输入音频信号能量而出现。在这点上,每个滤波器12A-12C输出相应的频带22A-22C,如图2所示,相邻频带重叠(例如,在频带22A和22B之间的重叠区域24A和在频带22B和22C之间的重叠区域24B)。
在上一段中提到的过冲效应在图3中对双频带动态范围压缩器示出,其中压缩器应用于通带以及阻带保持未被压缩。为了便于参考,在没有进一步详细阐述的情况下如在本文使用的术语“未压缩”意味着主题信号(一般地,特定的带限信号,或者更简洁地,频带)没有被范围压缩。在这个例子中,通带交叉频率被设置在1千赫(kHz)和10kHz处。它的压缩器具有20分贝(dB)的最大增益和0dB的期望限制阈值。当输入电平是低的时(即较低的曲线,例如图3中所示的曲线30及以下的曲线),可以清楚地看到20dB增益。当输入电平增加时(由较高的曲线例如曲线31及之上的曲线表示),限制器开始生效,以将输出电平理想地限制到最大值0dB,其在当前示例中是期望限制阈值28。然而,该限制28通常仅在中心频率32(在当前示例中为3.162kHz)周围以及对于远离交叉频率34的频率被施加。如在图3中可看到的,在交叉频率34内和周围,输入信号能量没有被带阻滤波器完全抑制,导致输出信号超过这个期望限制28,以致它达到高达几乎6dB的电平。
减轻这一问题的传统方法包括:(1)E.Lindemann的“The continuous frequencydynamic range compressor”(1997年在美国纽约新帕尔茨的1997Workshop onApplications of Signal Processing to Audio and Acoustics的会议录,DOI:10.1109/ASPAA.1997.625580,ISBN:0-7803-3908-8),其通过增加频带的数量并扩展在频带之间的重叠区域来解决这个问题;(2)E.Vickers的“The Non-Flat and Continually ChangingFrequency Response of Multiband Compressors”(2010年的Audio EngineeringSociety(AES)Convention 129),其采用频域方法,该方法检查在交叉区域附近的输入信号并重新计算频带边界,使得峰值完全落在单个频带内(从而限制在交叉区域中出现的信号能量的量);以及(3)D.Traore、J.Atkins的“Compensation of Crossover RegionOvershoot in Multiband Compression”(2014年的AES Convention 136),其中频率分解模块(其试图通过确定在交叉区域内的输入信号能量的量来提供过冲的估计)和增益补偿滤波器(其试图限制这种预期过冲的影响)在每个压缩器的增益路径的开始处被提供。
发明概述
然而,本发明人发现,减轻过冲的传统方法(例如,上述方法)的典型问题是,它们倾向于使用复杂的滤波器组和/或频域处理,以及因此通常不适合于实时应用,实时应用中低成本微控制器单元(微控制器或MCU)或数字信号处理器(DSP)被采用。为了解决这个问题,本发明除了别的以外还提供了一种相对简单的方法,其中压缩器的优选地延迟的输出被反馈到同一压缩器的增益路径的输入端,以抑制在后续样本中的过冲。
因此,本发明的一个实施例涉及音频信号动态范围压缩系统,其中输入线接受输入信号。耦合到输入线的滤波器组将输入信号分到一组频带中,该一组频带包括第一频带和第二频带。压缩器具有接收第一频带的第一输入端、第二输入端和输出端。加法器具有耦合到压缩器的输出端的第一输入端、耦合到第二频带的第二输入端、和输出端。过冲估计模块具有耦合到加法器的输出端的输入端和耦合到压缩器的第二输入端的输出端。过冲估计模块的输出端提供指示在过冲估计模块的输入端处的信号与指定阈值之间的比较的结果的过冲信号。
根据本发明的实施例,还包括以下内容:
1)一种音频信号动态范围压缩系统,包括:
(a)输入线,其用于接受输入信号;
(b)滤波器组,其耦合到所述输入线,所述滤波器组将所述输入信号分到一组频带中,所述一组频带包括第一频带和第二频带;
(c)压缩器,其具有第一输入端、第二输入端和输出端,所述第一输入端接收所述第一频带;
(d)加法器,其具有耦合到所述压缩器的输出端的第一输入端、耦合到所述第二频带的第二输入端和输出端;以及
(e)过冲估计模块,其具有耦合到所述加法器的输出端的输入端和耦合到所述压缩器的第二输入端的输出端,
其中所述过冲估计模块的输出端提供指示在所述过冲估计模块的输入端处的信号与指定阈值之间的比较的结果的过冲信号。
2)根据项1)所述的音频信号动态范围压缩系统,其中所述过冲估计模块引入延迟,使得在所述压缩器的输出端处提供的信号的当前样本的过冲的量用于修改由所述压缩器施加到在所述压缩器的第一输入端处施加的后续样本的增益。
3)根据项1)所述的音频信号动态范围压缩系统,其中所述过冲估计模块包括过冲信号发生器,所述过冲信号发生器具有(a)耦合到所述过冲估计模块的输入端的输入端,以及(b)提供作为在所述过冲信号发生器的输入端处接收的信号和所述指定阈值之间的比较的函数的过冲信号的输出端。
4)根据项3)所述的音频信号动态范围压缩系统,其中所述过冲估计模块还包括平滑模块,所述平滑模块具有:(a)耦合到所述过冲信号发生器的输出端的输入端,以及(b)耦合到所述过冲估计模块的输出端的输出端,其提供在所述平滑模块的输入端处接收的信号的低通滤波版本。
5)根据项4)所述的音频信号动态范围压缩系统,其中所述过冲估计模块还包括:(a)接收所述第一频带的第二输入端和(b)攻击检测模块,并且其中所述攻击检测模块具有耦合到所述过冲估计模块的第二输入端的输入端和提供指示攻击是否出现在所述第一频带内的信号的输出端。
6)根据项5)所述的音频信号动态范围压缩系统,其中所述平滑模块:(a)还具有第二输入端,其耦合到所述攻击检测模块的输出端,以及(b)当所述平滑模块的第二输入端接收到指示攻击出现在所述第一频带内的信号时重置由所述平滑模块执行的平滑操作。
7)根据项6)所述的音频信号动态范围压缩系统,其中响应于指示攻击在所述第一频带内出现的所述信号,通过将所述平滑模块和在所述平滑模块内的所有延迟元件的输出设置为零来重置由所述平滑模块执行的所述平滑操作。
8)根据项1)所述的音频信号动态范围压缩系统,其中所述输入信号是基于帧的,并且所述过冲估计模块在一种模式中操作,使得对于样本的每个帧,所述过冲估计模块的输出对于在所述帧中的所有样本都是相同的。
9)根据项1)所述的音频信号动态范围压缩系统,还包括:
(f)第二压缩器,其具有:接收所述第二频带的第一输入端、第二输入端和输出端;
(g)第二加法器,其具有:耦合到所述第二压缩器的输出端的第一输入端、耦合到所述第一频带的第二输入端、和输出端;以及
(h)第二过冲估计模块,其具有:耦合到所述第二加法器的输出端的输入端和耦合到所述第二压缩器的第二输入端的输出端,
其中所述第二过冲估计模块的输出端提供指示在所述第二过冲估计模块的输入端处的信号与第二指定阈值之间的比较的结果的第二过冲信号。
10)根据项9)所述的音频信号动态范围压缩系统,其中所述第一频带通过所述压缩器耦合到所述第二加法器的第二输入端。
11)根据项9)所述的音频信号动态范围压缩系统,其中所述一组频带还包括第三频带,并且其中所述第二加法器具有耦合到所述第三频带的输入端。
12)根据项11)所述的音频信号动态范围压缩系统,其中所述第三频带以未压缩格式耦合到所述第二加法器的所述输入端。
13)根据项11)所述的音频信号动态范围压缩系统,还包括:
(i)第三压缩器,其具有:接收所述第三频带的第一输入端、第二输入端和输出端;
(j)第三加法器,其具有:耦合到所述第三压缩器的输出端的第一输入端、耦合到所述第二频带的第二输入端、和输出端;以及
(k)第三过冲估计模块,其具有:耦合到所述第三加法器的输出端的输入端和耦合到所述第三压缩器的第二输入端的输出端,
其中所述第三过冲估计模块的输出端提供指示在所述第三过冲估计模块的输入端处的信号与第三指定阈值之间的比较的结果的第三过冲信号。
14)根据项13)所述的音频信号动态范围压缩系统,其中所述第二频带通过所述第二压缩器耦合到所述第三加法器的第二输入端。
15)根据项14)所述的音频信号动态范围压缩系统,其中所述第一频带通过所述压缩器耦合到所述第三加法器的输入端。
16)根据项13)所述的音频信号动态范围压缩系统,其中所述一组频带还包括第四频带,并且其中所述第三加法器具有耦合到所述第四频带的输入端。
17)根据前述项中任一项所述的音频信号动态范围压缩系统,其中所述过冲估计模块包括电平检测器,所述电平检测器具有(a)耦合到所述过冲估计模块的输入端的输入端,以及(b)提供遍及所述电平检测器的输入端处的多个样本的平滑化信号电平的输出端,并且其中所述平滑化信号电平用于生成过冲信号。
18)根据前述项中任一项所述的音频信号动态范围压缩系统,其中所述过冲估计模块包括过冲信号发生器,所述过冲信号发生器具有:(a)耦合到所述过冲估计模块的输入端的输入端,以及(b)提供作为在所述过冲信号发生器的输入端处接收的信号和所述指定阈值之间的差的函数的过冲信号的输出端。
19)根据前述项中任一项所述的音频信号动态范围压缩系统,其中所述压缩器包括:(a)主信号路径,在所述主信号路径中增益被施加到在所述压缩器的第一输入端上的信号;以及(b)平行于所述主信号路径的侧链路径,在所述侧链路径中所述增益被确定,并且其中所述过冲信号用于修改在所述侧链路径中的指示所述第一频带的当前强度的信号。
20)根据前述项中任一项所述的音频信号动态范围压缩系统,其中所述压缩器包括:(a)主信号路径,在所述主信号路径中增益被施加到在所述压缩器的第一输入端上的信号;以及(b)平行于所述主信号路径的侧链路径,在所述侧链路径中所述增益被确定,其中所述过冲信号用于修改由所述侧链路径使用的压缩阈值。
前面的概述仅旨在提供本发明的某些方面的简要描述。通过结合附图参考权利要求和优选实施例的以下详细描述,可以获得对本发明的更完整的理解。
附图说明
在下面的公开中,参照附图描述本发明。然而应当理解,附图仅描绘本发明的某些代表性和/或示例性实施例和特征,并且并不意欲以任何方式限制本发明的范围。以下是各附图的简要说明。
图1是传统的三频带动态范围压缩器的框图(现有技术)。
图2概念性地示出了由图1的范围压缩器处理的三个频带。
图3示出了在没有减轻过冲的情况下对于以5dB为增量的从-50dB(最下面的曲线)到0dB(最上面的曲线)范围的输入功率电平跨频谱范围的由传统范围压缩器提供的输出功率。
图4是示出用于处理输入信号的单个频带的传统动态均衡器的框图(现有技术)。
图5概念性地示出了由图4中所示的动态均衡器的滤波器产生的通带和阻带。
图6是通过基于反馈过冲信号修改输入到压缩器的侧链内的信号来提供过冲抑制(overshooting suppression)的动态压缩器的框图。
图7是过冲估计模块的框图。
图8是示出用于基于攻击的检测来重置平滑操作的过程的流程图。
图9是通过使用反馈过冲信号以拉低压缩器的压缩阈值来提供过冲抑制的动态压缩器的框图。
图10是基于帧的过冲估计模块的框图。
图11是示出在多频带动态范围压缩系统内使用过冲信号反馈的框图。
图12是示出使用来自仅仅一个下一相邻频带和所有先前频带的过冲信号反馈的多频带动态范围压缩系统的框图。
优选实施例的描述
在图4中示出了传统的动态均衡器(DEQ)50,其以多频带动态范围压缩系统的最简单形式之一被使用。它使用两个滤波器52和53来将输入信号51分成两个相应的部分:带通滤波器52选择(在图5中示出的)通带62,以及带阻滤波器53选择被称为阻带63(也在图5中示出)的光谱的其余部分,在通带62和阻带63之间有某个重叠65。压缩器55仅应用于通带62。最后,在加法器56中,通带信号62的压缩版本57与未压缩的阻带信号63组合以提供输出信号58。级联多个这样的动态均衡器50可以提供具有一组灵活的频带的多频带压缩器。
尽管在本示例中使用带通和带阻滤波,但是在可选的实施例中替代地使用低通或高通滤波器来产生通带62,并且相应的带阻滤波器53优选地分别是互补的高通或低通滤波器。在这一点上,注意,除非关于特定实例另外规定相反的情况,否则术语例如“频带”在本文中的使用意欲意指具有上限截止频率和非零下限截止频率的有限频带、仅具有上限截止频率的频带或仅具有下限截止频率的频带。
在图6中示出了可选的DEQ系统100,即包括根据本发明的过冲抑制的DEQ系统。类似于上面讨论的系统50,系统100包括带通滤波器52(提供有时被称为x(n)的通带信号62)、带阻滤波器53(提供阻带信号63)和压缩器155(其可以类似于压缩器55)。此外,与系统50不同,系统100包括过冲估计模块160,其估计在由加法器158提供的压缩输出信号157和阻带信号63的组合内的过冲的量。加法器158具有耦合到压缩输出信号157和阻带信号63的输入端和提供组合信号159(有时被称为y(n))的输出端。本实施例聚焦于压缩单个频带。在多个不同频带被压缩的本发明的优选实施例中,每个这样的频带的组合信号(例如信号159)包括下列项的某个版本:(1)该频带的信号的压缩版本和(2)相邻频带的信号(其将具有一些重叠频率)。
在任何情况下,组合信号159耦合到输出相应的过冲信号161(有时被称为o(n))的过冲估计模块160。如下文更详细讨论的,o(n)然后耦合到压缩器155的另一输入端,压缩器155使用该信息来抑制在通带信号62的后续样本中的过冲。在图6中描绘了压缩器155的一般内部结构,以便更好地说明在当前实施例中如何实现这种抑制。
尽管压缩器155的特定实现在图6中示出,但是应当理解,可以替代地利用各种不同类型的压缩器中的任何一种。对于可用在本发明中的潜在动态范围压缩器及它们的部件的讨论,参见本发明人/申请人的于2018年6月29日提交的美国专利申请序列号16/022,819(‘819申请),该申请通过引用被并入本文,如同在本文完全被阐述一样。这种压缩器通常包括主信号路径和侧链,在主信号路径中增益被施加到压缩器的输入信号,在侧链中这种增益被动态地计算。也参见例如D.Giannoulis、M.Massberg和J.Reiss.的2012年的“DigitalDynamic Range Compressor Design–A Tutorial and Analysis”(Journal of AudioEngineering Society 60:pp.399-408)(其在本文被称为“Giannoulis 2012”)。
在图6中,电平检测器155A被示为与侧链处理155B的其余部分分离,以便示出在当前实施例中的所估计的过冲信号161的插入点。在当前实施例中,在x(n)——通带信号62在元件155C中被延迟之后,在(主信号路径中的)乘法器155D中,在侧链中产生的增益信号155E被施加到信号62。
在图7中示出了过冲估计模块160的示例性实现。如所示,组合信号y(n)159耦合到延迟元件171的输入端,以及延迟元件171的输出端耦合到电平检测器172,电平检测器172然后提供电平信号173(有时被称为p(n))。
(由延迟元件171提供的)延迟是优选的,以便避免使用当前的组合信号y(n)来修改当前y(n)本身的压缩器增益,这将产生y(n)的新值。一个样本的延迟意味着当前压缩器输出样本y(n)用于修改下一个样本y(n-1)的压缩器增益。虽然可以使用更大的延迟,但是一个样本的最小延迟是优选的。
电平检测器172优选地提供它的输入信号的电平或功率的估计。优选地,电平检测器172计算输入信号的绝对值或平方。例如见Giannoulis2012。
如果由电平检测器172输出的电平信号p(n)173(或指示输入到过冲估计模块160的信号的电平的任何其他信号)高于指定阈值TL 175,则过冲优选地被认为出现,该阈值TL175又优选地与压缩器155的压缩阈值相关。例如,用户可以将阈值175(实时地或提前作为设计参数)设置得比压缩器的压缩阈值稍高或稍低,以便微调过冲抑制。
在当前实施例中,由模块176实现的斜坡函数产生瞬时过冲信号177,如下:
其中K是比例因子,其可以被调节以控制过冲信号多么强地被反馈给压缩器155。为此目的,加法器178可以被实现为单独的部件(如图7所示,以更清楚地示出比较特征的实现,在这种情况下,比较特征是在电平信号p(n)173和阈值TL 175之间的差异),或者可以被合并到模块176中。还应当注意,(在当前实施例中)由模块176实现的斜坡函数可以替代地用基于输入信号电平和阈值之间的比较(例如差异)提供输出信号的各种其他操作中的任何一个代替。例如,在可选的实施例中,操作仍然依赖于在输入信号电平和指定阈值之间的差异,但是上面阐述的分段线性斜坡函数用具有连续和/或平滑地变化的斜率的函数代替。此外,在某些实施例中,与上面给出的示例相反,由模块176提供的过冲信号对于低于指定阈值的至少一些值是非零的(例如,但很小)。因此,模块176可以更一般地被称为过冲信号发生器176或瞬时过冲信号发生器176。
在本实施例中,瞬时过冲信号177可从一个样本到另一样本显著变化,且因此可选地被平滑化(例如,在模块180中)以产生更稳定的过冲信号o(n)161。可以在平滑模块180内使用例如中值和最大值滤波器的顺序统计滤波器(order-statistics filter)或者任何普遍可用的有限脉冲响应(FIR)或无限脉冲响应(IIR)低通滤波器。也可以使用跟随有FIR和/或IIR滤波器的顺序统计滤波器的级联。因为一般FIR或IIR滤波器可以输出负值——即使所有它的输入都是非负的,所以在平滑模块180内任何这样的负值优选地被设置为零。
可选地,由模块180执行的平滑操作也实现图8中所示的过程200。为此目的,过程200的输入(以及平滑模块180的附加输入)是(在图7和图8中示出的)攻击检测器182的输出,攻击检测器182又具有耦合到通带信号54的输入端以及如前面所提到的检测输出端(其如图7所示耦合到平滑模块180)。再次参考图8,在步骤201中,基于攻击检测器182的输出来做出关于攻击是否出现的确定。例如,如果攻击检测模块182的输出超过指定阈值,则攻击被认为出现。在这种情况下,处理继续进行到步骤202,在步骤202中,由平滑模块180执行的平滑操作例如通过将它的输出和/或它的延迟元件中的至少一些(例如它们中的全部)设置为零来被重置。在此之前,不执行重置操作(即,步骤203)。任何类型的攻击检测算法可以由模块182实现,例如在D.Giannoulis、M.Massberg和J.Reiss的2013年的“ParameterAutomation in a Dynamic Range Compressor”(Journal of the Audio EngineeringSociety,716-726,其在此被称为“Giannoulis 2013”)中所述的波峰因子或在‘819申请中识别的任何其他攻击检测算法。此外,虽然过冲估计模块180(扩展开来,攻击检测器182)的输入54在图6中被显示为耦合到带通滤波器52的输出62,但是输入54可以替代地耦合到系统输入51。
过冲信号o(n)(在有或没有模块180的可选平滑化的情况下)被施加到压缩器155的侧链,例如以便当过冲实际上存在时使压缩器产生较小的增益,例如以抑制在输出信号y(n)的后续值中的过冲。有多种方式来实现这个目标。在图6中示出了一种简单的方法,其中过冲信号o(n)被添加到在压缩器侧链内的电平信号q(n)(即,在本示例中的电平检测器156的输出)。因为过冲信号o(n)优选地总是非负的,所以当过冲出现时,如由下游侧链处理部件看到的电平信号157将变得更大,因而使压缩器155产生更小的增益。
图9中所示的可选系统250使用(从过冲估计模块160输出的)过冲信号o(n)261来拉低由压缩器255使用的阈值,例如:
T(n)=T0-o(n),
其中T0是原始或标称压缩阈值(例如,传统上用于压缩信号的动态范围的阈值),以及T(n)是调整后的阈值262,其被提供给压缩器255的侧链256。因为o(n)优选地总是非负的,所以上面的等式确保当过冲出现时实际压缩阈值T(n)低于原始压缩阈值。因此,压缩器255将(在侧链256中)产生并(在乘法器257中)应用较小的增益。
上述系统和过程也可以适合于基于帧的处理,例如,如在图10中对基于帧的过冲估计模块300所示的。如果N表示帧中的样本的数量,则样本索引n可以被表示为
n=kN+m,
其中k是帧索引,以及m是在帧内的样本索引。在基于帧的处理的上下文中,最小延迟(例如,由延迟元件301实现的延迟)优选地是一帧,即N个样本。虽然可以使用更大的延迟,但是一帧的延迟是优选的。类似于电平检测器172,电平检测器302优选地还估计它的输入信号的电平或功率。事实上,与应用于电平检测器172的考虑相同的考虑通常将应用于电平检测器302,例如,由电平检测器302执行的操作独立于帧边界而起作用。
优选地,对于每个帧k,帧范数模块(frame norm module)303基于在该帧中的所有值(例如,在该帧中的电平检测器302的所有输出)来计算单个范数值以表示该帧。各种不同类型的范数中的任何一个例如欧几里德范数(L2范数)、Lp范数、中值范数、最大值范数等可以由帧范数模块303生成。使用最大范数作为示例,
可用于表示在整个第k个帧中的所有样本。也就是说,过冲估计模块300优选地使用单个值来表示在帧中的所有y(n)样本的电平。
可以针对给定帧将单个过冲值(例如在斜坡模块306中)计算为例如:
除了对帧值而不是样本值进行操作之外,上面关于斜坡模块176和加法器178讨论的相同论述和考虑也分别适用于斜坡模块306和加法器308。在该实施例中,假设可选的平滑化被执行(在平滑模块310中),优选地,平滑操作针对Vk值被执行,以产生表示在整个第k帧中的所有样本的平滑化的过冲信号Ok。否则,上面关于平滑模块180讨论的相同论述和考虑也适用于平滑模块310。
可选地,在攻击检测模块312中使用基于帧的攻击检测来确定在每个帧中是否存在攻击。否则,上面关于攻击检测模块182讨论的相同论述和考虑也适用于攻击检测模块312。在检测到攻击的情况下,平滑滤波器310优选地(例如,通过将它的输出和延迟线设置为零,如图8所示)被置于重置模式中。
可选地平滑化的过冲信号Ok是针对在整个帧中的所有样本的,因此复制器314优选地针对帧中的所有样本复制该值,例如:
o(n)=o(kN+m)=Ok,针对m=0、1、…、N-1,
其然后可以(例如,在压缩器的侧链中)用于以各种不同的方式中的任一个(诸如在图6和图9中所示并在上面讨论的结构/方法中的任何一个)抑制过冲。
上述延迟过冲反馈(delayed-overshoot-feedback)方法可以在所有(或至少多个)频带被压缩的系统中递归地被应用。一个示例是在图11中所示的系统350。
上面所述的系统100和250涉及共同覆盖输入信号的整个频谱的两个频带,其中一个频带被压缩,而另一个频带未被压缩。在本实施例中,两个或更多个频带覆盖输入信号的整个频谱,并且每个频带(或者至少这样的频带的子集的每个频带)是动态地范围压缩的,来自其相邻频带的反馈用于生成过冲信号,该过冲信号被反馈给当前频带的压缩器。
系统350(在图11中示出)对一个实施例例示了这个概念,在该实施例中,输入信号352的频谱被四个相应的滤波器360-363分成共同覆盖输入信号352的整个频谱的四个频带,其中每个这样的频带在它自己的处理分支中被压缩(使用来自它的相邻处理分支的输入,如下面更详细讨论的)。在图11中,滤波器360-363的相邻滤波器输出彼此相邻的频带,在它们之间有某个量的重叠(例如,如图2所示的重叠区域24A和24B)。
当处理由滤波器360输出的频带(其根据滤波器被排序的方式可以是最低频带或最高频带)时,只有由滤波器361输出的频带是相邻的。因此,只有由滤波器361输出的(在当前实施例中未压缩的)信号与由滤波器360输出的(在压缩器380中压缩后的)信号(在加法器370中)组合,以便产生输入到过冲估计模块390中的信号。
当处理由滤波器361输出的频带(其是在由滤波器360和362输出的频带之间的频带)时,在当前实施例中,只有由滤波器362输出的(未压缩的)相邻频带与由滤波器361输出的(在压缩器381中压缩之后的)信号(在加法器371中)组合,以便生成输入到它的过冲估计模块391中的信号。
当处理由滤波器363输出的频带(其在本例中是最后一个频带)时,没有与压缩器383的输出组合的“下一个”频带(类似于在前面分支中所做的事情)。因此,在本实施例中,总系统输出耦合到过冲估计模块393的输入端,过冲估计模块393然后产生过冲估计信号并将过冲估计信号提供回到压缩器383。在相关实施例中,过冲估计模块393被完全省略,并且没有过冲估计信号被提供给压缩器383。
注意,每个过冲估计模块390-393例如可以被实现为图7中的过冲估计模块160或图10中的过冲估计模块300。此外,为了简化图示,关于每个分支,从图11中省略了信号x(n)到相应频带的过冲估计模块390-393的提供,信号x(n)在优选实施例中是这种过冲估计模块390-393的攻击检测模块的输入。
本结构/方法的一个特征是,对于每个频带(除了最后一个频带之外),下一个频带的未被压缩的输出被向后添加到当前频带的压缩输出,以产生对过冲模块390-392的输入。取处理由滤波器361输出的频带的分支作为例子,滤波器362的未被压缩的输出被向后添加到滤波器361的压缩输出,以便产生对过冲估计模块391的输入。对于(由滤波器363输出的)最后一个频带,没有任何后续频带意味着没有过冲估计模块被设置在相应的分支中。因此,如上所提到的,不同的方法用于该分支,或者对于该最后一个频带完全省略过冲抑制。
可以做出关于前述实施例的若干论述。首先,每个频带(除了最后一个频带之外)的处理仅考虑一个相邻频带以及更具体地在本实施例中的下一个频带(其对于最后一个频带是不存在的)。尽管这种结构/方法可以产生良好的结果,但(1)它没有解决由于另一个相邻频带(当前示例中为前一频带(如果存在的话))而可能出现的任何过冲;以及(2)带通滤波器360-363的滚降通常可以扩展到这种其他相邻频带,意味着在该实施例中过冲抑制可能不是全面的。
因此,图12示出了可以减轻这个问题的系统400。与(在图11中示出的)系统350的主要区别是,在系统400中,在(系统400的过冲估计模块390-393中的相应一个中)计算过冲信号时也使用来自先前频带的压缩信号之和(结合来自随后频带的未被压缩的信号)。来自先前频带的压缩信号之和携带带通滤波器的大部分慢滚降效应和来自先前频带的非完美抑制的过冲,因此将它添加到对应的过冲估计模块391-393的输入端有助于抑制它们的效应。对于由系统400处理的最后一个频带(即,由滤波器363输出的频带),由于没有任何“下一频带”,(由加法器373产生的)总输出被提供给相应的过冲估计模块393。如上所提到的,要解决的大部分过冲由在正被处理的当前频带和与其紧邻的频带之间的重叠引起。
在系统400中,频带被合理地按顺序(并且合理地并行)处理,因此例如压缩器380和381的输出可用来(并且因此实际上)被提供给过冲估计模块392,但是压缩器383的输出不被提供给过冲估计模块392,因此替代地滤波器363的未被压缩的输出被提供给过冲估计模块392。更一般地,在系统400中,当处理当前频带时,以压缩格式将较早处理的频带(如果有的话)提供给当前频带的过冲估计模块,而以未压缩格式提供随后处理的频带(如果有的话)。在可选的实施例中,潜在地受制于其他定时约束,可以以压缩或未压缩格式提供任何或所有这样的频带,其中压缩格式是优选的,使用适当的延迟元件来确保期望的压缩信号是可用的。然而,即使理论上是可能的,在许多情况下,可能获得的额外性能益处并不能证明将被引入的额外延迟是合理的。
如图12所示,先前处理过的频带的压缩版本通过加法器的级联序列被提供给用于处理当前频带的过冲估计模块(模块390-393中的相应一个)(例如,过冲估计模块392的输入通过加法器370、371和372产生)。注意,在当前实施例中,加法器371和372是作为复合加法器的结构,每个加法器具有两输入加法器,共同提供三个输入和两个输出(即,最终输出和中间输出)。
此外,在可选的实施例中,不是将所有先前处理的频带都输入到当前过冲估计模块(即,模块390-393中的一个),而是只有紧接着前面的频带被输入。例如,当在该可选的实施例中处理由滤波器362输出的频带时,只有(由滤波器361和363输出的)两个相邻频带被输入到过冲估计模块392内。
最后,虽然四频带音频信号动态范围压缩系统350用于在前面的讨论中例示本发明(例如,参考图11和图12以及关于这些相应系统350、400的潜在变型),但是应该注意,相同或相似的过程和结构可以在处理任何数量的频带时被应用。
系统环境
一般来说,除非另有明确指示,否则本文所描述的所有系统、方法、模块、部件、功能和技术可使用一个或更多个可编程通用计算设备来实践。这种设备(例如,包括本文提到的任何电子设备)通常将包括例如经由公共总线彼此耦合的至少一些以下部件:(1)一个或更多个中央处理单元(CPU);(2)只读存储器(ROM);(3)随机存取存储器(RAM);(4)其他集成或附加存储设备;(5)用于(例如,使用硬连线连接,诸如串行端口、并行端口、USB连接或火线连接,或者使用无线协议,诸如射频识别(RFID)、任何其他近场通信(NFC)协议、蓝牙或802.11协议)与其他设备以接口方式连接的输入/输出软件和电路;(6)用于连接到一个或更多个网络的软件和电路,例如使用硬连线连接(诸如以太网卡)或无线协议,诸如码分多址(CDMA)、全球移动通信系统(GSM)、蓝牙、802.11协议或任何其他基于蜂窝或非基于蜂窝的系统,这些网络在本发明的许多实施例中又连接到因特网或任何其他网络;(7)显示器(诸如阴极射线管显示器、液晶显示器、有机发光显示器、聚合物发光显示器或任何其他薄膜显示器);(8)其他输出设备(诸如一个或更多个扬声器、耳机、激光器或其他光投影仪和/或打印机);(9)一个或更多个输入设备(诸如鼠标、一个或更多个物理开关或可变控制器、触摸板、平板电脑、触敏显示器或其他定点设备、键盘、小键盘、麦克风和/或照相机或扫描仪);(10)大容量存储单元(诸如硬盘驱动器或固态驱动器);(11)实时时钟;(12)可移动存储读/写设备(例如闪存驱动器、利用半导体存储器的任何其他便携式驱动器、磁盘、磁带、光磁盘、光盘等);和/或(13)调制解调器(例如,用于发送传真或用于连接到因特网或任何其他计算机网络)。在操作中,在由这种通用计算机执行的程度上,实现以上方法和功能的过程步骤通常最初存储在大容量储存器(例如,硬盘或固态驱动器)中,下载到RAM中,然后由CPU从RAM执行。然而,在一些情况下,过程步骤最初存储在RAM或ROM中和/或直接从大容量储存器中执行。
用于在实现本发明时使用的合适的通用可编程设备可以从各种供应商处获得。在各种实施例中,根据任务的大小和复杂性,使用不同类型的设备。这样的设备可以包括例如大型计算机、多处理器计算机、一个或更多个服务器盒、工作站、个人(例如台式、膝上型、平板或平板式)计算机和/或甚至更小的计算机,诸如个人数字助理(PDA)、无线电话(例如智能电话)或任何其他可编程装置或设备,无论是独立的、硬连线到网络还是无线连接到网络。
另外,尽管上文已经描述了通用可编程设备,但是在替代实施例中,替代地(或另外地)使用一个或更多个专用处理器或计算机。一般来说,应当注意,除非另有明确说明,否则上述任何功能可以由执行软件和/或固件的通用处理器、由专用(例如,基于逻辑的)硬件或这些方法的任何组合来实现,其中特定实现是基于已知的工程折衷来选择的。更具体地,在以固定、预定和/或逻辑方式实现上述任何过程和/或功能的情况下,可以通过执行编程(例如,软件或固件)的处理器、逻辑部件(硬件)的适当布置、或两者的任意组合来实现,这是本领域技术人员将容易认识到的。换句话说,如何将逻辑和/或算术运算转换成用于在处理器内执行这种运算的指令和/或转换成用于执行这种运算的逻辑门配置是容易理解的;事实上,编译器通常可用于这两种转换。
应当理解,本发明还涉及机器可读的有形(或非暂时性)介质,在该介质上存储有用于执行本发明的方法和功能和/或用于实现本发明的模块和部件的软件或固件程序指令(即,计算机可执行处理指令)。这种介质例如包括磁盘、磁带、光学可读介质(诸如CD和DVD),或者半导体存储器(诸如各种类型的存储卡、USB闪存设备、固态驱动器等)。在每种情况下,介质可以采取便携式物品的形式,诸如微型磁盘驱动器或小磁盘、软盘、盒式磁带、盒式数据存储器(cartridge)、卡、棒等,或者它可以采取相对较大或移动较少的物品的形式,诸如设置在计算机或其他设备中的硬盘驱动器、ROM或RAM。如本文所用,除非另有明确说明,对存储在计算机可读或机器可读介质上的计算机可执行过程步骤的提及旨在包括其中这样的过程步骤存储在单个介质上的情况,以及其中这样的过程步骤存储在多个介质上的情况。
前面的描述主要强调电子计算机和设备。然而,应当理解,还可以使用任何其他计算或其他类型的设备,诸如利用能够执行基本逻辑和/或算术运算的电子、光学、生物和化学处理的任何组合的设备。
另外,在本公开涉及处理器、计算机、服务器、服务器设备、计算机可读介质或其他储存设备、客户端设备或任何其他类型的装置或设备的情况下,这种提及应当理解为包括多个这种处理器、计算机、服务器、服务器设备、计算机可读介质或其他储存设备、客户端设备或任何其他这种装置或设备的使用,除非在范围上另有明确指示。例如,服务器通常可以(并且通常将)使用单个设备或(本地或地理上分散的)服务器设备集群来实现,例如具有适当的负载平衡。类似地,服务器设备和客户端设备通常将协作执行完整方法的过程步骤,例如,每个这样的设备具有存储这样的过程步骤的一部分的它自己的存储设备和执行这些过程步骤的它自己的处理器。
附加考虑事项
如本文所使用的,术语“耦合”或该词的任何其它形式旨在表示直接连接或通过一个或更多个其它元件或处理块连接,例如用于预处理的目的。在附图和/或它们的讨论中,在各个步骤、模块或处理块被示出和/或讨论为彼此直接连接的情况下,这样的连接应当被理解为耦合,其可以包括附加步骤、模块、元件和/或处理块。除非本文中另有相反的明确和具体说明,否则本文中对信号的提及意味着该信号的任何已处理或未处理版本。也就是说,本文讨论和/或要求保护的特定处理步骤不旨在是排他性的;相反,可以在本文明确讨论或要求保护的任何两个处理步骤之间执行中间处理。
在特定值在本文中被提到的情况下,这样的提及意味着该值或实质上该值,其包括与所述的值实质上没有差异的值,即,允许在所识别的上下文中没有实质性影响的偏差。例如,说明连续可变信号电平被设置为零(0)将包括确切地为0的值以及产生与0值实质上相同的效果的小值。
在前面的讨论中,术语“操作者”、“操作”、“功能”和类似的术语指过程步骤或硬件部件,取决于特定的实现/实施例。
在一方面的在本文或附图中明确阐述的本公开与另一方面的通过引用并入本文的任何材料之间发生任何冲突或不一致的情况下,本公开应优先。在通过引用并入本文的任何申请或专利的公开之间发生任何冲突或不一致的情况下,最新添加或改变的公开应优先。
除非明确指出相反,诸如“最优”、“优化”、“最大化”、“最小化”、“最佳”的词语以及类似词语和其他表示比较的单词和后缀在上述讨论中没有在其绝对意义上使用。相反,这些术语通常意在考虑任何其他潜在的约束(诸如用户指定的约束和目标以及成本和处理或制造限制)来理解。
在上面的讨论中,某些方法通过将它们分解成以特定顺序列出的步骤来被解释。类似地,通过显示和/或描述以特定顺序布置的模块来执行特定处理。然而,应当注意,在每种这样的情况下,除了在清楚地指示相反的情况或由实际考虑所要求的程度上(例如,在来自一个步骤的结果是执行另一个步骤所必需的情况下)以外,所指示的顺序不是关键的,但替代地,所描述的步骤和/或模块可以被重新排序和/或两个或更多个这样的步骤(或在两个或更多个这样的模块内的处理)可以同时被执行。
本文中对旨在触发、限制、滤波或以其他方式影响处理步骤、其他动作、处理步骤或动作的对象或任何其他活动或数据的“标准”、“多个标准”、“条件(condition)”、“条件(conditions)”或类似词语的提及旨在指“一个或更多个”,而不管是使用单数还是复数形式。例如,任何标准或条件可以包括动作、事件和/或出现(即多部分标准或条件)的任何组合(例如布尔组合)。
类似地,在上面的讨论中,功能有时归因于特定的模块或部件。然而,功能通常可以根据需要在任何不同的模块或部件之间重新分发,在一些情况下完全避免对特定部件或模块的需要和/或需要添加新的部件或模块。如本领域技术人员将理解的,参考本发明的具体实施例,功能的精确分布优选地根据已知的工程折衷来进行。
在上述讨论中,词语“包括(include)”、“包括(includes)”、“包括(including)”及该词语的所有其它形式不应该被理解为限制,而应该将这些单词之后的任何具体项理解为仅仅是示范性的。
本发明的几个不同实施例在上面和/或在通过引入并入本文的任何文件中进行描述,其中每个这样的实施例被描述为包括某些特征。然而,意图是结合任何单个实施例的讨论描述的特征不限于该实施例,而是可以被包括和/或布置在任何其它实施例中的各种组合中,如将由本领域技术人员理解的。
因此,虽然本发明已经关于其示例性实施例和附图被详细描述,但是对于本领域技术人员应当明显的是,在不脱离本发明的目的和范围的情况下,可以实现本发明的各种适应和修改。因此,本发明不限于附图所示和上述的精确实施例。相反,意图是不偏离本发明的目的的所有这样的变化被认为是落入其仅由所附权利要求书限定的范围内。
Claims (10)
1.一种音频信号动态范围压缩系统,包括:
(a)输入线,其用于接受输入信号;
(b)滤波器组,其耦合到所述输入线,所述滤波器组将所述输入信号分到一组频带中,所述一组频带包括第一频带和第二频带;
(c)压缩器,其具有第一输入端、第二输入端和输出端,所述第一输入端接收所述第一频带;
(d)加法器,其具有耦合到所述压缩器的输出端的第一输入端、耦合到所述第二频带的第二输入端和输出端;以及
(e)过冲估计模块,其具有耦合到所述加法器的输出端的输入端和耦合到所述压缩器的第二输入端的输出端,
其中所述过冲估计模块的输出端提供指示在所述过冲估计模块的输入端处的信号与指定阈值之间的比较的结果的过冲信号。
2.根据权利要求1所述的音频信号动态范围压缩系统,其中所述过冲估计模块引入延迟,使得在所述压缩器的输出端处提供的信号的当前样本的过冲的量用于修改由所述压缩器施加到在所述压缩器的第一输入端处施加的后续样本的增益。
3.根据权利要求1所述的音频信号动态范围压缩系统,其中所述过冲估计模块包括过冲信号发生器,所述过冲信号发生器具有(a)耦合到所述过冲估计模块的输入端的输入端,以及(b)提供作为在所述过冲信号发生器的输入端处接收的信号和所述指定阈值之间的比较的函数的过冲信号的输出端。
4.根据权利要求3所述的音频信号动态范围压缩系统,其中所述过冲估计模块还包括平滑模块,所述平滑模块具有:(a)耦合到所述过冲信号发生器的输出端的输入端,以及(b)耦合到所述过冲估计模块的输出端的输出端,其提供在所述平滑模块的输入端处接收的信号的低通滤波版本。
5.根据权利要求4所述的音频信号动态范围压缩系统,其中所述过冲估计模块还包括:(a)接收所述第一频带的第二输入端和(b)攻击检测模块,并且其中所述攻击检测模块具有耦合到所述过冲估计模块的第二输入端的输入端和提供指示攻击是否出现在所述第一频带内的信号的输出端。
6.根据权利要求5所述的音频信号动态范围压缩系统,其中所述平滑模块:(a)还具有第二输入端,其耦合到所述攻击检测模块的输出端,以及(b)当所述平滑模块的第二输入端接收到指示攻击出现在所述第一频带内的信号时重置由所述平滑模块执行的平滑操作。
7.根据权利要求6所述的音频信号动态范围压缩系统,其中响应于指示攻击在所述第一频带内出现的所述信号,通过将所述平滑模块和在所述平滑模块内的所有延迟元件的输出设置为零来重置由所述平滑模块执行的所述平滑操作。
8.根据权利要求1所述的音频信号动态范围压缩系统,其中所述输入信号是基于帧的,并且所述过冲估计模块在一种模式中操作,使得对于样本的每个帧,所述过冲估计模块的输出对于在所述帧中的所有样本都是相同的。
9.根据权利要求1所述的音频信号动态范围压缩系统,还包括:
(f)第二压缩器,其具有:接收所述第二频带的第一输入端、第二输入端和输出端;
(g)第二加法器,其具有:耦合到所述第二压缩器的输出端的第一输入端、耦合到所述第一频带的第二输入端、和输出端;以及
(h)第二过冲估计模块,其具有:耦合到所述第二加法器的输出端的输入端和耦合到所述第二压缩器的第二输入端的输出端,
其中所述第二过冲估计模块的输出端提供指示在所述第二过冲估计模块的输入端处的信号与第二指定阈值之间的比较的结果的第二过冲信号。
10.根据权利要求9所述的音频信号动态范围压缩系统,其中所述第一频带通过所述压缩器耦合到所述第二加法器的第二输入端。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/115,840 US10755722B2 (en) | 2018-08-29 | 2018-08-29 | Multiband audio signal dynamic range compression with overshoot suppression |
US16/115,840 | 2018-08-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110875055A true CN110875055A (zh) | 2020-03-10 |
CN110875055B CN110875055B (zh) | 2022-08-19 |
Family
ID=67070710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910004852.0A Active CN110875055B (zh) | 2018-08-29 | 2019-01-03 | 具有过冲抑制的多频带音频信号动态范围压缩 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10755722B2 (zh) |
EP (1) | EP3618274B1 (zh) |
JP (1) | JP6779323B2 (zh) |
CN (1) | CN110875055B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7229192B2 (ja) | 2020-03-02 | 2023-02-27 | 日本碍子株式会社 | ハニカムフィルタ |
US11032642B1 (en) * | 2020-03-10 | 2021-06-08 | Nuvoton Technology Corporation | Combined frequency response and dynamic range correction for loudspeakers |
US11317203B2 (en) | 2020-08-04 | 2022-04-26 | Nuvoton Technology Corporation | System for preventing distortion of original input signal |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4249042A (en) * | 1979-08-06 | 1981-02-03 | Orban Associates, Inc. | Multiband cross-coupled compressor with overshoot protection circuit |
US6205225B1 (en) * | 1997-12-03 | 2001-03-20 | Orban, Inc. | Lower sideband modulation distortion cancellation |
CA2354755A1 (en) * | 2001-08-07 | 2003-02-07 | Dspfactory Ltd. | Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank |
US20040189874A1 (en) * | 2003-03-27 | 2004-09-30 | Samsung Electronics Co., Ltd. | Image detail enhancement system |
CA2635154A1 (en) * | 2007-06-25 | 2008-12-25 | Harman Becker Automotive Systems Gmbh | Feedback limiter with adaptive time control |
US20110320210A1 (en) * | 2010-06-23 | 2011-12-29 | Stmicroelectronics, Inc. | Multiband dynamics compressor with spectral balance compensation |
CN102771145A (zh) * | 2010-01-07 | 2012-11-07 | 塔特公司 | 利用eq进行基于压缩器的动态低音增强 |
CN105022316A (zh) * | 2014-05-01 | 2015-11-04 | Gn瑞声达A/S | 用于数字音频信号的多频带信号处理器 |
US20150372653A1 (en) * | 2014-06-23 | 2015-12-24 | Rohm Co., Ltd. | Level adjusting circuit, digital sound processor, audio amp integrated circuit, electronic apparatus and method of automatically adjusting level of audio signal |
US20160344361A1 (en) * | 2006-02-07 | 2016-11-24 | Anthony Bongiovi | System and method for digital signal processing |
US9749741B1 (en) * | 2016-04-15 | 2017-08-29 | Amazon Technologies, Inc. | Systems and methods for reducing intermodulation distortion |
US20180192229A1 (en) * | 2017-01-04 | 2018-07-05 | That Corporation | Configurable multi-band compressor architecture with advanced surround processing |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4460871A (en) * | 1979-08-06 | 1984-07-17 | Orban Associates, Inc. | Multiband cross-coupled compressor with overshoot protection circuit |
US4493091A (en) * | 1982-05-05 | 1985-01-08 | Dolby Laboratories Licensing Corporation | Analog and digital signal apparatus |
US4701722A (en) * | 1985-06-17 | 1987-10-20 | Dolby Ray Milton | Circuit arrangements for modifying dynamic range using series and parallel circuit techniques |
US4922535A (en) * | 1986-03-03 | 1990-05-01 | Dolby Ray Milton | Transient control aspects of circuit arrangements for altering the dynamic range of audio signals |
US4887299A (en) * | 1987-11-12 | 1989-12-12 | Nicolet Instrument Corporation | Adaptive, programmable signal processing hearing aid |
US5185806A (en) * | 1989-04-03 | 1993-02-09 | Dolby Ray Milton | Audio compressor, expander, and noise reduction circuits for consumer and semi-professional use |
US7065257B2 (en) * | 2001-09-03 | 2006-06-20 | Kabushiki Kaisha Toyota Chuo Kenkyusho | Image processing method and apparatus |
DK1869948T3 (en) * | 2005-03-29 | 2016-05-02 | Gn Resound As | Hearing aid with adaptive compressor time constants |
US7873172B2 (en) * | 2005-06-06 | 2011-01-18 | Ntt Docomo, Inc. | Modified volterra-wiener-hammerstein (MVWH) method for loudspeaker modeling and equalization |
US8300849B2 (en) * | 2007-11-06 | 2012-10-30 | Microsoft Corporation | Perceptually weighted digital audio level compression |
JP4862820B2 (ja) | 2007-12-27 | 2012-01-25 | ヤマハ株式会社 | 音響信号増幅装置 |
US8204258B2 (en) * | 2008-12-17 | 2012-06-19 | Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America | Multiband audio dynamics processor |
US8391524B2 (en) | 2009-06-02 | 2013-03-05 | Panasonic Corporation | Hearing aid, hearing aid system, walking detection method, and hearing aid method |
JP2011255032A (ja) * | 2010-06-10 | 2011-12-22 | Shimadzu Corp | 画像処理方法およびそれを用いた放射線撮影装置 |
EP2632173B1 (en) * | 2012-02-22 | 2015-06-03 | Harman Becker Automotive Systems GmbH | Loudspeaker overload protection |
US9312829B2 (en) * | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US9559650B1 (en) * | 2012-07-13 | 2017-01-31 | MUSIC Group IP Ltd. | Loudness limiter |
EP2959479B1 (en) * | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
JP6323089B2 (ja) | 2014-03-14 | 2018-05-16 | ヤマハ株式会社 | レベル調整方法およびレベル調整装置 |
-
2018
- 2018-08-29 US US16/115,840 patent/US10755722B2/en active Active
-
2019
- 2019-01-03 CN CN201910004852.0A patent/CN110875055B/zh active Active
- 2019-01-10 JP JP2019002731A patent/JP6779323B2/ja active Active
- 2019-06-26 EP EP19182479.6A patent/EP3618274B1/en active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4249042A (en) * | 1979-08-06 | 1981-02-03 | Orban Associates, Inc. | Multiband cross-coupled compressor with overshoot protection circuit |
US6205225B1 (en) * | 1997-12-03 | 2001-03-20 | Orban, Inc. | Lower sideband modulation distortion cancellation |
CA2354755A1 (en) * | 2001-08-07 | 2003-02-07 | Dspfactory Ltd. | Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank |
US20040189874A1 (en) * | 2003-03-27 | 2004-09-30 | Samsung Electronics Co., Ltd. | Image detail enhancement system |
US20160344361A1 (en) * | 2006-02-07 | 2016-11-24 | Anthony Bongiovi | System and method for digital signal processing |
CA2635154A1 (en) * | 2007-06-25 | 2008-12-25 | Harman Becker Automotive Systems Gmbh | Feedback limiter with adaptive time control |
CN102771145A (zh) * | 2010-01-07 | 2012-11-07 | 塔特公司 | 利用eq进行基于压缩器的动态低音增强 |
US20110320210A1 (en) * | 2010-06-23 | 2011-12-29 | Stmicroelectronics, Inc. | Multiband dynamics compressor with spectral balance compensation |
CN105022316A (zh) * | 2014-05-01 | 2015-11-04 | Gn瑞声达A/S | 用于数字音频信号的多频带信号处理器 |
US20150372653A1 (en) * | 2014-06-23 | 2015-12-24 | Rohm Co., Ltd. | Level adjusting circuit, digital sound processor, audio amp integrated circuit, electronic apparatus and method of automatically adjusting level of audio signal |
US9749741B1 (en) * | 2016-04-15 | 2017-08-29 | Amazon Technologies, Inc. | Systems and methods for reducing intermodulation distortion |
US20180192229A1 (en) * | 2017-01-04 | 2018-07-05 | That Corporation | Configurable multi-band compressor architecture with advanced surround processing |
Non-Patent Citations (1)
Title |
---|
陈广飞: "数字助听器宽动态压缩算法研究", 《北京生物医学工程》 * |
Also Published As
Publication number | Publication date |
---|---|
US10755722B2 (en) | 2020-08-25 |
EP3618274A2 (en) | 2020-03-04 |
EP3618274A3 (en) | 2020-07-22 |
US20200075031A1 (en) | 2020-03-05 |
JP6779323B2 (ja) | 2020-11-04 |
CN110875055B (zh) | 2022-08-19 |
JP2020034885A (ja) | 2020-03-05 |
EP3618274B1 (en) | 2023-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110875055B (zh) | 具有过冲抑制的多频带音频信号动态范围压缩 | |
CN107439018B (zh) | 扬声器保护 | |
CN110728985B (zh) | 音频信号动态范围压缩 | |
CN109616134B (zh) | 多通道子带处理 | |
US9076437B2 (en) | Audio signal processing apparatus | |
WO2012177572A2 (en) | Optimization method for audio playback systems | |
JP6561772B2 (ja) | マルチバンドリミッタ、録音装置及びプログラム | |
JP2006526328A (ja) | 適応的フィルタリング | |
US20170117864A1 (en) | Multi-band limiter, sound recording apparatus, and program storage medium | |
CN101422054A (zh) | 声像定位装置 | |
EP3829192B1 (en) | Limiter system and method for avoiding clipping distortion or increasing maximum sound level of active speaker | |
KR101106464B1 (ko) | 멀티밴드 drc 시스템 및 멀티밴드 drc 시스템의 스레시홀드 결정 방법 | |
US9413323B2 (en) | System and method of filtering an audio signal prior to conversion to an MU-LAW format | |
US11646709B1 (en) | Multi-band limiter system and method for avoiding clipping distortion of active speaker | |
EP3916726A1 (en) | Decimator for audio signals | |
KR102721794B1 (ko) | 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법 | |
CN115623386A (zh) | 扬声器位移保护装置、方法及电子设备 | |
Darak et al. | Design of Variable Bandpass Filters Using First Order Allpass Transformation And Coefficient Decimation | |
CN117935821A (zh) | 由电子设备执行的方法、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |