CN105164918B - 具有动态阈值的频带压缩 - Google Patents
具有动态阈值的频带压缩 Download PDFInfo
- Publication number
- CN105164918B CN105164918B CN201480024349.7A CN201480024349A CN105164918B CN 105164918 B CN105164918 B CN 105164918B CN 201480024349 A CN201480024349 A CN 201480024349A CN 105164918 B CN105164918 B CN 105164918B
- Authority
- CN
- China
- Prior art keywords
- time
- varying
- band component
- distortion
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006835 compression Effects 0.000 title claims description 14
- 238000007906 compression Methods 0.000 title claims description 14
- 238000000034 method Methods 0.000 claims abstract description 33
- 239000003638 chemical reducing agent Substances 0.000 claims abstract description 28
- 230000005236 sound signal Effects 0.000 claims abstract description 24
- 238000005259 measurement Methods 0.000 claims abstract description 22
- 230000008447 perception Effects 0.000 claims abstract description 12
- 238000005056 compaction Methods 0.000 claims abstract description 4
- 238000001228 spectrum Methods 0.000 claims description 32
- 230000000873 masking effect Effects 0.000 claims description 19
- 230000004044 response Effects 0.000 claims description 17
- 230000003321 amplification Effects 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 18
- 238000005516 engineering process Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006399 behavior Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 206010021403 Illusion Diseases 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/16—Automatic control
- H03G5/165—Equalizers; Volume or gain control in limited frequency bands
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03F—AMPLIFIERS
- H03F3/00—Amplifiers with only discharge tubes or only semiconductor devices as amplifying elements
- H03F3/181—Low-frequency amplifiers, e.g. audio preamplifiers
- H03F3/183—Low-frequency amplifiers, e.g. audio preamplifiers with semiconductor devices only
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/008—Visual indication of individual signal levels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03F—AMPLIFIERS
- H03F2200/00—Indexing scheme relating to amplifiers
- H03F2200/03—Indexing scheme relating to amplifiers the amplifier being designed for audio applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Power Engineering (AREA)
- Quality & Reliability (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
公开了用于动态调整压缩器的阈值的系统、装置、方法和计算机可读存储介质的示例。处理具有多个频带分量的输入音频信号。可以确定时变阈值。压缩器对每个频带分量执行具有对应时变阈值的压缩运算,以产生增益。每个增益应用于受延迟的对应频带分量,以产生受处理的带分量,其相加以产生输出信号。在一些实现方式中,例如使用失真能听度模型来确定输出信号的感知谱的时变估计以及由感知谱估计引起的失真谱的时变估计。可以预测在存在感知谱估计的情况下的失真谱估计的能听度测量,并且将其用于调整时变阈值。
Description
相关申请的交叉引用
该专利申请要求2013年4月29日Alan J.Seefeldt提交的题为“DistortionReducing Multi-band Compressor with Dynamic Thresholds based on a DistortionAudibility Model”的共同未决和共同受让美国临时专利申请No.61/817,175(代理人案号No.D13064USP1)的优先权,出于所有目的通过引用而完整合并到此。
技术领域
该专利申请总体上涉及音频呈现,具体地说,涉及在呈现期间的失真减小。
背景技术
一些音频回放设备(如智能电话和平板设备)包括具有有限输出能力的放大器和扬声器。在这些设备中,音频回放可能在感知上是失真的,并且一般随着回放级别在呈现期间增加而强烈地失真。失真的特性一般对于回放设备是频率依赖性的。例如,当在特定频率处的输出信号达到或超过特定级别时,电视柜可能在受激发的特定频率处展现谐振响应,产生恼人的震颤。
多带压缩可以在回放之前应用于音频信号,以减少失真并且尝试最大化回放设备上的回放级别。为信号的每个频带指定失真阈值。压缩器将独立增益应用于每个带,以确保每个带中的信号级别不超过对应失真阈值。
发明内容
所公开的是实现用于响应于输入音频信号而动态调整压缩器的阈值的技术的系统、装置、方法和计算机可读存储介质的一些示例。在一些实现方式中,处理具有多个频带分量的输入信号。可以根据所述频带分量来确定时变阈值。每个时变阈值通常与相应的频带分量对应。压缩器对每个频带分量执行具有对应时变阈值的压缩运算,以产生多个增益,其中,每个增益与各个频带分量对应。每个增益应用于受延迟的对应频带分量,以产生多个受处理的频带分量,其被相加以产生输出信号。
在一些实现方式中,确定所述输出信号的感知谱的时变估计。此外,例如,根据失真模型的响应来确定感知谱估计所引起的失真谱的时变估计。预测在存在感知谱估计的情况下的所述失真谱估计的能听度测量。可以根据所预测的能听度测量来调整所述时变阈值。
在一些实现方式中,预测所述能听度测量包括:根据感知谱估计来计算掩蔽阈值;确定失真谱估计与掩蔽阈值之间的差值;以及把所确定的差值的正数值相加,以产生预测的能听度测量。可以基于感知谱估计参照调性谱来计算所述掩蔽阈值。所述调性谱包括区分类似噪声的频带分量与类似音调的频带分量的调性值。所确定的差值的相加的正数值可以加权以使得一个或更多个上频带分量和一个或更多个下频带分量具有比上频带分量与下频带分量之间的频带分量更低的权重。
在一些实现方式中,至少部分地根据固定标称阈值来确定时变阈值。因此,可以根据对应频带分量并且根据相应的固定阈值来确定每个时变阈值。在这些实现方式中,可以归一化失真的所预测的能听度测量。可以参照一个或更多个固定阈值并且根据应用于偏移值的归一化的能听度测量来提升或降低所述时变阈值。
在一些实现方式中,用于响应于输入音频信号而动态调整压缩阈值的装置包括:一个或更多个控制器,可操作为使得一些或所有上述操作得以执行。此外,该装置可以包括:滤波模块,能够对所述输入信号进行滤波,以产生所述频带分量;以及多带滤波器,包括多个带通滤波器,其中,每个带通滤波器与相应的频带分量相对应。所述装置可以还包括:一个或更多个放大器,被耦合以接收并且放大所述输出信号,以产生放大的输出信号;以及一个或更多个扬声器,被耦合以接收并且播放放大的输出信号。
在一些实现方式中,非瞬时计算机可读存储介质存储可由计算设备运行以使得一些或所有上述操作得以执行的指令。计算设备的非限定性示例包括服务器和台式计算机以及便携式手持设备(如智能电话、平板设备、膝上型设备、便携式音乐播放器等)。在一些实例中,一个或多个服务器可以被配置为使用所公开的技术中的一个或更多个来处理输入音频信号,并且作为基于云的服务的一部分而在互联网上把被处理的输出信号组流传送到用户的设备。
附图说明
所包括的附图目的是说明性的,并且仅用于提供用于所公开的本发明的系统、装置、方法和计算机可读存储介质的可能结构和操作的示例。这些附图绝非限制本领域技术人员在不脱离所公开的实现方式的精神和范围的情况下可以进行的形式和细节方面的任何改变。
图1示出根据一些实现方式的包括用于响应于输入音频信号而动态调整压缩器的阈值的失真能听度模型(DAM)的压缩器100的示例。
图2示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法200的示例。
图3示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法300的另一示例。
图4示出根据一些实现方式执行的用于在存在感知谱估计的情况下预测失真谱估计的能听度测量的方法400的示例。
图5A示出根据一些实现方式的显示器设备上所显示的输入音频信号的频带分量的能量级别的图形表示500A的示例。
图5B示出根据一些实现方式的显示器设备上所显示的由听者感知的所估计的输出信号谱的对应能量级别的图形表示500B的示例。
图6示出根据一些实现方式的用于呈现音频信号的包括压缩器100的回放系统600的示例。
具体实施方式
所公开的是实现用于响应于输入音频信号而动态调整压缩器的阈值的技术的系统、装置、方法和计算机可读存储介质的一些示例。一些所公开的技术包括失真能听度模型,以确定由多带压缩器可以应用的动态阈值。失真能听度模型被配置为在存在输入信号的情况下以依赖于动态信号的方式预测由该输入信号所引起的失真的感知能听度。这种所预测的能听度可以用于动态修改压缩器的阈值。包括所公开的技术的一些设备和系统因此能够在最小感知失真的情况下增加回放级别。
在一些实现方式中,失真能听度模型被配置为预测听者所收听到的信号谱的时变估计以及该信号所引起的失真谱的时变估计。失真能听度模型然后在存在信号谱估计的情况下预测该失真谱估计的能听度。以此方式,可以相应地动态调整压缩器的一个或更多个时变阈值。
用于动态调整压缩阈值的所公开的技术可以结合其它压缩处理而得以使用,并且可以实现于各种设备和系统(如智能电话、平板设备、膝上型计算机、便携式音乐播放器、电视、监视器以及基于服务器的系统)中。
实现所公开的技术的一些设备和系统在传统多带压缩器上改进,其显著地改动音色——听者感知的属性,其中,相等响度和音程的两种声音可以感知为不相似。当特定频率达到失真阈值而其它频率未达到时,一些传统压缩器因改动这些频率之间的相对平衡而引入缺点。所得声音显现为畸变,导致不自然的收听体验。
此外,如果增益过度地强势,则可能不必要地减少回放级别。如果每个带中的阈值被设置以消除用于在该带处居中的窄带信号的感知失真,则源自穿过压缩器的宽带信号的衰减一般多于在感知上消除任何所引起的失真所要求的衰减。这归因于这种事实:宽带信号可以大大掩蔽宽带信号引起的一些失真,而窄带信号在掩蔽其所引起的失真时可能是远更无效的。
图1示出根据一些实现方式的包括用于响应于输入音频信号而动态调整压缩器的阈值的失真能听度模型(DAM)的压缩器100的示例。在图1中,以滤波器组104为形式的滤波模块接收输入音频信号x[n]。滤波器组104被配置为对输入信号x[n]进行滤波,以将输入信号x[n]分离为多个频带分量x1[n]-xB[n]。在一些实现方式中,滤波器组104被配置作为实现为B个带通滤波器的多带滤波器,其中,每个带通滤波器与各个频带分量对应。例如,滤波器组104的每个带b可以被配置为输出如等式1所表示的那样被计算为与带通滤波器响应hb[n]卷积的输入信号x[n]的频带分量xb[n]:
xb[n]=hb[n]*x[n],b=1…B (1)
在图1中,DAM 108具有被耦合以接收从滤波器组104输出的频带分量x1[n]-xB[n]的输入。提供给DAM 108的每个频带分量xb[n]与各个固定压缩阈值Lb配对,如图1所示。DAM108被配置为计算并且输出时变阈值D1[n]-DB[n]。在一些实现方式中,每个时变阈值Db[n]被计算为各个频带分量xb[n]的函数。在一些其它实现方式中,并非对于每个带独立地计算,每个时变阈值Db[n]被计算为跨过带b=1……B的所有频带分量x1[n]-xB[n]和固定阈值Lb的函数,如等式2所表示的那样:
Db[n]=DAM({xi[n],Li|i=1...B}) (2)
每个频带分量xb[n]连同表示该带b中的信号在其之上将开始产生失真的级别的各个时变阈值Db[n]一起被提供作为对压缩函数(CF)112b的输入。每个压缩函数112b被配置为处理频带分量xb[n]和时变阈值Db[n],以产生时变增益gb[n],其表示用于将带b保持在其限制阈值Lb之下的增益,如等式3中所表示的那样:
gb[n]=CF(xb[n],Db[n]) (3)
通过相加所有频带分量x1[n]-xB[n]的延迟版本乘以它们的对应增益信号g1[n]-gB[n]来计算受处理的输出信号y[n]。在图1中,乘法器单元116被配置为将增益信号乘以延迟的频带分量,即yb[n]=gb[n]xb[n-d],以产生受处理的带分量y1[n]-yB[n],其然后在相加单元120处相加以产生输出信号y[n]。例如,延迟d可以被设计为考虑与增益信号的计算关联的任何处理延迟。等式4示出生成受处理的信号y[n]的表示:
图2示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法200的示例。参照图1的示例来描述图2。在图2的204,如上所述,接收频带分量x1[n]-xB[n]作为对DAM 108的输入。在208,DAM 108根据频带分量x1[n]-xB[n]来确定时变阈值D1[n]-DB[n]。在212,每个CF 112b被配置为使用对应的时变阈值Db[n]来对于对应的频带分量xb[n]执行压缩运算,以产生增益g1[n]-gB[n]。在216,每个增益gb[n]例如使用乘法器单元116而应用于对应的频带分量xb[n]的延迟版本,以产生受处理的带分量y1[n]-yB[n]。在220,受处理的带分量y1[n]-yB[n]在相加单元120处相加,以产生输出信号y[n],其可以然后存储在存储器设备中和/或提供给附加的处理模块。
图3示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法300的另一示例。方法300的操作304-320基本上与上述方法200的操作204-220相同。在图3中,在生成输出信号y[n]之后,在324,可以估计听者所收听到的输出信号y[n]的功率谱的时变估计。为此,平滑运算可以应用于受处理的带分量y1[n]-yB[n]。例如,可以通过快速起音/慢速释放(fast-attack/slow-release)单极点平滑器来平滑每个受处理的带分量yb[n]=gb[n]xb[n-d]。sb[n]表示听者所感知的输出信号谱的估计,并且在等式5中计算:
为了减少出自压缩阈值的随后调制的假声,在一些实例中,可以期望利用比等式5中所使用的稍微更快的攻击和稍微更慢的释放时间,以用于掌控增益g1[n]-gB[n]的起音和释放。在这些实例中,可以按分贝(dB)为单位来表示听者所感知的所估计的输出信号谱,如等式6所示:
Sb[n]=10log10(sb[n]) (6)
在图3中,在328,确定由感知谱估计sb[n]所引起的失真谱的时变估计。例如,可以通过将sb[n]馈送到失真生成模型中来估计sb[n]在回放系统中所引起的失真。可以通过测量并且表征单独回放系统来生成该模型。在一些情况下,用于具有小扬声器的设备的通用模型是足够的,并且假设带b中的信号将在带b中的信号级别之下的某固定偏移的级别处引起进入包括b以及在b之上的所有带的失真。
在一些实现方式中,在任何给定带中的失真谱估计是通过生成到该带中的失真的在所有带上的最大值来给出的。因此,第一频带分量的第一估计失真可以被确定为到第一频带分量中并且到比第一频带分量更高的频率的频带分量的至少一部分中引起的失真的最大值。这是因为,任何单个带通常产生包括到自身并且大于自身的带中的失真。可以如等式7中所示那样以从最低带到最高的顺序方式来计算充当结合图1和图2以上描述的时变阈值的失真谱估计D1[n]-DB[n],其中,用于固定偏移的值Doffset的示例是40dB:
D1[n]=S1[n]-Doffset (7)
Db[n]=max{Db-1[n],Sb[n]-Doffset} b=2...B
在图3中,在332,例如,使用图1的DAM 108预测在存在感知谱估计sb[n]的情况下的失真谱估计Db[n]的能听度测量。如下所述,图4示出用于预测该能听度测量的技术的示例。
在图3中,在336,根据所预测的能听度测量A[n]来调整时变阈值中的一个或更多个。在一些实现方式中,所预测的能听度测量A[n]被归一化,并且参照固定阈值Lb中的一个或更多个而且根据应用于偏移值的归一化能听度测量来提升或降低时变阈值Db[n]中的一个或更多个。例如,所预测的能听度测量可以归一化于0至1之间,然后被利用以调整时变阈值D1[n]-DB[n],如等式8所示:
在等式8的示例中,归一化限制被选取,以使得当归一化的所预测的能听度测量Anorm[n]等于0时,所引起的失真良好地受输出信号掩蔽,并且当Anorm[n]等于1时,失真处于能听度的边沿。因此,当Anorm[n]等于0时,时变阈值D1[n]-DB[n]可以得以提升,以允许更响的回放,但当Anorm[n]等于1时,阈值D1[n]-DB[n]保持在其标称值。故此,可以根据下式从固定阈值Lb来计算阈值D1[n]-DB[n]:
Db[n]=Lb+(1-Anorm[n])Loffset (9)
在等式9中,当Anorm[n]等于零时,阈值Db[n]在其标称值之上提升达Loffset dB。在一种情况下,将Loffset设置在6dB的范围中得到用于宽带信号的感知响度的感知上实质性的增加,而没有所感知的失真的增加。在其它情况下,对于特定回放设备修整Loffset。
图4示出根据一些实现方式的用于在存在感知谱估计的情况下预测失真谱估计的能听度测量的方法400的示例。在404,据感知谱估计sb[n]计算掩蔽阈值Mb[n]。用于掩蔽阈值Mb[n]的一个模型是在感知谱估计之下的固定偏移Moffset,如等式10所示,其中,用于Moffset的值的示例是10dB:
Mb[n]=Sb[n]-Moffset (10)
替代地,可以使用掩蔽模型,掩蔽模型根据掩蔽信号的调性来考虑掩蔽的变化性。通常已知的是,类似音调的信号的掩蔽能力显著小于类似噪声的信号。因此,可以基于sb[n]参照调性谱来计算掩蔽阈值Mb[n]。调性谱包括区分类似噪声的频带分量与类似音调的频带分量的调性值。可以使用已知的技术来表征每个带中的sb[n]的调性,以生成调性谱Tb[n],其中,Tb[n]从0到1变化。0指示类似噪声的信号,1表示类似音调的信号。利用该调性谱,可以如等式11所表示的那样计算掩蔽阈值:
Mb[n]=Sb[n]-(Tb[n]Mtone+(1-Tb[n])Mnoise) (11)
在一种测试情况下,Mtone=30dB并且Mnoise=10dB是适当值的示例,从而得到比类似噪声的信号小20dB的用于音调信号的掩蔽。
在图4中,在408,在各带上对失真谱估计Db[n]与掩蔽阈值Mb[n]进行比较,以确定Db[n]与Mb[n]之间的任何差值。在412,所确定的差值的任何正数值相加,以产生所预测的能听度测量A[n]。在一些实现方式中,A[n]被计算为Db[n]与Mb[n]之间的差值的正数值的加权和,如等式12所示:
在等式12中,在一些实现方式中,可以针对比中频带更少地加权的高频带和低频带在感知上激励加权Wb。
在一些其它实现方式中,并非利用显式失真生成和掩蔽模型,可以反而据信号谱Sb[n]的函数来推导失真能听度的测量。一个这样的示例是该谱的在各带上的标准差,如等式13所示:
当标准差很低时,所有带的值大致相同,说明Sb[n]大致是宽带的。在此情况下,Sb[n]应适度良好地掩蔽失真。如果标准差相对较高,则Sb[n]的值显著变化,以指示失真将是可听的谱中的可能“空洞”。因此,等式13中的值A[n]非常粗略地匹配等式12中的值A[n]的行为。来自等式13的能听度值可以然后使用与关于失真生成和掩蔽模型所使用的不同的归一化限制根据等式8而得以归一化,并然后如等式9中那样得以利用,以调整阈值Db[n]。
图5A示出根据一些实现方式的在显示器设备上所显示的输入音频信号的频带分量的能量级别的图形表示500A的示例。图5B示出根据一些实现方式的在显示器设备上所显示的由听者感知的所估计的输出信号谱的对应能量级别的图形表示500B的示例。
在图5A和图5B的示例中,图1的压缩器100如上所述处理输入音频信号x[n]。在图5A中,输入信号的二十个频带分量x1[n]-x20[n]通过图1的滤波器组104生成,并且被分隔开达人类听力的模仿(mimic)感知分辨率。馈送图1的压缩函数112的每个频带分量xb[n]的信号能量由图5A中的条504表示。如上所述计算的用于每个频带分量的时变阈值D1[n]-D20[n]由空白分段508表示。从压缩函数112输出的增益g1[n]-g20[n]由分段512描述。
在图5B中,感知谱估计S1[n]-S20[n]的能量级别由条514表示。据上述的感知谱估计sb[n]计算出的掩蔽阈值M1[n]-M20[n]在图5B中由分段516表示。由图1的DAM 108所生成的时变阈值D1[n]-D2[n]在图5B中由空白分段520表示。在图1中,在存在通过压缩器100播放音频信号的情况下在听者将感知任何所引起的失真之前,DAM108将图5B的时变阈值D1[n]-D20[n]520增加到最大可能级别。通常,对于宽带信号,时变阈值D1[n]-D20[n]将增加到它们的标称地设置的级别Lb之上,这是因为信号自身将掩蔽任何所引起的失真的非常重要的部分。对于窄带信号,时变阈值将很可能保留在它们的标称级别附近,这是因为信号将提供任何所引起的失真的很少掩蔽。
图6示出根据一些实现方式的用于呈现音频信号的包括压缩器100的回放系统600的示例。在图6中,控制器604被配置为实现上述的压缩器100。例如,以上参照图2-图4所描述的操作中的一个或更多个可以被控制器604执行或被使得由控制器604执行。控制器604可以具有各种不同配置,如以下更详细地解释的那样。此外,控制器604在图6的情况下可以在用户设备上实现,或在一些情况下,在一个或更多个服务器上实现。
在对于图6所示的示例的替选示例中,实现控制器604的服务器可以在合适的网络上将音频组流传送到用户的设备。本领域技术人员应理解,该网络提供服务器与用户设备(如智能电话或平板设备)之间的通信。网络可以是各种网络环境的任何子集或组合,包括例如基于TCP/IP的网络、电信网络、无线网络、缆线网络、公共网络、私有网络、广域网、局域网、互联网、World Wide Web、内部网、外部网等。
返回图6,回放系统600包括数模转换器(DAC)608,数模转换器(DAC)608被耦合为从压缩器100接收输出信号y[n]并且将y[n]转换为模拟信号。虽然DAC 608在该示例中被实现为控制器604的一个处理模块,但本领域技术人员应理解,DAC 608可以被构建为相对于控制器604的分离单元,并且在一些实例中,构建为相对于控制器604所处的服务器或用户的设备的分离设备。
在图6中,预放大器612被耦合为接收并且拉升由DAC 608所输出的模拟信号的信号强度。可以使用各种类型的预放大器,如电流灵敏预放大器、寄生电容预放大器、电荷灵敏预放大器或其某种组合。本领域技术人员应理解,在一些替选示例中,可以从系统600中省略预放大器612。
在图6中,功率放大器616被耦合以接收并且放大来自预放大器612的所拉升的信号,以产生适合于驱动一个或更多个扬声器620的放大的输出信号。在从系统600省略预放大器612的情况下,功率放大器616可以用集成放大器替换。系统600的放大器和扬声器可以是如上所述的用户的设备的组件。在一些实现方式中,与用户的设备集成的或处于连接到用户的设备的分离设备的形式的显示器可以被控制,以显示展示输出信号的频带以及表征该信号的其它信息(如图5A和图5B中所呈现的信息)的图形数据。在一些其它情形中,图6的放大器612和扬声器620是公共地址(PA)系统、戏剧或音乐会声音系统或家用系统(如立体声或家庭影院系统)的一部分。
可以通过一个或更多个计算设备来实现在此所描述的技术。例如,专用计算设备的控制器可以硬连线,以执行所公开的操作或使得这些操作得以执行,并且可以包括持续地被编程以执行操作或使得操作得以执行的数字电子电路(如一个或更多个专用集成电路(ASIC)或现场可编程门阵列(FPGA))。在一些实现方式中,组合具有定制编程的定制硬连线逻辑、ASIC和/或FPGA以实现这些技术。
在一些其它实现方式中,通用计算设备可以包括合并有被编程以使得所公开的操作中的一个或更多个被依照固件、存储器、其它存储体或其组合中的程序指令而执行的中央处理单元(CPU)的控制器。通用计算设备的示例包括服务器、网络设备和用户设备(如智能电话、平板设备、膝上型设备、台式计算机、便携式媒体播放器、其它各种便携式手持设备)以及任何其它包括数据处理硬件和/或程序逻辑的设备,以实现所公开的操作或使得操作得以实现并且执行。计算设备可以包括监视器、打印机、或其它合适的用于将在此所提及的任何结果提供给用户的显示器。
在此使用的术语“存储介质”和“存储媒介”指代存储使得计算机或机器的类型以特定方式操作的数据和/或指令的任何介质。在此所描述的任何模型、模块、单元、引擎和操作可以实现为可由控制器的处理器使用任何合适的计算机语言运行的软件代码或被使得由其实现。软件代码可以存储为用于存储和/或传输的计算机可读介质上的一系列指令或命令。合适的计算机可读介质的示例包括随机存取存储器(RAM)、只读存储器(ROM)、磁介质(如硬驱或软盘)、光学介质(如压缩盘(CD)或DVD(数字多功能盘))、固态驱动器、闪存、以及任何其它存储器芯片或盒。计算机可读介质可以是这些存储设备的任何组合。以软件/程序代码所编码的计算机可读介质可以随兼容设备(如上述用户设备或服务器)一起封装或与其它设备分离地提供。任何这些计算机可读介质可以驻留在单个计算设备或整个计算机系统上或其中,并且可以处于系统或网络内的其它计算机可读介质当中。
存储介质不同于传输介质,但可以与传输介质结合而被使用。传输介质参与在存储介质之间传递信息。例如,传输介质包括同轴电缆、铜线和光纤。传输介质也可以采用如在无线电波和红外数据通信期间生成的声波或光波的形式。
尽管在此参照特定计算范例和软件工具,但所公开的技术不限于硬件和软件的任何特定组合,也不限于用于由计算设备或数据处理装置所运行的指令的任何特定源。各种实现方式所基于的程序指令可以与各种编程语言、软件工具和数据格式中的任一种对应,并且存储于任何类型的非瞬时计算机可读存储介质或存储器设备中,并且可以在单机计算设备上根据各种计算模型(包括例如客户机/服务器模型、点对点模型)或根据其中可以在不同位置处作用或采用各种功能的分布式计算模型而运行。此外,在此对特定协议的引用仅是示例的方式。可以采用本领域技术人员已知的合适的替代方式。
还应注意,在此所使用的术语“扬声器”可以仅通过示例的方式包外放扬声器(包括外壳中安装的直接辐射电动态驱动器)、喇叭外放扬声器、压电扬声器、磁致伸缩扬声器、静电外放扬声器、带和平面磁外放扬声器、弯曲波外放扬声器、平坦板外放扬声器、分布模式外放扬声器、Heil空气运动换能器、等离子体弧扬声器、数字扬声器及其任何组合。
虽然已经参照该申请的具体实现方式特别地示出并且描述了其主题内容,但本领域技术人员应理解,在不脱离本公开的精神和范围的情况下,可以进行所公开的实现方式的形式和细节的改变。附图中示出这些实现方式中的一些的示例,阐述具体细节以提供其透彻理解。应注意,可以在没有一些或所有这些具体细节的情况下实践这些实现方式。此外,为了提高清楚性,尚未详细描述公知特征。最后,虽然在此已经参照一些实现方式讨论了优点,但应理解,范围不应受限于对这些优点的讨论。而是应参照所附权利要求来确定范围。
Claims (20)
1.一种用于响应于输入音频信号来动态调整压缩器的阈值的方法,所述方法包括:
接收具有多个频带分量的输入音频信号;
根据所述多个频带分量来确定多个时变阈值,每个时变阈值与相应的频带分量相对应;
通过压缩器对每个频带分量执行具有对应的时变阈值的压缩运算以产生多个增益,每个增益与相应的频带分量相对应;
将每个增益应用于受延迟的对应的频带分量,以产生多个被处理的频带分量;
把被处理的频带分量相加以产生输出信号;
确定所述输出信号的感知谱的时变估计;
确定由感知谱的时变估计所引起的失真谱的时变估计;
在存在感知谱的时变估计的情况下预测失真谱的时变估计的能听度测量;以及
根据所预测的能听度测量来调整所述时变阈值中的一个或更多个。
2.如权利要求1所述的方法,其中,根据失真模型对所述感知谱的时变估计的响应来确定所述失真谱的时变估计。
3.如权利要求2所述的方法,其中,所述失真谱的时变估计包括第一频带分量的第一估计失真,所述第一估计失真被确定为被引起进入所述第一频带分量中并且进入比所述第一频带分量更高频率的频带分量的至少一部分中的失真的最大值。
4.如权利要求1所述的方法,其中,确定感知谱的时变估计包括:
将平滑运算应用于被处理的频带分量。
5.如权利要求1所述的方法,其中,在存在所述感知谱的时变估计的情况下预测所述失真谱的时变估计的能听度测量包括:
根据感知谱的时变估计来计算掩蔽阈值;
确定所述失真谱的时变估计与所述掩蔽阈值之间的差值;以及
把所确定的差值的正数值相加,以产生预测的能听度测量。
6.如权利要求5所述的方法,其中,所述掩蔽阈值是基于感知谱的时变估计参照调性谱来计算的,所述调性谱包括区分噪声的频带分量与音调的频带分量的调性值。
7.如权利要求5所述的方法,其中,所确定的差值的相加的正数值被加权以使得一个或更多个上频带分量和一个或更多个下频带分量具有比上频带分量与下频带分量之间的频带分量更低的权重。
8.如权利要求1所述的方法,其中,根据多个固定阈值来进一步确定所述时变阈值。
9.如权利要求8所述的方法,其中,根据频带分量并且根据所述多个固定阈值来确定每个时变阈值。
10.如权利要求8所述的方法,其中,根据对应的频带分量并且根据相应的固定阈值来确定每个时变阈值。
11.如权利要求8所述的方法,还包括:
归一化所预测的能听度测量;以及
参照所述固定阈值中的一个或更多个并且根据应用于偏移值的归一化的能听度测量来提升或降低所述时变阈值中的一个或更多个。
12.如权利要求1所述的方法,还包括:
在存储介质上存储所述输出信号的数据。
13.一种用于响应于输入音频信号来动态调整压缩阈值的装置,所述装置包括:
一个或更多个控制器,能操作为使得执行如权利要求1所述的方法。
14.如权利要求13所述的装置,其中,所述一个或更多个控制器进一步能操作为使得执行如权利要求2-12中的一项或更多项所述的方法。
15.如权利要求13所述的装置,还包括:
滤波模块,能够对所述输入音频信号进行滤波以产生所述多个频带分量。
16.如权利要求15所述的装置,其中,所述滤波模块包括:
多带滤波器,包括多个带通滤波器,每个带通滤波器与相应的频带分量相对应。
17.如权利要求13所述的装置,还包括:
一个或更多个放大器,被耦合以接收所述输出信号,所述一个或更多个放大器能够放大所述输出信号以产生放大的输出信号;以及
一个或更多个扬声器,被耦合以接收并且播放放大的输出信号。
18.如权利要求17所述的装置,还包括:
显示器设备,被耦合以接收所述输出信号或放大的输出信号,所述显示器设备能够显示与所接收到的信号相关联的图形数据。
19.一种非瞬时计算机可读存储介质,存储能由计算设备运行以使得执行用于响应于输入音频信号来动态调整压缩器的阈值的方法的指令,所述方法包括如权利要求1所述的方法。
20.如权利要求19所述的非瞬时计算机可读存储介质,其中,所述用于响应于输入音频信号来动态调整压缩器的阈值的方法还包括如权利要求2所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810153878.7A CN108365827B (zh) | 2013-04-29 | 2014-04-14 | 具有动态阈值的频带压缩 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361817175P | 2013-04-29 | 2013-04-29 | |
US61/817,175 | 2013-04-29 | ||
PCT/US2014/034024 WO2014179021A1 (en) | 2013-04-29 | 2014-04-14 | Frequency band compression with dynamic thresholds |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810153878.7A Division CN108365827B (zh) | 2013-04-29 | 2014-04-14 | 具有动态阈值的频带压缩 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105164918A CN105164918A (zh) | 2015-12-16 |
CN105164918B true CN105164918B (zh) | 2018-03-30 |
Family
ID=50687733
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810153878.7A Active CN108365827B (zh) | 2013-04-29 | 2014-04-14 | 具有动态阈值的频带压缩 |
CN201480024349.7A Active CN105164918B (zh) | 2013-04-29 | 2014-04-14 | 具有动态阈值的频带压缩 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810153878.7A Active CN108365827B (zh) | 2013-04-29 | 2014-04-14 | 具有动态阈值的频带压缩 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9762198B2 (zh) |
EP (1) | EP2992605B1 (zh) |
JP (2) | JP5969727B2 (zh) |
CN (2) | CN108365827B (zh) |
HK (3) | HK1215108A1 (zh) |
WO (1) | WO2014179021A1 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2992605B1 (en) * | 2013-04-29 | 2017-06-07 | Dolby Laboratories Licensing Corporation | Frequency band compression with dynamic thresholds |
EP3223279B1 (en) * | 2016-03-21 | 2019-01-09 | Nxp B.V. | A speech signal processing circuit |
US10225654B1 (en) | 2017-09-07 | 2019-03-05 | Cirrus Logic, Inc. | Speaker distortion reduction |
EP3692530B1 (en) | 2017-10-02 | 2021-09-08 | Dolby Laboratories Licensing Corporation | Audio de-esser independent of absolute signal level |
US10827265B2 (en) * | 2018-01-25 | 2020-11-03 | Cirrus Logic, Inc. | Psychoacoustics for improved audio reproduction, power reduction, and speaker protection |
EP3579583B1 (en) | 2018-06-06 | 2023-03-29 | Dolby Laboratories Licensing Corporation | Manual characterization of perceived transducer distortion |
EP3584927B1 (en) * | 2018-06-20 | 2021-03-10 | Mimi Hearing Technologies GmbH | Systems and methods for processing an audio signal for replay on an audio device |
US10991375B2 (en) | 2018-06-20 | 2021-04-27 | Mimi Hearing Technologies GmbH | Systems and methods for processing an audio signal for replay on an audio device |
US11062717B2 (en) * | 2018-06-20 | 2021-07-13 | Mimi Hearing Technologies GmbH | Systems and methods for processing an audio signal for replay on an audio device |
US10911013B2 (en) | 2018-07-05 | 2021-02-02 | Comcast Cable Communications, Llc | Dynamic audio normalization process |
WO2020069120A1 (en) * | 2018-09-28 | 2020-04-02 | Dolby Laboratories Licensing Corporation | Distortion reducing multi-band compressor with dynamic thresholds based on scene switch analyzer guided distortion audibility model |
FR3091078A1 (fr) * | 2018-12-21 | 2020-06-26 | Cabasse | Systeme d’adaptation de la reponse spectrale d’une enceinte acoustique et de commande de la dynamique d’une chaine haute fidelite |
KR102277952B1 (ko) * | 2019-01-11 | 2021-07-19 | 브레인소프트주식회사 | 디제이 변환에 의한 주파수 추출 방법 |
CN113574596A (zh) * | 2019-02-19 | 2021-10-29 | 公立大学法人秋田县立大学 | 音频信号编码方法、音频信号解码方法、程序、编码装置、音频系统及解码装置 |
EP3840404B8 (en) | 2019-12-19 | 2023-11-01 | Steelseries France | A method for audio rendering by an apparatus |
US11159888B1 (en) | 2020-09-18 | 2021-10-26 | Cirrus Logic, Inc. | Transducer cooling by introduction of a cooling component in the transducer input signal |
US11153682B1 (en) | 2020-09-18 | 2021-10-19 | Cirrus Logic, Inc. | Micro-speaker audio power reproduction system and method with reduced energy use and thermal protection using micro-speaker electro-acoustic response and human hearing thresholds |
CN113821047A (zh) * | 2021-08-18 | 2021-12-21 | 杭州电子科技大学 | 一种基于单目视觉的无人机自主降落方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1856934A (zh) * | 2003-09-26 | 2006-11-01 | Bbe声音公司 | 音频预放大器和中频带压缩器电路 |
CN101036293A (zh) * | 2004-08-10 | 2007-09-12 | 安东尼·邦焦维 | 在高噪声环境中呈现的音频信号处理系统和方法 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1385493A (en) | 1971-11-19 | 1975-02-26 | Secr Defence | Speech communication system |
US4208548A (en) | 1977-07-19 | 1980-06-17 | Orban Associates, Inc. | Apparatus and method for peak-limiting audio frequency signals |
US4249042A (en) | 1979-08-06 | 1981-02-03 | Orban Associates, Inc. | Multiband cross-coupled compressor with overshoot protection circuit |
SU1223285A1 (ru) | 1984-02-16 | 1986-04-07 | Предприятие П/Я Р-6947 | Устройство дл сжати частотного диапазона звуковых сигналов |
US5278912A (en) | 1991-06-28 | 1994-01-11 | Resound Corporation | Multiband programmable compression system |
US5483600A (en) | 1994-02-14 | 1996-01-09 | Aphex Systems, Ltd. | Wave dependent compressor |
US6097824A (en) | 1997-06-06 | 2000-08-01 | Audiologic, Incorporated | Continuous frequency dynamic range audio compressor |
US6108431A (en) | 1996-05-01 | 2000-08-22 | Phonak Ag | Loudness limiter |
US5832444A (en) * | 1996-09-10 | 1998-11-03 | Schmidt; Jon C. | Apparatus for dynamic range compression of an audio signal |
US7309829B1 (en) | 1998-05-15 | 2007-12-18 | Ludwig Lester F | Layered signal processing for individual and group output of multi-channel electronic musical instruments |
US6757395B1 (en) | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US6618486B2 (en) | 2000-05-03 | 2003-09-09 | Robert A. Orban | Controller for FM 412 multiplex power regulation |
DE60209161T2 (de) | 2001-04-18 | 2006-10-05 | Gennum Corp., Burlington | Mehrkanal Hörgerät mit Übertragungsmöglichkeiten zwischen den Kanälen |
CA2354755A1 (en) * | 2001-08-07 | 2003-02-07 | Dspfactory Ltd. | Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US20030223597A1 (en) | 2002-05-29 | 2003-12-04 | Sunil Puria | Adapative noise compensation for dynamic signal enhancement |
US7043423B2 (en) * | 2002-07-16 | 2006-05-09 | Dolby Laboratories Licensing Corporation | Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding |
JP2004061617A (ja) * | 2002-07-25 | 2004-02-26 | Fujitsu Ltd | 受話音声処理装置 |
JP4185984B2 (ja) | 2003-11-04 | 2008-11-26 | 国立大学法人山梨大学 | 音信号の加工装置および加工方法 |
JP2005175674A (ja) | 2003-12-09 | 2005-06-30 | Nec Corp | 信号圧縮伸張装置および携帯通信端末装置 |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
EP1805891B1 (en) | 2004-10-26 | 2012-05-16 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
MY142675A (en) * | 2006-06-30 | 2010-12-15 | Fraunhofer Ges Forschung | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
DE602006003776D1 (de) * | 2006-11-17 | 2009-01-02 | Akg Acoustics Gmbh | Audiokompressor |
EP2118885B1 (en) | 2007-02-26 | 2012-07-11 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
TWI421856B (zh) | 2007-03-19 | 2014-01-01 | Dolby Lab Licensing Corp | 使用感知模型之語音增強技術 |
US7742746B2 (en) * | 2007-04-30 | 2010-06-22 | Qualcomm Incorporated | Automatic volume and dynamic range adjustment for mobile audio devices |
MY146431A (en) * | 2007-06-11 | 2012-08-15 | Fraunhofer Ges Forschung | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal |
US20090253457A1 (en) * | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
EP2279509B1 (en) | 2008-04-18 | 2012-12-19 | Dolby Laboratories Licensing Corporation | Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience |
BR122021003726B1 (pt) * | 2008-07-11 | 2021-11-09 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio. |
WO2010044439A1 (ja) | 2008-10-17 | 2010-04-22 | シャープ株式会社 | 音声信号調整装置及び音声信号調整方法 |
US20100215193A1 (en) | 2009-02-25 | 2010-08-26 | Conexant Systems, Inc. | Speaker Distortion Deduction System and Method |
WO2010137650A1 (ja) * | 2009-05-29 | 2010-12-02 | シャープ株式会社 | 音声再生装置、音声再生方法及びプログラム |
US8600076B2 (en) * | 2009-11-09 | 2013-12-03 | Neofidelity, Inc. | Multiband DRC system and method for controlling the same |
CN102812636B (zh) * | 2010-03-18 | 2016-06-08 | 杜比实验室特许公司 | 用于具有音质保护的失真减少多频带压缩器的技术 |
ES2526761T3 (es) | 2010-04-22 | 2015-01-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para modificar una señal de audio de entrada |
US9130527B2 (en) * | 2010-08-18 | 2015-09-08 | Dolby Laboratories Licensing Corporation | Method and system for controlling distortion in a critical frequency band of an audio signal |
EP2538555B1 (en) * | 2011-06-22 | 2019-09-11 | Nxp B.V. | Control of a loudspeaker output |
EP2992605B1 (en) * | 2013-04-29 | 2017-06-07 | Dolby Laboratories Licensing Corporation | Frequency band compression with dynamic thresholds |
-
2014
- 2014-04-14 EP EP14723282.1A patent/EP2992605B1/en active Active
- 2014-04-14 CN CN201810153878.7A patent/CN108365827B/zh active Active
- 2014-04-14 CN CN201480024349.7A patent/CN105164918B/zh active Active
- 2014-04-14 JP JP2016510698A patent/JP5969727B2/ja active Active
- 2014-04-14 US US14/787,854 patent/US9762198B2/en active Active
- 2014-04-14 WO PCT/US2014/034024 patent/WO2014179021A1/en active Application Filing
-
2016
- 2016-03-15 HK HK16102994.4A patent/HK1215108A1/zh unknown
- 2016-07-07 JP JP2016134973A patent/JP6436934B2/ja active Active
- 2016-09-02 HK HK16110463.9A patent/HK1222478A1/zh unknown
-
2019
- 2019-01-25 HK HK19101305.7A patent/HK1258837A1/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1856934A (zh) * | 2003-09-26 | 2006-11-01 | Bbe声音公司 | 音频预放大器和中频带压缩器电路 |
CN101036293A (zh) * | 2004-08-10 | 2007-09-12 | 安东尼·邦焦维 | 在高噪声环境中呈现的音频信号处理系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2992605A1 (en) | 2016-03-09 |
JP2016518788A (ja) | 2016-06-23 |
US9762198B2 (en) | 2017-09-12 |
JP2016195439A (ja) | 2016-11-17 |
CN108365827B (zh) | 2021-10-26 |
HK1215108A1 (zh) | 2016-08-12 |
WO2014179021A1 (en) | 2014-11-06 |
JP6436934B2 (ja) | 2018-12-12 |
CN108365827A (zh) | 2018-08-03 |
US20160072467A1 (en) | 2016-03-10 |
JP5969727B2 (ja) | 2016-08-17 |
EP2992605B1 (en) | 2017-06-07 |
CN105164918A (zh) | 2015-12-16 |
HK1222478A1 (zh) | 2017-06-30 |
HK1258837A1 (zh) | 2019-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105164918B (zh) | 具有动态阈值的频带压缩 | |
CN105245195B (zh) | 用于具有音质保护的失真减少多频带压缩器的技术 | |
US20120082322A1 (en) | Sound scene manipulation | |
US20110002467A1 (en) | Dynamic enhancement of audio signals | |
US9319789B1 (en) | Bass enhancement | |
US11716065B2 (en) | Systems and methods of volume limiting | |
CN110506425A (zh) | 低音增强 | |
WO2024021682A1 (zh) | 音频处理方法、虚拟低音增强系统、设备和存储介质 | |
CN105812996B (zh) | 用于立体声展宽的系统和方法 | |
US10547927B1 (en) | Systems and methods for processing an audio signal for replay on stereo and multi-channel audio devices | |
CN111935429B (zh) | 音质自适应调节方法、相关系统和设备及存储介质 | |
CN113362839A (zh) | 音频数据处理方法、装置、计算机设备及存储介质 | |
EP3599775B1 (en) | Systems and methods for processing an audio signal for replay on stereo and multi-channel audio devices | |
CN102576560B (zh) | 电子音频设备 | |
EP3603106B1 (en) | Dynamically extending loudspeaker capabilities | |
CN116349252A (zh) | 用于处理双耳录音的方法和设备 | |
JP2005184154A (ja) | 自動利得制御装置及び自動利得制御方法 | |
CN116964964A (zh) | 音频信号处理系统、扬声器和电子设备 | |
CN115550820A (zh) | 扬声器控制方法、装置、电子设备及存储介质 | |
TWI584275B (zh) | 電子裝置和聲音信號的分析與播放方法 | |
CN115278454A (zh) | 一种用于音频放大器的功率智能调节方法及装置 | |
Stuart | Active loudspeakers | |
Krix et al. | Sound designs | |
Minnaar | Non-linear signal processing for low frequency enhancement | |
Bohn | Signal Processing Fundamentals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1215108 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |