CN111480347B - 具有优先级的空间感知动态范围控制系统 - Google Patents

具有优先级的空间感知动态范围控制系统 Download PDF

Info

Publication number
CN111480347B
CN111480347B CN201880080633.4A CN201880080633A CN111480347B CN 111480347 B CN111480347 B CN 111480347B CN 201880080633 A CN201880080633 A CN 201880080633A CN 111480347 B CN111480347 B CN 111480347B
Authority
CN
China
Prior art keywords
component
gain
gain factor
primary
components
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880080633.4A
Other languages
English (en)
Other versions
CN111480347A (zh
Inventor
约瑟夫·马里利奥
扎卡里·塞尔迪斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Boomcloud 360 Inc
Original Assignee
Boomcloud 360 Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Boomcloud 360 Inc filed Critical Boomcloud 360 Inc
Publication of CN111480347A publication Critical patent/CN111480347A/zh
Application granted granted Critical
Publication of CN111480347B publication Critical patent/CN111480347B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/02Manually-operated control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

使用在另一音频坐标系中应用的增益因子在音频坐标系中对音频信号进行限制。根据第二音频坐标系中的音频信号的第三分量和第四分量生成第一音频坐标系中的第一分量和第二分量。确定限定第三分量和第四分量中的每一个的最大水平的幅度阈值。将一个或更多个增益因子应用于第三分量和第四分量中的每一个,以生成经调整的第三分量和经调整的第四分量,并且根据经调整的第三分量和经调整的第四分量生成第二音频坐标系中的第一输出声道和第二输出声道。根据一个或更多个增益因子的应用,第一输出声道和第二输出声道每个均被限制在幅度阈值以下。

Description

具有优先级的空间感知动态范围控制系统
相关申请的交叉引用
本申请要求2017年12月15日提交的美国临时申请第62/599,601号的权益,其全部内容通过引用并入本文。
技术领域
本文描述的主题涉及音频处理,并且更具体地涉及在空间感知环境中音频信号的动态范围控制。
背景技术
范围控制是指将音频信号限制在阈值量以下。对于包括左声道和右声道的左-右空间中的立体声音频信号,可以通过根据需要向左声道和右声道施加增益从而使每个声道的峰值在阈值以下来在左-右空间中实现范围控制。然而,期望将范围控制的伪象移位到不同的空间位置。
发明内容
实施方式涉及在空间感知环境中提供对音频信号的范围控制。使用在另一音频坐标系(例如,中间-侧空间)中应用的增益因子在音频坐标系(例如,左-右空间)中对音频信号进行限制,以将硬限制的伪象移位到不同的空间位置。根据音频信号的第三分量(例如,左声道)和第四分量(例如,右声道)生成第一(例如,中间)分量和第二(例如,侧)分量。确定第二音频坐标系中的幅度阈值,该幅度阈值限定第三分量和第四分量中的每一个的最大水平。将一个或更多个增益因子应用于第一分量和第二分量中的每一个,以生成第一音频坐标系中的经调整的第一分量和经调整的第二分量。根据经调整的第一分量和经调整的第二分量生成第二音频坐标系中的第一(例如,左)输出声道和第二(例如,右)输出声道。根据应用于第一分量和第二分量中的每一个的一个或更多个增益因子,第一输出声道和第二输出声道每个均被限制在幅度阈值以下。
在一些实施方式中,一种非暂态计算机可读介质,其存储程序代码,程序代码在由处理器执行时将处理器配置成:根据第二音频坐标系中的音频信号的第三分量和第四分量生成第一音频坐标系中的第一分量和第二分量;确定第二音频坐标系中的幅度阈值,该幅度阈值限定第三分量和第四分量中的每一个的最大水平;将一个或更多个增益因子应用于第一分量和第二分量中的每一个以生成第一音频坐标系中的经调整的第一分量和经调整的第二分量;以及根据经调整的第一分量和经调整的第二分量生成第二音频坐标系中的第一输出声道和第二输出声道。根据应用于第一分量和第二分量中的每一个的一个或更多个增益因子,第一输出声道和第二输出声道每个均被限制在幅度阈值以下。
在一些实施方式中,一种用于处理音频信号的系统包括处理电路,该处理电路被配置成:根据第二音频坐标系中的音频信号的第三分量和第四分量生成第一音频坐标系中的第一分量和第二分量;确定第二音频坐标系中的幅度阈值,该幅度阈值限定第三分量和第四分量中的每一个的最大水平;将一个或更多个增益因子应用于第一分量和第二分量中的每一个以生成第一音频坐标系中的经调整的第一分量和经调整的第二分量;以及根据经调整的第一分量和经调整的第二分量生成第二音频坐标系中的第一输出声道和第二输出声道。根据应用于第一分量和第二分量中的每一个的一个或更多个增益因子,组合的第一输出声道和第二输出声道每个均被限制在幅度阈值以下。
其他方面包括部件、装置、系统、改进、方法、处理、应用、计算机可读介质以及与上述中任何一个相关的其他技术。
附图说明
图1是根据一些实施方式的音频处理系统的示意性框图。
图2是根据一些实施方式的空间限制器的示意性框图。
图3A是根据一些实施方式的侧声道增益应用、随后是L/R增益应用的框图。
图3B是根据一些实施方式的中间声道增益应用、随后是L/R增益应用的框图。
图4是根据一些实施方式的并行的中间声道增益应用和侧声道增益应用、随后是L/R增益应用的框图。
图5A是根据一些实施方式的侧声道增益应用、随后是中间声道增益应用、随后是L/R增益应用的框图。
图5B是根据一些实施方式的中间声道增益应用、随后是侧声道增益应用、随后是L/R增益应用的框图。
图6是根据一些实施方式的用于对音频信号进行空间限制的方法的流程图。
图7是根据一些实施方式的用于使用侧限制(或中间限制)、随后是左-右限制来对音频信号进行空间限制的处理的流程图。
图8是根据一些实施方式的用于使用并行的侧限制和中间限制、随后是左-右限制来对音频信号进行空间限制的处理的流程图。
图9是根据一些实施方式的使用串行的侧限制、中间限制和左-右限制来对音频信号进行空间限制的处理的流程图。
图10是根据一些实施方式的用于控制一个音频坐标系中的音频信号分量以实现在另一音频坐标系中限定的约束的处理的流程图。
图11是根据一些实施方式的用于侧链处理的空间限制器的示意性框图。
图12是根据一些实施方式的计算机系统的示意性框图。
仅出于说明的目的,附图描绘了并且具体实施方式描述了各种非限制性实施方式。
具体实施方式
现在将详细参照实施方式,其示例在附图中示出。在以下详细描述中,为了提供对所描述的各种实施方式的透彻理解,阐述了许多具体细节。然而,可以在没有这些具体细节的情况下实践所描述的实施方式。在其他实例中,没有详细描述公知的方法、过程、部件、电路和网络,以便不会不必要地模糊实施方式的各方面。
本公开内容的实施方式涉及使用在中间-侧空间中应用的增益因子对左-右空间中的音频信号的范围控制。包括左声道和右声道的音频信号被转换成中间分量和侧分量。将增益因子应用于中间分量和侧分量中的每一个,以生成经调整的中间分量和经调整的侧分量。经调整的分量被转换回到左-右空间成为左输出声道和右输出声道,左输出声道和右输出声道各自满足左-右空间中的左-右阈值。
可以根据中间分量与侧分量之间的空间限制的优先级来限定增益因子。空间限制的优先级可以是可调整的,并且限定了伪象到不同空间位置的期望移位以满足左-右阈值。可以使用用于较高优先级分量的增益因子来限定用于较低优先级分量的增益因子,使得仅在已达到较高优先级分量的增益降低预算但不满足左-右阈值时应用用于较低优先级分量的增益因子。这样,根据中间分量与侧分量之间的空间限制的优先级,对于左输出声道和右输出声道中的每一个,均满足左-右阈值。
示例音频处理系统
图1是根据一些实施方式的音频处理系统100的示意性框图。音频处理系统100接收包括左输入声道112和右输入声道114的输入音频信号,并且对声道112、114的中间分量116或侧分量118进行增益调整,以生成包括左输出声道132和右输出声道134的输出音频信号,左输出声道132和右输出声道134均具有限制在左-右阈值
Figure GDA0002958151420000041
以下的峰值。音频处理系统100在空间感知环境中提供对输入音频信号的动态范围控制。音频处理系统100可以根据输入能量聚焦的位置和配置音频处理系统100的操作的设置将硬限制的伪象移位到不同的空间位置(例如,输入音频信号的中间分量或侧分量)。设置可以以编程方式确定,或者可以由用户指定。
音频处理系统100包括L/R至M/S转换器102、空间限制器104、L/R限制器106、M/S至L/R转换器108和控制器110。L/R至M/S转换器102接收左输入声道112和右输入声道114,并根据输入声道112、114生成中间分量116和侧分量118。在一些实施方式中,可以基于左输入声道112和右输入声道114之和来生成中间分量116。可以基于左输入声道112与右输入声道114之间的差来生成侧分量118。可以以其他方式诸如使用各种L/R至M/S变换来生成中间分量和侧分量。在一些实施方式中,根据多声道(例如,环绕声)音频信号生成中间分量和侧分量。
空间限制器104包括中间增益处理器152和侧增益处理器154。中间增益处理器152接收中间分量116和侧分量118,并且确定用于中间分量116的中间增益因子αm。中间增益处理器152将中间增益因子αm应用于中间分量116以生成经调整的中间分量120。侧增益处理器154接收中间分量116和侧分量118,并且确定用于侧分量118的侧增益因子αs。侧增益处理器154将侧增益因子αs应用于侧分量118以生成经调整的侧分量122。
在一些实施方式中,在中间分量116与侧分量118之间存在空间限制的优先级。例如,将初级增益因子αI应用于较高优先级分量,其低至较高优先级分量的增益降低预算。如果增益降低预算被耗尽,但是左-右阈值
Figure GDA0002958151420000051
未能被满足,则将次级增益因子αII应用于较低优先级分量,以低至较低优先级分量的增益降低预算。如果初级分量是中间分量并且次级分量是侧分量,则中间增益因子αm由αI限定,并且侧增益因子αs由αII限定。如果初级分量是侧分量,并且次级分量是中间分量,则中间增益因子αm由αII限定,并且侧增益因子αs由αI限定。使用用于较高优先级分量的增益因子来递归地限定用于较低优先级分量的增益因子,以指定优先级。如果在应用用于较低优先级分量的增益因子之后左-右阈值
Figure GDA0002958151420000052
仍然未被满足,则根据需要将左-右增益因子αlr应用于中间分量和侧分量中的每一个,以满足左-右阈值
Figure GDA0002958151420000053
L/R限制器106包括L/R增益处理器156。L/R增益处理器156接收由空间限制器104调整的经调整的中间分量120和经调整的侧分量122,将左-右增益因子αlr应用于经调整的中间分量120以生成经调整的中间分量124,并将左-右增益因子αlr应用于侧分量122以生成经调整的侧分量126。
如以下结合图3A至图9更详细地说明的,增益因子αm、αs和αlr可以根据音频处理系统100的空间限制的优先级而变化。空间限制的优先级限定了中间限制阶段与侧限制阶段之间的优先级。如果例如利用增益预算或侧链处理约束中间增益降低计算或侧增益降低计算,则它们之后可以是应用于中间分量和侧分量两者的L/R限制阶段。此L/R限制阶段会同等地影响两个分量,因此可以被确定并应用在中间-侧空间或左-右空间中。较低优先级的限制阶段可以应用以下增益因子,该增益因子使用在较高优先级的限制阶段中应用的一个或更多个增益因子来限定。每个较高优先级的限制阶段可以包括限定增益因子的最小值的增益降低预算θ,其中当针对较高优先级的限制阶段增益降低预算被耗尽并且左-右阈值
Figure GDA0002958151420000054
未能被满足时,使用较低优先级的限制阶段。在每个配置中,存在对中间分量应用至少一个增益因子和对侧分量应用至少一个增益因子,以确保左-右空间中的输出音频信号的左声道132和右声道134的峰值在左-右阈值
Figure GDA0002958151420000055
以下。应该注意的是,这些阶段实际上可能没有分开,也不一定本质上是递归的。单独的阶段可以仅表示逻辑优先级。本文讨论的实施方式不限于使用或省略递归增益阶段计算或针对每个阶段经由单独的动态范围控制器进行的操作。
M/S至L/R转换器108接收经调整的中间分量124和经调整的侧分量126,并根据经调整的中间分量124和经调整的侧分量126生成左输出声道132和右输出声道134。在一些实施方式中,可以基于经调整的中间分量124和经调整的侧分量126之和来生成左输出声道132。可以基于经调整的中间分量124与经调整的侧分量126之间的差来生成右输出声道134。其他类型的变换可以用于根据中间分量和侧分量生成左声道和右声道。M/S至L/R转换器108将左输出声道132输出至左扬声器,并且将右输出声道134输出至右扬声器。作为空间限制器104和L/R限制器106所应用的处理的结果,输出音频信号的左声道132和右声道134的峰值在左-右阈值
Figure GDA0002958151420000061
以下。
在一些实施方式中,控制器110控制音频处理系统100的操作。控制器110可以耦接至空间限制器104和L/R限制器以配置空间限制器104的操作,例如限定阈值(例如,
Figure GDA0002958151420000062
增益降低预算等)、确定处理阶段的优先级以及根据确定的优先级和阈值确定增益因子。如本文更详细地讨论的,空间限制器使用的各种参数可以通过用户输入、以编程方式或其组合来限定。
示例空间限制器
图2是根据一些实施方式的空间限制器200的示意性框图。空间限制器200包括中间峰值提取器202、侧峰值提取器204、中间增益处理器206、侧增益处理器208、中间混合器210和侧混合器212。
中间峰值提取器202接收中间分量116,并且确定表示中间分量116的峰值的中间峰值214。中间峰值提取器202将中间峰值214提供给中间增益处理器206和侧增益处理器208。侧峰值提取器204接收侧分量118,并且确定表示侧分量118的峰值的侧峰值216。侧峰值提取器204将侧峰值216提供给中间增益处理器206和侧增益处理器208。
中间增益处理器206基于中间峰值214、侧峰值216、左-右空间中的阈值
Figure GDA0002958151420000063
来确定中间增益因子218(αm)。侧增益处理器208基于中间峰值214、侧峰值216、左-右空间中的阈值
Figure GDA0002958151420000064
来确定侧增益因子220(αs)。
中间混合器210接收中间分量116和中间增益因子218(αm),并将这些值相乘以生成经调整的中间分量120。侧混合器212接收侧分量118和侧增益因子220(αs),并将这些值相乘以生成经调整的侧分量122。
在一些实施方式中,L/R限制阶段与空间限制器200集成在一起。中间增益处理器206将左-右增益因子αlr与中间增益因子218结合,并且中间混合器210将结果与中间分量116相乘以生成经调整的中间分量124。侧增益处理器208将左-右增益因子αlr与侧增益因子220结合,并且侧混合器212将结果与侧分量118相乘以生成经调整的侧分量126。
左-右空间到中间-侧空间的坐标变换
增益应用可以被应用于输入音频信号的中间分量116或侧分量118之一。为了创建中间分量116和侧分量118,可以通过等式1限定用于将信号从左-右空间转换到中间-侧空间的变换M:
Figure GDA0002958151420000071
在中间-侧空间中,可执行各种处理,包括:子带空间处理、串扰处理(例如,串扰消除或串扰模拟)、串扰补偿(例如,调整由串扰处理引起的频谱伪象)以及在中间分量或侧分量中的增益应用。经处理的中间分量和侧分量被转换到左-右空间,作为左扬声器的左输出声道和右扬声器的右输出声道。
可以通过等式2来限定用于将信号从中间-侧空间转换到左-右空间的逆变换M-1
Figure GDA0002958151420000072
左-右空间和中间-侧空间是正交音频坐标系的示例。在实践中,等式1和等式2可能比真正的正交形式更优选,其中,正变换和逆变换以2的平方根缩放,以降低计算复杂性。
侧(或中间)优先级到左-右优先级限制
音频处理系统100可通过使应用于侧分量m2或中间分量m1中的一者的增益优先、随后是L/R增益来执行音频信号的空间优先级限制。例如,确定左-右空间中的左-右阈值
Figure GDA0002958151420000073
该左-右阈值
Figure GDA0002958151420000074
限定了左-右空间中的音频信号的阈值水平。左输出声道132和右输出声道134每一个都不应超过阈值
Figure GDA0002958151420000075
为了满足阈值
Figure GDA0002958151420000076
音频处理系统可以使中间分量或侧分量之间的中间-侧空间中的增益优先。
为了使侧分量的降低最小化,可以使用侧分量的增益降低预算θs。增益降低预算θs限定了可以应用于侧分量的最大增益降低量,并且被用于确定侧分量的增益因子αs。基于增益因子αs确定左-右增益因子αlr。将侧增益因子αs应用于侧分量并且将左-右增益因子αlr应用于中间分量和侧分量二者会致使满足音频信号的阈值
Figure GDA0002958151420000081
在确定增益因子αs之后,将αs应用于侧分量。左-右增益因子αlr被应用于中间分量和侧分量中的每一个(或者在转换到左-右空间之后的左声道和右声道中的每一个,因为相同的全局比例因子可以被应用于坐标的任何正交旋转而具有相同的结果)。此处,存在针对侧分量的增益控制的优先化以满足阈值
Figure GDA0002958151420000082
其低至侧增益降低预算θs。如果增益降低预算θs被应用于侧分量,而阈值
Figure GDA0002958151420000083
未被满足,则合适的αlr被应用于中间分量和侧分量二者。这导致使用在中间-侧空间中确定的增益因子满足阈值
Figure GDA0002958151420000084
为了使对侧分量m2的低至侧增益降低预算θs的增益控制优先,应用于侧分量m2的增益因子αs可以由等式3限定:
Figure GDA0002958151420000085
其中|m1|是中间分量m1的峰值,并且|m2|是侧分量m2的峰值。
可以使用侧增益因子αS递归地限定左-右增益因子αlr。左-右增益因子αlr由等式4限定:
Figure GDA0002958151420000086
其中,PLR是在将侧增益因子αs应用于侧分量m2之后左-右空间中的最坏情况(worst-case)峰值。
PLR可以由等式5限定:
Figure GDA0002958151420000087
一旦确定了增益系数αs和αlr,就将它们应用于中间分量m1和侧分量m2,如等式6所示:
Figure GDA0002958151420000088
然后,如等式2所限定的逆变换可以应用于等式6的结果,以产生左输出声道132和右输出声道134,每个声道均满足左-右阈值
Figure GDA0002958151420000091
注意,在等式3中,如果对于给定峰值αs=0,则这将把声场完全分解为单声道。然而,我们可以通过为θs指定非零值来减轻这种影响。如果预算θs在侧分量中耗尽,或者在中间声道中存在削波,则将存在经由αlr而应用于侧分量和中间分量二者的峰值限制的一些分量。
等式3至等式6暗示了图3A所示的增益降低阶段的优先级,其中首先存在侧限制器阶段302,然后是左-右限制器阶段304。类似形式的处理可以应用于图3B所示的中间分量m1,其中首先存在中间限制器阶段306,然后是左-右限制器阶段304。此处,使用增益降低预算θm限定中间增益因子αm以及在应用中间增益因子αm之后根据需要使用左-右增益因子αlr以满足阈值
Figure GDA0002958151420000092
来实现对中间分量的算法控制。
为了使对中间分量m1的低至中间增益降低预算θm的增益控制优先,应用于中间分量m1的中间增益因子αm可以由等式7限定:
Figure GDA0002958151420000093
其中|m1|是中间分量m1的峰值,并且|m2|是侧分量m2的峰值。
可以使用中间增益因子αm递归地限定左-右增益因子αlr。左-右增益因子αlr由等式8限定:
Figure GDA0002958151420000094
其中PLR是在将中间增益因子αm应用于中间分量m1之后左-右空间中的最坏情况峰值。
PLR可以由等式9限定:
Figure GDA0002958151420000095
一旦确定了增益系数αm和αlr,就将它们应用于中间分量m1和侧分量m2,如等式10所示:
Figure GDA0002958151420000096
然后,如等式2所限定的逆变换可以应用于等式10的结果,以产生左输出声道和右输出声道,每个声道均满足左-右阈值
Figure GDA0002958151420000101
并行的中间优先级和侧优先级到左-右优先级限制
音频处理系统100可以在中间分量与侧分量之间使用并行(平坦)优先级,同时仍然使增益系数αm和αs优先于左-右增益因子αlr。图4中示出了增益降低阶段的优先级,其中首先存在与中间限制器阶段404并行的侧限制器阶段402,以及在并行阶段402和404之后的L/R限制器阶段406。
在这种情况下,使用侧增益降低预算θs和中间增益降低预算θm二者。可以使用等式3来确定侧增益因子αs,并且可以使用等式7来确定中间增益因子αm。此处,由于中间分量和侧分量的并行优先级,对侧增益因子和中间增益因子的限定是独立的。
使用中间增益因子αm和侧增益因子αs来限定左-右增益因子αlr。左-右增益因子αlr由上面所示的等式8限定,并且其中最坏情况峰值PLR由等式11限定:
Figure GDA0002958151420000102
一旦确定了增益系数αm、αs和αlr,就将它们应用于中间分量m1和侧分量m2,如等式12所示:
Figure GDA0002958151420000103
注意,在该配置中,假设θm=0,可以允许αm化为0,以保持输出
Figure GDA0002958151420000104
Figure GDA0002958151420000105
这意味着尽管该附加阶段已经防止了中间声道信息被削波,但是所得到的声场仍然可以在感知上降为单声道。提供αm的较低界限将解决这个问题,但是将导致不完全的增益降低策略,因为我们的增益降低预算现在是有限的,其由20log10(θs)+20log10(θm)组成。这样,αlr的计算和应用被用于确保满足左-右阈值
Figure GDA0002958151420000106
串行的侧优先级、中间优先级和左-右优先级限制
音频处理系统可以使用中间阶段与侧阶段之间的串行优先级关系,其后是L/R限制器阶段。如图5A所示,首先是侧限制器阶段502,使得侧分量m2是进行限制的初级分量,然后是中间限制器阶段504,使得中间分量m1是进行限制的次级分量,然后是L/R限制器阶段506。在图5B所示的另一示例中,首先是中间限制器阶段504,使得中间分量m1是进行限制的初级分量,然后是侧限制器阶段502,使得侧分量m2是进行限制的次级分量,然后是L/R限制器阶段506。注意,阶段502、504和506不一定是单独的处理阶段,并且可以仅表示逻辑优先级。换句话说,可以基于逻辑优先级,利用所使用的不同增益因子同时计算所有增益降低。当在单独的阶段中应用增益因子时,可以使用递归增益阶段计算。
在任一情况下,令mI表示初级分量(中间分量m1或侧分量m2中的任一个),并且令mII表示次级分量(中间分量m1或侧分量m2中的另一个)。音频处理系统可以编程地或基于用户输入来确定中间分量与侧分量之间的优先级次序,其中较高优先级分量被指定为初级分量mI,并且较低优先级分量被指定为次级分量mII
初级增益因子αI被应用于初级分量mI,并且次级增益因子αII被应用于次级分量mII。根据初级增益因子αI递归地限定次级增益因子αII以指定优先级。这由用于初级增益因子αI的等式13和用于次级增益因子αII的等式14示出:
Figure GDA0002958151420000111
Figure GDA0002958151420000112
其中|mI|是初级分量mI的峰值,|mII|是次级分量mII的峰值,θI是初级分量mI的增益降低预算,并且θII是次级分量mII的增益降低预算。
可以使用中间增益因子αm和侧增益因子αs递归地限定左-右增益因子αlr。如果初级分量是中间分量并且次级分量是侧分量,则中间增益因子αm由αI限定,并且侧增益因子αs由αII限定。如果初级分量是侧分量并且次级分量是中间分量,则中间增益因子αm由αII限定,并且侧增益因子αs由αI限定。左-右增益因子αlr由等式15限定:
Figure GDA0002958151420000113
其中,PLR由等式16限定:
Figure GDA0002958151420000121
一旦确定了增益系数αm、αs和αlr,就将它们应用于中间分量m1和侧分量m2,如等式17所示:
Figure GDA0002958151420000122
在一些实施方式中,L/R限制阶段506与侧限制阶段502和中间限制阶段504中的每一个集成。L/R限制器可以使用非平凡的增益降低预算或侧链处理,会具有可能过调的相关风险。为了控制过调可能成为问题的这些情况,这种实施方式在信号路径的末端处将需要附加L/R限制器阶段。
控制信号平滑
上述增益控制等式涉及瞬时增益值。如果逐个样本地应用这些值而不进行平滑,则结果将被有效地控制而在适当的子空间中硬削波。所产生的伪象实质上是增益控制函数的高频调制。为了减少这些伪象,非线性低通滤波器可以限制增益控制函数的斜率。在期望完全因果关系的增益控制响应的情况下,向下箝位可以立即发生,但向上移动被限制到某一最大斜率。在可以在控制缓冲器中进行前瞻的情况下,可以应用最大负下降斜率限制(由前瞻长度确定),并且仍然在适当的峰值处达到目标控制增益。任一变型将伪象移位到音乐声的瞬变阶段,在那里它们被感知地掩蔽,并且同时减小它们的带宽。
示例处理
图6是根据一些实施方式的用于对音频信号进行空间限制的处理600的流程图。处理600提供以下操作:通过对音频信号的中间分量和侧分量进行增益调整,将音频信号限制在左-右空间中的阈值
Figure GDA0002958151420000123
以下。处理600可以具有较少或附加的步骤,并且可以以不同次序执行步骤。
音频处理系统(例如,L/R至M/S转换器102)根据包括左声道和右声道的音频信号生成605中间分量和侧分量。中间分量和侧分量可如等式1中所限定的来确定。中间分量和侧分量表示中间-侧空间中的音频信号,并且左声道和右声道表示左-右空间中的音频信号。中间分量可以包括左声道和右声道之和。侧分量可以包括左声道与右声道之间的差。
音频处理系统(例如,空间限制器104或控制器110)确定610左-右阈值。左-右阈值
Figure GDA0002958151420000131
限定了对于左声道和右声道中的每一个所允许的最大水平。例如,左声道的绝对值和右声道的绝对值都不应超过左-右阈值
Figure GDA0002958151420000132
阈值
Figure GDA0002958151420000133
可以由用户输入限定,或者可编程地限定。如以下更详细讨论的,将增益降低应用于中间-侧空间中的音频信号以确保左声道和右声道的峰值在阈值
Figure GDA0002958151420000134
以下。
音频处理系统(例如,空间限制器104和/或L/R限制器106)将一个或更多个增益因子应用615于中间分量和侧分量中的每一个,以生成经调整的中间分量和经调整的侧分量。在一个示例中,用于中间分量的一个或更多个增益因子可以包括应用于中间分量的中间增益因子以及应用于中间分量和侧分量中的每一个的L/R增益因子。用于侧分量的一个或更多个增益因子可以包括应用于侧分量的侧增益因子和L/R增益因子。用于每个分量的一个或更多个增益因子可以取决于中间分量与侧分量之间的空间限制的优先级,其中使用较高优先级分量来递归地限定用于较低优先级分量的增益因子。类似地,可以使用用于中间分量和/或侧分量的增益因子来递归地限定L/R增益因子。下面结合图7、图8和图9讨论关于针对空间限制的不同优先级的增益因子的附加细节。
音频处理系统(例如,M/S到L/R转换器108)根据经调整的中间分量和经调整的侧分量生成620左输出声道和右输出声道。根据应用于中间分量和侧分量中的每一个的一个或更多个增益因子,左输出声道和右输出声道每个均被限制在左-右阈值以下。
图7是根据一些实施方式的用于使用侧(或中间)限制随后是左-右限制来对音频信号进行空间限制的处理700的流程图。处理700可以在处理600的步骤615处执行,以实现图3A或图3B示出的增益降低阶段的优先级。在图3A中,侧分量是针对限制的所选分量,而中间分量是针对限制的非所选分量。在图3B中,中间分量是选定分量,而侧分量是非选定分量。处理700可以具有较少的或附加的步骤,并且可以以不同的次序执行。
音频处理系统(例如,空间限制器104或控制器110)确定705中间分量与侧分量之间的空间限制的优先级,将中间分量或侧分量中的一个限定为所选分量,并且将中间分量或侧分量中的另一个限定为次级分量。空间限制的优先级可以编程地或者基于用户输入来确定。
音频处理系统(例如,空间限制器104或控制器110)确定710所选分量的增益因子。例如,当侧分量是所选分量时,增益因子可以由等式3限定,或者当中间分量是所选分量时,增益因子可以由等式7限定。在任一情况下,增益因子被限定为低至增益降低预算θ。
音频处理系统(例如,空间限制器104)将所选分量的增益因子应用715到所选分量。所选分量可以乘以增益因子。
音频处理系统(例如,L/R限制器106或控制器110)使用所选分量的增益因子确定720所选分量和非所选分量的左-右增益因子。如果所选分量是侧分量,则可以使用等式4和等式5来确定左-右增益因子αlr,如果所选分量是中间分量,则可以使用等式8和等式9来确定左-右增益因子αlr
音频处理系统(例如,L/R限制器106)将左-右增益因子应用725至所选分量以生成经调整的所选分量,并且应用至非所选分量以生成经调整的非所选分量。经调整的所选分量和非所选分量——一个是经调整的中间分量,另一个是经调整的侧分量——可以用于生成左输出声道和右输出声道。
图8是根据一些实施方式的用于使用并行的侧限制和中间限制并且随后是左-右限制来对音频信号进行空间限制的处理800的流程图。处理800可以在处理600的步骤615处执行,以实现图4所示的增益降低阶段的优先级。处理800可以具有较少的或附加的步骤,并且步骤可以以不同的次序执行。
音频处理系统(例如,空间限制器104或控制器110)确定805中间分量与侧分量之间的空间限制的优先级,将中间分量和侧分量限定为相等优先级分量。空间限制的优先级可以编程地或者基于用户输入来确定。
音频处理系统(例如,空间限制器104或控制器110)确定810中间分量的中间增益因子。例如,中间增益因子可以由等式7限定,其中中间增益因子被限定为低至增益降低预算θm
音频处理系统(例如,空间限制器104)将中间增益因子应用815到中间分量。中间分量可以乘以中间增益因子。
音频处理系统(例如,空间限制器104)确定820侧分量的侧增益因子。例如,侧增益因子可由等式7限定,其中,侧增益因子被限定为低至增益降低预算θs
音频处理系统(例如,空间限制器104)将侧增益因子应用825到侧分量。侧分量可以乘以侧增益因子。
音频处理系统(例如,L/R限制器106或控制器110)使用中间增益因子和侧增益因子递归地确定830中间分量和侧分量的左-右增益因子。可以使用如等式8和等式11所限定的中间增益因子αm和侧增益因子αs来确定左-右增益因子αlr
音频处理系统(例如,L/R限制器106)将左-右增益因子应用835到中间分量以生成经调整的中间分量,并且应用到侧分量以生成经调整的侧分量。经调整的中间分量和侧分量可以用于生成左输出声道和右输出声道。
图9是根据一些实施方式的使用串行的侧限制、中间限制和左-右限制来对音频信号进行空间限制的处理900的流程图。处理900可以在处理600的步骤615处执行,以实现图5A或图5B中所示的增益降低阶段的优先级。在图5A中,侧分量是具有较高优先级的用于限制的初级分量,而中间分量是具有比初级分量低的优先级的用于限制的次级分量。在图5B中,中间分量是初级分量,而侧分量是次级分量。处理900可以具有较少或附加的步骤,并且步骤可以以不同的次序执行。
音频处理系统(例如,空间限制器104或控制器110)确定905中间分量与侧分量之间的空间限制的优先级,将中间分量或侧分量中的一个限定为初级分量,并且将中间分量或侧分量中的另一个限定为次级分量。空间限制的优先级可以通过编程或者基于用户输入来确定。
音频处理系统还可以确定用于空间限制的一个或更多个参数。例如,初级增益降低预算θI和次级增益降低预算θII可以编程地或者根据用户输入确定。
音频处理系统(例如,中间增益处理器152或侧增益处理器154)确定910初级分量的初级增益因子。初级增益因子αI可以由等式13限定。此处,初级分量的峰值|mI|根据mI确定,次级分量的峰值|mII|根据mII确定。从阈值
Figure GDA0002958151420000151
减去次级分量的峰值|mII|,并且除以初级分量的峰值|mI|以确定结果。确定结果与1之间的最小值。初级增益因子αI是根据结果与初级增益降低预算θI之间的最大值确定的。
音频处理系统(例如,中间增益处理器152或侧增益处理器154)将初级增益因子应用915到初级分量。例如,初级增益因子αI可以乘以初级分量mI
音频处理系统(例如,中间增益处理器152或侧增益处理器154中的另一个)使用初级增益因子递归地确定920次级分量的次级增益因子。使用初级增益因子来限定次级增益因子,以实现用于音频信号的中间分量与侧分量之间的空间限制的串行优先级。
次级增益因子αII可由等式14限定。初级分量的峰值|mI|乘以初级增益因子αI,且从阈值
Figure GDA0002958151420000161
减去相乘的结果。相减的结果除以初级分量的峰值|mI|以确定结果。确定该结果与1之间的最小值。次级增益因子αII是根据该结果与次级增益降低预算θII之间的最大值确定的。
音频处理系统(例如,中间增益处理器152或侧增益处理器154中的另一个)将次级增益因子应用925到次级分量。例如,次级增益因子αII可以与次级分量mII相乘。
音频处理系统(例如,L/R限制器106或控制器110)使用初级增益因子和次级增益因子来确定930初级分量和次级分量的左-右增益因子。可以使用等式15和等式16来限定左-右增益因子αlr。在等式15中,左-右阈值
Figure GDA0002958151420000162
除以左-右空间PLR中的最坏情况峰值(worst-case peak),并且左-右增益因子αlr被确定为相除的结果与1之间的最小值。在等式16中,通过将中间分量的峰值|m1|乘以中间增益因子αm,将侧分量的峰值|m2|乘以侧增益因子αs,并将相乘的结果相加来确定PLR。增益因子αm或αs中的一个可以是初级增益因子αI,并且增益因子αm或αs中的另一个可以是次级增益因子αII,这取决于中间分量与侧分量之间的优先级的次序。
音频处理系统(例如,L/R限制器106)将左-右增益因子应用于935初级分量以生成经调整的初级分量,并将左-右增益因子应用于次级分量以生成经调整的次级分量。例如,将左-右增益因子αlr乘以初级分量(如可以由空间限制器140修改的)以生成经调整的初级分量。将左-右增益因子αlr乘以次级分量(如可由空间限制器104修改的)以生成经调整的次级分量。经调整的初级分量和次级分量可以用于生成左输出声道和右输出声道。
图10是根据一些实施方式的用于控制一个音频坐标系中的音频信号分量以实现在另一音频坐标系中限定的约束的处理1000的流程图。处理1000是分别在图6至图9中示出的处理600至处理900的概括,其中幅度阈值可以在中间-侧音频坐标系或左-右音频坐标系中限定,并且增益因子被应用于另一音频坐标系中的分量以满足幅度阈值。处理1000可具有更少或附加的步骤,并且步骤可以不同的次序执行。
音频处理系统根据第二音频坐标系中的音频信号的第三分量和第四分量生成1005第一音频坐标系中的第一分量和第二分量。在一个示例中,第一音频坐标系是中间-侧音频坐标系,第一分量是中间分量,并且第二分量是侧分量。第二音频坐标系是左-右音频坐标系,第三分量是左分量,并且第四分量是右分量。在另一示例中,第一音频坐标系是左-右音频坐标系,第一分量是左分量,并且第二分量是右分量。第二音频坐标系是中间-侧音频坐标系,第三分量是中间分量,并且第四分量是侧分量。音频坐标系之间的转换可以由如图1所示的L/R至M/S转换器102或M/S至L/R转换器108执行。
音频处理系统确定1010第二音频坐标系中的限定第三分量和第四分量中的每一个的最大水平的幅度阈值。如果第二音频坐标系是左-右音频坐标系,则幅度阈值可以是限定了音频信号的左-右分量的最大水平的L-R阈值
Figure GDA0002958151420000171
如果第二音频坐标系是中间-侧音频坐标系,则幅度阈值可以是限定了音频信号的中间和侧分量的最大水平的M-S阈值
Figure GDA0002958151420000172
如下面更详细讨论的,可以将增益降低应用至第二音频坐标系中的音频信号,以确保第三分量和第四分量的峰值低于幅度阈值。
音频处理系统将一个或更多个增益因子应用于1015第一分量和第二分量中的每一个,以在第一音频坐标系中生成经调整的第一分量和经调整的第二分量。一个或更多个增益因子可以包括应用于第一分量的一个或更多个第一增益因子以及应用于第二分量的一个或更多个第二增益因子。在一些实施方式中,可以如以下结合图11更详细讨论的那样执行侧链处理。此处,针对第一分量和第二分量中的每一个确定并应用单个增益因子。
在一些实施方式中,用于每个分量的一个或更多个增益因子可以取决于第一分量与第二分量之间的空间限制的优先级,其中使用较高优先级分量递归地限定用于较低优先级分量的增益因子。一个或更多个增益因子可以通过增益降低预算来约束。可以应用平滑函数来减少伪象。在第一音频坐标系是左-右音频坐标系的示例中,可以使用与本文针对中间-侧音频坐标系中的增益因子所讨论的技术类似的技术来生成增益因子。
在一些实施方式中,音频处理系统根据将一个或更多个增益因子应用于第一分量和第二分量中的每一个来确定是否满足幅度阈值。例如,增益因子中的一些或全部可以包括增益降低预算。如果增益降低预算被耗尽但幅度阈值未能被满足,则全局增益因子(例如,左-右增益因子αlr)可以被应用于音频信号以满足幅度阈值。全局增益因子可以应用于第一坐标系中的第一分量和第二分量,或者应用于第二坐标系中的第三分量和第四分量。
音频处理系统根据经调整的第一分量和经调整的第二分量在第二音频坐标系中生成1020第一输出声道和第二输出声道。根据应用于第一分量和第二分量中的每一个的一个或更多个增益因子,第一输出声道和第二输出声道中的每一个被限制在幅度阈值以下。在第二音频坐标系是左-右音频坐标系的示例中,第一输出声道和第二输出声道是左输出声道和右输出声道。
侧链处理
图11是根据一些实施方式的用于侧链处理的空间限制器1100的示意性框图。空间限制器1100将由图3A、图3B、图4、图5A或图5B中所示的各限制器阶段对中间分量和侧分量执行的处理集成到单个限制阶段中。在这种意义上,空间限制器1100可以是音频处理系统100的部件,其与L/R至M/S转换器102和M/S至L/R转换器108一起工作,从而代替图1所示的两阶段空间限制器104和L/R限制器106。
在由低频引起的泵浦伪象(pumping artifacts)存在于交叉阶段中的情况下,侧链处理特别有用。由于音频混合中的普遍惯例可以包括将低频(例如,低音)居中,所以中间分量的低频可能需要比侧分量的低频更多的增益降低。
空间限制器1100包括中间峰值提取器1102、侧峰值提取器1104、中间增益处理器1106、侧增益处理器1108、中间混合器1110和侧混合器1112。
中间峰值提取器1102接收中间分量116,并确定表示中间分量116的峰值的中间峰值214。中间峰值提取器1102将中间峰值214提供给中间增益处理器1106和侧增益处理器1108。侧峰值提取器1104接收侧分量118,并确定表示侧分量118的峰值的侧峰值216。侧峰值提取器1104将侧峰值216提供给中间增益处理器1106和侧增益处理器1108。
中间增益处理器1106基于中间峰值214、侧峰值216和左-右空间中的阈值
Figure GDA0002958151420000181
来确定中间增益因子1118(αm)。侧增益处理器1108基于中间峰值214、侧峰值216和左-右空间中的阈值
Figure GDA0002958151420000182
来确定侧增益因子1120(αs)。
侧链处理可以结合不同的优先级,用于基于用于中间增益因子αm和侧增益因子αs的计算来限制中间分量或侧分量。通过对控制信号应用附加的侧链处理,我们可以得到以下算子矩阵:
Figure GDA0002958151420000191
其中,每个条目是独立的算子。算子矩阵提供了不仅基于宽带空间特性而且基于大量其他特性诸如频率内容等来对增益控制进行优先级排序的能力。条目MM是限定由中间分量214对中间增益因子αm的控制的算子。MS是限定由中间分量214对侧增益因子αs的控制的算子。SM是限定由侧分量216对中间增益因子αm的控制的算子。最后,SS是限定由侧分量216对侧增益因子αs的控制的算子。
在利用侧链处理实现优先级的示例中,根据中间限制阶段与侧限制阶段之间的期望优先级,使用等式13或等式14,中间增益处理器1106确定中间增益因子并且侧增益处理器1108确定侧增益因子αs,使用等式15和等式16来确定左-右增益因子。中间增益处理器1106将中间增益因子与左-右增益因子组合以生成中间增益因子1118。侧增益处理器1106将侧增益因子与左-右增益因子组合以生成最终中间增益因子1118。
中间混合器1110接收中间分量116和中间增益因子1118(αm),并将这些值相乘以生成经调整的中间分量124。侧混合器212接收侧分量118和侧增益因子1120(αs),并将这些值相乘以产生经调整的侧分量126。经调整的中间分量124和经调整的侧分量126可以用于生成左输出声道132和右输出声道134,诸如由如图1所示的M/S至L/R转换器108来生成。
示例计算机
图12是根据一个实施方式的计算机1200的示意性框图。计算机1200是实现音频处理系统的电路的示例。示出了耦接至芯片组1204的至少一个处理器1202。芯片组1204包括存储器控制器集线器1220和输入/输出(I/O)控制器集线器1222。存储器1206和图形适配器1212耦接至存储器控制器集线器1220,并且显示装置1218耦接至图形适配器1212。存储装置1208、键盘1210、定点装置1214和网络适配器1216耦接至I/O控制器集线器1222。计算机1200可以包括各种类型的输入或输出装置。计算机1200的其他实施方式具有不同的架构。例如,在一些实施方式中,存储器1206直接耦接至处理器1202。
存储装置1208包括一个或更多个非暂态计算机可读存储介质,诸如硬盘驱动器、致密盘只读存储器(CD-ROM)、DVD或固态存储器装置。存储器1206保存由处理器1202使用的程序代码(包括一个或更多个指令)和数据。程序代码可以对应于图1至图11所描述的处理方面。
定点装置1214与键盘1210结合使用以将数据输入到计算机系统1200中。图形适配器1212在显示装置1218上显示图像和其他信息。在一些实施方式中,显示装置1218包括用于接收用户输入和选择的触摸屏功能。网络适配器1216将计算机系统1200耦接至网络。计算机1200的一些实施方式具有与图12所示的部件不同的部件以及/或者除图12所示的部件之外的其他部件
其他注意事项
所公开的配置的一些示例益处和优点包括:使用在中间-侧空间中应用的增益因子来限制左-右空间中的音频信号,以将硬性限制的伪象切换至不同的空间位置以及用户指定的偏好。在各种类型的音频处理中使用音频信号的中间分量或侧分量的处理,并且如本文所讨论的空间优先级限制提供了在中间空间/侧空间中与这种处理技术的在计算上的更有效的集成。这些偏好在最低级别上被指定为阈值,限制器在这些阈值之间进入不同的操作制度。在较高级别上,这可以理解为各种声场失真的伪象与传统峰值限制的伪象之间的折衷。
虽然已经示出和描述了特定实施方式和应用,但是应该理解,本发明不限于本文公开的精确构造和部件,并且在不脱离本公开内容的精神和范围的情况下,可以在本文公开的方法和装置的布置、操作和细节上进行对于本领域技术人员来说明显的各种修改、改变和变化。

Claims (31)

1.一种用于处理音频信号的方法,包括:
根据第二音频坐标系中的音频信号的第三分量和第四分量生成第一音频坐标系中的第一分量和第二分量;
确定所述第二音频坐标系中的幅度阈值,所述幅度阈值限定所述第三分量和所述第四分量中的每一个的最大水平;
使用所述第二音频坐标系中的所述幅度阈值和所述第一分量和所述第二分量的相应峰值计算一个或更多个增益因子;
将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个,以生成所述第一音频坐标系中的经调整的第一分量和经调整的第二分量;以及
根据所述经调整的第一分量和所述经调整的第二分量生成所述第二音频坐标系中的第一输出声道和第二输出声道,根据应用于所述第一音频坐标系中的所述第一分量和所述第二分量中的每一个的所述一个或更多个增益因子,所述第一输出声道和所述第二输出声道每个均被限制在所述第二音频坐标系中限定的所述幅度阈值以下。
2.根据权利要求1所述的方法,其中,将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个包括:
确定所述第一分量与所述第二分量之间的空间限制的优先级,所述优先级将所述第一分量或所述第二分量中的一个限定为初级分量,并且将所述第一分量或所述第二分量中的另一个限定为次级分量;
确定用于所述初级分量的初级增益因子;
将所述初级增益因子应用于所述初级分量;
使用所述初级增益因子确定用于所述次级分量的次级增益因子;以及
将所述次级增益因子应用于所述次级分量。
3.根据权利要求1所述的方法,其中,所述一个或更多个增益因子通过增益降低预算来约束。
4.根据权利要求1所述的方法,还包括将平滑函数应用于所述一个或更多个增益因子。
5.根据权利要求1所述的方法,其中:
所述第一音频坐标系是中间-侧音频坐标系;
所述第一分量是中间分量;
所述第二分量是侧分量;
所述第二音频坐标系是左-右音频坐标系;
所述第三分量是所述音频信号的左分量;
所述第四分量是所述音频信号的右分量;
所述第一输出声道是左输出声道;以及
所述第二输出声道是右输出声道。
6.根据权利要求5所述的方法,其中,将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个包括:
确定所述中间分量与所述侧分量之间的空间限制的优先级,所述优先级将所述中间分量或所述侧分量中的一个限定为初级分量,并且将所述中间分量或所述侧分量中的另一个限定为次级分量;
确定用于所述初级分量的初级增益因子;
将所述初级增益因子应用于所述初级分量;
使用所述初级增益因子确定用于所述次级分量的次级增益因子;
将所述次级增益因子应用于所述次级分量;使用所述初级增益因子和所述次级增益因子确定用于所述初级分量和所述次级分量的左-右增益因子;以及
将所述左-右增益因子应用于所述初级分量以生成经调整的初级分量,并应用于所述次级分量以生成经调整的次级分量。
7.根据权利要求6所述的方法,其中:
所述初级增益因子由
Figure FDA0003143343730000021
限定;
所述次级增益因子由
Figure FDA0003143343730000022
限定;
αI是所述初级增益因子;
θI是所述初级分量的初级增益降低预算;
θII是所述次级分量的次级增益降低预算;
Figure FDA0003143343730000031
是左-右阈值;
|mI|是所述初级分量的峰值;以及
|mII|是所述次级分量的峰值。
8.根据权利要求7所述的方法,其中:
所述左-右增益因子由
Figure FDA0003143343730000032
限定;
Figure FDA0003143343730000033
是所述左-右阈值;以及
PLR是在将所述初级增益因子应用于所述初级分量并将所述次级增益因子应用于所述次级分量之后所述音频信号的最坏情况峰值。
9.根据权利要求5所述的方法,其中,将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个包括:
确定所述中间分量与所述侧分量之间的空间限制的优先级,所述优先级将所述中间分量或所述侧分量中的一个限定为所选分量,并且将所述中间分量或所述侧分量中的另一个限定为非所选分量;
确定用于所述所选分量的增益因子;
将所述增益因子应用于所述所选分量;
使用用于所述所选分量的所述增益因子确定用于所述所选分量和所述非所选分量的左-右增益因子;以及
将所述左-右增益因子应用于所述所选分量以生成经调整的所选分量,并应用于所述非所选分量以生成经调整的非所选分量。
10.根据权利要求9所述的方法,其中:
用于所述所选分量的所述增益因子由
Figure FDA0003143343730000034
限定;
θss是所述所选分量的增益降低预算;
Figure FDA0003143343730000035
是左-右阈值;
|mss|是所述所选分量的峰值;以及
|mns|是所述非所选分量的峰值。
11.根据权利要求10所述的方法,其中:
所述左-右增益因子由
Figure FDA0003143343730000041
限定;
Figure FDA0003143343730000042
是所述左-右阈值;以及
PLR是在将用于所述所选分量的所述增益因子应用于所述所选分量之后所述音频信号的最坏情况峰值。
12.根据权利要求5所述的方法,其中,将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个包括:
确定所述中间分量与所述侧分量之间的空间限制的优先级,所述优先级将所述中间分量和所述侧分量限定为同等优先级分量;
确定用于所述中间分量的中间增益因子;
将所述中间增益因子应用于所述中间分量;
确定用于所述侧分量的侧增益因子;
将所述侧增益因子应用于所述侧分量;
使用所述中间增益因子和所述侧增益因子确定用于所述中间分量和所述侧分量的左-右增益因子;
将所述左-右增益因子应用于所述中间分量以生成经调整的中间分量,并应用于所述侧分量以生成经调整的侧分量。
13.根据权利要求12所述的方法,其中:
所述中间增益因子由
Figure FDA0003143343730000043
限定;
所述侧增益因子由
Figure FDA0003143343730000044
限定;
Figure FDA0003143343730000045
是左-右阈值;
θm是所述中间分量的中间增益降低预算;
θs是所述侧分量的侧增益降低预算;
|m1|是所述中间分量的峰值;以及
|m2|是所述侧分量的峰值。
14.根据权利要求13所述的方法,其中:
所述左-右增益因子由
Figure FDA0003143343730000051
限定;
Figure FDA0003143343730000052
是所述左-右阈值;以及
PLR是在将所述中间增益因子应用于所述中间分量并将所述侧增益因子应用于所述侧分量之后所述音频信号的最坏情况峰值。
15.根据权利要求1所述的方法,还包括:
根据应用所述一个或更多个增益因子来确定所述幅度阈值是否被满足;以及
响应于确定所述幅度阈值未能被满足,将全局增益因子应用于所述第一音频坐标系或所述第二音频坐标系中的所述音频信号,以满足所述幅度阈值。
16.一种非暂态计算机可读介质,其存储程序代码,所述程序代码在由处理器执行时将所述处理器配置成:
根据第二音频坐标系中的音频信号的第三分量和第四分量生成第一音频坐标系中的第一分量和第二分量;
确定所述第二音频坐标系中的幅度阈值,所述幅度阈值限定所述第三分量和所述第四分量中的每一个的最大水平;
使用所述第二音频坐标系中的所述幅度阈值和所述第一分量和所述第二分量的相应峰值计算一个或更多个增益因子;
将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个,以生成所述第一音频坐标系中的经调整的第一分量和经调整的第二分量;以及
根据所述经调整的第一分量和所述经调整的第二分量生成所述第二音频坐标系中的第一输出声道和第二输出声道,根据应用于所述第一音频坐标系中的所述第一分量和所述第二分量中的每一个的所述一个或更多个增益因子,所述第一输出声道和所述第二输出声道每个均被限制在所述第二音频坐标系中限定的所述幅度阈值以下。
17.根据权利要求16所述的计算机可读介质,其中,将所述处理器配置成将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个的所述程序代码还将所述处理器配置成:
确定所述第一分量与所述第二分量之间的空间限制的优先级,所述优先级将所述第一分量或所述第二分量中的一个限定为初级分量,并且将所述第一分量或所述第二分量中的另一个限定为次级分量;
确定用于所述初级分量的初级增益因子;
将所述初级增益因子应用于所述初级分量;
使用所述初级增益因子确定用于所述次级分量的次级增益因子;以及
将所述次级增益因子应用于所述次级分量。
18.根据权利要求16所述的计算机可读介质,其中,所述一个或更多个增益因子通过增益降低预算来约束。
19.根据权利要求16所述的计算机可读介质,其中,所述程序代码还将所述处理器配置成将平滑函数应用于所述一个或更多个增益因子。
20.根据权利要求16所述的计算机可读介质,其中:
所述第一音频坐标系是中间-侧音频坐标系;
所述第一分量是中间分量;
所述第二分量是侧分量;
所述第二音频坐标系是左-右音频坐标系;
所述第三分量是所述音频信号的左分量;
所述第四分量是所述音频信号的右分量;
所述第一输出声道是左输出声道;以及
所述第二输出声道是右输出声道。
21.根据权利要求20所述的计算机可读介质,其中,将所述处理器配置成将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个的所述程序代码还将所述处理器配置成:
确定所述中间分量与所述侧分量之间的空间限制的优先级,所述优先级将所述中间分量或所述侧分量中的一个限定为初级分量,并且将所述中间分量或所述侧分量中的另一个限定为次级分量;
确定用于所述初级分量的初级增益因子;
将所述初级增益因子应用于所述初级分量;
使用所述初级增益因子确定用于所述次级分量的次级增益因子;
将所述次级增益因子应用于所述次级分量;
使用所述初级增益因子和所述次级增益因子确定用于所述初级分量和所述次级分量的左-右增益因子;以及
将所述左-右增益因子应用于所述初级分量以生成经调整的初级分量,并应用于所述次级分量以生成经调整的次级分量。
22.根据权利要求21所述的计算机可读介质,其中:
所述初级增益因子由
Figure FDA0003143343730000071
限定;
所述次级增益因子由
Figure FDA0003143343730000072
限定;
αI是所述初级增益因子;
θI是所述初级分量的初级增益降低预算;
θII是所述次级分量的次级增益降低预算;
Figure FDA0003143343730000073
是左-右阈值;
|mI|是所述初级分量的峰值;以及
|mII|是所述次级分量的峰值。
23.根据权利要求22所述的计算机可读介质,其中:
所述左-右增益因子由
Figure FDA0003143343730000074
限定;
Figure FDA0003143343730000075
是所述左-右阈值;以及
PLR是在将所述初级增益因子应用于所述初级分量并将所述次级增益因子应用于所述次级分量之后所述音频信号的最坏情况峰值。
24.根据权利要求20所述的计算机可读介质,其中,将所述处理器配置成将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个的所述程序代码还将所述处理器配置成:
确定所述中间分量与所述侧分量之间的空间限制的优先级,所述优先级将所述中间分量或所述侧分量中的一个限定为所选分量,并且将所述中间分量或所述侧分量中的另一个限定为非所选分量;
确定用于所述所选分量的增益因子;
将所述增益因子应用于所述所选分量;
使用所述增益因子确定用于所述所选分量和所述非所选分量的左-右增益因子;以及
将所述左-右增益因子应用于所述所选分量以生成经调整的所选分量,并应用于所述非所选分量以生成经调整的非所选分量。
25.根据权利要求24所述的计算机可读介质,其中:
用于所述所选分量的所述增益因子由
Figure FDA0003143343730000081
限定;
θss是所述所选分量的增益降低预算;
Figure FDA0003143343730000082
是左-右阈值;
|mss|是所述所选分量的峰值;以及
|mns|是所述非所选分量的峰值。
26.根据权利要求25所述的计算机可读介质,其中:
所述左-右增益因子由
Figure FDA0003143343730000083
限定;
Figure FDA0003143343730000084
是所述左-右阈值;以及
PLR是在将用于所述所选分量的所述增益因子应用于所述所选分量之后所述音频信号的最坏情况峰值。
27.根据权利要求20所述的计算机可读介质,其中,将所述处理器配置成将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个的所述程序代码还将所述处理器配置成:
确定所述中间分量与所述侧分量之间的空间限制的优先级,所述优先级将所述中间分量和所述侧分量限定为同等优先级分量;
确定用于所述中间分量的中间增益因子;
将所述中间增益因子应用于所述中间分量;
确定用于所述侧分量的侧增益因子;
将所述侧增益因子应用于所述侧分量;
使用所述中间增益因子和所述侧增益因子确定用于所述中间分量和所述侧分量的左-右增益因子;以及
将所述左-右增益因子应用于所述中间分量以生成经调整的中间分量,并应用于所述侧分量以生成经调整的侧分量。
28.根据权利要求27所述的计算机可读介质,其中:
所述中间增益因子由
Figure FDA0003143343730000091
限定;
所述侧增益因子由
Figure FDA0003143343730000092
限定;
Figure FDA0003143343730000093
是左-右阈值;
θm是所述中间分量的中间增益降低预算;
θs是所述侧分量的侧增益降低预算;
|m1|是所述中间分量的峰值;以及
|m2|是所述侧分量的峰值。
29.根据权利要求28所述的计算机可读介质,其中:
所述左-右增益因子由
Figure FDA0003143343730000094
限定;
Figure FDA0003143343730000095
是所述左-右阈值;以及
PLR是在将所述中间增益因子应用于所述中间分量并将所述侧增益因子应用于所述侧分量之后所述音频信号的最坏情况峰值。
30.根据权利要求16所述的计算机可读介质,其中,所述程序代码还将所述处理器配置成:
根据应用所述一个或更多个增益因子来确定所述幅度阈值是否被满足;以及
响应于确定所述幅度阈值未能被满足,将全局增益因子应用于所述第一音频坐标系或所述第二音频坐标系中的所述音频信号,以满足所述幅度阈值。
31.一种用于处理音频信号的系统,包括:
处理电路,其被配置成:
根据第二音频坐标系中的音频信号的第三分量和第四分量生成第一音频坐标系中的第一分量和第二分量;
确定所述第二音频坐标系中的幅度阈值,所述幅度阈值限定所述第三分量和所述第四分量中的每一个的最大水平;
使用所述第二音频坐标系中的所述幅度阈值和所述第一分量和所述第二分量的相应峰值计算一个或更多个增益因子;
将所述一个或更多个增益因子应用于所述第一分量和所述第二分量中的每一个以生成所述第一音频坐标系中的经调整的第一分量和经调整的第二分量;以及
根据所述经调整的第一分量和所述经调整的第二分量生成所述第二音频坐标系中的第一输出声道和第二输出声道,根据应用于所述第一音频坐标系中的所述第一分量和所述第二分量中的每一个的所述一个或更多个增益因子,所述第一输出声道和所述第二输出声道每个均被限制在所述第二音频坐标系中限定的所述幅度阈值以下。
CN201880080633.4A 2017-12-15 2018-11-29 具有优先级的空间感知动态范围控制系统 Active CN111480347B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762599601P 2017-12-15 2017-12-15
US62/599,601 2017-12-15
US16/186,459 US10609499B2 (en) 2017-12-15 2018-11-09 Spatially aware dynamic range control system with priority
US16/186,459 2018-11-09
PCT/US2018/063152 WO2019118193A1 (en) 2017-12-15 2018-11-29 Spatially aware dynamic range control system with priority

Publications (2)

Publication Number Publication Date
CN111480347A CN111480347A (zh) 2020-07-31
CN111480347B true CN111480347B (zh) 2021-10-22

Family

ID=66816628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880080633.4A Active CN111480347B (zh) 2017-12-15 2018-11-29 具有优先级的空间感知动态范围控制系统

Country Status (7)

Country Link
US (1) US10609499B2 (zh)
EP (1) EP3725100B1 (zh)
JP (1) JP6910556B2 (zh)
KR (1) KR102229033B1 (zh)
CN (1) CN111480347B (zh)
TW (1) TWI695633B (zh)
WO (1) WO2019118193A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1391781A (zh) * 1999-11-25 2003-01-15 环绕声实验股份公司 用于处理输入音频立体声信号的两种方法和两种装置,以及一种音频立体声信号重放系统
CN1839663A (zh) * 2003-07-21 2006-09-27 环绕声实验股份公司 音频立体声处理方法、设备和系统
CN101855917A (zh) * 2007-07-19 2010-10-06 弗劳恩霍夫应用研究促进协会 生成具有增强的感知质量的立体声信号的方法和装置
CN106170991A (zh) * 2013-12-13 2016-11-30 无比的优声音科技公司 用于音场增强的设备及方法
US9661438B1 (en) * 2015-03-26 2017-05-23 Amazon Technologies, Inc. Low latency limiter

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE530180C2 (sv) * 2006-04-19 2008-03-18 Embracing Sound Experience Ab Högtalaranordning
US8644526B2 (en) 2008-06-27 2014-02-04 Panasonic Corporation Audio signal decoding device and balance adjustment method for audio signal decoding device
EP2401872A4 (en) * 2009-02-25 2012-05-23 Conexant Systems Inc SYSTEM AND METHOD FOR REDUCING SPEAKER DISTORTION
US9456289B2 (en) * 2010-11-19 2016-09-27 Nokia Technologies Oy Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
JP6174129B2 (ja) 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
US9332373B2 (en) * 2012-05-31 2016-05-03 Dts, Inc. Audio depth dynamic range enhancement
US9460729B2 (en) 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9398394B2 (en) 2013-06-12 2016-07-19 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
CN105917674B (zh) 2013-10-30 2019-11-22 华为技术有限公司 用于处理音频信号的方法和移动装置
WO2016054098A1 (en) * 2014-09-30 2016-04-07 Nunntawi Dynamics Llc Method for creating a virtual acoustic stereo system with an undistorted acoustic center

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1391781A (zh) * 1999-11-25 2003-01-15 环绕声实验股份公司 用于处理输入音频立体声信号的两种方法和两种装置,以及一种音频立体声信号重放系统
CN1839663A (zh) * 2003-07-21 2006-09-27 环绕声实验股份公司 音频立体声处理方法、设备和系统
CN101855917A (zh) * 2007-07-19 2010-10-06 弗劳恩霍夫应用研究促进协会 生成具有增强的感知质量的立体声信号的方法和装置
CN106170991A (zh) * 2013-12-13 2016-11-30 无比的优声音科技公司 用于音场增强的设备及方法
US9661438B1 (en) * 2015-03-26 2017-05-23 Amazon Technologies, Inc. Low latency limiter

Also Published As

Publication number Publication date
WO2019118193A1 (en) 2019-06-20
TW201929560A (zh) 2019-07-16
EP3725100A4 (en) 2021-08-18
US20190191260A1 (en) 2019-06-20
US10609499B2 (en) 2020-03-31
JP2021507587A (ja) 2021-02-22
KR102229033B1 (ko) 2021-03-16
EP3725100B1 (en) 2024-01-03
JP6910556B2 (ja) 2021-07-28
EP3725100A1 (en) 2020-10-21
TWI695633B (zh) 2020-06-01
CN111480347A (zh) 2020-07-31
KR20200088511A (ko) 2020-07-22

Similar Documents

Publication Publication Date Title
US10750278B2 (en) Adaptive bass processing system
JP5607626B2 (ja) パラメトリックステレオ変換システム及び方法
CA2928489A1 (en) System and method for digital signal processing
US8351619B2 (en) Auditory sense correction device
US20140010375A1 (en) Upmixing method and system for multichannel audio reproduction
US10057702B2 (en) Audio signal processing apparatus and method for modifying a stereo image of a stereo signal
JP2023138591A (ja) 優先度を持つ空間認識マルチバンド圧縮システム
RU2642386C2 (ru) Адаптивное генерирование рассеянного сигнала в повышающем микшере
CN111480347B (zh) 具有优先级的空间感知动态范围控制系统
KR102511377B1 (ko) 라우드스피커들을 위한 저음 향상
KR20130080852A (ko) 다운믹싱 제한
JP7576632B2 (ja) スピーカのための低音強調

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant