CN102282868B - 没有反馈的频域有源矩阵解码的方法和系统 - Google Patents

没有反馈的频域有源矩阵解码的方法和系统 Download PDF

Info

Publication number
CN102282868B
CN102282868B CN201080004384.4A CN201080004384A CN102282868B CN 102282868 B CN102282868 B CN 102282868B CN 201080004384 A CN201080004384 A CN 201080004384A CN 102282868 B CN102282868 B CN 102282868B
Authority
CN
China
Prior art keywords
critical band
frequency
stream
output
power ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080004384.4A
Other languages
English (en)
Other versions
CN102282868A (zh
Inventor
C·P·布朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN102282868A publication Critical patent/CN102282868A/zh
Application granted granted Critical
Publication of CN102282868B publication Critical patent/CN102282868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

提供将N个音频输入信号解码以产生M个音频输出信号的知觉激发的频域有源矩阵解码器和解码方法,其中,M比N大,包括:通过响应表示音频输入信号的输入频率成分的N个流,产生确定M个音频输出信号的输出频率成分的M个流;在不使用反馈的情况下从输入频率成分确定功率比,所述功率比包含关于一组临界频带中的每个临界频带的至少一个功率比;以及,从功率比确定临界频带中的每一个的增益控制值,包含通过在不使用反馈的情况下以非线性的方式将功率比整形。通过使用增益控制值来掌控有源矩阵元件。

Description

没有反馈的频域有源矩阵解码的方法和系统
(相关申请的交叉引用)
本申请要求在2009年1月14日提交的美国专利临时申请No.61/144,482的优先权,在此引入其全部内容作为参考。
技术领域
本发明涉及用于将大量的音频输入信号(例如,两个输入通道)解码成更多的音频输出信号(例如,五个输出通道,可以为全频率输出通道)的有源矩阵解码器系统和方法。在一些实施例中,本发明涉及在频域中操作、并且使用在不使用反馈的情况下产生的增益控制值掌控有源矩阵元件的这种矩阵解码器系统和方法。
背景技术
在包括权利要求书的整个本公开中,同义地使用术语“解码器”和“解码器系统”。
在包括权利要求书的整个本公开中,在广泛的意义上使用表述在信号或数据“上”执行操作(例如,过滤或变换),以表示直接对信号或数据、或者信号或数据的经处理的版本(例如,在对其执行操作之前已经过初步过滤的信号的版本)执行操作。
在包括权利要求书的整个本公开中,表述“后面”位置(例如,“后源位置”)表示收听者头部后面的位置,并且,“前面”位置(例如,“前输出位置”)的表达方式表示收听者头部前面的位置。类似地,“前面”扬声器表示位于收听者头部前面的扬声器,并且“后面”扬声器表示位于收听者头部后面的扬声器。
在包括权利要求书的整个本公开中,在广泛的意义上使用表述“系统”以表示装置、系统或子系统。例如,实现解码器的子系统可被称 为解码器系统,并且,包含这种子系统的系统(例如,响应多个输入产生X个输出信号的系统,其中,子系统产生输入中的M个输入,并且从外部源接收其它的X-M个输入)也可被称为解码器系统。
在包括权利要求书的整个本公开中,表述通过扬声器的信号的“再现”表示导致扬声器响应信号产生声音,包括通过执行信号的任何需要的放大和/或其它的处理。
音频矩阵解码器用于将(由X个输入信号确定的)X个离散音频通道解码为用于回放的(由Y个输出信号确定的)Y个通道,其中,X和Y是整数并且Y比X大。输入通道有时是从大量通道编码的矩阵。矩阵编码器/解码器技术的例子包含:四声道立体声(例如在以下文献中描述的:Bauer,Benjamin B.等人的“Quadraphonic Matrix Perspective-Advances in SQ Encoding and Decoding Technology”,J.Audio Engineering Society.,第21卷,第9页,1973年6月)、高保真度立体声响复制(例如在以下文献中描述的:Michael Gerzon,“Surround-sound psychoacoustics,Criteria for the design of matrix and discrete surround-sound systems”,Wireless World,1974年12月,第483-485页)、Dolby Pro Logic II技术(例如Kenneth Gundry在文章“A new active matrix decoder for surround sound”,Proc.AES 19th International Conference on Surround Sound,2001年6月中描述的)和Dolby Pro Logic技术。
图1是称为无源矩阵解码器的类型的简单的常规的2通道到4通道解码器的例子。无源矩阵解码器不尝试分析输入信号而是关于输入信号的编码(如果有的话)进行假定。在图1中,输入信号Left Total(Lt)和Right Total(Rt)被直接馈送到左(L)输出和右(R)输出。通过在加法元件2中将输入信号Lt和Rt相加,并且将得到的相加信号施加到对其施加增益的放大器1来导出中心(C)输出。通过在减法元件4中产生输入信号Lt和Rt的差值,并且在低通滤波器(LPF)3中对得到的差值信号进行低通过滤来导出环绕(S)输出。
图2是称为有源矩阵解码器的类型的常规的2通道到5通道解码 器的例子。图2的解码器包含有源解码矩阵6。矩阵6被耦合以接收Left Total(Lt)和Right Total(Rt)输入信号,并且被配置为响应输入信号和来自掌控元件7的控制信号产生五个输出信号(左输出“L”、右输出“R”、中心输出“C”、左环绕输出“Ls”和右环绕输出“Rs”)。图2的有源矩阵解码器在加法元件2中对输入信号求和,并且在减法元件4中产生输入信号的差值。来自元件2和4的相加和差值信号不被直接馈送到输出通道(如图1那样)。作为替代,从元件2和4输出的相加和差值信号与输入信号Lt和Rt一起被施加到掌控元件7。响应这些信号,掌控元件7以允许它连续“掌控”解码矩阵6的方式分析输入信号。解码矩阵6基于从元件7施加的掌控控制信号来确定输出通道混合。
如何利用使用反馈的掌控元件在时域中实现有源解码以产生用于控制有源矩阵元件的增益控制信号是众所周知的。例如,受让给Dolby Laboratories Licensing Corporation的美国专利7,280,664和美国专利6,920,223描述了这种解码。
美国专利7,280,664的有源矩阵解码器包括掌控元件(例如,图16A的元件230),该掌控元件包含使用反馈以产生用于产生有源矩阵元件要应用的矩阵系数的控制信号的伺服电路。例如,美国专利7,280,664的图16A的元件230可包含图17-19的伺服电路,其使用反馈以产生控制信号gL、gR、gF、gB、gLB和gRB。使用这些增益控制信号以产生图16A的自适应矩阵214要应用的更新的矩阵系数。例如,图17的伺服电路响应音频信号样本Lt′和Rt′产生控制信号gL和gR,包含通过将信号gL和gR作为反馈施加到输入Lt′和Rt′(并且在元件242、240、252和250中分别组合信号gL和gR与输入Lt′和Rt′)。使用元件240和250的输出(分别是(1-gL)Lt′和(1-gR)Rt′)来更新控制信号LR的值。信号LR的更新值确定控制信号gL和gR的更新值。
利用不使用反馈的掌控元件在时域中实现有源解码以产生用于控制有源矩阵元件的增益控制信号也是众所周知的。例如,在受让给 Dolby Laboratories Licensing Corporation的美国专利4,799,260中描述了这种有源解码。但是,在美国专利4,799,260中描述的有源矩阵解码是在不确定(根据知觉激发的考虑)输入音频信号的全频率范围的临界频带的情况下执行的。在美国专利4,799,260中描述的有源矩阵解码还是在不产生用于这种临界频带中的不同临界频带的增益控制值,并且不过滤输入音频信号以产生每个在不同的临界频带中的输入子带信号或者对于多个临界频带中的每个临界频带实现不同的有源矩阵的情况下执行的。
这里的表述(一个或更多个音频信号的组的全频率范围的)“临界频带”表示根据知觉激发的考虑确定的全频率范围的频带。一般地,分割全可听频率范围的临界频带具有跨全可听频率范围随着频率增加的宽度。
已经建议,在时域中执行有源矩阵解码,其中对于输入音频信号的多个临界频带中的不同临界频带产生增益控制值。例如,在其面上指示被受让给Digital Theater Systems,Inc.的美国专利7,003,467教导在时域中实现的有源矩阵解码器。解码器向音频输入信号应用带通滤波器以产生一组输入子带信号,每个表示输入信号的全频率范围中的不同的频带,然后将子带信号解码。美国专利7,003,467教导子带信号可被组成为更少的分组信号,每个表示输入信号的全频率范围中的(称为“Bark带”类型的)不同的临界频带,分组信号可接着被解码。但是,美国专利7,003,467没有教导(并且,在本发明之前不知道)如何在频域中实现有源解码,包括通过过滤输入音频信号以产生每个在不同的临界频带中的输入子带信号,关于临界频带中的每个临界频带分别产生增益控制值,并且对输入子带信号中的每个子带信号应用不同的有源矩阵。美国专利7,003,467也没有建议应在频域中实现有源音频信号解码,或者如何以有效的方式(例如,以低处理器速度(例如,低MIPS)需求)实现这种频域有源解码。
需要以对于每个临界频带中的输入音频内容定制的方式将输入音频信号的不同的临界频带解码(包括通过产生用于解码输入音频中的 不同的临界频带的增益控制值)的有源矩阵解码器,从而以有效的方式并且以可以低处理器速度(例如,低MIPS)需求实现的方式实现的改进的声学性能。本发明的典型的实施例通过以对于每个临界频带中的输入音频内容定制的方式解码频域输入音频的不同的临界频带(包含通过产生用于解码输入音频中的不同的临界频带的增益控制值),从而以更少的计算需求实现改进的声学性能(包括没有知觉伪信号的更大的频率选择性)。
在本发明之前,不知道如何实现将N(例如,N=2)个音频输入通道转换成M(其中,M大于N)个全频率音频输出通道的知觉激发音频矩阵解码器,包括通过将输入信号转换成频域(当输入信号并非已处于频域中时),将得到的输入频率成分施加到响应于输入频率成分产生频率成分的M个输出流有源矩阵元件,并且在不使用反馈的情况下掌控有源矩阵元件。也不知道如何以通过使用功率比(关于一组临界频带中的每个临界频带从频域输入音频产生)确定的用于掌控的准则来实现这种掌控,包括通过以非线性的方式整形和缩放功率比。
发明内容
在一类实施例中,本发明是一种被配置为将表示N个音频输入信号(输入通道)的输入频率成分的N个流解码以产生确定M个音频输出信号(一般为全频率输出通道)的输出频率成分的M个流的知觉激发有源矩阵解码器,其中,M和N是整数并且M比N大。解码器包括:有源矩阵子系统,被配置为响应输入频率成分的N个流(表示N个音频输入信号)产生确定M个音频输出信号的输出频率成分的M个流;和控制子系统,与有源矩阵子系统耦合并且被配置为在不使用反馈的情况下响应输入频率成分产生增益控制值,并且在输出频率成分的产生中对于有源矩阵子系统施加用于掌控有源矩阵元件的增益控制值。控制子系统被配置为响应输入频率成分产生功率比,所述功率比包含用于一组临界频带中的每个临界频带的(输入频率成分的每个块的)至少一个功率比,并且响应功率比产生增益控制值,包含通过 非线性的方式将功率比整形(以及可选地将功率比缩放和平滑化)。
一般地,有源矩阵子系统应用多组矩阵系数,每组矩阵系数用于临界频带中的不同的一个。例如,在一些实施例中,用于每个临界频带的增益控制值确定用于由有源矩阵子系统应用于其变换频率区间处于临界频带内的输入频率成分的不同的一组矩阵系数。属于临界频带之一的每个变换频率区间中的(关于输入频率成分的每个块的)输入频率成分是乘以与该临界频带对应的临界频带的矩阵系数的矩阵。
在一些实施例中,解码器还包括被配置为将N个输入信号从时域转换成频域,由此响应N个输入信号产生输入频率成分的N个流的输入变换子系统。在一些实施例中,解码器还包括被配置为将输出频率成分的流从频域转换成时域,由此响应所述输出频率成分产生M个输出信号的输出变换子系统。一般地,N=2且M=5。并且,一般地,控制子系统被配置为关于一组临界频带中的每个临界频带(为输入频率系数的每个块)产生一对功率比,并且(为输入频率系数的每个块)从功率比产生用于每个所述临界频带的五个增益控制值。例如,在解码器被配置为将两个音频输入信号解码以产生五个音频输出信号(左通道输出信号、右通道输出信号、中心通道输出信号、右环绕通道输出信号和左环绕通道输出信号)的一些实施例中,每对功率比包含:左和右通道功率测量值的比、和前和后通道功率测量值的比。优选地,临界频带将掌控分割为基于心理声学的多个频率区域。
在一类实施例中,本发明是用于解码N个音频输入信号以确定M个音频输出信号(一般地,全频率输出通道)的矩阵解码方法,其中,M和N是整数并且M比N大,所述方法包括以下步骤:
(a)响应表示N个音频输入信号的输入频率成分的N个流,操作有源矩阵子系统以产生确定M个音频输出信号的输出频率成分的M个流,
(b)在不使用反馈的情况下从输入频率成分确定功率比,所述功率比包含一组临界频带中的每个临界频带的至少一个功率比;
(c)从功率比确定用于临界频带中的每一个的增益控制值,包括 在不使用反馈的情况下以非线性的方式对功率比整形;和
(d)在执行步骤(a)的同时,使用增益控制值来掌控有源矩阵元件。
在一些实施例中,步骤(c)包括在不使用反馈的情况下缩放和平滑化功率比的步骤。一般地,N=2且M=5,步骤(b)包括关于临界频带中的每一个(为输入频率系数的每个块)确定两个功率比的步骤,并且步骤(c)包括关于临界频带中的每一个(为输入频率系数的每个块)确定五个增益控制值的步骤。在一些实施例中,该方法还包括以下步骤中的至少一个:将音频输入信号从时域转换成频域以产生输入的频率成分的流;和将输出频率成分的流从频域转换成时域,由此产生M个音频输出信号。
在典型的实施例中,本发明的解码器为或者包含利用软件(或固件)编程通用或专用处理器、和/或否则被配置为执行本发明的方法的实施例的通用或专用处理器。在一些实施例中,本发明的解码器是被耦合以接收表示音频输入信号的输入数据并且被编程(通过适当的软件)以通过执行本发明的方法的实施例响应输入数据产生表示音频输出信号的输出数据的通用处理器。在其它的实施例中,本发明的解码器是通过适当地配置(例如通过编程)可配置的音频数字信号处理器(DSP)来实现的。音频DSP可以是可被配置(例如,可通过适当的软件或固件被编程,或者可响应控制数据而被配置)以对输入音频执行各种操作中的任一个的常规的音频DSP。在操作中,被配置为根据本发明执行有源矩阵解码的音频DSP被耦合以接收多个音频输入信号,并且DSP一般对输入音频执行除了解码以外的各种操作,或连同解码的各种操作。根据本发明的各种实施例,在被配置(例如,被编程)为通过对输入音频信号执行该方法以响应输入音频信号产生输出音频信号之后,音频DSP可操作为执行本发明的方法的实施例。本发明的每个方面包含被配置(例如,被编程)为执行本发明的方法的任何实施例的系统、和存储了用于实现本发明的方法的任何实施例的代码的计算机可读介质(例如,盘)。
附图说明
图1是常规的音频矩阵解码器的框图。
图2是另一常规的音频矩阵解码器的框图。
图3是本发明的有源矩阵解码器系统的实施例的框图。
图4是图3的解码器的自适应矩阵16的实现的框图。
图5是图3的元件17的左/右控制电路的实现的框图。
图6是图3的元件17的前/后控制电路的实现的框图。
图7是图3的元件17的环绕控制电路的实现的框图。
图8是在图3解码器的实现(例如,在图5的元件32和42)中使用以将k=1024的傅立叶变换区间中的频率成分分组成经过滤的频率成分的b=40的临界频带中的滤波器的示图。
图9是作为本发明的解码系统的实施例的音频数字信号处理器(DSP)的框图。
具体实施方式
本发明的许多实施例在技术上是可能的。本领域技术人员从本公开可以明白如何实现它们。参照图3-9描述本发明的系统、方法和介质的实施例。
图3是本发明的有源矩阵解码器系统的实施例的框图。图3的系统包括时域到频域变换段10,该时域到频域变换段10被耦合和配置为接收时域输入信号“Left Total”(Lt)并且通过对输入信号Lt执行时域到频域的变换(例如,离散傅立叶变换,但可替换地,修正离散余弦变换、或正交镜像滤波器组中的变换、或另一时域到频域的变换)以产生频率成分Lt′。频率成分Lt′包含子集,每个子集处于不同的频率区间(频率变换区间)中。图3的系统还包含时域到频域变换段11,该时域到频域变换段11被耦合和配置为接收时域输入信号“Right Total”(Rt)并且通过对输入信号Rt执行时域到频域的变换(例如,离散傅立叶变换,但是可替换地,修正离散余弦变换、或正 交镜像滤波器组中的变换、或另一时域到频域变换)来产生频率成分Rt′。频率成分Rt′包含子集,每个子集处于不同的频率区间(频率变换区间)中。在自适应解码矩阵16和掌控元件17中单独地分析和处理每个频率区间中的频率成分Lt′和Rt′。
有源(自适应)解码矩阵16被配置为响应来自掌控元件17的控制信号和输入频率成分Lt′和Rt′产生输出频率成分的五个序列,该输出频率成分的五个序列在图3中被识别为:左输出数据L′(表示来自左前源的声音)、右输出数据R′(表示来自右前源的声音)、中心输出数据C′(表示来自中心前源的声音)、左环绕输出数据Ls′(表示来自左后源的声音)和右环绕输出数据Rs′(表示来自右后源的声音)。
每个频率成分Lt′在加法元件14中与相应的频率成分Rt′相加,以产生频率成分序列Ft′(这里,称为“前通道”频率成分)。在减法元件14中从相应的频率成分Lt′中减去每个频率成分Rt′以产生频率成分序列Bt′(这里,称为“后通道”频率成分)。频率成分Lt′和Rt′可经受简单的处理以表示沿左-右轴的信号支配,并且被掌控元件17使用以产生确定增益控制值gL和gR的功率比值序列。频率成分Lt′和Rt′可经受简单的处理以表示沿前-后轴(与左-右轴垂直)的信号支配,并且被掌控元件17使用以产生确定增益控制值gF和gB的功率比值序列。当输入音频信号表示主要来自一个源方向(例如,左前)的(临界频带中的)声音时,与当它们表示主要来自另一源方向(例如,右后)的(临界频带中的)声音时相比,掌控元件产生不同的(用于临界频带的)一组增益控制值。
对掌控元件17施加频率成分Ft′和Bt′和频率成分Lt′和Rt′。作为响应,掌控元件17分析每个临界频带中的频率成分Lt′和Rt′,以产生(并且对自适应解码矩阵16施加)用于关于临界频带中的每一个配置矩阵16的增益控制值gL、gR、gF、gB、gLB和gRB。响应用于频带中的每一个的增益控制值gL、gR、gF、gB、gLB和gRB,自适应矩阵16产生成分序列L′、R′、C′、Ls′和Rs′的(在每个这种临界频带中的每个频率区间中的)频率成分。每个成分序列L′、R′、C′、Ls′ 和Rs′的所有子集(每个所述子集处于所述频带中的不同的频带中)可选地在后处理段18中进行后处理。段18的输出在频域到时域变换段20中进行频域到时域变换(一般地,逆短时离散傅立叶变换或“iSTDFT”,但是可替换地,逆修正离散余弦变换、或正交镜像滤波器组中的变换、或另一频域到时域变换)。从段20输出五个离散时域信号(左通道输出信号L′、右通道输出信号R′、中心通道输出信号C′、左环绕通道输出信号Ls′和右环绕通道输出信号Rs′)。
因此,图3的系统将两个时域音频输出信号(Lt、Rt)转换成变换频率区间中的频域数据以供分析和处理。系统的控制路径(包含图3所示的元件12、13、14、15和17)从频域数据产生关于一组临界频带中的每一个的功率测量值,并且使用它们产生用于配置自适应矩阵16的增益控制值。这里,图3的系统中除了控制路径中的元件以外的元件有时被称为“信号路径”。系统的控制路径通过在滤波器12和13中带通过滤频域数据将频域数据整形。响应经过滤的频域数据,确定频率成分Ft′和Bt′。成分Ft′表示相加信号Ft(这里,称为“前通道”信号或“前”信号)。成分Bt′表示差值信号Bt(这里,称为“后通道”信号或“后”信号)。频率成分Ft′和Bt′连同表示经过滤的输入信号Lt和Rt的经过滤的频率成分被转换成被用于产生用于临界频带中的每一个的增益控制值gL、gR、gF、gB、gLB和gRB的临界频带功率值(关于临界频带中的每一个的功率测量值)。
图3系统的控制路径和信号路径都不包含反馈。作为替代,控制路径信号依赖于临界频带功率值的非线性表示的分析。有源解码矩阵16在临界频带内被掌控以产生输出通道数据(包含用于输出通道中的每一个的变换频率区间中的每一个的频率成分)。矩阵16将表示二通道输入音频的频率成分(Lt′、Rt′)乘以适当的混合矩阵系数,并且,得到的输出通道频率成分在段18中进行可选的后处理,并接着在段20中被转换回时域。
在优选的实施例中,使用以非线性的方式整形(例如,在图5和图6的电路38和58中)并且可选地被缩放(例如在图5和图6的电 路38和58中的电路中)和平滑化(例如,在图5和图6的元件33、43、45、46、53、63、65和66中)的功率比(例如,由参照图5和图6描述的电路的元件37和57产生的功率比的对)来确定(关于输入频率成分的每个块的)用于有源矩阵16的增益控制值。关于临界频带中的每一个产生用于输入频率成分的每个块的功率比。临界频带将掌控分割成基于心理声学的多个频率区域。通过这样做,掌控具有没有知觉伪信号的更大的频率选择性。因此,使用临界频带而不是变换区间来掌控有源矩阵。
在图3系统的典型的实现中,变换电路10和11通过以k个频率区间和b个临界频带向输入信号Lt和Rt中的每一个的采样的每m个连续块的组应用短时离散傅立叶变换(STDFT),将离散的输入音频(Lt、Rt)采样从时域转换成频域。一般地,在每个这种输入音频采样的组的每两个连续块之间存在重叠(例如,50%重叠)。一般地,b是20-40的范围中的整数。一般地,通过电路10和11中的每一个变换的输入音频的每个块由输入音频的1024(或512)个采样组成。并且,一般地,电路10和11的每一个响应每个这种块的输出是512(或256)个区间中的一组频率成分(即,每个具有512或256个频率中的不同的一个的一组频率成分)。
图3的有源矩阵16被配置为使用b个矩阵系数组对每个临界频带中的输入频率系数执行矩阵乘法,每个矩阵系数组用于b个临界频带中的不同的一个。(用于临界频带的)每个矩阵系数组可由如图4所示的那样标注的七十个系数组成。在被配置为响应两个输入通道施加多于五个的输出通道的图3和图4的实施例的变形中,有源矩阵为每个临界频带使用的矩阵系数组一般由多于七十个系数组成。
有源矩阵16一般被配置为向其变换频率区间处于每个不同的临界频带内的输入音频的频率成分应用不同的矩阵系数组。属于临界频带之一的每个变换频率区间内的(输入频率成分的每个块的)频率成分是乘以与该临界频带对应的临界频带的矩阵系数的矩阵。
元件16为临界频带中的每一个应用的矩阵包含固定部分(由图4 的矩阵系数a1至a10确定)和变量部分(由图4的系数b1至g10和元件17向矩阵16施加的增益控制值确定)。每个矩阵的固定部分与对矩阵16施加的增益控制值无关。每个矩阵的变量部分取决于增益控制值。对于每个块m和临界频带b,掌控元件17产生一组增益控制值gL、gR、gF、gB、gLB和gRB,并且,如式1所示,这些增益控制值被应用于第b个矩阵系数组(用于第b个临界频带的矩阵16的矩阵系数)以计算用于第b个临界频带的混合矩阵值v1、...、v10:
v 1 v 2 v 3 v 4 v 5 v 6 v 7 v 8 v 9 v 10 = 1 gL gR gF gB gLB gRB × a 1 a 2 a 3 a 4 a 5 a 6 a 7 a 8 a 9 a 10 b 1 b 2 b 3 b 4 b 5 b 6 b 7 b 8 b 9 b 10 c 1 c 2 c 3 c 4 c 5 c 6 c 7 c 8 c 9 c 10 d 1 d 2 d 3 d 4 d 5 d 6 d 7 d 8 d 9 d 10 e 1 e 2 e 3 e 4 e 5 e 6 e 7 e 8 e 9 e 10 f 1 f 2 f 3 f 4 f 5 f 6 f 7 f 8 f 9 f 10 g 1 g 2 g 3 g 4 g 5 g 6 g 7 g 8 g 9 g 10 - - - ( 1 )
用于每个临界频带的矩阵系数(a1、b1、c1、...和g10)的各种适当选择中的任一种对于本领域技术人员来说是明显的。一般地,矩阵系数将被选择为使得:(用于具有相对较高频率的临界频带的)矩阵更分散以分散较高频率的声音,并且(用于相对较低频率临界频带的)矩阵更多地局部化低频率声音(例如,使得由系统产生的输出信号在被扬声器再现时可在收听者周围的位置之间“摇动(pan)”低频率声音)。
为了产生用于每个块(第m个块)和每个临界频带(第b个频带)的频率成分L′、R′、C′、Ls′和Rs′,如式2所示,频带中的输入信号系数(Lt′、Rt′)是乘以两行五列的矩阵(其系数为来自用于频带的式1的混合矩阵值v1、...、v10)的矩阵:
L ′ C ′ R ′ Ls ′ Rs ′ = Lt ′ Rt ′ × v 1 v 3 v 5 v 7 v 9 v 2 v 4 v 6 v 8 v 10 - - - ( 2 )
在本发明的系统的一些实现中,后处理段(例如,图3的后处理 段18)提供以下用户可控特征中的至少一些特征:以依赖或独立的方式过滤输出音频通道中的一些或全部;使输出音频通道中的一些或全部相互或与外部源混合;组合音频通道以减少输出通道的总数;通过复制一个或更多个输出通道,扩展输出通道的总数;以及对于输出音频通道中的一个或更多个进行反相,以补偿下混合变化。因此,虽然图3所示的后处理段18具有五个输入通道和五个输出通道,但是,在本发明的系统的其它的实现中,它具有多于或少于五个输出通道。在本发明的系统的其它的实现中,后处理段被省略,并且,从有源矩阵(例如,矩阵16)输出的频率成分被传递到系统的输出,或者被直接传递至频域到时域变换段(例如,段20)。
在一些实施例中,本发明的系统包含被配置为向每个输出通道的每个临界频带应用可调整的增益(例如,对每个频带应用不同的可独立调整的增益)的电路。例如,段18可包含这种增益调整电路。
图3的掌控元件17包含三个子系统:图5所示的左/右控制电路;图6所示的前/后控制电路;和图7所示的环绕控制电路。
图5的左/右控制电路包含如图所示那样连接的共轭元件30和40、乘法元件31和41、分段(banding)元件32和42、平滑化元件33和43、减法元件34、加法元件35和36、除法元件37、以及整形、平滑化和缩放电路38,并且上述元件如下操作。在元件30和40中产生经过滤的频率成分Lt′和Rt′(来自图3的过滤器12和13)的复共轭。从元件30和40输出的经过滤的频率成分Lt′和Rt′分别在元件31和41中乘以它们各自的复共轭以按每区间获得功率测量值。
图3系统将k个变换区间(一般地,k=512或者k=256)中的每一个中的频率成分组合成更少数量的b个临界频带(例如,b=20个带或者b=40个带)中的成分。一般地,由电路10和11中的每一个变换的输入音频的每个块由输入音频的1024(512)个采样组成,并且,电路10和11中的每一个响应每个这种块的输出是512(或256)个区间中的一组频率成分。
元件32将从元件31(关于频率区间中的每一个)输出的功率测 量值组合成用于一组临界频带中的每一个的功率测量值(例如,以临界标度或听觉滤波器标度)。元件42将从元件41(关于频率区间中的每一个)输出的功率测量值组合成用于临界频带中的每一个的功率测量值。将区间分割成临界频带优选地模拟人听觉系统,特别是耳蜗。元件32和42中的每一个通过(对于临界频带中的每一个)对其应用适当的过滤器对频率区间中的功率测量值加权,并且通过将由滤波器对于所述频带确定的加权的功率测量值相加来产生临界频带中的每一个的功率测量值。
一般地,对于每个临界频带应用不同的滤波器,并且,这些滤波器表现大致圆通化指数(rounded exponential)形状并且以等效矩形带宽(ERB)标度均匀间隔。ERB标度是在近似听觉滤波器的带宽和间距的心理声学中使用的量度。图8示出了具有一个ERB的间距的适当的一组滤波器,从而导致用于应用于1024个频率区间k中的每一个的功率测量值的总共40个临界频带b。将功率测量值分段成临界频带有助于消除如果系统按每区间工作则会出现的输出数据中的可听伪信号。
临界分段的功率测量值接着关于时间(即,跨相邻的块)被平滑化(在元件33和43中),从而在元件33中产生用于每个块m和临界频带b的平滑化的功率测量值Plt′(m,b)并且在元件43中产生用于每个块m和临界频带b的平滑化的功率测量值Prt′(m,b)。
因此,对于输入频率成分Lt′的每个块,元件32将k个频率区间中的频率成分转换成b个临界频带功率测量值Plt′,每个临界频带一个。类似地,对于每个输入频率成分Rt′的块,元件42将k个频率区间中的频率成分转换成b个临界频带功率测量值,每个临界频带一个。功率测量值Plt′使用单极平滑化元件33,以关于DFT块尺寸m和频带数b的适当的时间常数被平滑化。功率测量值Prt′使用单极平滑化元件43,以关于DFT块尺寸m和频带数b的适当的时间常数被平滑化。元件33和43中的功率测量值Prt′和Plt′的平滑化将使施加在元件37的输出上的功率比平滑化。在本发明的替代实施例中,用于产生 用于掌控有源矩阵的增益控制值的功率比以其它的方式被平滑化。
下面,对于每个输入频率成分的块和每个临界频带,在元件35中产生功率测量值的和(Plt′+Prt′),并且在元件34中产生功率测量值的差值(Plt′-Prt′)。在元件36中,将小的偏移A1加到每个和(Plt′+Prt′)以避免分割误差。在元件37中,对于同一频带和块将每个差值(Plt′-Prt′)除以和(Plt′+Prt′+A1)以获得归一化的功率比。因此,归一化的功率比是左和右通道功率测量值的比。对电路38施加表示在元件37中(对于每个块和临界频带)确定的表示功率比的信号。
电路38对于在元件37中确定的功率比执行缩放和整形。电路38包含两个分支,每个分支包含六个段。第一分支产生用于每个临界频带和块的增益控制值gL(m,b)。第二分支产生用于每个临界频带和块的增益控制值gR(m,b)。第一分支的第一段将小的偏移值A2加到每个功率比上。第二分支的第一段从偏移值A2减去每个功率值。第一分支的第二段将第一分支的第一段的输出乘以系数A3,并且,第二分支的第二段将第二分支的第一段的输出乘以同一系数A3。第一分支的第三段将第一分支的第二段的每个输出值X(m,b)取幂以产生值XA4(m,b)=Pl(m,b)。一般地,系数A4等于3(或基本上等于3的数)。在A4=3的情况下,第一分支的第三段通过将X(m,b)自乘并且将积乘以X(m,b)来对每个值X(m,b)取幂。为了避免相邻的频带相差很大的量,从第一分支的第三段输出的值以逐临界频带的方式在带内平滑化元件45中被平滑化。第二分支的第三段将第二分支的第二段的每个输出值Y(m,b)取幂以产生值YA4(m,b)=Pr(m,b)。为了避免相邻的频带相差很大的量,从第二分支的第三段输出的值以逐临界频带的方式在带内平滑化元件46中被平滑化。表示得到的值Pl(m,b)和Pr(m,b)的信号被转递到图7的环绕控制电路。因此,第三段通过非线性A4来修改来自第二段的输出值,由此以非线性方式将功率比(元件37)整形。
第一分支的第四段将第一分支的第三段的输出乘以系数A5,并且,第二分支的第四段将第二分支的第三段的输出乘以同一系数A5。 第一分支的第五段将偏移值A6加到第一分支的第四段的输出上,并且第二分支的第五段将同一偏移值A6加到第二分支的第四段的输出上。第一分支的第六段将偏移值A7加到第一分支的第五段的输出上,以产生用于每个临界频带和块的增益控制值gL(m,b)。第二分支的第六段将同一偏移值A7加到第二分支的第五段的输出上,以产生用于每个临界频带和块的增益控制值gR(m,b)。
因此,电路38在不使用反馈的情况下缩放、平滑化和整形功率比。更一般地,图5的电路在不使用反馈的情况下根据输入频率成分产生增益控制值gL(m,b)和gR(m,b)。对矩阵16施加增益控制值gL(m,b)和gR(m,b)。
在图5电路的优选实施例中,对于典型的频带,值A1、A2、A3、A4、A5和A6如下:A1=0.001,A2=1.001,A3=0.499,A4=3,A5=0.95,A6=0.01。对于每个频带的值A1、A2、A3、A4、A5和A6的特定选择以给定本描述将对于本领域技术人员明显的方式优选取决于它们所应用的频带。
图6的前/后控制电路包含如所示的那样连接的共轭元件50和60、乘法元件51和61、分段元件52和62、平滑化元件53和63、减法元件54、加法元件55和66、除法元件57、以及整形和缩放电路58,上述元件如下操作。在元件50和60中产生经过滤的频率成分Ft′和Bt′(来自图3的元件14和15)的复共轭。从元件50和60输出的经过滤的频率成分Ft′和Bt′分别在元件51和61中乘以它们各自的复共轭以按每区间获得功率测量值。
元件52将从元件51(关于频率区间中的每一个)输出的功率测量值组合成用于一组临界频带中的每一个的功率测量值(例如,以临界标度或听觉滤波器标度)。元件62将从元件61(关于频率区间中的每一个)输出的功率测量值组合成关于临界频带中的每一个的功率测量值。元件52和62中的每一个通过(关于临界频带中的每一个)对其应用适当的滤波器来将频率区间中的功率测量值加权,并且通过对由滤波器对于所述频带确定的加权的功率测量值求和来产生关于临 界频带中的每一个的功率测量值。一般地,对于每个临界频带应用不同的滤波器,并且,这些滤波器与上述图5的元件32和42应用的滤波器相同。
临界分段的功率测量值接着关于时间(即,跨相邻的块)(在元件53和63中)被平滑化,以在元件53中产生关于每个块m和临界频带b的平滑化的功率测量值Pft′(m,b),并且在元件63中产生用于每个块m和临界频带b的平滑化的功率测量值Pbt′(m,b)。
因此,对于频率成分Ft′的每个块,元件52将k个频率区间中的频率成分转换成b个临界频带功率测量值Pft′,每个临界频带一个。对于频率成分Bt′的每个块,元件62将k个频率区间中的频率成分转换成b个临界频带功率测量值Pbt′,每个临界频带一个。功率测量值Pft′以关于DFT块尺寸m适当的时间常数通过使用单极平滑化元件53被平滑化。功率测量值Pbt′以关于DFT块尺寸m适当的时间常数通过使用单极平滑化元件63被平滑化。元件53和63中的功率测量值Pbt′和Pft′的平滑化将对被施加在元件57的输出上的功率比平滑化。在本发明的可替换实施例中,用于产生用于掌控有源矩阵的增益控制值的功率比以其它的方式被平滑化。
下面,对于输入频率成分的每个块和每个临界频带,在元件55中产生功率测量值的和(Pft′+Pbt′),并且在元件54中产生功率测量值的差值(Pft′-Pbt′)。在元件56中,将小的偏移A1加到每个和(Pft′+Pbt′)上以避免分割误差。在元件57中,对于同一频带和块将每个差值(Pft′-Pbt′)除以和(Pft′+Pbt′+A1)以获得归一化的功率比。因此,归一化的功率比是前后通道功率测量值的比。对电路58施加表示在元件57中(关于每个块和临界频带)确定的功率比的信号。
电路58对于在元件57中确定的功率比的序列执行缩放、平滑化和整形。电路58包含两个分支,每个分支包含六个段。第一分支产生用于每个临界频带和块的增益控制值gF(m,b)。第二分支产生用于每个临界频带和块的增益控制值gB(m,b)。第一分支的第一段将小的偏移值A2加到每个功率比上。第二分支的第一段从偏移值A2减去 每个功率值。第一分支的第二段将第一分支的第一段的输出乘以系数A3,并且第二分支的第二段将第二分支的第一段的输出乘以同一系数A3。第一分支的第三段将第一分支的第二段的每个输出值X(m,b)取幂以产生值XA4(m,b)=Pf(m,b)。一般地,系数A4等于3(或基本上等于3的数)。在A4=3的情况下,第一分支的第三段通过将X(m,b)自乘并且将积乘以X(m,b)来对每个值X(m,b)取幂。为了避免相邻的频带相差很大的量,从第一分支的第三段输出的值以逐临界频带的方式在带内平滑化元件65中被平滑化。第二分支的第三段对第二分支的第二段的每个输出值Y(m,b)取幂以产生值YA4(m,b)=Pb(m,b)。为了避免相邻的频带相差很大的量,从第二分支的第三段输出的值以逐临界频带的方式在带内平滑化元件66中被平滑化。表示得到的值Pf(m,b)和Pb(m,b)的信号被传递到图7的环绕控制电路。因此,第三段以非线性A4修改来自第二段的输出值,由此以非线性方式将功率比(元件57)整形。
第一分支的第四段将第一分支的第三段的输出乘以系数A5,并且,第二分支的第四段将第二分支的第三段的输出乘以同一系数A5。第一分支的第五段将偏移值A6加到第一分支的第四段的输出上,以产生用于每个临界频带和块的增益控制值gF(m,b)。第二分支的第五段将同一偏移值A6加到第二分支的第四段的输出上,以产生用于每个临界频带和块的增益控制值gB(m,b)。因此,电路58在不使用反馈的情况下仅缩放和整形功率比。更一般地,图6的电路在不使用反馈的情况下从输入频率成分产生增益控制值gF(m,b)和gB(m,b)。对矩阵16施加增益控制值gF(m,b)和gB(m,b)。
在图6电路的优选实施例中,对于典型的频带,值A1、A2、A3、A4、A5和A6如下:A1=0.001,A2=1.001,A3=0.499,A4=3,A5=0.95,A6=0.01。关于每个频带的值A1、A2、A3、A4、A5和A6的特定的选择以给定本描述将对于本领域技术人员明显的方式优选依赖于应用它们的频带。
图7的环绕控制电路响应来自图5和图6的电路的Pl(m,b)、 Pr(m,b)、Pf(m,b)和Pb(m,b)产生增益控制值gLB(m,b)和gRB(m,b)。图7的电路包含如图所示的那样连接的减法元件68和69、乘法元件70、73、80和83和比较元件71、72、74、81、82和84。在操作中,元件68响应用于每个块和临界频带的值Pl(m,b)和Pr(m,b)输出差值LR(m,b)=Pl(m,b)-Pr(m,b),并且元件69响应用于每个块和临界频带的值Pf(m,b)和Pb(m,b)输出差值FB(m,b)=Pf(m,b)-Pb(m,b)。
在左后(gLB)路径中,每个值LR(m,b)在元件70中被反相(在元件70中乘以值B1=-1)。在右后(gRB)路径中,每个值FB(m,b)在元件80中乘以值B2。
在左后路径中,比较元件71输出当前的反相的LR(m,b)和FB(m,b)值中的较大值(最大值),并且比较元件72输出元件71的输出和常数B3中的较小值(最小值)。元件73通过将元件72的输出乘以常数B4来缩放元件72的输出。比较元件74输出常数B5的输出和元件73的经缩放的输出中的较小值(最小值)。元件74的输出是用于当前块和临界频带的增益控制值gLB(m,b)。对元件16施加从元件74输出的增益控制值序列gLB(m,b),每个块和临界频带一个。
在右后路径中,比较元件81输出当前LR(m,b)值和当前的反相的FB(m,b)值中的较大值(最大值),并且比较元件82输出元件81的输出和常数B3中的较小值(最小值)。元件83通过将元件82的输出乘以常数B4来缩放元件82的输出。比较元件84输出常数B5的输出和元件83的经缩放的输出中的较小值(最小值)。元件84的输出是用于当前块和临界频带的增益控制值gLB(m,b)。对元件16施加从元件84输出的增益控制值的序列gRB(m,b),每个块和临界频带一个。
在图7电路的优选实施例中,对于典型的频带,值B1、B2、B3、B4和B5如下:B1=-1,B2=0.61,B3=0.0,B4=-2.1,B5=0.99。用于每个频带的值B1、B2、B3、B4和B5的特定的选择以给定本描述将对于本领域技术人员明显的方式优选依赖于应用它们的频带。
在另一类实施例中,本发明是用于将N个音频输入信号解码以确定M个音频输出信号(一般地,全频率输出通道)的矩阵解码方法,其中,M比N大,所述方法包括以下的步骤:
(a)响应表示N个音频输入信号的输入频率成分的N个流,操作有源矩阵子系统以产生确定M个音频输出信号的输出频率成分的M个流,
(b)在不使用反馈的情况下从输入频率成分确定功率比,所述功率比包含关于一组临界频带中的每个临界频带的至少一个功率比;
(c)从功率比确定关于临界频带中的每一个的增益控制值,包含在不使用反馈的情况下以非线性方式将功率比整形;以及
(d)在执行步骤(a)的同时,通过使用增益控制值来掌控有源矩阵元件。
在一些实施例中,步骤(c)包含在不使用反馈的情况下缩放和平滑化功率比的步骤。一般地,N=2,M=5,步骤(b)包含关于临界频带中的每一个(输入频率系数的每个块)确定两个功率比的步骤,并且步骤(c)包含关于临界频带中的每一个(输入频率系数的每个块)确定五个增益控制值的步骤。在一些实施例中,该方法还包括以下步骤中的至少一个:将音频输入信号从时域转换成频域以产生输入频率成分的流;和将输出频率成分的流从频域转换成时域,由此产生M个音频输出信号。
图9是作为被配置为执行本发明的方法的实施例的可编程音频DSP的解码系统(解码器)120的框图。系统120包含被耦合以接收音频输入信号(例如,参照图3描述的类型的两个输入信号Lt和Rt)的可编程DSP电路122(系统120的有源矩阵解码器子系统)。电路122被配置为响应来自控制接口121的控制数据执行本发明的方法的实施例,以响应音频输入信号产生多个输出音频信号(例如,由图3系统产生的类型的左输出“L”、右输出“R”、中心输出“C”、左环绕输出“Ls”和右环绕输出“Rs”)。为了对系统120编程,从外部处理器向控制接口121施加适当的软件,并且接口121作为响应对 电路122施加适当的控制数据,以配置电路122执行本发明的方法。
在操作中,被配置为根据本发明执行有源矩阵解码的音频DSP(例如,图9的系统120)被耦合以接收N个音频输入信号,并且DSP一般对输入音频(或其经处理的版本)执行除了解码以外的各种操作、或连同解码的各种操作。例如,图9的系统120可被实现为在处理子系统123中执行其它操作(对电路122的输出)。根据本发明的各种实施例,在被配置(例如,被编程)为通过对输入音频信号执行本发明的方法来响应输入音频信号产生输出音频信号之后,音频DSP可操作为执行本发明的方法的实施例。
在一些实施例中,本发明的系统为或者包含被耦合以接收或产生表示多个音频输入通道的输入数据并且通过软件(或固件)被编程和/或被另外配置(例如,响应控制数据)为对输入数据执行各种操作中的任一种(包括本发明的实施例)的通用处理器。这种通用处理器一般与输入装置(例如,鼠标和/或键盘)、存储器和显示装置耦合。例如,可以在通用处理器中实现图3的系统,并且输入Lt和Rt为表示编码的左和右音频输入通道的数据,输出L、C、R、Ls和Rs为表示解码的输出音频信号的输出数据。常规的数模转换器(DAC)可对该输出数据操作以产生用于被物理扬声器再现的输出音频信号的模拟版本。
尽管这里描述了本发明的特定实施例和本发明的应用,但本领域技术人员将明白可以对这里描述的实施例和应用提出许多变更。

Claims (19)

1.一种用于将N个音频输入信号解码以确定M个音频输出信号的矩阵解码方法,其中,M和N是整数,并且M比N大,并且N=2,所述方法包括以下的步骤:
将N个音频输入信号从时域转换成频域(10,11)以产生输入频率成分的N个流;
从输入频率成分的流确定功率比(17,30,31,32,33),所述功率比包含关于一组临界频带中的每个临界频带的至少一个功率比,其中,所述一组临界频带是根据知觉激发的考虑确定的;
关于临界频带中的每个临界频带从功率比确定增益控制值(17,38),包含通过以非线性的方式将功率比整形,其中,所述以非线性的方式将功率比整形包含以至少基本上等于3的指数对从功率比中的至少一个确定的至少一个值取幂的步骤,其中,用于各个临界频带的增益控制值是能够被独立调整的;
操作有源矩阵子系统(16)以响应输入频率成分的流产生输出频率成分的M个流,其中,使用增益控制值来掌控有源矩阵子系统(16),并且有源矩阵子系统(16)对输入频率成分的流应用多组矩阵系数,每组矩阵系数用于临界频带中不同的一个;以及
将输出频率成分的流从频域转换成时域(20),由此产生M个音频输出信号。
2.根据权利要求1所述的方法,其中,确定功率比(17,30,31,32,33)的步骤在不使用反馈的情况下进行,并且确定增益控制值(17,38)的步骤在不使用反馈的情况下进行。
3.根据权利要求2所述的方法,其中,确定增益控制值(17,38)的步骤包括在不使用反馈的情况下缩放和平滑化功率比的步骤。
4.根据权利要求3所述的方法,其中,M=5,并且确定功率比(17,30,31,32,33)的步骤包含关于临界频带中的每个临界频带为输入频率成分的流的每个块确定两个功率比的步骤,并且确定增益控制值(17,38)的步骤包含关于临界频带中的每个临界频带为输入频率成分的流的每个块确定五个增益控制值的步骤。
5.根据权利要求3所述的方法,其中,M=5,并且操作有源矩阵子系统(16)的步骤包含产生包含左通道输出流、右通道输出流、中心通道输出流、右环绕通道输出流和左环绕通道输出流的输出频率成分的五个流的步骤,并且确定功率比(17,30,31,32,33)的步骤包含关于临界频带中的每个临界频带为输入频率成分的流的每个块确定一对功率比的步骤,各所述一对功率比包含左和右通道功率测量值的比、和前和后通道功率测量值的比。
6.根据权利要求1所述的方法,其中,M=5,并且确定功率比(17,30,31,32,33)的步骤包含关于临界频带中的每个临界频带为输入频率成分的流的每个块确定两个功率比的步骤,并且确定增益控制值(17,38)的步骤包含关于临界频带中的每个临界频带为输入频率成分的流的每个块确定五个增益控制值的步骤。
7.根据权利要求1所述的方法,其中,M=5,并且操作有源矩阵子系统(16)的步骤包含产生包含左通道输出流、右通道输出流、中心通道输出流、右环绕通道输出流和左环绕通道输出流的输出频率成分的五个流的步骤,并且确定功率比(17,30,31,32,33)的步骤包含关于临界频带中的每个临界频带为输入频率成分的流的每个块确定一对功率比的步骤,各所述一对功率比包含左和右通道功率测量值的比、和前和后通道功率测量值的比。
8.根据权利要求7所述的方法,其中,通过操作包含有源矩阵子系统(16)和与有源矩阵子系统(16)耦合的控制子系统(17)的音频数字信号处理器来执行所述各步骤,并且通过操作控制子系统(17)来执行确定功率比(17,30,31,32,33)的步骤和确定增益控制值(17,38)的步骤,以从输入频率成分的流确定功率比,并且确定增益控制值。
9.一种被配置为将N个音频输入信号解码以产生M个音频输出信号的有源矩阵解码器,其中,M和N是整数并且M比N大,并且N=2,所述解码器包含:
输入变换子系统(10,11),被配置为将N个输入信号从时域转换成频域,由此响应N个输入信号产生输入频率成分的N个流;
控制子系统(17),被配置为如下响应输入频率成分的流产生增益控制值,
响应输入频率成分的流产生功率比(30,31,32,33),所述功率比包含关于一组临界频带中的每个临界频带的用于输入频率成分的流的每个块的至少一个功率比,其中,所述一组临界频带是根据知觉激发的考虑确定的;以及
从所述功率比产生增益控制值(38),包含通过以非线性的方式将功率比整形,其中,增益控制值包含多个子集,这些子集中的每一个用于临界频带中不同的一个,其中,所述以非线性的方式将功率比整形包含以至少基本上等于3的指数对从功率比中的至少一个确定的至少一个值取幂的步骤,其中,用于各个临界频带的增益控制值是能够被独立调整的;
有源矩阵子系统(16),与控制子系统(17)耦合并且被配置为响应输入频率成分的N个流产生输出频率成分的M个流,其中,所述控制子系统(17)被配置为在产生输出频率成分的M个流期间向有源矩阵子系统(16)施加增益控制值以掌控有源矩阵子系统(16),并且所述有源矩阵子系统(16)被配置为向输入频率成分的流应用多组矩阵系数,每组矩阵系数用于临界频带中的不同的一个;以及
输出变换子系统(20),被配置为将输出频率成分的M个流从频域转换成时域,由此响应所述输出频率成分的流产生M个输出信号。
10.根据权利要求9所述的解码器,其中,控制子系统(17)被配置为在不使用反馈的情况下产生功率比,并且在不使用反馈的情况下产生增益控制值。
11.根据权利要求10所述的解码器,其中,M=5,控制子系统(17)被配置为关于一组临界频带中的每个临界频带为输入频率成分的流的每个块产生一对功率比,并且关于每个所述临界频带为输入频率成分的流的每个块从功率比产生五个增益控制值。
12.根据权利要求11所述的解码器,其中,所述解码器被配置为将输入频率成分的两个流解码,以产生确定五个音频输出信号的输出频率成分的五个流,所述五个音频输出信号包含:左通道输出信号、右通道输出信号、中心通道输出信号、右环绕通道输出信号和左环绕通道输出信号,并且所述每对功率比包含:左和右通道功率测量值的比、和前和后通道功率测量值的比。
13.根据权利要求9所述的解码器,其中,控制子系统(17)被配置为从功率比产生增益控制值,包含通过在不使用反馈的情况下缩放和平滑化功率比。
14.根据权利要求9所述的解码器,其中,用于临界频带中的每个临界频带的增益控制值确定由有源矩阵子系统(16)应用于输入频率成分中其频率处于所述每个临界频带内的那些输入频率成分的多组矩阵系数中的不同的一组。
15.根据权利要求9所述的解码器,其中,用于临界频带中的每个临界频带的增益控制值确定由有源矩阵子系统(16)应用于输入频率成分中其变换频率区间处于所述每个临界频带内的那些输入频率成分的多组矩阵系数中的不同的一组。
16.根据权利要求9所述的解码器,其中,M=5,控制子系统(17)被配置为关于一组临界频带中的每个临界频带为输入频率成分的流的每个块产生一对功率比,并且关于每个所述临界频带为输入频率成分的流的每个块从功率比产生五个增益控制值。
17.根据权利要求16所述的解码器,其中,所述解码器被配置为将输入频率成分的两个流解码,以产生确定五个音频输出信号的输出频率成分的五个流,所述五个音频输出信号包含:左通道输出信号、右通道输出信号、中心通道输出信号、右环绕通道输出信号和左环绕通道输出信号,并且所述每对功率比包含:左和右通道功率测量值的比、和前和后通道功率测量值的比。
18.根据权利要求9所述的解码器,其中,所述解码器是音频数字信号处理器。
19.根据权利要求9所述的解码器,其中,所述解码器是包含被配置为实现有源矩阵子系统(16)和控制子系统(17)的电路的音频数字信号处理器。
CN201080004384.4A 2009-01-14 2010-01-12 没有反馈的频域有源矩阵解码的方法和系统 Active CN102282868B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14448209P 2009-01-14 2009-01-14
US61/144,482 2009-01-14
PCT/US2010/020700 WO2010083137A1 (en) 2009-01-14 2010-01-12 Method and system for frequency domain active matrix decoding without feedback

Publications (2)

Publication Number Publication Date
CN102282868A CN102282868A (zh) 2011-12-14
CN102282868B true CN102282868B (zh) 2016-11-02

Family

ID=42124651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080004384.4A Active CN102282868B (zh) 2009-01-14 2010-01-12 没有反馈的频域有源矩阵解码的方法和系统

Country Status (6)

Country Link
US (1) US8787585B2 (zh)
EP (1) EP2380366B1 (zh)
JP (1) JP5507581B2 (zh)
CN (1) CN102282868B (zh)
TW (1) TWI449442B (zh)
WO (1) WO2010083137A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9324337B2 (en) 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
DE102013019297A1 (de) 2013-11-19 2015-05-21 Fei Company Phasenplatte für ein Transmissionselektronenmikroskop
CN107004427B (zh) * 2014-12-12 2020-04-14 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
CA3011694C (en) * 2016-01-19 2019-04-02 Boomcloud 360, Inc. Audio enhancement for head-mounted speakers
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
US20230370777A1 (en) * 2020-10-07 2023-11-16 Clang A method of outputting sound and a loudspeaker
BR112023017137A2 (pt) 2021-02-25 2023-09-26 Dolby Laboratories Licensing Corp Virtualizador para áudio binaural
WO2023059838A1 (en) 2021-10-08 2023-04-13 Dolby Laboratories Licensing Corporation Headtracking adjusted binaural audio
CN116155623B (zh) * 2023-04-17 2023-08-15 湖南大学 一种基于电网频率特征嵌入的数字音频加密方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN86102314A (zh) * 1985-02-26 1986-10-22 杜比实验室许可公司 可变矩阵译码器
CN1571583A (zh) * 1996-07-19 2005-01-26 莱克西康公司 具有最大横向分离度的多声道主动型矩阵音响重放
CN1575621A (zh) * 2000-10-06 2005-02-02 数字剧场系统股份有限公司 把两频道矩阵编码音频重构为多频道音频的解码方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5046098A (en) 1985-03-07 1991-09-03 Dolby Laboratories Licensing Corporation Variable matrix decoder with three output channels
US5274740A (en) 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
US5583962A (en) 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JPH05191886A (ja) 1992-01-16 1993-07-30 Matsushita Electric Ind Co Ltd サラウンドマイクロホンシステム
US5870480A (en) 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6920223B1 (en) * 1999-12-03 2005-07-19 Dolby Laboratories Licensing Corporation Method for deriving at least three audio signals from two input audio signals
US6970567B1 (en) 1999-12-03 2005-11-29 Dolby Laboratories Licensing Corporation Method and apparatus for deriving at least one audio signal from two or more input audio signals
TW510143B (en) * 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
WO2002019768A2 (en) * 2000-08-31 2002-03-07 Dolby Laboratories Licensing Corporation Method for apparatus for audio matrix decoding
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
CA2610430C (en) 2005-06-03 2016-02-23 Dolby Laboratories Licensing Corporation Channel reconfiguration with side information
JP4835298B2 (ja) * 2006-07-21 2011-12-14 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法およびプログラム
EP2345026A1 (en) * 2008-10-03 2011-07-20 Nokia Corporation Apparatus for binaural audio coding
US9324337B2 (en) 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN86102314A (zh) * 1985-02-26 1986-10-22 杜比实验室许可公司 可变矩阵译码器
CN1571583A (zh) * 1996-07-19 2005-01-26 莱克西康公司 具有最大横向分离度的多声道主动型矩阵音响重放
CN1575621A (zh) * 2000-10-06 2005-02-02 数字剧场系统股份有限公司 把两频道矩阵编码音频重构为多频道音频的解码方法

Also Published As

Publication number Publication date
CN102282868A (zh) 2011-12-14
JP2012515505A (ja) 2012-07-05
TWI449442B (zh) 2014-08-11
EP2380366A1 (en) 2011-10-26
WO2010083137A1 (en) 2010-07-22
TW201101861A (en) 2011-01-01
JP5507581B2 (ja) 2014-05-28
EP2380366B1 (en) 2012-11-28
US8787585B2 (en) 2014-07-22
US20110274280A1 (en) 2011-11-10

Similar Documents

Publication Publication Date Title
CN102282868B (zh) 没有反馈的频域有源矩阵解码的方法和系统
CN102257562B (zh) 用空间线索参数对多通道音频信号应用混响的方法和装置
US10231073B2 (en) Ambisonic audio rendering with depth decoding
RU2396608C2 (ru) Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема
US9865270B2 (en) Audio encoding and decoding
RU2466469C2 (ru) Аудиодекодер
EP2327072B1 (en) Audio signal transformatting
CN101133680B (zh) 用于产生已编码立体声信号的设备及方法
EP1999999B1 (en) Generation of spatial downmixes from parametric representations of multi channel signals
JP5154538B2 (ja) オーディオ復号
CN107071686A (zh) 用于渲染音频声场表示以供音频回放的方法和设备
AU2007204333A1 (en) Decoding of binaural audio signals
JP2008512890A (ja) オーディオ信号のエンハンスメント
Zaunschirm et al. Binaural rendering with measured room responses: First-order ambisonic microphone vs. dummy head
CA2946916A1 (en) Method and device for applying dynamic range compression to a higher order ambisonics signal
Lecomte Ambitools: Tools For Sound Field Synthesis Using Higher Order Ambisonics-V1. 0
EP2934025A1 (en) Method and device for applying dynamic range compression to a higher order ambisonics signal
JP2007104601A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための装置
JP2011044884A (ja) 多チャネル音響再生装置及び多チャネル音響再生プログラム
MX2008008829A (en) Decoding of binaural audio signals

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant