CN103098131A

CN103098131A - 调频立体声无线电接收器的间歇单声道接收的隐藏

Info

Publication number: CN103098131A
Application number: CN2011800412167A
Authority: CN
Inventors: 利夫·塞尔斯特伦; 海科·普尔哈根; 约纳什·恩德加德
Original assignee: Dolby International AB
Current assignee: Dolby International AB
Priority date: 2010-08-24
Filing date: 2011-08-16
Publication date: 2013-05-08
Anticipated expiration: 2031-08-16
Also published as: EP2609592B1; WO2012025431A2; JP2013541870A; HK1186280A1; ES2526320T3; JP5581449B2; CN103098131B; EP2609592A2; US20130142340A1; US9237400B2; WO2012025431A3; AR082522A1

Abstract

本发明涉及音频信号处理。特别地，本发明涉及用于可靠地隐藏FM立体声无线电接收器的间歇单声道接收的方法及系统。该系统包括参数化立体声参数估计级，其被配置为基于所接收的双声道音频信号的第一帧来确定第一参数化立体声参数。该系统还包括隐藏检测级，其被配置为：确定第一信号帧内的侧边信号的能量；确定特定数量的跟随的连续信号帧，在特定数量的跟随的连续信号帧期间，侧边信号的能量从大于高阈值的值下降到小于低阈值的值；当连续的信号帧的数量小于帧阈值时确定跟随的第一信号帧的双声道音频信号是强迫单声道信号；以及基于第一参数化立体声参数确定参数化立体声参数。

Description

调频立体声无线电接收器的间歇单声道接收的隐藏

相关申请的交叉引用

本申请要求于2010年8月24日提交的美国专利临时申请61/376,569号的优先权，其全部内容通过引用合并于此。

技术领域

本文献涉及音频信号处理，尤其涉及一种用于改善调频（FM）立体声无线电接收器的音频信号的装置和相应方法。特别地，本文献涉及一种用于可靠地隐藏FM立体声无线电接收器的间歇单声道接收的方法和系统。

背景技术

在模拟FM（调频）立体声无线电系统中，用中-侧（M/S）表示（即作为中间声道（M）和侧边声道（S））来传递音频信号的左声道（L）和右声道（R）。中间声道M对应于L和R的和信号，例如，M=(L+R)/2，并且侧边声道S对应于L和R的差信号，例如，S=(L-R)/2。针对传输，将侧边声道S调制到38kHz抑制载波，并且添加到基带中间信号M以形成后向兼容立体声复用信号。然后使用该复用信号调制FM发送器的HF（高频）载波，通常工作在87.5MHz到108MHz的范围内。

当接收质量降低（即，无线电信道上的信噪比减小）时，S声道通常质量降低比M声道要严重。在许多FM接收器实施中，当接收条件有太多噪声时，将S声道静音。这意味着在差的HF无线电信号的情况下接收器从立体声后退到单声道。

即使在中间信号M具有可接受的质量的情况下，侧边信号S也可能是有噪声的，因此当混合在输出信号的左声道和右声道中（例如，根据L=M+S和R=M-S导出）时，可以严重地降低总体音频质量。当侧边信号S具有差到中级的质量的情况下，有两个选择：接收器选择接受与侧边信号S相关的噪声并且输出包括有噪声的左信号和右信号的实际立体声信号，或者接收器放弃侧边信号S并且后退到单声道。

参数化立体声（PS）编码是一种来自甚低比特率音频编码领域的技术。PS使得能够结合附加的PS侧边信息来将2-声道立体声音频信号作为单声道下混信号进行编码。单声道下混信号被获得为立体声信号的两个声道的组合。PS参数使得PS解码器能够根据单声道下混信号和PS侧边信息来重构立体声信号。通常，PS参数是时变和频变的，并且PS解码器中的PS处理通常在合并QMF组的混合滤波器组域中执行。文献“LowComplexity Parametric Stereo Coding in MPEG-4”,Heiko Purnhagen,Proc.Digital Audio Effects Workshop(DAFx),pp.163-168,Naples,IT,Oct.2004描述了对于MPEG-4的示例性PS编码系统。通过引用将其对参数化立体声的讨论合并到本文中。参数化立体声受例如MPEG-4Audio的支持。在MPEG-4标准化文献ISO/IEC14496-3:2005（MPEG-4Audio，第三版）的附录8.A和8.C以及章节8.6.4中讨论了参数化立体声。出于所有目的将该标准化文献的这些部分通过引用而合并到本文中。在MPEGSurround标准（参见文献ISO/IEC23003-1:2007,MPEG Surround）中也使用了参数化立体声。此外，出于所有目的通过引用将该文献合并到本文中。在文献“Binaural Cue Coding–Part I:PsychoacousticFundamentals and Design Principles,”Frank Baumgarte and ChristofFaller,IEEE Transactions on Speech and Audio Processing,vol 11,no6,pages509-519,November2003以及在文献“Binaural Cue Coding–PartII:Schemes and Applications,”Christof Faller and Frank Baumgarte,IEEE Transaction on Speech and Audio Processing,vol11,no6,pages520-531,11.2003中讨论了参数化立体声编码系统的另外的示例。在后两个文献中，使用了词语“双耳线索编码”，其是参数化立体声编码的示例。

在本文献中，描述了基于PS参数的生成的方法及系统。PS参数用于即使在接收到差质量的侧边信号时也生成低噪声立体声信号。此外，描述了一种误差隐藏方法，其可以用于通过维护先前所估计的PS参数来隐藏到单声道的中间后退。该情况下的问题是需要以高效和可靠的方式来检测单声道失落（dropout）情形。鉴于此，本文献描述了一种用于检测和隐藏单声道失落情形的机制。

发明内容

根据一个方面，描述了一种被配置为生成输出立体声信号和/或被配置为根据双声道音频信号确定参数化立体声参数的系统。可以在例如作为无线通信设备的一部分的FM立体声无线电接收器处接收双声道音频信号。可以将所接收的双声道音频信号表示为中间信号和侧边信号。换言之，双声道音频信号可以包括中间信号和侧边信号或可以包括可表示为中间信号和侧边信号的信号。可以根据左信号和右信号导出中间信号和侧边信号。再换言之，可以根据双声道音频信号来获得中间信号和/或侧边信号。因而，双声道音频信号可以包括能够从其导出中间信号和侧边信号的信息。在实施例中，中间信号M和侧边信号S与左音频信号L和右音频信号R按照M=(L+R)/2和S=(L-R)/2有关。输出立体声信号通常可以由左信号和右信号来表示。可替代地，可以将输出立体声信号称为双声道输出信号。该双声道输出信号可以携带单声道音频信号或立体声音频信号。具体地，如果双声道输出信号的左信号与双声道输出信号的右信号对应，则双声道输出信号通常携带单声道音频信号。

所述系统可以包括参数化立体声参数估计级，其被配置为基于所接收的双声道音频信号的第一帧来确定第一参数化立体声参数（或至少一个第一参数化立体声参数）。换言之，可以使用所接收的双声道音频信号的摘录来确定第一参数化立体声参数，例如，指示声道电平差的参数和/或指示声道间交叉相关性的参数。可以将摘录称为信号帧。参数化立体声参数估计级可以被配置为确定所接收的双声道音频信号的每个随后帧的新的参数化立体声参数（或至少一个新的参数化立体声参数）。

该系统可以包括被配置为确定第一信号帧内的侧边信号能量的隐藏检测级。可以基于信号帧内侧边信号的样本的均方根值来确定信号帧内的侧边信号的能量。隐藏检测级可以被配置为确定第一信号帧内的侧边信号的能量大于高阈值。

隐藏检测级可以被配置为确定特定数量的跟随的连续信号帧，在特定数量的跟随的连续信号帧期间，侧边信号的能量（E_s）从大于高阈值的值下降到小于低阈值的值。跟随的连续的信号帧的数量可以称为从高能量侧边信号（E_s>高阈值）到低能量侧边信号（E_s<低阈值）的转变时段。换言之，隐藏检测级可以被配置为确定直接接着第一信号帧的特定数量个信号帧的侧边信号的能量小于高阈值并且最终下降到小于低阈值。具体地，隐藏检测级可以被配置为确定能量从大于高阈值的能量下降至小于低阈值的能量期间信号帧的精确数量。甚至更具体地，隐藏检测级可以被配置为当连续信号帧的数量，即当所述转变时段小于帧阈值时确定跟随第一信号帧的双声道音频信号是劣化的立体声信号或强迫的单声道信号。在实施例中，帧阈值可以是一个或更多个信号帧，例如，1个信号帧、2个信号帧、3个信号帧或4个信号帧中的任意一种。

隐藏检测级可以被配置为尤其在已经检测到强迫的单声道信号时，基于第一参数化立体声参数来确定参数化立体声参数。参数化立体声参数可以用于处理双声道音频信号。特别地，参数化立体声参数可以用于处理双声道音频信号的接着双声道音频信号的第一信号帧的帧。

该系统可以包括上混级，所述上混级被配置为基于辅助音频信号以及基于第一参数化立体声参数来生成跟随第一信号帧的输出立体声信号的帧。换言之，如果确定所接收的跟随第一信号帧的双声道音频信号是强迫单声道信号，例如，侧边信号非常小例如具有很小能量的侧边信号的立体声信号，则根据第一参数化立体声参数（即，已经根据基于所接收的双声道音频信号的没有劣化的帧确定的第一参数化立体声参数）确定输出立体声信号的随后帧。另一方面，可以从所接收的跟随第一信号帧的双声道音频信号获得辅助音频信号，即，辅助音频信号可以根据所接收的双声道音频信号的与输出立体声信号的帧相对应的帧来确定。在实施例中，将辅助音频信号确定为(L+R)/a，其中a是实数，例如2。即，辅助音频信号可以与包括在所接收的双声道音频信号内的中间信号相对应。

隐藏检测级还可以被配置为当连续信号帧的数量等于或大于帧阈值时确定跟随第一信号帧的双声道音频信号是真实的单声道信号。因而，隐藏检测级可以被配置为通过确定侧边信号的能量从大于高阈值下降到小于低阈值所花费的信号帧的数量来检测从立体声信号到真实的单声道信号（例如，语音信号）的转变。

隐藏检测级可以被配置为状态机。具体地，隐藏检测级可以包括指定总体系统的多个模式的多个状态。所述系统的模式通常确定如何处理所接收的双声道音频信号的当前帧。具体地，上混级的处理可以取决于系统的当前状态。隐藏检测级还可以包括指定所述多个状态之间的转变条件的多个边缘。因而，两个状态之间的边缘可以指定针对系统从当前状态通过至随后状态所要满足的条件。该条件可以包括一个或更多个条件，例如，关于侧边信号的随后帧的能量、时间限制、帧数量限制等的条件。通过指定状态之间的转变条件，边缘可以确定如何处理双声道音频信号的当前帧的紧挨的随后帧。

多个状态可以包括立体声状态即以下状态：在该状态期间，系统将双声道音频信号作为非劣化的立体声信号来处理。如果系统位于立体声状态，则参数化立体声估计级可以被配置为基于所接收的双声道音频信号的当前帧来确定当前参数化立体声参数。上混级可以被配置为基于辅助音频信号和当前参数化立体声参数来生成输出立体声信号的当前帧。可以从所接收的双声道音频信号的当前帧获得辅助音频信号。具体地，可以从包括在所接收的双声道音频信号内的中间信号的当前帧获得辅助音频信号。应当注意：可替代地或另外地，所述系统可以旁路上混级，并直接从双声道音频信号确定输出立体声信号。具体地，可以直接从所接收的双声道音频信号的帧确定例如拷贝输出立体声信号的帧。

多个状态可以包括真实单声道状态，即以下状态：在该状态期间，系统将所接收的双声道音频信号作为真实单声道信号来处理，诸如例如语音信号等。如果该系统处于真实单声道状态，参数化立体声参数估计级可以被配置为基于所接收的双声道音频信号的当前帧来确定当前参数化立体声参数。上混级可以被配置为基于辅助音频信号和当前参数化立体声参数来生成输出立体声信号的当前帧。可以从所接收的双声道音频信号的当前帧获得辅助音频信号。应当注意：以与立体声状态类似的方式，系统在真实单声道操作期间可以工作在旁路模式。

该多个状态可以包括隐藏状态，即该系统隐藏强迫的单声道信号的状态。如果该系统处于隐藏状态，则上混级可以被配置为基于辅助音频信号和所存储的参数化立体声参数来生成输出立体声信号的当前帧。因而，上混级可以被配置为基于先前所确定的参数化立体声参数来确定输出立体声信号，从而隐藏包括在当前所接收的侧边信号帧内的单声道信号。以与其它状态类似的方式，辅助音频信号可以从所接收的双声道音频信号的当前帧获得。另一方面，所存储的参数化立体声参数可能已经由参数化立体声参数估计级在该系统处于先前立体声状态时确定。在实施例中，根据多个参数化立体声参数确定了所存储的参数化立体声参数，优选地，通过平滑或平均。通过考虑在达到隐藏状态前已经针对不同的信号帧确定了的参数化立体声参数，可以确保该系统在隐藏状态期间不使用难用的参数化立体声参数。此外，所存储的参数化立体声参数可以是时变的。具体地，所存储的参数化立体声参数可以随时间衰退到单声道。换言之，所存储的参数化立体声参数可以转变为适于生成单声道音频信号的参数化立体声参数。对于这种转变的时间间隔可以是可变的。

该多个边缘可以包括以下边缘中的一个或更多个：当随后帧的能量小于高阈值并且大于低阈值时，从立体声状态到真实单声道状态的转变；当随后帧的能量小于低阈值时，从立体声状态到隐藏状态的转变；当随后帧的能量小于高阈值并且大于低阈值时从隐藏状态到真实单声道状态的转变；当随后帧的能量大于高阈值时从隐藏状态到立体声状态的转变；和/或当随后帧的能量大于阈值时从真实单声道状态到立体声状态的转变。在实施例中，从真实单声道状态到隐藏状态的转变还取决于当前帧前面的、该系统处于真实单声道状态的帧的数量。可替代地或另外地，仅在当前帧前面的、该系统处于真实单声道状态的帧数量小于帧阈值时，才可能出现从真实单声道状态到隐藏状态的转变。

隐藏检测级还可以被配置为确定侧边信号的随后帧的谱平坦度。可以基于侧边信号的帧的功率谱来确定该谱平坦度。功率谱可以包括与相应的多个频带相关联的多个能量值。可以将谱平坦度确定为该多个能量值的几何平均与该多个能量值的算术平均之间的比率。因而，接近0的谱平坦度指示集中的功率谱，其中接近1的谱平坦度指示平坦的功率谱，即，噪声信号的功率谱。隐藏检测级还可以被配置为考虑该多个边缘中的至少之一的转变条件中的谱平坦度。即，隐藏级的边缘的转变条件可以考虑：侧边信号的随后帧包括或不包括高度的噪声。具体地，从真实单声道状态到立体声状态的转变可能取决于随后帧的谱平坦度。更加具体地，仅当谱平坦度小于平坦度阈值时才可能发生从真实单声道状态到立体声状态的转变。因而，能够避免由侧边信号中的噪声突发引起的从真实单声道状态到立体声状态的虚假转变。这还避免了从真实单声道状态到会导致真实的单声道信号的非期望的隐藏的隐藏状态的转变（经由立体声状态）。

该系统可以包括噪声估计级。噪声估计级可以被配置为确定所接收的侧边信号的噪声功率所特有的噪声参数。此外，参数化立体声参数估计级可以被配置为基于所接收的双声道音频信号和噪声参数来确定参数化立体声参数，即第一或当前参数化立体声参数。

该系统还包括音频编码器支持参数化立体声。音频编码器可以包括参数化立体声编码器，其中参数化立体声参数估计级是参数化立体声编码器的一部分。

根据另外的方面，描述了一种FM立体声无线电接收器。FM立体声无线电接收器可以被配置为接收包括或表示为中间信号和侧边信号的FM无线电信号。此外，FM立体声无线电接收器可以包括具有在本文献中所概括的特征和功能中的一个或更多个的系统。

根据另一个方面，描述了一种移动通信设备，例如蜂窝式电话或智能手机。该移动通信设备可以包括被配置为接收包括或可表示为中间信号和侧边信号的FM无线电信号的FM立体声接收器。此外，该移动通信设备可以包括根据在本文献中所概括的特征和功能中的一个或更多个的系统。

根据另外的方面，描述了一种用于确定输出立体声信号（或双声道输出信号）和/或用于根据所接收的双声道音频信号来确定参数化立体声参数的方法。所接收的双声道音频信号可以包括或可以表示为中间信号和侧边信号。该方法可以包括基于所接收的双声道音频信号的第一帧来确定第一参数化立体声参数的步骤。该方法可以进行第一信号帧内的侧边信号的能量的确定和第一信号帧内的侧边信号的能量高于高阈值的确定。此外，该方法可以包括确定特定数量的跟随的连续信号帧，例如直接跟随第一信号帧的信号帧，在该特定数量的连续信号帧期间侧边信号的能量从大于高阈值的值下降到小于低阈值的值。具体地，该方法可以确定在侧边信号的能量从大于高阈值下降到小于低阈值期间帧的数量。接着，该方法可以进行当连续的信号帧的数量低于帧阈值时跟随第一信号帧的双声道音频信号是劣化的立体声信号或强迫的单声道信号的确定。如果是这种情况，即如果确定跟随第一信号帧的双声道音频信号是强迫的单声道信号，该方法可以包括基于第一参数化立体声参数来确定参数化立体声参数的步骤。可替代地或另外地，该方法可以包括基于辅助音频信号以及基于第一参数化立体声参数生成输出立体声信号的跟随第一信号帧的帧的步骤；其中根据所接收的跟随第一信号帧的双声道音频信号获得辅助音频信号。

根据另外的方面，描述了一种软件程序。该软件程序可以适于执行在处理器上并且当执行在计算设备上时用于执行在本文献中所概括的方法步骤。

根据另一个方面，描述了一种存储介质。该存储介质可以包括软件程序，该软件程序适于执行在处理器上，并且当执行在计算设备上时适于进行在本文献中所概括的方法步骤。

根据另外的方面，描述了一种计算机程序产品。该计算机程序产品可以包括当执行在计算机上时用于执行本文献所概括的方法步骤的可执行指令。

应当注意，包括方法及系统的如在本专利申请中概括的优选实施例的方法及系统可以独立使用或结合在本文献中公开的其它方法及系统来使用。此外，可以任意组合在本专利申请中概括的方法及系统的所有方面。具体地，权利要求的特征可以以任意方式互相进行组合。

附图说明

参考附图通过例示性实例来说明本发明，其中

图1例示用于改善FM立体声无线电接收器的立体声输出的示意性实施例；

图2例示基于参数化立体声的概念的音频处理装置的实施例；

图3例示具有PS编码器和PS解码器的基于PS的音频处理装置的另一实施例；

图4例示图3的音频处理装置的扩展版本；

图5例示图4的PS编码器和PS解码器的实施例；

图6例示用于在FM接收器的仅单声道输出的情况下生成伪立体声的音频处理装置的另一实施例；

图7例示FM接收器的输出处立体声播放中的短暂失落的发生；

图8例示用于进行单声道失落检测和单声道误差隐藏的示例状态机；

图9例示具有单声道失落的信号的示例误差隐藏；

图10例示示例音频信号的功率谱；

图11例示使用误差隐藏的示例PS参数估计级；

图12例示示例“单声道”检测级或隐藏检测级；

图13例示具有误差补偿的先进的PS参数估计级；以及

图14例示基于HE-AAC v2编码器的音频处理装置的另外实施例。

具体实施方式

图1示出用于改善FM立体声无线电接收器1的立体声输出的简化的示意性实施例。如在背景技术部分所讨论的，在FM无线电中有意地将立体声信号作为中间信号和侧边信号来传输。在FM接收器1中，使用侧边信号来产生FM接收器1的输出处左声道L与右声道R之间的立体声差（至少当接收足够好并且没有静音侧边信号信息时）。左声道L和右声道R可以是数字或模拟信号。为了改善FM接收器的音频信号L和R，使用音频处理装置2，该音频处理装置2在其输出处生成立体声音频信号L’和R’。音频处理装置2对应于能够使用参数化立体声来对所接收的FM无线电信号进行降噪的系统。优选地，在数字域中进行装置2中的音频处理；因此，在FM接收器1与音频处理装置2之间的模拟接口的情况下，在装置2的数字音频处理之前使用模数转换器。可以将FM接收器1和音频处理装置2结合在相同的半导体芯片上或可以是两个半导体芯片的一部分。FM接收器1和音频处理装置2可以是无线通信设备的一部分，无线通信设备诸如蜂窝电话、个人数字终端（PDA）或智能手机。在这种情况下，FM接收器1可以是具有附加的FM无线电接收器功能的基带芯片的一部分。

替代在FM接收器1的输出处以及装置2的输入处使用左/右表示（representation），可以在FM接收器1与装置2之间的接口处使用中/侧表示（参见图1中对于中/侧表示的M、S和对于左/右表示的L、R）。因为FM接收器1已经接收了中/侧边信号并且音频处理装置2可以在不进行下混的情况下直接处理中/侧边信号，所以FM接收器1与装置2之间的接口处的这种中/侧表示可以事半功倍。当FM接收器1与音频处理装置2紧密整合时，尤其是当FM接收器1与音频处理装置2结合在相同的半导体芯片中时，中/侧表示可能是有利的。

可选地，可以将指示无线电接收条件的信号强度信号6用于适应（adapt）音频处理装置2中的音频处理。后面将在本说明书中对此进行说明。

FM无线电接收器1和音频处理装置2的组合对应于具有集成降噪系统的FM无线电接收器。

图2示出基于参数化立体声概念的音频处理装置2的实施例。装置2包括PS参数估计级3。参数估计级3被配置为基于要改善的输入音频信号（其可以用左/右表示或中/侧表示）确定PS参数5。PS参数5可以但不限于包括指示声道间强度差（IID或也称为CLD–声道电平差）的参数和/或指示声道间交叉相关性（ICC）的参数。优选地，PS参数5是时变和频变的。在参数估计级3的输入处的M/S表示的情况下，参数估计级3仍然可以确定与L/R声道有关的PS参数5。

从输入信号获得音频信号DM。在输入音频信号已经使用中/侧表示的情况下，音频信号DM可以直接对应中间信号。在输入音频信号具有左/右表示的情况下，通过下混音频信号来生成音频信号。优选地，下混后的结果信号DM对应于中间信号M并且可以通过下面的等式来生成：

DM=(L+R)/a，例如a=2，

即，下混信号DM可以与L和R信号的平均值相对应。对于a的不同值，L和R信号的平均值被放大或减小。

该装置还包括也称为立体声混合模块或立体声上混器的上混级4。上混级4被配置为基于音频信号DM和PS参数5生成立体声信号L’和R’。优选地，上混级4不仅使用DM信号而且还使用侧边信号或某种伪侧边信号（未示出）。后面将在本说明书中联系图4和图5中的更延伸的实施例来进行说明。

装置2基于这种思想：由于其噪声，对于通过简单地组合所接收的中间信号和侧边信号来重构立体声信号而言，所接收的侧边信号的噪声可能太大；尽管如此，在这种情况下，L/R信号中的侧边信号或侧边信号的分量对PS参数估计级3中的立体声参数分析可能仍然足够好。然后可以将获得的PS参数5用于生成相比直接在FM接收器1的输出处的音频信号具有减小了的噪声水平的立体声信号L’、R’。

因此，可以通过使用参数化立体声概念来“净化”差的FM无线电信号。FM无线电信号中的失真与噪声的主要部分位于可能不在PS下混中使用的侧边声道。尽管如此，即使在差的接收的情况下，对于PS参数提取，侧边声道通常具有足够的质量。

在所有下面的图中，到音频处理装置2的输入信号是左/右立体声信号。在对音频处理装置2内的一些模块进行较小的修改后，音频处理装置2还能够处理中/侧表示下的输入信号。因此，可以联系中/侧表示下的输入信号来使用本文所讨论的概念。

图3示出使用PS编码器7和PS解码器8的基于PS的音频处理装置2的实施例。在该示例中，参数估计级3是PS编码器7的一部分，并且上混级4是PS解码器8的一部分。将术语“PS编码器”和“PS解码器”用作描述装置2内的音频处理块的功能的名字。应当注意：音频处理都是发生在相同的FM接收器设备处。这些PS编码和PS解码处理可以紧密地耦接，并且仅使用术语“PS编码”和“PS解码”描述音频处理功能的传承。

PS编码器7基于立体声音频输入信号L、R生成音频信号DM和PS参数5。可选地，PS编码器7还使用信号强度信号6。音频信号DM为单声道下混并且优选地对应于所接收的中间信号。当加和L/R声道以形成DM信号时，在DM信号中可以完全排除所接收的侧边声道信息。因此，在该情况下，在单声道下混DM中仅包含中间信息。因此，在DM信号中可以排除来自侧边声道的任何噪声。但是，由于编码器7通常采用L=M+S和R=M-S作为输入（因此，DM=(L+R)/2=M），所以侧边信号是编码器7中的立体声参数分析的一部分。

随后，在PS解码器8中使用单声道信号DM和PS参数5来重构立体声信号L’、R’。

图4示出图3的音频处理装置2的扩展版本。此处，除了单声道下混信号DM和PS参数以外，还将原始接收的侧边信号S₀传递到PS解码器8。该方法与来自PS编码的“残差编码”技术类似，并且使得能够在良好但不完美的接收条件的情况下使用所接收的侧边信号S₀的至少部分（例如，某些频带）。优选地，在单声道下混信号对应于中间信号的情况下使用所接收的侧边信号S₀。但是，在单声道下混信号不对应于中间信号的情况下，可以使用更一般的残差信号替代所接收的侧边信号S₀。这种残差信号指示与通过原始声道的下混和PS参数表示原始声道相关的误差，并且经常用在PS编码方案中。下面，对所接收的侧边信号的S₀的用途的评论也适用于残差信号。

图5示出图4的PS编码器7和PS解码器8的实施例。PS编码器模块7包括下混生成器9和PS参数估计级3。例如，下混生成器9可以产生优选地与中间信号M对应的单声道下混DM（例如，DM=M=(L+R)/a），并且可选地还可以生成与所接收的侧边信号S₀=(L-R)/a对应的第二信号。

PS参数估计级3可以将PS参数5估计为L输入与R输入之间的电平差（level difference）和相关性。可选地，参数估计级接收信号强度6。可以使用该信息对PS参数5的可靠性做出决定。在低可靠性的情况下，例如在低信号强度6的情况下，可以设置PS参数5使得输出信号L’、R’是单声道输出信号或伪立体声输出信号。在伪立体声输出信号的情况下，可以使用默认的PS参数来生成伪或默认的立体声输出信号L’、R’。

PS解码器模块8包括立体声混合矩阵4a和去相关器10。去相关器接收单声道下混DM并且生成用作伪侧边信号的去相关信号S’。可以通过如在引用文献“Low Complexity Parametric Stereo Coding in MPEG-4”的章节4中讨论的适当的全通滤波器来实现去相关器10。在该实施例中，立体声混合矩阵4a是2×2上混矩阵。

取决于所估计的参数5，立体声混合矩阵4a将DM信号与所接收的侧边信号S₀或去相关信号S’进行混合来产生立体声输出信号L’和R’。信号S₀与信号S’之间的选择可以取决于指示接收条件（诸如信号强度6）的无线电接收指示器。可以替代地或附加地使用指示所接收的侧边信号的质量的质量指示器。这种质量指示器的一个示例是所接收的侧边信号的估计噪声（功率）。在侧边信号包括高度噪声的情况下，可以使用去相关信号S’来产生立体声输出信号L’和R’，而在低噪声情形中，可以使用侧边信号S₀。后面在本说明中讨论用于估计所接收的侧边信号的噪声的各种实施例。

优选地，根据下面的矩阵等式来执行上混操作：

(\begin{matrix} L' \\ R' \end{matrix}) = (\begin{matrix} α & β \\ γ & δ \end{matrix}) (\begin{matrix} DM \\ S \end{matrix})

此处，加权因子α、β、γ、δ确定信号DM和S的加权。优选地，单声道下混DM对应于所接收的中间信号。式中的信号S对应于去相关信号S’或所接收的侧边信号S0。可以如在引用论文“Low ComplexityParametric Stereo Coding in MPEG-4”（参见章节2.2），如在引用的MPEG-4标准文献ISO/IEC 14496-3:2005（参见章节8.6.4.6.2）或如在MPEG Surround规格文献ISO/IEC 23003-1（参见章节6.5.3.2）中所示来导出上混矩阵元素即加权因子α、β、γ、δ。上述文献的这些章节（以及这些章节中所引用的章节）出于所有目的通过引用合并到本文中。

在某些接收条件下，在所传递的侧边信号被静音的情况下，FM接收器1仅提供单声道信号。这通常发生在接收条件非常差并且侧边信号的噪声非常大时。在FM立体声接收器1已经切换至立体声无线电信号的单声道播放的情况下，优选地，上混级使用用于盲上混的上混参数诸如预设的上混参数，并且生成伪立体声信号，即，上混级使用用于盲上混的上混参数来生成立体声信号。

也有FM立体声接收器1的以下实施例：在过于差的接收条件下其切换至单声道播放。如果接收条件对于可靠的PS参数5的估计太差，则优选地，上混级使用用于盲上混的上混参数并且基于其生成伪立体声信号。

图6示出FM接收器1的仅单声道输出的情况下的伪立体声生成的实施例。此处，使用单声道/立体声检测器13来检测到装置2的输入信号是否为单声道，即，L声道和R声道的信号是否相同。在FM接收器1的单声道播放的情况下，单声道/立体声检测器13指示使用例如具有固定的上混参数的PS解码器到立体声的上混。换言之：在该情况下，上混级4不使用来自PS参数估计级3的PS参数（未在图6中示出），而是使用固定的上混参数（未在图6中示出）。

可选地，可以添加语音检测器14以指示所接收的信号是否主要是语音或音乐。这种语音检测器14允许取决于盲上混的信号。例如，这种语音检测器14可以允许取决于上混参数的信号。优选地，可以将一个或更多个上混参数用于语音，并且将不同的一个或更多个上混参数用于音乐。这种语音检测器14可以通过语音激活检测器（VAD）来实现。

严格来讲，图6中的上混级4包括去相关器10、2×2上混矩阵4a和将单声道/立体声检测器13和语音检测器14的输出转换成用作实际的立体声上混的输入的某种形式的PS参数的装置。

图7示出以下常见问题：由于时变的差的接收条件（例如，“衰落”），由FM接收器1所提供的音频信号在立体声与单声道之间切换。为了维护单声道/立体声切换期间的立体声声音图像，可以使用误差隐藏技术。在图7中用“C”指示要应用隐藏的时间间隔。PS编码中的一种隐藏方法是在因为FM接收器1的音频输出下降到单声道而不能计算新的PS参数的情况下使用基于先前所估计的PS参数的上混参数。例如，在因为FM接收器1的音频输出下降到单声道而不能计算新的PS参数的情况下，上混级4可以继续使用先前所估计的PS参数。因此，当FM立体声接收器1切换至单声道音频输出时，立体声上混级4继续使用来自PS参数估计级3的先前所估计的PS参数。如果在立体声输出中失落（dropout）时段很短以使得FM无线电信号的立体声声音图像在失落时段期间保持相似，则该失落在装置2的音频输出中是不可听见或仅几乎听不见。另一种方法可以添加上混参数和/或从先前所估计的参数推测上混参数。关于基于先前所估计的PS参数来确定上混参数，鉴于本文的教示，还可以使用例如从能够用在音频解码器中减轻传输误差（例如，损坏或缺失数据）的影响的误差隐藏机制中所知的其它技术。

如果在短的时段期间FM接收器1提供了有噪声的立体声信号，有噪声的信号过于差而使得不能基于其估计可靠的PS参数，则还可以应用使用基于先前所估计的PS参数的上混参数的相同方法。

如上面所概括的，期望在图7中描绘的立体声中断期间维护立体声图像，以避免立体声宽度的突发感知不连续性。这可以通过上述隐藏技术来实现。但是，以可靠的方式来检测这些单声道失落可能是个问题。可能的单声道/立体声检测器可以基于检测信号的满足条件左信号=右信号（或左信号-右信号=0）的单声道部分。但是，由于左信号和右信号能量以及侧边信号能量甚至可以在健康接收条件下波动很大的事实，这种单声道/立体声检测器可以导致对于隐藏处理的不稳定行为。

为了避免隐藏的这种不稳定行为，可以将单声道/立体声检测和隐藏机制实施为状态机。在图8中示出示例状态机。图8的状态机使用侧边信号S的绝对能量（即，E_S）的两个参考水平。可能已经使用通常为250Hz的截止频率来对用于计算E_S的侧边信号S进行了高通滤波。这些参考水平是上参考水平ref_high和下参考水平ref_low。在大于参考水平（ref_high）时，信号被认为是立体声，并且小于参考水平（ref_low）时，信号被认为是单声道。

将侧边信号能量E_S作为状态机的控制参数来计算。可以在例如与PS参数的有效时段对应的时间窗上计算E_S。换言之，确定侧边信号能量的频率可以与确定PS参数的频率一致。在该文献中，用于确定侧边信号能量E_S（以及可能PS参数）的时段称为信号帧。图8的状态机包括5个条件，每次计算新的帧的能量E_S时对这5个条件进行验证：

-条件A指示侧边信号能量E_S超过上参考水平ref_high。上参考水平可以称为高阈值。

-条件B指示侧边信号能量E_S小于或等于上参考水平ref_high并且大于或等于下参考水平ref_low。下参考水平可以称为低阈值。

-条件B1对应于条件B，但是添加了附加的时间条件。该时间条件规定在小于帧的阈值数量或小于阈值时间的情况下满足条件B。可以将该阈值称为帧阈值。

-条件B2对应于条件B，具有附加的时间条件，其规定在大于或等于帧的阈值数量，或者大于或等于阈值时间的情况下满足条件B。

-条件C指示侧边信号能量E_S小于下参考水平ref_low。

此外，图8的示例状态机使用5种状态。这5种状态的到达易受上述条件和图8中的状态图的影响。下面的行为通常进行在不同的状态下：

-在状态1下，例如基于根据当前音频信号确定的PS参数来进行正常的立体声操作。

-在状态2下，基于根据当前音频信号确定的PS参数来进行正常的立体声操作。由于对于大于或等于帧阈值的帧数量或对于大于或等于时间阈值的时间满足条件B（即，条件B2），或者在该帧数量流逝或时间流逝之前满足条件A，该状态仅是过渡性的。

-在状态3下，基于根据当前音频信号确定的PS参数来进行立体声操作。可以看出，状态3以从状态1经由状态2再到状态3的路径来达到。鉴于条件B2需要最小数量个帧或最小量的时间用于转变这个事实，路径“状态1、状态2、状态3”表示从正常立体声操作（例如，音乐）到正常单声道操作（例如，语音）的缓慢即平稳转变。

-在状态4下，使用先前所确定的PS参数例如在状态1下确定最近的PS参数来开始误差隐藏。可以看出，如果满足条件C，即，如果侧边信号能量E_S陡峭地从大于ref_high下降到小于ref_low，则可以从状态1直接到达状态4。可替代地，可以从状态1经由状态2到达状态4，但是仅当条件B针对少量帧或仅短暂的时段满足时。如此，路径“状态1、状态4”和“状态1、状态2、状态4”表示从正常的立体声操作（例如，音乐）到强迫的单声道操作的快速即突然的转变。强迫的单声道操作通常是当侧边信号中的噪声水平超过预定的水平时由FM接收器突然切断侧边信号而引起的。

-在状态5下，例如基于在状态4中已经建立的PS参数来继续误差隐藏。在示出的实施例中，如果满足条件C，则仅能够从状态4到达状态5，即，状态5表示稳定的误差隐藏状态，其中使用先前确定的PS参数以根据中间信号来生成立体声音频信号。PS参数可以衰退到具有几秒的时间常数的单声道。IID和ICC参数的时间常数可以不同。

如已经示出的，所例示的状态图确保仅当在几个时间窗口内（即，如果从立体声到单声道的转变是突然的）由FM接收器接收的音频信号从立体声到单声道时才触发隐藏。另一方面，在具有能量E_S的侧边信号中的噪声小于立体声水平（ref_high）而高于单声道水平（ref_low）的情况下，即，在侧边信号内仍有充足的信息来生成适当PS参数的情况下，防止触发隐藏。同时，即使当信号从立体声变化到单声道，例如当信号从音乐转变到语音时，也不会触发隐藏检测，从而确保没有因误差地应用隐藏而将原始的单声道信号表现（render）为伪立体声信号。可以基于侧边信号能量E_S的从大于ref_high的水平到小于ref_low的水平的平稳转变来检测从立体声到单声道的真实转变。

当触发隐藏时，使用来自先前时间窗之一的立体声（PS）参数（例如，IID和ICC）。通过可选地使用PS参数的低通滤波值替代PS参数的快照（snapshot），对参数的选择可以变得对难用的立体声声音图像的冻结风险不太敏感。换言之，使用经过滤波或平均的来自触发隐藏之前的特定时段或特定数量的帧的PS参数，以防止对PS参数的不适当的集合的使用可能是有益的。参数值可以衰退到单声道。

如从图8可以看出的，当侧边信号超过单声道水平（ref_low）时终止隐藏。因此，再次使用新近访问的立体声参数。这是由于以下事实：如果侧边信号能量E_S大于阈值ref_low，则认为侧边信号包括足够的用于确定PS参数的信息。

图9示出：对于示例音频信号，当侧边信号的能量下降到小于下参考水平（ref_low）时如何激活隐藏。图9示出所接收的音频信号的中间信号能量E_mid（附图标记30）以及侧边信号能量E_S（附图标记31）。此外，图9示出高阈值ref_high（附图标记32）和低阈值ref_low（附图标记33）。在上部曲线图34中例示隐藏触发，其中低值指示使用当前所确定的PS参数的正常操作，并且其中高值指示使用先前确定的PS参数来进行隐藏。

在实施例中，将谱平坦度测量（SFM）用于侧边信号噪声检测，以进一步改善对虚假的单声道失落检测的预防。如上所示的，可靠地区分由劣化的侧边信号引起的单声道失落与立体声到单声道之间的真实转变是有益的。一种进行这种区分的方法是使用如上所概括的状态图。可以进一步对侧边信号的频谱的谱平坦度进行测量以区分劣化的噪声侧边信号与真实的单声道信号。谱平坦度测量可以由以下给出：

SFM = \frac{{(Π_{k = 0}^{N - 1} E {X_{s}^{2} (k)})}^{1 / N}}{\frac{1}{N} Σ_{k = 0}^{N - 1} E {X_{s}^{2} (k)}}

其中

表示侧边信号的在混合滤波器组频带k中的功率。在示例PS系统中使用的混合滤波器组包括64个QMF频带，其中将3个最低的频带进一步分成4+2+2个频带（因此，N=64-3+4+2+2=69）。可以将SFM描述为功率谱的几何平均与功率谱的算术平均之间的比率。

可替代地，可以在频谱的仅包括范围从K_start到K_stop的混合滤波器组频带的子集上计算SFM。例如，可以排除一个或几个第一频带以移除不想要的DC，例如，低频、偏移。当调节频带边界时从而SFM产生：

SFM = \frac{{(Π_{k = K_{start}}^{K_{stop}} E {X_{s}^{2} (k)})}^{1 / (K_{stop} - K_{start} + 1)}}{\frac{1}{(K_{stop} - K_{start} + 1)} Σ_{k = K_{start}}^{K_{stop}} E {X_{s}^{2} (k)}}

对于限制计算复杂度的理由，SFM公式可以可替代地由SFM公式的基于例如泰勒展开式、查找表或对于软件实施领域的专家通常已知的类似技术的数字近似来取代。

此外，存在其它明显的测量谱平坦度的现有技术方法，诸如例如频率功率区间（bin）的最大值与最小值之间的标准偏差或差等。因此用词语“SFM”表示这些测量中的任何测量。

高的谱平坦度指示频谱在所有频带中具有类似的功率量。另一方面，低的谱平坦度指示谱功率集中在相对少量的频带中。从而，高SFM值指示有噪声的侧边信号，其中低的SFM值指示可以包括信息的侧边信号。

在图10中，对有噪声的语音信号的中间信号和侧边信号的功率谱进行描绘。可以看出，中间信号20的功率谱相对于较低频率范围中的高能量水平相对地陡峭。另一方面，在所示出的单声道语音信号主要包括噪声的情况下的侧边信号21具有总体的低度能量和相对地平坦的功率谱。

因为侧边信号噪声21的功率谱具有特征性斜坡，可以基于斜坡补偿功率谱来确定SFM。即，可以使用上面的公式根据斜坡补偿功率谱来确定SFM值。用于补偿功率谱的斜坡可以是预定的，例如，多个测试侧边信号的功率谱的平均斜坡。这些测试侧边信号可以是单声道信号的侧边信号，例如，单声道语音信号，从而产生对于在例如单声道语音信号的单声道信号中所包括的侧边信号噪声的典型/平均斜坡。可替代地或另外地，可以使用侧边信号的当前帧来确定用于补偿功率谱的斜坡，从而提供了自适应斜坡补偿。这可以使用线性回归技术来完成。

使用上述测量，可以针对每个信号帧来确定SFM值，从而产生对于一系列信号帧的SFM信号。可以沿着帧/时间轴对该SFM信号进行平滑（低通滤波器）。可以将SFM值或（平滑的）SFM信号用作噪声测量。具体地，可以使用SFM值来识别真实单声道信号中的偶然噪声突发。例如，音频信号可以是单声道语音信号并且图8的状态机可以处于状态3。侧边信号中的偶然噪声突发，即，能量E_S的偶然增加可以触发条件A，从而触发从状态3到状态1的转变，即使音频信号仍然是单声道语音信号。然后噪声突发的突变端可以触发到状态4的转变（直接地或经由状态2），从而启动对于单声道语音信号的非期望的隐藏。为了避免这种非期望的情形，SFM值或（平滑的）SFM信号可以用作附加的条件。例如，条件A可以取决于（平滑的）SFM信号而附加地做出，从而区分由立体声信号引起的侧边信号能量和由噪声突发引起的侧边信号能量。在实施例中，如果（平滑的）SFM信号超过特定阈值，则可以停用隐藏检测。总体上，应当注意，SFM的使用使得以下成为可能：避免虚假的隐藏检测，否则其会在侧边信号中的偶然噪声突发情况下针对典型的单声道语音信号出现。

在图11中示出包括隐藏的示例PS参数估计级。该PS参数估计级还可以称为改进的PS参数估计级。包括左信号和右信号的双声道音频信号进入PS参数估计级3，其基于双声道音频信号的一个或更多个当前帧来确定一组PS参数。左音频信号和右音频信号还进入“单声道”检测级或隐藏检测级22，其被配置为确定是否要进行隐藏。出于该目的，“单声道”检测级22可以使用在本文献中概括的任何方法。改进的PS参数估计级还可以包括被配置为存储先前所确定的PS参数的存储器级23。具体地，存储器级23可以被配置为确定并且存储要在隐藏期间使用的一组PS参数。此外，存储器级23可以被配置为对该组存储的PS参数应用衰退。该衰退可以导致从该组存储的PS参数到适于绘制单声道信号的一组PS参数的平滑转变。该衰退或转变的速度可以是可配置的。此外，改进的PS参数估计级可以包括PS参数选择级24，该PS参数选择级24被配置为根据立体声或真实的单声道操作期间PS参数估计级3的输出、和隐藏操作期间存储器级23的输出来选择PS参数。

图12例示示例“单声道”检测级或隐藏检测级22。使用侧边信号确定级25根据左信号和右信号来生成侧边信号。接着，在能量确定级26中确定侧边信号的能量E_S。此外，可以在SFM确定级27中确定侧边信号的SFM值。利用各个阈值验证级28、29确定侧边信号的能量E_S和/或SFM值是否满足特定的条件。将这些条件馈送至状态机40中以触发状态机40的状态之间的转变。状态机的状态和转变（边缘）可以如本文献所概括的来配置。作为“单声道”检测级22的输出，可以触发隐藏激活。

下面，参考图13来讨论提供误差补偿的先进的PS参数估计级3’。在基于包含有噪声的边侧成分的立体声信号来估计PS参数的情况下，如果使用用于确定PS参数的常规公式，诸如用于确定CLD参数（声道电平差）和ICC参数（声道间交叉相关性），则在PS参数的计算中会有误差。

实际的有噪声的立体声输入信号值I_w/噪声和r_w/噪声，其是图13所示的内PS参数估计级3’的输入，上述信号值可以用各个没有所接收的侧边信号值的噪声和噪声值n的I_w/o噪声和r_w/o噪声的相关性来表达：

I_w/噪声=m+(s+n)=I_w/o噪声+n

r_w/噪声=m-(s+n)=r_w/o噪声–n

应当注意，此处将所接收的侧边信号建模为s+n，其中“s”是原始的（未失真的）侧边信号，并且“n”是由无线电传输信道引起的噪声（失真信号）。此外，此处假设来自无线电传输信道的噪声没有使信号m失真。

因此，相应的输入功率L_w/噪声 ²、R_w/噪声 ²和交叉相关性L_w/噪声R_w/噪声可以写为：

L_w/噪声 ²=E(l_w/噪声 ²)=E((m+s)²)+E(n2)=L_w/o噪声 ²+N²

R_w/噪声 ²=E(r_w/噪声 ²)=E((m-s)²)+E(n²)=R_w/o噪声 ²+N²

L_w/噪声R_w/噪声=E(l_w/噪声·r_w/噪声)=E((l_w/o噪声+n)·(r_w/o噪声-n))=L_w/噪声R_w/噪声–N²

其中侧边信号噪声功率估计为N²，N²=E(n²)，其中“E()”是期望算子。

通过重新布置上面的等式，无噪声情况下的相应的补偿功率和交叉相关性可以确定为：

L_w/o噪声 ²=L_w/噪声 ²-N²

R_w/o噪声 ²=R_w/噪声 ²-N²

L_w/o噪声R_w/o噪声=L_w/噪声R_w/噪声+N²

可以执行基于补偿功率和交叉相关性的误差补偿PS参数提取，如下面公式所给出的：

CLD=10·log10(L_w/o噪声 ²/R_w/o噪声 ²)

ICC=(L_w/o噪声R_w/o噪声)/(L_w/o噪声 ²+R_w/o噪声 ²)

这种参数提取对PS参数的计算中所估计的N²项进行补偿。

侧边信号中的噪声的效果如下：当假设侧边信号中的噪声独立于中间信号：

-与基于无噪声的立体声信号估计的ICC值相比，该ICC值接近0，以以及

-与基于无噪声的立体声信号估计的CLD值相比，该CLD分贝值接近0dB。

对于PS参数中的误差的补偿，优选地，装置2具有噪声估计级，其被配置为确定所接收的侧边信号的噪声的功率的噪声参数特征，该噪声是由（差的）无线电传输引起的。然后当估计PS参数时可以考虑该噪声参数。这可以如在图3所示来实施。

根据图13，FM信号强度6可以用于至少部分地补偿误差。关于信号强度的信息通常可在FM无线电接收器中获得。信号强度6是在PS编码器7中参数分析段3的输入。在侧边信号噪声功率估计级15中，可以将信号强度6转换成侧边信号噪声功率估计N²。如作为信号强度6的替代或除了信号强度6以外，音频信号L和R可以用于估计如随后要讨论的信号噪声功率。

在图13中，侧边信号噪声功率估计级15被配置为基于信号强度6和/或音频输入信号（L和R）来导出噪声功率估计N²。噪声功率估计N²可以是频变和时变的。

可以使用确定侧边信号噪声功率N²的各种方法，例如：

-当检测中间信号的功率最小值（例如，语音中的停顿）时，可以假设侧边信号的功率仅是噪声（即，侧边信号的功率对应于这些情形中的N²）。

-可以通过信号强度数据6的函数来限定N²估计。函数（查找表）可以通过实验（物理）测量结果来指定。

-可以通过信号强度数据6的函数和/或音频输入信号（L和R）来限定N²估计。该函数可以由启发式规则来指定。

-N²估计可以基于对中间信号和侧边信号的信号类型相干性的研究。原始的中间信号和侧边信号可以例如假定为具有类似的音质噪声比或波峰因素或其功率包络特征。可以使用那些性质的偏差来指示N²的高水平。

本文所讨论的概念可以联系使用PS技术的任何编码器来实施，上述编码器例如在标准ISO/IEC 14496-3（MPEG-4Audio）中限定的HE-AACv2（高效的先进音频编码版本2）编码器、基于MPEG Surround的编码器或基于MPEG USAC（统一语音与音频编码器）的编码器以及MPEG标准所没有覆盖的编码器。

下面，例如，假定为HE-AAC v2编码器；尽管如此，可以联系使用PS技术的任何音频编码器来使用上述概念。

HE-AAC是有损音频压缩方案。HE-AAC v1（HE-AAC版本1）使用频带复制（SBR）来增加压缩效率。HE-AAC v2还包括用于增强处于非常低的比特率的立体声信号的压缩效率的参数化立体声。HE-ACC v2编码器固有地包括允许以非常低的比特率操作的PS编码器。这种HE-ACC v2编码器的PS编码器可以用作音频处理装置2的PS编码器7。具体地，可以将HE-AAC v2编码器的PS编码器内的PS参数估计级用作音频处理装置2的PS参数估计级3。此外，可以将HE-AAC v2编码器的PS编码器内的下混级用作装置2的下混级9。

因此，在本说明书中讨论的概念可以有效地与HE-AAC v2编码器组合以实现改善了的FM立体声无线电接收器。这种改善了的FM立体声无线电接收器可以具有HE-AAC v2记录特征，这是因为HE-AAC v2编码器输出可以出于记录目的而存储的HE-AAC v2比特流。这在图14中示出。在本实施例中，装置2包括HE-AAC v2编码器16和PS解码器8。HE-AAC v2编码器提供用于生成如联系先前的图来讨论的单声道下混DM和PS参数5的PS编码器7。

可选地，PS编码器7可以出于FM无线电噪声减少来修改以支持固定的下混方案，诸如根据DM=(L+R)/a的下混方案。

单声道下混DM和PS参数8可以馈送至PS解码器8以生成如上所讨论的立体声信号L’和R’。将单声道下混DM馈送至用于单声道下混DM的感知编码的HE-AAC v1编码器。将得到的感知编码器音频信号和PS信息复用为HE-AAC v2比特流18。出于记录的目的，可以将HE-AAC v2比特流18存储在存储器诸如快擦写存储器或硬盘中。

HE-AAC v1编码器17包括SBR编码器和AAC编码器（未示出）。SBR编码器通常在QMF（正交镜像滤波器组）域进行信号处理，因此需要QMF样本。相比之下，AAC编码器通常需要时域样本（通常以因子2进行下采样）。

HE-AAC v2编码器16内的PS编码器7通常提供已经位于QMF域中的混信号DM

因为PS编码器7可能已经将QMF域信号DM发送至HE-AAC v1编码器，所以能够使得用于SBR分析的HE-AAC v1编码器中的QMF分析变换过时。因此，可以通过提供作为QMF样本的下混信号DM来避免正常情况下为HE-AAC v1编码器的一部分的QMF分析。这减少了计算工作并且使能节省复杂度。

可以根据装置2的输入来导出用于AAC编码器的时域样本，例如，通过在时域进行简单的操作DM=(L+R)/2以及通过对时域信号DM进行下采样。该方法很可能是最廉价的方法。可替代地，装置2可以进行QMF域DM样本的半速QMF合成。

在本文献中，描述了用于减小FM无线电接收器的噪声的方法及系统。根据所接收的中间信号和侧边信号来确定PS参数以使用中间信号和PS参数来生成噪声减小了的音频信号。概括了甚至为高度噪声的侧边信号提供立体声信号的隐藏技术。在该情况下，概括了一种关于如何可靠地检测真实的单声道接收情形与噪声侧边信号情形的方法。

可以用软件、固件和/或硬件来实施在本文献中所描述的方法及系统。某些部件例如可以实施为运行在数字信号处理器或微处理器上的软件。其它部件例如可以作为硬件和或作为专用集成电路来实施。在所描述的方法中遇到的信号和系统可以存储在介质如随机存取存储器或光学存储介质等中。它们可以经由如无线电网络、卫星网络、无线网络或如互联网的有线网格等网络来传输。使用本文献中所描述的方法及系统的典型设备是用于存储和/或绘制音频信号的便携式电子设备或其它消费者装备。

Claims

1.一种被配置为根据双声道音频信号确定参数化立体声参数的系统,包括：

-参数化立体声参数估计级，被配置为基于所接收的双声道音频信号的第一帧来确定第一参数化立体声参数；以及

-隐藏检测级，被配置为：

-确定所述第一信号帧内的侧边信号的能量；其中所述侧边信号能够从所述双声道音频信号获得，并且其中所述能量大于高阈值；

-确定具有特定数量的跟随连续信号帧的转变时段，在所述转变时段期间所述侧边信号的能量从大于所述高阈值的值下降到小于低阈值的值；

-如果所述转变时段的连续信号帧的数量小于帧阈值，则确定跟随所述第一信号帧的所述双声道音频信号是强制单声道信号；以及

-基于所述第一参数化立体声参数来确定所述参数化立体声参数。

2.根据权利要求1所述的系统，其中所接收的双声道音频信号能够表示为中间信号和所述侧边信号。

3.根据权利要求1或2所述的系统，还包括：

-上混级，被配置为基于辅助音频信号并且基于所述第一参数化立体声参数来生成跟随所述第一信号帧的输出立体声信号的帧；其中根据跟随所述第一信号帧的所接收的双声道音频信号来获得所述辅助音频信号。

4.根据权利要求1至3中任一项所述的系统，其中所述隐藏检测级还被配置为：

-如果所述转变时段的连续信号帧的数量等于或大于所述帧阈值，则确定跟随所述第一信号帧的所述双声道音频信号是真实的单声道信号。

5.根据任一前述权利要求所述的系统，其中所述隐藏检测级包括：

-指定所述系统的多个模式的多个状态；其中所述系统的模式确定如何处理所述双声道音频信号的当前帧；以及

-指定所述多个状态之间的转变条件的多个边缘，从而确定如何处理所述双声道音频信号的所述当前帧的紧挨随后帧。

6.根据权利要求5所述的系统，其中所述多个状态包括立体声状态；其中在所述立体声状态中：

-所述参数化立体声参数估计级被配置为基于所接收的双声道音频信号的所述当前帧来确定当前参数化立体声参数；以及

-所述上混级被配置为基于所述辅助音频信号和所述当前参数化立体声参数来生成所述输出立体声信号的当前帧；其中根据所接收的双声道音频信号的所述当前帧来获得所述辅助音频信号。

7.根据权利要求6所述的系统，其中所述多个状态包括真实单声道状态；其中在所述真实单声道状态中：

8.根据权利要求7所述的系统，其中所述多个状态包括隐藏状态；其中在所述隐藏状态中：

-所述上混级被配置为基于所述辅助音频信号和所存储的参数化立体声参数来生成所述输出立体声信号的当前帧；其中根据所接收的双声道音频信号的所述当前帧来获得所述辅助音频信号；并且其中所存储的参数化立体声参数已经在所述系统处于先前的立体声状态时由所述参数立体声参数估计级确定。

9.根据权利要求8所述的系统，其中已经根据多个参数化立体声参数确定所存储的参数化立体声参数，优选地已经通过低通滤波或求平均来根据多个参数化立体声参数确定所存储的参数化立体声参数。

10.根据权利要求8或9所述的系统，其中所存储的参数化立体声参数是时变的并且随时间衰退到单声道。

11.根据权利要求8至10中任一项所述的系统，其中所述多个边缘包括：

-当所述随后帧的所述能量小于所述高阈值并且大于所述低阈值时从所述立体声状态到真实单声道状态的转变；

-当所述随后帧的所述能量小于所述低阈值时从所述立体声状态到所述隐藏状态的转变；

-当所述随后帧的所述能量小于所述高阈值并且大于所述低阈值时从所述隐藏状态到所述真实单声道状态的转变；

-当所述随后帧的所述能量大于所述高阈值时从所述隐藏状态到所述立体声状态的转变；和/或

-当所述随后帧的所述能量大于所述高阈值时从所述真实单声道状态到所述立体声状态的转变。

12.根据权利要求11所述的系统，其中从所述真实单声道状态到所述隐藏状态的所述转变还取决于所述当前帧之前的、所述系统处于所述真实单声道状态的帧的数量。

13.根据权利要求12所述的系统，其中仅当所述当前帧之前的、所述系统处于所述真实单声道状态的帧的数量小于所述帧阈值时，才发生从所述真实单声道状态到所述隐藏状态的所述转变。

14.根据任一前述权利要求所述的系统，其中所述帧阈值是1帧、2帧、3帧或4帧中任何一个。

15.根据权利要求11至14中任一项所述的系统，其中所述隐藏检测级还被配置为：

-确定所述侧边信号的所述随后帧的谱平坦度；以及

-考虑在所述多个边缘中的至少之一的转变条件中的所述谱平坦度。

16.根据权利要求15所述的系统，其中从所述真实单声道状态到所述立体声状态的所述转变取决于所述随后帧的所述谱平坦度。

17.根据权利要求16所述的系统，其中仅当所述谱平坦度小于平坦度阈值时才发生从所述真实单声道状态到所述立体声状态的所述转变。

18.根据权利要求3至17中任一项所述的系统，其中

-所述中间信号M和所述侧边信号S与左音频信号L和右音频信号R按照M=(L+R)/2并且S=(L-R)/2相关；以及

-所述辅助音频信号被确定为(L+R)/a，其中a是实数。

19.根据任一前述权利要求所述的系统，其中所述参数化立体声参数包括指示声道电平差的参数和/或指示声道间交叉相关性的参数。

20.根据任一前述权利要求所述的系统，其中

-所述系统还包括噪声估计级，所述噪声估计级被配置为确定所接收的所述侧边信号的噪声功率所特有的噪声参数；以及

-所述参数化立体声参数估计级被配置为基于所接收的双声道音频信号和所述噪声参数来确定所述参数化立体声参数。

21.根据任一前述权利要求所述的系统，还包括支持参数化立体声的音频编码器，所述音频编码器包括参数化立体声编码器，其中所述参数化立体声参数估计级是所述参数化立体声编码器的一部分。

22.一种调频立体声无线电接收器，被配置为接收包括中间信号和侧边信号的调频无线电信号，并且包括根据权利要求1至21中任一项所述的系统。

23.一种移动通信设备，包括：

-调频立体声接收器，被配置为接收包括中间信号和侧边信号的调频无线电信号；以及

-根据权利要求1至21中任一项所述的系统。

24.一种用于根据双声道音频信号来确定参数化立体声参数的方法，包括：

-基于所接收的双声道音频信号的第一帧来确定第一参数化立体声参数；

-确定所述第一信号帧内的侧边信号的能量；其中所述侧边信号能够从所述双声道音频信号来获得并且其中所述能量大于高阈值；

-确定特定数量的跟随连续信号帧，在所述跟随连续信号帧期间，所述侧边信号的能量从大于所述高阈值的值降至小于低阈值的值；

-如果连续信号帧的所述数量小于帧阈值，则确定跟随所述第一信号帧的所述双声道音频信号是强迫单声道信号；以及

25.一种软件程序，所述软件程序适于在处理器上执行并且当在计算设备上执行时用于执行权利要求24所述的方法步骤。

26.一种包括软件程序的存储介质，所述软件程序适于在处理器上执行并且当在计算设备上执行时用于执行权利要求24所述的方法步骤。

27.一种包括可执行指令的计算机程序产品，当在计算机上执行时，所述可执行指令用于执行权利要求24所述的方法。