CN103918030B - Fm立体声无线电信号中的高质量检测 - Google Patents

Fm立体声无线电信号中的高质量检测 Download PDF

Info

Publication number
CN103918030B
CN103918030B CN201280047065.0A CN201280047065A CN103918030B CN 103918030 B CN103918030 B CN 103918030B CN 201280047065 A CN201280047065 A CN 201280047065A CN 103918030 B CN103918030 B CN 103918030B
Authority
CN
China
Prior art keywords
signal
received
power
subband
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201280047065.0A
Other languages
English (en)
Other versions
CN103918030A (zh
Inventor
约纳斯·恩德加德
海科·普恩哈根
L·塞勒斯德姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of CN103918030A publication Critical patent/CN103918030A/zh
Application granted granted Critical
Publication of CN103918030B publication Critical patent/CN103918030B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H40/00Arrangements specially adapted for receiving broadcast information
    • H04H40/18Arrangements characterised by circuits or components specially adapted for receiving
    • H04H40/27Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95
    • H04H40/36Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving
    • H04H40/45Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving for FM stereophonic broadcast systems receiving
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/16Circuits
    • H04B1/1646Circuits adapted for the reception of stereophonic signals
    • H04B1/1661Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels
    • H04B1/1669Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal
    • H04B1/1676Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal of the sum or difference signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Electromagnetism (AREA)
  • Noise Elimination (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)

Abstract

本公开涉及音频信号处理,尤其涉及一种用于改进FM立体声无线电接收器的音频信号的装置和对应方法。特别地,本公开涉及一种用于可靠地检测所接收的FM立体声无线电信号的质量并且用于基于所检测的质量选择适当处理的方法和系统。描述了一种被配置为估计所接收的多声道FM无线电信号的质量的装置(20)。所接收的多声道FM无线电信号可以表示为中间信号和侧边信号,侧边信号指示左信号与右信号之间的差。装置(20)包括:功率确定单元,其被配置为确定(101)中间信号的功率和侧边信号的功率,中间信号的功率被称为中间功率,侧边信号的功率被称为侧边功率;比率确定单元,其被配置为确定(102)中间功率和侧边功率的比率,从而得到中侧比;以及质量确定单元,其被配置为至少基于中侧比来确定(105)所接收的FM无线电信号的质量指标。

Description

FM立体声无线电信号中的高质量检测
技术领域
本公开涉及音频信号处理,尤其涉及一种用于改进FM立体声无线电接收器的音频信号的装置和对应方法。特别地,本公开涉及一种用于可靠地检测所接收的FM立体声无线电信号的质量并且用于基于所检测的质量选择合适的处理的方法和系统。
背景技术
在模拟FM(调频)立体声无线电系统中,用中-侧(mid-side)(M/S)表示(即,作为中间声道(mid channel)(M)和侧边声道(side channel)(S))来传递音频信号的左声道(L)和右声道(R)。中间声道M对应于L和R的和信号,例如,M=(L+R)/2,侧边声道S对应于L和R的差信号,例如,S=(L-R)/2。为了传输,将侧边信号S调制到38kHz抑制载波上,并且添加到基带中间信号M以形成向后兼容的立体声复用信号。然后使用该复用基带信号调制FM发射器的HF(高频)载波,FM发射器典型地在87.5至108MHz的范围内操作。
当接收质量降低(即,无线电声道上的信噪比降低)时,S声道典型地在传输期间比M声道受损更多。在许多FM接收器实现中,当接收条件有太多噪声时,将S声道静音。这意味着在差HF无线电信号的情况下接收器从立体声退回单声道。
即使在中间信号M具有可接受质量的情况下,侧边信号S也可能是有噪声的,因此当混合在输出信号的左声道和右声道(例如根据L=M+S和R=M-S导出)中时,可能使总体音频质量严重劣化。当侧边信号S仅具有差到中等的质量时,有两个选择:接收器选择接受与侧边信号S相关联的噪声并且输出包括有噪声的左信号和右信号的实际立体声信号,或者接收器丢弃侧边信号S并且退回单声道。
参数化立体声(PS)编码是一种来自极低比特率音频编码领域的技术。PS使得可以将2-声道立体声音频信号编码为单声道下混信号与附加的PS侧边信息(PS参数)相结合。单声道下混信号被获得为立体声信号的两个声道的组合。PS参数使得PS解码器能够从单声道下混信号和PS侧边信息重构立体声信号。典型地,PS参数是时变的和频变的,并且PS解码器中的PS处理典型地在合并有QMF组的混合滤波器组域中执行。文献“Low Complexity Parametric Stereo Coding inMPEG-4”,Heiko Purnhagen,Proc.Digital Audio Effects Workshop(DAFx),pp.163-168,Naples,IT,Oct.2004描述了用于MPEG-4的示例性PS编码系统。它对于参数化立体声(特别是关于参数化立体声参数的确定)的讨论通过引用并入此。参数化立体声受到例如MPEG-4Audio的支持。在MPEG-4标准化文献IS0/IEC14496-3:2005(MPEG_4Audio,第三版)的章节8.6.4以及附录8.A和8.C中讨论了参数化立体声。该标准化文献的这些部分出于所有目的通过引用并入此。在MPEG Surround标准(參见文献IS0/IEC23003-1:2007,MPEGSurround)中也使用了参数化立体声。此外,该文献出于所有目的通过引用并入此。在文献“Binaural Cue Coding-Part1:PsychoacousticFundamentals and DesignPrinciples”,Frank Baumgarte and ChristofFaller,IEEE Transactions on Speech and Audio Processing,vol11,no6,pages509_519,November2003中、以及在文献“Binaural CueCoding-Part I1:Schemes and Applications”,Christof Faller andFrank Baumgarte,IEEE Transaction on Speech and Audio Processing,vol11,no6,pages520-531,November2003中讨论了参数化立体声编码系统的另外的例子。在后两个文献中,使用了术语“双耳线索编码”,其是参数化立体声编码的例子。
在WO2011/029570和PCT/EP2011/064077中已经提出了使用所接收的FM立体声信号的PS编码,以便降低所接收的FM立体声信号的所接收的侧边信号内所包括的噪声。基于参数化立体声(PS)的FM立体声无线电降噪技术的一般原理是使用从所接收的FM立体声信号导出的参数化立体声参数,以便用从中间信号M(例如,M=(L+R)/2)和一个或多个PS参数被参数化地重构的侧边信号的较少噪声版本取代所接收的有噪声的侧边信号S(例如,S=(L-R)/2)。可以通过考虑侧边信号中的所接收的噪声的特征性质(例如,谱平坦度)来改进该技术的性能。此外,WO PCT/EP2011/064084描述了该技术的扩展,该扩展使得可以在接收在单声道与立体声之间来回切换的情况下改进基于PS的FM立体声降噪的性能。以上提及的专利文献的公开内容通过引用并入此。
在本公开中,描述了一种可以用于进一步改进所接收的FM立体声信号的质量的方法和系统。
发明内容
基于PS的FM立体声降噪技术典型地对于在侧边信号遭受中等或高噪声水平的中等或坏接收条件的情况下改进感知声音质量是有益的。另一方面,本公开发现,在侧边信号具有相对低的噪声水平的良好接收条件的情况下,当与未经处理的信号相比时,基于PS的立体声降噪技术的参数化本质可能限制声音质量。因此,提出了在良好接收条件的情况下绕过基于PS的立体声降噪技术。该背景下的问题是可靠地检测这样的高质量(HQ)接收条件,即,绕过基于PS的立体声降噪技术在感知上是有利的条件。
根据一个方面,描述了一种被配置为估计所接收的多声道FM无线电信号的质量的装置。多声道FM无线电信号可以是两声道立体声信号。特别地,所接收的多声道FM无线电信号可以表示为、或者可以呈现为、或者可以指示中间信号和侧边信号。此外,侧边信号可以指示立体声信号的左信号与右信号之间的差。
在一个实施例中,所述装置包括功率确定单元,其被配置为确定中间信号的功率(即,中间功率)和侧边信号的功率(即,侧边功率)。此外,所述装置包括比率确定单元,其被配置为确定中间功率和侧边功率的比率,从而得到中侧比(mid-to-side ratio)。所述装置的质量确定单元可以被配置为至少基于中侧比(MSR)来确定所接收的FM无线电信号的质量指标。换句话讲,所述装置(也可以被称为质量检测单元)可以被配置为通过分析中间信号和侧边信号的能量(或功率)的比率(即,MSR)来确定所接收的FM信号的质量的指标。本公开发现——特别是在侧边信号的能量以预定功率阈值(例如,6dB或5dB或4dB)超过中间信号的能量的情况下——MSR提供所接收的FM信号的信噪比(SNR)的良好逼近。
如以上所指示的,功率确定单元可以被配置为确定中间功率和/或侧边功率。中间信号在时间点n的功率可以被确定为在时间点n附近的多个时间点的中间信号的平方(square)的平均值。换句话讲,在时间点n的中间功率可以被确定为在该时间点n的经平方的中间信号采样的期望值。侧边信号在时间点n的功率可被类似的方式确定。
功率确定单元可以被进一步配置为确定中间信号的多个子带的多个子带中间功率、以及侧边信号的多个对应子带的多个子带侧边功率。中间信号的所述多个子带和侧边信号的所述多个子带可以是使用正交镜像(QMF)滤波器组导出的子带。为了确定可靠的质量指标,仅分析中间信号和侧边信号所覆盖的频率范围的子范围中的中间功率和侧边功率可能是足够的。结果,可以降低用于确定质量指标的计算复杂度。特别地,分析该频率范围的较高部分中的中间功率和侧边功率可能是足够的。甚至更特别地,中间信号和侧边信号可以覆盖直到中频(medium frequency)的低频范围和从中频起的高频范围。中间信号的所述多个子带和侧边信号的所述多个子带可以位于该高频范围内。举例来说,中频可以大于或等于1kHz、2kHz、3kHz、4kHz、5kHz、6kHz、7kHz、8kHz、9kHz、10kHz、11kHz或12kHz。
基于所述多个子带中间功率和所述多个子带侧边功率,比率确定单元可以被配置为确定多个子带中侧比。质量确定单元然后可以被配置为从所述多个子带中侧比确定所接收的FM无线电信号的质量指标。在特定实施例中,质量确定单元被配置为从所述多个子带上的所述多个子带中侧比中的最小值确定所接收的FM无线电信号的质量指标。
作为替代地,质量确定单元可以被配置为对于所述多个子带中侧比根据相应子带所覆盖的频率进行不同加权,从而得到多个加权子带中侧比。为了考虑信号频率范围上的噪声的能量的不均匀分布(典型地由FM无线电传输导致),作为对应子带所覆盖的频率的函数的所述多个子带中侧比的加权可以是有益的。在加权子带中侧比的情况下,质量确定单元可以被配置为从所述多个子带上的所述多个加权子带中侧比中的最小值确定所接收的FM无线电信号的质量指标。
作为替代或除了分析多个子带内的中间功率和侧边功率之外还,功率确定单元可以被配置为确定在接连时间点序列的中间功率序列和对应的侧边功率序列。换句话讲,除了分析在特定时间点n的中间功率和侧边功率(或子带中间功率和子带侧边功率)之外,功率确定单元可以被配置为还确定在多个接连时间点的中间功率和侧边功率(或子带中间功率和子带侧边功率),从而提供中间功率和侧边功率的序列(或多个子带中间功率和子带侧边功率的序列)。
在这样的情况下,比率确定单元可以被配置为从中间功率序列和侧边功率序列确定在该时间点序列的中侧比序列、和/或被配置为从所述多个子带中间功率的序列和所述多个子带侧边功率的序列确定在该时间点序列的多个子带中侧比的序列。通过使用这些MSR值,质量确定单元可以被配置为从中侧比序列和/或从在该时间点序列的多个子带中侧比的序列确定质量指标序列。
为了防止质量指标序列的不规律行为(特别是当从指示低质量FM信号转变为指示高质量FM信号时),可能有益的是从平滑后的中侧比或平滑后的子带中侧比的序列确定质量指标序列。可以通过平滑化沿着所述时间点序列的所述多个子带中侧比的序列中的被选子带中侧比来确定平滑后的子带中侧比的序列。特别地,在每个时间点n,可以选择在这个时间点n的多个子带中侧比中的特定一个(例如,最小MSR值或最小加权MSR值)。可以使用反相峰值衰减函数来执行平滑化。在一个实施例中,通过将在时间点n的平滑后的子带中侧比确定为以下中侧比中的较小者来确定平滑后的子带中侧比的序列:所述时间点序列中的前一时间点n-1的、用衰减因子加权的平滑后的子带中侧比、以及在时间点n的多个子带中侧比中的最小值。
质量确定单元可以被配置为通过归一化在时间点n的中侧比(或者在时间点n通过归一化最小子带中侧比或者通过归一化平滑后的子带中侧比)来确定在时间点n的质量指标。一般来讲,质量确定单元可以被配置为从用于确定质量指标的该一个或多个中侧比的归一化版本来确定质量指标。为了这个目的,可以使用低功率阈值和高功率阈值。举例来说,在时间点n的质量指标可以被归一化为:
其中,q是在时间点n的中侧比(例如,平滑后的子带中侧比),MSR_LOW是低功率阈值,MSR_HIGH是高功率阈值。低功率阈值在对数域中可以小于或等于-4dB、-5dB或-6dB,和/或高功率阈值在对数域中可以大于或等于-5dB、-4dB或-3dB。作为归一化的结果,质量指标可以取预定区间(例如,[0,1])中的值,其中,该区间的一端指示所接收的FM信号的质量低(例如,0),该区间的另一端指示所接收的FM信号的质量高(例如,1)。
以下,描述关于可以如何增强质量指标以便以更高程度的可靠性来指示所接收的FM信号的质量的各种例子/实施例。该各种例子/实施例可被以任意方式组合。
在一个实施例中,质量确定单元被配置为还至少基于谱平坦度度量(SFM)值来确定质量指标,SFM值是侧边信号的谱平坦度的特性。在详细描述中描述了可以如何确定这样的SFM值的例子。侧边信号的谱平坦度典型地是所接收的FM信号内所包括的噪声的程度的指标。典型地,侧边信号的谱平坦度增大使得质量指标减小,即,指示所接收的FM信号的质量降低。特别地,修正后的影响因子(impact factor)可以被确定为:
α′HQ=(1-SFM_impact_factor)*αHQ
其中,SFM_impact_factor是在0至1的范围内的归一化SFM值,其中,0指示侧边信号的谱平坦度的程度低,1指示侧边信号的谱平坦度的程度高;其中,α’HQ是至少基于SFM值和中侧比确定的修正后的质量指标;其中,αHQ是至少基于中侧比确定的质量指标;其中,α’HQ和αHQ在0至1的范围内,其中,0指示低质量,1指示高质量。
在另一实施例中,质量确定单元被配置为还至少基于侧边信号的总功率水平来确定质量指标。典型地,侧边信号的总功率水平降低指示所接收的FM信号内有很小的有效载荷并且噪声相对多。就这点而论,侧边信号的总功率水平降低使质量指标减小。举例来说,修正后的质量指标可以被确定为:
αHQ=ggateαHQ
其中,
其中,Ssum是侧边信号的总功率水平;其中,S_THRES_LOW和S_THRES_HIGH是归一化阈值;其中,α’HQ是至少基于侧边信号的总功率水平和中侧比确定的修正后的质量指标;其中,αHQ是至少基于中侧比确定的质量指标;并且其中,α’HQ和αHQ在0至1的范围内,其中,0指示低质量,1指示高质量。
在另一实施例中,质量确定单元被配置为还至少基于声道电平差(channel level difference)(CLD)参数来确定质量指标。声道电平差参数可以反映或可以对应于左信号的功率与右信号的功率之间的比率。可以如本公开中所描述的那样从FM立体声信号的中间信号和侧边信号确定FM立体声信号的左信号和右信号。特别地,质量确定单元可以被配置为至少从CLD参数的绝对值以及中侧比的和确定质量指标。典型地,CLD参数按对数标度给出。甚至更特别地,在本公开中所概述的用于确定质量指标的方法中,在时间点n的CLD参数的绝对值以及中侧比的和可以取代中侧比。
根据另一方面,描述了一种被配置为从所接收的FM无线电信号产生改进的立体声信号的系统。如所指示的,FM无线电信号典型地指示所接收的左信号和所接收的右信号。所述系统包括被配置为确定所接收的FM无线电信号的质量指标的装置。为了这个目的,所述装置可以包括在本公开中所概述的特征和组件中的任何一个。所述系统被配置为根据或基于所确定的质量指标来产生改进的立体声信号。
在一个实施例中,所述系统包括FM降噪单元,其可以被配置为从所接收的FM无线电信号基于指示所接收的左信号和右信号的相关性和/或差异的一个或多个参数产生降噪的立体声信号。此外,所述系统可以包括被配置为提供所接收的左信号和右信号的旁路(bypass)。所述系统可以被配置为基于所确定的质量指标来选择降噪的立体声信号(或其部分)和/或所接收的左信号和右信号(或其部分)作为改进的立体声信号。为了这个目的,所述系统可以包括组合单元,其被配置为使用质量指标从降噪的立体声信号以及所接收的左信号和右信号确定改进的立体声信号。
FM降噪单元可以被配置为从所接收的FM无线电信号的参数化立体声表示产生降噪的立体声信号;其中,参数化立体声表示包括一个或多个参数化立体声参数。可替代地,FM降噪单元可以被配置为从所接收的FM无线电信号的其他表示(例如,基于预测的表示)产生降噪的立体声信号。此外,FM降噪单元可以被配置为使用在时间点n之前的时间点确定的一个或多个参数化立体声参数(或替代性表示的参数)来隐藏(conceal)在时间点n所接收的FM的立体声信号衰落(dropout)到单声道。FM降噪单元内的隐藏可以指示所接收的FM信号的质量低。因此,所述系统可以被配置为在检测到FM降噪单元内的隐藏的状况下修正质量指标。特别地,可以修正质量指标以确保改进的立体声信号仅选自降噪的立体声信号(而不选自所接收的左信号和右信号)。
此外,FM降噪单元可以被配置为使用质量指标从所接收的FM无线电信号产生降噪的立体声信号。就这点而论,FM降噪单元可以在确定降噪的立体声信号时考虑所接收的FM立体声信号的质量。这可以通过使用质量指标调整指示所接收的左信号和右信号的相关性和/或差异的一个或多个参数来进行。举例来说,FM降噪单元可以被配置为使用基于预测的参数化来确定降噪的立体声信号。在这种情况下,可以使用质量指标来调整基于预测的参数化的预测参数a和b(参见详细描述)。
可替代地或附加地,FM降噪单元可以被配置为从下混信号产生降噪的立体声信号的降噪的侧边信号,所述下混信号是从用下混增益调整的所接收的左信号和右信号的和确定的。下混增益可以指示所接收的左信号和右信号的同相和/或异相行为。可以使用质量指标来调整下混增益。
组合单元可以被配置为使用质量指标来在降噪的立体声信号与所接收的左信号和右信号之间进行融合(blend)。特别地,组合单元可以包括降噪立体声增益单元,其被配置为使用降噪立体声增益对降噪的立体声信号进行加权。此外,组合单元可以包括旁路增益单元,其被配置为使用旁路增益对所接收的左信号和右信号进行加权。另外,组合单元可以包括加法单元,其被配置为将加权的降噪的立体声信号与加权的所接收的左信号和右信号的相应信号相加;其中,降噪立体声增益和/或旁路增益可以取决于质量指标。甚至更特别地,可以在组合单元内将改进的立体声信号的左信号和右信号确定为:
L out R out = α HQ L FM R FM + ( 1 - α HQ ) L PS R PS
其中,LFM、RFM是所接收的左信号和右信号;其中,LPS、RPS是降噪的立体声信号的左信号和右信号;其中,αHQ是在0至1范围内的质量指标,其中,0指示低质量,1指示高质量。
根据另一方面,描述了一种移动通信装置(例如,智能电话或移动电话)。所述移动通信装置包括本公开中所概述的用于改进所接收的FM信号的质量的系统。此外,所述移动通信装置可以包括被配置为接收FM无线电信号的FM立体声接收器。
根据另一方面,描述了一种用于估计所接收的多声道FM无线电信号的质量的方法。所接收的多声道FM无线电信号可以表示为中间信号和侧边信号。此外,侧边信号可以指示左信号与右信号之间的差异。所述方法可以包括确定中间信号的功率和侧边信号的功率,中间信号的功率被称为中间功率,侧边信号的功率被称为侧边功率。此外,所述方法可以包括确定中间功率和侧边功率的比率,从而得到中侧比。另外,所述方法可以包括至少基于中侧比来确定所接收的FM无线电信号的质量指标。
根据另一方面,描述了一种用于从所接收的FM无线电信号产生改进的立体声信号的方法。FM无线电信号可以指示所接收的左信号和所接收的右信号。所述方法可以包括根据本公开中所概述的任何一种方法确定所接收的FM无线电信号的质量指标。此外,所述方法可以包括使用所述质量指标来从所接收的FM无线电信号产生改进的立体声信号。
根据另一方面,描述了一种软件程序。所述软件程序可以适用于在处理器上执行并且适用于当在计算设备上实行时执行本公开中所概述的方法步骤。
根据另一方面,描述了一种存储介质。所述存储介质可以包括适用于在处理器上执行并且适用于当在计算设备上实行时执行本公开中所概述的方法步骤的软件程序。
根据另一方面,描述了一种计算机程序产品。所述计算机程序产品可以包括用于当在计算机上执行时执行本公开中所概述的方法步骤的可执行指令。
应当注意,所述方法和系统(包括如本专利申请中所概述的它们的优选实施例)可以单独使用、或者与在本公开中所公开的其他方法和系统结合使用。此外,本专利申请中所概述的方法及系统的所有方面可以任意组合。特别地,权利要求的特征可被以任意方式互相进行组合。
附图说明
以下參考附图通过例示性例子来说明本发明,其中:
图1例示用于改进FM立体声无线电接收器的立体声输出的示意性实施例;
图2例示基于参数化立体声的概念的音频处理装置的实施例;
图3例示具有PS编码器和PS解码器的基于PS的音频处理装置的另一实施例;
图4例示图3的音频处理装置的扩展版本;
图5例示图4的PS编码器和PS解码器的实施例;
图6例示用于处理所接收的FM无线电信号的改进系统的示例框图;
图7示出有噪声的FM无线电语音信号的中间信号和侧边信号的示例功率谱;
图8示出在对AWGN(加性高斯白噪声)无线电声道进行FM立体声解码之后的示例中间信号和侧边信号噪声谱(假定静音被作为有效载荷信号传输);
图9至12在顶部示图中示出示例最小MSR(中侧比)曲线,并且在底部示图中示出在其内出现MSR的最小值的频带的示例指示;
图13例示用于处理所接收的FM无线电信号的改进方法的示例流程图;以及
图14示出用于PS参数隐藏(concealment)的示例状态机。
具体实施方式
图1示出用于改进FM立体声无线电接收器1的立体声输出的简化的示意性实施例。如在本公开的背景技术部分中所讨论的,在FM无线电中,有意地将立体声信号作为中间信号和侧边信号来传输。在FM接收器1中,使用侧边信号来在FM接收器1的输出处创建左信号L与右信号R之间的立体声差(至少当接收足够好并且侧边信号信息没有被静音时)。换句话讲,使用侧边信号来从中间信号创建左音频信号和右音频信号。左信号L和右信号R可以是数字或模拟信号。
为了改进FM接收器的音频信号L和R,使用音频处理装置2,该音频处理装置2在其输出处生成立体声音频信号L’和R’。使得音频处理装置2能够使用参数化立体声来执行所接收的FM无线电信号的降噪。优选地,在数字域中执行装置2中的音频处理;因此,在FM接收器1与音频处理装置2之间的模拟接口的情况下,在装置2中的数字音频处理之前使用模数转换器。可以将FM接收器1和音频处理装置2集成在同一半导体芯片上,或者可以是两个半导体芯片的一部分。FM接收器1和音频处理装置2可以是无线通信设备(诸如蜂窝电话、个人数字助理(PDA)或智能手机)的一部分。在这种情况下,FM接收器1可以是具有附加的FM无线电接收器功能的基带芯片的一部分。在另一应用中,FM接收器1和音频处理装置2可以是车载音频系统的一部分,以便补偿移动车辆的变化的接收条件。
代替在FM接收器1的输出和装置2的输入处使用左/右表示,在FM接收器1与装置2之间的接口处可以使用中/侧表示(参见图1中用于中/侧表示的M、S和用于左/右表示的L、R)。因为FM接收器1已经接收了中/侧信号并且音频处理装置2可以在不进行下混的情况下直接处理中/侧信号,所以FM接收器1与装置2之间的接口处的这样的中/侧表示可以使得处理负荷降低。如果FM接收器1与音频处理装置2紧密集成,特别是如果FM接收器1和音频处理装置2集成在同一半导体芯片上,中/侧表示可以是有利的。
可选地,可以使用指示无线电接收条件的无线电信号强度信号6来适应音频处理装置2中的音频处理。后面将在本说明书中对此进行说明。
FM无线电接收器1和音频处理装置2的组合对应于具有集成的降噪系统的FM无线电接收器。
图2示出基于参数化立体声概念的音频处理装置2的实施例。装置2包括PS参数估计单元3。参数估计单元3被配置为基于将被改进的输入音频信号(其可以用左/右表示或中/侧表示)来确定PS参数5。除了其他参数之外,PS参数5可以包括指示声道间强度差(IID或者也被称为CLD-声道电平差)的参数、和/或指示声道间互相关(ICC)的参数。优选地,PS参数5是时变的和频变的。在参数估计单元3的输入处的M/S表示的情况下,参数估计单元3仍然可以通过应用L/R声道的合适转换来确定与L/R声道有关的PS参数5。
从输入信号获得音频信号DM。在输入音频信号已经使用中/侧表示的情况下,音频信号DM可以直接对应于中间信号。在输入音频信号具有左/右表示的情况下,可以通过下混音频信号来产生音频信号。优选地,下混之后所得的信号DM对应于中间信号M,并且可以通过下式来产生:
DM=(L+R)/d例如,其中,d=2
即,下混信号DM可以对应于L和R信号的平均值。对于缩放因子d的不同值,L和R信号的平均值被放大或衰减。
该装置还包括也被称为立体声混合模块或立体声上混器的上混单元4。上混单元4被配置为基于音频信号DM和PS参数5来产生立体声信号L’和R’。优选地,上混单元4不仅使用DM信号,而且还使用侧边信号或某些类型的伪侧边信号(未示出)。后面将在本说明书中结合图4和图5中的更扩展的实施例对此进行说明。
装置2基于下述构思:由于其噪声,对于通过简单地组合所接收的中间信号和侧边信号来重构立体声信号而言,所接收的侧边信号的噪声可能太大;尽管如此,在这种情况下,L/R信号中的侧边信号的分量或侧边信号对于PS参数估计单元3中的立体声参数分析可能仍然足够好。然后,可以使用所得的PS参数5来产生与直接在FM接收器1的输出处的音频信号相比噪声水平降低的立体声信号L’、R’。
因此,可以通过使用参数化立体声概念来“清理(clean-up)”差的FM无线电信号。FM无线电信号中的噪声与失真的主要部分位于在PS下混中可能不被使用的侧边声道中。尽管如此,即使在差的接收的情况下,对于PS参数提取,侧边声道的质量常常也是足够的。
在以下图中,音频处理装置2的输入信号是左/右立体声信号。在对音频处理装置2内的一些模块进行较小的修正后,音频处理装置2还可以处理中/侧表示的输入信号。因此,本文中所讨论的概念可以与中/侧表示的输入信号结合使用。
图3示出使用PS编码器7和PS解码器8的基于PS的音频处理装置2的实施例。在这个例子中,参数估计单元3是PS编码器7的一部分,上混单元4是PS解码器8的一部分。术语“PS编码器”和“PS解码器”用作用于描述装置2内的音频处理块的功能的名称。应当注意,音频处理都是在同一FM接收器设备处发生。这些PS编码和PS解码处理可以紧密地联系,术语“PS编码”和“PS解码”仅用于描述音频处理功能的继承。
PS编码器7基于立体声音频输入信号L、R来产生音频信号DM和PS参数5。可选地,PS编码器7还使用无线电信号強度信号6。音频信号DM是单声道下混,优选地,对应于所接收的中间信号。当对L/R声道进行求和以形成DM信号时,在DM信号中不包括所接收的侧边声道的信息。因此,在该情况下,在单声道下混DM中仅包含中间信息。因此,在DM信号中可以不包括来自侧边声道的任何噪声。然而,因为编码器7典型地采取L=M+S和R=M-S作为输入(因此,DM=(L+R)/2=M),所以侧边声道是编码器7中的立体声参数分析的一部分。
随后,在PS解码器8中使用单声道信号DM和PS参数5来重构立体声信号L’、R’(典型地与原始立体声信号L、R相比噪声较少)。
图4示出图3的音频处理装置2的扩展版本。这里,除了单声道下混信号DM和PS参数之外,还将原始接收的侧边信号S0传递到PS解码器8。该方法与来自PS编码的“残差编码”技术类似,并且使得可以在良好但不完美的接收条件的情况下使用所接收的侧边信号S0的至少部分(例如,某些频带)。优选地,在单声道下混信号对应于中间信号的情况下,使用所接收的侧边信号S0。然而,在单声道下混信号不对应于中间信号的情况下,可以使用更一般的残差信号来代替所接收的侧边信号S0。这样的残差信号指示与用原始声道的下混和PS参数来表示原始声道相关联的误差,并且常用于PS编码方案中。以下,对于所接收的侧边信号S0的使用的评论也适用于残差信号。
图5示出图4的PS编码器7和PS解码器8的实施例的细节。PS编码器模块7包括下混产生器9和PS参数估计单元3。例如,下混产生器9可以创建优选地对应于中间信号M的单声道下混DM(例如,DM=M=(L+R)/d),并且可选地还可以产生对应于所接收的侧边信号S0=(L-R)/d的第二信号。
PS参数估计单元3可以将PS参数5估计为L输入与R输入之间的相关性和电平差。可选地,参数估计单元接收信号强度6。可以使用该信息来决定PS参数5的可靠性。在低可靠性的情况下,例如在低信号强度6的情况下,PS参数5可被设定为使得输出信号L’、R’是单声道输出信号或伪立体声输出信号。在单声道输出信号的情况下,输出信号L’等于输出信号R’。在伪立体声输出信号的情况下,可以使用默认的PS参数来产生伪立体声输出信号或默认立体声输出信号L’、R’。
PS解码器模块8包括立体声混合(或上混)矩阵4和去相关器10。去相关器接收单声道下混DM,并且产生用作伪侧边信号的去相关信号S’。可以通过如在引用的文献“Low Complexity Parametric StereoCoding in MPEG-4”的章节4中所讨论的适当的全通滤波器来实现去相关器10。在这个实施例中,立体声混合矩阵4是2×2上混矩阵。
根据所估计的参数5,立体声混合矩阵4a将DM信号与所接收的侧边信号S0或去相关信号S’进行混合以创建立体声输出信号L’和R’。所接收的信号S0与去相关信号S’之间的选择可以取决于指示接收条件的无线电接收指标(诸如信号强度6)。作为代替或附加地,可使用指示所接收的侧边信号的质量的质量指标。这样的质量指标的一个例子是所接收的侧边信号的估计噪声(功率)。在侧边信号包括高程度的噪声的情况下,可以使用去相关信号S’来创建立体声输出信号L’和R’,而在低噪声情形下,可以使用侧边信号S0
优选地,根据以下矩阵等式来执行上混操作:
L ′ R ′ = ϵ β γ δ DM S
这里,加权因子ε、β、γ、δ确定信号DM和S的加权。优选地,下混信号DM对应于所接收的中间信号。该式中的信号S对应于去相关信号S’或所接收的侧边信号S0。可以例如如引用的论文“LowComplexity Parametric Stereo Coding in MPEG-4(参见章节2.2)中所示那样、如引用的MPEG-4标准文献IS0/IEC14496-3:2005(参见章节8.6.4.6.2)中所示那样、或者如MPEG环绕声规范文献IS0/IEC23003-1(参见章节6.5.3.2)中所示那样,导出上混矩阵元素,即加权因子ε、β、γ、δ。这些文献的这些章节(以及这些章节中所引用的章节)出于所有目的通过引用被并入此。就这点而论,可以使用在参数估计单元3内确定的PS参数5来导出加权因子ε、β、γ、δ。
在某些接收条件下,在所传递的侧边信号被静音的情况下,FM接收器1仅提供单声道信号。这将典型地在如下情况中发生:接收条件非常差并且侧边信号的噪声非常大或者因为解调侧边信号所需的19kHz导频音太弱或根本不存在而不能从立体声复用信号解码。在FM立体声接收器1已经切換到立体声无线电信号的单声道重放的情况下,上混单元优选地使用用于盲上混的上混参数(诸如预设的上混参数(或(最新)近期的上混参数)),并且产生伪立体声信号,即,上混单元使用用于盲上混的上混参数来产生立体声信号。还可以存在在太差的接收条件下切换到单声道重放的FM立体声接收器1的实施例。
如在图4的上下文中所概述的,可以使用从PS已知的“残差编码”技术来改进PS解码器8的输出的质量。举例来说,可以使用无线电信号强度6作为指标,以便决定在PS编码器中是否应使用原始接收的侧边信号S0的至少部分来确定立体声信号L’、R’。然而,为了控制原始接收的侧边信号S0的使用而仅使用可以从FM接收器获得的无线电信号强度指标(RSSI)信息的实验表明,RSSI的使用要求相对复杂的系统设计,并且没有实现适当的感知性能。
因此,希望的是提供用于所接收的侧边信号S0的高质量(HQ)接收的检测器,其使得系统设计的复杂度可以降低并且导致感知性能得到改进。特别地,希望的是,HQ接收条件检测器仅采用所接收的立体声信号(即,FM接收器1的输出信号L、R(或M、S))作为输入。此外,这样的HQ接收条件检测器应当是鲁棒的(例如,它应当在各种接收条件下以及针对各种类型的音频信号工作)。此外,应当以改进并且可能优化所实现的整个系统(即,包括与HQ检测器控制的旁路结合的基于PS的立体声降噪的系统)的感知性能的方式来配置HQ接收条件检测器。
图6例示用于处理FM无线电信号的系统50的示例框图。系统50包括PS处理路径15和旁路路径16。PS信号处理路径15包括例如在图1至图5中所描述的PS音频处理装置2(或PS处理单元2)。PS音频处理装置2被配置为从(可能劣化的)所接收的FM立体声信号L、R(或M、S)产生立体声信号L’、R’。将所产生的立体声信号L’、R’传递到PS增益单元31。旁路路径16将所接收的FM立体声信号L、R的副本提供给旁路增益单元30。增益单元30、31在它们的输出处从它们的输入处的立体声信号产生经放大的和/或衰减的立体声信号。在合并单元(例如,加法单元)32中合并该经放大的和/或衰减的立体声信号。合并单元32被配置为组合来自增益单元30、31的对应的信号分量。特别地,合并单元32被配置为组合分别来自增益单元30、31的左信号和右信号。
系统50还包括HQ检测单元20,其被配置为确定或估计所接收的FM立体声信号L、R(或M、S)内的可听噪声的水平。使用在HQ检测单元20内确定的噪声水平估计来在经过PS处理的信号(在PS处理单元2的输出处)与原始(旁路的)信号(来自旁路路径16)之间进行融合。为了融合两个信号路径15、16上的信号,HQ检测单元20可以被配置为设定PS增益单元31和旁路增益单元30的增益值。作为替代地或附加地,可以通过(线性地或非线性地)对两个信号路径15、16上的信号进行插值来实现两个信号路径15、16上的信号的融合。可替代地,可以基于在HQ检测单元20内确定的可听噪声水平的估计来选择两个信号路径15、16上的信号之一。
以下,描述区分(由无线电传输引入的)噪声和实际有效载荷信号的新颖方法。换句话讲,描述如下方法:HQ检测单元20可以如何估计所接收的FM立体声信号内的实际噪声水平,从而决定是更多地着重于PS处理单元2的输出信号(在噪声较高的情况下)、还是更多地着重于旁路信号(在噪声较低的情况下)。
为了区分噪声和实际有效载荷信号,假定如果侧边信号S远强于所接收的中间信号M,则所接收的侧边信号S主要包含噪声。换句话讲,假定如果侧边信号S的功率以预定阈值超过中间信号M的功率,则侧边信号S的功率主要应归于噪声。因此,对于每一个频带k,对于低中侧比(MSR)值,所接收的立体声信号M、S的信噪比(SNR)可以近似为MSR:
MSR_THRESHOLD可以被设为例如-6dB。换句话讲,如果侧边信号S的频带k中的能量的比率超过中间信号M的频带k中的能量预定阈值(例如,+6dB),则可以认为MSR等于或接近于频带k中的SNR,从而提供所接收的FM立体声信号内所包含的噪声的可靠估计。
可以例如从如高效高级音频编码器(HE-AAC)中所使用的正交镜像滤波器组(QMF)分析级导出k=1,…,K个频带,其中,QMF音频数据的K=64个声道用于处理。可选地,可以例如通过使用附加滤波器将较低QMF带划分为更多个带来为QMF组提供进一步增强的频率分辨率。举例来说,可以通过在QMF组的Klow个频带中的每个频带内使用p个附加带通滤波器来将Klow个频带划分为p·Klow个频带(在例子中,Klow=16,p=2)。在作为HE-AAC v2的一部分的PS组件中使用这样的混合滤波器结构。此外,在PS音频处理装置2内也可以使用该混合滤波器结构。这意味着当与执行FM无线电立体声信号的频率分析(诸如在PS音频处理装置2内执行的HE-AAC或HE-AAC v2或PS处理)的编码/解码系统结合使用用于增强所接收的FM无线电信号的本系统50时,可以仅以非常低的附加计算复杂度来确定每一个频带k的MSR。
应当注意,有利地,可以将QMF或混合QMF带分组为与例如不均匀的可察觉激励标度(motivated scale)(例如,Bark标度)相对应的数量减少的频带。就这点而论,可以对于多个频带确定MSR,其中,所述多个频带的分辨率在感知上被激励。举例来说,QMF滤波器组可以包括64个QMF带,或者混合QMF滤波器组可以包括71个带。这些滤波器组的分辨率典型地在高频范围中过高。就这点而论,以感知激励的方式对一些带进行分组可能是有益的。典型地,PS中的参数与这样分组的(感知激励的)频带和按时连续(混合QMF)采样的矢量(即,时间/频率平面中的“贴片(tile)”)相对应。举例来说,可以在与信号帧(在HE-AAC的情况下,包括例如2048个采样)相对应的时间窗口内使用总共20个分组的QMF频带来确定PS参数。也可以使用用于参数化立体声的相同的频带或参数带来确定每一频带/参数带的MSR值,从而降低总体计算复杂度。
可以将对于某一给定时间点n以及对于中间信号M的参数带k的功率计算为期望值:
E { m k 2 } = 1 N Σ n = n 1 n 1 + N - 1 m k , n 2
其中,使用位于时间点或采样n1与n1+N-1之间的矩形窗口。应当注意,可以使用其他窗口形状来确定该期望值。还可以使用替代的时间/频率表示(不同于QMF),诸如离散傅立叶变换(DFT)或其他变换。此外,在这种情况下,可以将频率系数分组为较少的(感知激励的)参数带。
当侧边信号S不比中间信号M强(或者不以因子MSR_THRESHOLD比中间信号M强)时,SNR估计典型地是不可使用MSR获得的。换句话讲,当侧边信号S不比中间信号M强(或者不以因子MSR_THRESHOLD比中间信号M强)时,MSR典型地不是SNR的良好估计。在这种情况下,可以基于SNR的一个或多个以前的估计来确定SNR。这可以以与在用于语音通信的高级降噪系统中进行的方式类似的方式进行,在这些高级降噪系统中,在语音停顿期间测量噪声分布图。举例来说,可以假定:在MSR等于或大于MSR_THRESHOLD的时间点的侧边信号S内的噪声的功率与在MSR小于MSR_THRESHOLD的前一时间点的侧边信号S内的噪声的功率相对应(例如,相等)。可以分别对于每个频带(或参数带)k做该假定。换句话讲,如果在时间点n,侧边信号S的频带k中的能量的比率不以预定阈值超过中间信号M的频带k中的能量则当满足以上提及的条件时,可以将时间点n时的噪声的能量估计为前一时间点时的侧边信号S的频带k中的能量可替代地或附加地,可以通过相邻频带内的侧边信号S的能量来估计频带k中的噪声的能量(可能地,通过侧边信号内的噪声的功率谱的典型斜率来补偿频带k中的噪声的能量)。
如以下将概述的,可以通过应用如在图13的步骤104的上下文中描述的平滑或衰减函数来实现在当MSR值大于或等于MSR_THRESHOLD时在先前时刻的能量值的使用。
图7示出在有噪声的FM无线电接收条件下的中间信号60的功率谱和侧边信号61的功率谱。对于其中中间信号M强势主导的频带,侧边信号是否是噪声是不明确的。侧边信号S可以是例如环境信号的一部分或平移后的信号的一部分。因此,这些频带典型地不提供所接收的FM立体声信号L、R(或M、S)内的噪声的功率的可靠指示。然而,查看其中侧边信号S远强于中间信号M(例如,强至少6dB或几乎10dB)的频带,这可被采用作为侧边信号S内的由无线电传输引起的基本纯噪声的极有可能的指示。可以在图7中在大致2kHz和5kHz处看见这样的情况。就这点而论,可以认为频带k=1,…,K上的MSR的最小值是所接收的FM无线电信号的SNR(即,整个所接收的FM无线电立体声信号的质量)的可靠指标。
当立体声FM发射机将静音作为有效载荷信号发射时,以及当无线电传输声道被建模为具有加性高斯白噪声(AWGN)的声道时,所接收的立体声信号(在FM解调、立体声解码和去加重之后)在中间信号和侧边信号中包含噪声。由于在FM立体声系统中所使用的调频技术,与较低频率相比,对于较高频率在基带中产生更多噪声。因此,在包含侧边信号的基带中的较高的副载波(在38kHz)上产生更多噪声。应当将该基础噪声特性与FM无线电传输系统内所使用的标准化的预加重/去加重系统组合起来,以便补偿该基础噪声特性。结果,获得如图8中所示的中间信号70和侧边信号71的总噪声谱(当假定产生AWGN的无线电传输声道的静音的传输时)。如可以观察到的,侧边信号噪声71典型地超过中间信号噪声70至少10dB(对于高频),并且高达超过30dB(对于低频)。这意味着中间信号中的有效载荷信号应当添加覆盖整个频率范围的大量功率,以便在感知上掩饰来自侧边信号的所有噪声。如果情况并非如此,则侧边信号噪声在所接收的FM无线电立体声信号中典型地将是可听的。
诸如音乐或语音的音频内容典型地在高频范围中比在低频范围中具有更少的有效载荷能量。此外,高频范围中的有效载荷能量可能比低频范围中的有效载荷能量的连续性低。就这点而论,在高频范围内可以比在低频范围内更容易地检测所接收的FM信号的噪声的能量。鉴于此,将MSR的分析限于总共K个频带中所选的子范围可能是有益的。特别地,将MSR的分析限于总共K个频带的上部子范围(例如,K个频带的上半部分)可能是有益的。就这点而论,可以使得用于检测所接收的FM信号的质量的方法更加鲁棒。
鉴于以上,可以定义取决于频带k=1,…,K中的一些或全部上(例如,高频带上)的MSR分析的高质量因子αHQ。可以使用高质量因子αHQ作为所接收的FM无线电立体声信号内的可听噪声的指标。没有噪声的高质量信号可以用αHQ=1指示,具有高噪声的低质量信号可以用αHQ=0指示。中间质量状态可以用0<αHQ<1指示。可以根据下式从MSR值导出高质量因子αHQ
其中,MSR阈值MSR_LOW和MSR_HIGH是预定的归一化阈值,并且在例子中可以分别被选择为-6dB和-3dB。作为这样的归一化的结果,确保高质量因子αHQ取0与1之间的值。
在上式中,q是从一个或多个MSR值导出的值。如以上所指示的,可以从频带的子集上的最小MSR值导出q。此外,可以将q设为最小MSR值的反相峰值衰减值。可替代地或附加地,可以使用任何其它的平滑方法来平滑化质量指标参数q在时间上的进展。
高质量因子αHQ可以用于在PS处理路径15上的经过PS处理的立体声信号与旁路路径16上的原始未经处理的FM无线电立体声信号之间的切换或淡入淡出(fading)或插值。示例性淡入淡出公式由下式给出:
L out R out = &alpha; HQ L FM R FM + ( 1 - &alpha; HQ ) L PS R PS .
这意味着高质量因子αHQ可以用作用于旁路增益单元30的增益,而因子(1-αHQ)可以用作用于PS增益单元31的增益。
可以通过图13中所示的以下步骤来描述HQ检测算法100的实施例:
·在步骤101中,对于频带k(例如,Klow<k≤Khigh)中的一些或全部,计算中间信号功率和侧边信号功率,即,确定中间信号的能量和侧边信号的能量在例子中,Khigh=K并且Klow=K/2(即,仅考虑频带的上半部分)。在时间点n,例如使用以上提供的期望值的平均化公式来确定中间功率和侧边功率
·在步骤102中,确定对于频带k中的一些或全部的中侧比(MSR)值,例如,将其确定为
·在步骤103中,确定某一频率范围的最小MSR值其中,该频率范围为例如Klow<k≤Khigh
y在步骤104中,例如通过将MSR峰值确定为
γpeak(n)min(κγpeak(n-1),γmin)在时间上平滑化最小MSR值,其中,衰减因子为κ=exp(-1/(Fsτ)),时间常数为例如τ=2秒,Fs为采样频率(例如,帧率,即,多频繁地执行步骤104的速率)。这实现了在时间上平滑化最小MSR值的反相峰值衰减函数。
·在步骤105中,通过使用时间点n时的MSR峰值γpeak(n)(即,通过使用时间点n时的平滑后的最小MSR值)来将时间点n时的高质量因子αHQ确定为:
其中,q=γpeak(n),如以上所指示的,可以将MSR阈值设为例如MSR_LOW=-6dB,MSR_HIGH=-3dB。
·在步骤107中,可以例如通过如下设定将时间点n时的高质量因子αHQ应用于图6中所示的PS处理/旁路融合处理:
L out R out = &alpha; HQ L FM R FM + ( 1 - &alpha; HQ ) L PS R PS .
可以对于接连时间点迭代地重复以上提及的HQ检测算法100(用从步骤107回到步骤101的箭头例示)。
可以通过使高质量因子αHQ(除一个或多个MSR值之外)还取决于一个或多个另外的噪声指标来进一步改进用于确定所接收的FM无线电立体声信号的高质量的方法或系统。特别地,可以使高质量因子αHQ取决于所接收的FM无线电立体声信号的谱平坦度度量(SpectralFlatness Measure,SFM)。如WO PCT/EP2011/064077中所概述的,可以确定在0与1之间被归一化的所谓的SFM_impact_factor。SFM_impact_factor=0可以对应于低SFM值,低SFM值指示其谱功率集中于相对少量的频带中的侧边信号S的功率谱。即,SFM影响因子“0”指示低噪声水平。另一方面,SFM影响因子“1”对应于高SFM值,高SFM值指示谱在所有谱带中具有类似的功率量。因此,SFM影响因子“1”指示高噪声水平。
可以根据下式来确定修正后的高质量因子α’HQ
αHQ′=(1-SFM_impact_factor)*αHQ
从而如果SFM_impact_factor=1(指示所接收的FM无线电立体声信号内的高噪声水平),则强调高质量因子α’HQ=0(指示低质量,即,高噪声程度),反之亦然。应当注意,以上提及的用于组合基于MSR的高质量因子αHQ和SFM的效果的公式仅仅是将这两个噪声指标组合为联合的(修正后的)高质量因子α’HQ的一种可能的方式。SFM_impact_factor对于检测其中中间信号和侧边信号都具有相当平坦的谱并且在能量上接近的噪声情况可以是有益的。在这样的情况下,尽管在所接收的FM无线电立体声信号内有大量可听噪声,但是最小MSR值γmin典型地接近于0dB。在上述PS处理/旁路融合处理中,修正后的高质量因子α’HQ可以取代高质量因子αHQ
以下,概述用于确定SFM_impact_factor的例子。在典型的所接收的FM无线电立体声信号中,中间信号M的功率谱在低频范围中相对陡峭且能量水平高。另一方面,侧边信号S典型地具有总体低程度的能量和相对平坦的功率谱。
因为侧边信号噪声的功率谱相当平坦并且具有特征斜率,所以可以将SFM和斜率补偿一起用于估计所接收的FM信号内的噪声水平。可以使用不同类型的SFM值,即,可以以各种方式计算SFM值。特别地,可以使用瞬时SFM值以及该SFM的平滑化版本。瞬时SFM值典型地对应于侧边信号的信号帧的SFM,而瞬时SFM值的平滑化版本还取决于侧边信号的先前信号帧的SFM。
用于从侧边信号确定影响因子的方法可以包括确定侧边信号的功率谱的步骤。典型地,这使用侧边信号的某一数量的采样(例如,信号帧的采样)来进行。对于多个频带k(例如,k=1,…,K),可以将功率谱确定为侧边信号的能量值可以使功率谱的确定时间段与用于确定PS参数的时间段一致。就这点而论,可以对于对应PS参数的有效时间段确定侧边信号的功率谱。
在随后步骤中,可以补偿侧边信号噪声的功率谱的特征斜率。可以(在设计/调谐阶段)通过实验(例如,通过确定一组单声道信号的侧边信号的平均功率谱)来确定特征斜率。可替代地或附加地,可以(例如,使用当前侧边信号的功率谱上的线性回归)从当前侧边信号自适应地确定特征斜率。可以通过逆噪声斜率滤波器来执行特征斜率的补偿。结果,应当获得经斜率补偿的、可能平坦的功率谱,该功率谱不表现出单声道语音音频信号的侧边信号的功率谱的特征斜率。
使用(经斜率补偿的)功率谱,可确定SFM值。可根据下式计算SFM:
SFM = ( &Pi; k = 0 N - 1 E { s k 2 } ) 1 / N 1 N &Sigma; k = 0 N - 1 E { s k 2 }
其中,表示频带k中(例如,混合滤波器组带k中)的侧边信号的功率。示例PS系统中所使用的混合滤波器组由64个QMF带组成,其中,将3个最低的频带进一步划分为4+2+2个频带(因此,N=64-3+4+2+2=69)。可以将SFM描述为功率谱的几何平均与功率谱的算术平均之间的比率。
可替代地,可以在谱的仅包括范围从Klow至Khigh的混合滤波器组带的子集上计算SFM。以这种方式,可以排除第一带中的一个或几个,以便移除不想要的DC(例如,低频)偏移。当调整带边界时,应当相应地修订以上提及的用于计算SFM的公式。
出于限制计算复杂度的原因,可以可替代地用SFM公式的基于例如泰勒展开式、查找表或软件实现领域的专家通常已知的类似技术的数值近似来取代SFM公式。此外,还存在测量谱平坦度的其他方法,诸如例如频率功率区间的最小值与最大值之间的标准偏差或差等。在本文献中,术语“SFM”表示这些度量中的任何一个。
通过使用侧边信号的特定时间段或帧的SFM值,可以确定影响因子。出于这个目的,映射SFM,例如,将SFM映射到0至1的标度上。可以根据下式来执行SFM影响因子的映射和确定:
SFM _ impact _ factor = 0 , SFM < &alpha; low _ thresh SFM - &alpha; low _ thresh &alpha; high _ thresh - &alpha; low _ thresh , &alpha; low _ thresh &le; SFM &le; &alpha; high _ thresh 1 , SFM > &alpha; high _ tjresh
其中,根据典型地为0.2至0.8的SFM值的平均范围来选择两个阈值αlow_thresh和αhigh_thresh。归一化级的主要目的是确保SFM影响因子有规律地跨越“0”与“1”之间的整个区域。就这点而论,归一化确保“正常的”不平坦谱(SFM<αlow_thresh)不被检测为噪声,并且测量对于高值(SFM>αlow_thresh)是饱和的。换句话讲,归一化提供了更清楚地区分高噪声情况(SFM>αlow_thresh)和低噪声情况(SFM<αlow_thresh)的影响因子。
以下,描述用于增强本公开中所概述的用于HQ检测的方法和系统的另一选项。可以通过使高质量因子αHQ受作为软噪声门(soft noisegate)的总侧边水平Ssum影响来确定修正后的高质量因子α’HQ,Ssum即为可被确定为侧边信号(在所有频带上)的能量的侧边信号的总水平(即,能量或功率)。就这点而论,可以根据下式来确定修正后的高质量因子α’HQ
αHQ=ggateαHQ
其中,
可以使用阈值S_THRES_LOW和S_THRES_HIGH来将门因子ggate归一化为0与1之间的值。具有水平为Ssum<S_THRES_LOW的侧边信号的FM信号被认为是低质量,而具有水平为Ssum>S_THRES_HIGH的侧边信号的FM信号可以是高质量。
用于提供增强的HQ检测算法的另一选项是使高质量因子αHQ受例如在WO PCT/EP2011/064084中所描述的隐藏检测器的输出的影响。可以通过考虑在PS处理路径15内隐藏(concealment)是否起作用来确定修正后的高质量因子α’HQ,以便隐藏FM接收器的不希望的单声道衰落(dropout)情况。可以根据α′HQ=(1-δconcealHQ来确定修正后的高质量因子α’HQ,其中,如果隐藏起作用,则δconceal=1,否则δconceal=0。这意味着,如果隐藏在PS处理单元2内起作用,则所接收的FM无线电信号被肯定地认为是低质量(α’HQ=0),否则基于高质量因子αHQ的计算值来估计所接收的FM无线电信号的质量。为了避免当从隐藏状态(即,δconceal=1)恢复时的(可听)间断,即,为了确保修正后的高质量因子α’HQ从0平滑地转变到非零值,可以每当δconceal=1时就强制最小MSR值γmin为γmin=MSR_LOW,以使得通过图13的步骤104的平滑方法来确保平滑转变。作为使高质量因子取决于隐藏状态δconceal的结果,可以实现到PS模式的快速切换(即,到对于差接收条件的突然发生的FM立体声降噪处理的快速转变)、以及回到旁路模式的缓慢融合(在接收条件得到改进的情况下)。
PS处理单元2内的隐藏的使用要求对于单声道衰落的可靠检测,以便触发隐藏,即,以便将隐藏状态δconceal从0设为1。可能的单声道/立体声检测器可以基于检测满足条件左信号=右信号(或左信号-右信号=0)的信号的单声道部分。然而,由于左信号能量和右信号能量以及侧边信号能量甚至在健康接收条件下仍可能波动很大的事实,这样的单声道/立体声检测器将导致隐藏处理的不稳定的行为。
为了避免隐藏的这样的不稳定行为,可以将单声道/立体声检测和隐藏机制实施为状态机。在图14中例示了示例状态机。图14的状态机使用侧边信号S的绝对能量(即,Es)(或如以上定义的PS)的两个参考水平。用于计算Es的侧边信号S可能已经被以典型地为250Hz的截止频率进行了高通滤波。这些参考水平是上参考水平ref_high和下参考水平ref_low。大于上参考水平(ref_high),信号被认为是立体声,低于参考水平(ref_low),信号被认为是单声道。
将侧边信号能量Es计算为状态机的控制参数。可以在可以例如与PS参数的有效时间段相对应的时间窗口上计算Es。换句话讲,确定侧边信号能量的频率可以与确定PS参数的频率一致。在本公开中,用于确定侧边信号能量Es(以及,可能的PS参数)的时间段被称为信号帧。图14的状态机包括5个条件,每次计算新帧的能量Es时对这5个条件进行验证:
-条件A指示侧边信号能量Es超过上参考水平ref_high。上参考水平可以被称为高阈值。
-条件B指示侧边信号能量Es小于或等于上参考水平ref_high并且大于或等于下参考水平ref_low。下参考水平可以被称为低阈值。
-条件B1对应于条件B,但是添加了附加的时间条件。该时间条件规定对于其数量小于阈值数量的帧或小于阈值时间的时间,条件B被满足。该阈值可以被称为帧阈值。
-条件B2对应于条件B,具有附加的时间条件,该时间条件规定对于其数量大于或等于阈值数量的帧或者大于或等于阈值时间的时间,条件B被满足。
-条件C指示侧边信号能量Es小于下参考水平ref_low。
此外,图14的示例状态机使用5种状态。这些不同状态是在经受以上提及的条件以及经受图14中例示的状态图的情况下被达到的。在PS处理单元2内在不同状态下典型地执行以下动作:
-在状态1下,例如基于从当前音频信号确定的PS参数来执行正常的立体声操作。隐藏状态δconceal保持为0。
-在状态2下,基于根据当前音频信号确定的PS参数来执行正常的立体声操作。鉴于以下事实,该状态仅仅是过渡性的:对于其数量大于或等于帧阈值的帧或者对于大于或等于时间阈值的时间,条件B(即,条件B2)被满足,或者在该帧数过去或该时间过去之前,条件A或C被满足。隐藏状态δconceal保持为0。
-在状态3下,基于根据当前音频信号确定的PS参数来执行立体声操作。可以看出,在从状态1经由状态2到状态3的路径上达到状态3。鉴于条件B2需要用于该转变的最少帧数或最小时间量的事实,路径“状态1、状态2、状态3”表示从正常立体声操作(例如,音乐)到正常单声道操作(例如,语音)的缓慢的(即,平滑的)转变。隐藏状态δconceal被设为或保持为0。
-在状态4下,使用先前确定的PS参数(例如,在状态1下确定最近的PS参数)来开始单声道衰落隐藏。可以看出,如果满足条件C,即,如果侧边信号能量Es陡峭地从大于ref_high降至低于ref_low,则可以从状态I直接到达状态4。可替代地,可以从状态1经由状态2到达状态4,然而,这只有在仅对于少量帧或仅对于短时间段条件B被满足的情况下才发生。就这点而论,路径“状态1、状态4”和“状态1、状态2、状态4”表示从正常的立体声操作(例如,音乐)到强制单声道操作的快速的(即,突然的)转变。强制单声道操作典型地是由FM接收器在侧边信号中的噪声水平超过预定的水平时突然切断侧边信号而引起的。隐藏状态δconceal被设为1,以便指示PS处理单元2内使用隐藏。
-在状态5下,例如基于在状态4中已经建立的PS参数来继续单声道衰落隐藏。在例示的实施例中,如果满足条件C,则仅能够从状态4到达状态5,即,状态5表示稳定的单声道衰落隐藏状态,其中为了从中间信号产生立体声音频信号,使用先前确定的PS参数。PS参数可以以数秒的时间常数衰减到单声道。隐藏状态δconceal典型地保持为1。
如已经指示的,所例示的状态图确保:仅当FM接收器接收的音频信号在数个时间窗口内从立体声转变为单声道(即,从立体声到单声道的转变是突然的)时,才触发隐藏。另一方面,在其中能量Es低于立体声水平(ref_high)、而高于单声道水平(ref_low)的侧边信号中存在噪声的情况下,即,在侧边信号内仍存在足以产生适当PS参数的信息的情况下,防止触发隐藏。同时,即使当信号从立体声变为单声道时,例如当信号从音乐转变到语音时,也将不会触发隐藏检测,从而确保没有因隐藏的错误应用而将原始的单声道信号呈现为伪立体声信号。可以基于侧边信号能量Es的从大于ref_high到低于ref_low的平滑转变来检测从立体声到单声道的真实转变。
以下,描述用于增强本公开中所概述的HQ检测方法的另一选项。可以根据下式针对大的声道电平差(CLD)来调整MSR值γk
&gamma; &prime; k = &gamma; k + | CLD | = 10 log 10 ( P k M P k S ) + | CLD | .
CLD参数是指示所接收的FM无线电立体声信号的平移(pan)程度的PS参数。可以例如根据下式从所接收的左侧边信号L和所接收的右侧边信号R的能量的比率来确定CLD参数:
CLD = 10 &CenterDot; log 10 ( P L P R ) ,
其中,PL=E{L2}是所接收的左侧边信号的能量或功率,PR=E{R2}是所接收的右侧边信号的能量或功率。因此,对于在左侧边信号L与右侧边信号R之间有很大的能量差的严重平移的信号,MSR值γk增大。L信号与R信号之间的这样的重大差别导致侧边信号S具有相对高的能量,即使测量信号S不包括噪声。通过增大MSR值γk,最小MSR值γmin增大,从而增大高质量因子αHQ。因此,CLD参数的使用帮助避免由于宽(音乐)立体声混合和立体声加宽后处理而导致的强侧边信号S的低质量信号的错误检测。
用于增强本公开中所概述的HQ检测方法的另一选项是根据下式使高质量因子αHQ受PS下混增益影响:
g′dmx=αHQgdmx+(1-αHQ)·1
如以上所概述的,在PS处理单元2中,可以使用下混信号DM来从下混信号DM产生重构的左信号L’和右信号R’。为了这个目的,可以使用PS下混增益gdmx来对下混信号进行能量补偿,以使得PS下混增益gdmx可以是时变的和/或频变的。可以使用PS下混增益gdmx来实现例如在HE-AAE v2编码器中所使用的经过能量补偿的下混。典型地,使用PS下混增益gdmx来补偿左信号L和右信号R的同相或异相行为。可以使用PS下混增益gdmx来确保下混信号DM的电平(或能量或功率)对应于(例如,等于)右信号R的电平和左信号L的电平的和。可以使PS下混增益gdmx限于最大增益值(在左信号L和右信号R强烈异相的情况下)。
以上提及的用于根据质量指标αHQ修正PS下混增益gdmx的公式意味着,当使用根据以上提及的公式被修正的下混增益gdmx时,当侧边信号包括低程度的噪声(αHQ接近1)并且收敛到用于有噪声的信号的固定下混增益(因子为1)时(当能量补偿因子的可靠性较低时),在更大程度上使用经过能量补偿的下混方案。换句话讲,如果所接收的FM信号包括高程度的噪声,则提出不依赖于(或较少地依赖于)所确定的PS下混增益gdmx。例如在HE-AAC v2编码器中可以使用修正后的下混增益g’dmx
类似地,可以使用高质量因子αHQ来调整预测限制值(即,调整基于预测的FM立体声无线电降噪方案中的参数a和b)。如PCT/EP2011/064077中所概述的,可以从以下上混处理确定用于确定重构的侧边信号Sp的替代PS参数化:
Sp=a*DM+b*decorr(DM),L'=DM+Sp,R'=DM-Sp
其中,DM是下混信号,“a”和“b”是两个新的PS参数,decorr()是上混单元4中所使用的去相关器(典型地是全通滤波器)。该替代表示可以被称为基于预测的方案,因为侧边信号是从DM信号预测的。可以使用高质量因子αHQ来调整参数a和b。
在基于预测的FM立体声降噪方案中,可以在a’=a/c并且b’=b/c的情况下使用预测参数a和b的限制函数,其中,c是限制因子,并且其中,c=1导致未经修正的参数a和b。值c>1使得经降噪的侧边信号Sp与1/c相乘(即,以因子c衰减)。
从a和b计算限制因子c的不同方法(即,c=f(a,b))是可能的。两种可能的方法是:
c=max(1,(a2+b2)),或(1)
c = max ( 1 , ( a 2 + b 2 ) ) - - - ( 2 )
以与使质量因子αHQ限制PS下混增益gdmx的动态的方式类似的方式,可以使限制因子c受质量指标αHQ影响。这可以例如根据下式来进行:
c = max ( 1 , ( a 2 + b 2 ) ( 1 - &alpha; HQ + &epsiv; ) )
其中,ε是可选的调整值(小的数),该调整值防止在质量指标αHQ=1时(即,当所接收的FM信号包括低程度的噪声时)a和b无限大(或为不合理地大的数)。
这样的限制函数c=f(a,b,αHQ)的目的是对于低质量FM信号(αHQ接近于零)限制a和b,而对于高质量FM信号(αHQ接近于1)不限制(或仅轻微限制)a和b。应当注意,以上提及的用于根据质量因子αHQ来修正限制因子的函数对于αHQ=0近似为c的第一函数(1),对于αHQ=0.5近似为第二函数(2),对于αHQ=1,执行对于参数a和b的“不限制”。此外,应当注意,以上提及的公式仅仅是实现考虑了所接收的FM信号的质量的修正的限制函数的一个例子。
应当注意,以上提及的选项可以独立使用或者彼此任意地组合地使用。
在图9至图12中进一步举例说明了基于一个或多个MSR值的HQ检测方法。在这些图中,上部绘图85示出在时间点序列上的最小MSR值γmin82(实线)。最小MSR值γmin已经从典型PS系统的20个频带k中的上部10个频带确定。此外,示出了最小MSR值γmin82的序列的反相峰值衰减函数γmin(n)83(虚线)。参考MSR水平MSR_LOW=-6dB(标号81)和MSR_HIGH=-3dB(标号80)被标记为点线。
在这些例子中,小于-6dB的MSR值指示可听噪声,大于-3dB的MSR水平指示没有可听噪声(即,“高质量”)。使用以上提及的方法和公式来导出这些参考水平之间的中间分数的高质量因子αHQ
下部绘图86指示在其内已经确定最小MSR值82的频带k84(在本例子中,在10与20之间)。此外,如果频带k中的最小MSR大于MSR_HIGH,则可以用点87来例示它。
在图9中,所接收的FM无线电信号具有非常低的最小MSR值82,在较高频带内尤其如此。这是因为该信号包含仅具有适中量的高频能量的古典管弦乐。因此,该古典管弦乐没有很好地掩饰来自侧边信号的高频噪声。在图9的例子中,最小MSR值从未达到超过下阈值MSR_LOW,因此,该信号在任何给定时间点都被HQ检测算法100被分类为非HQ(即,αHQ=0)。
在图10中,绘图85和86示出语音信号的典型行为。最小MSR值82在语音停顿期间非常低,否则典型地由于无线电内容中的语音的响亮混合而相当高。该例子清楚地例示了使用沿着时间的平滑(例如,使用反相峰值衰减函数)的益处。该平滑具有记忆功能,其使HQ估计保持低,从而防止PS处理路径15(静音期间)与旁路路径16(语音传输期间)之间轮转。这样的轮转将导致不希望的声学效果。
在图11中,绘图85和86示出流行音乐的HQ接收的典型行为。由于流行音乐的立体声宽度广,因此图11中的最小MSR值82有时接近于0dB,但是因为流行音乐通常在中间信号中也包括大量高频能量(从而掩饰高频带中的任何噪声),所以最小MSR值82几乎不低于0dB。在图11的例子中,最小MSR值82从未达到上阈值MSR_HIGH以下,因此,该信号在任何给定时刻都被分类为HQ(即,αHQ=1)。就这点而论,沿着旁路路径16将所接收的FM信号传递给输出。主观质量评价表明,与PS处理路径15内的信号处理相比,这导致感知质量得到改进。
在图12中,绘图85和86示出当所接收的FM信号在隔离的时间点(尤其是在6-8秒附近的时间点)包括可听噪声时的行为。可以看出,最小MSR值82的反相峰值衰减版本83确保当所接收的FM信号因噪声而劣化时快速地切换到非HQ估计。另一方面,最小MSR值82的反相峰值衰减版本83确保通过低阈值和高阈值朝着HQ估计的平滑转变。为了最大化噪声抑制、但是同时最小化来自PS到旁路转变的伪像,此行为(即,响应于噪声突发快速地反应(因此应用在路径15上的PS处理)、但是缓慢地衰退回在路径16上的旁路模式的行为)典型地是希望的。
在本公开中,已经描述了一种用于改进FM无线电接收器的感知性能的方法和系统。该方法包括PS处理路径和并行的旁路路径。根据估计的所接收的FM无线电信号的质量,从PS处理路径和/或从并行的旁路路径选择输出信号。为了确保PS处理路径与并行的旁路路径之间的平滑转变,提出了这两个路径的输出信号的融合。结果,可以改进FM无线电信号的总体感知质量。
描述了使得可以可靠地估计所接收的FM无线电信号的质量的高质量(HQ)检测方案。该HQ检测方案通过(在时间/频率-平面中)查找所接收的FM无线电信号的其中侧边信号比中间信号强得多的侧边信号的部分,来估计所接收的FM无线电信号中的噪声水平或SNR(或区分噪声分量和信号分量)。SNR的估计可以是在单独频带中(例如,在QMF组或QMF组中的分组频带中)进行的。可以不同地对从不同频带得到的多个SNR估计进行加权,和/或可以排除一些频带。为了确保SNR估计的平滑进展,如果没有新的估计值可用,则可以使用旧的SNR估计(通过例如平滑化或峰值保持/衰减)。可以使用SNR估计来确定作为所接收的FM无线电信号的质量的指标的HQ因子。特别地,可以使用最小估计SNR值来确定HQ因子。可以使用该HQ因子来控制PS处理路径上的经过(降噪)处理的信号与被旁路的信号之间的混合。此外,可以使用HQ因子来控制PS编码器中的下混增益,或者控制基于预测的降噪系统中的预测限制因子。除了SNR估计之外,HQ因子还可以考虑以下参数中的任何一个:SFM、单声道隐藏检测状态、和/或绝对侧边电平。
本公开中所描述的方法和系统可以被实现为软件、固件和/或硬件。某些组件可以例如被实现为在数字信号处理器或微处理器上运行的软件。其他组件可以例如被实现为硬件和/或专用集成电路。在所描述的方法和系统中遇到的信号可以被存储在诸如随机存取存储器或光学存储介质的介质上。它们可以经由诸如无线电网络、卫星网络、无线网络或有线网络(诸如互联网)的网络来传送。使用本公开中所描述的方法和系统的典型设备是用于存储和/或呈现音频信号的便携式电子设备或其他消费者设备。

Claims (33)

1.一种被配置为估计所接收的FM无线电信号的质量的装置(20);其中,所接收的FM无线电信号能够表示为中间信号和侧边信号;其中,侧边信号指示左信号与右信号之间的差;所述装置(20)包括:
-功率确定单元,所述功率确定单元被配置为确定(101)被称为子带中间功率的中间信号的多个子带的多个功率和被称为子带侧边功率的侧边信号的多个对应子带的多个功率;
-比率确定单元,所述比率确定单元被配置为确定(102)作为多个子带中间功率与多个子带侧边功率的比率的多个子带中侧比;和
-质量确定单元,所述质量确定单元被配置为至少基于所述多个子带中侧比来确定(105)所接收的FM无线电信号的质量指标。
2.根据权利要求1所述的装置(20),其中,所述质量确定单元被配置为从所述多个子带上的所述多个子带中侧比之中的最小值确定所接收的FM无线电信号的质量指标。
3.根据权利要求1所述的装置(20),其中,所述质量确定单元被配置为:
-根据各子带所覆盖的频率对所述多个子带中侧比进行不同加权,从而得到多个加权子带中侧比;和
-从所述多个子带上的所述多个加权子带中侧比之中的最小值确定所接收的FM无线电信号的质量指标。
4.根据权利要求1至3中的任何一个所述的装置(20),其中,所述中间信号的多个子带和所述侧边信号的多个子带是使用正交镜像滤波器组导出的子带。
5.根据权利要求1至3中的任何一个所述的装置(20),其中:
-所述中间信号和所述侧边信号覆盖直到中频的低频范围和从中频起的高频范围;并且
-所述中间信号的多个子带和所述侧边信号的多个子带位于所述高频范围内。
6.根据权利要求5所述的装置(20),其中,所述中频大于或等于1kHz、2kHz、3kHz、4kHz、5kHz、6kHz、7kHz、8kHz、9kHz、10kHz、11kHz或12kHz。
7.根据权利要求1-3中任何一个所述的装置(20),其中:
-中间信号在时间点n的功率被确定为在所述时间点n附近的多个时间点的中间信号的平方的平均值;并且
-侧边信号在时间点n的功率被确定为在所述时间点n附近的多个时间点的侧边信号的平方的平均值。
8.根据权利要求1-3中任何一个所述的装置(20),其中:
-所述功率确定单元被配置为确定在接连时间点序列的中间功率序列和对应的侧边功率序列;
-所述比率确定单元被配置为从中间功率序列和侧边功率序列确定在所述时间点序列的中侧比序列;并且
-所述质量确定单元被配置为从所述中侧比序列确定质量指标序列。
9.根据权利要求8所述的装置(20),其中:
-所述功率确定单元被配置为确定在接连时间点序列的多个子带中间功率的序列和对应的多个子带侧边功率的序列;
-所述比率确定单元被配置为从所述多个子带中间功率的序列和所述多个子带侧边功率的序列确定在所述时间点序列的多个子带中侧比的序列;并且
-所述质量确定单元被配置为从平滑后的子带中侧比的序列确定质量指标序列;其中,所述平滑后的子带中侧比的序列通过沿着所述时间点序列平滑化所述多个子带中侧比的序列中所选择的子带中侧比而确定。
10.根据权利要求9所述的装置(20),其中,使用反相峰值衰减函数来执行平滑化。
11.根据权利要求10所述的装置(20),其中,通过将在时间点n的平滑后的子带中侧比确定为以下中侧比中的较小者来确定平滑后的子带中侧比的序列:
-在所述时间点序列中的前一时间点n-1的、用衰减因子加权的平滑后的子带中侧比;以及
-在时间点n的所述多个子带中侧比之中的最小值。
12.根据权利要求11所述的装置(20),其中,所述质量确定单元被配置为从在时间点n的平滑后的子带中侧比,通过使用低功率阈值和高功率阈值对该平滑后的子带中侧比进行归一化,来确定在时间点n的质量指标。
13.根据权利要求12所述的装置(20),其中,在时间点n的质量指标被确定为:
其中,q是在时间点n的平滑后的子带中侧比,MSR_LOW是低功率阈值,MSR_HIGH是高功率阈值。
14.根据权利要求12至13中的任何一个所述的装置(20),其中:
-所述低功率阈值在对数域中小于或等于-4dB、-5dB或-6dB;并且
-所述高功率阈值在对数域中大于或等于-5dB、-4dB或-3dB。
15.根据权利要求1-3中任何一个所述的装置(20),其中,所述质量确定单元被配置为进一步至少基于谱平坦度量度SFM值来确定质量指标,所述SFM值是侧边信号的谱平坦度的特性。
16.根据权利要求15所述的装置(20),其中,所述侧边信号的谱平坦度增大使得质量指标减小。
17.根据权利要求16所述的装置(20),其中,
α′HQ=(1-SFM_impact_factor)*αHQ
其中:
-SFM_impact_factor是在0至1范围内的归一化后的SFM值,其中,0指示低程度的谱平坦度,1指示高程度的谱平坦度;
-α’HQ是至少基于SFM值和中侧比确定的质量指标;
HQ是至少基于中侧比确定的质量指标;和
-α’HQ和αHQ在0至1范围内,其中,0指示低质量,1指示高质量。
18.根据权利要求1-3中任何一个所述的装置(20),其中,所述质量确定单元被配置为进一步至少基于侧边信号的总功率水平来确定质量指标,其中,所述侧边信号的总功率水平降低使质量指标减小。
19.根据权利要求18所述的装置(20),其中,
α′HQ=ggateαHQ
其中,
其中,
-Ssum是侧边信号的总功率水平;
-S_THRES_LOW和S_THRES_HIGH是归一化阈值;
-α’HQ是至少基于侧边信号的总功率水平和中侧比确定的质量指标;
HQ是至少基于中侧比确定的质量指标;和
-α’HQ和αHQ在0至1范围内,其中,0指示低质量,1指示高质量。
20.根据权利要求1-3中任何一个所述的装置(20),其中,所述质量确定单元被配置为进一步至少基于声道电平差CLD参数来确定质量指标,其中,所述声道电平差参数反映了左信号的功率与右信号的功率之间的比率。
21.根据权利要求20所述的装置(20),其中,所述质量确定单元被配置为至少从CLD参数的绝对值以及中侧比的和确定质量指标。
22.一种被配置为从所接收的FM无线电信号产生改进的立体声信号的系统(50);其中,所述FM无线电信号指示所接收的左信号和所接收的右信号,并且所述所接收的FM无线电信号能够表示为中间信号和侧边信号,其中,所述中间信号指示所述左信号与右信号的和,而所述侧边信号指示所述左信号与右信号之间的差;所述系统(50)包括被配置为确定所接收的FM无线电信号的质量指标的装置(20);其中,所述装置(20)根据权利要求1至21中的任何一个进行配置;其中,所述系统(50)被配置为根据所确定的质量指标来产生改进的立体声信号。
23.根据权利要求22所述的系统(50),还包括:
-FM降噪单元(2),所述FM降噪单元(2)被配置为至少基于指示所接收的左信号和右信号的相关性和/或差异的一个或多个参数来从所接收的FM无线电信号产生降噪立体声信号;
-旁路(16),所述旁路(16)被配置为提供所接收的左信号和右信号;和
-组合单元(30,31,32),所述组合单元(30,31,32)被配置为使用质量指标来从降噪的立体声信号以及所接收的左信号和右信号确定改进的立体声信号。
24.根据权利要求23所述的系统(50),其中,所述FM降噪单元(2)被配置为使用所述质量指标来从所接收的FM无线电信号产生降噪立体声信号。
25.根据权利要求24所述的系统(50),其中:
-所述FM降噪单元(2)被配置为从下混信号产生降噪立体声信号的降噪侧边信号,所述下混信号是从用下混增益调整的所接收的左信号和右信号的和确定的;
-所述下混增益指示所接收的左信号和右信号的同相和/或异相行为;并且
-通过所述质量指标来调整所述下混增益。
26.根据权利要求23至25中的任何一个所述的系统(50),其中,所述FM降噪单元(2)被配置为从所接收的FM无线电信号的参数化立体声表示产生降噪立体声信号;其中,所述参数化立体声表示包括一个或多个参数化立体声参数。
27.根据权利要求26所述的系统(50),其中:
-所述FM降噪单元(2)被配置为通过使用在时间点n之前的时间点确定的一个或多个参数化立体声参数来隐藏在时间点n所接收的FM立体声信号到单声道的衰落;并且
-质量指标在经受FM降噪单元(2)内的隐藏的情况下被修正。
28.根据权利要求23至25中的任何一个所述的系统(50),其中,所述组合单元(30,31,32)被配置为使用质量指标来在降噪立体声信号与所接收的左信号和右信号之间进行融合。
29.根据权利要求28所述的系统(50),其中,所述组合单元(30,31,32)包括:
-降噪立体声增益单元(31),所述降噪立体声增益单元(31)被配置为使用降噪立体声增益来对降噪立体声信号进行加权;
-旁路增益单元(30),所述旁路增益单元(30)被配置为使用旁路增益来对所接收的左信号和右信号进行加权;和
-合并单元(32),所述合并单元(32)被配置为合并加权后的降噪立体声信号以及加权后的所接收的左信号和右信号的相应信号;其中,所述降噪立体声增益和旁路增益取决于所述质量指标。
30.根据权利要求29所述的系统(50),其中:
L o u t R o u t = &alpha; H Q L F M R F M + ( 1 - &alpha; H Q ) L P S R P S
其中,
-Lout、Rout是改进的立体声信号的左信号和右信号;
-LFM、RFM是所接收的左信号和右信号;
-LPS、RPS是降噪立体声信号的左信号和右信号;并且
HQ是在0至1范围内的质量指标,其中,0指示低质量,1指示高质量。
31.一种移动通信设备,包括:
-FM立体声接收器,所述FM立体声接收器被配置为接收FM无线电信号;和
-根据权利要求22至30中的任何一个所述的系统。
32.一种用于估计所接收的FM无线电信号的质量的方法;其中,所接收的FM无线电信号能够表示为中间信号和侧边信号;其中,侧边信号指示左信号与右信号之间的差;所述方法包括:
-确定(101)被称为子带中间功率的中间信号的多个子带的多个功率和被称为子带侧边功率的侧边信号的多个对应子带的多个功率;
-确定(102)作为多个子带中间功率和多个子带侧边功率的比率的多个子带中侧比;和
-至少基于多个中侧比来确定(105)所接收的FM无线电信号的质量指标。
33.一种用于从所接收的FM无线电信号产生改进的立体声信号的方法;其中,所述FM无线电信号指示所接收的左信号和所接收的右信号,并且所述所接收的FM无线电信号能够表示为中间信号和侧边信号,其中,所述中间信号指示所述左信号与右信号的和,而所述侧边信号指示所述左信号与右信号之间的差;所述方法包括:
-根据权利要求32所述的方法确定所接收的FM无线电信号的质量指标;和
-使用所述质量指标来从所接收的FM无线电信号产生改进的立体声信号。
CN201280047065.0A 2011-09-29 2012-10-01 Fm立体声无线电信号中的高质量检测 Expired - Fee Related CN103918030B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161540876P 2011-09-29 2011-09-29
US61/540,876 2011-09-29
PCT/EP2012/069330 WO2013045693A2 (en) 2011-09-29 2012-10-01 High quality detection in fm stereo radio signals

Publications (2)

Publication Number Publication Date
CN103918030A CN103918030A (zh) 2014-07-09
CN103918030B true CN103918030B (zh) 2016-08-17

Family

ID=47018980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280047065.0A Expired - Fee Related CN103918030B (zh) 2011-09-29 2012-10-01 Fm立体声无线电信号中的高质量检测

Country Status (9)

Country Link
US (1) US9319159B2 (zh)
EP (1) EP2761618B1 (zh)
JP (1) JP5809754B2 (zh)
KR (1) KR101585852B1 (zh)
CN (1) CN103918030B (zh)
BR (1) BR112014007481A2 (zh)
IN (1) IN2014CN01270A (zh)
RU (1) RU2584009C2 (zh)
WO (1) WO2013045693A2 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN103098131B (zh) * 2010-08-24 2015-03-11 杜比国际公司 调频立体声无线电接收器的间歇单声道接收的隐藏
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9396732B2 (en) 2012-10-18 2016-07-19 Google Inc. Hierarchical deccorelation of multichannel audio
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal
US20160171987A1 (en) * 2014-12-16 2016-06-16 Psyx Research, Inc. System and method for compressed audio enhancement
GB2551347B (en) * 2016-06-13 2020-04-15 Toshiba Kk Indoor localisation using received signal quality weights
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals
CN114708874A (zh) * 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
CN110556116B (zh) * 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
CN114420139A (zh) 2018-05-31 2022-04-29 华为技术有限公司 一种下混信号的计算方法及装置
CN109215673B (zh) * 2018-08-06 2020-12-04 杭州摸象大数据科技有限公司 一种VoIP电话网络RTP语音流降噪方法
KR102470429B1 (ko) * 2019-03-14 2022-11-23 붐클라우드 360 인코포레이티드 우선순위에 의한 공간 인식 다중 대역 압축 시스템
CN111697982B (zh) * 2019-03-15 2022-03-22 安克创新科技股份有限公司 一种自适应噪声处理方法、装置、系统及存储介质
CN110033784B (zh) * 2019-04-10 2020-12-25 北京达佳互联信息技术有限公司 一种音频质量的检测方法、装置、电子设备及存储介质
CN110265064B (zh) * 2019-06-12 2021-10-08 腾讯音乐娱乐科技(深圳)有限公司 音频爆音检测方法、装置和存储介质
CN117133305A (zh) * 2023-04-27 2023-11-28 荣耀终端有限公司 立体声降噪方法、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630509A (zh) * 2008-07-14 2010-01-20 华为技术有限公司 一种编解码方法、装置及系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3939478C2 (de) * 1989-02-03 1994-09-22 Pioneer Electronic Corp Vorrichtung zur Rauschunterdrückung in einem FM-Stereotuner
CA2125220C (en) 1993-06-08 2000-08-15 Joji Kane Noise suppressing apparatus capable of preventing deterioration in high frequency signal characteristic after noise suppression and in balanced signal transmitting system
US6430227B1 (en) * 1998-03-27 2002-08-06 Ibiquity Digital Corporation FM in-band-on-channel digital audio broadcasting method and system
EP1289156A1 (en) * 2001-08-24 2003-03-05 Sony International (Europe) GmbH Noise reduction in a stereo receiver comprising an expander
DE60138281D1 (de) 2001-08-24 2009-05-20 Sony Deutschland Gmbh Rauschverminderung in einem FM-Stereo-Empfänger
JP2005130074A (ja) 2003-10-22 2005-05-19 Matsushita Electric Ind Co Ltd ステレオデコーダ
SE527866C2 (sv) * 2003-12-19 2006-06-27 Ericsson Telefon Ab L M Kanalsignalmaskering i multikanalsaudiosystem
EP2392003B1 (en) * 2009-01-30 2013-01-02 Telefonaktiebolaget LM Ericsson (publ) Audio signal quality prediction
EP2626855B1 (en) * 2009-03-17 2014-09-10 Dolby International AB Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
US20110194699A1 (en) * 2010-02-05 2011-08-11 Thomas Baker Method and system for enhanced sound quality for stereo audio
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
CN103098131B (zh) 2010-08-24 2015-03-11 杜比国际公司 调频立体声无线电接收器的间歇单声道接收的隐藏

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630509A (zh) * 2008-07-14 2010-01-20 华为技术有限公司 一种编解码方法、装置及系统

Also Published As

Publication number Publication date
US20140226822A1 (en) 2014-08-14
KR101585852B1 (ko) 2016-01-15
WO2013045693A3 (en) 2013-06-20
RU2014110245A (ru) 2015-09-27
US9319159B2 (en) 2016-04-19
RU2584009C2 (ru) 2016-05-20
CN103918030A (zh) 2014-07-09
KR20140049081A (ko) 2014-04-24
IN2014CN01270A (zh) 2015-06-19
BR112014007481A2 (pt) 2017-04-04
EP2761618B1 (en) 2016-11-30
EP2761618A2 (en) 2014-08-06
JP2014535183A (ja) 2014-12-25
WO2013045693A2 (en) 2013-04-04
JP5809754B2 (ja) 2015-11-11

Similar Documents

Publication Publication Date Title
CN103918030B (zh) Fm立体声无线电信号中的高质量检测
CN103069721B (zh) 降低调频无线电广播噪声中的伪不相关性
JP5841666B2 (ja) 予測ベースのfmステレオ・ノイズ削減
EP3035712B1 (en) Improvement of an audio signal of an fm stereo radio receiver by using parametric stereo
KR100803344B1 (ko) 멀티채널 출력 신호를 구성하고 다운믹스 신호를 생성하기위한 장치 및 방법
US9299355B2 (en) FM stereo radio receiver by using parametric stereo
TW201532035A (zh) 預測式fm立體聲無線電雜訊降低
TWM527596U (zh) 用於預測式fm立體聲無線電雜訊降低的設備

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160817

Termination date: 20181001