CN103718466A - 通过使用参量立体声改善fm立体声无线电接收器 - Google Patents
通过使用参量立体声改善fm立体声无线电接收器 Download PDFInfo
- Publication number
- CN103718466A CN103718466A CN201280038065.4A CN201280038065A CN103718466A CN 103718466 A CN103718466 A CN 103718466A CN 201280038065 A CN201280038065 A CN 201280038065A CN 103718466 A CN103718466 A CN 103718466A
- Authority
- CN
- China
- Prior art keywords
- signal
- parametric stereo
- mixed
- stereo parameter
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 71
- 230000001965 increasing effect Effects 0.000 claims description 61
- 230000005611 electricity Effects 0.000 claims description 28
- 238000011002 quantification Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 4
- 238000011084 recovery Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 claims 2
- 238000007906 compression Methods 0.000 claims 2
- 238000012545 processing Methods 0.000 abstract description 6
- 230000001747 exhibiting effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 9
- 230000006872 improvement Effects 0.000 description 8
- 239000000203 mixture Substances 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/16—Circuits
- H04B1/1646—Circuits adapted for the reception of stereophonic signals
- H04B1/1661—Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H40/00—Arrangements specially adapted for receiving broadcast information
- H04H40/18—Arrangements characterised by circuits or components specially adapted for receiving
- H04H40/27—Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95
- H04H40/36—Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving
- H04H40/45—Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving for FM stereophonic broadcast systems receiving
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Stereo-Broadcasting Methods (AREA)
- Noise Elimination (AREA)
Abstract
本发明涉及用于改善FM立体声无线电接收器(10)的立体声音频信号的装置(1)。建议在这样的装置(1)中采用标准的HE-ACCv2解码器(40)的组件以有效地恢复立体声音频信号(L\R')同时也呈现良好的信号质量。为此,参量立体声参数(15)应该被量化并且连同单声道缩混信号(25)提交到这样的解码器(40)。解码器(25)然后可以容易地通过经由简单的查找表恢复参量立体声参数(15),并且最终从去量化的参量立体声参数和单声道缩混信号(25)产生立体声输出信号(L'R')。该装置(1)进一步包括参数估计级(5),参数估计级可以再一次基于标准的HE-ACC v2编码器(65)的组件而被实施。在估计参量立体声参数(15)和生成单声道缩混信号(25)之后,除了已经执行的PS编码之外,编码器(65)不会使用进一步的编码。因此根据本发明的装置(1)有利地包括标准的HE-ACC v2编解码器的解码器(40)和/或编码器(65)组件,利用它的参量立体声参数处理能力。
Description
对相关申请的交叉引用
本申请要求于2011年8月4日提交的欧洲专利申请No.11176523.6和2011年10月25日提交的美国临时专利申请No.61/551,103的优先权,它们每一个通过引用而被全部合并于此。
技术领域
本发明涉及音频信号处理,具体地涉及用于改善FM立体声无线电接收器的音频信号的装置和对应方法。
背景技术
PCT/EP2010/005481在各个实施例中公开了利用参量立体声的FM立体声无线电接收器。此公开应当在此通过引用全部合并。
在模拟FM(调频)立体声无线电系统中,音频信号的左声道(L)和右声道(R)以中侧(M/S)表示(即,作为中央声道(M)和侧声道(S))被传送。中央声道M对应于L和R的和信号,例如M=(L+R)/2,并且侧声道S对应于L和R的差信号,例如S=(L-R)/2。为了传输,侧声道S被调制到38kHz的抑制载波上并且添加到基带中央信号M以形成向后兼容的立体声多路复用信号。此多路复用信号然后用于调制通常操作在87.5到108MHz的范围中的FM发射器的HF(高频)载波。
当接收质量下降(即,无线信道上的信噪比下降)时,S声道通常比M声道受到的损失大。在许多FM接收器实施方式中,当接收状况变得太嘈杂时,S声道被消音。这意味着在不良的HF无线电信号的情况下,接收器从立体声退回到单声道。
参量立体声(PS)编码是从非常低的比特率音频编码领域而来的技术。PS允许将2声道立体声音频信号编码为与附加的PS辅助信息(即,PS参数)结合的单声道缩混信号。单声道缩混信号被获得为立体声信号的两个声道的组合。PS参数使得PS解码器能够从单声道缩混信号和PS辅助信息重构立体声信号。通常,PS参数是随时间和频率变化的,并且PS解码器中的PS处理通常在合并QMF组的混合滤波器组域中执行。文献“Low Complexity Parametric StereoCoding in MPEG-4”,Heiko Purnhagen,Proc.Digital Audio EffectsWork-shop(DAFx),pp.163-168,Naples,IT,Oct.2004描述用于MPEG-4的示范性PS编码系统。它对参量立体声的讨论通过引用合并于此。参量立体声被MPEG-4音频支持。参量立体声在MPEG-4标准化文件ISO/IEC 14496-3:2005(MPEG-4音频,第三版)的8.6.4节和附录8.A和8.C中讨论。该标准化文件的这些部分通过引用合并于此以用于所有目的。参量立体声也用在MPEG环绕声标准中(参见文件ISO/IEC23003-1:2007,MPEG Surround)。同样,该文件通过引用合并于此以用于所有目的。参量立体声编码系统的进一步的示例在文件“Binaural Cue Coding-Part I:Psychoacoustic Fundamentalsand Design Principles”,Frank Baumgarte和Christof Faller,IEEETransactions on Speech and Audio Processing,vol11,no6,pages509-519,November2003以及在文件“Binaural Cue Coding-Part II:Schemes and Applications”,Christof Faller和Frank Baumgarte,IEEE Transactions on Speech and Audio Processing,vol 11,no 6,pages 520-531,November 2003中讨论。在后两个文件中,使用术语“双耳提示编码”,其是参量立体声编码的示例。
甚至在中央信号M具有可接受的质量的情况下,侧信号S在被混入输出信号(其例如根据L=M+S和R=M-S推导的)的左声道和右声道时,可以是强噪声的,因而可以严重地降低整体音频质量。当侧信号S仅仅具有不良到中间质量时,存在两个选项:或者接收器选择接受与侧信号S相关联的噪声并输出真正的立体声,或者接收器丢弃侧信号S并且退回到单声道。
发明内容
本发明的第一方面涉及用于改善FM立体声无线电接收器的音频信号的装置。该装置生成立体声音频信号。要被改善的音频信号可以是以L/R表示的音频信号,即L/R音频信号,或在可替换实施例中,以M/S表示的音频信号,即M/S音频信号。通常,要被改善的音频信号是以L/R表示的音频信号,因为传统的FM无线电接收器使用L/R输出。
作为本发明的示范性实施例,该装置用于被配置为接收包括中央信号和侧信号的FM无线电信号的FM立体声无线电接收器。
该装置包括参量立体声(PS)参数估计级。参数估计级被配置为基于L/R或M/S音频信号以频率变化或频率不变的方式确定一个或多个PS参数。所述一个或多个参数可以包括指示声道间强度差(IID或也称为CLD-声道级别差)的参数和/或指示声道间互相关(ICC)的参数。优选地,这些PS参数是随时间和频率变化的。
此外,该装置包括增混级。增混级被配置为基于第一音频信号和一个或多个PS参数生成立体声信号。
第一音频信号是例如通过缩混级中的缩混操作从L/R或M/S音频信号中获得的。在L/R表示的情况下,第一音频信号可以从音频信号中通过缩混操作根据以下公式获得:DM=(L+R)/a,其中DM对应于第一音频信号。例如,参数a被选择为2。在DM=(L+R)/a的情况下,第一音频信号基本上对应于接收的中央信号M。在更高级的自适应缩混方案中,用于根据公式DM=L/a1+R/a2组合两个声道的两个参数a1、a2可以是不同的和/或可以取决于PS参数和/或其它信号性质。
在FM立体声无线电接收器的输出处的M/S表示的情况下,第一音频信号可以简单地对应于输出处的M/S音频信号的M信号。
PS参数估计级可以是PS编码器的一部分。增混级可以是PS解码器的一部分。
该装置基于如下构思:由于它的噪声,接收的侧信号对于通过简单地组合接收的中央信号和侧信号来重构立体声信号是不足够好的;然而,在这种情况下,侧信号或L/R信号中的侧信号的分量对于PS参数估计级中的立体声参数分析可以仍然是足够好的。这些PS参数然后可以用于重构立体声信号。
因而,在侧信号中的中间或甚至大噪声的条件下,该装置实现改善的立体声接收。应当注意,术语“噪声”通常用在此说明书中以指代从无线电发送信道的局限性引入的噪声(与起源于被广播的实际音频信号的类噪声信号分量相反)。
代替使用接收的有噪声的侧信号产生立体声音频信号,可以使用在接收器处生成的改善的侧信号。改善的侧信号可以利用来自于PS编码的技术来生成。这些包括例如通过解相关器对作为输入的第一音频信号操作来生成改善的侧信号的分量。关于接收状况的数据和/或接收的立体声信号的分析可以用于自适应地控制改善的侧信号的生成并且还控制音频输出信号的生成。
根据另一个实施例,该装置进一步包括被配置为基于第一音频信号生成解相关的信号的解相关器。增混级可以基于第一音频信号、一个或多个PS参数和解相关的信号或至少解相关的信号的频带生成立体声信号。
代替使用解相关的信号,增混级可以使用接收的侧信号用于增混,例如在当接收的侧信号的噪声低时的良好的接收状况的情况下。因此,根据实施例,为了选择性地增混,使用接收的侧信号或解相关的信号。更优选地,选择是随频率变化的。例如,增混级可以使用接收的侧信号用于更低的频率,并且可以使用解相关的信号作为伪侧信号用于更高的频率,因为频率越高,噪声密度越大。在对无线电心道的加性(白色)噪声情况下,这是FM解调的典型性质。这将在说明书中在后面详细说明。
如果第一信号对应于中央信号,则接收的侧信号或其至少一个或多个频率分量可以用于增混。在不同的缩混方案(其不同于用于生成第一音频信号的(L+R)/a)的情况下,残差信号可以用于增混,代替使用接收的侧信号。这样的残差信号指示与通过它们的缩混和PS参数表示原始声道相关联的误差并且通常用在PS编码方案中。上述对接收的侧信号的使用的陈述也适用于残差信号。
用于增混的接收的侧信号和解相关的信号的选择可以是依赖于信号的,或换句话说是信号自适应的。
根据另一实施例,该选择取决于由诸如信号强度之类的无线电接收指示器指示的接收状况和/或取决于指示接收的侧信号的质量的指示器。在良好的接收状况(即,高强度)的情况下,接收的侧信号可以优选地用于增混(在一些情况下,不用于最高频率),而在中间接收状况(即,较低强度)的情况下,解相关的信号可以用于增混。
在侧信号上具有高的噪声级别的非常差的接收状况下,FM接收器可以切换到单声道输出模式以减小音频信号的噪声。在FM接收器的输出处的L/R立体声音频信号的情况下,输出处的两个声道在单声道重放中具有相同的信号。在FM接收器的输出处的M/S立体声信号的情况下,输出处的S声道被消音。在单声道输出模式中,立体声信息在FM接收器的音频信号中丢失。因而,PS参数估计级不能确定适合于在增混级中产生真正的立体声信号的PS参数。即使在非常差的接收状况中FM接收器不切换到单声道输出模式,FM接收器的输出处的音频信号也可以太差而不能用于估计有意义的PS参数。
该装置可以被配置为检测FM接收器是否已经选择了立体声无线电信号的单声道输出和/或可以被配置为通知这样的不良的接收状况(其太不良而不能用于估计有意义的PS参数)。在检测到单声道输出的情况下或在检测到这样的不良的接收状况的情况下,增混级可以生成伪立体声信号。增混级使用一个或多个增混参数用于盲增混,而不是如上所述使用估计的参数。此模式被称为伪立体声操作或盲增混操作。
在这种情况下,盲增混操作指定,在检测到不良的接收状况或检测到单声道输出并且因而启动盲增混操作之后,FM接收器的输出信号中的空间声学信息-如果完全存在的话-不用于确定增混参数并且因而不被考虑用于增混(如果在FM接收器的输出处已经存在单声道输出,则不存在空间声学信息并且因而完全不能考虑)。与上述讨论的其中确定PS参数以用于在增混级的输出信号中重构侧信号的PS操作模式相反,在盲增混操作中,该装置目的在于在增混级的输出信号处重构侧信号。
但是,盲增混不意味着装置是“盲的”,因为增混参数一定独立于FM接收器的输出信号。例如,FM接收器的输出信号可以被监视它是音乐还是谈话,并且根据其可以选择适当的增混参数。
用于盲增混的一个实施例是使用预设的增混参数。预设的增混参数可以是默认的或存储的增混参数。
然而,使用的增混参数可以是依赖于信号的,例如用于谈话的增混参数和用于音乐的增混参数。在这种情况下,该装置进一步具有谈话检测器(例如,谈话/音乐鉴别器),其检测音频信号主要是谈话还是音乐。例如,在纯音乐的情况下,可以选择增混参数以使得缩混信号和其解相关的版本被混合,而在纯谈话的情况下,可以选择增混参数以使得不使用缩混信号的解相关的版本并且仅仅缩混信号用于增混到“单声道”左/右信号。在音频信号是谈话和音乐的混合物的情况下,可以使用盲增混参数,其处于用于纯谈话的增混参数和用于纯音乐的增混参数之间。可以进一步使用用于其间所有状态的内插的增混参数。
可以预见用于伪立体声的高级的盲增混方案,其中执行更加高级的单信号分析并且这被用作推导“人为生成的”或“合成的”PS参数的基础。
对于实际上具有仅仅噪声的侧信号,该装置优选地切换到如上所述的伪立体声模式。如上所述,术语“噪声”这里是指由差的无线电接收引入的噪声(即,无线电声道上的低的信噪比),而不是指包含在发送给FM广播发射器的原始信号中的噪声。
但是,对于几乎不具有噪声的侧信号,即几乎没有来源于FM无线电传输的噪声,该装置优选地切换到正常的立体声模式而不是参量立体声模式。在正常的立体声模式中,该装置的信号改善功能基本上被禁用。对于禁用,在装置的输入处的左/右音频信号可以基本上被馈通到该装置的输出。
可替换地,对于禁用,在增混级中仅仅接收的侧信号(而非解相关的信号)与第一音频信号混合。当在增混级中适当地选择增混参数时,增混级的输出信号对应于FM发射器的输出信号:例如,当混合第一音频信号DM和接收的侧信号时,So根据
在DM=(L+R)/2且So=(L-R)/2的情况下,L'=DM+So和R'=DM-So。
更优选地,在有些情况下,可以按照依频率变化的方式选择正常的立体声模式或参量立体声模式,即对于不同的频带,选择可以是不同的。这是有用的,因为接收的侧信号的信噪比的特性对于更高的频率变得更坏。如上所述,这是FM解调的典型性质。
本发明的第二方面涉及用于基于FM立体声无线电接收器的左/右或中/侧音频信号生成立体声信号的装置。该装置被配置用于通知FM立体声接收器已经选择了立体声无线电信号的单声道输出或该装置被配置用于通知不良的无线电接收。该装置包括立体声增混级。该增混级被配置为,在该装置通知FM立体声接收器已经选择了立体声无线电信号的单声道输出或该装置通知不良的接收的情况下,基于第一音频信号和用于盲增混的一个或多个增混参数生成立体声信号。第一音频信号是从左/右或中/侧音频信号中获得的。
用于盲增混的增混参数可以是预设参数,诸如默认或存储的参数。
该装置允许在侧信号上具有高的噪声级别的非常差的接收状况的情况下生成具有低级别的噪声的伪立体声信号。在这样的接收状况中,FM接收器可以切换到单声道模式以减小音频信号的噪声,或者L/R或M/S音频信号可以太差而不能估计有意义的PS参数。这被检测然后使用用于盲增混的增混参数来生成伪立体声信号。这已经参考本发明的第一方面进行了讨论。
如还参考本发明的第一方面讨论的,该装置可以包括用于检测FM立体声接收器是否已经选择了立体声无线电信号的单声道输出的检测级。
根据示范性实施例,该装置进一步包括音频类型检测器,诸如指示FM发射器的输出处的音频信号是否主要是谈话的谈话检测器。在这种情况下,增混参数取决于谈话检测器的指示。例如该装置在谈话的情况下使用增混参数,并且在音乐的情况下使用不同的增混参数,如参考本发明的第一方面详细地讨论的。
根据本发明的第二方面的装置可以进一步包括根据本发明的第一方面的装置的特征,反之亦然。
本发明的第三方面涉及被配置为接收包括中央信号和侧信号的FM无线电信号的FM立体声无线电接收器。FM立体声无线电接收器包括用于根据本发明的第一和第二方面改善音频信号的装置。
本发明的第四方面涉及诸如蜂窝电话之类的移动通信设备。移动通信设备包括被配置为接收FM无线电信号的FM立体声接收器。此外,移动通信设备包括用于根据本发明的第一和第二方面改善音频信号的装置。
本发明的第五方面涉及用于改善FM立体声无线电接收器的左/右或中/侧音频信号的方法。根据第五方面的方法的特征对应于根据第一方面的装置的特征。一个或多个PS参数是基于左/右或中/侧音频信号以频率变化或频率不变的方式确定的。该立体声信号是通过增混操作基于所述第一音频信号和一个或多个PS参数生成的。
对本发明的第一方面的陈述也适用于本发明的第五方面。
本发明的第六方面涉及用于基于FM立体声无线电接收器的左/右或中/侧音频信号生成立体声信号的方法。根据第六方面的方法的特征对应于根据第二方面的装置的特征。应当注意,FM立体声接收器具有选择了立体声无线电信号的单声道输出,或在可替换实施例中,通知不良的无线电接收。在FM立体声接收器已经选择了立体声无线电信号的单声道输出的情况下在不良的无线电接收的情况下,基于第一音频信号和诸如预设增混参数之类的用于盲增混的一个或多个增混参数生成立体声信号。
对本发明的第二方面的陈述也适用于本发明的第六方面。
本发明的另一方面包括利用标准的HE-AAC v2编码器和解码器的组件来有效地实现改善的FM立体声无线电接收器。
进一步有用的和优选实施例在从属权利要求中规定。
附图说明
在下文中,将概述本发明的示范性实施例,集中于标准的HE-ACC v2编码器和解码器的组件的使用。
图1示出了根据本发明的改善的FM立体声无线电接收器。
具体实施方式
该图示意地描述改善的FM立体声无线电接收器100,包括能够从接收的FM无线电信号产生立体声L/R或中/侧M/S输出信号的FM立体声无线电接收器10。因此FM立体声无线电接收器10可以被认为是传统的立体声FM收音机。根据本发明的改善的立体声无线电接收器100优选地被集成到诸如蜂窝电话机、PDA、智能电话、平板PC、汽车收音机等之类的移动设备中。
主要由于不稳定的FM信号接收状况,典型地对于移动设备,传统的FM立体声无线电接收器10往往会呈现-至少暂时地-差的立体声信号再现质量。因此,当前发明建议增加用于改善的FM接收质量的进一步的信号处理组件。
提供用于基于左/右L、R或中/侧M、S信号确定一个或多个参量立体声参数15和第一音频信号25-优选地通过缩混单元30生成的单声道缩混信号-的参量立体声参数估计级5。
可以可选地提供用于进一步调节确定的参量立体声参数15的预处理单元50。根据当前信号接收性质,这样的预处理单元50可以被激活或者旁路。
此外,提供量化器单元35,接收确定的或预处理的参量立体声参数15作为量化器单元输入值45。量化器单元35基于诸如均匀量化、不均匀量化、固定点量化和浮点量化之类的量化器规则从量化器单元输入值45生成离散值,其中量化器可以进一步被实施为中升(midrise)或中平(midtread)量化器。
量化的(可选地预处理的)参量立体声参数55然后可以容易地由增混级20使用用于执行去量化的查找表60恢复而不需要应用复杂的数学运算来恢复所述参数。
增混级20基于第一音频信号25(单声道缩混信号)和去量化的参量立体声参数产生改善的L'/R'立体声输出信号。
量化器单元35和/或预处理单元50优选地包括在参量立体声参数估计级5中,相应地标准HE AAC v2编码器(65)组件中。
本发明的一个重要的方面是使用参量立体声进行编码和随后利用传统的FM无线电接收器10的立体声输出进行解码的构思,虽然不存在具有有限传输能力的典型传输信道。
通常,参量立体声编码(PS)应用于要被通过在比特率、带宽等方面具有局限性的信道发送的立体声信号。在信道的接收方处,然后解码编码的PS信号以恢复立体声信号。
相反,本发明建议直接组合立体声音频左/右或中/侧信号的PS编码和解码,而没有中间传输信道,并且优选地在诸如蜂窝电话机、PDA、智能电话机、平板PC、汽车收音机等之类的一个(移动)设备中集成整个信号处理链路。
此构思基于关于PS编码的如下知识:即使传输信道有限或失真,也改善立体声信号的再现。
利用本发明,我们不具有(传统的)传输信道,而是由(传统的)FM立体声无线电接收器产生的可能有限/失真的音频信号。如果使用PS编码和解码进一步处理这样的音频信号,则在许多情况中,与(传统的)FM立体声无线电接收器的信号输出相比较,将可以例如通过由增混级20根据关于(去量化的)参量立体声参数的信号性质选择性地生成并且应用立体声增混矩阵,来改善输出信号(L'、R')质量。
这样的立体声增混矩阵的元素可以包括范围从对应于良好质量的立体声输出信号的值到仅仅单声道信号-以及中间的任何事物的任何值。
一旦发现在目前技术水平的编码器和解码器中实现的参量立体声(PS)编码和随后的解码算法在用于FM立体声无线电接收器时将改善再现的信号质量,像HE ACC v2的这样的标准编解码器的(至少有关PS的)组件可以有利地用于执行本发明,通常不需要这样的组件的重新设计或改编。具体地,量化器单元35的主要目的是调节确定的参量立体声参数以使得它们可以直接被标准的HE ACC v2解码器处理,该解码器包括用于去量化的简单的查找表。因此量化负责提供与标准的比特流格式相似的数据格式,其可以直接由标准的HEACC v2解码器处理。既然除了实现PS编码之外没有其他的编码,那么这里的解码仅仅需要使用查找表的“逆量化”。
根据本发明的改善的立体声FM无线电接收器100可以被描述为具有随后的参量立体声编码和解码而在PS编码器和解码器之间没有中间传输信道的传统的立体声FM无线电接收器。
从根据目前技术水平的标准的HE ACC v2编解码器的角度来看,本发明产生了标准的HE AAC v2解码器40组件对于FM立体声无线电接收器10的新的和有用的用途,包括使用用于去量化的查找表60从馈送给HE AAC v2解码器40的量化的参量立体声参数55恢复参量立体声参数15,和从恢复的参量立体声参数和馈送给HE AACv2解码器40的单声道缩混25信号恢复立体声信号(L'、R')。
本发明进一步产生标准的HE AAC v2编码器65组件对于FM立体声无线电接收器的新的和有用的用途,包括从左/右L、R或中/侧M、S音频信号确定参量立体声参数15,和从左/右L、R或中/侧M、S音频信号产生单声道缩混信号25。
具体地,参量立体声编码器5/65和解码器20/40之间的链路可以通过使用量化的PS数据(即,参量立体声参数)而不是从参量立体声参数估计级5/65中获得的准确值,被非常有效地建立。
对于普通的HE-AAC v2比特流,编码器确定PS参数并且根据一个表量化它们。在那之后,对该表的Huffman编码的索引被写到比特流中。解码器然后可以从比特流中提取数据并且使用查找表执行去量化。
在不使用量化的PS参数和查找表的情况下,需要许多先验的数学来重构解相关和/或增混矩阵,解相关和/或增混矩阵必须应用于解码器中的单声道缩混信号以便再一次获得立体声信号。
参考本发明,可以丢弃Huffman编码/解码,因为在不存在具有有限能力的传输信道时比特率效率不是问题。
本发明的显著部分可以概述如下:
本发明涉及用于改善FM立体声无线电接收器的立体声音频信号的装置。
建议在这样的装置中采用标准的HE-ACC v2解码器的组件以有效地恢复立体声音频信号同时也呈现良好的信号质量。为此,参量立体声参数应该被量化并且连同单声道缩混信号递交到这样的解码器。解码器然后可以容易地恢复参量立体声参数,经由简单的查找表去量化它们,并且最终从去量化的参量立体声参数和单声道缩混信号产生立体声输出信号。
该装置进一步包括参数估计级,参数估计级可以再一次基于标准的HE-ACC v2编码器的组件而被实施。在估计立体声参数和生成单声道缩混信号之后,除了已经执行的PS编码之外,编码器不会使用进一步的编码。
因此根据本发明的装置有利地包括标准的HE-ACC v2编解码器的解码器和/或编码器组件-利用它的参量立体声参数处理能力。
关于本发明和它的各个实施例,计算复杂度的减小通过使用量化的参数作为到预先计算的值的表的索引来实现。
预先计算该表中的那些值涉及像计算代价大的arccos()或arcsinQ和exp()的数学函数的计算。
相反,使用作为该表内的值的“去量化的”值-如果仅仅是逆量化的话,预先在编译时进行这些代价大的计算并且将预先计算的值存储在该表中。这意味着不再需要在运行时进行这些计算。
另一方面,只有在具有有限数目的可能的输入值用于计算时才可以进行此步骤-这也是采用量化的原因。
因此除了“去量化”PS参数之外,本发明意味着在使用查找表时已经执行了增混矩阵计算的有效部分。
Claims (15)
1.一种用于改善FM立体声无线电接收器(10)的左/右(L,R)或中/侧(M,S)立体声音频信号的装置(1),该FM立体声无线电接收器(10)被配置为接收包括中央信号(M)和侧信号(S)的FM无线电信号,该装置(1)包括:
参量立体声参数估计级(5),该参量立体声参数估计级(5)被配置为以频率变化的或频率不变的方式、基于左/右(L,R)或中/侧(M,S)音频信号确定一个或多个参量立体声参数(15);
增混级(20),该增混级(20)被配置为基于第一音频信号(25)和所述一个或多个参量立体声参数(15)生成立体声信号(L',R'),该第一音频信号(25)从该左/右(L,R)或中/侧(M,S)音频信号获得;以及
量化器单元(35),可操作地将参量立体声参数估计级(5)连接到增混级(20),其中该增混级(20)基于标准的HE AAC v2解码器(40)实施。
2.根据权利要求1所述的装置(1),其中该量化器单元(35)接收参量立体声参数(15)作为量化器单元输入参数(45),所述参量立体声参数(15)由参量立体声参数估计级(5)确定或是预处理的参量立体声参数。
3.根据权利要求2所述的装置(1),其中该量化器单元(35)被配置为使用均匀量化、不均匀量化、固定点量化和浮点量化中的任何一个量化该量化器输入参数(45)。
4.根据权利要求1-3中的任何一个所述的装置(1),其中该量化器单元(35)被实施为中升量化器或中平量化器。
5.根据权利要求2-4中的任何一个所述的装置(1),其中该增混级(20)被配置为使用查找表(60)去量化所述量化的参量立体声参数(55),相应地预处理的参量立体声参数(55)。
6.根据权利要求2-5中的任何一个所述的装置(1),其中所述量化的参量立体声参数(55),相应地预处理的参量立体声参数(55)除了被量化并且表示参量立体声参数之外不被编码和/或压缩。
7.根据权利要求1-6中的任何一个所述的装置(1),其中所述参量立体声参数估计级(50)基于标准的HE AAC v2编码器(65)实施。
8.根据权利要求2-7中的任何一个所述的装置(1),其中所述第一音频信号(25)是从所述左/右(L,R)或中/侧(M,S)音频信号生成的单声道缩混信号,其中所述参量立体声参数估计级(5)不向所述单声道缩混信号(25)和确定的参量立体声参数(15),相应地预处理的参量立体声参数,应用编码和/或压缩方案。
9.根据权利要求8所述的装置(1),其中所述增混级(20)包括标准的HE AAC v2解码器(40)的这样的组件,所述组件被配置为从所述单声道缩混信号(25)和所述量化的参量立体声参数(55),相应地预处理的参量立体声参数(55),恢复所述立体声信号(L',R')。
10.根据权利要求8或9所述的装置(1),其中所述参量立体声参数估计级(5)包括被配置为生成所述参量立体声参数(15)和所述单声道缩混信号(25)的所述标准的HE AAC v2编码器(65)的这样的组件。
11.一种标准的HE AAC v2解码器(40)组件在FM立体声无线电接收器(10)中的用途,用于:
使用用于去量化的查找表(60)从馈送给HE AAC v2解码器(40)的量化的参量立体声参数(55)恢复参量立体声参数(15),以及
从所述恢复的参量立体声参数和馈送给HE AAC v2解码器(40)的单声道缩混(25)信号恢复立体声信号(L',R')。
12.根据权利要求11所述的用途,其中所述单声道缩混信号(25)和所述量化的参量立体声参数(55)除了表示参量立体声编码方案的组件之外不被编码和/或压缩。
13.一种标准的HE AAC v2编码器(65)组件在FM立体声无线电接收器(10)中的用途,用于:
从左/右(L,R)或中/侧(M,S)音频信号确定参量立体声参数(15),以及
从所述左/右(L,R)或中/侧(M,S)音频信号产生单声道缩混信号(25)。
14.根据权利要求13所述的用途,其中所述标准的HE AAC v2编码器(65)进一步用于至少量化所述确定的参量立体声参数(15)。
15.根据权利要求13或14所述的用途,其中所述标准的HE AACv2编码器(65)除了执行参量立体声编码之外不向左/右(L,R)或中/侧(M,S)信号应用编码和/或压缩方案。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP11176523 | 2011-08-04 | ||
EP11176523.6 | 2011-08-04 | ||
US201161551103P | 2011-10-25 | 2011-10-25 | |
US61/551,103 | 2011-10-25 | ||
PCT/EP2012/064258 WO2013017435A1 (en) | 2011-08-04 | 2012-07-20 | Improved fm stereo radio receiver by using parametric stereo |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103718466A true CN103718466A (zh) | 2014-04-09 |
CN103718466B CN103718466B (zh) | 2016-08-17 |
Family
ID=47628648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280038065.4A Active CN103718466B (zh) | 2011-08-04 | 2012-07-20 | 通过使用参量立体声改善fm立体声无线电接收器 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9299355B2 (zh) |
EP (1) | EP2740222B1 (zh) |
JP (1) | JP5775637B2 (zh) |
CN (1) | CN103718466B (zh) |
AR (1) | AR087401A1 (zh) |
PL (1) | PL2740222T3 (zh) |
WO (1) | WO2013017435A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110622242A (zh) * | 2017-05-11 | 2019-12-27 | 高通股份有限公司 | 用于立体声解码的立体声参数 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
CN104981867B (zh) | 2013-02-14 | 2018-03-30 | 杜比实验室特许公司 | 用于控制上混音频信号的通道间相干性的方法 |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1993733A (zh) * | 2005-04-19 | 2007-07-04 | 编码技术股份公司 | 用于空间音频参数的有效编码的能量相关量化 |
WO2011029570A1 (en) * | 2009-09-10 | 2011-03-17 | Dolby International Ab | Improvement of an audio signal of an fm stereo radio receiver by using parametric stereo |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2323294T3 (es) | 2002-04-22 | 2009-07-10 | Koninklijke Philips Electronics N.V. | Dispositivo de decodificacion con una unidad de decorrelacion. |
US8843378B2 (en) | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
JPWO2006004048A1 (ja) | 2004-07-06 | 2008-04-24 | 松下電器産業株式会社 | オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
US7983922B2 (en) | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
WO2007011157A1 (en) | 2005-07-19 | 2007-01-25 | Electronics And Telecommunications Research Institute | Virtual source location information based channel level difference quantization and dequantization method |
JP5513887B2 (ja) | 2006-09-14 | 2014-06-04 | コーニンクレッカ フィリップス エヌ ヴェ | 多チャネル信号のためのスイートスポット操作 |
WO2008035949A1 (en) | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
US8185381B2 (en) * | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101604983B (zh) | 2008-06-12 | 2013-04-24 | 华为技术有限公司 | 编解码装置、系统及其方法 |
US20110137661A1 (en) | 2008-08-08 | 2011-06-09 | Panasonic Corporation | Quantizing device, encoding device, quantizing method, and encoding method |
JP5326465B2 (ja) * | 2008-09-26 | 2013-10-30 | 富士通株式会社 | オーディオ復号方法、装置、及びプログラム |
EP3093843B1 (en) | 2009-09-29 | 2020-12-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Mpeg-saoc audio signal decoder, mpeg-saoc audio signal encoder, method for providing an upmix signal representation using mpeg-saoc decoding, method for providing a downmix signal representation using mpeg-saoc decoding, and computer program using a time/frequency-dependent common inter-object-correlation parameter value |
TWI516138B (zh) | 2010-08-24 | 2016-01-01 | 杜比國際公司 | 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品 |
US9237400B2 (en) | 2010-08-24 | 2016-01-12 | Dolby International Ab | Concealment of intermittent mono reception of FM stereo radio receivers |
-
2012
- 2012-07-20 CN CN201280038065.4A patent/CN103718466B/zh active Active
- 2012-07-20 US US14/234,293 patent/US9299355B2/en active Active
- 2012-07-20 EP EP20120735906 patent/EP2740222B1/en active Active
- 2012-07-20 JP JP2014523278A patent/JP5775637B2/ja active Active
- 2012-07-20 WO PCT/EP2012/064258 patent/WO2013017435A1/en active Application Filing
- 2012-07-20 PL PL12735906T patent/PL2740222T3/pl unknown
- 2012-07-31 AR ARP120102790A patent/AR087401A1/es active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1993733A (zh) * | 2005-04-19 | 2007-07-04 | 编码技术股份公司 | 用于空间音频参数的有效编码的能量相关量化 |
WO2011029570A1 (en) * | 2009-09-10 | 2011-03-17 | Dolby International Ab | Improvement of an audio signal of an fm stereo radio receiver by using parametric stereo |
Non-Patent Citations (2)
Title |
---|
HEIKO PURNHAGEN: "《LOW COMPLEXITY PARAMETRIC STEREO CODING IN MPEG-4》", 《PROC.OF THE 7TH INT. CONFERENCE ON DIGITAL AUDIO EFFECTS(DAFX‘04),NAPLES, ITALY》, 8 October 2004 (2004-10-08), pages 163 - 168, XP002364489 * |
熊朋: "《增强型AAC+编码器中立体声参数的量化算法优化研究》", 《电信科学》, 20 November 2010 (2010-11-20), pages 260 - 263 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110622242A (zh) * | 2017-05-11 | 2019-12-27 | 高通股份有限公司 | 用于立体声解码的立体声参数 |
CN110622242B (zh) * | 2017-05-11 | 2023-06-16 | 高通股份有限公司 | 用于立体声解码的立体声参数 |
US11823689B2 (en) | 2017-05-11 | 2023-11-21 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
Also Published As
Publication number | Publication date |
---|---|
JP5775637B2 (ja) | 2015-09-09 |
US20140161262A1 (en) | 2014-06-12 |
EP2740222A1 (en) | 2014-06-11 |
PL2740222T3 (pl) | 2015-08-31 |
WO2013017435A1 (en) | 2013-02-07 |
EP2740222B1 (en) | 2015-04-22 |
CN103718466B (zh) | 2016-08-17 |
JP2014527197A (ja) | 2014-10-09 |
AR087401A1 (es) | 2014-03-19 |
US9299355B2 (en) | 2016-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102598717B (zh) | 使用参数化立体声的fm立体声无线电接收机的音频信号的改进 | |
CN1993733B (zh) | 空间音频参数量化器、去量化器及参数量化、去量化方法 | |
US5488665A (en) | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels | |
CN101120615B (zh) | 多声道编码器和解码器以及相应的编码和解码方法 | |
CA2301663C (en) | A method and a device for coding audio signals and a method and a device for decoding a bit stream | |
JP3502639B2 (ja) | 強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読 | |
CN1748443B (zh) | 多声道音频扩展支持 | |
KR101449434B1 (ko) | 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치 | |
Herre et al. | MPEG-4 high-efficiency AAC coding [standards in a nutshell] | |
CN103180899B (zh) | 立体声信号的编码装置、解码装置、编码方法及解码方法 | |
US20030220783A1 (en) | Efficiency improvements in scalable audio coding | |
KR19990041073A (ko) | 비트율 조절이 가능한 오디오 부호화/복호화 방법 및 장치 | |
CN101548315B (zh) | 用于立体声编码的方法和装置 | |
JP6864378B2 (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
CN103718466A (zh) | 通过使用参量立体声改善fm立体声无线电接收器 | |
UA48191C2 (uk) | Спосіб та пристрій для кодування аудіосигналів ( варіанти ) | |
EP1553563A2 (en) | Method and apparatus for converting audio data | |
Davidson | Digital audio coding: Dolby AC-3 | |
Kim et al. | Improved channel level difference quantization for spatial audio coding | |
Dietz et al. | Using MPEG-4 audio for DRM digital narrowband broadcasting | |
Li et al. | Efficient stereo bitrate allocation for fully scalable audio codec | |
Aggarwal et al. | Department of Electrical and Computer Engineering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |