CN102473414A - 带宽扩展编码器、带宽扩展解码器和相位声码器 - Google Patents
带宽扩展编码器、带宽扩展解码器和相位声码器 Download PDFInfo
- Publication number
- CN102473414A CN102473414A CN2010800291647A CN201080029164A CN102473414A CN 102473414 A CN102473414 A CN 102473414A CN 2010800291647 A CN2010800291647 A CN 2010800291647A CN 201080029164 A CN201080029164 A CN 201080029164A CN 102473414 A CN102473414 A CN 102473414A
- Authority
- CN
- China
- Prior art keywords
- signal
- window
- low frequency
- coding
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 149
- 230000005236 sound signal Effects 0.000 claims abstract description 146
- 230000006870 function Effects 0.000 claims description 138
- 230000008439 repair process Effects 0.000 claims description 64
- 238000001228 spectrum Methods 0.000 claims description 39
- 230000000052 comparative effect Effects 0.000 claims description 37
- 238000000034 method Methods 0.000 claims description 35
- 230000015572 biosynthetic process Effects 0.000 claims description 20
- 238000003786 synthesis reaction Methods 0.000 claims description 20
- 230000007480 spreading Effects 0.000 claims description 11
- 238000003892 spreading Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008878 coupling Effects 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 5
- 238000005859 coupling reaction Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 26
- 238000004422 calculation algorithm Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 13
- 238000005259 measurement Methods 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 230000010076 replication Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 241001270131 Agaricus moelleri Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
一种用于编码音频信号的带宽扩展编码器,包括信号分析器、核心编码器和参数计算器。音频信号包括具有核心频带的低频信号和具有上频带的高频信号。信号分析器被配置为分析音频信号,该音频信号具有音频样本块,该块具有一定时间长度。信号分析器还被配置为从多个分析窗口确定将用于在带宽扩展解码器中进行带宽扩展的分析窗口。核心编码器被配置为编码低频信号从而获得编码的低频信号。参数计算器被配置为从高频信号计算带宽扩展参数。
Description
技术领域
本发明涉及音频信号处理,具体地,涉及带宽扩展编码器、用于编码音频信号的方法、带宽扩展解码器、用于解码编码的音频信号的方法、相位声码器和音频信号。
此外,本发明的实施方式涉及用于独立于带宽扩展进行纯时间延长的相位声码器的应用。
背景技术
音频信号的存储或传输通常受比特率的严格限制。这些限制条件通常是由于编码器/解码器(编解码器)根据存储或传输信号所需的信息率来有效压缩音频信号的原因。在过去,当只有很低的比特率可利用时,编码器不得不迅速地降低音频带宽。现代的音频编解码器能够通过使用带宽扩展(BWE)法编码宽带信号,如M.Dietz、L.Liljeryd、K.和O.Kunz在2002年5月于慕尼黑举办的第112届AES大会上提出的“Spectral BandReplication,a novel approach in audio coding(频带复制,一种新的音频编码方法)”;S.Meltzer、R.和F.Henn在2002年5月于慕尼黑举办的第112届AES大会上提出的“SBR enhanced audio codecs for digitalbroadcasting such as“Digital Radio Mondiale”(DRM)(用于例如数字无线广播(DRM)等数字广播的SBR增强型音频编解码器)”以及T.Ziegler、A.Ehret、P. Ekstrand和M.Lutzky在2002年5月于慕尼黑举办的第112届AES大会上提出的“Enhancing mp3 with SBR:Features and Capabilitiesof the new mp3PRO Algorithm(通过SBR增强mp3:新的mp3PRO算法的特性和性能)”;国际标准ISO/IEC 14496-3:2001/FPDAM1:“带宽扩展”,ISO/IEC,2002;Vasu Iyengar等人在美国专利5,455,888中提出的“语音带宽扩展方法和装置”;E.Larsen、R.M.Aarts和M.Danessis提出的“音乐和语音的高效高频带宽扩展”中记载的。R.M.Aarts、E.Larsen和O.Ouweltjes在2002年5月于慕尼黑举办的第112届AES大会上提出的“低频和高频带宽扩展的统一方法”。K.在2003年10月于美国纽约举办的第115届AES大会上提出的“窄带语音信号的鲁棒性宽带增强”。赫尔辛基理工大学声学和音频信号处理实验室的E.Larsen和R.M.Aarts在2001年的研究报告提出的“音频宽带扩展——在心理声学、信号处理和扬声器设计的应用”。John Wiley & Sons公司的E.Larsen、R.M.Aarts和M.Danessis在2004年提出的“音乐和语音的高效高频带宽扩展”。J.Makhoul在2002年5月于慕尼黑举办的第112届AES大会上提出的“通过线性预测分析语音频谱”。Ohmori等人在1973年6月的IEEE音频和电子声学学报AU-21(3)提出的美国专利申请08/951,029“音频扩带扩展系统和方法”。Malah,D和Cox,R.V.提出的美国专利申请6895375中的“窄带语音宽带扩展的系统”以及Frederik Nagel和SaschaDisch在2009年4月于台湾台北举办的IEE CNF关于声学、语音和信号处理的ICASSP国际会议上提出的“音频编解码器的谐波宽带扩展方法”。
这些算法依赖于高频(HF)内容的参数表示。通过变换到HF频谱区(修补)并应用参数驱动的后处理从解码的信号的低频(LF)部分生成该表示。
在现有技术中,已知的带宽扩展方法例如有频带复制(SBR)或谐波带宽扩展(HBE)。在下文中,将简要地说明这两种BWE方法。一方面,如在M.Dietz、L.Liljeryd、K.和O.Kunz于2002年5月在慕尼黑举办的第112届AES大会上提出的“频带复制:一种新的音频编码方法”中所记载的,频带复制(SBR)采用正交镜像滤波器组(QMF)来生成HF信息。采用所谓的“修补”算法,较低的QMF带信号拷贝到较高的QMF带内,从而将LF部分的信息复制到HF部分中。然后,所生成的HF部分适于借助于调整频谱包络和音调的参数来与原始HF部分严密地匹配。
另一方面,谐波带宽扩展(HBE)是基于相位声码器的另一种带宽扩展方案。相对于需要非谐波频谱位移的SBR,HBE能够使频谱谐波延续。其可用于替代或改进的SBR修补算法。
申请号为US 61/079,841的美国临时专利申请公开了一种BWE方法,其可在操作在频域或时域中的可替换修补算法之间选择。在由滤波器组进行时-频转换中,采用某一预定的分析窗口。此外,根据现有技术的传统相位声码器实现方法采用一个预定的窗口形状,例如:升余弦窗口或巴特利特窗口。
但是,选择一种用于声码器应用的预定分析窗口始终包括应用设计师根据对于不同类型的音频信号所达到的整体感知音频质量所作的取舍。因此,尽管可通过一开始选择一定的窗口来优化平均音频质量,但是每个不同类型的信号的音频质量都不是最佳的。
此外,还发现一定的信号受益于相位声码器专门的分析窗口,特别是用于在不改变这些信号的基音的情况下时间直扩音频信号。
因此,需要例如在BWE方案中选择最佳分析窗口的思想。但是,优选地,对刚刚提及到的感知音频质量下降进行的测量不会显著增加使用的编解码器的计算复杂性。
发明内容
本发明的目的在于提供一种编码和/或解码思想或提供改善的音频质量的相位声码器思想。
该目的由根据权利要求1的带宽扩展编码器、根据权利要求2的带宽扩展解码器、根据权利要求12的相位声码器、根据权利要求13的编码方法、根据权利要求14的解码方法、根据权利要求15的编码的音频信号或根据权利要求16的计算机程序来实现。
本发明隐含的思想是,当分析具有一定时间长度的音频样本块的音频信号以从多个分析窗口确定将用于在带宽扩展解码器中进行带宽扩展的分析窗口时,可获得改善的感知质量。与现有技术的BWE方法相比,通过该方法,可防止由应用预定分析窗口造成的音频质量下降,并因此可以以相对少的努力来提高感知音频质量。
根据本发明的实施方式,一种用于编码音频信号的带宽扩展编码器包括信号分析器、核心编码器和参数计算器。音频信号包括具有核心频带的低频信号和具有上频带的高频信号。信号分析器被配置为分析音频信号,该音频信号具有音频样本块,该块具有一定的时间长度。信号分析器还被配置为从多个分析窗口确定将用于在带宽扩展解码器中进行带宽扩展的分析窗口。核心编码器被配置为编码低频信号,从而获得编码的低频信号。参数计算器被配置为计算高频信号的带宽扩展参数。
根据本发明的另一实施方式,一种用于解码编码的音频信号的带宽扩展解码器包括核心解码器、修补模块和组合器。编码的音频信号包括编码的低频信号和上频带参数。核心解码器被配置为解码编码的低频信号,其中,解码的低频信号具有核心频带。修补模块被配置为基于解码的低频信号和上频带参数生成修补信号,其中,修补信号包括从核心频带生成的上频带。组合器被配置为组合修补信号和解码的低频信号,从而获得组合的输出信号。
根据另一实施方式,一种用于处理音频信号的相位声码器处理器,包括分析窗口器、时/频转换器、频域处理器、频/时转换器、合成窗口器、比较器和重叠加法器。分析窗口器被配置为对音频信号或由音频信号获得的信号应用多个分析窗函数,从而获得多个窗口化音频信号,音频信号具有音频样本块,该块具有一定时间长度。时/频转换器被配置为将窗口化音频信号转换成频谱。频域处理器被配置为在频域内处理频谱,从而获得改进的频谱。频/时转换器被配置为将改进的频谱转换为改进的时域信号。合成窗口器被配置为对改进的时域信号应用多个合成窗函数,从而获得窗口化改进的时域信号,其中合成窗函数与分析窗函数匹配。比较器被配置为基于多个窗口化改进的时域信号和音频信号或由音频信号获得的信号的比较来确定多个比较参数,其中,多个比较参数对应于多个分析窗函数。比较器还被配置为选择比较参数满足预定条件的分析窗函数和合成窗函数。重叠加法器被配置为对窗口化改进的时域信号的重叠块进行相加,从而获得时间直扩信号。重叠加法器还被配置为处理由比较器选择的分析窗函数和合成窗函数进行改进的窗口化改进的时域信号的块。
本发明的实施方式基于这样的思想,即多个修补信号可从应用于具有核心频带的音频信号的多个分析窗函数生成。多个修补信号可与参考信号进行比较,参考信号为原始音频信号或由音频信号获得的信号。这将产生与音频质量的测量相关的多个比较参数。此外,从多个分析窗函数可选择比较参数满足预定条件的分析窗函数。因此,使用所选的分析窗函数可确保音频质量的降低最小,从而在BWE场景下获得最佳的感知音频质量。
本发明的其他实施方式涉及一种信号分析器,包括:信号分类器,其中,信号分类器被配置为分析/分类音频信号或由音频信号获得的信号。在这种情况下,基于分析/分类的信号的信号特性选择用于在带宽扩展解码器内进行带宽扩展的分析窗函数。
因此,实施方式提供了一种为解码器内的带宽扩展选择最佳分析窗口的方法。可评估控制参数,从而决定哪个分析窗口是最合适的。为实现此,可采用分析-合成方案;即,可应用一组窗口,然后根据合适的目的选择最好的窗口。在本发明的优选方式中,该目的是用于确保复原的最佳感知音频质量。在可替换的方式中,可优化目标函数。例如,该目的可以是尽可能地保持与原始HF的光谱平坦度相近。
一方面,考虑到原始信号、合成信号或其二者,可仅在编码器选择窗口。然后,将决定(窗口提示)传输到解码器。另一方面,只考虑解码信号的核心宽带,可同时在编码器和解码器侧进行选择。后一种方法不需要生成附加的旁信息,这对编解码器的比特率效率来说是有利的。
本发明的优点在于,优化了声码器输出信号的感知质量。实施方式提供了用于声码处理的合适的分析和合成窗口的信号自适应选择,其中,分析和/或合成窗口的时间响应或频率响应可能不同。
本发明的另一优点在于,其能够例如在BWE方案中在上述劣化和计算复杂度之间做出很好的取舍。
附图说明
下面参照附图描述本发明的实施方式,附图中:
图1示出了带宽扩展编码器的实施方式的框图;
图2示出了带宽扩展解码器的实施方式的框图;
图3示出了带宽扩展编码器的另一实施方式的框图;
图4示出了带宽扩展解码器的另一实施方式的框图;
图5示出了带宽扩展编码器的又一实施方式的框图;
图6示出了带宽扩展解码器的又一实施方式的框图;
图7示出了比较器的实现的框图;
图8示出了带宽扩展编码器的另一实施方式的框图;
图9示出了信号分类器的实现的框图;
图10示出了带宽扩展编码器的又一实施方式的框图;
图11示出了带宽扩展解码器的又一实施方式的框图;
图12示出了相位声码器处理器的实施方式的框图;
图13示出了根据控制信息在不同的分析和合成窗口之间切换的装置的实施方式的框图;
图14示出了相位声码器驱动的带宽扩展解码器的实施方式的概述。
具体实施方式
图1示出了根据本发明实施方式的用于编码音频信号101-1的带宽扩展编码器100的框图。音频信号101-1包括具有核心频带101-3的低频信号101-2和具有上频带101-5的高频信号101-4。带宽扩展编码器100包括信号分析器110、核心编码器120和参数计算器130。信号分析器110被配置为分析音频信号101-1,该音频信号101-1具有音频样本块101-6,该块101-6具有一定的时间长度。信号分析器110还被配置为从多个分析窗口111-1确定将用于在例如带宽扩展解码器200中进行带宽扩展的分析窗口111-2。核心编码器120被配置为编码低频信号101-2,以获得编码的低频信号121。最后,参数计算器130被配置为从高频信号101-4计算带宽扩展参数131。带宽扩展参数131、将在带宽扩展解码器200中使用的分析窗口111-2以及编码的低频信号121组成带宽扩展编码器100提供的编码的音频信号103-1。
图2示出了根据本发明另一实施方式的用于对编码的音频信号201-1进行解码的带宽扩展解码器200的框图。编码的音频信号201-1包括编码的低频信号201-2和上频带参数201-3。这里,编码的音频信号201-1可相当于图1所示的由带宽扩展编码器100提供的编码的音频信号103-1。带宽扩展解码器200包括核心解码器210、修补模块220和组合器230。核心解码器210被配置为对编码的低频信号201-2进行解码,以获得解码的低频信号211-1。解码的低频信号211-1包括核心频带211-2。修补模块220被配置为基于解码的低频信号211-1和上频带参数201-3生成修补信号221-1,其中修补信号221-1包括从核心频带211-2产生的上频带221-2。最后,组合器230被配置为组合修补信号221-1和解码的低频信号211-1,从而获得组合输出信号231-1。具体地,修补信号221-1可以是带宽扩展算法的目标频率范围内的信号,而带宽扩展解码器200提供的组合输出信号231-1可以是具有扩展的带宽的被控信号(231-2)。
图3示出了带宽扩展编码器300的另一实施方式的框图。带宽扩展编码器300可包括低通(LP)滤波器和高通(HP)滤波器。滤波器可被实施为产生低通滤波版本的音频信号101-1作为低频信号101-2和高通滤波版本的音频信号101-1作为高频信号101-4。如图3所示,带宽扩展编码器300还可包括窗口控制器310,用于提供供参数计算器320和修补模块330使用的窗口控制信息311。窗口控制器310提供的窗口控制信息311可指示要应用于由音频信号101-1获得的音频样本块101-6的多个分析窗函数111-1。具体地,参数计算器320可包括受窗口控制器310控制的窗口器,其中参数计算器320的窗口器被配置为对高频信号101-4应用多个分析窗函数111-1和比较器340所选择的分析窗函数111-2。这里,获得分别对应于由窗口控制信息311所指示的多个分析窗函数111-1和对应于在比较器340的输出处由窗口指示340-1提供的所选分析窗函数111-2的带宽扩展参数321-1、321-2。
在图3所示的实施方式中,信号分析器110包括修补模块330,其被配置为基于低频信号101-2、窗口控制信息311和带宽扩展参数321-1生成多个修补信号331-1。这里,修补信号331-1包括从核心频带101-3产生的上频带331-2。具体地,修补模块330包括受窗口控制器310控制的窗口器,其中,修补模块330的窗口器被配置为对低频信号101-2应用多个分析窗函数111-1。
此外,带宽扩展编码器300的信号分析器110包括比较器340,其被配置为基于修补信号331-1和参考信号的比较确定多个比较参数341-2,参考信号为音频信号101-1或从诸如由虚线所示的高频信号101-4的音频信号获得的信号,其中多个比较参数341-2对应于多个分析窗函数111-1。比较器340还被配置为提供与比较参数满足预定条件的分析窗函数111-2对应的窗口指示341-1。最后,带宽扩展编码器300包括用于提供编码的音频信号351的输出接口350,编码的音频信号351包括窗口指示341-1。
根据上述比较的实施情况,图7示出了比较器700的实施方式的框图,其可包括频谱平坦度测量(SFM)参数计算器710、SFM参数比较器720和窗口指示提取器730。SFM参数计算器710可被实施为计算例如多个输入信号701-1的多个SFM参数703-1和参考输入信号701-2的参考SFM参数703-2。具体地,每个SFM参数可通过将功率谱的几何平均值除以从相应的输入信号获得的功率谱的算术平均值而算得,其中,相对高的SFM参数表示在所有频带中频谱具有等量的功率,而相对低的SFM参数表示频谱功率集中在相对较少的频带中。另外,也能在某一部分频带(子带)内而不是输入信号的整个频带中测量SFM参数。SFM参数比较器720可被实施为比较SFM参数703-1和参考SFM参数703-2,从而获得多个比较参数705,其中,比较参数705可基于例如比较的SFM参数的偏差。窗口指示提取器730可被实施为从多个比较参数705中选择满足预定条件的比较参数。例如,可选择预定条件,使得所选的比较参数是多个比较参数705中的最小值。在这种情况下,所选的比较参数将对应于多个输入信号701-1中具有在频谱平坦度方面与参考输入信号701-2的偏差最小的特征的输入信号。
具体地,输入信号701-1可对应于修补信号331-1,修补信号331-1是在将多个分析窗函数111-1应用于音频信号101-1或诸如低频信号101-2的从音频信号101-1获得的信号后获得的,而参考输入信号701-2可对应于原始音频信号101-1。此外,比较器700的多个比较参数705可对应于带宽扩展编码器300的多个比较参数341-2。因此,可对应于所选的比较参数选择分析窗函数111-2,即,例如,修补信号331-1和原始音频信号101-1的SFM参数偏差将最小。也可通过窗口指示707指出所选的分析窗函数111-2,窗口指示707可对应于分别在比较器700或340的输出提供的窗口指示341-1。因此,例如,当所选的分析窗函数111-2被选择用于例如在带宽扩展解码器内进行带宽扩展时,将尽可能少地改变或降低通过频谱偏袒度测出的感知音频质量。
此外,由窗口控制器310的输出端的窗口控制信息311指示的多个分析窗函数111-1可包括具有不同窗口特性但具有与块101-6时间相同的窗口长度的不同分析窗函数。具体地,由根据频谱分析获得的不同频率响应函数(传递函数)可表征不同的分析窗函数。因此,传递函数又可通过特性特征(例如:它们的主瓣宽度、旁瓣电平或旁瓣衰减)来区分。不同分析窗函数还可根据它们性能特征(例如:频谱分辨率或动态范围),而分成若干个组。例如,高和中分辨率窗口可由矩形、三角形、余弦、升余弦、汉明、汉宁、巴特利特、布莱克曼、高斯、凯瑟或布莱克曼-汉宁窗函数表示,而低分辨率或高动态范围窗口可由平顶、布莱克曼-哈瑞斯或Tukey窗函数表示。在可替换实施方式中,也可使用具有不同数量样本的窗函数(即,不同窗口长度的窗口)。
具体地,例如,通过修补模块330将可属于不同分析窗函数组的不同分析窗函数111-1应用于音频样本块101-6,将产生具有诸如不同SFM参数的不同特性特征的修补信号331-1。
图4示出了带宽扩展解码器400的另一实施方式的框图,其能明确地使用例如由图3所示的带宽扩展编码器300提供的窗口指示341-1。具体地,带宽扩展解码器400可被实施为对编码的音频信号401-1进行操作,其中,除了编码的低频信号401-2和上频带参数401-3外,编码音频信号401-1还包括窗口指示401-4。这里,编码的低频信号401-2、上频带参数401-3和窗口指示401-1可分别对应于从带宽扩展编码器300的输出接口350输出的编码的低频信号121、带宽扩展参数321-2和窗口指示341-1。在图4所示的实施方式中,带宽扩展解码器400包括核心解码器410,其可对应于带宽扩展解码器200的核心解码器210,核心解码器410被配置为解码编码的低频信号401-2,其中,解码的低频信号411-1包括核心频带411-2。此外,带宽扩展解码器400包括修补模块420,其可对应于带宽扩展解码器200的修补模块220,其中修补模块420包括用于基于窗口指示401-4从多个分析窗函数选择分析窗函数以及将所选的分析窗函数应用于解码的低频信号411-1的可控窗口器。以此方式,在修补模块420的输出将获得修补信号421。修补信号421还可通过组合器430与低频信号411-1组合,使得将从带宽扩展解码器400输出组合的输出信号431。这里,修补信号421、解码的低频信号411-1、组合器430和组合的输出信号431可分别对应于修补信号221-1、解码的低频信号211-1、组合器230和组合的输出信号231-1。如上所述,组合的输出信号431可以是具有扩展的带宽的被控信号(manipulated signal)。
根据图3和图4,有利的是,与通过在编码器侧(图3)进行信号分析所获得的最佳分析窗函数对应的窗口指示341-1、401-4可在编码的音频信号351、401-1中传输,然后在修补模块420中使用,使得在不需要在解码器侧(图4)进行进一步信号分析的情况下,也可以进行带宽扩展。
图5示出了带宽扩展编码器500的另一实施方式的框图。带宽扩展编码器500基本上包括与图3的带宽扩展编码器300相同的块。因此,具有相同实现方式和/或功能的相同块用相同的标号表示。但是,与图3所示的实施方式相比,带宽扩展编码器500包括比较器510,其被配置为将多个修补信号333-1与由音频信号101-1获得的低频参考信号作比较。可选地,带宽扩展编码器500还可包括核心解码器520,其被实施为通过解码核心编码器120输出的编码的低频信号121来提供解码的低频信号521。对于参考低频信号,例如,可使用作为低通滤波版本的音频信号101-1的低频信号101-2或核心解码器520输出的解码的低频信号521。此外,比较器510被配置为提供对应于所选的(最佳)分析窗函数的窗口指示511,其中,在这种情况下,基于修补信号331-1与低频参考信号101-2或521的比较来选择窗口。与图3所示的实施方式中的窗口指示341-1一样,窗口指示511可提供给参数计算器320,使得将仅获得对应于窗口指示511的BWE参数321-2。BWE参数321-2可与编码的低频信号121一起提供给输出接口530。但是,这里,窗口指示511可不提供给输出接口530。最后,输出接口530被配置为提供编码的音频信号531,该编码的音频信号531不包括窗口指示511。
图6示出了带宽扩展解码器600的另一实施方式的框图。具体地,带宽扩展解码器600被实施为对包括编码的低频信号601-2和上频带参数601-3的编码的音频信号601-1进行操作。这里,编码的音频信号601-1、编码的低频信号601-2和上频带参数601-3可分别对应于编码的音频信号201-1、编码的低频信号201-2和上频带参数201-3。尤其在图6所示的实施方式中,馈送到带宽扩展解码器600的编码音频信号601-1不包括窗口指示。为此,在这种情况下,需要在解码器侧分析信号,分析信号的目的在于选择例如要在带宽扩展方案中应用的合适的窗函数(图6)。
如图6所示,带宽扩展解码器600的修补模块220包括分析窗口器610、时/频转换器620、频域处理器630、频/时转换器640、合成窗口器650、比较器660和带宽扩展模块670。另外,带宽扩展解码器600包括用于解码编码的低频信号601-2的核心解码器680,其中,解码的低频信号681-1包括核心频带681-2。这里,核心解码器680和解码的低频信号681-1可分别对应于核心解码器210和解码的低频信号211-1。
分析窗口器610被配置为将多个分析窗函数(例如:带宽扩展编码器300、500实施方式中的分析窗函数111-1)应用于解码的低频信号681-1,从而获得多个窗口化的低频信号611。时/频转换器620被配置为将窗口化的低频信号611转换为频谱621。频域处理器630被配置为在频域中处理频谱621,从而获得改进的(modified)频谱631。频/时转换器640被配置为将改进的频谱631转换为改进的时域信号641。合成窗口器650被配置为将多个合成窗函数应用于改进的时域信号641,其中,合成窗函数与分析窗函数匹配,从而获得窗口化改进的时域信号651。具体地,合成窗函数可与分析窗函数匹配,使得应用合成窗函数来补偿相应分析窗函数的效果。比较器660被配置为基于多个窗口化改进的时域信号651与解码的低频信号681-1的比较来确定多个比较参数,其中,多个比较参数对应于已通过分析窗口器610应用于解码的低频信号681-1的多个分析窗函数111-1。比较器660还被配置为选择比较参数满足预定条件的分析窗函数和合成窗函数。这里,比较器660尤其可如图7的背景中所述的那样配置。选择的分析窗函数和合成窗函数可组成在比较器660的输出提供的窗口指示661。但是,与图4所示的带宽扩展解码器400实施方式不同的是,其中图4的用于在解码器侧进行带宽扩展的窗口指示401-4包含在编码的音频信号401-1中,图6中所示的带宽扩展解码器600的窗口指示661在编码音频信号601中是不可用的,使得必须首先通过分析由编码的音频信号601-1获得的解码的低频信号681-1来确定窗口指示661。此外,带宽扩展解码器600的修补模块220可包括带宽扩展模块670,其被配置为进行带宽扩展算法,即,修补模块220将基于解码的低频信号681-1、比较器660所选的分析窗函数和合成窗函数以及上频带参数601-3生成修补信号671。最后,修补信号671和解码的低频信号681-1可通过组合器690组合,从而获得具有扩展的带宽的组合输出信号691。这里,修补信号671、解码的低频信号681-1、组合器690和组合的输出信号691可分别对应于图2所示的带宽扩展解码器200的修补信号221-1、解码的低频信号211-1、组合器230和组合的输出信号231-1。
在前面提到的带宽扩展编码器/解码器的实施方式中,使用的比较器可对应于如图7所述的比较器700。具体地,比较器700可被实施为接收图3和5图中的带宽扩展编码器300和500的多个修补信号331-1或图6中带宽扩展解码器600的多个窗口化改进的时域信号651作为多个输入信号701-1,并且接收由图3中“参考信号”表示的音频信号101-1或图3中由虚线表示的高频信号101-4、图5中由“低频参考信号”表示的低频信号101-2或图5中由虚线指示的解码低频信号521或图6中的带宽扩展解码器600的解码的低频信号681-1作为参考输入信号701-2。比较器700还被配置为提供窗口指示707,其可对应于图3中的带宽扩展编码器300的窗口指示341-1、图5中的带宽扩展编码器500的窗口指示511或图6中的带宽扩展解码器600的窗口指示661。如上所述,例如可基于输入信号的SFM参数的计算结果进行比较。可替换,输入信号701-1和参考输入信号701-2还可基于其音频信号的差值的样本相关(sample-wise)的计算结果进行比较。
在上述实施方式中,通过信号分析进行窗口选择,即,多个不同分析窗函数应用于音频信号或由音频信号获得的信号,从而生成多个不同的修补(合成)信号。该多个合成信号中,基于根据合成信号和原始音频信号或由音频信号获得的信号的比较的预定标准来选择最佳窗函数。然后,将选择的窗函数应用于音频信号或由(例如,带宽扩展方案中的)音频信号获得的信号,从而将生成一定的修补(合成)信号。具体地,上述过程对应于闭环并且可称为“分析-合成”方案。可替换地,也可以对作为音频信号或由音频信号获得的信号的输入信号进行直接分析来进行窗口选择,其中,根据一定的信号特性(例如,音调测量结果),对原始输入信号进行分析/分类。将在下面的实施方式中对对应于开环的可替换分析方案进行说明。
图8示出了带宽扩展编码器800的另一实施方式的框图。这里,带宽扩展编码器800的基本结构对应于图3所示的带宽扩展编码300的基本结构。因此,图3和图8中所示的相同块可由相同的标号表示。
带宽扩展编码器800的信号分析器110包括信号分类器810,其中信号分类器810被配置为将音频信号101-1或由诸如高频信号101-4(虚线)的音频信号获得的信号分类,从而基于分类信号的信号特性确定对应于分析窗函数的窗口指示811。例如,信号分类器810可被实施为通过根据音频信号101-1或高频信号101-4计算音调测量结果来确定窗口指示811,其中音调测量结果可指示频谱能量在其频带中的分布。如果频谱能量相对均匀地分布在频带中,则在该频带中存在更接近无音调的信号(噪声信号)且窗口指示811可与具有适于应用于无音调信号的第一特性的第一窗函数相关,而如果频谱能量相对强地集中在该频带的某一位置,则该频带中存在更接近有音调的信号且窗口指示811可与具有适于应用于音调信号的第二特性的第二窗函数相关。此外,编码器800包括窗口控制器820,用于基于由信号分类器810确定的窗口指示811提供窗口控制信息821。编码器800的参数计算器830包括受窗口控制器820控制的窗口器,其中参数计算器830的窗口器被配置为基于窗口控制信息821将分析窗函数应用于高频信号101-4,从而获得BWE参数831。例如,窗口控制器820可被实施为向参数计算器830提供窗口控制信息821,使得当确定的音调测量结果小于预定的阈值时,参数计算器830的窗口器将应用由具有主瓣的第一宽度的传递函数表征的第一窗口,或者当确定的音调测量结果等于或者大于预定的阈值时,参数计算器830的窗口器将应用由具有主瓣的第二宽度的传递函数表征的第二窗口,其中,传递函数的主瓣的第一宽度大于传递函数的主瓣的第二宽度。具体地,在带宽扩展方案的情况下,有利的是,对于没有音调的信号使用传递函数的主瓣相当大的窗函数,对于有音调的信号使用传递函数的主瓣相当小的窗函数。
带宽扩展编码器800的核心编码器120被配置为编码低频信号101-2,从而获得编码的低频信号121。如图3所示的实施方式,编码的低频信号121、窗口指示811和BWE参数831可被提供给输出接口840,其中输出接口用于提供包括窗口指示811的编码的音频信号841。
图9示出了信号分类器900的实施的框图,信号分类器900可用于对图8、图10和图11的实施方式中的音频信号101-1进行直接分析。信号分类器900可包括音调测量器910、信号表征器920和窗口选择器930。音调测量器910可被配置为分析音频信号101-1,从而确定音频信号101-1的音调测量结果911。信号表征器920可被配置为基于由音调测量器910提供的音调测量结果911确定音频信号101-1的信号特性921。具体地,信号表征器920被配置为确定音频信号101-1是对应于噪声信号还是对应于音调信号。最后,窗口选择器930被实施为基于信号特性921提供窗口指示811。
图10示出了带宽扩展编码器1000的另一实施方式的框图,带宽扩展编码器1000可对应于图5所示的带宽扩展编码器500。相应地,图5和图10所示的实施方式中相同的块用相同的标号表示。带宽扩展编码器1000的信号分析器110包括信号分类器1010,其中信号分类器1010被配置为对从音频信号101-1获得的低频信号101-2进行分类,从而基于信号分类器1010提供的分类信号的信号特性确定对应于分析窗函数的窗口指示1011。此外,编码器1000包括窗口控制器1020,用于基于由信号分类器1010确定的窗口指示1011提供窗口控制信息1021。带宽扩展编码器1000的参数计算器1030包括受窗口控制器1020控制的窗口器,其中参数计算器1030的窗口器被配置为基于窗口控制信息1021将分析窗函数应用于高频信号101-4,从而获得BWE参数1031。带宽扩展编码器1000可包括核心编码器120,其用于编码低频信号101-2,从而获得编码的低频信号121。另外,可选地,带宽扩展编码器1000还可包括由虚线块表示的核心解码器1050,其被配置为解码编码的低频信号121,从而获得解码的低频信号1051(虚线箭头)。相应地,可选地,信号分类器1010可被配置为分析/分类解码的低频信号1051,从而确定窗口指示1011。编码的低频信号121和BWE参数1031还可提供给输出接口1040,其中输出接口1040被配置为提供不包括窗口指示1011的编码的音频信号1041。这里,编码的音频信号1041可对应于图5所示的编码的音频信号531。
在这种情况下,窗口指示不包含在编码器侧的编码音频信号内(图10),也就是说,如下所述,窗口指示也必须在解码器侧确定(图11)。
图11示出了带宽扩展解码器1100的另一实施方式的框图,其可对应于图6所示的带宽扩展编码器600。相应地,图6和图11实施方式中的相同块由相同的标号表示。具体地,带宽扩展解码器1100包括核心解码器680,其用于解码编码的低频信号601-2,从而获得解码的低频信号681-1。带宽扩展解码器1100的修补模块220包括信号分类器1110,其被配置为分析/分类解码的低频信号681-1,以基于分析的信号的信号特性确定对应于分析窗函数的窗口指示1111。此外,解码器1100包括用于基于由信号分类器1110确定的窗口指示111提供窗口控制信息1121的窗口控制器1120。另外,解码器1100可包括BWE模块1130,其可被配置为修补模块220将基于解码的低频信号681-1生成修补信号671,基于窗口控制信息1121和上频带参数601-3生成分析窗函数。还可通过组合器690组合修补信号671和解码的低频信号681-1,从而获得组合的输出信号691。
上述实施方式的分析-合成方案还可在相位声码器实施中使用。因此,图12示出了相位声码器处理器1200的实施方式的框图。用于处理音频信号1201的相位声码器处理器1200可包括分析窗口器1210、时/频转换器1220、频域处理器1230、频/时转换器1240、合成窗口器1250、比较器1260和重叠加法器1270。具体地,分析窗口器1210可被配置为将多个分析窗函数111-1应用于音频信号1201或从诸如虚线箭头所表示的解码的低频信号1202的音频信号所获得的信号(音频信号1201具有音频样本块,该块具有一定时间长度),从而获得多个窗口化的音频信号1211。时/频转换器1220可被配置为将窗口化音频信号1211转换为频谱1221。频域处理器1230可被配置为在频域内处理频谱1221,从而获得改进的频谱。频/时转换器1240可被配置为将改进的频谱1231转换为改进的时域信号1241。合成窗口器1250可被配置为将多个合成窗函数应用于改进的时域信号1241,其中,合成窗函数与分析窗函数匹配,从而获得窗口化改进的时域信号1251。比较器1260可进一步被配置为基于多个窗口化改进的时域信号1251和音频信号1201或由诸如解码的低频信号1202(虚线)的音频信号所获得的信号之间的比较,确定多个比较参数,其中,多个比较参数对应于多个分析窗函数,并且比较器1260被进一步配置为选择比较参数满足预定条件的分析窗函数和合成窗函数。这里,需要注意的是,比较器1260所选择的分析窗函数和合成窗函数可以在上述实施方式的背景下所描述的类似的方式确定。具体地,可按照图7所示的实施方式来实现比较器1260。然后,所选的分析窗函数和合成窗函数可用于起始于图12所示的处理链中的比较器1260之前的分析窗口器1210并终结于合成窗口器1250的信号路径中,使得在合成窗口器1250的输出获得特定(优化的)窗口化改进的时域信号1255。最后,重叠加法器1270可被配置为对已经过比较器1260所选的分析窗函数和合成窗函数改进的窗口化改进的时域信号1255的重叠连续块进行相加,从而获得时间直扩信号(temporally spreadsignal)1271。
具体地,通过使窗口化改进的时域信号1255的重叠连续块彼此之间的间隔距离大于原始音频信号1201或解码的低频信号1202的相应块之间的距离,可获得时间直扩信号1271。另外,这里用作信号直扩器的重叠加法器1270还可被配置为时间上直扩音频信号1201或解码的低频信号1202,即,信号的基音不会变化,从而引起“纯时间延长”的场景。
可替换地,在处理链中,比较器1260也可设置在重叠加法器1270之后,使得重叠加法器1270也将包括在分析-合成方案中,在这种情况下的范围内,其是有利的,由重叠加法器1270处理的不同的窗口化改进的时域信号1251的效果还可由随后的比较/窗口选择说明。
在另外的替代实施方式中,相位声码器1200还可包括为例如简单采样率转换器形式的抽取器,其中,抽取器可被配置为抽取(压缩)直扩的信号,从而将获得在带宽扩展算法的目标频率范围内抽取的信号。
在另外的可替换实施方式中,为了选择适合分析的音频信号的信号特性的最佳分析窗函数,相位声码器处理器还可被实施为直接分析输入音频信号。具体地,已经发现,一定的信号受益于相位声码器的专门分析窗口。例如,通过采用例如Tukey窗口可更好地分析噪声信号,同时,主要的音调信号受益于由例如巴特利特窗口提供的传递函数的小主瓣。
总之,由此可见,可仅在编码器侧(例如:图3和图8的带宽扩展编码器300和800内)进行选择最佳窗函数的步骤,然后,其中所提供的窗口指示被传输到解码器侧(例如:图4的带宽扩展解码器400),或可在编码器和解码器侧(例如:图5和图6的带宽扩展编码器/解码器500和600或图10和图11的带宽扩展编码器/解码器1000和1100)进行选择最佳窗函数的步骤。
在这方面,其优点在于,在后一种情况下,窗口指示在编码的音频信号内不存储为附加的旁信息,从而可降低存储或传输编码的音频信号的比特率。
图13示出了装置1300的实施方式,该装置可用于根据可用于相位声码器应用的时-频变换的控制信息在不同分析和合成窗口之间切换。进入的比特流1301-1可由数据流解释器解释,数据流解释器被实施为从音频数据1301-3分离控制信息1301-2。此外,根据控制信息1031-2,多个分析窗口1311-2中的分析窗函数1311-1可应用于音频数据1301-3。这里,例如,多个分析窗口1311-2包括由块“分析窗口1”到块“分析窗口4”表示的四个不同的分析窗口,其中块“分析窗口1”是指应用的分析窗口1311-1。具体地,控制信息1301-2已经由分别如上所述的信号特性或分析-合成方案的直接计算获得。在噪声信号的情况下,例如可选择Tukey窗口,而在音调信号的情况下,例如可选择巴特利特窗口。也可称为余弦锥形窗口的Tukey窗口可想象成宽度为(1.0-α·2)N的矩形窗口围绕宽度为(α·2)N的余弦瓣。Tukey窗口可表示为:
其中,随着参数α从0变成单位一时,窗口从矩形窗口演变成汉宁窗口。表示三角形窗口的巴特利特窗口可表示为:
在式子(1)和(2)中,n为整数值,N为时-离散窗函数w(n)的宽度(样本内)。
应用分析窗口1311-1后所获得的窗口化音频信号还可在由“时-频变换”表示的块1320中从时域变换为频域。然后,可在由“频域处理”表示的块1330中处理所获得的频谱。具体地,块1330可包括用于改进的频谱的频谱值的相位的调相器。然后,处理的频谱可在由“频-时变换”表示的块1340中变换回时域,从而获得改进的时域信号。最后,根据控制信息1301-2,由“合成窗口1”到“合成窗口4”表示的多个合成窗口1351-2中的合成窗口1351-1可应用到改进的时域信号上,从而在来自由加号表示的块1360中所有可能的信号路径的贡献进行相加后,在装置1300的输出获得窗口化改进的时域信号1361,其中,合成窗口1351-1补偿分析窗口1311-1的效果。
图14示出了相位声码器驱动的带宽扩展解码器1400的实施方式的概述。具体地,数据音频流1411-1可分成编码的低频信号1411-2和HBE/SBR数据1411-3。编码的低频信号1411-2可由核心解码器1420解码,从而获得包括核心频带1425的解码的低频信号1421。例如,解码的低频信号1421可表示帧大小为1024的脉冲编码调制(PCM)数据。解码的低频信号1421还提供到延迟级1430,从而获得延迟的信号1431。然后,延迟的信号1431被输入到32带正交镜像滤波器(QMF)分析组1440,以例如生成延迟信号1431的32个子频带1441。HBE/SBR数据1411-3可包括用于控制修补开关1450的控制信息,其中,修补开关1450被配置为在SBR修补算法和HBE修补算法之间切换。在SBR修补算法的情况下,子频带1441被提供给SBR修补设备1460-1,从而获得修补QMF数据1461。出现在SBR修补设备1460-1的输出端的修补QMF数据1461被提供给例如包括噪声填充单元1470-2、缺失谐波重建单元1470-3或反向过滤单元1470-4的HBE/SBR工具1470-1。具体地,HBE/SBR工具1470-1可执行在修补QMF数据1461上使用的已知频带复制技术。例如,SBR修补设备1460-1所使用的修补算法可使用频域内频谱数据的镜像或拷贝。此外,HBE/SBR工具1470-1受HBE/SBR数据1411-3的控制。修补QMF数据1461和HBE/SBR工具1470-1的输出1471被提供给包络格式器1470。包络格式器1470被实施为调整所生成的修补的包络,使得生成包括上频带的包络调整修补信号。包络调整信号1471被提供给被配置为将上频带的成分与频域1441的音频信号组合的QMF合成组1480。最后,获得由“波形”表示的合成音频信号1481。
在HBE修补算法(块1460-2)的情况下,可通过下采样器1490将解码的低频信号1421下采样例如因子2,从而获得下采样版本的解码的低频信号1491。下采样信号1491还可以使用相位声码器的谐波带宽扩展算法的高级处理方案进行处理。
一方面,通过利用在当瞬态检测器1485在解码的低频信号块1424中未检测出瞬态事件时由“否”表示的信号路径1500所示的标准算法和当在该块中检测到瞬态事件时起始于补零操作(块1515)由“是”表示的信号路径1510所示的高级算法之间的切换,可采用信号相关的处理方案。
另一方面,实际上,如之前已经详细描述的,可以时-频变换实现方式在相位声码器内进行分析窗口特性的信号相关的切换。具体地,在图14中,由1520、1530指示的虚线框表示可通过信令改变的窗口。基本上,图14示出了图13的实施方式在相位声码器驱动的带宽扩展中的应用。
这里,由“FFT”(快速傅里叶变换)、“相位自适应法”和“iFFT”(逆快速傅里叶变换)表示的块可分别对应于图13所示的块1320、1330和1340。具体来说,FFT和iFFT处理块可被实施为分别将短时傅里叶变换(STFT)或离散傅里叶变换(DFT)以及逆短时傅里叶变换(iSTFT)或逆离散傅里叶变换(iDFT)应用于解码的低频信号块1421。另外,图14所示的带宽扩展解码器1400还可包括提升采样级1540、重叠添加(OLA)级1550和提取级1560。
需要注意的是,通过上述概念,能够在音频信号的任意位置处的不同的窗口之间进行切换。
尽管已经结合框图对本发明进行了描述,方框图中的块表示实际或逻辑的硬件部件,但是本发明还可通过计算机执行的方法来实现。在后一种情况下,方框表示对应的方法步骤,其中这些步骤代表由对应的逻辑或物理硬件块执行的功能。
所描述的实施方式仅仅是用来说明本发明的原理。应理解到,对于本领域的技术人员显而易见的是,可对本文中所描述的配置以及细节进行修改和变化。因此,意指本申请仅仅受随后的专利权利要求书的限制,而不受以本文中的实施方式的描述和解释所给出的具体细节的限制。
根据本发明方法的一定实施要求,本发明方法可在硬件或软件中实施。该实施可使用数字存储介质(具体地,磁盘、DVD或其上存储有电可读控制信号的CD)来实现,这些数字存储介质与可编程计算机系统协作,从而执行本发明的方法。因此,通常,本发明可实现为具有存储在可机读载体上的程序代码的计算机程序产品,当计算机程序产品在计算机上运行时,通过运行程序代码来执行本发明的方法。因此,换言之,本发明的方法是,具有计算机程序在计算机上运行时,用于执行至少一种本发明方法的程序代码的计算机程序。本发明的编码音频信号可存储在任意可机读存储介质上,例如数字存储介质。
该新颖的处理的优点在于,本申请中所记载的上述实施方式(即:装置、方法或计算机程序)可改善带宽扩展应用的感知音频质量。具体地,例如在相位声码器驱动的带宽扩展中,采用分析窗口特性的信号相关的切换。
只要是在选择最佳分析或合成窗口时考虑信号特性是有益的情况下,该新颖的处理还可用在其他相位声码器应用中,例如,纯时间延长。
所述概念允许带宽扩展在修补过程考虑信号特性。可在开环或闭环内完成最合适分析窗口的确定。因此,复原质量可被优化,从而被进一步增强。
基于带宽扩展理论的最突出的应用为音频解码器。但是,本发明的处理还可增强用于音乐制作或音频后处理的相位声码器应用。
Claims (16)
1.一种用于编码音频信号(101-1)的带宽扩展编码器(100;300;500;800;1000),所述音频信号(101-1)包括具有核心频带(101-3)的低频信号(101-2)和具有上频带(101-5)的高频信号(101-4),所述编码器(100;300;500;800;1000)包括:
信号分析器(110),用于分析所述音频信号(101-1),所述音频信号(101-1)具有音频样本块(101-6),所述块(101-6)具有指定的时间长度,其中,所述信号分析器(110)被配置为从多个分析窗口(111-1)确定用于在带宽扩展解码器(200;400;1400)中进行带宽扩展的分析窗口(111-2);
核心编码器(120),用于编码所述低频信号(101-2),以获得编码的低频信号(121);以及
参数计算器(130;320;830;1030),用于从所述高频信号(101-4)计算带宽扩展参数(131;321-2;831;1031)。
2.一种用于对编码的音频信号(201-1;401-1;601-1;1411-1)进行解码的带宽扩展解码器(200;400;600;1100;1400),所述编码的音频信号(201-1;401-1;601-1;1411-1)包括编码的低频信号(201-2;401-2;601-2;1411-2)和上频带参数(201-3;401-3;601-3;1411-3),所述解码器(200;400;600;1100;1400)包括:
核心解码器(210;410;680;1420),用于对所述编码的低频信号(201-2;401-2;601-2;1411-2)进行解码,其中,解码的低频信号(211-1;411-1;681-1;1421)具有核心频带(211-2;411-2;681-2;1425);
修补模块(220;420;1460-2),被配置为基于所述解码的低频信号(211-1;411-1;681-1;1421)和所述上频带参数(201-3;401-3;601-3;1411-3)生成修补信号(221-1;421;671;1461),其中,所述修补信号(221-1;421;671;1461)具有从所述核心频带(211-2;411-2;681-2;1425)生成的上频带(221-2);以及
组合器(230;430;690;1480),被配置为组合所述修补信号(221-1;421;671;1461)和所述解码的低频信号(211-1;411-1;681-1;1421),以获得组合的输出信号(231-1;431;691;1481)。
3.根据权利要求1所述的带宽扩展编码器(300),还包括:
窗口控制器(310),用于提供指示多个分析窗函数(111-1)的窗口控制信息(311),所述参数计算器(320)包括受所述窗口控制器(310)控制的窗口器,其中,所述窗口器被配置为对所述高频信号(101-4)应用所述多个分析窗函数(111-1)和比较器(340)所选择的分析窗函数(111-2),所述信号分析器(110)包括修补模块(330),所述修补模块被配置为基于所述低频信号(101-2)、所述窗口控制信息(311)和所述带宽扩展参数(321-1)生成多个修补信号(331-1),其中,所述修补信号(331-1)具有从所述核心频带(101-3)生成的上频带(331-2);
比较器(340),被配置为基于所述修补信号(331-1)与参考信号之间的比较来确定多个比较参数(341-2),所述参考信号为所述音频信号(101-1)或从所述音频信号获得的信号(101-4),其中,所述多个比较参数(341-2)对应于所述多个分析窗函数(111-1),并且其中,所述比较器(340)还被配置为提供与比较参数满足预定条件的分析窗函数(111-2)对应的窗口指示(341-1);和
输出接口(350),用于提供编码的音频信号(351),所述编码的音频信号(351)包括所述窗口指示(341-1)。
4.根据权利要求2所述的带宽扩展解码器(400),其中,所述编码的音频信号(401-1)包括窗口指示(401-4),并且其中,所述修补模块(420)包括可控窗口器,所述窗口器用于基于所述窗口指示(401-4)从多个分析窗函数选择分析窗函数,并用于对所述解码的低频信号(411-1)应用所选择的分析窗函数。
5.根据权利要求1所述的带宽扩展编码器(500),还包括:
窗口控制器(310),用于提供指示多个分析窗函数(111-1)的窗口控制信息(311),所述参数计算器(320)包括受所述窗口控制器(310)控制的窗口器,其中该窗口器被配置为对所述高频信号(101-4)应用所述多个分析窗函数(111-1)和比较器(510)选择的分析窗函数(111-2),所述信号分析器(110)包括修补模块(330),所述修补模块被配置为基于所述低频信号(101-2)、所述窗口控制信息(311)和所述带宽扩展参数(321-1)生成多个修补信号(331-1),其中,所述修补信号(331-1)具有从所述核心频带(101-3)产生的上频带(331-2);并且其中,所述修补模块(330)包括受所述窗口控制器(310)控制的窗口器,其中该窗口器被配置为对所述低频信号(101-2)应用所述多个分析窗函数(111-1);
比较器(510),被配置为基于所述修补信号(331-1)与从所述音频信号获得的参考低频信号(101-2)的比较来确定多个比较参数,其中,所述多个比较参数对应于所述多个分析窗函数(111-1),并且其中,所述比较器(510)还被配置为提供与比较参数满足预定条件的分析窗函数对应的窗口指示(511);以及
输出接口(530),用于提供编码的音频信号,所述编码的音频信号(531)不包括所述窗口指示(511)。
6.根据权利要求2所述的带宽扩展解码器(600),其中,所述修补模块(220)包括:
分析窗口器(610),用于对所述解码的低频信号(681-1)应用多个分析窗函数(111-1),以获得多个窗口化低频信号(611);
时/频转换器(620),用于将所述窗口化低频信号(611)转换为频谱(621);
频域处理器(630),用于在频域中处理所述频谱(621),以获得改进的频谱(631);
频/时转换器(640),用于将所述改进的频谱(631)转换为改进的时域信号(641);
合成窗口器(650),用于对所述改进的时域信号(641)应用多个窗函数,以获得窗口化的改进的时域信号(651),其中,合成窗函数与所述分析窗函数匹配;以及
比较器(660),被配置为基于多个所述窗口化的改进的时域信号(651)与所述解码的低频信号(681-1)的比较来确定多个比较参数,其中,所述多个比较参数对应于所述多个分析窗函数(111-1),并且其中,所述比较器(660)还被配置为选择比较参数满足预定条件的分析窗函数和合成窗函数,并且其中,所述修补模块(220)被配置为基于所述解码的低频信号(681-1)、所述比较器(660)选择的分析窗函数和合成窗函数以及所述上频带参数(601-3)生成修补信号(671)。
7.根据权利要求3、5或6所述的带宽扩展编码器(300;500)或解码器(600),其中,所述比较器(340;510;660;700)被配置为用于计算用于所述修补信号(331-1)或所述窗口化的改进的时域信号(651)的多个SFM参数(703-1)以及从所述音频信号(101-1)或解码的低频信号(681-1)获得的参考SFM参数(703-2),并且用于基于所述SFM参数(703-1)与所述参考SFM参数(703-2)的比较来确定多个比较参数(705)。
8.根据权利要求1所述的带宽扩展编码器(800),信号分析器(110)包括信号分类器(810;900),其中,所述信号分类器(810;900)被配置为对所述音频信号(101-1)或从所述音频信号(101-4)获得的信号进行分类,以基于经分类的信号的信号特性确定对应于分析窗函数的窗口指示(811);所述编码器(800)包括窗口控制器(820),所述窗口控制器用于基于由所述信号分类器(810)确定的窗口指示(811)提供窗口控制信息(821),所述参数计算器(830)包括受所述窗口控制器(820)控制的窗口器,其中,所述窗口器被配置为基于所述窗口控制信息(821)对所述高频信号(101-4)应用分析窗函数,并且所述编码器(800)还包括用于提供编码的音频信号(841)的输出接口(840),所述编码的音频信号(841)包括所述窗口指示(811)。
9.根据权利要求1所述的带宽扩展编码器(1000),所述信号分析器(110)包括信号分类器(900;1010),其中,所述信号分类器(900;1010)被配置为对从所述音频信号(101-1)获得的低频信号(101-2)进行分类,以基于经分类的信号的信号特性确定对应于分析窗函数的窗口指示(1011);所述编码器(1000)包括窗口控制器(1021),所述窗口控制器用于基于由所述信号分类器(900,1010)确定的窗口指示(1011)提供窗口控制信息(1021),所述参数计算器(1030)包括受所述窗口控制器(1020)控制的窗口器,其中,所述窗口器被配置为基于所述窗口控制信息(1021)对所述高频信号(101-4)应用分析窗函数,并且所述编码器(1000)还包括用于提供编码的音频信号(1041)的输出接口(1040),所述编码的音频信号(1041)不包括所述窗口指示(1011)。
10.根据权利要求5或9所述的带宽扩展编码器(500;1000),还包括:
核心解码器(520;1050),用于对编码的低频信号(121)进行解码,以获得解码的低频信号(521;1051)。
11.根据权利要求2所述的带宽扩展解码器(1100),其中,所述修补模块(220)包括:
信号分类器(900;1110),被配置为对所述解码的低频信号(681-1)进行分类,以基于经分类的信号的信号特性确定对应于分析窗函数的窗口指示(1111),所述解码器(1100)包括窗口控制器(1120),所述窗口控制器用于基于由所述信号分类器(900;1110)确定的所述窗口指示(1111)提供窗口控制信息(1121),并且其中,所述修补模块(220)被配置为基于所述解码的低频信号(681-1)生成修补信号(671);基于所述窗口控制信息(1121)和所述上频带参数(601-3)生成分析窗函数。
12.一种用于处理音频信号(1201)的相位声码器处理器(1200),包括:
分析窗口器(1210),被配置为对所述音频信号(1201)或从所述音频信号获得的信号(1202)应用多个分析窗函数(111-1),以获得多个窗口化的音频信号(1211),所述音频信号(1201)具有音频样本块(101-6),所述块(101-6)具有指定的时间长度;
时/频转换器(1220),用于将所述窗口化的音频信号(1211)转换为频谱(1221);
频域处理器(1230),用于在频域中处理所述频谱(1221),以获得改进的频谱(1231);
频/时转换器(1240),用于将所述改进的频谱(1231)转换为改进的时域信号(1241);
合成窗口器(1250),用于对所述改进的时域信号(1241)应用多个合成窗函数,以获得窗口化的改进的时域信号(1251),其中,所述合成窗函数与所述分析窗函数匹配;
比较器(1260),被配置为基于多个所述窗口化的改进的时域信号(1251)与所述音频信号(1201)或从所述音频信号获得的信号(1202)的比较来确定多个比较参数,其中,所述多个比较参数对应于所述多个分析窗函数,并且其中,所述比较器(1260)还被配置为选择比较参数满足预定条件的分析窗函数和合成窗函数;以及
重叠加法器(1270),用于对窗口化的改进的时域信号(1255)的重叠块进行相加,以获得时间直扩信号(1271),其中,所述重叠加法器(1270)被配置为用于对已通过所述比较器(1260)所选的分析窗函数和合成窗函数改进了的所述窗口化的改进的时域信号(1255)的块进行处理。
13.一种用于编码音频信号(101-1)的方法(100;300;500;1000),所述音频信号(101-1)包括具有核心频带(101-3)的低频信号(101-2)以及具有上频带(101-5)的高频信号(101-4),所述方法(100;300;500;1000)包括:
分析(110)所述音频信号(101-1),以从多个分析窗口(111-1)确定将用于在带宽扩展解码器(200;400;1400)中进行带宽扩展的分析窗口(111-2),其中,所述音频信号(101-1)具有音频样本块(101-6),所述块(101-6)具有指定的时间长度;
编码(120)所述低频信号(102-2),以获得编码的低频信号(121);以及
从所述高频信号(101-4)计算(130;320;830;1030)带宽扩展参数。
14.一种用于对编码的音频信号(201-1;401-1;601-1;1411-1)进行解码的方法(200;400;600;1100;1400),所述编码的音频信号(201-1;401-1;601-1;1411-1)包括编码的低频信号(201-2;401-2;601-2;1411-2)和上频带参数(201-3;401-3;601-3;1411-3),所述方法(200;400;600;1100;1400)包括:
对所述编码的低频信号(201-2;401-2;601-2;1411-2)进行解码(210;410;680;1420),其中,解码的低频信号(211-1;411-1;681-1;1421)包括核心频带(211-2;411-2;681-2;1425);
基于所述解码的低频信号(211-1;411-1;681-1;1421)和所述上频带参数(201-3;401-3;601-3;1411-3)生成(220;420;1460-2)修补信号(221-1;421;671;1461),其中,所述修补信号(221-1;421;671;1461)包括从所述核心频带(211-2;411-2;681-2;1425)生成的上频带(221-2);以及
组合(230;430;690;1480)所述修补信号(221-1;421;671;1461)和所述解码的低频信号(211-1;411-1;681-1;1421),以获得组合的输出信号(231-1;431;691;1481)。
15.一种编码的音频信号(103-1;351;841),包括:
编码的低频信号(121);
带宽扩展参数(131;321-2;831);以及
分析窗口(111-2),用于在带宽扩展解码器(200;400;1400)中进行带宽扩展。
16.一种计算机程序,具有当所述计算机程序在计算机上运行时执行根据权利要求13或14所述的方法的程序代码。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US22144209P | 2009-06-29 | 2009-06-29 | |
US61/221,442 | 2009-06-29 | ||
EP10153530A EP2273493B1 (en) | 2009-06-29 | 2010-02-12 | Bandwidth extension encoding and decoding |
EP10153530.0 | 2010-02-12 | ||
PCT/EP2010/059025 WO2011000780A1 (en) | 2009-06-29 | 2010-06-24 | Bandwidth extension encoder, bandwidth extension decoder and phase vocoder |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102473414A true CN102473414A (zh) | 2012-05-23 |
CN102473414B CN102473414B (zh) | 2013-11-06 |
Family
ID=42537947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800291647A Active CN102473414B (zh) | 2009-06-29 | 2010-06-24 | 带宽扩展编码器、带宽扩展解码器和相位声码器 |
Country Status (14)
Country | Link |
---|---|
US (1) | US8606586B2 (zh) |
EP (2) | EP2273493B1 (zh) |
JP (1) | JP5329714B2 (zh) |
KR (1) | KR101425157B1 (zh) |
CN (1) | CN102473414B (zh) |
AU (1) | AU2010268160B2 (zh) |
BR (1) | BRPI1010165B1 (zh) |
CA (2) | CA2856587C (zh) |
ES (2) | ES2400661T3 (zh) |
HK (2) | HK1153035A1 (zh) |
MX (1) | MX2011013610A (zh) |
PL (2) | PL2273493T3 (zh) |
RU (1) | RU2563164C2 (zh) |
WO (1) | WO2011000780A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714822A (zh) * | 2013-12-27 | 2014-04-09 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
CN104813395A (zh) * | 2012-09-17 | 2015-07-29 | 弗兰霍菲尔运输应用研究公司 | 从带宽有限音频信号生成带宽扩展信号的设备和方法 |
CN104981871A (zh) * | 2013-02-15 | 2015-10-14 | 高通股份有限公司 | 个人化带宽扩展 |
CN105264599A (zh) * | 2013-01-29 | 2016-01-20 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、音频解码器、提供编码及解码音频信息的方法、计算机程序及使用信号适应性带宽扩展的编码表示 |
CN106463133A (zh) * | 2014-03-24 | 2017-02-22 | 三星电子株式会社 | 高频带编码方法和装置,以及高频带解码方法和装置 |
CN106663449A (zh) * | 2014-08-06 | 2017-05-10 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
CN108831501A (zh) * | 2012-03-21 | 2018-11-16 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
CN109346101A (zh) * | 2013-01-29 | 2019-02-15 | 弗劳恩霍夫应用研究促进协会 | 产生频率增强音频信号的译码器和产生编码信号的编码器 |
CN112204659A (zh) * | 2018-04-25 | 2021-01-08 | 杜比国际公司 | 具有减少后处理延迟的高频重建技术的集成 |
CN113593586A (zh) * | 2020-04-15 | 2021-11-02 | 华为技术有限公司 | 音频信号编码方法、解码方法、编码设备以及解码设备 |
US11527256B2 (en) | 2018-04-25 | 2022-12-13 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11676614B2 (en) | 2014-03-03 | 2023-06-13 | Samsung Electronics Co., Ltd. | Method and apparatus for high frequency decoding for bandwidth extension |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY176904A (en) * | 2010-06-09 | 2020-08-26 | Panasonic Ip Corp America | Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus |
KR101826331B1 (ko) | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9177570B2 (en) * | 2011-04-15 | 2015-11-03 | St-Ericsson Sa | Time scaling of audio frames to adapt audio processing to communications network timing |
US9697840B2 (en) * | 2011-11-30 | 2017-07-04 | Dolby International Ab | Enhanced chroma extraction from an audio codec |
RU2725416C1 (ru) | 2012-03-29 | 2020-07-02 | Телефонактиеболагет Лм Эрикссон (Пабл) | Расширение полосы частот гармонического аудиосигнала |
CN110706715B (zh) * | 2012-03-29 | 2022-05-24 | 华为技术有限公司 | 信号编码和解码的方法和设备 |
EP2720222A1 (en) | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
KR101757349B1 (ko) | 2013-01-29 | 2017-07-14 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 부대역들의 시간적 평활을 이용하여 주파수 향상 신호를 발생시키는 장치 및 방법 |
EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
EP3063761B1 (en) | 2013-10-31 | 2017-11-22 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
EP2881943A1 (en) | 2013-12-09 | 2015-06-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal with low computational resources |
KR102386736B1 (ko) * | 2014-03-03 | 2022-04-14 | 삼성전자주식회사 | 대역폭 확장을 위한 고주파 복호화 방법 및 장치 |
CN111710342B (zh) * | 2014-03-31 | 2024-04-16 | 弗朗霍弗应用研究促进协会 | 编码装置、解码装置、编码方法、解码方法及程序 |
KR102191506B1 (ko) * | 2014-05-14 | 2020-12-16 | 삼성전자주식회사 | 통신 시스템에서 송신 신호 처리 장치 및 방법 |
CN104007977A (zh) * | 2014-06-09 | 2014-08-27 | 威盛电子股份有限公司 | 电子装置及音频播放方法 |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
CN104269173B (zh) * | 2014-09-30 | 2018-03-13 | 武汉大学深圳研究院 | 切换模式的音频带宽扩展装置与方法 |
US10117247B2 (en) * | 2015-03-13 | 2018-10-30 | Futurewei Technologies, Inc. | Windowing methods for efficient channel aggregation and deaggregation |
KR101642112B1 (ko) | 2015-10-29 | 2016-07-22 | 주식회사 님버스 | 이동통신망에서 실시간 멀티미디어를 송수신하기 위한 모뎀 본딩 시스템 및 방법 |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
KR101688647B1 (ko) | 2016-04-04 | 2016-12-22 | 주식회사 님버스 | 이동통신망에서 실시간 저지연 전송을 위한 모뎀 본딩 시스템 및 방법 |
RU169931U1 (ru) * | 2016-11-02 | 2017-04-06 | Акционерное Общество "Объединенные Цифровые Сети" | Устройство сжатия аудиосигнала для передачи по каналам распространения данных |
WO2018101868A1 (en) * | 2016-12-02 | 2018-06-07 | Dirac Research Ab | Processing of an audio input signal |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998002971A1 (en) * | 1996-07-11 | 1998-01-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A method of coding and decoding audio signals |
WO1998057436A2 (en) * | 1997-06-10 | 1998-12-17 | Lars Gustaf Liljeryd | Source coding enhancement using spectral-band replication |
WO2001026095A1 (en) * | 1999-10-01 | 2001-04-12 | Coding Technologies Sweden Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
EP1672618A1 (en) * | 2003-10-07 | 2006-06-21 | Matsushita Electric Industrial Co., Ltd. | Method for deciding time boundary for encoding spectrum envelope and frequency resolution |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
DE10084385T1 (de) * | 1999-08-31 | 2002-08-01 | Mitsubishi Paper Mills Ltd | Elektronenannehmende Verbindung und wärmeempfindliches Aufzeichnungsmaterial |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6636830B1 (en) * | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US7389226B2 (en) * | 2002-10-29 | 2008-06-17 | Ntt Docomo, Inc. | Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard |
WO2004072956A1 (en) | 2003-02-11 | 2004-08-26 | Koninklijke Philips Electronics N.V. | Audio coding |
WO2005036806A2 (en) | 2003-10-08 | 2005-04-21 | Unisys Corporation | Scalable partition memory mapping system |
DE102004009954B4 (de) * | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
JP2007304258A (ja) * | 2006-05-10 | 2007-11-22 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化およびその復号化装置、方法ならびにプログラム |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
-
2010
- 2010-02-12 PL PL10153530T patent/PL2273493T3/pl unknown
- 2010-02-12 ES ES10153530T patent/ES2400661T3/es active Active
- 2010-02-12 EP EP10153530A patent/EP2273493B1/en active Active
- 2010-06-24 CN CN2010800291647A patent/CN102473414B/zh active Active
- 2010-06-24 BR BRPI1010165-9A patent/BRPI1010165B1/pt active IP Right Grant
- 2010-06-24 MX MX2011013610A patent/MX2011013610A/es active IP Right Grant
- 2010-06-24 KR KR1020117031327A patent/KR101425157B1/ko active IP Right Grant
- 2010-06-24 CA CA2856587A patent/CA2856587C/en active Active
- 2010-06-24 EP EP10725483.1A patent/EP2449554B1/en active Active
- 2010-06-24 RU RU2012102411/08A patent/RU2563164C2/ru active
- 2010-06-24 PL PL10725483T patent/PL2449554T3/pl unknown
- 2010-06-24 CA CA2766573A patent/CA2766573C/en active Active
- 2010-06-24 ES ES10725483.1T patent/ES2534944T3/es active Active
- 2010-06-24 JP JP2012518070A patent/JP5329714B2/ja active Active
- 2010-06-24 AU AU2010268160A patent/AU2010268160B2/en active Active
- 2010-06-24 WO PCT/EP2010/059025 patent/WO2011000780A1/en active Application Filing
-
2011
- 2011-07-08 HK HK11107088.5A patent/HK1153035A1/xx unknown
- 2011-12-22 US US13/335,096 patent/US8606586B2/en active Active
-
2012
- 2012-11-01 HK HK12111016.3A patent/HK1170331A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998002971A1 (en) * | 1996-07-11 | 1998-01-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A method of coding and decoding audio signals |
WO1998057436A2 (en) * | 1997-06-10 | 1998-12-17 | Lars Gustaf Liljeryd | Source coding enhancement using spectral-band replication |
WO2001026095A1 (en) * | 1999-10-01 | 2001-04-12 | Coding Technologies Sweden Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
EP1672618A1 (en) * | 2003-10-07 | 2006-06-21 | Matsushita Electric Industrial Co., Ltd. | Method for deciding time boundary for encoding spectrum envelope and frequency resolution |
Non-Patent Citations (1)
Title |
---|
FREDERIK NAGEL ET AL: "A harmonic bandwidth extension method for audio codecs", 《ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2009. ICASSP 2009. IEEE INTERNATIONAL CONFERENCE ON》, 24 April 2009 (2009-04-24) * |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108831501B (zh) * | 2012-03-21 | 2023-01-10 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
CN108831501A (zh) * | 2012-03-21 | 2018-11-16 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
CN104813395B (zh) * | 2012-09-17 | 2017-11-24 | 弗劳恩霍夫应用研究促进协会 | 从带宽有限音频信号生成带宽扩展信号的设备和方法 |
CN104813395A (zh) * | 2012-09-17 | 2015-07-29 | 弗兰霍菲尔运输应用研究公司 | 从带宽有限音频信号生成带宽扩展信号的设备和方法 |
US10580415B2 (en) | 2012-09-17 | 2020-03-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
US9997162B2 (en) | 2012-09-17 | 2018-06-12 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
CN105264599A (zh) * | 2013-01-29 | 2016-01-20 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、音频解码器、提供编码及解码音频信息的方法、计算机程序及使用信号适应性带宽扩展的编码表示 |
CN109346101B (zh) * | 2013-01-29 | 2024-05-24 | 弗劳恩霍夫应用研究促进协会 | 产生频率增强音频信号的译码器和产生编码信号的编码器 |
CN109346101A (zh) * | 2013-01-29 | 2019-02-15 | 弗劳恩霍夫应用研究促进协会 | 产生频率增强音频信号的译码器和产生编码信号的编码器 |
CN105264599B (zh) * | 2013-01-29 | 2019-05-10 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、音频解码器、提供编码音频信息的方法 |
CN104981871B (zh) * | 2013-02-15 | 2018-01-02 | 高通股份有限公司 | 个人化带宽扩展 |
CN104981871A (zh) * | 2013-02-15 | 2015-10-14 | 高通股份有限公司 | 个人化带宽扩展 |
CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
CN103714822A (zh) * | 2013-12-27 | 2014-04-09 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
US11676614B2 (en) | 2014-03-03 | 2023-06-13 | Samsung Electronics Co., Ltd. | Method and apparatus for high frequency decoding for bandwidth extension |
US10909993B2 (en) | 2014-03-24 | 2021-02-02 | Samsung Electronics Co., Ltd. | High-band encoding method and device, and high-band decoding method and device |
CN106463133A (zh) * | 2014-03-24 | 2017-02-22 | 三星电子株式会社 | 高频带编码方法和装置,以及高频带解码方法和装置 |
CN106463133B (zh) * | 2014-03-24 | 2020-03-24 | 三星电子株式会社 | 高频带编码方法和装置,以及高频带解码方法和装置 |
CN111105806B (zh) * | 2014-03-24 | 2024-04-26 | 三星电子株式会社 | 高频带编码方法和装置,以及高频带解码方法和装置 |
CN111105806A (zh) * | 2014-03-24 | 2020-05-05 | 三星电子株式会社 | 高频带编码方法和装置,以及高频带解码方法和装置 |
US11688406B2 (en) | 2014-03-24 | 2023-06-27 | Samsung Electronics Co., Ltd. | High-band encoding method and device, and high-band decoding method and device |
US10468035B2 (en) | 2014-03-24 | 2019-11-05 | Samsung Electronics Co., Ltd. | High-band encoding method and device, and high-band decoding method and device |
CN106663449A (zh) * | 2014-08-06 | 2017-05-10 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
US11810591B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11823694B2 (en) | 2018-04-25 | 2023-11-21 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11527256B2 (en) | 2018-04-25 | 2022-12-13 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
CN112204659B (zh) * | 2018-04-25 | 2021-12-17 | 杜比国际公司 | 具有减少后处理延迟的高频重建技术的集成 |
US11810592B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11810590B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11810589B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11562759B2 (en) | 2018-04-25 | 2023-01-24 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11823695B2 (en) | 2018-04-25 | 2023-11-21 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11823696B2 (en) | 2018-04-25 | 2023-11-21 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11830509B2 (en) | 2018-04-25 | 2023-11-28 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11862185B2 (en) | 2018-04-25 | 2024-01-02 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11908486B2 (en) | 2018-04-25 | 2024-02-20 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
CN112204659A (zh) * | 2018-04-25 | 2021-01-08 | 杜比国际公司 | 具有减少后处理延迟的高频重建技术的集成 |
CN113593586A (zh) * | 2020-04-15 | 2021-11-02 | 华为技术有限公司 | 音频信号编码方法、解码方法、编码设备以及解码设备 |
Also Published As
Publication number | Publication date |
---|---|
EP2273493A1 (en) | 2011-01-12 |
PL2449554T3 (pl) | 2015-08-31 |
AU2010268160B2 (en) | 2014-03-06 |
KR20120031957A (ko) | 2012-04-04 |
CA2856587C (en) | 2016-09-13 |
RU2563164C2 (ru) | 2015-09-20 |
AU2010268160A1 (en) | 2012-02-02 |
US20120158409A1 (en) | 2012-06-21 |
HK1170331A1 (zh) | 2013-02-22 |
EP2449554B1 (en) | 2015-03-25 |
RU2012102411A (ru) | 2013-08-20 |
WO2011000780A1 (en) | 2011-01-06 |
CA2766573A1 (en) | 2011-01-06 |
KR101425157B1 (ko) | 2014-08-01 |
EP2273493B1 (en) | 2012-12-19 |
CA2856587A1 (en) | 2011-01-06 |
CA2766573C (en) | 2015-06-23 |
JP2012531632A (ja) | 2012-12-10 |
JP5329714B2 (ja) | 2013-10-30 |
US8606586B2 (en) | 2013-12-10 |
PL2273493T3 (pl) | 2013-07-31 |
ES2400661T3 (es) | 2013-04-11 |
ES2534944T3 (es) | 2015-04-30 |
CN102473414B (zh) | 2013-11-06 |
HK1153035A1 (en) | 2012-03-16 |
MX2011013610A (es) | 2012-03-26 |
EP2449554A1 (en) | 2012-05-09 |
BRPI1010165A2 (pt) | 2016-03-29 |
BRPI1010165B1 (pt) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102473414B (zh) | 带宽扩展编码器、带宽扩展解码器和相位声码器 | |
JP5551692B2 (ja) | 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム | |
CN102027537B (zh) | 利用谐波带宽扩充及非谐波带宽扩充的组合、基于输入信号表示型态产生扩充带宽信号的表示型态的装置、方法 | |
JP7126536B2 (ja) | パケット損失隠匿方法 | |
JP6229957B2 (ja) | 音声信号を再生するための装置および方法、符号化音声信号を生成するための装置および方法、コンピュータプログラム、および符号化音声信号 | |
TWI459379B (zh) | 用以把音訊樣本編碼和解碼之音訊編碼器與解碼器 | |
CN107731237B (zh) | 时域帧错误隐藏设备 | |
TWI585748B (zh) | 訊框錯誤隱藏方法以及音訊解碼方法 | |
TWI453731B (zh) | 音訊編碼器與解碼器、用於編碼已取樣音訊信號之訊框及用於解碼已編碼訊框之方法、及電腦程式產品 | |
US10373624B2 (en) | Broadband signal generating method and apparatus, and device employing same | |
AU2013314401B2 (en) | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal | |
AU2014201331B2 (en) | Bandwidth extension encoder, bandwidth extension decoder and phase vocoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Munich, Germany Patentee after: Fraunhofer Application and Research Promotion Association Address before: Munich, Germany Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. |