CN102598121B - 增强型音频解码器 - Google Patents
增强型音频解码器 Download PDFInfo
- Publication number
- CN102598121B CN102598121B CN201080049717.5A CN201080049717A CN102598121B CN 102598121 B CN102598121 B CN 102598121B CN 201080049717 A CN201080049717 A CN 201080049717A CN 102598121 B CN102598121 B CN 102598121B
- Authority
- CN
- China
- Prior art keywords
- signal
- frequency
- decoded
- audio
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 149
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000001914 filtration Methods 0.000 claims description 39
- 230000004044 response Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 19
- 230000003595 spectral effect Effects 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000013501 data transformation Methods 0.000 claims description 5
- 238000009434 installation Methods 0.000 claims description 4
- 230000010076 replication Effects 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 description 39
- 230000008569 process Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供了用于对包括带宽扩展数据的音频信号进行解码的方法、系统和装置。可以在解码器中接收包括核心音频数据和带宽扩展数据的音频信号。核心音频数据可以与音频信号的核心部分相关联,例如在截止频率以下的频率范围,并且带宽扩展数据可以与音频信号的扩展部分相关联,例如在截止频率以上的频率范围。可对核心音频数据进行解码以生成具有时域表示的经解码核心音频信号。此外,可以根据扩展数据和经解码核心音频信号来重构音频信号的扩展部分。另外,在被组合以生成经解码输出信号之前,经解码核心音频信号可被进行低通滤波并且扩展部分可被进行高通滤波。
Description
相关申请的交叉引用
本申请要求2009年8月31日提交的序号为12/551,450的美国申请的优先权。
技术领域
本公开涉及对诸如利用高效高级音频编码(HE-AAC)方案所编码的音频数据之类的音频数据的解码,并且涉及对音频数据的解码的增强。
背景技术
音频编码用于以数量减少的数据(例如比特)来表示音频信号的内容,而同时保持音频信号的质量。可以对音频信号编码以减少重构音频信号(例如用于回放)所需要存储的数据量。此外,可以利用数量减少的带宽来传输音频信号的编码表示。这样,与未编码音频信号相比,可以更快地并且通过更低的带宽连接(例如通过网络)来传输经编码音频信号。
音频编解码器(编码器-解码器)可以执行音频压缩以减小音频文件的大小。编解码器可以采用所有音频信号数据都被保持在编码信号中的无损策略,或者一些原始音频信号数据无法从编码音频信号中取回的有损策略。高效高级音频编码(HE-AAC)是一种有损音频编码方案,其已被运动图像专家组(MPEG)采用来用于音频压缩和传输,包括流传输音频。
还开发了带宽扩展策略以用于对音频信号的编码。例如,谱带宽复制(SBR)是已被采用来与HE-AAC编码和解码一起使用的带宽扩展策略。SBR数据被编码器添加到音频数据流,并且可被用于解码的接收解码器从音频数据流中解析。例如,在HE-AAC编码中,音频信号的直到截止频率为止的低频部分(或者称“核心信号”)被编码。在编码器处从音频信号的可用高频部分来确定表示音频信号的高频部分(即,所有在截止频率以上的频率)的SBR数据。生成SBR数据以使得可以在解码器处基于低频部分来重构音频信号的高频部分。此外,生成SBR数据以使得音频信号的高频部分可被重构为在感觉上与原始高频部分尽可能相似。还可以合并音频信号的低频部分和重构的高频部分以产生经解码音频信号。
带宽扩展策略依赖于滤波器组(filter bank)在时域和频域之间来变换音频信号。例如,SBR使用正交镜像滤波器(Quadrature Mirror Filter,QMF)组将音频信号的频域表示变换成时域表示(反之亦然)。QMF组被设计成在不引入混叠失真的情况下工作。然而,因为QMF滤波器组对音频信号的整个频率范围进行合成,所以某种失真仍然可能被引入到信号的低频部分中。
发明内容
与音频信号的高频部分相关的失真可在解码期间被隔离。这样,与音频信号的高频部分相关的失真在解码期间不被引入到相应的低频部分(即核心信号)中。此外,可以实现对利用带宽扩展策略(例如SBR)所编码的音频信号进行解码的处理,以使得与当不存在高频分量时相比,音频信号的经解码低频部分不会具有更多失真。音频信号的频率范围因此可被扩展,例如超过人耳的正常操作范围,而不降低质量或者显著增大音频信号的大小或传输音频信号所需的带宽。
本发明的发明人认识到需要将在对音频信号的高频SBR部分的解码期间产生的失真(例如QMF失真)隔离。本发明的发明人还认识到需要通过将与HE-AAC解码器QMF合成滤波器组和QMF分析滤波器组相关联的系数替换为提供核心AAC信号的改进频域表示的系数,来减少失真。此外,还认识到需要允许在低功率和高功率解码选项之间进行选择。
本发明的发明人还认识到需要在对扩展了带宽的音频信号(例如HE-AAC信号)的低频部分的解码期间绕过滤波器组,例如QMF滤波器组。还认识到需要防止信号的低频部分变换到频域中并且在解码期间变换回时域中。此外,本发明的发明人认识到需要在将音频信号的低频部分和音频信号的高频部分相组合之前分别对它们进行滤波以减少向经解码音频信号的失真引入。因此,这里描述的技术和装置实现了用于利用编码方案来对高质量音频信号进行编码而不向核心音频信号引入另外的失真,其中所述编码方案采用带宽扩展策略,例如HE-AAC。
一般地,在一个方面中,该技术可被实现为包括:在音频解码器中接收与音频信号的核心部分相关联的核心音频数据以及与所述音频信号的扩展部分相关联的扩展数据;对所述核心音频数据进行解码,以生成具有时域表示的经解码核心音频信号;根据所述扩展数据和所述经解码核心音频信号来生成所述音频信号的重构扩展部分;利用高通滤波器对所述音频信号的重构扩展部分进行滤波,以生成重构输出信号;以及将所述经解码核心音频信号和所述重构输出信号相组合,以生成经解码输出信号。
所述技术还可被实现为使得生成所述音频信号的重构扩展部分还包括:利用滤波器组将所述音频信号的重构扩展部分变换成时域表示。此外,所述技术可被实现为使得所述滤波器组是复数正交镜像滤波器组。另外,所述技术可被实现为使得所述扩展数据是谱带复制数据。此外,所述技术还可被实现为包括:在所述组合之前利用低通滤波器对所述经解码核心音频信号进行滤波。所述技术还可被实现为包括:配置所述高通滤波器和所述低通滤波器使其具有等于平坦频率响应的组合频谱响应。
一般地,在另一方面中,该技术可被实现为一种编码在计算机可读介质上的计算机程序产品,其可操作来使得数据处理装置执行包括以下各项的操作:在音频解码器中接收与音频信号的核心部分相关联的核心音频数据以及与所述音频信号的扩展部分相关联的扩展数据;对所述核心音频数据进行解码,以生成具有时域表示的经解码核心音频信号;根据所述扩展数据和所述经解码核心音频信号来生成所述音频信号的重构扩展部分;利用高通滤波器对所述音频信号的重构扩展部分进行滤波,以生成重构输出信号;以及将所述经解码核心音频信号和所述重构输出信号相组合,以生成经解码输出信号。
所述技术还可被实现为还可操作来使得数据处理装置执行包括以下操作在内的操作:利用滤波器组将所述音频信号的重构扩展部分变换成时域表示。另外,所述技术可被实现为还可操作来使得数据处理装置执行包括以下操作在内的操作:解析接收到的比特流以使所述核心音频数据和所述扩展数据分离。此外,所述技术可被实现为还可操作来使得数据处理装置执行包括以下操作在内的操作:在所述组合之前利用低通滤波器对所述经解码核心音频信号进行滤波。此外,所述技术可被实现为还可操作来使得数据处理装置执行包括以下操作在内的操作:配置所述高通滤波器和所述低通滤波器使其具有等于平坦频率响应的组合频谱响应。另外,所述技术可被实现为还可操作来使得数据处理装置执行包括以下操作在内的操作:基于所述经解码核心音频信号的至少一部分来生成子带信号;以及根据所述扩展数据来选择用于生成所述重构扩展部分的子带信号。
一般地,在另一方面中,该主题可被实现为包括:对与截止频率以下的音频信号部分相对应的低频音频数据进行解码,以生成具有时域表示的经解码低频信号;根据扩展数据和所述经解码低频信号的至少一部分来生成高频音频数据;利用滤波器组将所述高频音频数据变换成时域表示,以生成经解码高频信号;对所述经解码低频信号和所述经解码高频信号中的至少一者进行滤波以减少失真;以及将所述经解码低频信号和所述经解码高频信号相组合,以生成经解码输出信号。
此外,所述技术可被实现为使得生成高频音频数据还包括:基于所述经解码低频信号的至少一部分来生成子带信号;以及根据所述扩展数据来选择用于生成所述高频音频数据的子带信号。所述技术还可被实现为包括:在变换所述高频音频数据之前抵消所生成的子带信号。另外,所述技术可被实现为使得滤波步骤还包括:利用与所述滤波器组的响应相匹配的低通滤波器对所述经解码低频信号进行滤波。
所述技术还可被实现为使得所述滤波器组包括正交镜像滤波器组。此外,所述技术可被实现为使得滤波步骤还包括:利用低通滤波器对所述经解码低频信号进行滤波并且利用高通滤波器对所述经解码高频信号进行滤波,其中所述低通滤波器和所述高通滤波器对于所述音频信号的频率范围的一部分是重叠的。
一般地,在另一方面中,该技术可被实现为一种编码在计算机可读介质上的计算机程序产品,其可操作来使得数据处理装置执行包括以下各项的操作:对与截止频率以下的音频信号部分相对应的低频音频数据进行解码,以生成具有时域表示的经解码低频信号;根据扩展数据和所述经解码低频信号的至少一部分来生成高频音频数据;利用滤波器组将所述高频音频数据变换成时域表示,以生成经解码高频信号;对所述经解码低频信号和所述经解码高频信号中的至少一者进行滤波以减少失真;以及将所述经解码低频信号和所述经解码高频信号相组合,以生成经解码输出信号。
所述技术还可被实现为还可操作来使得数据处理装置执行包括以下操作在内的操作:基于所述经解码低频信号的至少一部分来生成子带信号;以及根据所述扩展数据来选择用于生成所述高频音频数据的子带信号。此外,所述技术可被实现为还可操作来使得数据处理装置执行包括以下操作在内的操作:在变换所述高频音频数据之前抵消所生成的子带信号。另外,所述技术可被实现为还可操作来使得数据处理装置执行包括以下操作在内的操作:解析接收到的比特流以使所述低频音频数据和所述扩展数据分离。
所述技术还可被实现为还可操作来使得数据处理装置执行包括以下操作在内的操作:利用低通滤波器对所述经解码低频信号进行滤波并且利用高通滤波器对所述经解码高频信号进行滤波,其中所述低通滤波器和所述高通滤波器对于所述音频信号的频率范围的一部分是重叠的。
一般地,在另一方面中,该主题可被实现为一种系统,该系统包括被配置来接收音频比特流的输入以及包括处理器电子装置的音频解码器,所述处理器电子装置被配置来执行包括以下各项的操作:对与所述音频比特流相关联的低频音频数据进行解码以生成经解码低频信号,所述低频音频数据对应于截止频率以下的音频信号部分;根据与所述音频比特流相关联的扩展数据和所述经解码低频信号的至少一部分来生成高频音频数据;利用滤波器组将所述高频音频数据变换成时域表示以生成经解码高频信号;对所述经解码低频信号和所述经解码高频信号中的至少一者进行滤波以减少失真;以及将所述经解码低频信号和所述经解码高频信号相组合以生成经解码输出信号。
所述技术还可被实现为使得所述音频解码器还包括:高通滤波器和低通滤波器,被配置为具有等于平坦频率响应的组合频谱响应。此外,所述技术可被实现为使得所述高通滤波器和所述低通滤波器对于频率范围的一部分是重叠的。另外,所述技术可被实现为使得所述音频解码器还包括延迟元件,该延迟元件被配置来延迟所述经解码低频信号。此外,所述技术可被实现为使得与所述延迟元件相关联的延迟持续时间对应于所述滤波器组的处理延迟。此外,所述技术可被实现为使得所述音频解码器还包括:分析滤波器组,被配置为基于所述经解码低频信号的至少一部分来生成子带信号;以及抵消器,被配置为将所生成的子带信号清零。另外,所述技术可被实现为使得所述滤波器组包括正交镜像滤波器组。
可以实现本说明书中所描述的技术以获得下列优点中的一个或多个。例如,该技术可被实现为使得:可以使用采用了带宽扩展的音频编码方案来对高质量音频信号进行编码,该高质量音频信号例如具有延伸超过人耳的正常操作范围的音频频谱。此外,该技术可被实现为使得:与信号的扩展部分相关联的延迟不被引入到信号的核心部分中。该技术还可被实现为:提供一种经解码HE-AAC信号,其中相对于相应的AAC信号,核心AAC信号的质量未被折衷。
此外,该技术可被实现为:允许针对解码路径的至少一部分而绕过一个或多个滤波器组。这样,对于解码信号的至少一部分,可以避免向频域表示的转换以及返回时域表示的转换。该技术还可被实现为:允许使用互补的低通滤波器和高通滤波器,以从经解码音频信号的相应部分消除失真。另外,该技术可被实现为:允许响应于一个或多个因素(例如计算资源或者电池功率),在基于旁路实现方式和修改后滤波系数实现方式的解码选项之间进行选择。
在附图和下面的描述中给出了一个或多个实现方式的细节。其他特征和优点将从该描述和附图以及权利要求中变得明显。
附图说明
图1示出被配置为对扩展了带宽的音频信号进行解码的修改型音频解码器。
图2示出示例性修改型QMF组的典型低通滤波器的目标频率响应。
图3示出描述用于对扩展了带宽的音频信号进行解码的示例性处理的流程图。
图4示出被配置为对扩展了带宽的音频信号进行解码的修改型音频解码器(包括旁路)。
图5示出与核心解码器和QMF合成滤波器组的输出的白噪声信号相关的示例性失真水平。
图6示出对白噪声信号的经解码低频部分进行低通滤波并且对白噪声信号的经解码高频部分进行高通滤波的示例。
图7示出白噪声信号的低通和高通滤波之后的示例性失真水平。
在说明书和附图的各处,相似标号表示相似元件。
具体实施方式
被配置来实现带宽扩展方案的编解码器可适合用于高质量音频信号而非低比特音频信号,或者除了低比特率音频信号之外还适合用于高质量音频信号。例如,可以利用SBR数据对高质量高比特率音频信号的一部分(例如高频部分)进行编码。此外,可以实现解码器来防止与处理利用SBR数据所编码的部分相关的失真被引入到信号的其余部分(例如低频部分)。图1示出被配置为对带宽扩展了的音频信号进行解码的修改型音频解码器。修改型音频解码器100可以接收与利用带宽扩展方案编码的音频信号相对应的音频比特流102,例如HE-AAC比特流。音频比特流102可以包括与该音频比特流的核心部分相关联的核心数据。例如,核心数据可以表示原始音频信号的低频(或者低频带)部分,该部分例如可以针对截止频率来定义。可以基于目标比特率来选择低频部分的带宽并且因而来选择截止频率。表明截止频率的数据可被编码在音频比特流102中。此外,音频比特流102可以包括定义了原始音频信号在截止频率以上的一部分的带宽扩展数据,例如SBR数据。核心数据和带宽扩展数据可按任何方式(包括通过复用)布置在音频比特流102中。
接收到的音频比特流102可被传送到比特流解析器104,比特流解析器104可以将比特流数据分离,例如解复用。例如,比特流解析器104可以从音频比特流102中划分(或者提取)核心数据并且生成核心数据流。核心数据流可被提供到核心信号解码器106以供解码。此外,比特流解析器104可以从音频比特流102划分带宽扩展数据,并且生成谱带复制(SBR)数据流。SBR数据流可被提供到SBR处理器110以用于解码和后处理操作。在一些实现方式中,可以选择其他带宽扩展方案,并且可以生成与所选扩展方案相对应的数据流来取代SBR数据流。此外,在这样的实现方式中,SBR处理器110可被适合于所选扩展方案的处理器所取代。
核心信号解码器106对核心数据进行解码以生成经解码核心音频信号的时域表示。经解码核心音频信号可以对应于原始音频信号的低频部分,例如在0和22kHz之间的频率。例如,在音频比特流102是HE-AAC比特流的情况下,经解码核心音频信号可以对应于经解码AAC信号。
此外,经解码核心音频信号可被提供到修改型QMF分析组108,QMF分析组108可以将经解码核心音频信号变换成频域表示。QMF分析组108可以采用修改型QMF组(在下面讨论)来分析经解码核心音频信号并且生成用于重构原始音频信号的高频部分的子带信号(例如对应于32个子带)。在一些实现方式中,可以在生成子带信号之前对经解码核心音频信号进行上采样。QMF分析组108生成的子带信号可被提供到SBR处理器110和QMF合成组112。在一些实现方式中,QMF分析组108可被配置为在修改型QMF组与传统QMF组(例如与标准HE-AAC解码器相关联的QMF组)之间切换。例如,QMF分析组108可被配置为响应于检测到低功率状态或者有限的资源而从修改型QMF组切换。
SBR处理器110利用SBR数据流和从QMF分析组108接收到的低频子带信号来重构原始音频信号的高频部分。SBR处理器110可被配置为基于SBR数据来选择用于生成高频子带信号的一个或多个低频子带信号。此外,SBR处理器110可被配置为调节所生成的高频子带信号的包络以生成重构的音频信号高频部分。
QMF分析组108生成的低频子带信号和SBR处理器110生成的重构的音频信号高频部分被提供给修改型QMF合成组112。为了确保正确的定时,QMF分析组108输出的低频子带信号可被延迟,以与来自SBR处理器110的高频信号的输出相一致。QMF合成组112将由低频子带信号所表示的低频部分与重构的高频部分相组合以生成经解码音频信号。
QMF合成组112可被配置为使用修改型QMF组,该修改型QMF组被设计为减少或者消除经解码音频信号中原本在核心信号解码器106的输出处不存在的失真。QMF分析组108还可被配置为使用修改型QMF组或其改编版本。与QMF分析组108一样,QMF合成组112也可被配置为在修改型QMF组与传统的QMF组(例如与标准HE-AAC解码器相关联的QMF组)之间切换。此外,滤波器组的切换可被协调,以使得QMF分析组108和QMF合成组112被配置为使用相应的滤波器组。
修改型QMF组的典型低通滤波器可以具有中心位于所选频率(例如0kHz)的通带和表示要衰减的频率范围(例如500Hz至48kHz)的阻带。在一些实现方式中,可以在滤波器优化期间确定阻带的起始频率。可以基于典型低通滤波器来得出滤波器组中的其余滤波器,以使得与各个子带相对应的带通滤波器具有与低通滤波器相似的特性(例如频率响应)。例如,修改型QMF组可被配置为使用64个子带滤波器,其中每个滤波器具有与低通滤波器相似的频率响应但是在可被通过的频率范围方面有所移位。此外,修改型QMF组可适于将阻带中的频率衰减预定的量,例如大约70-90分贝(dB)。针对图2讨论了修改型QMF组的一种示例性实现方式。然而,各种实现方式是可能的。修改型QMF组可以包括更多数目并且因而更精确的滤波系数。此外,因为修改型QMF组的长度增大,所以可以执行滤波器设计优化以在实现目标频率响应(例如图2所示)的同时维持QMF结构所需的滤波属性。在一些实现方式中,QMF分析组108和QMF合成组112可被并非QMF类型的复数滤波器组取代,其中该复数滤波器组仍然实现目标频率响应。
QMF合成组112可以将经解码音频信号以时域表示(例如以脉冲编码调制(PCM)格式)提供到音频输出114。此外,音频输出114可以将经解码音频信号提供到例如应用或音频输出。
图2示出示例性修改型QMF组的典型低通滤波器的目标频率响应。曲线图202的x轴表示低通滤波器的归一化频率204,y轴表示按dB测得的衰减水平206。典型低通滤波器的通带的中心位于频率0处。此外,曲线208示出阻带衰减一般为90dB或者更大。在该衰减水平生成的失真可能无法被人耳检测到。修改型QMF组的其余子带滤波器各自在频率方面可被相对于低通滤波器而移位,以对应于所包括的子带(例如32或64个)中的特定一个子带。此外,修改型QMF组中的各个其余子带滤波器可被配置为具有与典型低通滤波器相似的频率响应。可以利用近似目标频率响应的任意系数来配置修改型QMF组。
图3示出描述用于对扩展了带宽的音频信号进行解码的示例性处理的流程图。扩展了带宽的音频信号可以用比特流来表示,该比特流包括与编码音频信号的核心部分(例如低频部分)相关联的核心数据以及与编码音频信号的扩展部分相关联的带宽扩展数据(例如SBR数据)。该比特流可被在解码器中接收并且被解析以将核心数据与带宽扩展数据相分离(302)。
核心数据可被解码以生成经解码核心信号(304)。核心数据可被利用核心解码器来解码,该核心解码器可以产生编码音频信号的核心部分的时域表示。例如,扩展了带宽的音频信号可以是HE-AAC比特流,并且核心数据可被利用AAC核心解码器来解码。此外,经解码核心信号可被例如利用QMF分析组来处理,以生成相应子带信号(306)。例如,经解码核心信号的时域表示的拷贝可被利用QMF分析组变换成频域表示。频域表示进一步可被划分成多个(例如32个)子带信号。经解码核心信号的时域表示的另一拷贝可被路由到存储装置或者延迟元件。
此外,可以使用子带信号和带宽扩展数据(例如SBR数据)来生成经编码音频信号的重构部分(308)。该重构部分可以对应于核心信号的频率范围以上的频率范围。带宽扩展数据可用于选择与解码核心信号相对应的一个或多个子带信号,以用于重构与经编码音频信号的扩展部分相对应的子带信号。经编码音频信号的重构的扩展部分还可被从频域变换到时域中(310)。例如,QMF合成滤波器组可以接收重构的子带信号,并且可以将它们变换成重构的输出信号的时域表示。
另外,重构的输出信号(例如对应于编码音频信号的高频部分)的时域表示可被进行高通滤波以产生经过高通滤波的输出信号(312)。高通滤波器可被配置为仅使重构的输出信号通过并且因而对频率低于通带的任何信号(包括失真)进行衰减。例如通过QMF合成滤波器组和/或高频处理生成的经解码核心信号的频率范围中的失真因而可被从重构的输出信号中去除。
此外,经解码核心信号可被进行低通滤波以生成经过低通滤波的输出信号(314)。例如,经解码核心信号可在相应的重构输出信号被进行高通滤波时由延迟元件从存储装置取回并提供。可以执行低通滤波以使得仅使经解码核心信号的频率范围通过并且过滤其他频率,包括重构的输出信号的频率范围。此外,经过低通滤波的输出信号和经过高通滤波的输出信号可被组合,以生成经解码音频信号(316)。
解码器可被实现为使得经解码信号的一部分(例如核心信号)绕过QMF滤波器组。经过旁路而路由的信号部分因而不受与QMF滤波器组中的处理相关联的失真的影响。解码器可用软件、硬件、固件或者其组合来实现。在一些实现方式中,解码器可被配置为:响应于一个或多个因素(例如检测到低功率状态或者有限资源),通过旁路来路由信号的一部分,作为对使用修改型滤波器组的替代。此外,可以响应于一个或多个因素(例如检测到低功率状态或者有限资源)而选择性地启用/禁用该旁路。图4示出被配置为对扩展了带宽的音频信号进行解码的修改型音频解码器(包括旁路)。修改型音频解码器400可以接收与利用带宽扩展方案而编码的音频信号相对应的音频比特流102,例如HE-AAC比特流。音频比特流102可以包括与该音频比特流的核心部分相关联的核心数据。例如,核心数据可以表示原始音频信号的低频部分,该部分例如可以针对截止频率来定义。可以基于目标比特率来选择低频部分的带宽并且因而来选择截止频率。表明截止频率的数据可被编码在音频比特流102中。此外,音频比特流102可以包括定义了原始音频信号在截止频率以上的一部分的带宽扩展数据,例如SBR数据。核心数据和带宽扩展数据可按任何方式(包括通过复用)布置在音频比特流中。
音频比特流102可被传送到比特流解析器104,比特流解析器104可以将比特流数据分离,例如解复用。例如,比特流解析器104可以从音频比特流102中划分核心数据并且生成核心数据流,核心数据流可被提供到核心信号解码器106以供解码。此外,比特流解析器104可以从音频比特流102划分带宽扩展数据并且生成SBR数据流。SBR数据流可被提供到谱带复制(SBR)处理器110以用于解码和后处理操作。在一些实现方式中,可以选择其他带宽扩展方案,并且可以生成与所选扩展方案相对应的数据流来取代SBR数据流。此外,在这样的实现方式中,SBR处理器110可被适合于所选扩展方案的处理器所取代。
核心信号解码器106对核心数据进行解码以生成经解码核心音频信号的时域表示。经解码核心音频信号可以对应于原始音频信号的低频部分,例如在0和22kHz之间的频率。例如,在音频比特流102是HE-AAC比特流的情况下,经解码核心音频信号可以对应于经解码AAC信号。
经解码核心音频信号被提供给延迟元件410。延迟元件410所引入的延迟的持续时间可以是固定的,并且可以被设定为等于或者接近QMF分析组402、抵消器404和QMF合成组406的定时。这样,在与经解码音频信号的相应高频部分被提供到高通滤波器408的同时或者接近同时,经解码核心音频信号可被提供到低通滤波器412。希望延迟对于特定滤波器实现方式(例如QMF分析组402和QMF合成组406)而言是一致的,并且如果滤波器实现方式被修改,则该延迟可被修改。
经解码核心音频信号还可被提供到QMF分析组402,QMF分析组402可以根据HE-AAC标准来配置。由QMF分析组402实现的QMF组可以是复数QMF组(标准的)或者真实QMF组(低功率的)。QMF分析组402可被配置为:将经解码核心音频信号变换成频域表示,并且分析经解码核心音频信号并生成用于重构原始音频信号的高频部分的子带信号(例如对应于32个子带)。在一些实现方式中,可以在生成子带信号之前对经解码核心音频信号进行上采样。QMF分析组402生成的子带信号可被提供到SBR处理器110和抵消器404。
抵消器404被配置来清零(抵消)从QMF分析组402接收的子带信号。通过将子带信号清零,抵消器404还抑制了在转换到频域和划分成子带信号期间引入到经解码核心音频信号的任何失真,例如高频处理假象。
SBR处理器110利用SBR数据流和从QMF分析组402接收到的低频子带信号来重构原始音频信号的高频部分。SBR处理器110可被配置为基于SBR数据来选择用于生成高频子带信号的一个或多个低频子带信号。此外,SBR处理器110可被配置为调节所生成的高频子带信号的包络以生成重构的音频信号高频部分。
QMF合成组406也可以根据HE-AAC标准来配置,例如使用与QMF分析组402相同的组。作为由抵消器404执行的抵消的结果,只有SBR处理器110生成的重构的音频信号高频部分被提供到QMF合成组406。QMF合成组406将接收到的高频部分变换成时域信号,该时域信号被提供给高通滤波器408。
高通滤波器408和低通滤波器412是互补的,使得它们的组合频谱响应等于平坦频率响应。高通滤波器408可被配置为仅使重构的音频信号高频部分通过。结果,由SBR处理器110中的处理生成的与截止频率以下的频率相关联的失真可被消除。这样,高通滤波器408仅将重构的音频信号高频部分提供给加法器414。在一些实现方式中,抵消器404可被去除,并且高通滤波器408可被配置来衰减截止频率以下的所有信号或者基本上所有信号。
此外,低通滤波器412可被配置为使低频经解码核心音频信号通过并且衰减频率在截止频率以上的信号。这样,低通滤波器412仅将低频经解码核心音频信号提供给加法器414。在一些实现方式中,高通滤波器408可被省略,并且低通滤波器412可被配置来匹配QMF合成组406的滤波器组响应。
加法器414对高通滤波器408和低通滤波器412的输出执行时域相加,以生成经解码音频信号。经解码音频信号然后可被提供到音频输出114。
图5示出与核心解码器和QMF合成滤波器组的输出的白噪声信号相关的示例性失真水平。通过经解码低频部分502(Ycore)针对核心解码器图示出引入到恒定信号(例如白噪声)中的QMF失真的水平。此外,通过经解码高频部分504(YSBR)针对QMF合成滤波器组图示出QMF失真的水平。在理想情况下,经解码低频部分502和经解码高频部分504在截止频率506处分离,该截止频率506可以在相应的音频比特流中被指示出。QMF失真水平对于直到最高频率508为止的信号的整个频率范围都是恒定的。通常,失真水平可能随着频率和音频信号水平而变化。
图6示出对白噪声信号的经解码低频部分进行低通滤波并且对白噪声信号的经解码高频部分进行高通滤波的示例。对白噪声信号进行解码的修改型音频解码器可以实现针对图4所讨论的低通和高通滤波策略。低通滤波器可被配置为具有从最低频率(例如0Hz)到上部频率604延伸的低通频带602。这样,低通频带602一般对应于信号的经解码低频部分502。低通滤波器可以对任何频率高于上部频率604的信号进行衰减。此外,高通滤波器可被配置为具有从最低频率608到信号的最高频率610延伸的高通频带606。这样,高通频带606一般对应于信号的经解码高频部分604。高通滤波器可以对任何频率低于最低频率608的信号进行衰减。
此外,低通滤波器和高通滤波器在交叉频率范围612上可以是重叠的。在交叉频率范围612内,低通滤波器和高通滤波器的总贡献必须等于1。此外,交叉频率范围612的中心可以位于交叉点,以使得低通滤波器和高通滤波器二者在交叉点处各自具有0.5的贡献。可以选择交叉点以使得它对应于截止频率以下的频率。
图7示出白噪声信号的低通和高通滤波之后的示例性失真水平。在执行低通和高通滤波之后留下的QMF失真水平702与高通频带606同样大。这样,QMF处理所引入的失真仅对于高通频带606内的频率具有能量。此外,在排除交叉频率范围612的情况下,与低通频带602相对应的信号部分没有QMF失真。
本公开中所描述的技术和功能性操作可以用数字电路实现,或者用计算机软件、固件或硬件(包括本公开中所描述的结构装置及其结构等同物)实现,或者用它们的组合来实现。这些技术可以利用一个或多个计算机程序产品来实现,例如有形地存储在计算机可读介质上以供一个或多个可编程处理器或计算机执行或者控制一个或多个可编程处理器或计算机的操作的机器可读指令。此外,可编程处理器和计算机可包括在移动设备中或者封装为移动设备。
本公开中所描述的处理和逻辑流程可由一个或多个可编程处理器来执行,这些处理器执行一个或多个用于接收、操纵和/或输出数据的指令。处理和逻辑流程也可由可编程逻辑电路来执行,包括一个或多个FPGA(现场可编程门阵列)、PLD(可编程逻辑器件)和/或ASIC(专用集成电路)。可以使用通用和/或专用处理器(包括任何种类的数字计算机的处理器)来执行存储在计算机可读介质中的计算机程序和其他编程指令,其中计算机可读介质包括诸如只读存储器之类的非易失性存储器、诸如随机访问存储器之类的易失性存储器或者这二者。另外,可以从一个或多个海量存储设备接收和向这些海量存储设备发送数据和计算机程序,这些海量存储设备包括硬盘驱动器、闪存驱动器和光学存储设备。此外,通用和专用计算设备和存储设备可以通过通信网络而互连。通信网络可以包括有线和无线基础设施。通信网络还可以是公共的、私人的或者其组合。
这里公开了多个实现方式。然而,将会了解,在不脱离权利要求的精神和范围的情况下可以作出各种修改。因此,其他实现方式在权利要求的范围内。
Claims (18)
1.一种对音频信号进行解码的方法,该方法包括:
在音频解码器中接收与音频信号的核心部分相关联的核心音频数据以及与所述音频信号的扩展部分相关联的扩展数据;
对所述核心音频数据进行解码,以生成具有时域表示的经解码核心音频信号;
根据所述扩展数据和所述经解码核心音频信号来在频域生成所述音频信号的重构扩展部分;
利用高通滤波器对所述音频信号的重构扩展部分进行滤波,以生成重构输出信号;
利用滤波器组将所述重构输出信号变换成时域表示;以及
在将所述重构输出信号变换成时域表示之后,将所述经解码核心音频信号和所述重构输出信号相组合,以生成经解码输出信号。
2.如权利要求1所述的方法,其中,所述滤波器组包括复数正交镜像滤波器组。
3.如权利要求1所述的方法,其中,所述扩展数据包括谱带复制数据。
4.如权利要求1所述的方法,还包括:
在所述组合之前利用低通滤波器对所述经解码核心音频信号进行滤波。
5.如权利要求4所述的方法,还包括:
配置所述高通滤波器和所述低通滤波器使其具有等于平坦频率响应的组合频谱响应。
6.一种对音频信号进行解码的方法,该方法包括:
对与截止频率以下的音频信号部分相对应的低频音频数据进行解码,以生成具有时域表示的经解码低频信号;
根据所述经解码低频信号的至少一部分和扩展数据来在频域生成高频音频数据;
利用滤波器组将所述高频音频数据变换成时域表示以生成经解码高频信号;
对所述经解码低频信号和所述经解码高频信号中的至少一者进行滤波以减少失真;以及
将所述经解码低频信号和所述经解码高频信号相组合,以在时域生成经解码输出信号,其中,所述被组合的所述经解码低频信号和所述经解码高频信号中的至少一者已被滤波以减少失真。
7.如权利要求6所述的方法,其中,生成高频音频数据还包括:
基于所述经解码低频信号的至少一部分来生成子带信号;以及
根据所述扩展数据来选择用于生成所述高频音频数据的子带信号。
8.如权利要求7所述的方法,还包括:
在变换所述高频音频数据之前抵消所生成的子带信号。
9.如权利要求6所述的方法,其中,滤波还包括:
利用与所述滤波器组的响应相匹配的低通滤波器对所述经解码低频信号进行滤波。
10.如权利要求9所述的方法,其中,所述滤波器组包括正交镜像滤波器组。
11.如权利要求6所述的方法,其中,滤波还包括:
利用低通滤波器对所述经解码低频信号进行滤波并且利用高通滤波器对所述经解码高频信号进行滤波,其中所述低通滤波器和所述高通滤波器对于所述音频信号的频率范围的一部分是重叠的。
12.一种对音频信号进行解码的系统,包括:
输入,被配置来接收音频比特流;以及
音频解码器,包括处理器电子装置,所述处理器电子装置被配置来执行包括以下各项的操作:
对与所述音频比特流相关联的低频音频数据进行解码以生成具有时域表示的经解码低频信号,所述低频音频数据对应于截止频率以下的音频信号部分;
根据所述经解码低频信号的至少一部分和与所述音频比特流相关联的扩展数据来在频域生成高频音频数据;
利用滤波器组将所述高频音频数据变换成时域表示以生成经解码高频信号;
对所述经解码低频信号和所述经解码高频信号中的至少一者进行滤波以减少失真;以及
将所述经解码低频信号和所述经解码高频信号相组合以在时域生成经解码输出信号,其中,所述被组合的所述经解码低频信号和所述经解码高频信号中的至少一者已被滤波以减少失真。
13.如权利要求12所述的系统,其中,所述音频解码器还包括:
高通滤波器和低通滤波器,被配置为具有等于平坦频率响应的组合频谱响应。
14.如权利要求13所述的系统,其中,所述高通滤波器和所述低通滤波器对于频率范围的一部分是重叠的。
15.如权利要求12所述的系统,其中,所述音频解码器还包括:
延迟元件,被配置来延迟所述经解码低频信号。
16.如权利要求15所述的系统,其中,与所述延迟元件相关联的延迟持续时间对应于所述滤波器组的处理延迟。
17.如权利要求12所述的系统,其中,所述音频解码器还包括:
分析滤波器组,被配置为基于所述经解码低频信号的至少一部分来生成子带信号;以及
抵消器,被配置为将所生成的子带信号清零。
18.如权利要求12所述的系统,其中,所述滤波器组包括正交镜像滤波器组。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/551,450 | 2009-08-31 | ||
US12/551,450 US8515768B2 (en) | 2009-08-31 | 2009-08-31 | Enhanced audio decoder |
PCT/US2010/047269 WO2011026083A1 (en) | 2009-08-31 | 2010-08-31 | Enhanced audio decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102598121A CN102598121A (zh) | 2012-07-18 |
CN102598121B true CN102598121B (zh) | 2014-05-07 |
Family
ID=42953749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080049717.5A Active CN102598121B (zh) | 2009-08-31 | 2010-08-31 | 增强型音频解码器 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8515768B2 (zh) |
EP (1) | EP2473994A1 (zh) |
KR (1) | KR101387871B1 (zh) |
CN (1) | CN102598121B (zh) |
GB (1) | GB2473139B (zh) |
WO (1) | WO2011026083A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11875805B2 (en) | 2013-04-05 | 2024-01-16 | Dolby International Ab | Audio encoder and decoder for interleaved waveform coding |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5552988B2 (ja) * | 2010-09-27 | 2014-07-16 | 富士通株式会社 | 音声帯域拡張装置および音声帯域拡張方法 |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP2777042B1 (en) * | 2011-11-11 | 2019-08-14 | Dolby International AB | Upsampling using oversampled sbr |
TWI521965B (zh) | 2012-05-14 | 2016-02-11 | Sony Corp | Camera and camera methods, electronic machines and programs |
RU2665281C2 (ru) * | 2013-09-12 | 2018-08-28 | Долби Интернэшнл Аб | Временное согласование данных обработки на основе квадратурного зеркального фильтра |
EP3048609A4 (en) | 2013-09-19 | 2017-05-03 | Sony Corporation | Encoding device and method, decoding device and method, and program |
TR201802303T4 (tr) | 2013-10-31 | 2018-03-21 | Fraunhofer Ges Forschung | Frekans alanında zamansal ön şekillendirilmiş gürültü eklenmesiyle ses bant genişliği uzatma. |
RU2667627C1 (ru) | 2013-12-27 | 2018-09-21 | Сони Корпорейшн | Устройство и способ декодирования и программа |
TW202242853A (zh) | 2015-03-13 | 2022-11-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US9613628B2 (en) | 2015-07-01 | 2017-04-04 | Gopro, Inc. | Audio decoder for wind and microphone noise reduction in a microphone array system |
EP3182411A1 (en) * | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
TW202341126A (zh) * | 2017-03-23 | 2023-10-16 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
EP3382704A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal |
US11527256B2 (en) | 2018-04-25 | 2022-12-13 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
BR112020021809A2 (pt) | 2018-04-25 | 2021-02-23 | Dolby International Ab | integração de técnicas de reconstrução de alta frequência com atraso de pós-processamento reduzido |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1585972A (zh) * | 2002-08-01 | 2005-02-23 | 松下电器产业株式会社 | 音频解码装置和音频解码方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6356639B1 (en) | 1997-04-11 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
EP1351401B1 (en) * | 2001-07-13 | 2009-01-14 | Panasonic Corporation | Audio signal decoding device and audio signal encoding device |
DE60208426T2 (de) | 2001-11-02 | 2006-08-24 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten |
EP1341160A1 (en) | 2002-03-01 | 2003-09-03 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for encoding and for decoding a digital information signal |
US20070168197A1 (en) | 2006-01-18 | 2007-07-19 | Nokia Corporation | Audio coding |
WO2008035949A1 (en) | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
JP4396683B2 (ja) | 2006-10-02 | 2010-01-13 | カシオ計算機株式会社 | 音声符号化装置、音声符号化方法、及び、プログラム |
WO2008062990A1 (en) | 2006-11-21 | 2008-05-29 | Samsung Electronics Co., Ltd. | Method, medium, and system scalably encoding/decoding audio/speech |
US8606566B2 (en) | 2007-10-24 | 2013-12-10 | Qnx Software Systems Limited | Speech enhancement through partial speech reconstruction |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
PL2146344T3 (pl) * | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
JP5309944B2 (ja) | 2008-12-11 | 2013-10-09 | 富士通株式会社 | オーディオ復号装置、方法、及びプログラム |
US8392200B2 (en) | 2009-04-14 | 2013-03-05 | Qualcomm Incorporated | Low complexity spectral band replication (SBR) filterbanks |
-
2009
- 2009-08-31 US US12/551,450 patent/US8515768B2/en active Active
-
2010
- 2010-08-31 EP EP10757502A patent/EP2473994A1/en not_active Withdrawn
- 2010-08-31 CN CN201080049717.5A patent/CN102598121B/zh active Active
- 2010-08-31 KR KR1020127008261A patent/KR101387871B1/ko active IP Right Grant
- 2010-08-31 GB GB1014415.2A patent/GB2473139B/en not_active Expired - Fee Related
- 2010-08-31 WO PCT/US2010/047269 patent/WO2011026083A1/en active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1585972A (zh) * | 2002-08-01 | 2005-02-23 | 松下电器产业株式会社 | 音频解码装置和音频解码方法 |
Non-Patent Citations (7)
Title |
---|
Andreas Spanias等.Signal Processing Essentials.《AUDIO SIGNAL PROCESSING AND CODING》.2007,13-49. * |
Bandwidth Extension of Audio Signals Spectral Band Replication;Per Ekstrand;《Proc.1st IEEE Benelux Workshop on Workshop on Model based Processing and Coding of Audio》;20021115;53-58 * |
Han-Wen Hsu等.High Quality, Low Power QMF Bank Design for SBR, Parametric Coding, and MPEG Surround Decoders.《Audio Engineering Society 122nd Convention Paper》.2007,1-10. |
High Quality, Low Power QMF Bank Design for SBR, Parametric Coding, and MPEG Surround Decoders;Han-Wen Hsu等;《Audio Engineering Society 122nd Convention Paper》;20070508;1-10 * |
MartinDietz等.SpectralBandReplication a novel approach in audio coding.《Audio Engineering Society 112th Convention Paper》.2002 |
Per Ekstrand.Bandwidth Extension of Audio Signals Spectral Band Replication.《Proc.1st IEEE Benelux Workshop on Workshop on Model based Processing and Coding of Audio》.2002,53-58. |
Spectral Band Replication, a novel approach in audio coding;Martin Dietz等;《Audio Engineering Society 112th Convention Paper》;20020513;1-8 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11875805B2 (en) | 2013-04-05 | 2024-01-16 | Dolby International Ab | Audio encoder and decoder for interleaved waveform coding |
Also Published As
Publication number | Publication date |
---|---|
CN102598121A (zh) | 2012-07-18 |
US20110054911A1 (en) | 2011-03-03 |
KR20120052407A (ko) | 2012-05-23 |
GB2473139A (en) | 2011-03-02 |
EP2473994A1 (en) | 2012-07-11 |
US8515768B2 (en) | 2013-08-20 |
GB2473139B (en) | 2012-04-11 |
GB201014415D0 (en) | 2010-10-13 |
WO2011026083A1 (en) | 2011-03-03 |
KR101387871B1 (ko) | 2014-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102598121B (zh) | 增强型音频解码器 | |
CN1809872B (zh) | 编码音频信号的设备和方法及解码已编码音频信号的设备和方法 | |
JP3371590B2 (ja) | 高能率符号化方法及び高能率復号化方法 | |
US8010348B2 (en) | Adaptive encoding and decoding with forward linear prediction | |
CN1154087C (zh) | 提高低比特率音频编码系统音质的方法、编码器和译码器 | |
CN1973319B (zh) | 编码和解码多通道音频信号的方法和设备 | |
Sinha et al. | Audio compression at low bit rates using a signal adaptive switched filterbank | |
CN103620679A (zh) | 具有灵活配置功能的音频编码器和解码器 | |
KR20150047607A (ko) | 오디오 신호를 재생하기 위한 장치 및 방법, 코딩된 오디오 신호를 생성하기 위한 장치 및 방법, 컴퓨터 프로그램 및 코딩된 오디오 신호 | |
CN105280190A (zh) | 带宽扩展编码和解码方法以及装置 | |
JP2006521577A (ja) | マルチチャネル信号を表す主信号と副信号の符号化 | |
CN105103224A (zh) | 用于交错波形编码的音频编码器和解码器 | |
JP3341474B2 (ja) | 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体 | |
KR102622804B1 (ko) | 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합 | |
CN106030704B (zh) | 用于对音频信号进行编码/解码的方法和设备 | |
CN101197576A (zh) | 一种音频信号编码、解码方法 | |
JP3557674B2 (ja) | 高能率符号化方法及び装置 | |
US6995699B2 (en) | Encoding method, and encoding apparatus, and decoding method and decoding apparatus | |
JP3475985B2 (ja) | 情報符号化装置および方法、情報復号化装置および方法 | |
WO1999044291A1 (fr) | Dispositif et procede de codage, dispositif et procede de decodage, support d'enregistrement de programme et de donnees | |
CN105261373A (zh) | 用于带宽扩展编码的自适应栅格构造方法和装置 | |
KR102630922B1 (ko) | 서브밴드 병합 및 시간 도메인 에일리어싱 감소를 사용하는 적응형 비-균일 시간/주파수 타일링을 갖는 지각 오디오 코딩 | |
KR101786863B1 (ko) | 고 주파수 복원 알고리즘들을 위한 주파수 대역 테이블 설계 | |
CN117292699A (zh) | 音频的带宽扩展方法、装置、存储介质及计算机程序产品 | |
JP2010515090A (ja) | 音声コード化の方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |