CN105103224A - 用于交错波形编码的音频编码器和解码器 - Google Patents
用于交错波形编码的音频编码器和解码器 Download PDFInfo
- Publication number
- CN105103224A CN105103224A CN201480019104.5A CN201480019104A CN105103224A CN 105103224 A CN105103224 A CN 105103224A CN 201480019104 A CN201480019104 A CN 201480019104A CN 105103224 A CN105103224 A CN 105103224A
- Authority
- CN
- China
- Prior art keywords
- frequency
- signal
- coding
- waveform
- coded signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 96
- 230000003595 spectral effect Effects 0.000 claims abstract description 79
- 238000000034 method Methods 0.000 claims abstract description 57
- 239000013598 vector Substances 0.000 claims description 64
- 238000001228 spectrum Methods 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 238000002955 isolation Methods 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 38
- 239000000203 mixture Substances 0.000 description 28
- 230000001052 transient effect Effects 0.000 description 25
- 230000011664 signaling Effects 0.000 description 21
- 230000008034 disappearance Effects 0.000 description 20
- 239000011159 matrix material Substances 0.000 description 13
- 238000005070 sampling Methods 0.000 description 13
- 239000012634 fragment Substances 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000002123 temporal effect Effects 0.000 description 6
- 230000002349 favourable effect Effects 0.000 description 5
- 238000012913 prioritisation Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
Abstract
提供用于音频信号的解码和编码的方法和装置。特别地,用于解码的方法包括接收具有与高于交叉频率的频率范围的子集对应的频谱内容的波形编码信号。波形编码信号与高于交叉频率的音频信号的参数高频率重构交错。以这种方式,实现音频信号的高频率带的改善的重构。
Description
技术领域
这里公开的本发明一般涉及音频编码和解码。特别地,它涉及适于执行音频信号的高频率重构的音频编码器和音频解码器。
背景技术
音频编码系统使用用于音频编码的不同的方法,诸如纯波形编码、参数空间编码和包含频谱带复制(SBR)算法的高频率重构算法。MPEG-4标准将音频信号的SBR和波形编码进行组合。更准确地说,编码器可波形编码用于直到交叉频率的频谱带的音频信号,并且通过使用SBR编码来编码高于交叉频率的频谱带。音频信号的波形编码部分然后与在SBR编码中确定的SBR参数一起被传送到解码器。如在综述性论文Brinker等人,AnoverviewoftheCodingStandardMPEG-4AudioAmendments1and2:HE-AAC,SSCandHE-AACv2,EURASIPJournalonAudio,Speech,andMusicProcessing,2009卷,文章ID468971中讨论的那样,基于音频信号的波形编码部分和SBR参数,解码器然后重构高于交叉频率的频谱带中的音频信号。
该方法的一个问题是,在输出中,会缺失强的声调成分,即强的谐波成分,或者通过SBR算法没有恰当地重构的高频谱带中的任何成分。
因而,SBR算法实现的是缺失谐波检测过程。通过SBR高频率重构不能适当地重建的声调成分在编码器侧被识别。这些强的声调成分的频率位置的信息被传送到解码器,在解码器处,用在解码器中产生的正弦曲线替代缺失声调成分所在的频谱带中的频谱内容。
SBR算法中提供的缺失谐波检测的优点在于,它是非常低位率的解决方案,原因是,通过或多少地简化,只有声调成分的频率位置及其振幅水平需要被传送到解码器。
SBR算法的缺失谐波检测的缺点在于,它是非常粗略的模型。另一缺点在于,当传送率低(即,当每秒可传送的位数低)并且因此频谱带宽时,将用正弦曲线替代大的频率范围。
SBR算法的另一缺点在于,它具有抹除在音频信号中出现的瞬态的趋势。一般地,在SBR重构的音频信号中将存在瞬态的前回声(pre-echo)和后回声(post-echo)。因此,需要继续改进。
附图说明
以下,参照附图更详细地描述示例性实施例,其中,
图1是根据示例性实施例的解码器的示意图;
图2是根据示例性实施例的解码器的示意图;
图3是根据示例性实施例的解码方法的流程图;
图4是根据示例性实施例的解码器的示意图;
图5是根据示例性实施例的编码器的示意图;
图6是根据示例性实施例的编码方法的流程图;
图7是根据示例性实施例的信令方案的示意图;以及
图8a~b是根据示例性实施例的交错级的示意图。
所有附图都是示意性的,并且,为了阐明本公开,一般仅示出必要的部分,而其它的部分可能被省略或仅仅被建议。除非另外指示,否则,类似的附图标记在不同的附图中指的是类似的部分。
具体实施方式
鉴于以上的情况,一个目的是提供能够改善高频率带中的声调成分和瞬态的重构的编码器和解码器及相关方法。
I.概要-解码器
这里,音频信号可以是纯音频信号、视听信号或多媒体信号的音频部分、或者元数据结合它们的任一个。
根据第一方面,示例性实施例提出用于解码的解码方法、解码装置和计算机程序产品。提出的方法、装置和计算机程序产品一般会具有相同的特征和优点。
根据示例性实施例,提供一种音频处理系统中的解码方法,该解码方法包括:接收具有直到第一交叉频率的频谱内容的第一波形编码信号;接收具有与高于第一交叉频率的频率范围的子集对应的频谱内容的第二波形编码信号;接收高频率重构参数;通过使用第一波形编码信号和高频率重构参数执行高频率重构,以产生具有高于第一交叉频率的频谱内容的频率扩展信号;以及交错频率扩展信号与第二波形编码信号。
这里,波形编码信号要被解释为通过波形的表示的直接量化被编码的信号;最优选,输入波形信号的频率变换的线的量化。这与信号由信号属性的一般性模型的变动表示的参数编码相对。
解码方法由此建议使用高于第一交叉频率的频率范围的子集中的波形编码数据并且使其与高频率重构信号交错。以这种方式,高于第一交叉频率的频率带中的信号的重要部分,诸如一般不能通过参数高频率重构算法很好地重构的瞬态或声调成分,可被波形编码。作为结果,高于第一交叉频率的频率带中的信号的这些重要部分的重构得到改善。
根据示例性实施例,高于第一交叉频率的频率范围的子集是稀疏的子集。例如,它可包含多个隔离的频率间隔。这是有利的,原因是,用于编码第二波形编码信号的位数低。并且,通过具有多个隔离的频率间隔,可通过第二波形编码信号很好地捕获音频信号的例如为单次谐波的声调成分。作为结果,以低的位代价实现高频率带的声调成分的重构的改善。
这里,缺失谐波或单次谐波意味着频谱的任何任意的强的声调部分。特别地,应当理解,缺失谐波或单次谐波不限于谐波系列的一个谐波。
根据示例性实施例,第二波形编码信号可代表要被重构的音频信号中的瞬态。瞬态一般限于短时间范围,诸如采样率为48kHz的近百个时间采样,例如,5~10毫秒量级的时间范围,但可具有宽的频率范围。为了捕获瞬态,高于第一交叉频率的频率范围的子集可因此包含在第一交叉频率与第二交叉频率之间延伸的频率间隔。这是有利的,原因是可以实现瞬态的改善的重构。
根据示例性实施例,第二交叉频率随时间改变。例如,第二交叉频率可在通过音频处理系统设定的时间帧内改变。以这种方式,可应对瞬态的短时间范围。
根据示例性实施例,执行高频率重构的步骤包括执行频谱带复制,即SBR。一般在诸如例如64个子带的伪正交镜像滤波器QMF域的频域中执行高频率重构。
根据示例性实施例,在诸如QMF域的频域中执行交错频率扩展信号与第二波形编码信号的步骤。一般地,为了便于实现并更好地控制这两个信号的时间和频率特性,在与高频率重构相同的频域中执行交错。
根据示例性实施例,通过使用相同的修改离散余弦变换MDCT来编码接收的第一和第二波形编码信号。
根据示例性实施例,解码方法可包括根据高频率重构参数调整频率扩展信号的频谱内容,以调整频率扩展信号的频谱包络。
根据示例性实施例,交错可包含将第二波形编码信号加到频率扩展信号。如果第二波形编码信号代表声调成分,诸如当高于第一交叉频率的频率范围的子集包含多个隔离的频率间隔时,那么这是优选的选项。将第二波形编码信号加到频率扩展信号模仿SBR中已知的谐波的参数相加,并且允许使用SBR复制信号来通过适当程度的混入而避免大频率范围被单个声调成分替代。
根据示例性实施例,交错包含在与第二波形编码信号的频谱内容对应的高于第一交叉频率的频率范围的子集中用第二波形编码信号的频谱内容替代频率扩展信号的频谱内容。当第二波形编码信号代表瞬态时,例如,当高于第一交叉频率的频率范围的子集可因此包含在第一交叉频率与第二交叉频率之间延伸的频率间隔时,这是优选的选项。一般仅对于被第二波形编码信号覆盖的时间范围执行替代。以这种方式,可使得替代尽可能地少,同时仍足以替代存在于频率扩展信号中的瞬态和潜在时间抹除,并且,交错由此不限于由SBR包络时间网格规定的时间段。
根据示例性实施例,第一和第二波形编码信号可以是单独的信号,意味着它们被单独地编码。作为替代方案,第一波形编码信号和第二波形编码信号形成一个共同的联合编码信号的第一和第二信号部分。从实现的观点看,后面的这个替代方案更具吸引力。
根据示例性实施例,解码方法可包括接收包含涉及第二波形编码信号可用的一个或更多个时间范围和高于第一交叉频率的一个或更多个频率范围的数据的控制信号,其中,交错频率扩展信号与第二波形编码信号的步骤基于该控制信号。这是有利的,原因是它提供控制该交错的有效方式。
根据示例性实施例,控制信号包含指示第二波形编码信号可用于与频率扩展信号交错的高于第一交叉频率的一个或更多个频率范围的第二矢量和指示第二波形编码信号可用于与频率扩展信号交错的一个或更多个时间范围的第三矢量中的至少一个。这是方便的实现控制信号的方式。
根据示例性实施例,控制信号包含指示基于高频率重构参数在参数上被重构的高于第一交叉频率的一个或更多个频率范围的第一矢量。以这种方式,对于某个频率带,频率扩展信号可优先于第二波形编码信号。
根据示例性实施例,还提供一种计算机程序产品,包括具有用于执行第一方面的任何解码方法的指令的计算机可读介质。
根据示例性实施例,还提供一种用于音频处理系统的解码器,该解码器包括:被配置为接收具有直到第一交叉频率的频谱内容的第一波形编码信号、具有与高于第一交叉频率的频率范围的子集对应的频谱内容的第二波形编码信号、以及高频率重构参数的接收级;被配置为从接收级接收第一波形编码信号和高频率重构参数并且通过使用第一波形编码信号和高频率重构参数执行高频率重构以产生具有高于第一交叉频率的频谱内容的频率扩展信号的高频率重构级;以及被配置为从高频率重构级接收频率扩展信号并且从接收级接收第二波形编码信号并且交错频率扩展信号与第二波形编码信号的交错级。
根据示例性实施例,解码器可被配置为执行这里公开的任何解码方法。
II.概要-编码器
根据第二方面,示例性实施例提出用于编码的编码方法、编码装置和计算机程序产品。提出的方法、装置和计算机程序产品一般会具有相同的特征和优点。
对于用于编码器的对应的特征和设置,在以上的解码器的概要中给出的关于特征和设置的优点一般会是有效的。
根据示例性实施例,提供一种音频处理系统中的编码方法,该编码方法包括以下的步骤:接收要被编码的音频信号;基于接收的音频信号计算使得能够实现高于第一交叉频率的接收的音频信号的高频率重构的高频率重构参数;基于接收的音频信号识别高于第一交叉频率的频率范围的子集,对于该子集,接收的音频信号的频谱内容要被波形编码并且随后在解码器中与音频信号的高频率重构交错;通过对于直到第一交叉频率的频谱带波形编码接收的音频信号而产生第一波形编码信号;以及,通过对于与高于第一交叉频率的频率范围的所识别子集对应的频谱带波形编码接收的音频信号而产生第二波形编码信号。
根据示例性实施例,高于第一交叉频率的频率范围的子集可包含多个隔离的频率间隔。
根据示例性实施例,高于第一交叉频率的频率范围的子集可包含在第一交叉频率与第二交叉频率之间延伸的频率间隔。
根据示例性实施例,第二交叉频率可随时间改变。
根据示例性实施例,通过使用频谱带复制(即SBR)编码来计算高频率重构参数。
根据示例性实施例,编码方法还可包括调整包含于高频率重构参数中的频谱包络水平,以补偿解码器中的接收的音频信号的高频率重构与第二波形编码信号的相加。由于在解码器中将第二波形编码信号加到高频率重构信号,因此,组合信号的频谱包络水平与高频率重构信号的频谱包络水平不同。可在编码器中应对频谱包络水平的这种变化,使得解码器中的组合信号得到目标频谱包络。通过在编码器侧执行该调整,可以减少在解码器侧需要的工作,或者换句话说,通过从编码器到解码器的特定的信令,使得不需要在解码器中限定如何应对该情况的特定规则。这允许通过在将来优化编码器而在将来优化系统,而不必更新潜在地广泛部署的解码器。
根据示例性实施例,调整高频率重构参数的步骤可包含:测量第二波形编码信号的能量;以及通过从与第二波形编码信号的频谱内容对应的频谱带的频谱包络水平减去测量的第二波形编码信号的能量调整频谱包络水平,这是为了控制高频率重构信号的频谱包络。
根据示例性实施例,还提供一种包括具有用于执行第二方面的任何编码方法的指令的计算机可读介质的计算机程序产品。
根据示例性实施例,提供一种用于音频处理系统的编码器,该编码器包括:被配置为接收要被编码的音频信号的接收级;被配置为从接收级接收音频信号并且基于接收的音频信号计算使得能够实现高于第一交叉频率的接收的音频信号的高频率重构的高频率重构参数的高频率编码级;被配置为基于接收的音频信号识别高于第一交叉频率的频率范围的子集的交错编码检测级,对于该子集,接收的音频信号的频谱内容要被波形编码并且随后在解码器中与音频信号的高频率重构交错;被配置为从接收级接收音频信号并且通过对于直到第一交叉频率的频谱带波形编码接收的音频信号而产生第一波形编码信号并且从交错编码检测级接收高于第一交叉频率的频率范围的所识别子集并通过对于与接收的频率范围的所识别子集对应的频谱带波形编码接收的音频信号而产生第二波形编码信号的波形编码级。
根据示例性实施例,编码器还可包括:被配置为从高频率编码级接收高频率重构参数并从交错编码检测级接收高于第一交叉频率的频率范围的所识别子集,并且基于接收的数据调整高频率重构参数以补偿随后的在解码器中的接收的音频信号的高频率重构与第二波形编码信号的交错的包络调整级。
根据示例性实施例,编码器可被配置为被执行这里公开的任何编码方法。
III.示例性实施例-解码器
图1示出解码器100的示例性实施例。解码器包括接收级110、高频率重构级120、以及交错级130。
现在参照示出解码器200的图2的示例性实施例和图3的流程图更详细地解释解码器100的操作。解码器200的目的是,在要被重构的音频信号的高频率带中存在强的声调成分的情况下,对于高频率给予改善的信号重构。接收级110在步骤D02中接收第一波形编码信号201。第一波形编码信号201具有直到第一交叉频率fc的频谱内容,即,第一波形编码信号201是限制为低于第一交叉频率fc的频率范围的低带信号。
接收级110在步骤D04中接收第二波形编码信号202。第二波形编码信号202具有与高于第一交叉频率fc的频率范围的子集对应的频谱内容。在图2的示出例子中,第二波形编码信号202具有与多个隔离的频率间隔202a和202b对应的频谱内容。第二波形编码信号202可由此被视为由多个带限信号构成,每个带限信号与隔离的频率间隔202a和202b中的一个对应。在图2中,仅示出两个频率间隔202a和202b。一般地,第二波形编码信号的频谱内容可与宽度变化的任意数量的频率间隔对应。
接收级110可接收作为两个单独的信号的第一和第二波形编码信号201和202。作为替代方案,第一和第二波形编码信号201和202可形成由接收级110接收的一个共同信号的第一和第二信号部分。换句话说,可例如通过使用相同的MDCT变换联合编码第一和第二波形编码信号。
一般地,通过使用诸如MDCT变换的重叠窗口变换编码由接收级110接收的第一波形编码信号201和第二波形编码信号202。接收级可包含被配置为将第一和第二波形编码信号201和202变换到时域的波形解码级240。波形解码级240一般包含被配置为执行第一和第二波形编码信号201和202的逆MDCT变换的MDCT滤波器组。
接收级110进一步在步骤D06中接收由在后面公开的高频率重构级120使用的高频率重构参数。
第一波形编码信号201和由接收级110接收的高频率参数然后被输入到高频率重构级120。高频率重构级120一般在频域中,优选地在QMF域中对信号进行操作。在输入到高频率重构级120之前,第一波形编码信号201因此优选地通过QMF分析级250被变换到频域,优选地,QMF域。QMF分析级250一般包含被配置为执行第一波形编码信号201的QMF变换的QMF滤波器组。
基于第一波形编码信号201和高频率重构参数,高频率重构级120在步骤D08中将第一波形编码信号201扩展到高于第一交叉频率fc的频率。具体而言,高频率重构级120产生具有高于第一交叉频率fc的频谱内容的频率扩展信号203。由此,频率扩展信号203是高带信号。
高频率重构级120可根据用于执行高频率重构的任何已知的算法操作。特别地,如在综述性论文Brinker等人,AnoverviewoftheCodingStandardMPEG-4AudioAmendments1and2:HE-AAC,SSCandHE-AACv2,EURASIPJournalonAudio,Speech,andMusicProcessing,2009卷,文章ID468971中公开的那样,高频率重构级120可被配置为执行SBR。这样,高频率重构级可包含被配置为在数个步骤中产生频率扩展信号203的数个子级。例如,高频率重构级120可包含高频率产生级221、参数高频率成分添加级222和包络调整级223。
简言之,为了产生频率扩展信号203,高频率产生级221在第一子步骤D08a中将第一波形编码信号201扩展到高于第一交叉频率fc的频率范围。通过选择第一波形编码信号201的子带部分,并且根据由高频率重构参数引导的特定规则,将第一波形编码信号201的所选子带部分映照或复制到高于第一交叉频率fc的频率范围的所选子带部分来执行该产生。
高频率重构参数还可包括用于向频率扩展信号203添加缺失谐波的缺失谐波参数。如上面讨论的那样,缺失谐波应当被解释为频谱的任何任意的强声调部分。例如,缺失谐波参数可包含与缺失谐波的频率和振幅有关的参数。基于缺失谐波参数,参数高频率成分添加级222在子步骤D08b中产生正弦曲线成分并且将正弦曲线成分加到频率扩展信号203。
高频率重构参数还可包括描述频率扩展信号203的目标能级的频谱包络参数。基于频谱包络参数,包络调整级223可在子步骤D08c中调整频率扩展信号203的频谱内容,即频率扩展信号203的频谱系数,使得频率扩展信号203的能级与由频谱包络参数描述的目标能级对应。
来自高频率重构级120的频率扩展信号203和来自接收级110的第二波形编码信号然后被输入到交错级130。交错级130一般在与高频率重构级120相同的频域、优选地QMF域中操作。因此,第二波形编码信号202一般通过QMF分析级250被输入到交错级。此外,第二波形编码信号202一般通过延迟级260被延迟,以补偿高频率重构级120执行高频率重构所花费的时间。以这种方式,第二波形编码信号202和频率扩展信号203将被对准,使得交错级130对与相同的时间帧对应的信号进行操作。
然后,为了产生交错信号204,交错级130在步骤D10中交错,即组合第二波形编码信号202与频率扩展信号203。可以使用不同的方法来交错第二波形编码信号202与频率扩展信号203。
根据一个示例性实施例,交错级130通过将频率扩展信号203和第二波形编码信号202相加来交错频率扩展信号203与第二波形编码信号202。第二波形编码信号202的频谱内容在与第二波形编码信号202的频谱内容对应的频率范围的子集中与频率扩展信号203的频谱内容重叠。通过使频率扩展信号203和第二波形编码信号202相加,交错信号204由此对于重叠频率包含频率扩展信号203的频谱内容以及第二波形编码信号202的频谱内容。作为相加的结果,交错信号204的频谱包络水平对于重叠频率增大。优选地,并且,如后面公开的那样,当确定包含于高频率重构参数中的能量包络水平时,在编码器侧应对由于相加导致的频谱包络水平的增大。例如,用于重叠频率的频谱包络水平可在编码器侧减小与由于解码器侧的交错导致的频谱包络水平的增大对应的量。
作为替代方案,可在解码器侧应对由于相加导致的频谱包络水平的增大。例如,可以有能量测量级,其测量第二波形编码信号202的能量、比较测量的能量与由频谱包络参数描述的目标能级、并且调整扩展频率信号203使得交错信号204的频谱包络水平等于目标能级。
根据另一示例性实施例,交错级130通过对于频率扩展信号203和第二波形编码信号202重叠的那些频率,用第二波形编码信号202的频谱内容替代频率扩展信号203的频谱内容,来交错频率扩展信号203与第二波形编码信号202。在频率扩展信号203被第二波形编码信号202替代的示例性实施例中,不必调整频谱包络水平以补偿频率扩展信号203与第二波形编码信号202的交错。
高频率重构级120优选地以等于用于编码第一波形编码信号201的底层芯部编码器的采样率的采样率操作。以这种方式,可以使用与用于编码第一波形编码信号201的重叠窗口变换相同的重叠窗口变换,诸如相同的MDCT,来编码第二波形编码信号202。
交错级130可进一步被配置为优选地通过波形解码级240、QMF分析级250和延迟级260从接收级接收第一波形编码信号201,并且,为了产生具有低于以及高于第一交叉频率的频率的频谱内容的组合信号205,组合交错信号204与第一波形编码信号201。
来自交错级130的输出信号即交错信号204或组合信号205可随后通过QMF合成级270变换回时域。
优选地,QMF分析级250和QMF合成级270具有相同数量的子带,意味着输入到QMF分析级250的信号的采样率等于从QMF合成级270输出的信号的采样率。因此,用于波形编码第一和第二波形编码信号的波形编码器(使用MDCT)可以与输出信号相同的采样率操作。因此,通过使用相同的MDCT变换,可有效地并且在结构上容易地编码第一和第二波形编码信号。这与波形编码器的采样率一般限于输出信号的采样率的一半的现有技术不同,并且,随后的高频率重构模块完成上采样以及高频率重构。这限制波形编码覆盖整个输出频率范围的频率的能力。
图4示出解码器400的示例性实施例。解码器400要在要被重构的输入音频信号中存在瞬态的情况下对高频率给出改善的信号重构。图4的例子与图2的例子之间的主要不同是第二波形编码信号的频谱内容和持续时间的形式。
图4示出解码器400在时间帧的多个随后时间部分中的操作;这里,示出三个随后的时间部分。一个时间帧例如可与2048个时间采样对应。具体而言,在第一时间部分期间,接收级110接收具有直到第一交叉频率fc1的频谱内容的第一波形编码信号401a。在第一时间部分期间不接收第二波形编码信号。
在第二时间部分期间,接收级110接收具有直到第一交叉频率fc1的频谱内容的第一波形编码信号401b和具有与高于第一交叉频率fc1的频率范围的子集对应的频谱内容的第二波形编码信号402b。在图4的示出例子中,第二波形编码信号402b具有与在第一交叉频率fc1与第二交叉频率fc2之间延伸的频率间隔对应的频谱内容。第二波形编码信号402b由此是限于第一交叉频率fc1与第二交叉频率fc2之间的频率带的带限信号。
在第三时间部分期间,接收级110接收具有直到第一交叉频率fc1的频谱内容的第一波形编码信号401c。对第三时间部分,不接收第二波形编码信号。
对于示出的第一和第三时间部分,不存在第二波形编码信号。对于这些时间部分,解码器将根据诸如常规的SBR解码器的被配置为执行高频率重构的常规的解码器操作。高频率重构级120将分别基于第一波形编码401a和401c产生频率扩展信号403a和403c。但是,由于不存在第二波形编码信号,因此,交错级130不实施交错。
对于示出的第二时间部分,存在第二波形编码信号402b。对于第二时间部分,解码器400将以关于图2描述的相同方式操作。特别地,高频率重构级120基于第一波形编码信号和高频率重构参数执行高频率重构,以产生频率扩展信号403b。频率扩展信号403b然后被输入到交错级130,在那里,它与第二波形编码信号402b交错成交错信号404b。如关于图2的示例性实施例讨论的那样,可通过使用相加或替代方法执行交错。
在以上的例子中,对于第一和第三时间部分没有第二波形编码信号。对于这些时间部分,第二交叉频率等于第一交叉频率,并且不执行交错。对于第二时间帧,第二交叉频率比第一交叉频率大,并且,执行交错。一般地,第二交叉频率可由此随时间改变。特别地,第二交叉频率可在时间帧内改变。当第二交叉频率大于第一交叉频率且小于由解码器代表的最大频率时,将实施交错。第二交叉频率等于该最大频率的情况与纯波形编码对应,并且,不需要高频率重构。
应当注意,关于图2和图4描述的实施例可被组合。图7示出关于频域、优选地QMF域所定义的时间频率矩阵700,其中,通过交错级130执行交错。示出的时间频率矩阵700与要被解码的音频信号的一个帧对应。示出的矩阵700分成从第一交叉频率fc1开始的16个时隙和多个频率子带。并且,示出覆盖低于第八时隙的时间范围的第一时间范围T1、覆盖第八时隙的第二时间范围T2和覆盖高于第八时隙的时隙的时间范围T3。作为SBR数据的一部分的不同的频谱包络可与不同的时间范围T1~T3相关。
在本例子中,频率带710和720中的两个强声调成分在编码器侧的音频信号中被识别。频率带710和720可具有与例如SBR包络带相同的带宽,即,相同的频率分辨率被用于代表频谱包络。频率带710和720中的这些声调成分具有与整个时间帧对应的时间范围,即,声调成分的时间范围包含时间范围T1~T3。在编码器侧,决定在第一时间范围T1中波形编码710和720的声调成分,这由第一时间范围T1中的虚线表示的声调成分710a和720示出。并且,在编码器侧决定,在第二和第三时间范围T2和T3中,要通过如关于图2的参数高频率成分添加级222解释的那样包含正弦曲线而在解码器中在参数上重构第一声调成分710。这由(第二时间范围T2)和第三时间范围T3中的第一声调成分710b的方形图案表示。在第二和第三时间范围T2和T3中,第二声调成分720仍被波形编码。并且,在本实施例中,第一和第二声调成分要通过添加来与高频率重构音频信号交错,因此,编码器已相应调整传送的频谱包络、SBR包络。
另外,瞬态730已在编码器侧在音频信号中被识别。瞬态730具有与第二时间范围T2对应的持续时间,并且,与第一交叉频率fc1与第二交叉频率fc2之间的频率间隔对应。在编码器侧已经决定了波形编码与瞬态的位置对应的音频信号的时间频率部分。在本实施例中,通过替代来完成波形编码瞬态的交错。信令方案被设置以向解码器信令该信息。信令方案包含与第二波形编码信号在哪个/些时间范围中和/或在高于第一交叉频率fc1的哪个/些频率范围中可用有关的信息。信令方案也可与涉及如何执行交错即交错是通过添加还是替代方式的规则相关。信令方案也可与后面解释的限定添加或替代不同的信号的优先级顺序的规则相关。
信令方案包含标为“另外的正弦曲线”的第一矢量740,对于各频率子带指示是否应在参数上添加正弦曲线。在图7中,对于第一矢量740的相应的子带,第二和第三时间范围T2和T3中的第一声调成分710b的添加由“1”表示。包含第一矢量740的信令在现有技术中是已知的。对于什么时候允许开始正弦曲线,在现有技术的解码器中定义了规则。该规则是,如果检测到新的正弦曲线,即,第一矢量740的“另外的正弦曲线”信令从一个帧中的0变为下一帧中的1,那么对于特定的子带,在该帧开始时开始正弦曲线,除非在帧中存在瞬态事件,对于帧中存在瞬态事件的情况,正弦曲线在瞬态处开始。在示出的例子中,在帧中存在瞬态事件730,这就解释了为什么对于频率带710的采用正弦曲线方式的参数重构在瞬态事件730之后才开始。
信令方案还包括标为“波形编码”的第二矢量750。第二矢量750对各频率子带指示波形编码信号是否可用于与音频信号的高频率重构交错。在图7中,对第二矢量750的相应子带,第一和第二声调成分710和720的波形编码信号的可用性由“1”表示。在本例子中,第二矢量750中的波形编码数据的可用性表示也指示要通过添加来执行交错。但是,在其它的实施例中,第二矢量750中的波形编码数据的可用性表示也可指示要通过替代来执行交错。
信令方案还包括标为“波形编码”的第三矢量760。第三矢量760对各时隙指示波形编码信号是否可用于与音频信号的高频率重构交错。在图7中,对于第三矢量760的相应的时隙,瞬态730的波形编码信号的可用性由“1”表示。在本例子中,第三矢量760中的波形编码数据的可用性表示也指示要通过替代执行交错。但是,在其它的实施例中,第三矢量760中的波形编码数据的可用性表示也可指示要通过添加执行交错。
存在如何体现第一、第二和第三矢量740、750、760的许多替代方案。在一些实施例中,矢量740、750、760是使用逻辑0或逻辑1来提供它们的指示的二进制矢量。在其它的实施例中,矢量740、750、760可采取不同的形式。例如,矢量中的诸如“0”的第一值可表示没有波形编码数据可用于特定的频率带或时隙。矢量中的诸如“1”的第二值可表示要对特定的频率带或时隙通过添加执行交错。矢量中的诸如“2”的第三值可表示要对特定的频率带或时隙通过替代执行交错。
以上的示例性信令方案也可与可在冲突的情况下应用的优先级顺序相关。作为例子,代表替代方式的瞬态的交错的第三矢量760可优先于第一和第二矢量740和750。此外,第一矢量740可优先于第二矢量750。应当理解,可定义矢量740、750和760之间的任何优先级顺序。
图8a更详细地示出图1的交错级130。交错级130可包含信令解码部件1301、决策逻辑部件1302和交错部件1303。如上面讨论的那样,交错级130接收第二波形编码信号802和频率扩展信号803。交错级130还可接收控制信号805。信令解码部件1301将控制信号805解码成与参照图7描述的信令方案的第一矢量740、第二矢量750和第三矢量760对应的三个部分。它们被发送到决策逻辑部件1302,该决策逻辑部件1302基于逻辑创建用于QMF帧的时间/频率矩阵870,指示对哪个时间/频率片段要使用第二波形编码信号802和频率扩展信号803中的哪一个。时间/频率矩阵870被发送到交错部件1303并且在交错第二波形编码信号802与频率扩展信号803时被使用。
在图8b中更详细地示出决策逻辑部件1302。决策逻辑部件1302可包含时间/频率矩阵产生部件13021和优先次序排列部件13022。时间/频率产生部件13021产生具有与当前的QMF帧对应的时间/频率片段的时间/频率矩阵870。时间/频率产生部件13021将来自第一矢量740、第二矢量750和第三矢量760的信息包含于时间/频率矩阵中。例如,如图7所示,如果对于某个频率在第二矢量750中存在“1”(或者,更一般地,为与零不同的任何数值),那么在时间/频率矩阵870中,与该频率对应的时间/频率片段被设定为“1”(或者,更一般地,被设定为存在于矢量750中的数值),表示要对这些时间/频率片段执行与第二波形编码信号802的交错。类似地,如果对于某个时隙在第三矢量760中存在“1”(或者,更一般地,为与零不同的任何数值),那么在时间/频率矩阵870中,与该时隙对应的时间/频率片段被设定为“1”(或者,更一般地,被设定为与零不同的任何数值),表示要对这些时间/频率片段执行与第二波形编码信号802的交错。类似地,如果对于某个频率在第一矢量740中存在“1”,那么在时间/频率矩阵870中,与该频率对应的时间/频率片段被设定为“1”,表示输出信号804要基于已例如通过包含正弦曲线信号在参数上重构该频率的频率扩展信号803。
对于一些时间/频率片段,在来自第一矢量740、第二矢量750和第三矢量760的信息之间存在冲突,意味着对于时间/频率矩阵870的相同的时间/频率片段,在矢量740~760中多于一个的矢量表示与零不同的数值,诸如“1”。在这种情况下,为了消除时间/频率矩阵870中的冲突,优先次序排列部件13022需要决定如何排列来自矢量的信息的优先级。更准确地说,优先次序排列部件13022决定输出信号804是基于频率扩展信号803(由此给予第一矢量740优先)、是通过频率方向的第二波形编码信号802的交错(由此给予第二矢量750优先)还是通过时间方向的第二波形编码信号802的交错(由此给予第三矢量760优先)。
出于这种目的,优先次序排列部件13022包含与矢量740~760的优先级顺序有关的预定规则。优先次序排列部件13022还可包含与如何执行交错,即,是通过添加还是通过替代执行交错有关的预定规则。
优选地,这些规则如下:
■时间方向的交错,即由第三矢量760限定的交错被赋予最高优先级。优选地,通过在由第三矢量760限定的那些时间/频率片段中替代频率扩展信号803执行时间方向的交错。第三矢量760的时间分辨率与QMF帧的时隙对应。如果QMF帧与2048个时域采样对应,那么时隙一般可与128个时域采样对应。
■频率的参数重构,即由第一矢量740限定的使用频率扩展信号803被赋予第二高优先级。第一矢量740的频率分辨率是诸如SBR包络带的QMF帧的频率分辨率。与第一矢量740的信令和解释有关的现有技术规则保持有效。
■频率方向的交错,即由第二矢量750限定的交错被赋予最低优先级。通过在由第二矢量750限定的那些时间/频率片段中添加频率扩展信号803执行频率方向的交错。第二矢量750的频率分辨率与诸如SBR包络带的QMF帧的频率分辨率对应。
III.示例性实施例-编码器
图5示出适用于音频处理系统中的编码器500的示例性实施例。编码器500包括接收级510、波形编码级520、高频率编码级530、交错编码检测级540和传送级550。高频率编码级530可包含高频率重构参数计算级530a和高频率重构参数调整级530b。
以下参照图5和图6的流程图描述编码器500的操作。在步骤E02中,接收级510接收要被编码的音频信号。
接收的音频信号被输入到高频率编码级530。基于接收的音频信号,高频率编码级530,特别是高频率重构参数计算级530a,在步骤E04中计算使得能够实现高于第一交叉频率fc的接收音频信号的高频率重构的高频率重构参数。高频率重构参数计算级530a可使用用于计算高频率重构参数的任何已知技术,诸如SBR编码。高频率编码级530一般在QMF域中操作。因此,在计算高频率重构参数之前,高频率编码级530可执行接收的音频信号的QMF分析。作为结果,关于QMF域限定高频率重构参数。
计算的高频率重构参数可包含与高频率重构有关的数个参数。例如,高频率重构参数可包含与如何将来自低于第一交叉频率fc的频率范围的子带部分的音频信号映照或复制到高于第一交叉频率fc的频率范围的子带部分有关的参数。这种参数有时被称为描述补片(patching)结构的参数。
高频率重构参数还可包含描述高于第一交叉频率的频率范围的子带部分的目标能级的频谱包络参数。
高频率重构参数还可包含指示谐波的缺失谐波参数或者如果通过使用描述补片结构的参数在高于第一交叉频率的频率范围中重构音频信号则将缺失的强声调成分。
交错编码检测级540然后在步骤E06中识别接收音频信号的频谱内容要被波形编码的高于第一交叉频率fc的频率范围的子集。换句话说,交错编码检测级540的作用是识别高于第一交叉频率的频率(对于这些频率,高频率重构无法得到希望的结果)。
交错编码检测级540可采取不同的方法以识别高于第一交叉频率fc的频率范围的相关子集。例如,交错编码检测级540可识别通过高频率重构不能很好地重构的强声调成分。强声调成分的识别可基于接收的音频信号,例如通过根据频率确定音频信号的能量并将具有高能量的频率识别为包含强声调成分。此外,识别可基于如何在解码器重构接收的音频信号的知识。特别地,这种识别可基于作为接收音频信号的声调量度(measure)与高于第一交叉频率的频率带的接收音频信号的重构的声调量度的比的声调配额。高的声调配额表示音频信号将对于与声调配额对应的频率不能很好地重构。
交错编码检测级540还可检测通过高频率重构不能很好地重构的接收音频信号中的瞬态。这种识别可以是接收音频信号的时间频率分析的结果。例如,可从接收音频信号的频谱图检测出现瞬态的时间频率间隔。这种时间频率间隔一般具有比接收音频信号的时间帧短的时间范围。相应的频率范围一般与扩展到第二交叉频率的频率间隔对应。高于第一交叉频率的频率范围的子集可因此通过交错编码检测级540被识别为从第一交叉频率扩展到第二交叉频率的间隔。
交错编码检测级540还可从高频率重构参数计算级530a接收高频率重构参数。基于来自高频率重构参数的缺失谐波参数,交错编码检测级540可识别缺失谐波的频率并且决定在高于第一交叉频率fc的频率范围的所识别子集中包含缺失谐波的频率中的至少一些。如果在不能在参数模型的限度内正确地建模的音频信号中存在强声调成分,那么这种方法可能是有利的。
接收音频信号也被输入到波形编码级520。波形编码级520在步骤E08中执行接收音频信号的波形编码。特别地,波形编码级520通过波形编码直到第一交叉频率fc的频率带的音频信号产生第一波形编码信号。并且,波形编码级520从交错编码检测级540接收所识别子集。波形编码级520然后通过对与高于第一交叉频率的频率范围的所识别子集对应的频谱带波形编码接收音频信号产生第二波形编码信号。第二波形编码信号将由此具有与高于第一交叉频率fc的频率范围的所识别子集对应的频谱内容。
根据示例性实施例,波形编码级520可通过首先对所有频谱带波形编码接收音频信号产生第一和第二波形编码信号,然后对与高于第一交叉频率fc的频率的所识别子集对应的频率去除这样波形编码的信号的频谱内容。
波形编码级例如可通过使用诸如MDCT滤波器组的重叠窗口变换滤波器组执行波形编码。这种重叠窗口变换滤波器组使用具有某个时间长度的窗口,使得一个时间帧中的变换信号的值受到前后时间帧中的信号的值的影响。为了减少这种影响,执行一定量的时间过编码可能是有利的,意味着波形编码级520不仅波形编码接收音频信号的当前时间帧,而且波形编码接收音频信号的前后时间帧。类似地,高频率编码级530也可不仅编码接收音频信号的当前时间帧,而且编码接收音频信号的前后时间帧。以这种方式,可在QMF域中改善第二波形编码信号与音频信号的高频率重构之间的交叉衰退。并且,这减少对频谱包络数据边界的调整的需要。
应当注意,第一和第二波形编码信号也可以是单独的信号。但是,优选地,它们形成一个共同信号的第一和第二波形编码信号部分。如果是这样,那么可通过对接收音频信号执行单个波形编码操作,诸如向接收音频信号应用单个MDCT变换,来产生它们。
高频率编码级530,特别是高频率重构参数调整级530b,也可接收高于第一交叉频率fc的频率范围的所识别子集。基于接收数据,高频率重构参数调整级530b可在步骤E10中调整高频率重构参数。特别地,高频率重构参数调整级530b可调整与包含于所识别子集中的频谱带对应的高频率重构参数。
例如,高频率重构参数调整级530b可调整描述高于第一交叉频率的频率范围的子带部分的目标能级的频谱包络参数。如果要对解码器中音频信号的高频率重构添加第二波形编码信号,那么这是特别有关系的,原因是,这样,第二波形编码信号的能量将被添加到高频率重构的能量。为了补偿这种添加,高频率重构参数调整级530b可通过对与高于第一交叉频率fc的频率范围的所识别子集对应的频谱带从目标能级减去第二波形编码信号的测量能量来调整能量包络参数。以这种方式,当在解码器中添加第二波形编码信号和高频率重构时,总信号能量被保留。可例如通过交错编码检测级540测量第二波形编码信号的能量。
高频率重构参数调整级530b也可调整缺失谐波参数。更具体而言,如果包含由缺失谐波参数表示的缺失谐波的子带是高于第一交叉频率fc的频率范围的所识别子集的一部分,那么将通过波形编码级520波形编码该子带。因此,高频率重构参数调整级530b可从缺失谐波参数去除这种缺失谐波,原因是这种缺失谐波不需要在解码器侧被参数重构。
传送级550然后接收来自波形编码级520的第一和第二波形编码信号以及来自高频率编码级530的高频率重构参数。传送级550将接收的数据格式化为用于传送到解码器的位流。
交错编码检测级540还可将信息信令到传送级550中以使其包含于位流中。特别地,交错编码检测级540可信令如何用音频信号的高频率重构交错第二波形编码信号(诸如是通过信号的添加还是通过用信号中的一个代替另一个来执行交错),以及应针对什么频率范围和什么时间间隔来交错波形编码信号。例如,可通过使用参照图7讨论的信令方案实施信令。
等同物、扩展、替代和混杂
在研究以上的描述之后,本领域技术人员能够想到本公开的其它实施例。尽管本说明书和附图公开了实施例和例子,但本公开不限于这些特定的例子。在不背离由所附的权利要求限定的本公开的范围的情况下,可以提出大量的修改和变化。在权利要求中出现的任何附图标记不应被理解为限制它们的范围。
另外,通过研究附图、本公开和所附的权利要求,实践本公开的本领域技术人员可以理解和实施公开的实施例的变更例。在权利要求中,词语“包括”不排除其它的要素或步骤,并且,不定冠词“一个”或“一种”不排除多个。在多个不同的从属权利要求中仅仅记载某些措施不表示这些措施的组合不能被充分利用。
以上公开的系统和方法可实为软件、固件、硬件或它们的组合。在硬件实现中,在以上的描述中提到的功能单元之间的任务的划分未必与多个单元的划分对应;相反,一个物理部件可具有多个功能,一个任务可通过协作的几个物理部件实施。某些部件或所有部件可实现为由数字信号处理器或微处理器执行的软件,或者实现为硬件或专用集成电路。这种软件可分布于可包含计算机存储介质(或非暂态介质)或通信介质(或暂态介质)的计算机可读介质上。本领域技术人员公知的是,术语计算机存储介质包括在任何方法或技术中实现的易失性和非易失性、可去除和不可去除介质,这些介质用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息。计算机存储介质包括但不限于RAM、ROM、EEPROM、快擦写存储器或其它存储器技术、CD-ROM、数字万用盘(DVD)或其它光盘存储器、磁盒、磁带、磁盘存储器或其它磁存储装置或可用于存储希望的信息并且可通过计算机访问的任何其它介质。并且,本领域技术人员公知的是,通信介质一般在诸如载波或其它传输机制的调制数据信号中体现计算机可读指令、数据结构、程序模块或其它数据,并且包含任何信息传输介质。
Claims (29)
1.一种音频处理系统中的解码方法,包括:
接收具有直到第一交叉频率的频谱内容的第一波形编码信号;
接收具有与高于第一交叉频率的频率范围的子集对应的频谱内容的第二波形编码信号;
接收高频率重构参数;
通过使用第一波形编码信号和高频率重构参数执行高频率重构,以产生具有高于第一交叉频率的频谱内容的频率扩展信号;以及
交错频率扩展信号与第二波形编码信号。
2.根据权利要求1所述的解码方法,其中,高于第一交叉频率的频率范围的子集包含多个隔离的频率间隔。
3.根据权利要求1所述的解码方法,其中,高于第一交叉频率的频率范围的子集包含在第一交叉频率与第二交叉频率之间延伸的频率间隔。
4.根据权利要求3所述的解码方法,其中,第二交叉频率随时间改变。
5.根据权利要求3和4中的任一项所述的解码方法,其中,第二交叉频率在由音频处理系统设定的时间帧内改变。
6.根据前面的权利要求中的任一项所述的解码方法,其中,执行高频率重构的步骤包括执行频谱带复制即SBR。
7.根据前面的权利要求中的任一项所述的解码方法,其中,执行高频率重构的步骤是在频域中执行的。
8.根据前面的权利要求中的任一项所述的解码方法,其中,在频域中执行交错频率扩展信号与第二波形编码信号的步骤。
9.根据任意的权利要求6或7所述的解码方法,其中,频域是正交镜像滤波器域,即QMF域。
10.根据前面的权利要求中的任一项所述的解码方法,其中,通过使用相同的MDCT变换来编码接收的第一和第二波形编码信号。
11.根据前面的权利要求中的任一项所述的解码方法,还包括根据高频率重构参数调整频率扩展信号的频谱内容,以调整频率扩展信号的频谱包络。
12.根据前面的权利要求中的任一项所述的解码方法,其中,交错包含向频率扩展信号添加第二波形编码信号。
13.根据权利要求1~11中的任一项所述的解码方法,其中,交错包含在与第二波形编码信号的频谱内容对应的高于第一交叉频率的频率范围的子集中,用第二波形编码信号的频谱内容替代频率扩展信号的频谱内容。
14.根据前面的权利要求中的任一项所述的解码方法,其中,第一波形编码信号和第二波形编码信号形成一个共同信号的第一和第二信号部分。
15.根据前面的权利要求中的任一项所述的解码方法,还包括接收包含涉及第二波形编码信号能够用于的一个或更多个时间范围和高于第一交叉频率的一个或更多个频率范围的数据的控制信号,其中,交错频率扩展信号与第二波形编码信号的步骤基于该控制信号。
16.根据权利要求15所述的解码方法,其中,所述控制信号包含第二矢量与第三矢量中的至少一个,所述第二矢量指示第二波形编码信号能够用于与频率扩展信号交错的高于第一交叉频率的一个或更多个频率范围,所述第三矢量指示第二波形编码信号能够用于与频率扩展信号交错的一个或更多个时间范围。
17.根据权利要求15和16中的任一项所述的解码方法,其中,所述控制信号包含第一矢量,所述第一矢量指示基于高频率重构参数在参数上被重构的高于第一交叉频率的一个或更多个频率范围。
18.一种包括具有用于执行前面的权利要求中的任一项的方法的指令的计算机可读介质的计算机程序产品。
19.一种用于音频处理系统的解码器,包括:
被配置为接收具有直到第一交叉频率的频谱内容的第一波形编码信号、具有与高于第一交叉频率的频率范围的子集对应的频谱内容的第二波形编码信号、以及高频率重构参数的接收级;
被配置为从接收级接收第一波形编码信号和高频率重构参数并且通过使用第一波形编码信号和高频率重构参数执行高频率重构以产生具有高于第一交叉频率的频谱内容的频率扩展信号的高频率重构级;以及
被配置为从高频率重构级接收频率扩展信号并且从接收级接收第二波形编码信号并且交错频率扩展信号与第二波形编码信号的交错级。
20.一种音频处理系统中的编码方法,包括以下的步骤:
接收要被编码的音频信号;
基于接收的音频信号计算使得能够实现高于第一交叉频率的接收的音频信号的高频率重构的高频率重构参数;
基于接收的音频信号识别高于第一交叉频率的频率范围的子集,对于该子集,接收的音频信号的频谱内容要被波形编码并且随后在解码器中与音频信号的高频率重构交错;
通过对直到第一交叉频率的频谱带波形编码接收的音频信号产生第一波形编码信号;通过对与高于第一交叉频率的频率范围的所识别子集对应的频谱带波形编码接收的音频信号产生第二波形编码信号。
21.根据权利要求20所述的编码方法,其中,高于第一交叉频率的频率范围的子集包含多个隔离的频率间隔。
22.根据权利要求20或21所述的编码方法,其中,高于第一交叉频率的频率范围的子集包含在第一交叉频率与第二交叉频率之间延伸的频率间隔。
23.根据权利要求22所述的编码方法,其中,第二交叉频率随时间改变。
24.根据权利要求20~21中的任一项所述的编码方法,其中,通过使用频谱带复制编码即SBR编码计算高频率重构参数。
25.根据权利要求20~24中的任一项所述的编码方法,还包括调整包含于高频率重构参数中的频谱包络水平,以补偿解码器中的接收的音频信号的高频率重构与第二波形编码信号的相加。
26.根据权利要求25所述的编码方法,其中,调整高频率重构参数的步骤包含:
测量第二波形编码信号的能量;
通过从与第二波形编码信号的频谱内容对应的频谱带的频谱包络水平减去测量的第二波形编码信号的能量来调整频谱包络水平。
27.一种包括具有用于执行权利要求20~26中的任一项的方法的指令的计算机可读介质的计算机程序产品。
28.一种用于音频处理系统的编码器,包括:
被配置为接收要被编码的音频信号的接收级;
被配置为从接收级接收音频信号并且基于接收的音频信号计算使得能够实现高于第一交叉频率的接收的音频信号的高频率重构的高频率重构参数的高频率编码级;
被配置为基于接收的音频信号识别高于第一交叉频率的频率范围的子集的交错编码检测级,对于该子集,接收的音频信号的频谱内容要被波形编码并且随后在解码器中与该音频信号的高频率重构交错;
被配置为从接收级接收音频信号并且通过对直到第一交叉频率的频谱带波形编码接收的音频信号产生第一波形编码信号并且从交错编码检测级接收高于第一交叉频率的频率范围的所识别子集并通过对与接收的频率范围的所识别子集对应的频谱带波形编码接收的音频信号产生第二波形编码信号的波形编码级。
29.根据权利要求28所述的编码器,还包括被配置为从高频率编码级接收高频率重构参数并从交错编码检测级接收高于第一交叉频率的频率范围的所识别子集并且基于接收的数据调整高频率重构参数以补偿随后的在解码器中的接收的音频信号的高频率重构与第二波形编码信号的交错的包络调整级。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311191143.0A CN117253497A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557658.5A CN110223703B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557659.XA CN110136728B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN202311191551.6A CN117253498A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557683.3A CN110265047B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN202311188836.4A CN117275495A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361808687P | 2013-04-05 | 2013-04-05 | |
US61/808,687 | 2013-04-05 | ||
PCT/EP2014/056856 WO2014161995A1 (en) | 2013-04-05 | 2014-04-04 | Audio encoder and decoder for interleaved waveform coding |
Related Child Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311191143.0A Division CN117253497A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN202311191551.6A Division CN117253498A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557658.5A Division CN110223703B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN202311188836.4A Division CN117275495A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557683.3A Division CN110265047B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557659.XA Division CN110136728B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105103224A true CN105103224A (zh) | 2015-11-25 |
CN105103224B CN105103224B (zh) | 2019-08-02 |
Family
ID=50442508
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311191143.0A Pending CN117253497A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557658.5A Active CN110223703B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557659.XA Active CN110136728B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201480019104.5A Active CN105103224B (zh) | 2013-04-05 | 2014-04-04 | 用于交错波形编码的音频编码器和解码器 |
CN202311191551.6A Pending CN117253498A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN202311188836.4A Pending CN117275495A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557683.3A Active CN110265047B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311191143.0A Pending CN117253497A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557658.5A Active CN110223703B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557659.XA Active CN110136728B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311191551.6A Pending CN117253498A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN202311188836.4A Pending CN117275495A (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
CN201910557683.3A Active CN110265047B (zh) | 2013-04-05 | 2014-04-04 | 音频信号的解码方法和解码器、介质以及编码方法 |
Country Status (10)
Country | Link |
---|---|
US (5) | US9514761B2 (zh) |
EP (4) | EP3742440B1 (zh) |
JP (6) | JP6026704B2 (zh) |
KR (7) | KR102170665B1 (zh) |
CN (7) | CN117253497A (zh) |
BR (4) | BR122020020705B1 (zh) |
ES (1) | ES2688134T3 (zh) |
HK (1) | HK1217054A1 (zh) |
RU (4) | RU2622872C2 (zh) |
WO (1) | WO2014161995A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3742440B1 (en) * | 2013-04-05 | 2024-07-31 | Dolby International AB | Audio decoder for interleaved waveform coding |
CN105493182B (zh) * | 2013-08-28 | 2020-01-21 | 杜比实验室特许公司 | 混合波形编码和参数编码语音增强 |
RU2665281C2 (ru) * | 2013-09-12 | 2018-08-28 | Долби Интернэшнл Аб | Временное согласование данных обработки на основе квадратурного зеркального фильтра |
EP3288031A1 (en) | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
EP3337065B1 (en) * | 2016-12-16 | 2020-11-25 | Nxp B.V. | Audio processing circuit, audio unit and method for audio signal blending |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
JP7270836B2 (ja) | 2019-08-08 | 2023-05-10 | ブームクラウド 360 インコーポレイテッド | 音響心理学的周波数範囲拡張のための非線形適応フィルタバンク |
CN113192521B (zh) * | 2020-01-13 | 2024-07-05 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
CN113808596A (zh) * | 2020-05-30 | 2021-12-17 | 华为技术有限公司 | 一种音频编码方法和音频编码装置 |
JP7253208B2 (ja) | 2021-07-09 | 2023-04-06 | 株式会社ディスコ | ダイヤモンド成膜方法及びダイヤモンド成膜装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1947174A (zh) * | 2004-04-27 | 2007-04-11 | 松下电器产业株式会社 | 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法 |
CN101236745A (zh) * | 2007-01-12 | 2008-08-06 | 三星电子株式会社 | 用于带宽扩展编码和解码的方法、设备和介质 |
US20080259014A1 (en) * | 2007-04-17 | 2008-10-23 | Nec Lcd Technologies, Ltd. | Liquid crystal display device |
CN102089814A (zh) * | 2008-07-11 | 2011-06-08 | 弗劳恩霍夫应用研究促进协会 | 对编码的音频信号进行解码的设备和方法 |
CN102246231A (zh) * | 2008-12-15 | 2011-11-16 | 弗兰霍菲尔运输应用研究公司 | 音频编码器和带宽扩展解码器 |
Family Cites Families (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2598159B2 (ja) * | 1990-08-28 | 1997-04-09 | 三菱電機株式会社 | 音声信号処理装置 |
DE69322805T2 (de) | 1992-04-03 | 1999-08-26 | Yamaha Corp. | Verfahren zur Steuerung von Tonquellenposition |
US5598478A (en) | 1992-12-18 | 1997-01-28 | Victor Company Of Japan, Ltd. | Sound image localization control apparatus |
EP0695109B1 (en) | 1994-02-14 | 2011-07-27 | Sony Corporation | Device for reproducing video signal and audio signal |
JP3849210B2 (ja) * | 1996-09-24 | 2006-11-22 | ヤマハ株式会社 | 音声符号化復号方式 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6442275B1 (en) * | 1998-09-17 | 2002-08-27 | Lucent Technologies Inc. | Echo canceler including subband echo suppressor |
CA2311817A1 (en) | 1998-09-24 | 2000-03-30 | Fourie, Inc. | Apparatus and method for presenting sound and image |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
EP1158494B1 (en) * | 2000-05-26 | 2002-05-29 | Lucent Technologies Inc. | Method and apparatus for performing audio coding and decoding by interleaving smoothed critical band evelopes at higher frequencies |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
CN1177433C (zh) | 2002-04-19 | 2004-11-24 | 华为技术有限公司 | 一种移动网络中广播多播业务源的管理方法 |
KR20050057288A (ko) | 2002-09-09 | 2005-06-16 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스마트 스피커들 |
US7191136B2 (en) * | 2002-10-01 | 2007-03-13 | Ibiquity Digital Corporation | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10338694B4 (de) | 2003-08-22 | 2005-08-25 | Siemens Ag | Wiedergabeeinrichtung, umfassend wenigstens einen Bildschirm zur Darstellung von Informationen |
RU2374703C2 (ru) | 2003-10-30 | 2009-11-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование или декодирование аудиосигнала |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
EP1719117A1 (en) | 2004-02-16 | 2006-11-08 | Koninklijke Philips Electronics N.V. | A transcoder and method of transcoding therefore |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
CA2581810C (en) * | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
JP4939424B2 (ja) | 2004-11-02 | 2012-05-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 |
DE102005008343A1 (de) | 2005-02-23 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Liefern von Daten in einem Multi-Renderer-System |
JP5129117B2 (ja) * | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US8199828B2 (en) | 2005-10-13 | 2012-06-12 | Lg Electronics Inc. | Method of processing a signal and apparatus for processing a signal |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
CN101086845B (zh) * | 2006-06-08 | 2011-06-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及方法以及声音解码装置及方法 |
WO2008004812A1 (en) | 2006-07-04 | 2008-01-10 | Electronics And Telecommunications Research Institute | Apparatus and method for restoring multi-channel audio signal using he-aac decoder and mpeg surround decoder |
JP2008096567A (ja) | 2006-10-10 | 2008-04-24 | Matsushita Electric Ind Co Ltd | オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム |
JP4973919B2 (ja) | 2006-10-23 | 2012-07-11 | ソニー株式会社 | 出力制御システムおよび方法、出力制御装置および方法、並びにプログラム |
EP3288027B1 (en) | 2006-10-25 | 2021-04-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating complex-valued audio subband values |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
US8363842B2 (en) | 2006-11-30 | 2013-01-29 | Sony Corporation | Playback method and apparatus, program, and recording medium |
JPWO2008084688A1 (ja) * | 2006-12-27 | 2010-04-30 | パナソニック株式会社 | 符号化装置、復号装置及びこれらの方法 |
US8015368B2 (en) | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
US8630863B2 (en) * | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101743586B (zh) * | 2007-06-11 | 2012-10-17 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、编码方法、解码器、解码方法 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
DK2571024T3 (en) | 2007-08-27 | 2015-01-05 | Ericsson Telefon Ab L M | Adaptive transition frequency between the noise filling and bandwidth extension |
JP5008542B2 (ja) * | 2007-12-10 | 2012-08-22 | 花王株式会社 | トナー用結着樹脂の製造方法 |
EP3296992B1 (en) * | 2008-03-20 | 2021-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for modifying a parameterized representation |
JP5010743B2 (ja) * | 2008-07-11 | 2012-08-29 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法 |
CA2836871C (en) * | 2008-07-11 | 2017-07-18 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
EP2301028B1 (en) * | 2008-07-11 | 2012-12-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus and a method for calculating a number of spectral envelopes |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
JP5215077B2 (ja) | 2008-08-07 | 2013-06-19 | シャープ株式会社 | コンテンツ再生装置、コンテンツ再生方法、プログラムおよび記録媒体 |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
DK2211339T3 (en) | 2009-01-23 | 2017-08-28 | Oticon As | listening System |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
TWI556227B (zh) * | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102257567B (zh) | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
CN102667920B (zh) * | 2009-12-16 | 2014-03-12 | 杜比国际公司 | Sbr比特流参数缩混 |
CN108989721B (zh) | 2010-03-23 | 2021-04-16 | 杜比实验室特许公司 | 用于局域化感知音频的技术 |
US9275650B2 (en) * | 2010-06-14 | 2016-03-01 | Panasonic Corporation | Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs |
WO2012000882A1 (en) * | 2010-07-02 | 2012-01-05 | Dolby International Ab | Selective bass post filter |
CN103155033B (zh) * | 2010-07-19 | 2014-10-22 | 杜比国际公司 | 高频重建期间的音频信号处理 |
JP5533502B2 (ja) | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US9117440B2 (en) | 2011-05-19 | 2015-08-25 | Dolby International Ab | Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal |
JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
BR122021018240B1 (pt) * | 2012-02-23 | 2022-08-30 | Dolby International Ab | Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
EP3742440B1 (en) | 2013-04-05 | 2024-07-31 | Dolby International AB | Audio decoder for interleaved waveform coding |
-
2014
- 2014-04-04 EP EP20179681.0A patent/EP3742440B1/en active Active
- 2014-04-04 CN CN202311191143.0A patent/CN117253497A/zh active Pending
- 2014-04-04 BR BR122020020705-1A patent/BR122020020705B1/pt active IP Right Grant
- 2014-04-04 BR BR122020020698-5A patent/BR122020020698B1/pt active IP Right Grant
- 2014-04-04 KR KR1020207012124A patent/KR102170665B1/ko active IP Right Grant
- 2014-04-04 KR KR1020217011196A patent/KR102450178B1/ko active IP Right Grant
- 2014-04-04 WO PCT/EP2014/056856 patent/WO2014161995A1/en active Application Filing
- 2014-04-04 BR BR122017006820-2A patent/BR122017006820B1/pt active IP Right Grant
- 2014-04-04 KR KR1020207030234A patent/KR102243688B1/ko active IP Right Grant
- 2014-04-04 CN CN201910557658.5A patent/CN110223703B/zh active Active
- 2014-04-04 JP JP2016505844A patent/JP6026704B2/ja active Active
- 2014-04-04 EP EP24191339.1A patent/EP4428860A2/en active Pending
- 2014-04-04 CN CN201910557659.XA patent/CN110136728B/zh active Active
- 2014-04-04 ES ES14715895.0T patent/ES2688134T3/es active Active
- 2014-04-04 KR KR1020227033768A patent/KR102694669B1/ko active IP Right Grant
- 2014-04-04 RU RU2015147173A patent/RU2622872C2/ru active
- 2014-04-04 CN CN201480019104.5A patent/CN105103224B/zh active Active
- 2014-04-04 US US14/781,891 patent/US9514761B2/en active Active
- 2014-04-04 EP EP18167164.5A patent/EP3382699B1/en active Active
- 2014-04-04 RU RU2017118558A patent/RU2665228C1/ru active
- 2014-04-04 KR KR1020157027445A patent/KR101632238B1/ko active IP Right Grant
- 2014-04-04 BR BR112015025022-0A patent/BR112015025022B1/pt active IP Right Grant
- 2014-04-04 KR KR1020247026655A patent/KR20240127481A/ko active Search and Examination
- 2014-04-04 CN CN202311191551.6A patent/CN117253498A/zh active Pending
- 2014-04-04 CN CN202311188836.4A patent/CN117275495A/zh active Pending
- 2014-04-04 CN CN201910557683.3A patent/CN110265047B/zh active Active
- 2014-04-04 KR KR1020167015595A patent/KR102107982B1/ko active Application Filing
- 2014-04-04 EP EP14715895.0A patent/EP2981959B1/en active Active
-
2016
- 2016-04-29 HK HK16104970.8A patent/HK1217054A1/zh unknown
- 2016-09-28 US US15/279,365 patent/US10121479B2/en active Active
- 2016-10-12 JP JP2016200664A patent/JP6317797B2/ja active Active
-
2018
- 2018-03-30 JP JP2018068064A patent/JP6541824B2/ja active Active
- 2018-07-24 RU RU2018127009A patent/RU2694024C1/ru active
- 2018-10-24 US US16/169,964 patent/US11145318B2/en active Active
-
2019
- 2019-06-11 JP JP2019108504A patent/JP6859394B2/ja active Active
- 2019-06-28 RU RU2019120194A patent/RU2713701C1/ru active
-
2021
- 2021-03-25 JP JP2021051360A patent/JP7317882B2/ja active Active
- 2021-10-06 US US17/495,184 patent/US11875805B2/en active Active
-
2023
- 2023-07-19 JP JP2023117210A patent/JP7551860B2/ja active Active
- 2023-12-14 US US18/539,664 patent/US20240194210A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1947174A (zh) * | 2004-04-27 | 2007-04-11 | 松下电器产业株式会社 | 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法 |
CN101236745A (zh) * | 2007-01-12 | 2008-08-06 | 三星电子株式会社 | 用于带宽扩展编码和解码的方法、设备和介质 |
US20080259014A1 (en) * | 2007-04-17 | 2008-10-23 | Nec Lcd Technologies, Ltd. | Liquid crystal display device |
CN102089814A (zh) * | 2008-07-11 | 2011-06-08 | 弗劳恩霍夫应用研究促进协会 | 对编码的音频信号进行解码的设备和方法 |
CN102246231A (zh) * | 2008-12-15 | 2011-11-16 | 弗兰霍菲尔运输应用研究公司 | 音频编码器和带宽扩展解码器 |
Non-Patent Citations (4)
Title |
---|
BALAZS KOVESI ET AL.: "A SCALABLE SPEECH AND AUDIO CODING SCHEME WITH CONTINUOUS BITRATE FLEXIBILITY", 《2004 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING》 * |
BERND GEISER ET AL.: "Bandwidth Extension for Hierarchical Speech and Audio Coding in ITU-T Rec.G.729.1", 《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 * |
STEPHANE RAGOT ET AL.: "ITU-T G.729.1:AN 8-32Kbit/S Scalable Coder Interoperable with G.729 for Wideband Telephony and Voice Over IP", 《2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH AND SIGNAL PROCESSING》 * |
TOMASZ ZERNICKI ET AL.: "Improved coding of tonal components in audio techniques utilizing the SBR tool", 《93.MPEG MEETING》 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105103224A (zh) | 用于交错波形编码的音频编码器和解码器 | |
KR101711312B1 (ko) | 오디오 신호를 재생하기 위한 장치 및 방법, 코딩된 오디오 신호를 생성하기 위한 장치 및 방법, 컴퓨터 프로그램 및 코딩된 오디오 신호 | |
KR102102450B1 (ko) | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 | |
CN102089817B (zh) | 用于计算频谱包络数目的装置与方法 | |
AU2007206167B2 (en) | Apparatus and method for encoding and decoding signal | |
CN102648495B (zh) | 用于利用适应性过取样产生高频音频信号的装置及方法 | |
CA2746837A1 (en) | Audio encoder and bandwidth extension decoder | |
CN105103225A (zh) | 立体声音频编码器和解码器 | |
CN103620679A (zh) | 具有灵活配置功能的音频编码器和解码器 | |
CN101390159A (zh) | 在解码器和相应设备中可靠识别和衰减数字信号中的回声的方法 | |
CN104103276A (zh) | 一种声音编解码装置及其方法 | |
CN105308680A (zh) | 音频编码器和解码器 | |
RU2809586C2 (ru) | Аудиокодер и декодер для кодирования по форме волны с перемежением |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |