CN112466312A - 用于对编码音频信号进行解码的设备、方法及计算机程序 - Google Patents

用于对编码音频信号进行解码的设备、方法及计算机程序 Download PDF

Info

Publication number
CN112466312A
CN112466312A CN202011075098.9A CN202011075098A CN112466312A CN 112466312 A CN112466312 A CN 112466312A CN 202011075098 A CN202011075098 A CN 202011075098A CN 112466312 A CN112466312 A CN 112466312A
Authority
CN
China
Prior art keywords
frequency
spectral
signal
tile
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011075098.9A
Other languages
English (en)
Inventor
萨沙·迪施
拉尔夫·盖格尔
克里斯蒂安·黑尔姆里希
弗雷德里克·纳格尔
克里斯蒂安·诺伊坎
康斯坦丁·施密特
米夏埃尔·菲舍尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN112466312A publication Critical patent/CN112466312A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Abstract

提供了用于对编码音频信号进行解码的设备、方法及计算机程序。用于对包括编码核心信号和参数化数据的编码音频信号进行解码的设备包括:核心解码器(600),用于对编码核心信号进行解码以获得解码核心信号;分析器(602),用于在执行频率再生操作之前或之后对解码核心信号进行分析以提供分析结果(603);以及频率再生器(604),用于使用解码核心信号的频谱部分、参数化数据(605)和分析结果(603)来再生未包括在解码核心信号中的频谱部分。

Description

用于对编码音频信号进行解码的设备、方法及计算机程序
本专利申请是国际申请日为2014年7月15日、国家申请号为201480041246.1、发明名称为“用于对编码音频信号进行解码的设备、方法及计算机程序”的专利申请的分案申请。
技术领域
本发明涉及音频编码/解码,并且具体地涉及使用智能间隙填充(IGF)的音频编码。
背景技术
音频编码为使用心理声学知识处理音频信号中的冗余及无关部分的信号压缩领域。如今音频编解码器通常需要大约60kbps/声道以对几乎任何类型的音频信号进行感知透明编码。较新的编解码器旨在使用如带宽扩展(BWE)的技术通过利用信号中的频谱相似度来降低编码比特率。BWE方案使用低比特率参数集来表示音频信号的高频(HF)分量。HF频谱填充有来自低频(LF)区域的频谱内容,并且频谱形状、倾斜和时域连续性被调整以维持原始信号的音质和音色。这样的BWE方法使得音频编解码器即使在大约24kbps/声道的低比特率下仍能够保持良好的品质。
本发明的音频编码系统以各种各样的比特率对任意音频信号高效地编码。然而,对于高比特率而言,本发明的系统收敛至透明,对于低比特率而言,感知烦恼被最小化。因此,在编码器中可用比特率的主要份额用于仅对信号的在感知上最相关的结构进行波形编码,并且在解码器中所得到的频谱间隙被粗略地近似于原始频谱的信号内容填充。通过从编码器发送至解码器的专用边信息来控制参数驱动的所谓的频谱智能间隙填充(IGF)仅消耗非常有限的比特预算。
音频信号的存储或传输经常受到严格的比特率约束。在过去,当仅有很低的比特率可用时编码器才被迫大幅度地减小传输音频带宽。
现代音频编解码器如今能够通过使用带宽扩展(BWE)方法[1]对宽带信号进行编码。这些算法依赖于高频内容(HF)的参数化表示以及参数驱动的后处理的应用,高频内容(HF)的参数化表示借助至HF频谱区域的转移(“修补(patching)”)来从波形编码低频部分(LF)生成。按照BWE方案,高于给定的所谓的交叉频率的HF频谱区域的重构通常基于频谱修补。通常,HF区域包括多个相邻补片,并且这些补片中的每一个源自低于给定的交叉频率的LF频谱的带通(BP)区域。现有技术系统通过将一组相邻子频带系数从源区域拷贝至目标区域来高效地执行滤波器组表示例如正交镜像滤波器组(QMF)内的修补。
在如今的音频编解码器中发现的提高压缩效率从而使得能够在低比特率下扩展音频带宽的另一种技术是音频频谱的适当部分的参数驱动合成替换。例如,原始音频信号的类噪声信号部分可以用在解码器中生成并且由边信息参数缩放的人造噪声来替换,而基本上不损失主观品质。一个示例是包括在MPEG-4高级音频编码(AAC)中的感知噪声替代(PNS)工具[5]。
还提供了也使得能够在低比特率下扩展音频带宽的另一种技术,其是包括在MPEG-D统一语音与音频编码(USAC)中的噪声填充技术[7]。通过由于太粗糙的量化导致的量化器的死区而推断出的频谱间隙(零)随后以解码器中的人工噪声来填充并且通过参数驱动后处理来缩放。
另一种现有技术系统被称为精确频谱替换(ASR)[2-4]。除了波形编解码器以外,ASR还采用专用信号合成段,其在解码器处恢复信号的在感知上重要的正弦部分。此外,[5]中描述的系统依赖于波形编码器的HF区域中的正弦建模以使得扩展的音频带宽在低比特率下仍具有还不错的感知品质。所有这些方法涉及将数据变换至除了改进的离散余弦变换(MDCT)以外的第二域的变换并且还涉及用于保留HF正弦分量的相当复杂的分析/合成段。
图13A示出了用于如在例如高效高级音频编码(HE-ACC)中使用的带宽扩展技术的音频编码器的示意图。线1300处的音频信号被输入至包括低通1302和高通1304的滤波器系统。由高通滤波器1304输出的信号被输入至参数提取器/编码器1306。参数提取器/编码器1306被配置成用于计算并且编码参数如例如频谱包络参数、噪声添加参数、丢失的谐波参数或逆滤波参数。所提取的这些参数被输入至比特流复用器1308。低通输出信号被输入至通常包括下采样器1310和核心编码器1312的功能的处理器。低通1302将要被编码的带宽限于与出现在线1300上的原始输入音频信号中出现的带宽相比明显较小的带宽。这由于以下事实而提供了明显的编码增益:核心编码器中出现的全部功能仅必须对具有减小了的带宽的信号进行操作。当例如线1300上的音频信号的带宽为20kHz时并且当低通滤波器1302具有例如4kHz的带宽时,为了满足采样定理,理论上充分的是,下采样器之后的信号的采样频率为8kHz,其基本上降低至必须至少是40kHz的音频信号1300所需的采样速率。
图13B示出了相应的带宽扩展解码器的示意图。解码器包括比特流复用器1320。比特流解复用器1320提取核心解码器1322的输入信号和参数解码器1324的输入信号。在上面的示例中,核心解码器输出信号的采样速率为8kHz并且因此带宽为4kHz,然而,对于完整的带宽重构,高频重构器1330的输出信号必须处于20kHz,其要求至少40kHz的采样速率。为了使这可能,需要具有上采样器1325和滤波器组1326的功能的解码器处理器。然后,高频重构器1330接收由滤波器组1326输出的经频率分析的低频信号,并且使用高频带的参数化表示对由图13A的高通滤波器1304限定的频率范围进行重构。高频重构器1330具有几个功能如使用低频范围中的源范围来再生上频率范围、频谱包络调整、噪声添加功能以及在上频率范围内引入丢失的谐波的功能,并且为了解释较高频率范围通常与较低频率范围具有不同的音调的事实,如果在图13A的编码器中施加以及计算,则还包括逆滤波操作。在HE-ACC中,丢失的谐波在解码器侧上被重新合成,并且被精确地置于重构频带的中间。因此,在某个重构频带中确定了的所有丢失的谐波线未被放置在位于原始信号中的频率值处。替代地,那些丢失的谐波线被置于某个频带的中心内的频率处。从而,当原始信号中的丢失的谐波线被放置得很靠近原始信号中的重构频带边界时,通过将重构信号中的该丢失的谐波线置于频带的中心处而引入的频率的误差接近生成并且发送了参数的个别重构频带的50%。
此外,尽管典型的音频核心编码器操作在频谱域中,然而核心解码器生成时域信号,然后该时域信号通过滤波器组1326功能再次被转换至频谱域。这引入了额外的处理延迟,由于首先从频谱域变换成频域以及再次变换成通常不同的频域的串联处理而可能引入伪声,并且当然这还要求大量的计算复杂度以及因此电力,当带宽扩展技术被应用于移动装置如移动电话、平板或手提计算机等时,电力尤其是问题。
当前音频编解码器使用BWE作为编码方案的主要部分来执行低比特率音频编码。然而,BWE技术限于仅替换高频(HF)内容。此外,它们不能使得高于给定的交叉频率的感知上重要的内容能够被波形编码。因此,由于在大多数系统中不考虑信号的音调谐波的精确对准,所以当实现BWE时,当代音频编解码器丢失HF细节或音品。
目前现有技术的BWE系统的另一缺点是需要将音频信号变换至新的域中以实现BWE(例如,从MDCT域变换至QMF域)。这导致同步复杂、额外的计算复杂度以及增加了的存储需求。
音频信号的存储或传输经常受到严格的比特率约束。在过去,当仅很低的比特率可用时编码器才被迫大幅度地减小传输音频带宽。现代音频编解码器如今能够通过使用带宽扩展(BWE)方法[1-2]对宽带信号进行编码。这些算法依赖于高频内容(HF)的参数化表示以及参数驱动的后处理的应用,高频内容(HF)的参数化表示借助于至HF频谱区域的转移(“修补”)来从解码信号的波形编码的低频部分(LF)生成。
按照BWE方案,高于给定的所谓的交叉频率的HF频谱区域的重构通常基于频谱修补。用来填充频谱间隙的其他方案例如智能间隙填充(IGF)使用邻近的所谓频谱铺片来再生音频信号HF频谱的部分。通常,HF区域包括多个相邻补片或铺片,并且这些补片或铺片中的每一个源自低于给定的交叉频率的LF频谱的带通(BP)区域。现有技术系统通过将一组相邻子频带系数从源区域拷贝至目标区域来高效地执行滤波器组表示内的修补或平铺。然而,对于一些信号内容,根据LF频带和HF频带内的相邻补片进行的重构信号的组装会导致差拍、失调和听觉的粗糙感。
因此,在[19]中,失调防护频带滤波的概念出现在基于滤波器组的BWE系统的背景下。其建议在LF与BWE再生HF之间的交叉频率处有效地应用近似1巴克(bark)带宽的陷波滤波器,以避免失调的可能性并且取代具有零信号或噪声的频谱内容。
然而,[19]中提议的解决方案具有一些缺点:首先,以零信号或噪声中任之一严格取代频谱内容还可能损害信号的感知品质。此外,所提出的处理不是信号自适应的,并且因此可能在一些情况下损害感知品质。例如,如果信号包含瞬变信号,则这可能导致预回声和后回声。
其次,失谐还可能发生在连续HF补片之间的过渡处。[19]中提议的解决方案仅用来补救发生在LF与BWE再生HF之间的交叉频率处的失调。
最后,与如在[19]中提出的基于滤波器组的系统不同,BWE系统还能够在基于变换的实现诸如例如改进型离散余弦变换(MDCT)中实现。变换诸如MDCT非常容易受所谓的颤音[20]或鸣响伪声的影响,上述所谓的颤音或鸣响发生在当频谱系数的带通区域被拷贝或者频谱系数被设置为如在[19]中提出的零时。
具体地,美国专利8,412,365公开了在基于滤波器组的转化或折叠中使用所插入的由被设置为零的一个或几个子频带声道构成的所谓防护频带。多个滤波器组声道被用作防护频带,并且防护频带的带宽应当为0.5巴克。这些失调防护频带使用随机白噪声信号被部分地重构,即,这些子频带被填入白噪声而不是零信号。与要处理的当前信号无关地插入防护频带。
发明内容
本发明的目的是提供一种对编码音频信号进行解码的改进了的概念。
该目的通过用于对编码音频信号进行解码的设备、对编码音频信号进行解码的方法、或者计算机可读介质来实现。
根据本发明,使用分析器的解码器侧信号分析被执行,以用于在执行频率再生操作之前或之后分析解码核心信号以提供分析结果。然后,该分析结果被频率再生器用于再生未包括在解码核心信号中的频谱部分。
因此,与固定的解码器设置相比,其中,以固定方式执行修补或频率平铺,即,其中,某个源范围取自核心信号并且某些固定频率边界被施加以设置源范围与重构范围之间的频率或者设置重构范围内的两个相邻频率补片或铺片之间的频率边界,执行信号相关的修补或平铺,其中,例如,能够分析核心信号以找到核心信号中的局部最小值,并且然后选择核心范围使得核心范围的频率边界与核心信号频谱中的局部最小值一致。
可替选地或另外地,可以对初步再生信号或初步频率修补或平铺信号执行信号分析,其中,在初步频率再生过程之后,分析核心范围与重构范围之间的边界以检测任何伪声产生信号部分,如当重构时由于其彼此非常接近而生成差拍伪声的成问题的音调部分。可替选地或另外地,还可以按照以下方式检查边界:检测音调部分的中途削剪,并且当重构时音调部分的该削剪照样还会造成伪声。为了避免这些过程,可以由信号操作器修改重构范围和/或源范围和/或重构范围中的两个单独频率铺片或补片之间的频率边界以用新设置的边界再次执行重构。
另外地或可替选地,频率再生是基于分析结果的再生,因为频率边界被按原样保留并且靠近源范围与重构范围之间或者重构范围内的两个单独频率铺片或补片之间的频率边界的成问题的音调部分被消除或者至少衰减。这样的音调部分可能是接近的音调,其可能导致差拍伪声或者可能是中途削剪的音调部分。
具体地,当使用非节能变换如MDCT时,单个音调并不直接映射至单条频谱线。替代地,单个音调将取决于音调相位而映射至具有一定幅度的一组频谱线。当修补操作削剪该音调部分时,则即使如在MDCT重构器中实施了完美的重构,这在重构之后仍将导致伪声。这是由于下述事实:MDCT重构器将需要音调的完整的音调模式以最终正确地重构该音调。由于之前已发生削剪,所以这再也不可能,并且因此将创造出时变的颤音伪声。基于根据本发明的分析,频率再生器将通过衰减造成伪声的完整的音调部分、或者如前面讨论地通过改变相对应的边界频率、或通过应用两个测量、或通过甚至基于对这样的音调模式的一定预知来重构被削剪的部分,以避免该情况。
另外地或可替选地,交叉滤波可应用于对解码核心信号以及频率从间隙填充频率扩展至第一铺片停止频率的第一频率铺片进行频谱上的交叉滤波,或者用于对第一频率铺片和第二频率铺片进行频谱上的交叉滤波。
该交叉滤波对减少所谓的滤波器鸣响有用。
本发明的方法主要意在基于如MDCT的变换而被应用于BWE中。然而,本发明的教示通常例如类似地适用于基于正交镜像滤波器组(QMF)的系统内,特别是如果系统被临界采样,例如实值QMF表示。
本发明的方法基于以下观察:听觉的粗糙感、差拍和失调可以仅发生在接近过渡点(诸如交叉频率或补片边界)的频域区域中的信号内容非常音调性时。因此,针对在现有技术中发现的缺点而提出的解决方案包括对过渡区域中的音调分量的信号自适应检测以及对这些分量的随后衰减或去除。优选地,可以通过对这种分量的底对底频谱插值或者可替选地通过零信号或噪声插入完成对这些分量的衰减或去除。可替选地,可以信号自适应地选择过渡的频谱位置,使得过渡伪声最小化。
另外,该技术可以用于减少或者甚至避免滤波器鸣响。尤其对于类瞬变信号,鸣响是可以被听见并且恼人的伪声。滤波器鸣响伪声由滤波器的所谓的砖墙式特性在过渡频带(在截止频率处从通带到阻带的陡峭过渡)中引起。可以通过在时间频率变换的频率域中将一个系数或多组系数设置为零来高效地实现这样的滤波器。所以,在BWE的情况下,建议在补片之间或者核心频带与第一补片之间的每个过渡频率处应用交叉滤波器以减少上述鸣响效应。可以通过变换域中的采用适合增益函数的频谱加权来实现交叉滤波器。
根据本发明的另一方面,用于对编码音频信号进行解码的设备包括:核心解码器;铺片生成器,用于使用解码核心信号的频谱部分来生成具有未包括在解码核心信号中的频率的一个或更多个频谱铺片;以及交叉滤波器,用于对解码核心信号以及频率从间隙填充频率扩展至第一铺片停止频率的第一频率铺片进行频谱上的交叉滤波,或者用于对某个铺片和另外的频率铺片进行频谱上的交叉滤波,所述另外的频率铺片具有与所述某个频率铺片的上边界频率频率邻近的下边界频率。
优选地,该过程意在基于如MDCT的变换而被应用于带宽扩展中。然而,本发明通常适用于并且特别是基于正交镜像滤波器组(QMF)的带宽扩展场景中,特别是如果系统被临界采样,例如当存在实值QMF表示作为时间频率转换或者作为频率时间转换时。
本实施方式对类瞬变信号特别有用,因为对于类瞬变信号,鸣响是能够听见且恼人的伪声。滤波器鸣响伪声由滤波器的所谓的砖墙式特性在过渡频带,即在截止频率处从通带到阻带的陡峭过渡中引起。可以通过在时间频率变换的频率域中将一个系数或多组系数设置为零来高效地实现这样的滤波器。因此,本发明依靠在补片/铺片之间或者核心频带与第一补片/铺片之间的每个过渡频率处的交叉滤波器来减少该鸣响伪声。优选地,通过变换域中的采用适合的增益函数的频谱加权来实现交叉滤波器。
优选地,交叉滤波器具有信号自适应性,并且包括两个滤波器,即应用于低频谱区域的渐出滤波器以及应用于高频谱区域的渐入滤波器。所述滤波器可以取决于具体实现而为对称或非对称。
在另一实施方式中,频率铺片或频率补片不仅经受交叉滤波,而且优选地,在执行交叉滤波之前,铺片生成器执行补片自适应,所述补片自适应包括在频谱最小值处设置频率边界以及将保留在过渡频率周围的过渡范围中的音调部分去除或衰减。
附图说明
下面参照附图讨论优选实施方式,其中:
图1A示出了用于对音频信号进行编码的设备;
图1B示出了与图1A的编码器匹配的用于对编码音频信号进行解码的解码器;
图2A示出了解码器的优选实现;
图2B示出了编码器的优选实现;
图3A示出了由图1B的频谱域解码器生成的频谱的示意性表示;
图3B示出了表示比例因子频带的比例因子与用于重构频带的能量之间的关系及噪声填充频带的噪声填充信息的表格;
图4A示出了频谱域编码器的用于将频谱部分的选择应用至第一组频谱部分和第二组频谱部分的功能;
图4B示出了图4A的功能的实现;
图5A示出了MDCT编码器的功能;
图5B示出了使用MDCT技术的解码器的功能;
图5C示出了频率再生器的实现;
图6A是根据一个实现的用于对编码音频信号进行解码的设备;
图6B是用于对编码音频信号进行解码的设备的另一实施方式;
图7A示出了图6A或图6B的频率再生器的优选实现;
图7B示出了分析器与频率再生器之间的合作的另一实现;
图8A示出了频率再生器的另一实现;
图8B示出了本发明的另一实施方式;
图9A示出了具有使用再生频率范围的能量值的频率再生技术的解码器;
图9B示出了图9A的频率再生器的更详细的实现;
图9C示出了示出图9B的功能的示意图;
图9D示出了图9A的解码器的又一实现;
图10A示出了与图9A的解码器匹配的编码器的框图;
图10B示出了用于说明图10A的参数计算器的又一功能的框图;
图10C示出了示出图10A的参数化计算器的又一功能的框图;
图10D示出了图10A的参数化计算器的又一功能的框图;
图11A示出了围绕瞬变信号的滤波器鸣响的频谱;
图11B示出了在应用带宽扩展之后的瞬变信号的频谱图;
图11C示出了在应用具有滤波器鸣响抑制的带宽扩展之后瞬变信号的频谱图;
图12A示出了用于对编码音频信号进行解码的设备的框图;
图12B示出了音调信号、没有补片/铺片自适应的拷贝、具有改变的频率边界的拷贝、以及伪声产生音调部分的另外消除的幅度频谱(程式化);
图12C示出了示例交叉渐变函数;
图13A示出了具有带宽扩展的现有技术编码器;
图13B示出了具有带宽扩展的现有技术解码器;
图14A示出了使用交叉滤波器的、用于对编码音频信号进行解码的另一设备;以及
图14B示出了示例性交叉滤波器的更详细的图示。
具体实施方式
图6A示出了用于对包括编码核心信号和参数化数据的编码音频信号进行解码的设备。该设备包括用于对编码核心信号进行解码以获得解码核心信号的核心解码器600,以及用于在执行频率再生操作之前或之后对解码核心信号进行分析的分析器602。分析器602被配置成用于提供分析结果603。频率再生器604被配置成使用解码核心信号的频谱部分、丢失的频谱部分的包络数据605以及分析结果603来再生未包括在解码核心信号中的频谱部分。因此,与早期的实现相比,频率再生在解码器侧上并非信号无关地执行,而是信号相关地执行。这具有以下优点:当不存在问题时,频率再生按原样执行,但是当存在有问题的信号部分时,则这由分析结果603来检测,然后,频率再生器604执行频率再生的适应方法,所述频率再生的适应方法可以是对例如核心区域与重构频带之间的初始频率边界的改变或者是对重构频带内的两个单独铺片/补片之间的频率边界的改变。相比防护频带的实现而言,这具有以下优点:具体过程仅在需要时执行,而不像在防护频带实现中,在没有任何信号相关性的情况下一直执行。
优选地,核心解码器600被实现为如图6B所示的熵(例如Huffman或算术解码器)解码和去量化段612。然后,核心解码器600输出核心信号频谱,并且该频谱由与图6A中的分析器602非常类似的频谱分析器614来分析,其被实现为频谱分析器而不是被实现为如图6A所示的还分析时间域信号的任何任意分析器。在图6B的实施方式中,频谱分析器被配置成用于分析频谱信号,使得能够确定源频带中以及/或者目标频带中即频率补片或频率铺片中的局部最小值。然后,如616处所示,频率再生器604执行补片边界被置为源频带和/或目标频带中的最小值的频率再生。
随后,讨论图7A以描述图6A的频率再生器604的优选实现。初步信号再生器702接收来自源频带的源数据作为输入并且另外还接收如初步边界频率的初步补片信息作为输入。然后,生成由用于检测初步重构信号703内的音调分量的检测器704检测的初步再生信号703。可替选地或另外地,还可以由与图6A的分析器602对应的检测器来分析源数据705。然后,初步信号再生步骤将无必要。如稍后结合图12B所讨论的,当存在从源数据至重构数据的明确限定的映射时,则可以甚至通过考虑仅源数据来检测最小值或音调部分,无论音调部分是靠近核心范围的上边界还是处于两个单独生成的频率铺片之间的频率边界处。
当在频率边界处发现了有问题的音调分量时,过渡频率调整器706执行对过渡频率如核心频带与重构频带之间或由重构频带中的同一个源数据生成的各个频率部分之间的过渡频率或交叉频率或间隙填充起始频率进行调整。块706的输出信号被转发至边界处的音调分量的去除器708。去除器被配置成用于去除在块706的过渡频率调整之后依然存在的剩余音调分量。然后,去除器708的结果被转发至交叉滤波器710以解决滤波器鸣响问题,并且然后,将交叉滤波器710的结果输入至执行重构频带中的频谱包络整形的频谱包络整形块712中。
如在图7A的背景下讨论的,可以对源数据705或初步重构信号703两者执行块704中的音调分量检测。图7B示出了如块718所示创建初步再生信号的实施方式。然后,与图7A的信号703对应的信号然后被转发至检测伪声产生分量的检测器720。尽管检测器720可以被配置成为如图7A中的704处所示的用于检测频率边界处的音调分量的检测器,但是该检测器还可以被实现成检测其他伪声产生分量。这样的频谱分量可以是甚至除音调分量外的其他分量,并且可以通过尝试不同的再生并且比较不同的再生结果来执行是否产生了伪声的检测以找出哪一个再生提供了伪声产生分量。
现在,检测器720控制用于操作信号即初步再生信号的操作器722。可以通过由线723实际处理初步再生信号或者通过重新执行再生来进行该操作,但是现在具有如由线724所示的例如经修正的过渡频率。
操作过程的一个实现是如图7A中的706处所示来调整过渡频率。图8A示出了可以代替块706或者连同图7A的块706一起执行的另一实现。检测器802被设置成用于检测有问题的音调部分的起始频率和结束频率。然后,插值器804被配置成用于在频谱范围内的音调部分的起始处与结束处之间进行插值并且优选地进行复数插值。然后,如在图8A中由块806所示,用插值结果来替换该音调部分。
图8A中的块808和块810示出了替选实现。代替执行插值,在音调部分的起始处与结束处之间执行频谱线的随机生成808。然后,如810处所示执行随机生成的频谱线的能量调整,并且设置随机生成的频谱线的能量使得该能量与相邻的非音调频谱部分类似。然后,用经包络调整的随机生成的频谱线来替换音频部分。可以随机生成或者伪随机生成频谱线以提供尽可能无伪声的替换信号。
图8B示出了另一实现。在块820处示出了位于图6A的频率再生器604内的频率铺片生成器。频率铺片生成器使用预定频率边界。然后,分析器分析由频率铺片生成器生成的信号,并且优选地,频率铺片生成器820被配置成用于执行多个平铺操作来生成多个频率铺片。然后,图8B中的操作器824根据分析器822所输出的分析结果来操作频率铺片生成器的结果。该操作可以是对频率边界的改变或者对各个部分的衰减。然后,频谱包络调整器826使用如已在图6A的背景下讨论的参数化信息605来执行频谱包络调整。
然后,将块826所输出的频谱调整信号输入至另外地接收第一频谱部分即核心解码器600的输出信号的频谱表示的频率时间转换器。然后,频率时间转换器828的输出可以用于存储或者用于发送至扬声器以供音频呈现。
本发明可以应用于如图13A和图13B所示的已知频率再生过程或者优选地,可以应用于随后参考图1A至图5B以及图9A至图10D描述的智能间隙填充情形中。
图1A示出了用于对音频信号99进行编码的设备。音频信号99被输入至时间频谱转换器100,时间频谱转换器100用于将具有采样速率的音频信号转换成由该时间频谱转换器输出的频谱表示101。频谱101被输入至用于分析频谱表示101的频谱分析器102。频谱分析器101被配置成用于确定要以第一频谱分辨率被编码的第一组第一频谱部分103以及要以第二频谱分辨率被编码的不同的第二组第二频谱部分105。第二频谱分辨率小于第一频谱分辨率。第二组第二频谱部分105被输入至用于计算具有第二频谱分辨率的频谱包络信息的参数计算器或参数化编码器104。此外,设置频谱域音频编码器106用于生成具有第一频谱分辨率的第一组第一频谱部分的第一编码表示107。此外,参数计算器/参数化编码器104被配置成用于生成第二组第二频谱部分的第二编码表示109。第一编码表示107和第二编码表示109被输入至比特流复用器或比特流形成器108,并且块108最终输出编码音频信号以进行传输或存储在存储装置上。
通常,第一频谱部分如图3A的306会由两个第二频谱部分如307A和307B围绕。在HEAAC中并不是这种情况,在HE AAC中核心编码器频率范围频带受限。
图1B示出了与图1A的编码器匹配的解码器。第一编码表示107被输入至用于生成第一组第一频谱部分的第一解码表示的频谱域音频解码器112,该解码表示具有第一频谱分辨率。此外,第二编码表示109被输入至用于生成具有低于第一频谱分辨率的第二频谱分辨率的第二组第二频谱部分的第二解码表示的参数化解码器114。
解码器还包括用于使用第一频谱部分再生具有第一频谱分辨率的重构的第二频谱部分的频率再生器116。频率再生器116执行铺片填充操作,即,使用第一组第一频谱部分的铺片或一部分并且将第一组第一频谱部分拷贝至具有第二频谱部分的重构范围或重构频带中,并且通常执行频谱包络成形或由参数化解码器114所输出的第二解码表示所指示的其他操作,即,通过使用关于第二组第二频谱部分的信息。如在线117上的频率再生器116的输出端处所示,经解码的第一组第一频谱部分和重构的第二组频谱部分被输入至频谱时间转换器118,频谱时间转换器118被配置成用于将第一解码表示和重构的第二频谱部分转换成时间表示119,该时间表示具有某个高的采样速率。
图2B示出了图1A的编码器的实现。音频输入信号99被输入至与图1A的时间频谱转换器100对应的分析滤波器组220。然后,在TNS块222中执行时域噪声整形操作。因此,至与图2B的音调掩蔽块对应的图1A的频谱分析器102的输入在当时域噪声整形/时域铺片整形操作不被应用时可以是全部频谱值,并且在当如2B所示的块222的TNS操作被应用时可以是频谱残差值。对于双声道信号或多声道信号,可以另外地执行联合声道编码228以使得图1A的频谱域编码器106可以包括联合声道编码块228。此外,提供用于执行无损数据压缩的熵编码器232,其也是图1A的频谱域编码器106的一部分。
频谱分析器/音调掩蔽226将TNS块222的输出分离成与第一组第一频谱部分103对应的核心频带和音调分量以及与图1A的第二组第二频谱部分105对应的残差分量。被表示为IGF参数提取编码的块224对应于图1A的参数化编码器104,并且比特流复用器230对应于图1A的比特流复用器108。
优选地,分析滤波器组222被实现为MDCT(改进型离散余弦变换滤波器组),并且该MDCT用于使用用作频率分析工具的改进型离散余弦变换将信号99变换至时间频率域。
优选地,频谱分析器226应用音调掩蔽。该音调掩蔽估计段用于将信号中的音调分量与类噪声分量分离开。这使得核心编码器228可以使用心理声学模块对所有音调分量进行编码。音调掩蔽估计段可以按照大量不同的方式来实现,并且优选地被实现成在功能方面类似于在语音/音频编码的正余弦建模中使用的正弦轨迹估计段[8,9]或在[10]中描述的基于HILN模型的音频编码器。优选地,使用一种易于实现而不必须维持生死轨迹的实现,但是还可以使用任何其他音调或噪声检测器。
IGF模块计算源区域与目标区域之间存在的相似度。目标区域将由来自源区域的频谱表示。使用互相关方法来进行源区域与目标区域之间的相似度的测量。目标区域被划分成nTar个非交叠频率铺片。对于目标区域中的每个铺片,从固定起始频率起创建nSrc个源铺片。这些源铺片以0与1之间的因子交叠,其中0表示0%交叠,1表示100%交叠。这些源铺片中的每一个与各种滞后处的目标铺片相关,以找出与目标铺片最佳地匹配的源铺片。最佳匹配铺片数量被存储在tileNum[idx_tar]中,在其处与目标最相关的滞后被存储在xcorr_lag[idx_tar][idx_src]中,并且相关的符号被存储在xcorr_sign[idx_tar][idx_src]中。在高度负相关的情况下,源铺片需要在解码器处进行铺片填充处理之前乘以-1。由于使用音调掩蔽来保存音调分量,所以IGF模块还要注意不覆写频谱中的音调分量。带状能量参数用于存储目标区域的能量,其使得能够准确地重构频谱。
该方法相对于经典的SBR[1]具有某些优点的原因在于:由核心编码器保存多音调信号的谐波网格,而仅正弦波之间的间隙填充有来自源区域的最匹配的“整形噪声”。该系统相比ASR(精确频谱替换)[2-4]而言的另一优点是不存在信号合成段,该信号合成段在解码器处创建信号的重要部分。替代地,该任务由核心编码器接管,使得能够保存频谱的重要分量。所提出的系统的另一优点是特征所提供的连续的可伸缩性。对于每个铺片,仅使用tilieNum[idx_tar]以及xcorr_lag=0,其被称为粗粒度匹配,并且当为每个铺片使用变量xcorr_lag时,可以用于低比特率,使得能够较佳地匹配目标频谱和源频谱。
另外,提出了铺片选择稳定化技术,其去除频域伪声如颤音噪声或音乐噪声。
在立体声声道对的情况下,应用另外的联合立体声处理。这是必要的,因为对于某个目的范围,信号可以来自高度相关的平移声音源。在针对该特定区域而选择的源区域非良好相关的情况下,虽然能量针对目的区域被匹配,但空间图像可能由于不相关的源区域而受损。编码器分析每个目的区域能量频带,通常执行频谱值的互相关,并且如果超过某个阈值,则为该能量频带设置联合标签。在解码器中,如果未没置联合立体声标签,则单独地处理左声道能量频带和右声道能量频带。在设置联合立体声标签的情况下,在联合立体声域执行能量和修补两者。IGF区域的联合立体声信息类似于核心编码的联合立体声信息被用信号发送,包括在预测情况下表示预测的方向是从下混合至残差还是从残差至下混合的标签。
能量可以根据L/R域中的传送能量来计算。
midNrg[k]=leftNrg[k]+rightNrg[k];
sideNrg[k]=leftNrg[k]-rightNrg[k];
其中,k是变换域中的频率索引。
另一解决方案是在联合立体声域中针对其中联合立体声是活动的频带直接计算和发送能量,所以在解码器侧不需要额外的能量变换。
源铺片总是根据中间/侧矩阵来创建:
midTile[k]=0.5·(leftTile[k]+rightTile[k])
sideTile[k]=0.5·(leftTile[k]-rightTile[k])
能量调整:
midTile[k]=midTile[k]*midNrg[k];
sideTile[k]=sideTile[k]*sideNrg[k];
联合立体声->LR变换:
如果没有另外的参数被编码:
leftTile[k]=midTile[k]+sideTile[k]
rightTile[k]=midTile[k]-sideTile[k]
如果有另外的预测参数被编码并且如果用信号发送的方向是从中间至侧:
sideTile[k]=sideTile[k]-predictionCoeff·midTile[k]
leftTile[k]=midTile[k]+sideTile[k]
rightTile[k]=midTile[k]-sideTile[k]
如果用信号发送的方向是从侧至中间:
midTile1lk]=midTile[k]-predictionCoeff·sideTile[k]
leftTile[k]=midTile1[k]-sideTile[k]
rightTile[k]=midTile1[k]+sideTile[k]
该处理确保:根据用于再生成高度相关的目的区域和平移目的区域的铺片,即使源区域不相关,结果的左声道和右声道仍表示相关和平移声音源,保留了这样的区域的立体声图像。
换言之,在比特流中,传送表示是否应当使用L/R或M/S作为一般联合立体声编码的示例的联合立体声标签。在解码器中,首先,如与由核心频带的联合立体声标签表示的,核心信号被解码。第二,核心信号被存储在L/R和M/S表示中。对于IGF铺片填充,如由IGF频带的联合立体声信息表示,源铺片表示被选择以匹配目标铺片表示。
时域噪声整形(TNS)是标准技术并且是ACC[11-13]的一部分。TNS可以被认为是感知编码器的基本方案的扩展,在滤波器组与量化段之间插入可选的处理步骤。TNS模块的主要任务是将所产生的量化噪声隐藏在类瞬变信号的时域掩蔽区域中,从而导致更高效的编码方案。首先,TNS在变换域例如MDCT中使用“前向预测”计算一组预测系数。然后,这些系数用于平坦化信号的时域包络。当量化影响经TNS滤波的频谱时,量化噪声也在时间上平坦。通过在解码器侧上应用逆TNS滤波,量化噪声根据TNS滤波器的时域包络被整形,因此量化噪声短暂地被掩蔽。
IGF基于MDCT表示。为了高效编码,优选地,必须使用大约20ms的长块。如果这样的长块内的信号包括瞬变信号,则由于铺片填充而在IGF频谱带中出现可听见的预回声和后回声。
在IGF背景下,通过使用TNS来减小该预回声效果。在此,当在解码器中对TNS残差信号执行频谱再生时,TNS用作时域铺片整形(TTS)工具。照例使用编码器侧上的全频谱来计算和应用所需的TTS预测系数。TNS/TTS起始和终止频率不受IGF工具的IGF起始频率fIGFstart的影响。与传统的TNS相比,TTS终止频率被增大至IGF工具的终止频率,其高于fIGFstart。在解码器侧上,再次对全频谱即核心频谱加上再生的频谱加上来自音调图的音调分量应用TNS/TTS系数。TTS的应用对于以下是必需的:形成再生的频谱的时域包络以再次与原始信号的包络匹配。所以,减小了示出的预回声。另外,仍然照例使用TNS对信号中的低于fIGFstart的量化噪声进行整形。
在传统的解码器中,对音频信号的频谱修补破坏修补边界处的频谱相关,并且因此通过引入分散而损害音频信号的时域包络。因此,对残差信号执行IGF铺片填充的另一益处在于:在应用整形滤波器之后,铺片边界无缝相关,从而导致对信号的更加逼真的时域再现。
在本发明的编码器中,经历了TNS/TTS滤波、音调掩蔽处理和IGF参数估计的频谱缺乏除了音调分量以外的任何高于IGF起始频率的信号。该稀疏频谱现在由核心编码器使用算术编码和预测编码的原理来编码。这些编码的分量连同信令比特形成音频的比特流。
图2A示出了对应的解码器实现。图2A中的与编码音频信号对应的比特流被输入至解复用器/解码器,解复用器/解码器相对于图1B将被连接至块112和114。比特流解复用器将输入的音频信号分离成图1B的第一编码表示107和图1B的第二编码表示109。具有第一组第一频谱部分的第一编码表示被输入至与图1B的频谱域解码器112对应的联合声道解码块204。第二编码表示被输入至未在图2A中示出的参数化解码器114,然后被输入至与图1B的频率再生器116对应的IGF块202。频率再生所需要的第一组第一频谱部分经由线203被输入至IGF块202。此外,在联合声道解码204之后,在音调掩蔽块206中应用具体的核心解码以使得音调掩蔽206的输出对应于频谱域解码器112的输出。然后,通过组合器208执行组合,即,其中组合器208的输出现在具有全范围频谱但仍处于TNS/TTS滤波域的帧构建。然后,在块210中,使用经由线109提供的TNS/TTS滤波器信息执行逆TNS/TTS操作,即,TTS边信息优选地包括在由频谱域编码器106生成的第一编码表示中,或者可以被包括在第二编码表示中,频谱域编码器106可以是例如简单的AAC或USAC核心编码器。在块210的输出处,提供直至最大频率为止的完整频谱,其是由原始输入信号的采样速率限定的全范围频率。然后,在合成滤波器组212中执行频谱/时间转换以最终获得音频输出信号。
图3A示出了频谱的示意性表示。该频谱按照比例因子频带SCB被细分,其中,在图3A示出的示例中具有7个比例因子频带SCB1至SCB7。如图3A中示意性地示出的,比例因子频带可以是以AAC标准限定的AAC比例因子频带,并且具有至上频率的增大的带宽。优选的是不从频谱的一开始即在低频处执行智能间隙填充,而是在309处示出的IGF起始频率处开始IGF操作。因此,核心频带从最低频率扩展至IGF起始频率。在IGF起始频率之上,应用频谱分析以将高分辨率频谱分量304、305、306、307(第一组第一频谱部分)与由第二组第二频谱部分表示的低分辨率分量分离开。图3A示出了被示例性地输入至频谱域编码器106或联合声道编码器228的频谱,即,核心编码器在全范围下操作,但是对大量的零频谱值进行编码,即,这些零频谱值被量化成零或者在量化前后被设置成零。无论如何,核心解码器操作在全范围,即,如频谱会如所示出的一样,即,核心解码器不必非得知道具有较低频谱分辨率的第二组第二频谱部分的任何智能间隙填充或编码。
优选地,高分辨率由频谱线如MDCT线的线状编码来限定,而第二分辨率或低分辨率通过例如仅计算每比例因子频带的单个频谱值来限定,其中,比例因子频带覆盖几条频率线。从而,第二低分辨率关于其频谱分辨率远低于通常由核心编码器如AAC或USAC核心编码器所应用的线状编码定义的第一或高分辨率。
关于比例因子或能量计算,在图3B中示出了该情况。由于编码器是核心编码器的事实以及由于在每个频带中可以存在但不是必须存在第一组频谱部分的事实,核心编码器不仅在低于IGF起始频率309的核心范围中而且还在高于IGF起始频率直至最大频率fIGFstop的范围内计算每个频带的比例因子,fIGFstop小于或等于采样频率的二分之一即fs/2。从而,图3A的编码音调部分302、304、305、306、307以及在该实施方式中连同比例因子SCB1至SCB7对应于高分辨率频谱数据。低分辨率频谱数据从IGF起始频率开始被计算,并且对应于能量信息值E1、E2、E3、E4,其连同比例因子SF4至SF7一起被发送。
特别地,当核心编码器处于低比特率条件下时,可以在核心频带即频率低于IGF起始频率,即在比例因子频带SCB1至SCB3中另外地应用另外的噪声填充操作。在噪声填充中,存在被量化成了零的几条相邻的频谱线。在解码器侧上,这些量化成零的频谱值被重新合成,并且经重新合成的频谱值的幅度使用噪声填充能量如图3B中的308处示出的NF2被调整。尤其相对于USAC中的比例因子可以以绝对值或相对值给出的噪声填充能量对应于被量化成零的该组频谱值的能量。这些噪声填充频谱线还可以被视为第三组第三频谱部分,其在没有任何依赖于使用来自其他频率的频率铺片的频率再生的IGF操作的情况下通过简单的噪声填充合成来生成,所述噪声填充合成用于使用来自源范围的频谱值以及能量信息E1、E2、E3、E4来重构频率铺片。
优选地,计算能量信息的频带与比例因子频带一致。在其他实施方式中,应用能量信息值分组以使得例如对于比例因子频带4和5仅发送单个能量信息值,但是甚至在该实施方式中,分组的重构频带的边界与比例因子边界的边界一致。如果应用不同的频带分离,则可以应用某些重新计算或合成,并且这可以根据某个实现而合乎情理。
优选地,图1A的频谱域编码器106是如图4A中所示的心理声学驱动的编码器。通常,如按照例如MPEG2/4AAC标准或MPEG1/2,层3标准所示,要在变换成了频谱范围(图4A中的401)之后被编码的音频信号转发至比例因子计算器400。比例因子计算器由心理声学模型控制,该心理声学模型另外地接收要量化的音频信号或如在MPEG1/2层3或按照MPEG AAC标准中接收音频信号的复数频谱表示。心理声学模型针对每个比例因子频带计算用于表示心理声学阈值的比例因子。另外,然后,比例因子通过公知的内外迭代循环的协作或通过任何其他适当的编码过程被调整以使得实现某些比特率条件。一方面要量化的频谱值和另一方面所计算的比例因子被输入至量化器处理器404。在简单的音频编码器操作中,要量化的频谱值通过比例因子加权,并且然后经加权的频谱值被输入至固定的量化器,该固定的量化器通常具有至上幅度范围的压缩功能。然后,在量化器处理器的输出端处,确实存在量化索引,然后量化索引被转发至熵编码器,熵编码器通常具有对于相邻频率值或在本领域也称作零值的“运行”的一组零量化索引的特定并且非常有效的编码。
然而,在图1A的音频编码器中,量化器处理器通常接收关于来自频谱分析器的第二频谱部分的信息。从而,量化器处理器404弄清楚:在量化器处理器404的输出中,如由频谱分析器102识别的第二频谱部分为零或者具有由编码器或解码器承认为零表示的表示,零表示可以很高效地被编码,尤其当在频谱中存在零值的“运行”时。
图4B示出了量化器处理器的实现。MDCT频谱值可以被输入至设置成零块410。然后,在在块412中通过比例因子执行加权之前,第二频谱部分就已经被设置成零。在另一实现中,不提供块410,但是在加权块412之后的块418中执行设置成零协作。在又一实现中,还可以在量化器块420中的量化之后的设置成零块422中执行设置成零操作。在该实现中,不会出现块410和418。一般地,根据具体实现来提供块410、418、422中的至少之一。
然后,在块422的输出端处,获得与图3A中示出的频谱对应的经量化的频谱。然后,该经量化的频谱被输入至熵编码器如图2B中的232,其可以是Huffman编码器或按照例如USAC标准定义的算术编码器。
彼此交替地或者并行地设置的设置成零块410、418、422由频谱分析器424来控制。优选地,频谱分析器包括公知的音调检测器的任何实现或者包括操作地用于将频谱分离成要以高分辨率编码的分量以及要以低分辨率编码的分量的任何不同类型的检测器。在频谱分析器中实现的其他这样的算法可以是语音活动检测器、噪声检测器、话音检测器或根据不同频谱部分的频谱信息或关于分辨率要求的相关联的元数据进行判决的任何其他检测器。
图5A示出了图1A的时间频谱转换器的优选实现,例如按照AAC或USAC来实现。时间频谱转换器100包括由瞬变检测器504控制的加窗器502。当瞬变检测器504检测到瞬变信号时,则从长窗口至短窗口的切换被用信号发送给加窗器。然后,加窗器502针对交叠的块计算加窗的帧,其中每个加窗的帧通常具有2N个值如2048个值。然后,在块变换器506内执行变换,并且该块变换器通常另外地提供抽取来使得执行组合的抽取/变换以获得具有N个值如MDCT频谱值的频谱帧。从而,对于长窗口操作,块506的输入端处的帧包括2N个值如2048个值并且频谱帧则具有1024个值。那么,然而,当执行8个短块,并且其中每个短块与长窗口相比具有1/8的加窗时域值并且每个频谱块长块相比具有1/8的频谱值时,对短块执行切换。从而,当该抽取与加窗器的50%的交叠操作组合时,频谱是时域音频信号99的临界采样的版本。
随后,参照图5B,图5B示出了图1B的频率再生器116和频谱时间转换器118或图2A的块208、212的组合操作的具体实现。在图5B中,考虑特定的重构频带如图3A的比例因子频带6。该重构频带中的第一频谱部分即图3A的第一频谱部分306被输入至帧构建器/调整器块510。此外,比例因子频带6的重构的第二频谱部分也被输入至帧构建器/调整器510。此外,比例因子频带6的能量信息如图3B的E3也被输入至块510。重构频带中的重构的第二频谱部分已经使用源范围通过频率铺片填充被生成,并且则重构频带对应于目标范围。现在,执行帧的能量调整以因此最终获得具有N个值的完整重构的帧如例如在图2A的组合器208的输出端处获得的。然后,在块512中,执行逆块变换/插值以在块512的输入端处获得例如124个频谱值的248个时域值。然后,在块514中执行合成加窗操作,块514再次由作为编码音频信号中的边信息被发送的长窗口/短窗口表示来控制。然后,在块516中,执行与先前时间帧的交叠/相加操作。优选地,MDCT应用50%的交叠,使得对于2N个值的每个新的时间帧,最终输出N个时域值。50%的交叠由于以下事实而被强烈地优选:其提供临界采样以及由于块516中的交叠/相加操作从一个帧至下一个帧的连续交叉。
如图3A中的301处所示,例如对于与图3A的比例因子频带6一致的设想的重构频带,可以不仅在IGF起始频率之下而且还在IGF起始频率之上另外地应用噪声填充操作,然后,噪声填充频谱值也可以被输入至帧构建器/调整器510,并且在该块中还可以应用噪声填充频谱值的调整,或者在被输入至帧构建器/调整器510之前,就已经可以使用噪声填充能量来调整噪声填充频谱值。
优选地,IGF操作,即,使用来自其他部分的频谱值进行的频谱铺片填充操作可以被应用于完整的频谱。从而,频谱铺片填充操作不仅可以应用于IGF起始频率之上的高频带中,而且还可以应用于低频带中。此外,不使用频谱铺片填充的噪声填充也不仅可以应用于IGF起始频率之下,而且还可以应用于IGF起始频率之上。然而,已经发现,如图3A中所示,当噪声填充操作限于IGF起始频率之下的频谱范围时并且当频率铺片填充操作限于IGF起始频率之上的频谱范围时,可以获得高品质和高效音频编码。
优选地,目标铺片(TT)(具有大于IGF起始频率的频率)受制于全速率编码器的比例因子频带边界。从其获取信息的源铺片(ST),即,低于IGF起始频率的频率的源铺片不受制于比例因子频带边界。ST的大小应当对应于相关联的TT的大小。这使用下面的示例来示出。TT[0]具有10个MDCT频率点(bin)的长度。这精确地对应于两个后续的SCB的长度(如4+6)。然后,要与TT[0]相关的所有可能的ST也具有10个频率点的长度。与TT[0]相邻的第二目标铺片TT[1]具有15个频率点I的长度(具有7+8的长度的SCB)。然后,其ST具有15个频率点的长度而非TT[0]的10个频率点的长度。
假如出现不能找到用于具有目标铺片的长度的ST的TT的情况(当例如TT的长度大于可用源范围时),则不计算相关性,并且不将源范围多次拷贝至该TT中(一个接一个进行拷贝以使得第二拷贝的最低频率的频率线在频率上紧紧跟随第一拷贝的最高频率的频率线),直到完全填充目标铺片TT。
随后,参照图5C,图5C示出了图1B的频率再生器116或图2A的IGF块202的又一优选实施方式。块522是频率铺片生成器,其不仅接收目标频带ID而且另外还接收源频带ID。示例性地,在编码器侧上确定了:图3A的比例因子频带3非常好地适合于重构比例因子频带7。从而,源频带ID将是2,目标频带ID将是7。基于该信息,频率铺片再生器522应用复制或谐波铺片填充操作或任何其他铺片填充操作以生成频谱分量523的原始第二部分。频谱分量的原始第二部分具有与第一组第一频谱部分中包括的频率分辨率相同的频谱分辨率。
然后,重构频带如图3A的307的第一频谱部分被输入至帧构建器524,并且原始第二部分523也被输入至帧构建器524。然后,调整器526使用由增益因子计算器528计算的重构频带的增益因子对重构帧进行调整。然而,重要地,帧中的第一频谱部分不受调整器526影响,而是重构帧的仅原始第二部分受调整器526的影响。为此,增益因子计算器528分析源频带或原始第二部分523并且额外地分析重构频带中的第一频谱部分以最终找到正确的增益因子527,使得当设想比例因子频带7时由调整器526输出的经调整的帧的能量具有能量E4
在该背景下,非常重要的是,相比于HE-AAC来评估本发明的高频重构准确度。这将相对于图3A中的比例因子频带7来说明。假定现有技术编码器如图13A中示出的编码器将要以高分辨率编码的频谱部分307检测为“丢失的谐波”。然后,将该频谱分量的能量连同关于该重构频带如比例因子频带7的频谱包络信息一起发送至解码器。然后,解码器将重建丢失的谐波。然而,在其处由图13B的现有技术解码器重构丢失的谐波307的频谱值将位于由重构频率390表示的频率处的频带7的中间。从而,本发明避免会由图13B的现有技术解码器引入的频率误差391。
在一种实现中,频谱分析器还被实现成:计算第一频谱部分与第二频谱部分之间的相似度并且基于所计算的相似度针对重构范围内的第二频谱部分确定尽可能地与第二频谱部分匹配的第一频谱部分。然后,在该可变的源范围/目的范围实现中,参数化编码器会额外地将针对每个目的范围表示匹配源范围的匹配信息引入至第二编码表示中。然后,在解码器侧上,该信息将由图5C的频谱铺片生成器522使用,图5C示出了原始第二部分523的基于源频带ID和目标频带ID的生成。
此外,如图3A中所示,频谱分析器被配置成对直至最大分析频率的频谱表示进行分析,最大分析频率仅是低于采样频率的二分之一的小数量,并且优选地是采样频率的至少四分之一或通常较高。
如所示出的,编码器在无下采样的情况下进行操作,并且解码器在无上采样的情况下进行操作。换言之,频谱域音频编码器被配置成生成具有奈奎斯特频率的频谱表示,该奈奎斯特频率由与原始输入的音频信号的采样速率来限定。
此外,如图3A中所示,频谱分析器被配置成对频谱表示进行分析,该频谱表示始于间隙填充起始频率并且止于由该频谱表示中包括的最大频率表示的最大频率,其中,从最小频率向上延伸至间隙填充起始频率的频谱部分属于第一组频谱部分,并且其中,具有高于间隙填充频率的频率值的另外的频谱部分如304、305、306、307另外地被包括在第一组第一频谱部分中。
如所概述的,频谱域音频解码器112被配置成使得由第一解码表示中的频谱值表示的最大频率等于具有采样速率的时间表示中包括的最大频率,其中,第一组第一频谱部分中的最大频率的频谱值为零或不为零。不管怎样,对于第一组频谱分量中的该最大频率,存在关于比例因子频带的比例因子,不论如在图3A和图3B的背景下所讨论的该比例因子频带中的所有频谱值被设置成零还是不被设置成零,均生成和发送该比例因子。
因此,本发明的优点在于:相对于增大压缩效率的其他参数化技术,例如,噪声替代和噪声填充(这些技术专门用于类噪声局部信号内容的有效表示),本发明使得能够对音调分量进行准确的频率再现。目前,没有现有技术通过频谱间隙填充来解决任意信号内容的有效参数化表示,而不限制低频带(LF)和高频带(HF)中的固定的先验划分。
本发明系统的实施方式改进现有技术方法,从而甚至在低比特率的情况下仍提供高压缩效率、没有或仅有小量的感知烦恼以及全音频带宽。
一般系统包括:
·全频带核心编码
·智能间隙填充(铺片填充或噪声填充)
·由音调掩蔽选择的核心中的稀疏音调部分
·全频带的联合立体声对编码,包括铺片填充
·对铺片的TNS
·IGF范围内的频谱白化
迈向更高效系统的第一步骤是去除将频谱数据变换成与核心编码的变换域不同的第二变换域的需要。当大多数音频编解码器诸如例如AAC使用MDCT作为基本变换,在MDCT域也执行BWE是有用的。BWE系统的第二要求将是保存音调网格的需要,由此甚至HF音调分量被保存,从而编码音频的品质优于现有系统。为了小心处理上面提到的关于BWE方案的两个要求,提出了称作智能间隙填充(IGF)的新系统。图2B示出了编码器侧上的所提出的系统的框图,图2A示出了解码器侧上的系统。
图9A示出了用于对包括第一组第一频谱部分的编码表示以及表示第二组第二频谱部分的频谱能量的参数化数据的编码表示的编码音频信号进行解码的设备。在图9A中在901a处表示第一组第一频谱部分,在图9A的901b处表示参数化数据的编码表示。提供音频解码器900用于对第一组第一频谱部分的编码表示901a进行解码以获得解码的第一组第一频谱部分904,并且用于对参数化数据的编码表示进行解码以获得关于表示各个重构频带的各个能量的第二组第二频谱部分的解码的参数化数据902,其中,第二频谱部分位于重构频带中。此外,提供频率再生器906用于对包括第二频谱部分的重构频带的频谱值进行重构。频率再生器906使用第一组第一频谱部分中的第一频谱部分和重构频带的各个能量信息,其中,重构频带包括第一频谱部分和第二频谱部分。频率再生器906包括计算器912,其用于确定包括具有重构频带中的频率的第一频谱部分的累积能量的残留能量信息。此外,频率再生器906包括计算器918,其用于确定重构频带的另外的频谱部分的铺片能量信息,而频率值不同于第一频谱部分,其中,这些频率值具有重构频带中的频率,其中,另外的频谱部分要使用与重构频带中的第一频谱部分不同的第一频谱部分通过频率再生来生成。
频率再生器906还包括针对重构频带中的丢失能量的计算器914,并且计算器914使用重构频带的各个能量以及由块912生成的残存能量来操作。此外,频率再生器906包括频谱包络调整器916,频谱包络调整器916基于丢失能量信息以及由块918生成的铺片能量信息来对重构频带中的另外的频谱部分进行调整。
参照图9C,图9C示出了某个重构频带920。该重构频带包括在921处示意性地示出的重构频带中的第一频谱部分如图3A中的第一频谱部分306。此外,重构频带920中的其余频谱值要使用例如来自低于图3A的智能间隙填充起始频率的比例因子频带1、2、3的源区域来生成。频率再生器906被配置成用于生成第二频谱部分922和923的原始频谱值。然后,如图9C中所示,计算增益因子g以最终对频率频带922、923中的原始频谱值进行调整来获得重构频带920中的经重构并且调整的第二频谱部分,该经重构并且调整的第二频谱部分现在与第一频谱部分921具有相同的频谱分辨率即相同的线距离。重要的是要理解,图9C中的921处示出的重构频带中的第一频谱部分由音频解码器900来解码,而不受图9B的包络调整执行块916的影响。替代地,921处所表示的重构频带中的第一频谱部分按原样留下,因为第一频谱部分由全带宽或全速率音频解码器900经由线904来输出。
随后,对使用实数数字的特定示例进行讨论。由块912计算的剩余的残留能量为例如5个能量单位,并且该能量是第一频谱部分921中的示例性地所表示的4个频谱线的能量。
此外,与图3B或图3A的比例因子频带6对应的重构频带的能量值E3等于10个单位。重要地,能量值不仅包括频谱部分922、923的能量,而是包括在编码器侧上,即,在使用例如声道掩蔽执行频谱分析之前计算的重构频带920的全部能量。因此,10个能量单位覆盖重构频带中的第一频谱部分和第二频谱部分。则,假定块922、923的源范围数据或块922、923的原始目标范围数据的能量等于8个能量单位。从而,计算出5个单位的丢失能量。
基于丢失能量除以铺片能量tEk,计算出增益因子0.79。然后,将第二频谱部分922、923的原始频谱线乘以所计算的增益因子。从而,仅对第二频谱部分922、923的频谱值进行调整,而第一频谱部分921的频谱线不受该包络调整影响。在乘以第二频谱部分922、923的原始频谱值之后,计算完整的重构频带,其包括重构频带中的第一频谱部分,并且包括重构频带920中的第二频谱部分922、923中的频谱线。
优选地,用于生成频带922、923中的原始频谱数据的源范围相对于频率而言低于IGF起始频率309,而重构频带920高于IGF起始频率309。
此外,优选地,重构频带边界与比例因子边界一致。从而,在一种实施方式中,重构频带具有核心音频解码器的相应的比例因子频带的大小,或者将其大小做成使得:当应用能量配对时,重构频带的能量值提供等于或大于2的整数个比例因子频带的能量。从而,当假定对于比例因子频带4、比例因子频带5和比例因子频带6执行能量累积时,则重构频带920的较低频率边界等于比例因子频带4的较低边界,而重构频带920的较高频率边界与比例因子频带6的较高边界一致。
随后,讨论图9D以示出图9A的解码器的另外的功能。音频解码器900接收与第一组频谱部分的第一频谱部分对应的去量化的频谱值,并且另外地,将如图3B中示出的比例因子频带的比例因子提供至逆缩放块940。逆缩放块940提供低于图3A的IGF起始频率309的所有第一组第一频谱部分以及另外地提供高于IGF起始频率的第一频谱部分,即,都位于图9D中的941处示出的重构频带的图3A的第一频谱部分304、305、306、307。此外,源频带中的用于重构频带中的频率铺片填充的第一频谱部分被提供至包络调整器/计算器942,并且该块额外接收被设置为相对于如图9D中的943处所示的编码音频信号的参数化边信息的关于重构频带的能量信息。然后,包络调整器/计算器942提供图9B和图9C的功能,并且最后输出重构频带中的第二频谱部分的经调整的频谱值。重构频带中的第二频谱部分的这些经调整的频谱值922、923和图9D中的线941表示的重构频带中的第一频谱部分921联合地表示重构频带的完整的频谱表示。
随后,参照图10A和图10B,图10A和图10B用于说明用于对音频信号进行编码以提供或生成编码音频信号的音频编码器的优选实施方式。该编码器包括时间/频谱转换器1002,其给频谱分析器1004馈送,并且频谱分析器1004一方面与参数计算器1006连接并且另一方面与音频编码器1008连接。音频编码器1008提供第一组第一频谱部分的编码表示,并且不覆盖第二组第二频谱部分。另一方面,参数计算器1006提供覆盖第一频谱部分和第二频谱部分的重构频带的能量信息。此外,音频编码器1008被配置成生成具有第一频谱分辨率的第一组第一频谱部分的第一编码表示,其中,音频编码器1008提供由块1002生成的频谱表示的所有频带的比例因子。另外,如图3B中所示,编码器提供相对于频率而言位于如图3A所示的IGF起始频率309之上的至少重构频带的能量信息。从而,对于优选地与比例因子频带或与比例因子频带的组一致的重构频带,给出了两个值,即,来自音频编码器1008的相应的比例因子以及另外地由参数计算器1006输出的能量信息。
优选地,音频编码器具有具有不同的频率带宽即具有不同数量的频谱值的比例因子频带。因此,参数化计算器包括归一化器1012,其用于相对于特定重构频带的带宽对不同带宽的能量进行归一化。为此,归一化器1012接收频带中的能量以及频带中的大量频谱值作为输入,然后归一化器1012输出每重构/比例因子频带的归一化能量。
此外,图10A的参数化计算器1006A包括能量值计算器,其用于如图10A中的线1007所示从核心或音频编码器1008接收控制信息。该控制信息可以包括关于由音频编码器使用的长/短块的信息和/或分组信息。因此,虽然关于长/短块的信息以及关于短窗口的分组信息与“时间”分组有关,但是分组信息可以另外地指代频谱分组,即,将两个比例因子频带分组成单个重构频带。因此,当已经对仅频谱部分分组时,能量值计算器1014输出覆盖第一频谱部分和第二频谱部分的每个分组的频带的单个能量值。
图10D示出了用于实现频谱分组的又一实施方式。为此,块1016被配置成用于计算两个相邻频带的能量值。然后,在块1018中,将两个相邻频带的能量值进行比较,并且当能量值与例如由阈值限定的相比未有明显不同或有较小程度的不同时,则如块1020中所示,生成两个频带的单个(经归一化的)值。如由线1019所示,块1018可以被旁路。此外,由块1020执行的关于两个或更多个频带的单个值的生成可以由编码器比特率控制器1024来控制。从而,当比特率要降低时,编码比特率控制器1024控制块1020来生成两个或更多个频带的单个归一化的值,即使块1018中的比较未被允许对能量信息值进行分组。
在音频编码器执行两个或更多个短窗口的分组的情况下,也对于能量信息应用该分组。当核心编码器执行两个或更多个短块的分组时,则对于这些两个或更多个块,仅单组比例因子被计算和发送。那么,在解码器侧上,音频解码器对于两个分组的窗口应用同一组比例因子。
关于能量信息计算,对于两个或更多个短窗口累积重构频带中的频谱值。换言之,这表示短块和随后的短块的某个重构频带中的频谱值被累积在一起,以及对于覆盖两个短块的该重构频带而言,仅单个能量信息被发送。那么,在解码器侧上,对于每个短块不单独执行关于图9A至图9D讨论的包络调整,但是对于一组分组的短窗口,一起执行关于图9A至图9D讨论的包络调整。
然后,再次应用相应的归一化,使得即使已经执行了频率中的任何分组或者时间中的分组,归一化容易地使得能够:对于解码器侧上的能量值信息计算,一方面仅能量值信息以及重构频带中或一组分组重构频带中的频谱线的量必须已知。
此外,其强调:关于频谱能量的信息、关于个别能量的信息或个别能量信息、关于残存能量的信息或残存能量信息、关于铺片能量的信息或铺片能量信息、或者关于丢失能量的信息或丢失能量信息不仅可以包括能量值,而且还可以包括可以从中推出最终能量值的(例如绝对)幅度值、水平值或任何其他值。所以,关于能量的信息可以例如包括能量值自身以及/或者水平和/或幅度和/或绝对幅度的值。
图12A示出了用于解码的设备的另一实现。通过可以例如是AAC解码器的核心解码器1200来接收比特流。该结果被配置成到用于执行与例如频率再生器604对应的带宽扩展修补或平铺1202的级。然后,执行补片/铺片自适应和后处理的过程,并且,当执行了补片自适应时,控制频率再生器1202来执行另一频率再生,但是现在具有例如经调整的频率边界。此外,当修补处理如通过消除或衰减音调线被执行时,则该结果被转发至执行如例如还在块712或块826的背景下讨论的参数驱动的带宽包络整形的块1206。然后,该结果被转发至合成变换块1208用于执行至例如图12A所示的PCM输出域的最终输出域的变换。
发明的实施方式的主要特征如下:
优选实施方式基于下述MDCT,如果音调的频谱区域因对交叉频率和/或补片边缘的不当选择而被削剪,或者音调分量被放置得太过靠近修补边界处,则MDCT显现出上面引用的颤音伪声。
图12B示出了新近提出的技术如何减少在现有技术BWE方法中发现的伪声。在图12的面板(2)中,示出了当代BWE方法的输出的程式化幅度频谱。在该示例中,信号被由两个临近的音调导致的差拍在感知上损害,并且还被音调的分割在感知上损害。两个有问题的频谱区域各自用圆圈标示。
为克服这些问题,新技术首先检测包括在信号中的音调分量的频谱位置。然后,根据本发明的一个方面,其试图通过个别移位(在给定限制内)来调整LF与所有补片之间的过渡频率,使得音调分量的分割或差拍最小化。出于该目的,优选地,过渡频率必须与局部频谱最小值匹配。该步骤在图12B的面板(2)和面板(3)中示出,其中,过渡频率fx2朝较高频率移动,结果为fˊx2
根据本发明的另一方面,如果过渡区域中的有问题的频谱内容残留,则去除至少一个错位的音调分量以减少过渡频率处的差拍伪声或者颤音。如图2的面板(3)所示,这经由频谱外插或内插/滤波来完成。因此,从底点至底点地将音调分量去除,即从其左局部最小值至其右局部最小值。图12B的面板(4)示出了在应用发明技术之后作为结果的频谱。
换言之,图12B在左上角即在面板(1)中示出了原始信号。在右上角即在面板(2)中示出了具有由椭圆1220和椭圆1221标示的有问题的区域的比较带宽扩展信号。在左下角即在面板(3)中示出了两个优选的补片或频率铺片处理特征。通过增加频率边界fˊx2解决了音调部分的分割,使得不再有对应的音调部分的削剪。此外,应用用于消除音调部分1031和1032的增益函数1030,或者可替选地,表示由1033所示的插值。最终,图12B的右下角即面板(4)示出了由一方面的铺片/补片频率调整以及有问题的音调部分的消除或至少衰减导致的改进信号。
如前面讨论的,图12B的面板(1)示出了原始频谱,并且原始频谱具有直至交叉或间隙填充起始频率fx1的核心频率范围。
因此,频率fx1示出了源范围1252与重构范围1254之间的边界频率1250,重构范围1254在边界频率1250与小于或等于Nyquist频率fNyquist的最大频率之间延伸。在编码器侧上,假设信号被带宽受限于fx1处,或者当关于智能间隙填充的技术被应用时,假设fx1与图3A的间隙填充起始频率309对应。取决于该技术,高于fx1的重构范围将为空(在图13A与图13B的实现的情况下)或者如在图3A的背景下讨论的,将包括具有高分辨率的、要被编码的特定第一频谱部分。
图12B的面板(2)示出了例如由图7A的块702生成的、具有两个有问题的部分的初步再生信号。在1220处示出了一个有问题的部分。1220a处所示的核心区域内的音调部分与1220b处所示的频率铺片的起始处的音调部分之间的频率距离太小以至于会创建差拍伪声。另一问题是:在由1225处所示的第一修补操作或频率平铺操作生成的第一频率铺片的上边界处是中途削剪的或分割的音调部分1226。当该音调部分1226与图12B中的其它音调部分进行比较时,以下变得清楚:该宽度小于通常音调部分的宽度并且这意味着已通过在源范围1252中的错误地方处设置第一频率铺片1225与第二频率铺片1227之间的频率边界来分割该音调部分。为了解决该问题,如图12B中的面板(3)所示,边界频率fx2已被修改成稍微变大,使得不发生该音调部分的削剪。
另一方面,已改变fˊx2的该过程不会有效解决差拍问题,所述差拍问题因此通过由如在图7A的块708的背景下讨论的滤波或插值或任何其他过程的音调分量去除而被解决。因此,图12B示出了对过渡频率调整706以及对708处所示的边界处的音调分量的去除的相继应用。
另一选择会是设置过渡边界fx1使得其稍微降低而使音调部分1220a不再在核心范围中。然后,还通过将过渡频率fx1设置在较低值处来去除或消除音调部分1220a。
该过程还为解决有问题的音调分量1032的问题而进行。通过将fˊx2设置得更高,音调部分1032所位于的频谱部分可以在第一修补操作1225内再生,因此,不会出现两个相邻或邻近的音调部分。
基本上,差拍问题取决于相邻音调部分的频率的幅度和距离。优选地,检测器704和720或者更通常所述的分析器602以下述方式被配置:作出对位于低于诸如fx1、fx2、fˊx2的过渡频率的频率中的较低频谱部分的分析以定位任何音调分量。此外,还分析高于过渡频率的频谱范围以检测音调分量。当检测导致两个音调分量时,在频率上一个向过渡频率的左边并且一个向右边(参考上升频率),然后,激活图7A中的708处所示的边界处的音调分量的去除器。在特定检测范围中执行对音调分量的检测,所述特定检测范围在两个方向上延伸对应频带的带宽的至少20%,并且优选地,相对于对应带宽,朝着过渡频率的左边向下延伸以及朝着过渡频率的右边向上延伸仅延伸最高至10%,即一方面源范围的带宽以及另一方面重构范围的带宽,或者当过渡频率是两个频率铺片1225和1227之间的过渡频率时,为对应频率铺片的对应的10%的量。在另一实施方式中,预定检测带宽为1巴克。应当可以去除补片边界周围1巴克范围内的音调部分,使得完整的检测范围为2巴克,即较低频带中的1巴克和较高频带中的1巴克,其中,较低频带中的1巴克与较高频带中的1巴克紧邻。
根据本发明的另一方面,为减少滤波器鸣响伪声,频率域中的交叉滤波器被应用于即核心频带与第一补片之间或者两个补片之间的两个连续频谱区域。优选地,交叉滤波器具有信号自适应性。
交叉滤波器包括两个滤波器,即应用于较低频谱区域的渐出滤波器hout以及应用于较高频谱区域的渐入滤波器hin
每个滤波器的长度为N。
另外,两个滤波器的斜率通过确定交叉滤波器的陷波特性的、被称为Xbias的信号自适应值来表征,其中0≤Xbias≤N:
如果Xbias=0,则两个滤波器的和等于1,即在作为结果的滤波器中不存在陷波滤波器特性。
如果Xbias=N,则两个滤波器完全为零。
交叉滤波器的基本设计受限于下述方程式:
Figure BDA0002716458420000302
hout(k)+hin(k)=1,Xbias=0
其中,k=0,1,...,N-1为频率索引。图12C示出了这样的交叉滤波器的示例。
在该示例中,下述方程式被用来创造滤波器hout
Figure BDA0002716458420000301
下述方程式描述接着如何应用滤波器hin和滤波器hout
Y(kt-(N-1)+k)=LF(kt-(N-1)+k)·hout(k)+
HF(kt-(N-1)+k)·hin(k),k=0,1,…,N-1
其中,Y表示组装频谱,kt为过渡频率,LF为低频内容并且HF为高频内容。
接下来,将呈现该技术的优点的证据。下述示例中的原始信号是类瞬变信号,特别是其具有22kHz的截止频率的低通滤波版本。首先,瞬变信号在变换域中被频带限制为6kHz。随后,将低通滤波原始信号的带宽扩展至24kHz。通过拷贝LF频带三次以完全地填充频率范围来完成带宽扩展,所述频率范围在变换内高于6kHz可用。
图11A示出了该信号的频谱,其能够被认为是由于变换(语音峰值1100)的上述砖墙特性而在频谱上围绕瞬变信号的滤波器鸣响伪声的典型频谱。通过应用发明的方法,滤波器鸣响在每个过渡频率处减少了大约20dB(减少语音峰值)。
图11B和图11C以不同图示示出了相同的效果。图11B示出了具有滤波器鸣响伪声的提及的类瞬变信号的频谱图,其在没有任何滤波器鸣响抑制的情况下在应用上面描述的BWE技术之后在时域上领先且接续瞬变信号。每个水平线表示连续补片之间的过渡频率处的滤波器鸣响。图6示出了在应用具有BWE的发明的方法之后的相同的信号。通过应用鸣响抑制,与先前图中显示的信号相比,滤波器鸣响减少了大约20dB。
随后,讨论图14A和图14B以进一步示出在具有分析器特征的背景下已讨论的交叉滤波器发明方面。然而,还能够独立于在图6A至图7B的背景下所讨论的本发明来实现交叉滤波器710。
图14A示出了用于对包括编码核心信号以及关于参数化数据的信息的编码音频信号进行解码的设备。设备包括用于对编码核心信号进行解码以获得解码核心信号的核心解码器1400。解码核心信号在图13A和图13B的实现情形下带宽会受限,或者核心解码器在图1至图5C或者图9A至图10D的背景下会是全频率范围或全速率编码器。
此外,使用解码核心信号的频谱部分来生成用于再生具有未包括在解码核心信号中的频率的一个或更多个频谱铺片的铺片生成器1404。所述铺片可以是以下重构频带内的重构的第二频谱部分,所述重构频带可以如例如图3A的背景下所示或者可以包括要被重构的、具有高分辨率的第一频谱部分,但是可替选地,当编码器如图13A所示执行了严格的频带限制时,频谱铺片还可以包括完全空的频带。
此外,还设置有交叉滤波器1406以对解码核心信号以及频率从间隙填充频率309扩展至第一铺片停止频率的第一频率铺片进行频谱上的交叉滤波,或者对第一频率铺片1225和第二频率铺片1221进行频谱上的交叉滤波。第二频率铺片的下边界频率与第一频率铺片1225的上边界频率在频率上相邻。
在另一实现中,将交叉滤波器1406输出信号馈送至包络调整器1408,包络调整器1408应用包括在编码音频信号中的参数化频谱包络信息作为参数化边信息以最终获得包络调整的再生信号。如例如图13B、图1B或图6A所示,元件1404、1406和1408可以被实现为频率再生器。
图14B示出了交叉滤波器1406的另一实现。交叉滤波器1406包括接收第一输入信号IN1的渐出子滤波器以及接收第二输入IN2的第二渐入子滤波器1422,并且两个滤波器1420和1422的结果或输出被提供至例如作为加法器的组合器1424。加法器或组合器1424输出频率点的频谱值。图12C示出了包括渐出子滤波器特性1420a和渐入子滤波器特性1422a的示例交叉渐变函数。在图12C的示例中,两个滤波器具有等于21的特定频率交叠,即N=21。因此,例如源区域1252的其它频率值不受影响。仅源范围1252的最高的21个频率点受渐出函数1420a的影响。
另一方面,仅第一频率铺片1225的最低的21条频率线受渐入函数1422a影响。
另外,从交叉渐变函数清楚地看到,影响9至13之间的频率线,但是渐入函数实际上并不影响1至9之间的频率线,并且渐出函数1420a不影响13至21之间的频率线。这意味着仅频率线9至频率线13之间的交叠是必要的,并且如fx1的交叉频率会被放置在频率采样或频率点11处。因此,会要求仅源范围与第一频率铺片之间的两个频率点或频率值的交叠以实现交叉或交叉渐变函数。
取决于具体实现,能够应用较高或较低的交叠,并且另外,可以使用除余弦函数之外的其它渐变函数。此外,如图12C所示,优选地,应用交叉范围中的特定陷波。不同地阐述,当其为无陷波的交叉渐变函数中的情况时,边界范围中的能量由于两个滤波器函数没有合计为一体而将减少。频率铺片即第一频率铺片的边界的能量损耗将在下边界处和上边界处被衰减,能量更集中至频带的中间。然而,由于频谱包络调整发生在通过交叉滤波器的处理之后,所以全部频率未被触及,而是由频谱包络数据诸如如图3A的背景下所讨论的相对应的比例因子来限定。换言之,然后,图9B的计算器918将计算作为交叉滤波器的输出的“已生成的原始目标范围”。此外,由于通过插值对音调部分的去除而引起的能量损失还可以因该去除又会导致较低的铺片能量的事实而得到补偿,并且完整重构频带的增益因子会变高。然而另一方面,交叉频率导致能量更集中至频率铺片的中间,并且因此这有效减少特别是由如在图11A至图11C的背景下讨论的瞬变信号引起的伪声。
图14B示出了不同的输入组合。对于源频率范围与频率铺片之间的边界处的滤波,输入1是核心范围的上频谱部分并且输入2是第一频率铺片或单个频率铺片(当仅单个频率铺片存在时)的下频谱部分。此外,输入可以是第一频率铺片,并且过渡频率可以是第一铺片的上频率边界,并且子滤波器1422的输入会是第二频率铺片的下部分。当图12C的特性被使用时,当存在另外的第三频率铺片时,则另一过渡频率将是第二频率铺片与第三频率铺片之间的频率边界,并且渐出子滤波器1421的输入会是由滤波器参数确定的第二频率铺片的上频谱范围,进入渐入子滤波器1422的输入会是第三频率铺片的下部分,并且在图12C的示例中是最低的21条频谱线。
如图12C所示,优选地,具有对于渐出子滤波器和渐入子滤波器相等的参数N。然而,这并非必要。N的值能够变化,并且然后,结果将是滤波器“陷波”将在下范围和上范围之间不对称。另外,渐入/渐出函数没必要必须在如图12C中的相同特性中。替代地,还能够使用不对称特性。
此外,优选地,使交叉滤波器特性信号自适应。因此,基于信号分析来适应滤波器特性。由于交叉滤波器对瞬变信号特别有用,所以检测是否出现瞬变信号。当出现瞬变信号时,则能够使用如图12C所示的滤波器特性。然而,当检测到非瞬变信号时,优选地,改变滤波器特性来减少交叉滤波器的影响。这可以例如通过将N设置为零或者将Xbias设置为零来获得,使得两个滤波器的和等于1,即在作为结果的滤波器中存在非陷波的滤波器特性。可替选地,在非瞬变信号的情况下,能够简单地旁路交叉滤波器1406。然而,优选地,通过改变参数N和Xbias来相对慢地改变滤波器特性以避免通过快速改变滤波器特性而获得的伪声。此外,即使由特定瞬变信号/音调检测器所检测的信号更迅速改变,低通滤波器仍优选地仅允许这种相对小的滤波器特性改变。图14A中的1405处示出了检测器。其可以接收进入铺片生成器的输入信号或铺片生成器1404的输出信号,或者其能够甚至与核心解码器1400连接以获得瞬变信号/非瞬变信号信息,诸如例如来自AAC解码的短块指示。自然地,同样能够使用与图12C所示的交叉滤波器不同的任何其他交叉滤波器。
然后,基于瞬变检测或者基于音调检测或者基于任何其他信号特性检测,如讨论地改变交叉滤波器1406的特性。
虽然在用于编码或解码的设备的背景下描述了一些方面,但是清楚的是,这些方面也代表相应的方法的描述,其中,一个块或装置对应于方法步骤或者方法步骤的特征。类似地,在方法步骤的背景下描述的方面也代表相应的块或项目的描述或者相应的设备的特征。一些或全部方法步骤可以由(或者使用)硬件设备诸如例如微处理器、可编程计算机或电子电路来执行。在一些实施方式中,最重要的方法步骤中的某一个或更多个可以由这样的设备来执行。
取决于某些实现要求,本发明的实施方式可以以硬件或软件被实现。实现可以使用例如数字存储介质的非暂态存储介质来实现,例如软盘、硬盘驱动(HDD)、DVD、蓝光、CD、ROM、PROM和EPROM、EEPROM或者闪存存储器,其上存储有电可读的控制信号,其与可编程计算机系统合作(或能够与其合作),使得执行相应的方法。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施方式包括数据载体,数据载体具有电可读控制信号,电可读控制信号能够与可编程计算机系统协作以使得执行本文中描述的方法之一。
通常,本发明的实施方式可以被实现为具有程序代码的计算机程序产品,当计算机程序产品在计算机上运行时,程序代码操作地用于执行方法之一。程序代码可以被存储在例如机器可读载体上。
其他实施方式包括被存储在机器可读载体上的用于执行本文中描述的方法之一的计算机程序。
换言之,本发明的方法的实施方式因此是具有程序代码的计算机程序,当计算机程序在计算机上运行时,程序代码用于执行本文中描述的方法之一。
因此,本发明的方法的又一实施方式是数据载体(或数字存储介质或者计算机可读介质),该数据载体包括其上存储的用于执行本文中描述的方法之一的计算机程序。数据载体、数字存储介质或记录介质通常为有形的和/或非暂态。
因此,本发明的方法的另一实施方式是表示用于执行本文中描述的方法之一的计算机程序的数据流或信号序列。数据流或信号序列可以被配置成例如经由数据通信连接例如经由因特网被传送。
又一实施方式包括处理装置例如计算机或可编程逻辑器件,处理装置被配置成或适于执行本文中描述的方法之一。
又一实施方式包括其上安装有用于执行本文中描述的方法之一的计算机程序的计算机。
根据本发明的又一实施方式包括被配置成将用于执行本文中描述的方法之一的计算机程序(例如,电子地或光学地)传送至接收器的设备或系统。接收器可以是例如计算机、移动装置、存储装置等。设备或系统可以包括例如用于将计算机程序传送至接收器的文件服务器。
在一些实施方式中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文中描述的方法的一些或全部功能。在一些实施方式中,现场可编程门阵列可以与微处理器协作以执行本文中描述的方法之一。通常,优选地,这些方法由任意硬件设备来执行。
上述实施方式对于本发明的原理仅为说明性。应当理解,对本领域中的其他技术人员而言,本文中描述的布置和细节的修改和变化会很明显。因此,意在仅受所附专利权利要求的范围的限制,而不受借助于本文中的实施方式的描述和说明给出的具体细节的限制。
引用文献列表
[1]Dietz、L.Liljeryd、K.
Figure BDA0002716458420000351
和O.Kunz,“Spectral Band Replication,anovel approach in audio coding”,第112次AES(音频工程协会)会议,慕尼黑,2002年5月
[2]Ferreira、D.Sinha,“Accurate Spectral Replacement”,音频工程协会会议,巴塞罗那,西班牙,2005年
[3]D.Sinha、A.Ferreira1和E.Harinarayanan,“ANovel Integrated AudioBandwidth Extension Toolkit(ABET)”,音频工程协会会议,巴黎,法国,2006年
[4]R.Annadana、E.Harinarayanan、A.Ferreira和D.Sinha,“New Results in LowBit Rate Speech Coding and Bandwidth Extension”,音频工程协会会议,旧金山,美国,2006年
[5]T.
Figure BDA0002716458420000352
M.Bartkowiak,“Audio bandwidth extension by frequencyscaling of sinusoidal partials”,音频工程协会会议,旧金山,美国,2008年
[6]J.Herre、D.Schulz,Extending the MPEG-4AAC Codec by Perceptual NoiseSubstitution,第104次AES(音频工程协会)会议,阿姆斯特丹,1998年,预印本4720
[7]M.Neuendorf、M.Multrus、N.Rettelbach等人,MPEG Unified Speech andAudio Coding-The ISO/MPEG Standard for High-Efficiency Audio Coding of allContent Types,第132次AES(音频工程协会)会议,布达佩斯,匈牙利,2012年4月
[8]McAulay、Robert J.、Quatieri、Thomas F,“Speech Analysis/SynthesisBased on a Sinusoidal Representation”,关于声学、语音和信号处理的IEEE会报,第34(4)卷,1986年8月
[9]Smith,J.O.、Serra,X.,“PARSHL:An analysis/synthesis program for non-harmonic sounds based on a sinusoidal representation”,国际计算机音乐会议的会议记录,1987年
[10]Purnhagen、H.;Meine、Nikolaus,“HILN-the MPEG-4parametric audiocoding tools”,电路与系统,2000年ISCAS(电路与系统国际研讨会)会议记录,日内瓦,2000年,2000IEEE国际研讨会,第3卷,第201、204页,第3卷,2000年
[11]国际标准ISO/IEC 13818-3,“Generic Coding of Moving Pictures andAssociated Audio:Audio”,日内瓦,1998年
[12]M.Bosi、K.Brandenburg、S.Quackenbush、L.Fielder、K.Akagiri、H.Fuchs、M.Dietz、J.Herre、G.Davidson、Oikawa,“MPEG-2Advanced Audio Coding”,第101次AES(音频工程协会)会议,洛杉矶,1996年
[13]J.Herre,“Temporal Noise Shaping,Quantization and Coding methodsin Perceptual Audio Coding:A Tutorial introduction”,关于高质量音频编码的第17次AES(音频工程协会)国际会议,1999年8月
[14]J.Herre,“Temporal Noise Shaping,Quantization and Coding methodsin Perceptual Audio Coding:A Tutorial introduction”,关于高质量音频编码的第17次AES(音频工程协会)国际会议,1999年8月
[15]国际标准ISO/IEC 23001-3:2010,Unified speech and audio codingAudio,日内瓦,2010年
[16]国际标准ISO/IEC 14496-3:2005,Information technology-Coding ofaudio-visual objects-Part 3:Audio,日内瓦,2005年
[17]P.Ekstrand,“Bandwidth Extension of Audio Signals by Spectral BandReplication”,关于MPCA的第1次IEEE比荷卢经济联盟研讨会的会议记录,勒芬,2002年11月
[18]F.Nagel、S.Disch、S.Wilde,A continuous modulated single sidebandbandwidth extension,关于声学、语音和信号处理的ICASSP国际会议,达拉斯,德克萨斯州(美国),2010年4月
[19]Liljeryd、Lars;Ekstrand、Per;Henn、Fredrik;Kjorling、Kristofer:Spectral translation/folding in the subband,美国专利8,412,365,2013年4月2日
[20]Daudet,L.;Sandler,M.;“MDCT analysis of sinusoids:exact resultsand applications to coding artifacts reduction,”语音和音频处理,IEEE会报,第12卷,第3号,第302至312页,2004年5月

Claims (17)

1.一种用于对包括编码核心信号和参数化数据的编码音频信号进行解码的设备,包括:
核心解码器(600),用于对所述编码核心信号进行解码以获得解码核心信号;
分析器(602),用于在执行频率再生操作之前或之后对所述解码核心信号进行分析以提供分析结果(603);以及
频率再生器(604),用于使用所述解码核心信号的频谱部分、所述参数化数据(605)和所述分析结果(603)来再生未包括在所述解码核心信号中的频谱部分。
2.根据权利要求1所述的设备,
其中,所述分析器(614)被配置成用于:在频率再生之前或之后分析所述解码核心信号以在频率再生之前或之后定位所述解码核心信号中的一个或更多个局部频谱最小值;并且
其中,所述分析器(614)被配置成用于:提供识别所述局部频谱最小值的所述分析结果(603);
其中,所述频率再生器(604,616)被配置成用于再生所述频谱部分,其中,所述解码信号的频谱部分中的或者所再生的频谱部分中的频率铺片边界被设置在所述一个或更多个频谱最小值处。
3.根据权利要求1所述的设备,
其中,所述频率再生器(604)被配置成生成初步再生信号(703),其中,所述分析器(602)被配置成用于分析(704)所述初步再生信号以检测伪声产生信号部分;并且
其中,所述频率再生器(604)还包括操作器(722),所述操作器(722)用于操作所述初步再生信号或者用于使用与所述初步再生的参数不同的参数来执行另外的再生以减少或消除所述再生信号中的所述伪声产生信号部分。
4.根据权利要求1所述的设备,
其中,所述频率再生器(604)被配置成用于:使用所述解码核心信号的频谱部分来生成具有未包括在所述解码核心信号中的频谱部分的初步再生信号(703)以获得再生频谱部分;
其中,所述频率再生器(604)被配置成用于:检测(704)在所述解码核心信号与所述再生频谱部分之间的频率边界附近的或者在通过使用所述解码核心信号的相同或不同频谱部分而生成的两个再生频谱部分之间的频率边界附近的伪声产生信号部分;并且
其中,所述频率再生器(604)还包括操作器(722),所述操作器(722)用于操作所述初步再生信号或者用于操作控制数据以使用与用于生成所述初步再生信号的控制数据不同的所操作的控制数据来重新生成再生信号。
5.根据权利要求4所述的设备,
其中,所述频率再生器(604)包括铺片生成器(820),所述铺片生成器(820)被配置成使用所述解码信号的一个或更多个频谱部分来得到所述频谱部分以获得原始频谱部分;
其中,所述操作器(824)被配置成操作所述原始频谱部分或所述频率铺片生成器(820)以获得操作频谱部分;并且
其中,所述频率再生器(604)还包括频谱包络调整器(826),所述频谱包络调整器(826)被配置成用于:使用所述参数化数据(605)来执行对所述操作频谱部分的包络调整。
6.根据权利要求1所述的设备,
其中,所述分析器(602)被配置成检测位于频率检测范围中的音调信号部分,所述频率检测范围从重构范围的频率边界或者在所述重构范围内的相邻频率铺片之间延伸了预定检测带宽,所述预定检测带宽小于源频率范围的或所述重构频率范围的带宽的20%,或者所述预定检测带宽为1巴克。
7.根据权利要求6所述的设备,
其中,所述操作器(824)被配置成衰减或去除(708)所述预定检测带宽中的包括所述再生信号中的音调部分的频谱部分。
8.根据权利要求7所述的设备,
其中,所述操作器(722,824)被配置成:确定在频率上位于所述音调信号的起始处的起始频谱部分(802)以及确定在频率上位于所述音调部分的结束频率处的结束频谱部分(802);在所述起始频率与所述结束频率之间插值(804)以获得插值信号部分;以及用所述插值信号部分来替换所述起始频率与所述结束频率之间的音调部分(806)。
9.根据权利要求7所述的设备,
其中,所述操作器(822)被配置成随机地或非随机地生成频谱线(808),所述频谱线的能量由所述解码核心信号的非音调信号部分或者所述再生频谱部分的非音调信号部分来确定(810)。
10.根据权利要求4所述的设备,
其中,所述分析器被配置成用于检测特定频率处的所述伪声产生信号部分,并且其中,所述操作器(722,824)被配置成控制铺片生成器,使得所述铺片生成器被配置成改变所述解码核心信号的频谱部分的频率边界或者所述再生频谱部分的频率边界,从而使得所述伪声产生信号部分较少地产生伪声或不产生伪声。
11.根据权利要求1所述的设备,
其中,所述分析器(602)被配置成用于对以下各处所述解码核心信号的频谱部分中的或所述再生信号中的峰值部分的中途分割进行检测:所述解码核心信号的频率边界处,或通过使用所述解码核心信号的相同或不同频谱部分而生成的两个再生频谱部分之间的频率边界处,或所述再生信号的最大频率边界处;并且
其中,所述频率再生器被配置成:改变所述解码核心信号与所述再生信号之间的频率边界或者改变通过使用所述解码信号的相同或不同频谱部分而生成的两个再生频谱部分之间的频率边界,或者改变所述最大频率,从而使得所述分割被减少或消除。
12.根据权利要求1所述的设备,其中,所述频率再生器(604)包括铺片生成器(820),其中,所述铺片生成器(820)被配置成使用所述解码核心信号的相同或不同频谱部分来生成用于第一频谱部分的第一频率铺片以及用于第二频谱部分的第二频率铺片;
其中,所述第二频率铺片的下频率边界与所述第一频率铺片的上频率边界一致;
其中,所述分析器(602)被配置成检测:峰值频谱部分是否被所述第二频率铺片的下频率边界或所述第一频率铺片的上频率边界或者所述第一频率铺片的下频率边界以及所述解码核心信号的预定间隙填充起始频率(309)削剪;并且
其中,所述操作器(824)被配置成控制所述铺片生成器(820),使得所述铺片生成器(820)生成起始频率边界或终止频率边界被修改的修改频率铺片,从而使得所述削剪被减少或消除。
13.根据权利要求1所述的设备,其中,所述核心解码器被配置成获得频率域解码频谱部分,所述频率域解码频谱部分包括由与零表示不同的频谱值表示的第一组第一频谱部分,并且其中,由频谱值的所述零表示来表示第二组第二频谱部分,其中,所述参数化信息被提供用于所述第二组第二频谱部分,其中,所述频率再生器(604)被配置成使用来自所述第一组第一频谱部分的解码频谱部分来再生重构频带内的未包括在所述第一组第一频谱部分中的频谱部分,并且其中,所述设备还包括用于将所再生的频谱部分和所述解码核心信号的频谱部分转换成时间表示的频率时间转换器(828)。
14.根据权利要求1所述的设备,
其中,所述核心解码器(600)被配置成输出改进型离散余弦变换MDCT频谱值;并且
其中,所述频率时间转换器(828)包括处理器,所述处理器用于执行对后续获得的MDCT帧应用交叠相加处理的逆MDCT变换(512,514,516)。
15.根据权利要求1所述的设备,
其中,所述频率再生器(604)被配置成生成(702)初步再生信号;
其中,所述频率再生器(604)被配置成检测(704)所述初步再生信号中的音调分量;
其中,所述频率再生器被配置成基于所述检测(704)的结果来调整源范围与重构范围之间的或者所述重构范围中的相邻频率铺片之间的过渡频率以生成再生信号;
其中,所述再生器还被配置成用于去除所述过渡频率周围的检测范围中的音调分量(708);
其中,所述频率再生器还包括交叉滤波器(710),所述交叉滤波器(710)用于对被去除了所述过渡频率周围的交叉范围中的音调分量的信号进行交叉滤波;并且
其中,所述频率再生器还包括频谱包络整形器(712),所述频谱包络整形器(712)用于使用所述参数化数据(605)来对所述交叉滤波器的结果进行频谱包络整形。
16.一种用于对包括编码核心信号和参数化数据的编码音频信号进行解码的方法,包括:
对所述编码核心信号进行解码(600)以获得解码核心信号;
在执行频率再生操作之前或之后对所述解码核心信号进行分析(602)以提供分析结果(603);以及
使用所述解码核心信号的频谱部分、所述参数化数据(605)和所述分析结果(603)来再生(604)未包括在所述解码核心信号中的频谱部分。
17.一种计算机程序,所述计算机程序当在计算机或者处理器上运行时执行根据权利要求16所述的方法。
CN202011075098.9A 2013-07-22 2014-07-15 用于对编码音频信号进行解码的设备、方法及计算机程序 Pending CN112466312A (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
EP13177348 2013-07-22
EP13177350.9 2013-07-22
EP13177346.7 2013-07-22
EP13177350 2013-07-22
EP13177353 2013-07-22
EP13177346 2013-07-22
EP13177348.3 2013-07-22
EP13177353.3 2013-07-22
EP13189382.8 2013-10-18
EP13189382.8A EP2830063A1 (en) 2013-07-22 2013-10-18 Apparatus, method and computer program for decoding an encoded audio signal
CN201480041246.1A CN105453175B (zh) 2013-07-22 2014-07-15 对编码音频信号进行解码的设备、方法及计算机可读介质

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480041246.1A Division CN105453175B (zh) 2013-07-22 2014-07-15 对编码音频信号进行解码的设备、方法及计算机可读介质

Publications (1)

Publication Number Publication Date
CN112466312A true CN112466312A (zh) 2021-03-09

Family

ID=49385156

Family Applications (12)

Application Number Title Priority Date Filing Date
CN201480041566.7A Active CN105580075B (zh) 2013-07-22 2014-07-15 用自适应频谱铺片选择的音频信号解码和编码设备及方法
CN201480041248.0A Active CN105518777B (zh) 2013-07-22 2014-07-15 用频谱域智能间隙填充编码或解码音频信号的设备及方法
CN202010010552.6A Pending CN111179963A (zh) 2013-07-22 2014-07-15 用自适应频谱铺片选择的音频信号解码和编码设备及方法
CN201910412164.8A Active CN110310659B (zh) 2013-07-22 2014-07-15 用重构频带能量信息值解码或编码音频信号的设备及方法
CN201480041226.4A Active CN105453176B (zh) 2013-07-22 2014-07-15 智能间隙填充框架内使用双声道处理的音频编码器、音频解码器及相关方法
CN201480041246.1A Active CN105453175B (zh) 2013-07-22 2014-07-15 对编码音频信号进行解码的设备、方法及计算机可读介质
CN201911415693.XA Active CN111554310B (zh) 2013-07-22 2014-07-15 用频谱域智能间隙填充编码或解码音频信号的设备及方法
CN201480002625.XA Active CN104769671B (zh) 2013-07-22 2014-07-15 用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法
CN201480041218.XA Active CN105556603B (zh) 2013-07-22 2014-07-15 用于在过渡频率附近使用交叉滤波器对编码音频信号进行解码的设备及方法
CN202011075098.9A Pending CN112466312A (zh) 2013-07-22 2014-07-15 用于对编码音频信号进行解码的设备、方法及计算机程序
CN201480041267.3A Active CN105518776B (zh) 2013-07-22 2014-07-15 用重构频带能量信息值解码或编码音频信号的设备及方法
CN201910689687.7A Active CN110660410B (zh) 2013-07-22 2014-07-15 音频编码器、音频解码器及相关方法

Family Applications Before (9)

Application Number Title Priority Date Filing Date
CN201480041566.7A Active CN105580075B (zh) 2013-07-22 2014-07-15 用自适应频谱铺片选择的音频信号解码和编码设备及方法
CN201480041248.0A Active CN105518777B (zh) 2013-07-22 2014-07-15 用频谱域智能间隙填充编码或解码音频信号的设备及方法
CN202010010552.6A Pending CN111179963A (zh) 2013-07-22 2014-07-15 用自适应频谱铺片选择的音频信号解码和编码设备及方法
CN201910412164.8A Active CN110310659B (zh) 2013-07-22 2014-07-15 用重构频带能量信息值解码或编码音频信号的设备及方法
CN201480041226.4A Active CN105453176B (zh) 2013-07-22 2014-07-15 智能间隙填充框架内使用双声道处理的音频编码器、音频解码器及相关方法
CN201480041246.1A Active CN105453175B (zh) 2013-07-22 2014-07-15 对编码音频信号进行解码的设备、方法及计算机可读介质
CN201911415693.XA Active CN111554310B (zh) 2013-07-22 2014-07-15 用频谱域智能间隙填充编码或解码音频信号的设备及方法
CN201480002625.XA Active CN104769671B (zh) 2013-07-22 2014-07-15 用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法
CN201480041218.XA Active CN105556603B (zh) 2013-07-22 2014-07-15 用于在过渡频率附近使用交叉滤波器对编码音频信号进行解码的设备及方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201480041267.3A Active CN105518776B (zh) 2013-07-22 2014-07-15 用重构频带能量信息值解码或编码音频信号的设备及方法
CN201910689687.7A Active CN110660410B (zh) 2013-07-22 2014-07-15 音频编码器、音频解码器及相关方法

Country Status (20)

Country Link
US (24) US10332539B2 (zh)
EP (20) EP2830061A1 (zh)
JP (12) JP6389254B2 (zh)
KR (7) KR101681253B1 (zh)
CN (12) CN105580075B (zh)
AU (7) AU2014295296B2 (zh)
BR (11) BR122022010960B1 (zh)
CA (8) CA2918524C (zh)
ES (9) ES2908624T3 (zh)
HK (1) HK1211378A1 (zh)
MX (7) MX354657B (zh)
MY (5) MY187943A (zh)
PL (8) PL3025340T3 (zh)
PT (7) PT3407350T (zh)
RU (7) RU2607263C2 (zh)
SG (7) SG11201600464WA (zh)
TR (1) TR201816157T4 (zh)
TW (7) TWI545560B (zh)
WO (7) WO2015010953A1 (zh)
ZA (5) ZA201502262B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113113033A (zh) * 2021-04-29 2021-07-13 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、设备及可读存储介质

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY167474A (en) 2012-03-29 2018-08-29 Ericsson Telefon Ab L M Bandwith extension of harmonic audio signal
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10141004B2 (en) * 2013-08-28 2018-11-27 Dolby Laboratories Licensing Corporation Hybrid waveform-coded and parametric-coded speech enhancement
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
TR201907596T4 (tr) 2014-03-14 2019-06-21 Ericsson Telefon Ab L M Ses kodlama usulü ve aygıtı.
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
CN112967727A (zh) 2014-12-09 2021-06-15 杜比国际公司 Mdct域错误掩盖
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
GB201504403D0 (en) 2015-03-16 2015-04-29 Microsoft Technology Licensing Llc Adapting encoded bandwidth
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
CA3012159C (en) * 2016-01-22 2021-07-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters
SG11201806256SA (en) * 2016-01-22 2018-08-30 Fraunhofer Ges Forschung Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision
EP3208800A1 (en) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
DE102016104665A1 (de) * 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
CA3018039C (en) * 2016-03-24 2023-08-29 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
US10141005B2 (en) 2016-06-10 2018-11-27 Apple Inc. Noise detection and removal systems, and related methods
US10770082B2 (en) 2016-06-22 2020-09-08 Dolby International Ab Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
US10812550B1 (en) * 2016-08-03 2020-10-20 Amazon Technologies, Inc. Bitrate allocation for a multichannel media stream
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
US9679578B1 (en) 2016-08-31 2017-06-13 Sorenson Ip Holdings, Llc Signal clipping compensation
EP3306609A1 (en) * 2016-10-04 2018-04-11 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for determining a pitch information
US10362423B2 (en) 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
US10304468B2 (en) * 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
US10090892B1 (en) * 2017-03-20 2018-10-02 Intel Corporation Apparatus and a method for data detecting using a low bit analog-to-digital converter
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
KR102332153B1 (ko) 2017-05-18 2021-11-26 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 네트워크 디바이스 관리
US11188422B2 (en) 2017-06-02 2021-11-30 Apple Inc. Techniques for preserving clone relationships between files
WO2018233788A1 (en) * 2017-06-19 2018-12-27 Rtx A/S AUDIO SIGNAL CODING AND DECODING
US11232804B2 (en) 2017-07-03 2022-01-25 Dolby International Ab Low complexity dense transient events detection and coding
BR112020008216A2 (pt) * 2017-10-27 2020-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho e seu método para gerar um sinal de áudio intensificado, sistema para processar um sinal de áudio
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483882A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
TWI809289B (zh) * 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
JPWO2019155603A1 (ja) * 2018-02-09 2020-06-11 三菱電機株式会社 音響信号処理装置及び音響信号処理方法
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3576088A1 (en) * 2018-05-30 2019-12-04 Fraunhofer Gesellschaft zur Förderung der Angewand Audio similarity evaluator, audio encoder, methods and computer program
SG11202012936VA (en) * 2018-07-04 2021-01-28 Fraunhofer Ges Forschung Multisignal audio coding using signal whitening as preprocessing
CN109088617B (zh) * 2018-09-20 2021-06-04 电子科技大学 比率可变数字重采样滤波器
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
CN113302688A (zh) * 2019-01-13 2021-08-24 华为技术有限公司 高分辨率音频编解码
BR112021012753A2 (pt) * 2019-01-13 2021-09-08 Huawei Technologies Co., Ltd. Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório
JP7354275B2 (ja) * 2019-03-14 2023-10-02 ブームクラウド 360 インコーポレイテッド 優先度を持つ空間認識マルチバンド圧縮システム
CN110265043B (zh) * 2019-06-03 2021-06-01 同响科技股份有限公司 自适应有损或无损的音频压缩和解压缩演算方法
WO2020253941A1 (en) * 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
DE102020210917B4 (de) 2019-08-30 2023-10-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein Verbesserter M/S-Stereo-Codierer und -Decodierer
TWI702780B (zh) * 2019-12-03 2020-08-21 財團法人工業技術研究院 提升共模瞬變抗擾度的隔離器及訊號產生方法
CN111862953B (zh) * 2019-12-05 2023-08-22 北京嘀嘀无限科技发展有限公司 语音识别模型的训练方法、语音识别方法及装置
CN113192517B (zh) * 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
US20230085013A1 (en) * 2020-01-28 2023-03-16 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis
CN111199743B (zh) * 2020-02-28 2023-08-18 Oppo广东移动通信有限公司 音频编码格式确定方法、装置、存储介质及电子设备
CN111429925B (zh) * 2020-04-10 2023-04-07 北京百瑞互联技术有限公司 一种降低音频编码速率的方法及系统
CN113593586A (zh) * 2020-04-15 2021-11-02 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备
CN111371459B (zh) * 2020-04-26 2023-04-18 宁夏隆基宁光仪表股份有限公司 一种适用于智能电表的多操作高频替换式数据压缩方法
CN113808597A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN113808596A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN113365189B (zh) * 2021-06-04 2022-08-05 上海傅硅电子科技有限公司 多声道无缝切换方法
CN115472171A (zh) * 2021-06-11 2022-12-13 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序
CN113593604A (zh) * 2021-07-22 2021-11-02 腾讯音乐娱乐科技(深圳)有限公司 检测音频质量方法、装置及存储介质
TWI794002B (zh) * 2022-01-28 2023-02-21 緯創資通股份有限公司 多媒體系統以及多媒體操作方法
CN114582361B (zh) * 2022-04-29 2022-07-08 北京百瑞互联技术有限公司 基于生成对抗网络的高解析度音频编解码方法及系统
WO2023224665A1 (en) * 2022-05-17 2023-11-23 Google Llc Asymmetric and adaptive strength for windowing at encoding and decoding time for audio compression

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1276903A (zh) * 1997-10-17 2000-12-13 多尔拜实验特许公司 采用附加的滤波器阵列在帧边界处衰减混叠伪差的基于帧的音频编码
US20040028244A1 (en) * 2001-07-13 2004-02-12 Mineo Tsushima Audio signal decoding device and audio signal encoding device
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法
US20070239442A1 (en) * 2004-04-05 2007-10-11 Koninklijke Philips Electronics, N.V. Multi-Channel Encoder
CN102089816A (zh) * 2008-07-11 2011-06-08 弗朗霍夫应用科学研究促进协会 音频信号合成器及音频信号编码器
US20110264454A1 (en) * 2007-08-27 2011-10-27 Telefonaktiebolaget Lm Ericsson Adaptive Transition Frequency Between Noise Fill and Bandwidth Extension
WO2012110482A2 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs

Family Cites Families (257)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US6289308B1 (en) 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
ATE211326T1 (de) 1993-05-31 2002-01-15 Sony Corp Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium
JP3465697B2 (ja) * 1993-05-31 2003-11-10 ソニー株式会社 信号記録媒体
TW272341B (zh) * 1993-07-16 1996-03-11 Sony Co Ltd
GB2281680B (en) 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
BE1007617A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5502713A (en) * 1993-12-07 1996-03-26 Telefonaktiebolaget Lm Ericsson Soft error concealment in a TDMA radio system
JPH07336231A (ja) * 1994-06-13 1995-12-22 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
BR9609799A (pt) 1995-04-10 1999-03-23 Corporate Computer System Inc Sistema para compressão e descompressão de sinais de áudio para transmissão digital
JP3747492B2 (ja) 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6253172B1 (en) * 1997-10-16 2001-06-26 Texas Instruments Incorporated Spectral transformation of acoustic signals
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6061555A (en) 1998-10-21 2000-05-09 Parkervision, Inc. Method and system for ensuring reception of a communications signal
US6400310B1 (en) * 1998-10-22 2002-06-04 Washington University Method and apparatus for a tunable high-resolution spectral estimator
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
CN1192355C (zh) * 1999-11-16 2005-03-09 皇家菲利浦电子有限公司 宽带音频传输系统
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
ATE308858T1 (de) * 2000-08-16 2005-11-15 Dolby Lab Licensing Corp Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video- kodiersystem in antwort auf zusätzliche information
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US20020128839A1 (en) 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US20040054525A1 (en) 2001-01-22 2004-03-18 Hiroshi Sekiguchi Encoding method and decoding method for digital voice data
JP2002268693A (ja) 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US6934676B2 (en) 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
ATE363121T1 (de) * 2001-10-25 2007-06-15 Koninkl Philips Electronics Nv Verfahren zur übertragung breitbandiger tonsignale über einen übertragungskanal mit verminderter bandbreite
JP3923783B2 (ja) * 2001-11-02 2007-06-06 松下電器産業株式会社 符号化装置及び復号化装置
JP4308229B2 (ja) 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
EP1470550B1 (en) 2002-01-30 2008-09-03 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
BR0304231A (pt) * 2002-04-10 2004-07-27 Koninkl Philips Electronics Nv Métodos para codificação de um sinal de canais múltiplos, método e disposição para decodificação de informação de sinal de canais múltiplos, sinal de dados incluindo informação de sinal de canais múltiplos, meio legìvel por computador, e, dispositivo para comunicação de um sinal de canais múltiplos
US20030220800A1 (en) * 2002-05-21 2003-11-27 Budnikov Dmitry N. Coding multichannel audio signals
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
EP1516514A1 (en) * 2002-06-12 2005-03-23 Equtech APS Method of digital equalisation of a sound from loudspeakers in rooms and use of the method
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
ES2334934T3 (es) 2002-09-04 2010-03-17 Microsoft Corporation Codificacion de entropia por adaptacion de codificacion entre modalidades de nivel y de longitud de sucesion y nivel.
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
RU2244386C2 (ru) 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
CN1774957A (zh) 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 音频信号生成
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
CN1839426A (zh) * 2003-09-17 2006-09-27 北京阜国数字技术有限公司 多分辨率矢量量化的音频编解码方法及装置
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR101217649B1 (ko) 2003-10-30 2013-01-02 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004007191B3 (de) 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007184B3 (de) 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
DE602005022641D1 (de) 2004-03-01 2010-09-09 Dolby Lab Licensing Corp Mehrkanal-Audiodekodierung
US7739119B2 (en) 2004-03-02 2010-06-15 Ittiam Systems (P) Ltd. Technique for implementing Huffman decoding
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
CN1677491A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
EP1852851A1 (en) * 2004-04-01 2007-11-07 Beijing Media Works Co., Ltd An enhanced audio encoding/decoding device and method
CN1677492A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
JP4741476B2 (ja) 2004-04-23 2011-08-03 パナソニック株式会社 符号化装置
CN1947174B (zh) * 2004-04-27 2012-03-14 松下电器产业株式会社 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
EP1768107B1 (en) * 2004-07-02 2016-03-09 Panasonic Intellectual Property Corporation of America Audio signal decoding device
US7465389B2 (en) 2004-07-09 2008-12-16 Exxonmobil Research And Engineering Company Production of extra-heavy lube oils from Fischer-Tropsch wax
US6963405B1 (en) 2004-07-19 2005-11-08 Itt Manufacturing Enterprises, Inc. Laser counter-measure using fourier transform imaging spectrometers
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
TWI498882B (zh) 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
BRPI0517716B1 (pt) 2004-11-05 2019-03-12 Panasonic Intellectual Property Management Co., Ltd. Aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação.
CN101048649A (zh) * 2004-11-05 2007-10-03 松下电器产业株式会社 可扩展解码装置及可扩展编码装置
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
KR20070085982A (ko) * 2004-12-10 2007-08-27 마츠시타 덴끼 산교 가부시키가이샤 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
UA91853C2 (ru) * 2005-04-01 2010-09-10 Квелкомм Инкорпорейтед Способ и устройство для векторного квантования спектрального представления огибающей
BRPI0608269B8 (pt) * 2005-04-01 2019-09-03 Qualcomm Inc método e aparelho para quantização vetorial de uma representação de envelope espectral
DE602006004959D1 (de) * 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
US7983922B2 (en) 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
CN101199004B (zh) * 2005-04-22 2011-11-09 高通股份有限公司 用于增益因数平滑的系统、方法及设备
US7698143B2 (en) 2005-05-17 2010-04-13 Mitsubishi Electric Research Laboratories, Inc. Constructing broad-band acoustic signals from lower-band acoustic signals
JP2006323037A (ja) * 2005-05-18 2006-11-30 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置
US8170883B2 (en) 2005-05-26 2012-05-01 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
JP4954069B2 (ja) * 2005-06-17 2012-06-13 パナソニック株式会社 ポストフィルタ、復号化装置及びポストフィルタ処理方法
US7548853B2 (en) 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP2009500657A (ja) 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US8121836B2 (en) * 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
JP4640020B2 (ja) 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
CN100539437C (zh) 2005-07-29 2009-09-09 上海杰得微电子有限公司 一种音频编解码器的实现方法
JP5108767B2 (ja) 2005-08-30 2012-12-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
JP5536335B2 (ja) * 2005-10-20 2014-07-02 エルジー エレクトロニクス インコーポレイティド マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置
US8620644B2 (en) 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
KR20070046752A (ko) * 2005-10-31 2007-05-03 엘지전자 주식회사 신호 처리 방법 및 장치
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
RU2453986C2 (ru) * 2006-01-27 2012-06-20 Долби Интернэшнл Аб Эффективная фильтрация банком комплексно-модулированных фильтров
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
HUE043155T2 (hu) * 2006-07-04 2019-08-28 Dolby Int Ab Szûrõátalakítót és szûrõkrompresszort tartalmazó szûrõrendszer, és eljárás a szûrõrendszer mûködtetésére
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
JP2010503881A (ja) 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
AU2007312598B2 (en) 2006-10-16 2011-01-20 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
BRPI0716315A2 (pt) 2006-10-25 2017-05-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V aparelhagem e método para gerar valores de sub-banda de áudio e aparelhagem e método para gerar amostras de áudio de domínio de tempo
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
WO2008065822A1 (en) 2006-11-28 2008-06-05 Panasonic Corporation Encoding device and encoding method
WO2008072524A1 (ja) 2006-12-13 2008-06-19 Panasonic Corporation オーディオ信号符号化方法及び復号化方法
US8200351B2 (en) 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
RU2466469C2 (ru) * 2007-01-10 2012-11-10 Конинклейке Филипс Электроникс Н.В. Аудиодекодер
WO2008106474A1 (en) 2007-02-26 2008-09-04 Qualcomm Incorporated Systems, methods, and apparatus for signal separation
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP5294713B2 (ja) 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
US9185507B2 (en) 2007-06-08 2015-11-10 Dolby Laboratories Licensing Corporation Hybrid derivation of surround sound audio channels by controllably combining ambience and matrix-decoded signal components
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8428957B2 (en) * 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
ES2774956T3 (es) 2007-08-27 2020-07-23 Ericsson Telefon Ab L M Método y dispositivo para la descodificación espectral perceptual de una señal de audio, que incluyen el llenado de huecos espectrales
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
US8527265B2 (en) 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
US9177569B2 (en) * 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
CA2697830C (en) 2007-11-21 2013-12-31 Lg Electronics Inc. A method and an apparatus for processing a signal
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
EP2229676B1 (en) * 2007-12-31 2013-11-06 LG Electronics Inc. A method and an apparatus for processing an audio signal
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
US20090180531A1 (en) 2008-01-07 2009-07-16 Radlive Ltd. codec with plc capabilities
KR101413967B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
ES2401817T3 (es) * 2008-01-31 2013-04-24 Agency For Science, Technology And Research Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable
BRPI0907508B1 (pt) 2008-02-14 2020-09-15 Dolby Laboratories Licensing Corporation Método, sistema e método para modificar uma entrada estéreo que inclui sinais de entrada esquerdo e direito
CA2716926C (en) 2008-03-04 2014-08-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for mixing a plurality of input data streams
JP5247826B2 (ja) * 2008-03-05 2013-07-24 ヴォイスエイジ・コーポレーション 復号化音調音響信号を増強するためのシステムおよび方法
EP2104096B1 (en) 2008-03-20 2020-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR101414412B1 (ko) * 2008-05-09 2014-07-01 노키아 코포레이션 오디오 신호의 인코딩 장치, 오디오 신호의 디코딩 장치, 오디오 신호의 인코딩 방법, 스케일러블 인코딩 오디오 신호의 디코딩 방법, 인코더, 디코더, 전자기기 및 컴퓨터 판독가능한 기록 매체
US20090319263A1 (en) 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
CN102144259B (zh) 2008-07-11 2015-01-07 弗劳恩霍夫应用研究促进协会 用于产生带宽扩展输出数据的装置和方法
EP2144171B1 (en) * 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
KR101518532B1 (ko) * 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
ES2372014T3 (es) 2008-07-11 2012-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral.
CA2871252C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
BRPI0910796B1 (pt) 2008-07-11 2021-07-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de áudio e decodificador de áudio
ES2741963T3 (es) 2008-07-11 2020-02-12 Fraunhofer Ges Forschung Codificadores de señal de audio, métodos para codificar una señal de audio y programas informáticos
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
US8463603B2 (en) 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
US8532983B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010031049A1 (en) 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
JP5295372B2 (ja) * 2008-09-17 2013-09-18 フランス・テレコム デジタルオーディオ信号におけるプリエコーの減衰
EP2169670B1 (en) * 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
PL4231294T3 (pl) 2008-12-15 2024-04-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
EP2620941B1 (en) 2009-01-16 2019-05-01 Dolby International AB Cross product enhanced harmonic transposition
JP4977157B2 (ja) 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
MX2011009660A (es) * 2009-03-17 2011-09-30 Dolby Int Ab Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica.
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
US8391212B2 (en) 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
EP2249333B1 (en) * 2009-05-06 2014-08-27 Nuance Communications, Inc. Method and apparatus for estimating a fundamental frequency of a speech signal
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
EP2273493B1 (en) 2009-06-29 2012-12-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Bandwidth extension encoding and decoding
US9111427B2 (en) 2009-07-07 2015-08-18 Xtralis Technologies Ltd Chamber condition
US8793617B2 (en) * 2009-07-30 2014-07-29 Microsoft Corporation Integrating transport modes into a communication stream
WO2011026247A1 (en) 2009-09-04 2011-03-10 Svox Ag Speech enhancement techniques on the power spectrum
GB2473267A (en) 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
KR101137652B1 (ko) 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
CN102884574B (zh) * 2009-10-20 2015-10-14 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
ES2453098T3 (es) 2009-10-20 2014-04-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Códec multimodo de audio
ES2507165T3 (es) * 2009-10-21 2014-10-14 Dolby International Ab Sobremuestreo en un banco de filtros de reemisor combinado
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
WO2011062536A1 (en) 2009-11-19 2011-05-26 Telefonaktiebolaget Lm Ericsson (Publ) Improved excitation signal bandwidth extension
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
DK2510515T3 (da) 2009-12-07 2014-05-19 Dolby Lab Licensing Corp Dekodning af flerkanalaudio-kodede bitstrømme ved anvendelse af adaptiv hybrid transformation
KR101764926B1 (ko) 2009-12-10 2017-08-03 삼성전자주식회사 음향 통신을 위한 장치 및 방법
KR101370870B1 (ko) * 2009-12-16 2014-03-07 돌비 인터네셔널 에이비 Sbr 비트스트림 파라미터 다운믹스
KR101423737B1 (ko) * 2010-01-21 2014-07-24 한국전자통신연구원 오디오 신호의 디코딩 방법 및 장치
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
BR122021014305B1 (pt) * 2010-03-09 2022-07-05 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch
EP2369861B1 (en) 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
JP5814341B2 (ja) * 2010-04-09 2015-11-17 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
EP4254951A3 (en) * 2010-04-13 2023-11-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoding method for processing stereo audio signals using a variable prediction direction
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
CA2800613C (en) 2010-04-16 2016-05-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
JP5243620B2 (ja) 2010-06-09 2013-07-24 パナソニック株式会社 帯域拡張方法、帯域拡張装置、プログラム、集積回路およびオーディオ復号装置
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US8924222B2 (en) * 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8489403B1 (en) 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
US9135929B2 (en) 2011-04-28 2015-09-15 Dolby International Ab Efficient content classification and loudness estimation
WO2012158333A1 (en) 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
US9311923B2 (en) 2011-05-19 2016-04-12 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
US9349380B2 (en) 2011-06-30 2016-05-24 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwidth extension signal
US8731949B2 (en) * 2011-06-30 2014-05-20 Zte Corporation Method and system for audio encoding and decoding and method for estimating noise level
US20130006644A1 (en) 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP6037156B2 (ja) * 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
KR20130022549A (ko) 2011-08-25 2013-03-07 삼성전자주식회사 마이크 노이즈 제거 방법 및 이를 지원하는 휴대 단말기
JP6010539B2 (ja) 2011-09-09 2016-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法および復号方法
WO2013045693A2 (en) 2011-09-29 2013-04-04 Dolby International Ab High quality detection in fm stereo radio signals
PT3624119T (pt) * 2011-10-28 2022-05-16 Fraunhofer Ges Forschung Aparelho de codificação e método de codificação
PL3040988T3 (pl) * 2011-11-02 2018-03-30 Telefonaktiebolaget Lm Ericsson (Publ) Dekodowanie audio w oparciu o wydajną reprezentację współczynników autoregresji
CN103959375B (zh) * 2011-11-30 2016-11-09 杜比国际公司 增强的从音频编解码器的色度提取
CN103165136A (zh) * 2011-12-15 2013-06-19 杜比实验室特许公司 音频处理方法及音频处理设备
JP5817499B2 (ja) 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
EP2806423B1 (en) 2012-01-20 2016-09-14 Panasonic Intellectual Property Corporation of America Speech decoding device and speech decoding method
KR101398189B1 (ko) 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
KR102123770B1 (ko) 2012-03-29 2020-06-16 텔레폰악티에볼라겟엘엠에릭슨(펍) 하모닉 오디오 신호의 변환 인코딩/디코딩
MY167474A (en) * 2012-03-29 2018-08-29 Ericsson Telefon Ab L M Bandwith extension of harmonic audio signal
CN102750955B (zh) * 2012-07-20 2014-06-18 中国科学院自动化研究所 基于残差信号频谱重构的声码器
US9589570B2 (en) 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
EP2903004A4 (en) 2012-09-24 2016-11-16 Samsung Electronics Co Ltd METHOD AND APPARATUS FOR HAMPERING FRAME ERRORS, AND METHOD AND APPARATUS FOR DECODING AUDIO DATA
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9135920B2 (en) 2012-11-26 2015-09-15 Harman International Industries, Incorporated System for perceived enhancement and restoration of compressed audio signals
CA2985121C (en) 2013-01-29 2019-03-12 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1276903A (zh) * 1997-10-17 2000-12-13 多尔拜实验特许公司 采用附加的滤波器阵列在帧边界处衰减混叠伪差的基于帧的音频编码
US20040028244A1 (en) * 2001-07-13 2004-02-12 Mineo Tsushima Audio signal decoding device and audio signal encoding device
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法
US20070239442A1 (en) * 2004-04-05 2007-10-11 Koninklijke Philips Electronics, N.V. Multi-Channel Encoder
US20110264454A1 (en) * 2007-08-27 2011-10-27 Telefonaktiebolaget Lm Ericsson Adaptive Transition Frequency Between Noise Fill and Bandwidth Extension
CN102089816A (zh) * 2008-07-11 2011-06-08 弗朗霍夫应用科学研究促进协会 音频信号合成器及音频信号编码器
WO2012110482A2 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113113033A (zh) * 2021-04-29 2021-07-13 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、设备及可读存储介质

Also Published As

Publication number Publication date
MX2016000924A (es) 2016-05-05
EP3742444A1 (en) 2020-11-25
TW201517019A (zh) 2015-05-01
CA2918701C (en) 2020-04-14
BR112016001125A2 (zh) 2017-08-22
CN111554310A (zh) 2020-08-18
EP3723091A1 (en) 2020-10-14
CN105453176A (zh) 2016-03-30
ES2698023T3 (es) 2019-01-30
CN111554310B (zh) 2023-10-20
KR101774795B1 (ko) 2017-09-05
MX2016000943A (es) 2016-07-05
US11289104B2 (en) 2022-03-29
BR112016001125B1 (pt) 2022-01-04
JP2018013796A (ja) 2018-01-25
SG11201600422SA (en) 2016-02-26
US11257505B2 (en) 2022-02-22
US10311892B2 (en) 2019-06-04
RU2016105613A (ru) 2017-08-28
CN105518777B (zh) 2020-01-31
MX355448B (es) 2018-04-18
ES2827774T3 (es) 2021-05-24
US20160140973A1 (en) 2016-05-19
TW201517024A (zh) 2015-05-01
WO2015010948A1 (en) 2015-01-29
RU2640634C2 (ru) 2018-01-10
CN105518776A (zh) 2016-04-20
BR112016000852A2 (pt) 2017-08-22
EP3407350B1 (en) 2020-07-29
CA2886505C (en) 2017-10-31
JP2018077487A (ja) 2018-05-17
BR122022011231B1 (pt) 2024-01-30
US20160133265A1 (en) 2016-05-12
AU2014295295A1 (en) 2016-03-10
US20190074019A1 (en) 2019-03-07
EP3025328B1 (en) 2018-08-01
RU2635890C2 (ru) 2017-11-16
RU2651229C2 (ru) 2018-04-18
JP2016525713A (ja) 2016-08-25
CN111179963A (zh) 2020-05-19
EP2830061A1 (en) 2015-01-28
EP3025328A1 (en) 2016-06-01
US20230352032A1 (en) 2023-11-02
US10332539B2 (en) 2019-06-25
JP6306702B2 (ja) 2018-04-04
BR122022010960B1 (pt) 2023-04-04
BR112015007533A2 (zh) 2017-08-22
MY180759A (en) 2020-12-08
CN105518777A (zh) 2016-04-20
CA2973841C (en) 2019-08-20
TWI545560B (zh) 2016-08-11
TWI549121B (zh) 2016-09-11
CA2918804C (en) 2018-06-12
US10276183B2 (en) 2019-04-30
CA2918810C (en) 2020-04-28
EP3025344A1 (en) 2016-06-01
CA2918807C (en) 2019-05-07
EP3025343A1 (en) 2016-06-01
US11250862B2 (en) 2022-02-15
CA2886505A1 (en) 2015-01-29
JP6705787B2 (ja) 2020-06-03
JP2016527557A (ja) 2016-09-08
TW201514974A (zh) 2015-04-16
JP6144773B2 (ja) 2017-06-07
TWI545561B (zh) 2016-08-11
CN104769671B (zh) 2017-09-26
US20190043522A1 (en) 2019-02-07
PT3017448T (pt) 2020-10-08
TW201523589A (zh) 2015-06-16
JP6400702B2 (ja) 2018-10-03
CA2918701A1 (en) 2015-01-29
MX340575B (es) 2016-07-13
TWI541797B (zh) 2016-07-11
EP3975180A1 (en) 2022-03-30
US20210217426A1 (en) 2021-07-15
MX2016000940A (es) 2016-04-25
BR122022010965B1 (pt) 2023-04-04
BR112016000947A2 (zh) 2017-08-22
US10332531B2 (en) 2019-06-25
PL2883227T3 (pl) 2017-03-31
US20200082841A1 (en) 2020-03-12
RU2015112591A (ru) 2016-10-27
AU2014295297B2 (en) 2017-05-25
EP3017448A1 (en) 2016-05-11
MY182831A (en) 2021-02-05
RU2016105610A (ru) 2017-08-25
US20160140980A1 (en) 2016-05-19
KR20160046804A (ko) 2016-04-29
MX2016000857A (es) 2016-05-05
PL3025328T3 (pl) 2019-02-28
AU2014295298A1 (en) 2016-03-10
US10002621B2 (en) 2018-06-19
AU2014295301B2 (en) 2017-05-25
AU2014295302B2 (en) 2016-06-30
TR201816157T4 (tr) 2018-11-21
JP2020060792A (ja) 2020-04-16
PT3025328T (pt) 2018-11-27
MY187943A (en) 2021-10-30
US11222643B2 (en) 2022-01-11
CA2918835C (en) 2018-06-26
US20180102134A1 (en) 2018-04-12
KR20160024924A (ko) 2016-03-07
EP3025344B1 (en) 2017-06-21
US20160140981A1 (en) 2016-05-19
BR122022010958B1 (pt) 2024-01-30
US11735192B2 (en) 2023-08-22
CN105518776B (zh) 2019-06-14
MX2015004022A (es) 2015-07-06
CA2918807A1 (en) 2015-01-29
JP6310074B2 (ja) 2018-04-11
US20170154631A1 (en) 2017-06-01
CA2918810A1 (en) 2015-01-29
AU2014295301A1 (en) 2016-03-10
KR101681253B1 (ko) 2016-12-01
CN110310659A (zh) 2019-10-08
US20180144760A1 (en) 2018-05-24
AU2014295300B2 (en) 2017-05-25
BR112015007533B1 (pt) 2022-09-27
PL3025340T3 (pl) 2019-09-30
HK1211378A1 (zh) 2016-05-20
JP7092809B2 (ja) 2022-06-28
US20180268842A1 (en) 2018-09-20
EP3025337A1 (en) 2016-06-01
PT2883227T (pt) 2016-11-18
SG11201600506VA (en) 2016-02-26
ES2728329T3 (es) 2019-10-23
JP2016530556A (ja) 2016-09-29
US11049506B2 (en) 2021-06-29
PL3506260T3 (pl) 2024-02-19
SG11201502691QA (en) 2015-05-28
CN110310659B (zh) 2023-10-24
US10347274B2 (en) 2019-07-09
JP2016529546A (ja) 2016-09-23
JP2022123060A (ja) 2022-08-23
TWI555008B (zh) 2016-10-21
CN105453175B (zh) 2020-11-03
CA2973841A1 (en) 2015-01-29
JP6321797B2 (ja) 2018-05-09
KR20160030193A (ko) 2016-03-16
AU2014295296A1 (en) 2016-03-10
BR112016000740A2 (pt) 2017-08-22
MX353999B (es) 2018-02-07
WO2015010952A9 (en) 2017-10-26
WO2015010949A1 (en) 2015-01-29
SG11201600496XA (en) 2016-02-26
BR112016001072B1 (pt) 2022-07-12
JP2016529545A (ja) 2016-09-23
JP6691093B2 (ja) 2020-04-28
ZA201601010B (en) 2017-11-29
US20220270619A1 (en) 2022-08-25
EP3025340B1 (en) 2019-03-27
PT3407350T (pt) 2020-10-27
KR20150060752A (ko) 2015-06-03
CN110660410B (zh) 2023-10-24
JP2016527556A (ja) 2016-09-08
BR112016000740B1 (pt) 2022-12-27
MX2016000935A (es) 2016-07-05
US20160140979A1 (en) 2016-05-19
KR101807836B1 (ko) 2018-01-18
CN105556603B (zh) 2019-08-27
CA2918524C (en) 2018-05-22
AU2014295297A1 (en) 2016-03-10
MX356161B (es) 2018-05-16
EP4246512A2 (en) 2023-09-20
PT3025343T (pt) 2018-05-18
EP3506260B1 (en) 2023-08-16
RU2643641C2 (ru) 2018-02-02
EP3506260C0 (en) 2023-08-16
KR20160034975A (ko) 2016-03-30
PT3025337T (pt) 2022-02-23
US11769512B2 (en) 2023-09-26
WO2015010952A1 (en) 2015-01-29
ZA201601046B (en) 2017-05-31
ZA201502262B (en) 2016-09-28
WO2015010954A1 (en) 2015-01-29
EP2883227A1 (en) 2015-06-17
RU2607263C2 (ru) 2017-01-10
EP2830059A1 (en) 2015-01-28
RU2646316C2 (ru) 2018-03-02
CN105580075B (zh) 2020-02-07
ES2908624T3 (es) 2022-05-03
RU2016105618A (ru) 2017-08-28
US20150287417A1 (en) 2015-10-08
US20220139407A1 (en) 2022-05-05
ZA201601111B (en) 2017-08-30
EP2830065A1 (en) 2015-01-28
CN105453176B (zh) 2019-08-23
ES2638498T3 (es) 2017-10-23
EP2830054A1 (en) 2015-01-28
CN105556603A (zh) 2016-05-04
RU2649940C2 (ru) 2018-04-05
MX362036B (es) 2019-01-04
AU2014295298B2 (en) 2017-05-25
CA2918835A1 (en) 2015-01-29
SG11201600401RA (en) 2016-02-26
US10593345B2 (en) 2020-03-17
KR101809592B1 (ko) 2018-01-18
US11769513B2 (en) 2023-09-26
EP3025343B1 (en) 2018-02-14
ZA201601011B (en) 2017-05-31
US20190251986A1 (en) 2019-08-15
RU2016105473A (ru) 2017-08-23
US10847167B2 (en) 2020-11-24
TWI545558B (zh) 2016-08-11
MX354002B (es) 2018-02-07
CN110660410A (zh) 2020-01-07
EP2883227B1 (en) 2016-08-17
EP2830063A1 (en) 2015-01-28
WO2015010950A1 (en) 2015-01-29
BR112016000852B1 (pt) 2021-12-28
BR112016001072A2 (zh) 2017-08-22
PL3407350T3 (pl) 2020-12-28
US20190371355A1 (en) 2019-12-05
US20210295853A1 (en) 2021-09-23
EP4246512A3 (en) 2023-12-13
US20190198029A1 (en) 2019-06-27
WO2015010947A1 (en) 2015-01-29
CN105453175A (zh) 2016-03-30
ES2959641T3 (es) 2024-02-27
EP3025337B1 (en) 2021-12-08
JP2018041100A (ja) 2018-03-15
US10515652B2 (en) 2019-12-24
PT3025340T (pt) 2019-06-27
RU2016105759A (ru) 2017-08-25
MX2016000854A (es) 2016-06-23
ES2599007T3 (es) 2017-01-31
US10147430B2 (en) 2018-12-04
PL3025343T3 (pl) 2018-10-31
RU2016105619A (ru) 2017-08-23
ES2813940T3 (es) 2021-03-25
TW201523590A (zh) 2015-06-16
AU2014295295B2 (en) 2017-10-19
US20220157325A1 (en) 2022-05-19
US10573334B2 (en) 2020-02-25
EP3025340A1 (en) 2016-06-01
EP3407350A1 (en) 2018-11-28
US10134404B2 (en) 2018-11-20
ES2667221T3 (es) 2018-05-10
KR20160042890A (ko) 2016-04-20
AU2014295300A1 (en) 2016-03-10
EP2830056A1 (en) 2015-01-28
AU2014295296B2 (en) 2017-10-19
AU2014295302A1 (en) 2015-04-02
CA2918804A1 (en) 2015-01-29
CN104769671A (zh) 2015-07-08
EP3506260A1 (en) 2019-07-03
TW201513098A (zh) 2015-04-01
TWI555009B (zh) 2016-10-21
JP6568566B2 (ja) 2019-08-28
MY184847A (en) 2021-04-27
EP2830064A1 (en) 2015-01-28
PL3025337T3 (pl) 2022-04-11
BR122022011238B1 (pt) 2023-12-19
KR101764723B1 (ko) 2017-08-14
CN105580075A (zh) 2016-05-11
SG11201600494UA (en) 2016-02-26
US20210065723A1 (en) 2021-03-04
MX354657B (es) 2018-03-14
JP6186082B2 (ja) 2017-08-23
PL3017448T3 (pl) 2020-12-28
TW201517023A (zh) 2015-05-01
BR112016000947B1 (pt) 2022-06-21
US20160210974A1 (en) 2016-07-21
WO2015010953A1 (en) 2015-01-29
CA2918524A1 (en) 2015-01-29
JP6389254B2 (ja) 2018-09-12
MY175978A (en) 2020-07-19
KR20160041940A (ko) 2016-04-18
US10984805B2 (en) 2021-04-20
EP3017448B1 (en) 2020-07-08
JP2015535620A (ja) 2015-12-14
KR101826723B1 (ko) 2018-03-22
SG11201600464WA (en) 2016-02-26
US11922956B2 (en) 2024-03-05
KR101822032B1 (ko) 2018-03-08

Similar Documents

Publication Publication Date Title
CN105453175B (zh) 对编码音频信号进行解码的设备、方法及计算机可读介质
EP3186807A1 (en) Apparatus and method for generating an enhanced signal using independent noise-filling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination