CN1809872A - 编码音频信号的设备和方法及解码已编码音频信号的设备和方法 - Google Patents

编码音频信号的设备和方法及解码已编码音频信号的设备和方法 Download PDF

Info

Publication number
CN1809872A
CN1809872A CN200480017095.2A CN200480017095A CN1809872A CN 1809872 A CN1809872 A CN 1809872A CN 200480017095 A CN200480017095 A CN 200480017095A CN 1809872 A CN1809872 A CN 1809872A
Authority
CN
China
Prior art keywords
signal
audio signal
encoder output
resolution
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200480017095.2A
Other languages
English (en)
Other versions
CN1809872B (zh
Inventor
霍尔根·霍里奇
迈克尔·舒格
马赛厄斯·诺伊辛格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Publication of CN1809872A publication Critical patent/CN1809872A/zh
Application granted granted Critical
Publication of CN1809872B publication Critical patent/CN1809872B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

在编码音频信号时,首先以第一编码器(12)编码音频信号,以获得第一编码器输出信号。将此第一编码器输出信号写入比特流。还通过解码器(18)对其进行解码,以提供解码音频信号。将解码音频信号与原始音频信号进行比较(22),以获得残余信号。然后,通过第二编码器(26)编码残余信号,以提供第二编码器输出信号,将其也写入比特流(30)。第一编码器具有第一时间或频率分辨率。第二编码器具有第二时间或频率分辨率。第一分辨率不同于第二分辨率,从而在对应的解码器中,能够恢复同时具有高时间分辨率和高频率分辨率的音频信号。

Description

编码音频信号的设备和方法 及解码已编码音频信号的设备和方法
技术领域
本发明涉及编码技术,更具体地,涉及音频编码技术。
背景技术
音频编码器,尤其是以诸如“mp3”、“AAC”或“mp3PRO”等为关键字的编码器已经得到了广泛的认可。其能够将音频信号(在再现时,这些音频信号需要大量的数据,例如音频CD上的PCM格式)压缩为“可容忍”的数据速率(适合于在具有有限带宽的信道上传输音频信号)。因此,为了传输PCM格式的数据,需要高达1.4Mbit/s的数据速率。“mp3”编码的音频数据已经以128kbit/s的数据速率,实现了具有较高品质的立体声。
此外,谱带复制(SBR)是一种已知的方法,极大地提高了现有听觉适应音频编码器的效率。在WO 98/57436中描述了SBR技术,并以“mp3PRO”格式实现。这里,已经以64kbit/s的数据速率实现了良好的立体声品质。
欧洲专利EP 0 846 375 B1公开了一种用于对音频信号进行可扩缩编码的方法和设备。通过第一编码器编码音频信号,以获得针对第一编码器的比特流。然后,利用适合于第一编码器的解码器再次解码此信号。将解码器输出信号与延迟原始音频信号一起提供给差分级,以产生差别信号。将此差别信号与原始音频信号在频带方面进行比较,以便确定对于谱带而言,差别信号的能量是否大于音频信号的能量。如果是这样,则将原始音频信号提供给第二编码器,而在差别信号的能量小于原始音频信号的能量时,将差别信号提供给第二编码器。第二编码器是变换编码器,其基于心理声学模型进行操作。与第一编码器的比特流一样,也将第二编码器输出侧的比特流馈入比特流复用器,其在输出侧提供所谓的比例(scaled)比特流。关于这一点,可扩缩性意味着解码器能够根据设计,在解码器侧,从比特流中只提取出第一编码器的比特流,或提取出第一编码器的比特流和第二编码器的比特流,以便在第一种情况下,获得原始音频信号的低品质再现,以及在第二种情况下,获得高品质再现。
在图4a中示出了典型的基于变换的编码器。向分析滤波器组400提供音频信号,在其输入侧,分别通过阻断和窗口,形成具有来自采样值流的音频信号的一组特定数量的样本,并将其转换为谱再现。分别对在分析滤波器组的输出侧产生的谱系数和子带信号进行量化。量化器步长宽度依赖于不同的因素。重要的因素是心理声学掩码阈值,由心理声学模型402根据原始音频信号计算。模块“量化和编码404”中的量化器总是试图尽可能粗糙地进行量化,以获得良好的压缩。但是,另一方面,又试图尽可能精细地进行量化,从而使由于量化引起的量化噪声低于由模块402设置的心理声学掩码阈值,如现有技术所述。然后,对以这种方式量化的谱值进行熵编码,典型地,使用哈夫曼编码作为熵编码,其典型地分别以预定的哈夫曼代码本和哈夫曼代码表进行操作。然后,将熵编码后的量化谱值提供给模块404的输出,通过模块406,将其与解码所需边带信息一起写入比特流408,其中可以存储此比特流,或根据应用领域,将其通过传输信道传输到解码器(如图4b所示)。首先,解码器包括模块410,用于读取比特流,以便从比特流中一方面提取出边带信息,另一方面提取出熵编码后的量化谱值。然后,首先将熵编码后的量化谱值提供给熵解码,然后提供给逆量化,以获得逆量化谱值(模块412),然后,提供给适应于分析滤波器组400的合成滤波器组414,以便在输出侧获得时间离散解码音频信号。然后,可以在适当的插值和数字/模拟转换以及可能需要的放大之后,将合成滤波器组的输出侧的时间离散音频信号提供给扬声器,从而使其可以被听到。
基于模块的编码器/解码器(如其用在如图4a和4b所示的已知场景中那样)基于将一组样本(如1024和2048,具有本领域已知的MDCT,分别具有重叠和添加),音频信号的时间离散样本典型地转换为谱范围的事实。即使利用较低频率分辨率的滤波器,如具有64信道的SBR滤波器组,仍然使用具有特定样本数的一组样本,并将其转换为谱表示,即这里的各个子带信号。然后,如上所述,将对谱表示进行量化,典型地,借助于心理声学模型,其按照现有技术已知的方式计算心理声学掩码阈值。
这种变换具有内在的特定时间/频率分辨率。这意味着在将大量样本插入块中时,应用于该块的变换内在地具有高频率分辨率。另一方面,降低了时间分辨率。如果将音频信号的较短部分转换为谱范围,以增加时间分辨率,将导致频率分辨率相应地受到损害的事实。
因此,问题是只能将音频信号看作在非常短的时间段内是固定的。当然存在短期强能量增加,这被称为瞬变,其间音频信号不是固定的。
为了解决时间/频率分辨率的这种问题,例如,在AAC编码器(AAC=高级音频编码)中使用由瞬变检测器控制的块切换。这里,在分别进行窗口和阻断之前,检查要编码的音频信号,以便确定音频信号是否具有这种瞬变。如果确定了瞬变,则使用较短的块进行编码。但是,如果检测到不具有瞬变的信号部分,则使用较长的块长度。因此,在这种普通变换编码方法中,使用块切换,以便使变换长度适应于信号。尤其是在要实现低比特率时,优选地,使用非常长的变换长度,因为页面信息与有用信息的比率典型地与块长度相对无关。这意味着页面信息量通常相同,与块表示音频信号的大量时间样本还是块比较短(即表示较少数量的样本)的事实无关。因此,出于编码效率的原因,目标是总是使用尽可能大的块长度、以及变换编码器中的较大变换长度。
另一方面,对于在出现音频信号的非固定范围时的瞬变检测和切换到较短窗口,必须接受处理努力,但是,仍然导致其编码形式的信号或者只具有良好的频率分辨率或者只具有良好的时间分辨率。
发明内容
本发明的目的是提供一种针对编码和解码的改进概念,以获得较高的品质和仍然有效的音频编码/解码。
此目的通过根据权利要求1所述的用于编码音频信号的设备、根据权利要求7所述的用于编码音频信号的方法、根据权利要求8所述的用于解码已编码音频信号的设备、根据权利要求9所述的用于解码已编码音频信号的方法或根据权利要求10所述的计算机程序来实现。
本发明基于以下认知:具有良好频率分辨率和良好时间分辨率的良好编码品质是通过以下事实获得的:在扩缩性概念方面,第一编码器具有第一时间/频率分辨率,以及第二编码器具有不同于第一时间/频率分辨率的第二时间/频率分辨率,从而第一编码器以特定的分辨率编码原始音频信号,然后,第二编码器以在时间和频率方面、特定的不同分辨率进行操作,从而获得两个数据流,在一起考虑时,表现出良好的时间分辨率和良好的频率分辨率。
如上所述,不向第二编码器提供原始音频信号,而是原始音频信号与第一编码器/解码器的已编码、再解码结果之间的差。于是,由第一编码器产生的分辨率误差自动出现在所获得的残余信号中,例如,通过差别形成,其中残余信号典型地具有误差,例如由于第一编码器/解码器路径的较差时间分辨率而产生。与此相反,残余信号将很难再具有相应的频率误差,由于第一编码器/解码器路径具有良好的频率分辨率。因此,可以容易地以具有较高时间分辨率(并因而相应地具有较差的频率分辨率)的编码器对残余信号进行编码,以获得作为第二编码输出信号的、具有良好时间分辨率但较差频率分辨率的信号,但这并不是问题,因为第一编码器输出信号已经具有良好的频率分辨率,因而非常好地再现了音频信号在频率方面的结构。
在本发明的优选实施例中,第一编码器和第二编码器均为变换编码器。此外,优选的是,以较高的频率分辨率(因而较差的时间分辨率),即以较高的变换长度,操作第一编码器,而以较高的时间分辨率(因而较差的频率分辨率),操作第二编码器。
根据本发明,已经发现时域的人造假象(表示由于较差的时间分辨率产生的人造假象)比频域的人造假象(即由于较差的频率分辨率产生的人造假象)在多数情况下更容易被接受。因此,优选的是,以较高的频率分辨率操作第一编码器,因为只是来自对应解码器的第一编码器输出信号就足以获得相当好的音频输出,这在于可扩缩性的概念。
根据本发明,通过第二编码器改善了第一编码器方法的品质,通过执行第一编码器/解码器路径的输出信号与原始音频信号之间的差别形成,然后,以具有良好时间分辨率的第二编码器编码得到的残余信号。这种编码对于残余信号尤为合适,因为其已经包括较少的音调元素,因为其已经非常好并被第一编码方法有效地捕获。
但是,此残余信号的重要缺陷在于较差的时间分辨率,表现在瞬变之前或之后噪声的产生,即前回声和后回声。前回声比后噪声更容易造成干扰,由于其更容易被察觉。可以说,此噪声是瞬变的量化噪声,且其谱内容主要对应于瞬变之一,因而并非音调。因此,通过利用具有较短块的变换编码方法,即具有较高时间分辨率,以有效的方式极大地改善了时间分辨率。
因此,根据本发明,获得了具有较高和最高品质的音频编码方法,以具有长变换长度的频率选择变换编码方法检测部分音频信号(音调,确切地说是音调信号),同时,具有短变换长度的下游编码方法实现了针对残余信号的高时间分辨率。
附图说明
下面,将参照附图,更为详细地讨论本发明的优选实施例,其中:
图1本发明编码概念的方框图;
图2根据本发明优选实施例的本发明编码概念的方框图;
图3本发明解码器概念的方框图;
图4a已知变换编码器;以及
图4b已知变换解码器。
具体实施方式
图1示出了用于编码音频信号的设备,通过输入10提供所述音频信号。首先,将音频信号馈入具有第一时间/频率分辨率的第一编码器12。形成第一编码器12以在输出14产生第一编码器输出信号。一方面,将第一编码器12的输出14处的第一编码器输出信号提供给复用器16,另一方面,将其提供给解码器18,解码器18适合于第一编码器,并解码第一编码器输出信号,以在解码器18的输出20提供解码音频信号。将解码输出信号20以及原始音频信号10提供给比较器22。形成比较器22,将输入10处的音频信号与输出20处的解码音频信号进行比较,这意味着在来自第一编码器12和解码器18的路径之后。具体地,形成比较器22,以在其输出24之一处提供残余信号,其中残余信号包括音频信号和解码音频信号之间的差别。将此残余信号24提供给第二编码器26,形成第二编码器26,以编码比较器22的输出24处的残余信号,从而在输出28提供第二编码器输出信号,同样将其提供给复用器16。形成复用器16,将第一编码器输出信号和第二编码器输出信号进行组合,并在输出30产生已编码音频信号,如果需要,考虑对应的边带信息和比特流语法转换。
根据本发明,第一编码器具有第一时间或频率分辨率,而第二编码器具有第二时间或频率分辨率。根据本发明,第一编码器的第一分辨率不同于第二编码器的第二分辨率,所以第一编码器输出信号或者在时间或者在频率方面是良好编码的,而第二编码器输出信号或者在频率或者在时间方面是良好编码的,从而在复用器16的输出处的已编码音频信号具有高时间分辨率和高频率分辨率。
下面,将参照图2描述本发明的优选实施例。这里,在将音频信号10提供给比较器22(在图2中将其表示为差分件)之前,由延迟件32对音频信号10进行延迟,从而在图2所示的优选实施例中,可以由差分件22,在解码器18的输出处的解码音频信号和延迟件32的输出处的(延迟)音频信号之间实时地进行样本差别形成。
此外,在图2所示的实施例中,形成第一编码器(即图2中的编码器12)和图2中称为差别编码器的第二编码器26,以执行变换编码。
此外,优选的是,第一编码器12执行具有长变换长度的编码,即高频率分辨率和低时间分辨率,而第二编码器26执行具有短变换长度的编码,这意味着高时间分辨率和内在的低频率分辨率。
尽管在原理上第一编码器也可以按照短变换长度进行操作,而差别编码器以长变换长度进行操作,但优选的是,以长变换长度运行第一编码器,因为如上所述,与频率人造假象相比,时间人造假象对于听众来说问题小一些。因此,与第一编码器以短变换长度工作时相比,如果第一编码器以长变换长度进行操作,只能处理输出14处的第一编码器输出信号、不能处理输出28处的第二编码器输出信号的编码器可以产生更加令人愉悦的再现。
可以将用于将一组时间样本转换为谱表示的任何手段用作图2所示的第一编码器和/或第二编码器内的变换算法,如傅立叶变换、离散傅立叶变换、快速傅立叶变换、离散余弦变换、修正离散余弦变换等。或者,可以使用具有较少数量信道的滤波器组,如64信道滤波器组、128信道滤波器组、或具有更多或更少信道的滤波器组。
在本发明的一个实施例中,第一编码器12可以是SBR编码器,用于提供第一编码器输出信号,所述第一编码器输出信号只包括直到截止频率的信息,小于音频输出10处的音频信号的截止频率。典型的SBR编码器从音频信号中提取边带信息,可以用于SBR解码器中的高频重构,从而以尽可能高的品质重构高频带,其表示音频信号高于第一编码器输出信号的截止频率的频带。但是,图2中的解码器18不是这种具有高频重构的SBR解码器,而是普通的变换解码器,适合于第一编码器12,以简单地解码已编码输出信号,而与限制相同频带的事实无关,所以解码器18在输出20处的输出信号也具有比原始音频信号低的截止频率。
在这种情况下,直到截止频率的残余信号将包括编码器12和解码器的路径的编码器/解码器误差,但仍然是截止频率以上的完整音频信号。
在这种情况下,也利用使用短变换长度的差别编码器26对残余信号进行编码,因为其对应于第一编码器输出信号的截止频率以上的原始音频信号。或者,只以差别编码器26编码残余信号直到第一编码器输出信号的截止频率的谱范围,而以具有长变换长度的第一编码器12再次编码残余信号的高频部分,从而在音频信号的高频部分中,也获得高频率分辨率。
然后,将编码器12针对高频频带的输出信号再次与原始音频信号的对应频带进行比较,从而再次以差别编码器26编码差别信号,最后,将四个数据流提供给复用器16,在对其全部一起进行解码时,实现了透明再现,即没有人造假象的再现。
根据本发明,第一编码器和第二编码器利用心理声学模型来进行操作并不关键。但是,出于数据效率的原因,优选的是,至少第一编码器12利用心理声学模型来进行操作。当各个传输信道源出现时,第二编码器可以根据来源,进行无损编码,从而实现全透明再现。或者,第二编码器也可以利用心理声学模型来进行操作,其中优选的是,在这种情况下,不再针对第二编码器完整地计算心理声学模型,考虑到第一编码器与第二编码器的不同变换长度,可以“重新使用”相同的、完整的心理声学掩码阈值中的至少一部分。例如,这可以如下进行:将第一编码器计算的心理声学掩码阈值直接应用于第二编码器,但是,例如,考虑到第二编码器的较短变换长度,使用3dB的“安全附加”,从而使第二编码器的心理声学掩码阈值比第一编码器12的心理声学掩码阈值低3dB或其他预定量。
对于变换长度,优选的是,第一编码器的变换长度是第二编码器的变换长度的整数倍。这样,第一编码器的变换长度可以比第二编码器26的变换长度包括2倍、3倍、4倍或5倍的音频信号样本。因此,第一和第二编码器的变换长度之间的整数关系是优选的,因为这样,第一编码器的编码数据针对第二编码器的相对良好的重新使用成为可能。另一方面,变换长度之间的非整数联系也没有问题,因为第一编码器12和第二编码器26也可以彼此不同步地运行,只要将其相应地报告给解码器,从而解码器以正确的样本进行求和,这表示在图2的元件22中反转样本的差别信息。
图3示出了根据本发明的、用于解码已编码音频信号的解码器。在传输、存储等之后,将在图1和图2的输出30处输出的已编码音频信号提供给图3中的解码器的输入40。输入40首先与提取器42相连,提取器42具有比特流解复用器的功能,首先从已编码音频信号中提取出第一编码器输出信号,并在输出44处提供,并且用于在输出46处分别提供已编码残余信号和差别信号以及第二已编码音频信号。将第一编码器输出信号提供给第一解码器,其适合于图1所示的本发明的编码设备的第一编码器12,并在原理上等同于图1的解码器18。这意味着第一解码器48同样具有相同的时间/频率分辨率,这意味着其以与图1的编码器12相同的变换长度进行操作。将提取器的输出46处的第二编码器输出信号提供给第二解码器50,其适合于图1的第二编码器26,并因此具有第二时间/频率分辨率,表示与图1中的第二编码器26的时间/频率分辨率等同的时间/频率分辨率。
在输出侧,第一编码器48提供解码音频信号,可以等同于图2的输出20处的信号。类似地,第二解码器50在其输出提供解码残余信号。应当注意,原理上可以如图4b所示地形成这两个解码器,但是,在其变换长度以及所使用的合成滤波器组方面不同。
将图3中的输出52处的解码音频信号和图3中的输出54处的解码残余信号提供给组合器56,在本发明的优选实施例中,执行样本求和,这通常表示在图1的元件22中的编码器中执行的比较操作的逆操作。在输出侧,组合器56在图3的解码器设备的输出58处提供输出信号,由于本发明,表现出良好的时间分辨率和良好的频率分辨率,即其包括较少的频率人造假象和较少的时间人造假象。
根据环境,可以由硬件或软件实现参照图1描述的根据本发明的编码方法或参照图3描述的根据本发明的解码方法。可以在数字存储介质上实现本发明的实施方式,尤其是具有电可读控制信号的盘或CD,能够与可编程计算机系统相互作用,从而执行相应的方法。因此,本发明通常还在于一种计算机程序产品,具有存储在机器可读载体上的程序代码,当在计算机上运行所述计算机程序产品时,执行本发明的方法。换句话说,也可以将本发明实现为计算机程序,具有当在计算机上运行所述计算机程序时、实现所述方法的程序代码。

Claims (10)

1、一种用于编码音频信号的设备,包括:
第一变换编码器(12),用于根据音频信号产生第一编码器输出信号,其中第一变换编码器适合于将具有第一数量的音频信号时间样本的组转换为谱表示,以获得第一编码器输出信号;
解码器(18),适合于第一编码器(12),用于解码第一编码器输出信号,以提供解码音频信号;
比较器(22),用于将音频信号与解码音频信号进行比较,其中比较器(22)适合于提供残余信号,所述残余信号包括音频信号与解码音频信号之间的差别;
第二变换编码器(26),用于编码残余信号,以提供第二编码器输出信号,其中第二变换编码器适合于将具有第二数量的音频信号时间样本的组转换为谱表示,以获得第二编码器输出信号,
其中调整第一变换编码器和第二变换编码器,从而使第一数量的音频信号时间样本大于第二数量的音频信号时间样本,从而使第一编码器(12)具有低时间分辨率和高频率分辨率,而第二编码器(26)具有高时间分辨率和低频率分辨率;以及
复用器(16),用于组合第一编码器输出信号和第二编码器输出信号,以获得已编码音频信号。
2、根据权利要求1所述的设备,其特征在于第一编码器(12)和第二编码器(26)具有滤波器组或变换算法,所述变换算法包括傅立叶变换、离散傅立叶变换、快速傅立叶变换、离散余弦变换或修正余弦变换。
3、根据权利要求1或2所述的设备,其特征在于解码器(18)适合于提供具有样本序列的时间离散解码音频信号,
其中音频信号是具有样本序列的时间离散音频信号,以及
比较器(22)适合于执行逐样本差别信息,以获得残余信号。
4、根据前述权利要求之一所述的设备,其特征在于还包括:
延迟件(32),用于延迟音频信号,其中延迟件(32)适合于具有依赖于与第一编码器(12)和解码器(18)相关联的延迟的延迟。
5、根据前述权利要求之一所述的设备,其特征在于复用器(16)适合于产生已编码音频信号,从而能够独立于第二编码器输出信号地解码第一编码器输出信号。
6、根据前述权利要求之一所述的设备,其特征在于第一编码器(12)适合于对音频信号进行频带限制,从而使第一编码器输出信号具有比音频信号的上截止频率小的上截止频率,
其中比较器(22)提供与第一编码器输出信号的上截止频率以上的音频信号相对应的残余信号,并且第二解码器(26)适合于对具有不等于第二分辨率或等于第二分辨率的时间或频率分辨率的第一编码器的上截止频率以上的残余信号部分进行编码。
7、一种用于解码音频信号的方法,包括:
由音频信号产生(12)具有第一时间或频率分辨率的第一输出信号,其中产生步骤(12)包括以下步骤:将具有第一数量的音频信号时间样本的组转换为谱表示,以获得第一输出信号;
解码第一编码器输出信号,以提供解码音频信号;
将音频信号与解码音频信号进行比较(22),以提供残余信号,其中所述残余信号包括音频信号与解码音频信号之间的差别;
以第二时间或频率分辨率编码(26)残余信号,以提供第二编码器输出信号,其中编码步骤(26)包括以下步骤:将具有第二数量的音频信号时间样本的组转换为谱表示,以获得第二编码器输出信号,
其中调整产生步骤(12)和编码步骤(26),从而使第一数量的音频信号时间样本大于第二数量的音频信号时间样本,从而使第一输出信号具有低时间分辨率和高频率分辨率,而第二输出信号具有高时间分辨率和低频率分辨率;以及
组合(16)第一编码器输出信号和第二编码器输出信号,以获得已编码音频信号。
8、一种用于解码已编码音频信号以获得输出信号的设备,其中已编码音频信号具有第一编码器输出信号,以高时间分辨率和低频率分辨率编码所述第一编码器输出信号,而且已编码音频信号还具有第二编码器输出信号,表示以高时间分辨率和低频率分辨率编码的残余信号,表示原始音频信号与解码音频信号之间的差别,其中可以通过解码第一编码器输出信号获得解码音频信号,其中利用第一变换编码器产生第一编码器输出信号,其中第一变换编码器适合于将具有较高数量的音频信号时间样本的组转换为谱表示,以获得第一编码器输出信号,其中利用第二变换编码器产生第二编码器输出信号,其中第二变换编码器适合于将具有较低数量的音频信号时间样本的组转换为谱表示,以获得第二编码器输出信号,所述设备包括:
提取器(42),用于从已编码音频信号中提取出第一编码器输出信号和第二编码器输出信号;
第一变换解码器(48),适合于第一变换编码器,用于解码第一编码器输出信号,以获得解码音频信号,其中第一解码器(48)适合于以低时间分辨率和高频率分辨率进行操作,而且第一变换解码器(48)适合于将具有第一数量的谱值的组转换为时间表示;
第二变换解码器(50),适合于第二变换编码器,用于解码第二编码器输出信号,以获得解码残余信号,其中第二解码器适合于以高时间分辨率和低频率分辨率进行操作,而且第二变换解码器(50)适合于将具有第二数量的谱值的组转换为时间表示,所述第二数量小于所述第一数量,以及
组合器(56),用于组合解码音频信号和解码残余信号,以获得输出信号。
9、一种用于解码已编码音频信号以获得输出信号的方法,其中已编码音频信号具有第一编码器输出信号,以高时间分辨率和低频率分辨率编码所述第一编码器输出信号,而且已编码音频信号还具有第二编码器输出信号,表示以高时间分辨率和低频率分辨率编码的残余信号,表示原始音频信号与解码音频信号之间的差别,其中可以通过解码第一编码器输出信号获得解码音频信号,其中利用第一变换编码器产生第一编码器输出信号,其中第一变换编码器适合于将具有较高数量的音频信号时间样本的组转换为谱表示,以获得第一编码器输出信号,其中利用第二变换编码器产生第二编码器输出信号,其中第二变换编码器适合于将具有较低数量的音频信号时间样本的组转换为谱表示,以获得第二编码器输出信号,所述方法包括:
从已编码音频信号中提取出(42)第一编码器输出信号和第二编码器输出信号;
适合于第一变换编码器,解码(48)第一编码器输出信号,以获得解码音频信号,其中解码步骤(48)适合于以低时间分辨率和高频率分辨率进行操作,而且解码步骤(48)适合于将具有第一数量的谱值的组转换为时间表示;
适合于第二变换编码器,解码(50)第二编码器输出信号,以获得解码残余信号,其中解码步骤适合于以高时间分辨率和低频率分辨率进行操作,而且解码步骤(50)适合于将具有第二数量的谱值的组转换为时间表示,所述第二数量小于所述第一数量,以及
组合(56)解码音频信号和解码残余信号,以获得输出信号。
10、一种计算机程序,具有当在计算机上运行所述程序时、执行根据权利要求7或9所述的方法的程序代码。
CN200480017095.2A 2003-06-25 2004-06-24 编码音频信号的设备和方法及解码已编码音频信号的设备和方法 Expired - Lifetime CN1809872B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10328777A DE10328777A1 (de) 2003-06-25 2003-06-25 Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
DE10328777.9 2003-06-25
PCT/EP2004/006850 WO2005001813A1 (en) 2003-06-25 2004-06-24 Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal

Publications (2)

Publication Number Publication Date
CN1809872A true CN1809872A (zh) 2006-07-26
CN1809872B CN1809872B (zh) 2010-06-02

Family

ID=33546670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200480017095.2A Expired - Lifetime CN1809872B (zh) 2003-06-25 2004-06-24 编码音频信号的设备和方法及解码已编码音频信号的设备和方法

Country Status (7)

Country Link
US (1) US7275031B2 (zh)
EP (1) EP1636791B1 (zh)
JP (1) JP2009513992A (zh)
CN (1) CN1809872B (zh)
DE (2) DE10328777A1 (zh)
HK (1) HK1083664A1 (zh)
WO (1) WO2005001813A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009109139A1 (zh) * 2008-03-05 2009-09-11 华为技术有限公司 超宽带扩展编码、解码方法、编码器及超宽带扩展系统
CN101188111B (zh) * 2006-11-24 2012-02-22 富士通株式会社 解码装置和解码方法
CN101615393B (zh) * 2008-06-25 2013-01-02 汤姆森许可贸易公司 对语音和/或非语音音频输入信号编码或解码的方法和设备
CN107403625A (zh) * 2012-07-16 2017-11-28 杜比国际公司 用于对hoa音频信号进行解码的方法、设备和计算机可读介质
CN110010140A (zh) * 2013-04-05 2019-07-12 杜比国际公司 立体声音频编码器和解码器
CN111444382A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 一种音频处理方法、装置、计算机设备以及存储介质
CN112104952A (zh) * 2020-11-19 2020-12-18 首望体验科技文化有限公司 应用于720度球幕全景影院的全景声音频系统
CN113963706A (zh) * 2014-07-28 2022-01-21 弗劳恩霍夫应用研究促进协会 频域处理器以及时域处理器的音频编码器和解码器

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7539870B2 (en) * 2004-02-10 2009-05-26 Microsoft Corporation Media watermarking by biasing randomized statistics
US7788090B2 (en) * 2004-09-17 2010-08-31 Koninklijke Philips Electronics N.V. Combined audio coding minimizing perceptual distortion
JP4809370B2 (ja) 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
ATE442645T1 (de) 2006-02-06 2009-09-15 France Telecom Verfahren und vorrichtung zur hierarchischen kodierung eines quelltonsignals sowie entsprechendes decodierverfahren und gerät, programme und signal
EP1855271A1 (en) * 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for re-encoding signals
GB2443911A (en) * 2006-11-06 2008-05-21 Matsushita Electric Ind Co Ltd Reducing power consumption in digital broadcast receivers
CN101689368B (zh) * 2007-03-30 2012-08-22 韩国电子通信研究院 对具有多声道的多对象音频信号进行编码和解码的设备和方法
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
WO2009049895A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
ES2731424T3 (es) 2008-07-11 2019-11-15 Fraunhofer Ges Forschung Codificador de audio y decodificador de audio
CN101729198B (zh) * 2008-10-27 2014-04-02 华为技术有限公司 一种编解码方法、装置及系统
PT3364414T (pt) 2008-12-15 2022-07-04 Fraunhofer Ges Forschung Descodificador de áudio de extensão de largura de banda, método correspondente e programa de computador
RU2523035C2 (ru) * 2008-12-15 2014-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудио кодер и декодер, увеличивающий полосу частот
PL4152320T3 (pl) * 2009-10-21 2024-02-19 Dolby International Ab Nadpróbkowanie w banku filtrów połączonym z modułem transpozycji
BR112012014856B1 (pt) * 2009-12-16 2022-10-18 Dolby International Ab Método para fundir conjuntos de fonte de parâmetros de sbr a conjuntos-alvo de parâmetros de sbr, meio de armazenamento não transitório e unidade de fusão de parâmetros de sbr
JP5737189B2 (ja) 2010-01-15 2015-06-17 三菱化学株式会社 単結晶基板、それを用いて得られるiii族窒化物結晶及びiii族窒化物結晶の製造方法
CN102263771B (zh) * 2010-05-26 2014-03-19 中国移动通信集团公司 移动终端、适配器及多媒体数据的播放方法和系统
ES2666150T3 (es) 2010-07-02 2018-05-03 Dolby International Ab Descodificación de audio con pos-filtro selectivo
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
CN106409299B (zh) 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
EP3704863B1 (en) * 2017-11-02 2022-01-26 Bose Corporation Low latency audio distribution
US12104955B2 (en) * 2021-03-01 2024-10-01 The Boeing Company Device to process sample using a time-windowed transform function to generate spectral data and to use combined magnitude and phase spectrograms
EP4303872A1 (de) * 2022-07-07 2024-01-10 Technische Universität München Kodierungsvorrichtung und kodierungsverfahren zur mehrkanalkodierung von vibrotaktilen signalen sowie dekodierung und dekodierungsverfahren

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143735A (ja) * 1988-11-25 1990-06-01 Victor Co Of Japan Ltd 音声多段符号化伝送方式
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5732391A (en) * 1994-03-09 1998-03-24 Motorola, Inc. Method and apparatus of reducing processing steps in an audio compression system using psychoacoustic parameters
JPH07261799A (ja) * 1994-03-18 1995-10-13 Pioneer Electron Corp 直交変換符号化装置及び方法
JP3186413B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
DE19537338C2 (de) * 1995-10-06 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren von Audiosignalen
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19743662A1 (de) * 1997-10-02 1999-04-08 Bosch Gmbh Robert Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
WO2001022401A1 (en) * 1999-09-20 2001-03-29 Koninklijke Philips Electronics N.V. Processing circuit for correcting audio signals, receiver, communication system, mobile apparatus and related method
US6377916B1 (en) * 1999-11-29 2002-04-23 Digital Voice Systems, Inc. Multiband harmonic transform coder
JP3609323B2 (ja) * 2000-05-08 2005-01-12 日本電信電話株式会社 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
DE10102159C2 (de) * 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188111B (zh) * 2006-11-24 2012-02-22 富士通株式会社 解码装置和解码方法
WO2009109139A1 (zh) * 2008-03-05 2009-09-11 华为技术有限公司 超宽带扩展编码、解码方法、编码器及超宽带扩展系统
CN101615393B (zh) * 2008-06-25 2013-01-02 汤姆森许可贸易公司 对语音和/或非语音音频输入信号编码或解码的方法和设备
CN107403625A (zh) * 2012-07-16 2017-11-28 杜比国际公司 用于对hoa音频信号进行解码的方法、设备和计算机可读介质
CN107403625B (zh) * 2012-07-16 2021-06-04 杜比国际公司 用于对hoa音频信号进行解码的方法、设备和计算机可读介质
CN110010140A (zh) * 2013-04-05 2019-07-12 杜比国际公司 立体声音频编码器和解码器
CN110010140B (zh) * 2013-04-05 2023-04-18 杜比国际公司 立体声音频编码器和解码器
US12080307B2 (en) 2013-04-05 2024-09-03 Dolby International Ab Stereo audio encoder and decoder
CN113963706A (zh) * 2014-07-28 2022-01-21 弗劳恩霍夫应用研究促进协会 频域处理器以及时域处理器的音频编码器和解码器
CN111444382A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 一种音频处理方法、装置、计算机设备以及存储介质
CN112104952A (zh) * 2020-11-19 2020-12-18 首望体验科技文化有限公司 应用于720度球幕全景影院的全景声音频系统

Also Published As

Publication number Publication date
WO2005001813A1 (en) 2005-01-06
DE10328777A1 (de) 2005-01-27
EP1636791B1 (en) 2007-03-07
JP2009513992A (ja) 2009-04-02
DE602004005197T2 (de) 2007-06-28
CN1809872B (zh) 2010-06-02
HK1083664A1 (en) 2006-07-07
EP1636791A1 (en) 2006-03-22
US20060167683A1 (en) 2006-07-27
DE602004005197D1 (de) 2007-04-19
US7275031B2 (en) 2007-09-25

Similar Documents

Publication Publication Date Title
CN1809872B (zh) 编码音频信号的设备和方法及解码已编码音频信号的设备和方法
CN1878001B (zh) 对音频数据编码及解码的设备及方法
US7974840B2 (en) Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
CN101223577B (zh) 对低比特率音频信号进行编码/解码的方法和设备
Iwakami et al. High-quality audio-coding at less than 64 kbit/s by using transform-domain weighted interleave vector quantization (TWINVQ)
US6092041A (en) System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
KR101139172B1 (ko) 스케일러블 음성 및 오디오 코덱들에서 양자화된 mdct 스펙트럼에 대한 코드북 인덱스들의 인코딩/디코딩을 위한 기술
US6502069B1 (en) Method and a device for coding audio signals and a method and a device for decoding a bit stream
TWI407432B (zh) 用於可縮放的語言及音頻編碼之方法、器件、處理器及機器可讀媒體
JPH09204197A (ja) 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
CN1153365C (zh) 采用不同编码原理的传送系统
WO2006000842A1 (en) Multichannel audio extension
KR20090043983A (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
CN1117346C (zh) 编码离散信号和解码已编码的离散信号的方法和设备
WO2005096274A1 (fr) Dispositif et procede de codage/decodage audio ameliores
CA2490064A1 (en) Audio coding method and apparatus using harmonic extraction
KR102083768B1 (ko) 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
CN1273955C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置
Yu et al. A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding
CN1318904A (zh) 一种实用的基于小波变换的声音编解码器
AU2011205144B2 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
Mandal et al. Digital Audio Compression

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: DOLBY INTERNATIONAL CO., LTD.

Free format text: FORMER NAME: CODDING TECHNOLOGY COMPANY

CP01 Change in the name or title of a patent holder

Address after: Stockholm

Patentee after: DOLBY INTERNATIONAL AB

Address before: Stockholm

Patentee before: Coding Technology

C56 Change in the name or address of the patentee
CP02 Change in the address of a patent holder

Address after: Amsterdam, The Netherlands

Patentee after: DOLBY INTERNATIONAL AB

Address before: Stockholm

Patentee before: Dolby International AB

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20100602