CN101188111A

CN101188111A - 解码装置和解码方法

Info

Publication number: CN101188111A
Application number: CNA2007101668462A
Authority: CN
Inventors: 牧内孝志; 铃木政直; 土永义照; 白川美由纪
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-11-24
Filing date: 2007-10-22
Publication date: 2008-05-28
Anticipated expiration: 2027-10-22
Also published as: EP1926086B1; EP1926086A2; JP2008129541A; US8249882B2; JP5103880B2; CN101188111B; US20080288262A1; EP1926086A3

Abstract

本发明提供了解码装置和解码方法。所述解码装置将第一编码数据和第二编码数据解码成音频信号，所述第一编码数据根据所述音频信号的低频分量被编码到第一时间范围，所述第二编码数据在根据所述低频分量生成所述音频信号的高频分量时使用并被编码到第二时间范围。在所述解码装置中，高频分量补偿单元基于所述第一时间范围来补偿根据所述第二编码数据生成的高频分量。解码单元通过对由所述高频分量补偿单元补偿的所述高频分量和根据所述第一解码数据解码出的所述低频分量进行合成，来解码出所述音频信号。

Description

解码装置和解码方法

技术领域

本发明涉及音频信号的解码技术。

背景技术

近来，采用高效高级音频编码(HE-AAC)方法来编码语音、声音和音乐。HE-AAC方法是原则上通过运动图像专家组第2代(MPEG-2)或运动图像专家组第4代(MPEG-4)使用的音频压缩方法。

根据HE-AAC方法的编码，通过高级音频编码(AAC)方法对要编码的音频信号(涉及语音、声音和音乐等的信号)的低频分量进行编码，并通过频带复制(SBR)方法对音频信号的高频分量进行编码。根据SBR方法，通过仅对无法根据音频信号的低频分量的部分进行编码，可以用比通常使用的位数更少的位数来对该音频信号的高频分量进行编码。下文中，将通过AAC方法编码的数据称作AAC数据，将通过SBR方法编码的数据称作SBR数据。

下面说明用于对通过HE-AAC方法编码的数据(HE-ACC数据)进行解码的解码器的示例。如图14所示，解码器10包括数据分离单元11、AAC解码单元12、分析滤波器13、高频生成单元14和合成滤波器15。

当数据分离单元11获得HE-AAC数据时，数据分离单元11将获得的HE-AAC数据分离成AAC数据和SBR数据、将该AAC数据输出到AAC解码单元12、并将SBR数据输出到高频生成单元14。

AAC解码单元12对AAC数据进行解码，并将经解码的AAC数据作为经AAC解码音频数据输出到分析滤波器13。分析滤波器13基于从AAC解码单元12获取的经AAC解码音频信号来计算与音频信号的低频分量相关的时间和频率特性，并将计算结果输出到合成滤波器15和高频生成单元14。下文中，将从分析滤波器13输出的计算结果称作低频分量数据。

高频生成单元14基于从数据分离单元11获取的SBR数据和从分析滤波器13获取的低频分量数据，生成音频信号的高频分量。高频生成单元14然后将生成的高频分量的数据作为高频分量数据输出到合成滤波器15。

合成滤波器15对从分析滤波器13获取的低频分量数据和从高频生成单元14获取的高频分量数据进行合成，并输出合成的数据作为HE-AAC输出音频数据。

下面说明解码器10执行的处理。分析滤波器13生成如图15的左边部分所示的低频分量数据。如图15的右边部分所示，高频生成单元14根据低频分量数据生成高频分量数据，合成滤波器15对该低频分量数据和高频分量数据进行合成，从而生成HE-AAC输出音频数据。这样，利用解码器10将通过HE-AAC数据方法解码的音频信号解码成HE-AAC输出音频数据。

日本特开2006-126372号公报公开了一种编码方法，根据该方法，当接收到音频信号时，如果该音频信号包含振幅突变，则将该音频信号的频谱分成多个组，并且针对每个组执行位赋值(assignment)和量化。

然而，如果对包含冲击音(attack sound)的音频信号(包括振幅突变的信号)进行编码(例如，通过HE-ACC方法)并且之后对该编码的音频信号进行解码，则上述常规技术无法适当地编码音频信号的高频分量。

下面来具体说明常规技术中的问题。如图16所示，当通过SBR方法对在极短时间内包含振幅突变的音频信号进行编码时，存在这样的情况，其中由于SBR方法的特性导致冲击音发生的时间区域与通过SBR方法划分的时间区域相比极短(或者，根据SBR方法的时间分辨率比根据AAC方法的时间分辨率粗糙)。其原因在于，包含冲击音的时间区域的功率被平坦，使得冲击音被以更慢的步幅编码。

下面说明根据SBR方法的时间分辨率比根据AAC方法的时间分辨率粗糙的情况。在通过HE-AAC方法对音频信号进行编码中，首先通过SBR方法执行编码，然后通过AAC方法执行编码。在SBR方法和AAC方法中每一个中，都通过判断音频信号是否包含冲击音并基于判断结果调整时间分辨率来执行编码(如果包含冲击音，则将时间分辨率设置为精细，如果不包含冲击音，则将时间分辨率设置为粗糙)。然而，有时尽管音频信号包含冲击音，但确未检测到冲击音。在这种情况下，根据SBR方法的时间分辨率比根据AAC方法的时间分辨率粗糙。

换句话说，强烈需要即使在包含冲击音的音频信号的高频分量没有通过HE-AAC方法适当地编码的情况下也能通过补偿经编码的音频信号的高频分量适当地对经编码的音频信号进行解码。

发明内容

本发明的目的在于至少部分地解决常规技术中的问题。

根据本发明的一个方面，提供了一种解码装置，该解码装置将第一编码数据和第二编码数据解码成音频信号，所述第一编码数据根据所述音频信号的低频分量被编码到第一时间范围，所述第二编码数据在根据所述低频分量生成所述音频信号的高频分量时使用并被编码到第二时间范围。所述解码装置包括：高频分量补偿单元，其基于所述第一时间范围来补偿根据所述第二编码数据生成的高频分量；和解码单元，其通过对由所述高频分量补偿单元补偿的所述高频分量和根据所述第一解码数据解码出的所述低频分量进行合成，来解码出所述音频信号。

根据本发明的另一方面，提供了一种解码方法，该解码方法将第一编码数据和第二编码数据解码成音频信号，所述第一编码数据根据所述音频信号的低频分量被编码到第一时间范围，所述第二编码数据在根据所述低频分量生成所述音频信号的高频分量时使用并被编码到第二时间范围。该解码方法包括以下步骤：高频补偿步骤，基于所述第一时间范围来对根据所述第二编码数据生成的高频分量进行高频补偿；以及解码步骤，通过对在所述高频补偿步骤中补偿的所述高频分量和根据所述第一解码数据解码出的所述低频分量进行合成，来解码出所述音频信号。

通过阅读以下结合附图对本发明的当前优选实施方式的详细描述，将更好地理解本发明的上述和其他目的、特征、优点以及技术和工业意义。

附图说明

图1是用于说明根据本发明第一实施方式的解码器的概要和特性的示意图；

图2是图1所示的解码器的功能框图；

图3是用于说明由图2所示的高频补偿单元执行的对高频分量数据进行补偿的示意图；

图4是由图1所示的解码器执行的处理过程的流程图；

图5是根据本发明第二实施方式的解码器的功能框图；

图6是由图5所示的解码器执行的处理过程的流程图；

图7是根据本发明第三实施方式的解码器的功能框图；

图8是用于说明由图7所示的瞬态(transience)判定单元执行的用于检测出检测时间范围的处理的示意图；

图9是图7所示的解码器执行的处理过程的流程图；

图10是根据本发明第四实施方式的解码器的功能框图；

图11是由图10所示的解码器执行的处理过程的流程图；

图12是根据本发明第五实施方式的解码器的功能框图；

图13是由图12所示的解码器执行的处理过程的流程图；

图14是常规解码器的功能框图；

图15是用于说明由常规解码器执行的处理的概要的示意图；以及

图16是用于说明常规技术的问题的示意图。

具体实施方式

下面将参照附图来详细说明本发明的示例性实施方式。

[第一实施方式]

下面说明根据本发明第一实施方式的解码器100的概要和特性。如图1所示，当解码器100获取并解码通过高效高级音频编码(HE-AAC)方法编码的音频信号(下文中称作“HE-AAC数据”)时，解码器100将HE-AAC数据中包含的高频分量数据的时间范围校正到该HE-AAC数据中包含的低频分量数据的时间范围，并且根据校正后的时间范围来补偿在校正之前的时间范围内已被平坦化的高频分量的功率。

高频分量数据的时间范围对应于通过频带复制(SBR)方法对数据进行编码的时间分辨率，低频分量数据的时间范围对应于通过高级音频编码(AAC)方法对数据进行编码的时间分辨率。下文中，将通过SBR方法编码的数据称作SBR数据，将通过AAC方法编码的数据称作AAC数据。SBR数据和AAC数据都包含在HE-AAC数据中。

这样，即使音频信号的高频分量(SBR数据)没有通过HE-AAC方法适当地编码，解码器100也能够适当地解码出音频信号。

下面说明解码器100的配置。如图2所示，解码器100包括数据分离单元110、AAC解码单元120、分析滤波器130、高频生成单元140、瞬态判定单元150、高频补偿单元160以及合成滤波器170。

当数据分离单元110获得根据HE-AAC方法编码的数据(下文中称作“HE-AAC数据”)时，数据分离单元110将获得的HE-AAC数据分离成高级音频编码(AAC)数据和SBR数据、将该AAC数据输出到AAC解码单元120、并将SBR数据输出到高频生成单元140。

AAC解码单元120对AAC数据进行解码，并将经解码的AAC数据作为AAC输出音频数据输出到分析滤波器130和瞬态判定单元150。分析滤波器130基于从AAC解码单元120获取的AAC输出音频数据来计算与音频信号的低频分量相关的时间和频率特性，并将计算结果输出到合成滤波器170和高频生成单元140。下文中，将从分析滤波器130输出的计算结果称作低频分量数据。

高频生成单元140基于从数据分离单元110获取的SBR数据和从分析滤波器130获取的低频分量数据，生成音频信号的高频分量。高频生成单元140然后将生成的高频分量的数据作为音频信号的高频分量数据输出到高频补偿单元160。

瞬态判定单元150从AAC解码单元120获取AAC输出音频数据，判断HE-AAC数据是否包含任意冲击音(包含振幅突变的信号)，并将判定结果输出到高频补偿单元160。

高频补偿单元160从瞬态判定单元150获取判定结果，并基于获取的判定结果来补偿高频分量数据。如果高频补偿单元160获得的判定结果为包含冲击音，则高频补偿单元160补偿高频分量数据，并将经补偿的高频分量数据输出到合成滤波器170。与之相反，如果高频补偿单元150获得的判定结果为不包含冲击音，则高频补偿单元160将高频分量数据直接输出到合成滤波器170，而不对该高频分量数据进行补偿。

下面说明由高频补偿单元160执行的对高频分量数据的补偿。如图3所示，高频补偿单元160将高频分量数据的时间范围调整到与低频分量数据相同的时间范围。图3示出了这样一种情况，其中在时间和频率的平面上同时绘出从分析滤波器130获取的低频分量数据和从高频生成单元140获取的高频分量数据的示例。

下面说明这样一种情况，其中低频分量数据的频谱(低频频谱)仅存在于时间i内，而高频分量数据的频谱在时间i和时间(i+1)内都存在。在图3中，每个区域中的E表示以时间t和频率f指定的、低频分量或高频分量的电功率。

不对低频分量进行补偿，因此电功率表示如下：

E(t_i，f₀)＝E’(t_i，f₀)

其中，E(t_i，f₀)表示补偿之前的低频分量的功率，E’(t_i，f₀)表示补偿之后的低频分量的功率。

E(t_i，f₁)、E(t_i，f₂)、E(t_i+1，f₁)以及E(t_i+1，f₂)表示补偿之前的高频分量的功率，而E’(t_i，f₁)、E’(t_i，f₂)、E’(t_i+1，f₁)以及E’(t_i+1，f₂)表示补偿之后的高频分量的功率。

根据对高频分量的补偿，补偿之前每个高频分量的所有时间范围中的电功率被集缩到与低频分量相同的时间范围(图3的时间范围i)内。将在低频分量的时间范围中不存在的高频分量的电功率变成零。与高频分量相关的补偿由下式表示：

E’(t_i，f₁)＝E(t_i，f₁)+E(t_i+1，f₁)

E’(t_i，f₂)＝E(t_i，f₂)+E(t_i+1，f₂)

E’(t_i+1，f₁)＝0

E’(t_i+1，f₂)＝0

尽管在第一实施方式中，补偿之前的时间范围的数量为2，即，时间i和时间(i+1)，但本发明不限于此。即使时间范围大于2，高频分量的电功率也同样被集缩到低频分量的时间范围。用于补偿高频分量的电功率的方法不限于上述方法。例如，通过对每个时间范围进行加权可以补偿电功率。

返回图2，合成滤波器170对从分析滤波器130获取的低频分量数据和从高频补偿单元160获取的高频分量数据(或者在包含冲击音的情况下为经补偿的高频分量数据)进行合成，并输出合成数据作为HE-AAC输出音频数据。该HE-AAC输出音频数据是解码HE-AAC数据的结果。

下面说明由解码器100执行的处理过程。如图4所示，在解码器100中，数据分离单元110获取HE-AAC数据(步骤S101)，并将获得的HE-AAC数据分离成AAC数据和SBR数据(步骤S102)。

AAC解码单元120然后对AAC数据进行解码，并生成AAC输出音频数据(步骤103)，分析滤波器130根据AAC输出音频数据生成低频分量数据(步骤S104)。

高频生成单元140根据SBR数据和低频分量数据生成高频分量数据(步骤S105)。瞬态判定电路150基于AAC输出音频数据来判断是否包含冲击音(步骤S106)。

如果瞬态判定单元150判定包含冲击音(步骤S107处为“是”)，则高频补偿单元160基于低频分量数据的时间范围来补偿高频分量数据(步骤108)。

合成滤波器170然后合成低频分量数据和高频分量数据、生成HE-AAC输出音频数据(S109)，并输出HE-AAC输出音频数据(S110)。与之相反，如果瞬态判定单元150判定不包含冲击音(步骤S107处为“否”)，则处理控制直接进行到步骤S109。

这样，当瞬态判定单元150检测到冲击音时，高频补偿单元160补偿高频分量数据，从而即使在高频分量没有被适当地编码的情况下，也可以通过补偿HE-AAC数据的高频分量来适当地解码HE-AAC数据。

如上所述，即使HE-AAC数据的高频分量没有被适当地编码，解码器100也可以补偿HE-AAC数据的高频分量，并可以提高HE-AAC输出音频数据的音质。

解码器100可以补偿编码器的没有适当地对HE-AAC数据的高频分量编码的缺点，从而解码器100无需应对编码器中的这种问题，由此减小了设计这种编码器所需的成本。

尽管当高频补偿单元160补偿高频分量数据时，解码器100将高频分量数据的时间范围校正到低频分量数据的时间范围，但本发明不限于此。例如，可以将高频分量数据的时间范围改变为，使得高频分量数据的时间范围与低频分量数据的时间范围之差等于或小于一阈值，然后可以将对应于补偿之前的时间范围的高频分量数据集缩以适合补偿之后的时间范围。

[第二实施方式]

下面说明根据本发明第二实施方式的解码器200的概要和特性。解码器200基于HE-AAC数据中包含的窗口数据来判断是否包含冲击音；如果判定包含冲击音，则根据低频分量的时间范围来补偿高频分量。

当编码器(未示出，其对音频信号进行编码)通过AAC方法对音频信号的低频分量进行编码时，窗口数据指示了该音频信号是否包含冲击音的判定结果。如果窗口数据是LONG(长)，则音频信号中不包含冲击音，这意味着AAC数据的时间分辨率(时间范围)宽。与之相反，如果窗口数据是SHORT(短)，则音频信号中包含冲击音，这意味着AAC数据的时间分辨率(时间范围)窄。

这样，减少了用于检测冲击音所需的对解码器200的处理负荷，使得解码器200可以有效地补偿高频分量。

下面说明解码器200的配置。如图5所示，解码器200包括数据分离单元210、AAC解码单元220、分析滤波器230、高频生成单元240、瞬态判定单元250、高频补偿单元260以及合成滤波器270。

当数据分离单元210获得HE-AAC数据时，数据分离单元210将获得的HE-AAC数据分离成AAC数据和SBR数据、将该AAC数据输出到AAC解码单元220、并将SBR数据输出到高频生成单元240。

AAC解码单元220对AAC数据进行解码，并将经解码的AAC数据作为AAC输出音频数据输出到分析滤波器230，并AAC数据中包含的窗口数据输出到瞬态判定单元250。

分析滤波器230基于从AAC解码单元220获取的AAC输出音频数据来计算与音频信号的低频分量相关的时间和频率特性，并将计算结果输出到合成滤波器270和高频生成单元240。下文中，将从分析滤波器230输出的计算结果称作低频分量数据。

高频生成单元240基于从数据分离单元210获取的SBR数据和从分析滤波器230获取的低频分量数据，生成音频信号的高频分量。高频生成单元240然后将生成的高频分量的数据作为音频信号的高频分量数据输出到高频补偿单元260。

瞬态判定单元250从AAC解码单元220获取窗口数据，判断HE-AAC数据是否包含冲击音，并将判定结果输出到高频补偿单元260。具体地说，如果窗口数据是LONG，则瞬态判定单元250判定不包含冲击音；如果窗口数据是SHORT，则判定包含冲击音。

高频补偿单元260从瞬态判定单元250获取判定结果，并基于获取的判定结果来补偿高频分量数据。如果高频补偿单元260获取的判定结果为包含冲击音，则高频补偿单元260对高频分量数据进行补偿，并将经补偿的高频分量数据输出到合成滤波器270。与之相反，如果高频补偿单元260获取的判定结果为不包含冲击音，则高频补偿单元260将高频分量数据直接输出到合成滤波器270，而不对高频分量数据进行补偿。

合成滤波器270对从分析滤波器230获取的低频分量数据和从高频补偿单元260获取的高频分量数据(或者，在包含冲击音的情况下为经补偿的高频分量数据)进行合成，并输出合成数据作为HE-AAC输出音频数据。该HE-AAC输出音频数据是解码HE-AAC数据的结果。

下面说明由解码器200执行的处理过程。如图6所示，在解码器200中，数据分离单元210获取HE-AAC数据(步骤S201)，并将获得的HE-AAC数据分离成AAC数据和SBR数据(步骤S202)。

AAC解码单元220然后对AAC数据进行解码，并生成AAC输出音频数据(步骤203)，分析滤波器230根据AAC输出音频数据生成低频分量数据(步骤S204)。

高频生成单元240根据SBR数据和低频分量数据生成高频分量数据(步骤S205)。瞬态判定单元250基于窗口数据判断是否包含冲击音(步骤S206)。

如果瞬态判定单元250判定包含冲击音(当窗口数据为SHORT)(步骤S207处为“是”)，则高频补偿单元260基于低频分量数据的时间范围来补偿高频分量数据(步骤S208)。

合成滤波器270然后合成低频分量数据和高频分量数据，生成HE-AAC输出音频数据(步骤S209)，并输出HE-AAC输出音频数据(步骤S210)。与之相反，如果瞬态判定单元250判定不包含冲击音(当窗口数据为LONG)(步骤S207处为“否”)，则处理控制直接进行到步骤S209。

这样，瞬态判定单元250基于窗口数据判断是否包含冲击音，使得可以有效地执行对冲击音的检测。

如上所述，即使HE-AAC数据的高频分量没有被适当地编码，解码器200也可以补偿HE-AAC数据的高频分量，并提高HE-AAC输出音频数据的音质。

[第三实施方式]

下面说明根据本发明第三实施方式的解码器300的概要和特性。解码器300基于HE-AAC数据中包含的分组(grouping)数据来检测发生冲击音的时间范围。解码器300基于从分组数据检测的时间范围来校正高频分量的时间范围，并根据校正之后的时间范围来补偿在校正之前的时间范围内被平坦化的、高频分量的功率。下文中，将从分组数据检测的时间范围称作检测时间范围。

分组数据是这样的数据，其中音频信号的单个帧被分成一定数量的样本(例如，1024个样本)，且被包含在HE-AAC数据中。例如，单个帧包括音频信号的一个帧的时间和功率之间的关系。

这样，解码器300可以更精确地补偿高频分量，且可以提高经解码的HE-AAC输出音频数据的音质。

下面说明解码器300的配置。如图7所示，解码器300包括数据分离单元310、AAC解码单元320、分析滤波器330、高频生成单元340、瞬态判定单元350、高频补偿单元360以及合成滤波器370。

当数据分离单元310获得HE-AAC数据时，数据分离单元310将获得的HE-AAC数据分离成AAC数据和SBR数据、将该AAC数据输出到AAC解码单元320、并将SBR数据输出到高频生成单元340。

AAC解码单元320对AAC数据进行解码，将经解码的AAC数据作为AAC输出音频数据输出到分析滤波器330，并将包含在AAC数据中的窗口数据和分组数据输出到瞬态判定单元350。这里，窗口数据类似于在第二实施方式中说明的窗口数据，因此省略对其进行说明。

分析滤波器330基于从AAC解码单元320获取的AAC输出音频数据来计算与音频信号的低频分量相关的时间和频率特性，并将计算结果输出到合成滤波器370和高频生成单元340。下文中，将从分析滤波器330输出的计算结果称作低频分量数据。

高频生成单元340基于从数据分离单元310获取的SBR数据和从分析滤波器330获取的低频分量数据，生成音频信号的高频分量。高频生成单元340然后将生成的高频分量的数据作为音频信号的高频分量数据输出到高频补偿单元360。

瞬态判定单元350从AAC解码单元320获取窗口数据，判断HE-AAC数据是否包含冲击音，并将判定结果输出到高频补偿单元360。具体来说，如果窗口数据为LONG，则瞬态判定单元350判定不包含冲击音；如果窗口数据为SHORT，则判定包含冲击音。

如果窗口数据为SHORT，则瞬态判定单元350基于分组数据对检测时间范围进行检测，并将该检测时间范围的数据输出到高频补偿单元360。

如图8所示，开始，瞬态判定单元350将由1024个样本组成的分组数据分成子帧#0至#7，其中每个子帧都包括128个样本。瞬态判定单元350然后通过比较相邻的子帧对子帧进行分组。

例如，瞬态判定单元350比较相邻的子帧，并根据相比较的子帧的值(例如，音频信号的电功率)之差等于或大于一阈值的变化点来对子帧进行分组。在图8中，假设子帧#2的值和子帧#3的值之差等于或大于阈值，并且子帧#3的值和子帧#4的值之差等于或大于阈值。因此，子帧被分组，即，子帧#0至#2构成组1，子帧#3构成组2，子帧#4至#7构成组3。

瞬态判定单元350然后检测对应于组2的时间范围(即，图8所示的示例中的128个样本时间范围)作为检测时间范围，并将该检测时间范围的数据输出到高频补偿单元360。

返回图7，高频补偿单元360从瞬态判定单元350获取判定结果，并基于获取的判定结果来补偿高频分量数据。如果高频补偿单元360获取的判定结果为包含冲击音，则高频补偿单元360基于检测时间范围对高频分量数据进行补偿，并将经补偿的高频分量数据输出到合成滤波器370。与之相反，如果高频补偿单元360获取的判定结果为不包含冲击音，则高频补偿单元360将高频分量数据直接输出到合成滤波器370，而不对高频分量数据进行补偿。

高频补偿单元360基于检测时间范围对高频分量数据进行补偿的方法与高频补偿单元160基于低频分量数据的时间范围对高频分量数据进行补偿的方法类似(以低频分量数据的时间范围取代检测时间范围)，因此省略对其进行说明。

合成滤波器370将从分析滤波器330获取的低频分量数据和从高频补偿单元360获取的高频分量数据(或者在包含冲击音的情况下为经补偿的高频分量数据)进行合成，并且输出合成数据作为HE-AAC输出音频数据。该HE-AAC输出音频数据是解码HE-AAC数据的结果。

下面说明由解码器300执行的处理过程。如图9所示，在解码器300中，数据分离单元310获取HE-AAC数据(步骤S301)，并将获得的HE-AAC数据分离成AAC数据和SBR数据(步骤S302)。

AAC解码单元320然后对AAC数据进行解码，并生成AAC输出音频数据(步骤S303)，分析滤波器330根据AAC输出音频数据生成低频分量数据(步骤S304)。

高频生成单元340根据SBR数据和低频分量数据生成高频分量数据(步骤S305)。瞬态判定电路350基于AAC输出音频数据来判断是否包含冲击音(步骤S306)。

如果瞬态判定单元350判定窗口数据为SHORT(步骤S307处为“是”)，则高频补偿单元360基于分组数据对检测时间范围进行检测(S308)，并基于该检测时间范围来补偿高频分量数据(步骤S309)。

合成滤波器370然后合成低频分量数据和高频分量数据、生成HE-AAC输出音频数据(步骤S310)，并输出HE-AAC输出音频数据(步骤S311)。与之相反，如果瞬态判定单元350判定窗口数据为LONG(步骤S307处为“否”)，则处理控制进行到步骤S3 10。

这样，瞬态判定单元350基于分组数据来检测包含冲击音的精确时间范围，从而可以有效地提高HE-AAC输出音频数据的音质。

如上所述，解码器300可以更精确地补偿高频分量，并可以提高经解码的HE-AAC输出音频数据的音质。

[第四实施方式]

下面说明根据本发明第四实施方式的解码器400的概要和特性。解码器400中存储有一定期间中的改进离散余弦变换(MDCT)系数，并将存储的MDCT系数与包含在HE-AAC数据中的另一MDCT系数进行比较。如果比较的MDCT系数之间的差异等于或大于一阈值，则判定HE-AAC数据包含冲击音，且解码器400根据低频分量的时间范围来补偿高频分量。

MDCT系数是间断地抽取音频信号的低频分量的功率(电功率)和频率之间的关系的值。解码器400中预存储有一定期间中的MDCT系数的平均值。下文中，将预存储在解码器中的MDCT系数称作参考MDCT系数，并将包含在HE-AAC数据中的MDCT系数称作对比MDCT系数。

这样，解码器400基于包含在HE-AAC数据中的对比MDCT系数和参考MDCT系数来判断HE-AAC数据是否包含冲击音(编码之前的音频信号是否包含冲击音)，从而减少检测冲击音所需的处理负荷，并且可以有效地补偿高频分量。

下面说明解码器400的配置。如图10所示，解码器400包括数据分离单元410、AAC解码单元420、分析滤波器430、高频生成单元440、瞬态判定单元450、高频补偿单元460以及合成滤波器470。

当数据分离单元410获得HE-AAC数据时，数据分离单元410将获得的HE-AAC数据分离成AAC数据和SBR数据、将该AAC数据输出到AAC解码单元420、并将SBR数据输出到高频生成电路440。

AAC解码单元420对AAC数据进行解码，将经解码的AAC数据作为AAC输出音频数据输出到分析滤波器430，并将包含在AAC数据中的对比MDCT系数输出到瞬态判定单元450。

分析滤波器430基于从AAC解码单元420获取的AAC输出音频数据来计算与音频信号的低频分量相关的时间和频率特性，并将计算结果输出到合成滤波器470和高频生成单元440。下文中，将从分析滤波器430输出的计算结果称作低频分量数据。

高频生成单元440基于从数据分离单元410获取的SBR数据和从分析滤波器430获取的低频分量数据，生成音频信号的高频分量。高频生成单元440然后将生成的高频分量的数据作为音频信号的高频分量数据输出到高频补偿单元460。

瞬态判定单元450从AAC解码单元420获取MDCT系数，判断HE-AAC数据是否包含冲击音，并将判定结果输出到高频补偿单元460。具体而言，瞬态判定单元450将对比MDCT系数和存储在MDCT存储单元455中的参考MDCT系数进行比较，如果从比较获得的差异等于或大于一阈值，则瞬态判定单元450判定包含冲击音。与之相反，如果对比MDCT系数与参考MDCT系数之差小于该阈值，则瞬态判定单元450判定不包含冲击音。MDCT存储单元455中存储有所述参考MDCT系数。

合成滤波器470对从分析滤波器430获取的低频分量数据和从高频补偿单元460获取的高频分量数据(或者在包含冲击音的情况下为经补偿的高频分量数据)进行合成，并输出合成数据作为HE-AAC输出音频数据。该HE-AAC输出音频数据是解码HE-AAC数据的结果。

下面说明由解码器400执行的处理过程。如图11所示，在解码器400中，数据分离单元410获取HE-AAC数据(步骤S401)，并将获得的HE-AAC数据分离成AAC数据和SBR数据(步骤S402)。

AAC解码单元420然后对AAC数据进行解码，并生成AAC输出音频数据(步骤S403)，分析滤波器430根据AAC输出音频数据生成低频分量数据(步骤S404)。

高频生成单元440根据SBR数据和低频分量数据生成高频分量数据(步骤S405)。瞬态判定单元450获取对比MDCT系数(步骤S406)，并通过比较对比MDCT系数和参考MDCT系数来判断是否包含冲击音(步骤S407)。

如果瞬态判定单元450判定包含冲击音(步骤S408处为“是”)，则高频补偿单元460基于低频分量数据的时间范围来补偿高频分量数据(步骤S409)。

合成滤波器470然后合成低频分量数据和高频分量数据、生成HE-AAC输出音频数据(步骤S410)，并输出HE-AAC输出音频数据(步骤S411)。与之相反，如果瞬态判定单元450判定不包含冲击音(步骤S408处为“否”)，则处理控制直接进行到步骤S410。

这样，瞬态判定单元450基于对比MDCT系数和参考MDCT系数来判断是否包含冲击音，从而可以有效地执行对冲击音的检测。

如上所述，即使HE-AAC数据的高频分量没有被适当地编码，解码器400也可以补偿HE-AAC数据的高频分量，并可以有效地提高HE-AAC输出音频数据的音质。

如果对比MDCT系数和参考MDCT系数之间的比较结果小于所述阈值，则瞬态判定单元450可以基于从AAC解码单元420获取的对比MDCT系数来更新存储在MDCT存储单元455中的参考MDCT系数。可以使用任何更新方法，例如，对比MDCT系数和参考MDCT系数的平均值可以是新的参考MDCT系数。

这样，通过更新存储在MDCT存储单元455中的参考MDCT系数，可以更精确地执行对冲击音的检测。

[第五实施方式]

下面说明根据本发明第五实施方式的解码器500的概要和特性。解码器500基于包含在HE-AAC数据中的低频分量和高频分量的数据来判断HE-AAC数据是否包含冲击音，如果判定包含冲击音，则解码器500根据低频分量的时间范围来补偿高频分量。

这样，解码器500可以更精确地检测冲击音。

下面说明解码器500的配置。如图12所示，解码器500包括数据分离单元510、AAC解码单元520、分析滤波器530、高频生成单元540、瞬态判定单元550、高频分量数据存储单元555、高频补偿单元560以及合成滤波器570。

当数据分离单元510获取HE-AAC数据时，数据分离单元510将获得的HE-AAC数据分离成AAC数据和SBR数据、将该AAC数据输出到AAC解码单元520、并将SBR数据输出到高频生成电路540。

AAC解码单元520对AAC数据进行，并将经解码的AAC数据作为AAC输出音频数据输出到分析滤波器530和瞬态判定单元550。分析滤波器530基于从AAC解码单元520获取的AAC输出音频数据来计算与音频信号的低频分量相关的时间和频率特性，并将计算结果输出到合成滤波器570和高频生成单元540。下文中，将从分析滤波器530输出的计算结果称作低频分量数据。

高频生成单元540基于从数据分离单元510获取的SBR数据和从分析滤波器530获取的低频分量数据，生成音频信号的高频分量。高频生成单元540然后将生成的高频分量的数据作为音频信号的高频分量数据输出到高频补偿单元560。

瞬态判定单元550从AAC解码单元520获取AAC输出音频数据且从高频生成单元540获取高频分量数据，判断HE-AAC数据是否包含冲击音，并将判定结果输出到高频补偿单元560。

具体地说，如果瞬态判定单元550基于AAC输出音频数据判定包含冲击音，另外基于高频分量数据也判定包含冲击音，则瞬态判定单元550判定包含冲击音。与之相反，如果瞬态判定单元550基于AAC输出音频数据或高频分量数据判定不包含冲击音，则瞬态判定单元550判定不包含冲击音。基于AAC输出音频数据判断是否包含冲击音的方法与第一到第四实施方式中描述的方法类似，这里省略对其进行描述。

下面说明瞬态判定单元550基于高频分量数据判断是否包含冲击音的方法。瞬态判定单元550获取高频分量数据存储单元555中存储的过去一定期间中的高频分量数据的平均值(下文中称作“参考高频分量数据”)，并将获得的参考高频分量数据和从高频生成单元540输出的高频分量数据进行比较。如果作为比较结果的差异等于或大于一阈值，则瞬态判定单元550判定包含冲击音。高频分量数据存储单元555中存储有参考高频分量数据。

如果参考高频分量数据与从高频生成单元540输出的高频分量数据之差小于所述阈值，则瞬态判定单元550基于从高频生成单元540获取的高频分量数据来更新存储在高频分量数据存储单元555中的参考高频分量数据。例如，瞬态判定单元550取参考高频分量数据和从高频生成单元540获取的高频分量数据的平均值作为新的参考高频分量数据。

高频补偿单元560从瞬态判定单元550获取判定结果，并基于获得的判定结果来补偿高频分量数据。如果高频补偿单元560获得的判定结果为包含冲击音，则高频补偿单元560对高频分量数据进行补偿，并将经补偿的高频分量数据输出到合成滤波器570。与之相反，如果高频补偿单元560获得的判定结果为不包含冲击音，则高频补偿单元560将高频分量数据直接输出到合成滤波器570，而不对高频分量数据进行补偿。

合成滤波器570对从分析滤波器530获取的低频分量数据和从高频补偿单元560获取的高频分量数据(或者在包含冲击音的情况下为经补偿的高频分量数据)进行合成，并输出合成数据作为HE-AAC输出音频数据。该HE-AAC输出音频数据是解码HE-AAC数据的结果。

下面说明由解码器500执行的处理过程。如图13所示，在解码器500中，数据分离单元510获取HE-AAC数据(步骤S501)，并将获得的HE-AAC数据分离成AAC数据和SBR数据(步骤S502)。

AAC解码单元520然后对AAC数据进行解码，并生成AAC输出音频数据(步骤S503)，分析滤波器530根据AAC输出音频数据生成低频分量数据(步骤S504)。

高频生成单元540根据SBR数据和低频分量数据生成高频分量数据(步骤S505)。瞬态判定电路550基于AAC输出音频数据来判断是否包含冲击音(步骤S506)。

如果瞬态判定单元550基于AAC输出音频数据判定包含冲击音(步骤S507处为“是”)，则瞬态判定单元550基于高频分量数据来判断是否包含冲击音(步骤S508)。如果判定包含冲击音(步骤S509处为“是”)，则高频补偿单元560基于低频分量数据的时间范围来对高频分量数据进行补偿(步骤S510)。

合成滤波器570然后合成低频分量数据和高频分量数据、生成HE-AAC输出音频数据(步骤S511)，并输出HE-AAC输出音频数据(步骤S512)。与之相反，如果基于AAC输出音频数据判定不包含冲击音(步骤S507处为“否”)，则处理控制直接进行到步骤S511。如果基于高频分量数据判定不包含冲击音(步骤S509处为“否”)，则瞬态判定单元550更新参考高频分量数据(步骤S513)，然后处理控制进行到步骤S511。

这样，因为瞬态判定单元550基于AAC输出音频数据和高频分量数据来判断是否包含冲击音，所以瞬态判定单元550可以更精确地判断是否包含冲击音。

如上所述，解码器500可以精确地检测冲击音，补偿HE-AAC数据的高频分量，并可以有效地提高HE-AAC输出音频数据的音质。

除了上述实施方式，还可以按照在权利要求中所述的技术概念范围内的各种实施方式来实施本发明。

在实施方式中说明的处理之中，描述为要自动执行的处理的全部或部分也可以手动地执行，并且描述为要手动执行的处理的全部或部分也可以按照已知的方式自动地执行。

除非特别指出，否则可以在需要时改变说明书和附图中示出的处理过程、控制过程、具体名称、包括各种数据和参数的信息。

附图中所示的每个装置的各构成元件都是功能性和概念性的，不必须物理地配置成如图所示。换句话说，每个装置的分离和整合的实际形式并不限于附图中所示的形式。可以通过以依赖于各种负荷或使用条件的任意尺度单位功能地或物理地进行分离或整合来配置装置的全部或部分。

根据本发明的一方面，可以适当地解码音频信号，且可以提高高频分量的音。

根据本发明的另一方面，可以适当地补偿高频分量。

根据本发明的又一方面，可以在减小对解码装置的负荷的同时适当地解码音频信号。

根据本发明的另一方面，可以更有效地检测冲击音。

根据本发明的另一方面，可以在减小对解码装置的负荷的同时更有效地检测冲击音。

根据本发明的另一方面，可以防止对冲击音的错误检测，并且可以更精确地检测冲击音。

尽管为了完整和清晰的公开，已经针对具体实施方式描述了本发明，但是所附权利要求并不由此受限，而应被解释为包含本领域技术人员可以想得到的、完全落在此处阐述的基本教导内的所有变型和另选构造。

Claims

1.一种解码装置，该解码装置将第一编码数据和第二编码数据解码成音频信号，所述第一编码数据根据所述音频信号的低频分量被编码到第一时间范围，所述第二编码数据在根据所述低频分量生成所述音频信号的高频分量时使用并被编码到第二时间范围，所述解码装置包括：

高频分量补偿单元，其基于所述第一时间范围来补偿根据所述第二编码数据生成的高频分量；和

解码单元，其通过对由所述高频分量补偿单元补偿的所述高频分量和根据所述第一解码数据解码出的所述低频分量进行合成，来解码出所述音频信号。

2.根据权利要求1所述的解码装置，其中，所述高频分量补偿单元将对应于所述第二时间范围的高频分量集缩到所述第一时间范围内。

3.根据权利要求1所述的解码装置，其中，所述高频分量补偿单元将所述第二时间范围改变为使得所述第一时间范围与所述第二时间范围之差等于或小于一阈值，并将对应于改变之前的第二时间范围的高频分量集缩到改变之后的第二时间范围内。

4.根据权利要求1所述的解码装置，该解码装置还包括冲击音判定单元，该冲击音判定单元判断所述音频信号是否包含冲击音，该冲击音是所述音频信号中的在一定时间范围内变化等于或大于一阈值的分量，其中，如果所述音频信号包含所述冲击音，则所述高频分量补偿单元对所述高频分量进行补偿。

5.根据权利要求4所述的解码装置，其中，所述冲击音判定单元基于对所述第一编码数据的解码结果来判断所述音频信号是否包含冲击音。

6.根据权利要求4所述的解码装置，其中，

所述第一编码数据包括指示所述音频信号中是否包含冲击音的冲击音存在数据，并且

所述冲击音判定单元基于所述冲击音存在数据来判断所述音频信号是否包含冲击音。

7.根据权利要求4所述的解码装置，该解码装置还包括低频分量存储单元，该低频分量存储单元存储一定时期中的低频分量的数据，其中，所述冲击音判定单元基于根据所述第一编码数据解码出的低频分量和存储在所述低频分量存储单元中的低频分量来判断所述音频信号是否包含冲击音。

8.根据权利要求4所述的解码装置，其中，所述冲击音判定单元通过进一步使用高频分量来判断所述音频信号是否包含冲击音。

9.一种解码方法，用于将第一编码数据和第二编码数据解码成音频信号，所述第一编码数据根据所述音频信号的低频分量被编码到第一时间范围，所述第二编码数据在根据所述低频分量生成所述音频信号的高频分量时使用并被编码到第二时间范围，该解码方法包括以下步骤：

高频补偿步骤，基于所述第一时间范围来对根据所述第二编码数据生成的高频分量进行高频补偿；以及

解码步骤，通过对在所述高频补偿步骤中补偿的所述高频分量和根据所述第一解码数据解码出的所述低频分量进行合成，来解码出所述音频信号。

10.根据权利要求9所述的解码方法，其中，所述高频补偿步骤包括将对应于所述第二时间范围的高频分量集缩到所述第一时间范围内。

11.根据权利要求9所述的解码方法，其中，所述高频补偿步骤包括以下步骤：将所述第二时间范围改变为使得所述第一时间范围与所述第二时间范围之差等于或小于一阈值，并将对应于改变之前的第二时间范围的高频分量集缩到改变之后的第二时间范围内。

12.根据权利要求9所述的解码方法，该解码方法还包括冲击音判定步骤，用以判断所述音频信号是否包含冲击音，该冲击音是所述音频信号中的在一定时间范围内变化等于或大于一阈值的分量，其中，如果所述音频信号包含所述冲击音，则所述高频补偿步骤包括对所述高频分量进行补偿。

13.根据权利要求12所述的解码方法，其中，所述冲击音判定步骤包括基于对所述第一编码数据的解码结果来判断所述音频信号是否包含冲击音。

14.根据权利要求12所述的解码方法，其中，

所述冲击音判定步骤包括基于所述冲击音存在数据来判断所述音频信号是否包含冲击音。

15.根据权利要求12所述的解码方法，该解码方法还包括存储步骤，用以存储一定时期中的低频分量的数据，其中，所述冲击音判定步骤包括基于根据所述第一编码数据解码出的低频分量和在所述存储步骤中存储的低频分量来判断所述音频信号是否包含冲击音。

16.根据权利要求12所述的解码方法，其中，所述冲击音判定步骤包括通过进一步使用高频分量来判断所述音频信号是否包含冲击音。