CN101188112B - 解码装置和解码方法 - Google Patents
解码装置和解码方法 Download PDFInfo
- Publication number
- CN101188112B CN101188112B CN200710180961.5A CN200710180961A CN101188112B CN 101188112 B CN101188112 B CN 101188112B CN 200710180961 A CN200710180961 A CN 200710180961A CN 101188112 B CN101188112 B CN 101188112B
- Authority
- CN
- China
- Prior art keywords
- high fdrequency
- fdrequency component
- frequency band
- data
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 64
- 230000005236 sound signal Effects 0.000 claims abstract description 53
- 238000001514 detection method Methods 0.000 claims 2
- 238000004458 analytical method Methods 0.000 description 26
- 239000002131 composite material Substances 0.000 description 22
- 238000010586 diagram Methods 0.000 description 18
- 230000011218 segmentation Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了解码装置和解码方法。该解码装置将从音频信号的低频分量编码的第一编码数据和当根据低频分量产生音频信号的高频分量时使用的且根据特定的带宽编码的第二编码数据解码成音频信号。在该解码装置中,高频分量检测单元将高频分量分成具有与所述特定的带宽相对应的特定区间范围的多个频带,并且检测与各频带相对应的高频分量的值。高频分量补偿单元基于与由高频分量检测单元检测出的各频带相对应的高频分量的值,对高频分量进行补偿。解码单元将从第一编码数据中解码出的低频分量和经高频分量补偿单元补偿的高频分量解码成音频信号。
Description
技术领域
本发明涉及用于解码音频信号的技术。
背景技术
近来,高效先进音频编码(HE-AAC)方法被用于编码声音、声响和音乐。HE-AAC方法为音频压缩方法,其主要例如由运动图像专家组规范2(MPEG-2)、或运动图像专家组规范4(MPEG-4)使用。
根据HE-AAC方法的编码,待编码的音频信号(涉及诸如声音、声响和音乐之类的信号)的低频分量通过先进音频编码(AAC)方法编码,并且音频信号的高频分量通过频带复制(SBR)方法编码。根据SBR方法,通过仅仅编码不能根据音频信号的低频分量预估(estimated)的部分,音频信号的高频分量可以利用比通常状况少的位数来编码。在下文中,由AAC方法编码的数据被称作AAC数据,而通过SBR方法编码的数据被称作SBR数据。
根据HE-AAC方法的编码,频带越高,分出的带宽越宽。音频信号的功率在分出的频带中均分(even out),随后对音频信号编码。如图15中所示,依据HE-AAC方法的编码对音频信号进行编码,频率(即待由SBR方法进行编码的高频分量的频率)越高,分出的带宽越宽。
下面解释用于解码由HE-AAC方法编码的数据(HE-AAC数据)的解码器的实施例。如图16所示,解码器10包括数据分离单元11、AAC解码单元12、分析滤波器13、高频生成单元14和合成滤波器15。
当数据分离单元11获得HE-AAC数据时,数据分离单元11将HE-AAC数据分成AAC数据和SBR数据,并且将AAC数据输出至AAC解码单元12,以及将SBR数据输出至高频生成单元14。
AAC解码单元12解码AAC数据,并且将经解码的AAC数据输出至分析滤波器13,作为AAC解码音频数据。分析滤波器13基于从AAC解码单元12获得的AAC解码音频数据,计算涉及音频信号的低频分量的时间和频率特性,并且将计算结果输出至合成滤波器15和高频生成单元14。在下文中,从分析滤波器13输出的计算结果被称作低频分量数据。
高频生成单元14基于从数据分离单元11获得的SBR数据和从分析滤波器13获得的低频分量数据,生成音频信号的高频分量。随后高频生成单元14将所生成的高频分量的数据作为高频分量数据输出至合成滤波器15。
合成滤波器15合成从分析滤波器13获得的低频分量数据和从高频生成单元14获得的高频分量数据,并输出所合成的数据作为HE-AAC输出音频数据。
下面解释解码器10执行的处理。如在图17的左部分中所示,分析滤波器13生成低频分量数据。如在图17的右部分中示出的,高频生成单元14根据低频分量数据生成高频分量数据,并且合成滤波器15合成该低频分量数据和该高频分量数据以输出HE-AAC输出音频数据。由此,解码器10将HE-AAC数据方法编码的音频信号解码成HE-AAC输出音频数据。
日本专利申请特开第2002-73088号公开了一种即使在信号的高频部分被急剧地衰减的情况下,也能精确地恢复信号的技术。根据该技术,频谱被分成多个频带;彼此之间具有强相关的频带结合成用于删除和插入的对;除去用于删除的频带并且将其余的频带转换至低频侧;从而保存了高频侧的信号;这样在音频信号被压缩时保持了较高的声响质量。
然而,上述的常规技术具有以下问题:即由于SBR方法编码的音频信号的频率分辨率较低,因而导致SBR方法编码的音频信号的高频分量不能被适当地解码。
在常规的SBR方法中,待编码的频带的带宽较宽(SBR方法的频率分辨率较低)。如在图18中所示,如果诸如辅音之类的一部分声响(其中在高频分量侧的频带中的功率急剧下降)以较宽的带宽编码,则频带中的功率被均分,这样功率在低频侧和高频侧之间均分,从而频带中的高频侧被强调。
如图18所示,音频信号在频带中的高频侧被强调的状态下被编码。如果基于这种编码的音频信号解码该音频信号,则编码音频信号被解码为频带中的高频侧被强调,这样音频信号不能被适当地解码。
换言之,即使音频信号的高频分量不能被适当地编码,也强烈要求解码后的音频信号是通过补偿高频分量而被精确地解码出的。
发明内容
本发明的目的在于至少部分地解决传统技术中的问题。
根据本发明的一个方面,提供了一种解码装置,其将从音频信号的低频分量编码出的第一编码数据和当根据低频分量产生音频信号的高频分量时使用的且根据特定的带宽编码的第二编码数据解码成所述音频信号,该解码装置包括:高频分量检测单元,其与所述特定的带宽相对应地将所述高频分量分成具有特定区间范围的多个频带,并且检测相应于各所述多个频带的高频分量的值;高频分量补偿单元,其基于与由所述高频分量检测单元检测出的各所述多个频带相对应的高频分量的值,补偿所述高频分量;以及解码单元,其将从所述第一编码数据中解码出的低频分量和经所述高频分量补偿单元补偿的高频分量解码成音频信号。
根据本发明的另一个方面,提供了一种解码方法,其用于将从音频信号的低频分量编码的第一编码数据和当根据低频分量产生音频信号的高频分量时使用的且根据特定的带宽编码的第二编码数据解码成所述音频信号,所述解码方法包括:高频分量检测步骤,其包括与所述特定的带宽相对应地将所述高频分量分成具有特定区间范围的多个频带,并且检测相应于各所述多个频带的高频分量值;补偿步骤,基于相应于由所述高频分量检测步骤检测出的各所述多个频带的高频分量值,补偿所述高频分量;以及将从所述第一编码数据中解码出的低频分量和经所述补偿步骤补偿的高频分量解码成音频信号。
本发明的上述和其它目的、特征、优点和技术,以及工业重要性将通过结合附图阅读以下本发明目前优选的实施方式的详细说明而得到更好的理解。
附图说明
图1为用于解释根据本发明的第一实施方式的解码器的示意图;
图2为图1中示出的解码器的功能方框图;
图3为用于解释图2中示出的高频分量分析单元所执行的处理的示意图;
图4为用于解释图2中示出的补偿单元对补偿对象频带进行补偿的处理的示意图;
图5为图2中示出的解码器执行的处理过程的流程图;
图6为根据本发明的第二实施方式的解码器的功能方框图;
图7为用于解释高频分量数据的示意图;
图8为用于解释图6中示出的补偿频带确定单元所执行的处理的示意图;
图9为用于解释图6中示出的高频分量分析单元所执行的处理的示意图;
图10为用于解释图6中示出的补偿单元所执行的处理的示意图;
图11为图6中示出的解码器执行的处理过程的流程图;
图12为根据本发明的第三实施方式的解码器的功能方框图;
图13为用于解释图12中示出的补偿频带确定单元所执行的处理的示意图;
图14为图12中示出的解码器执行的处理过程的流程图;
图15为用于解释当根据高效先进音频编码方法执行编码时,带宽和频率之间的关系的示意图;
图16为根据传统技术的解码器的功能方框图;
图17为用于解释图16中示出的解码器所执行的处理的示意图;以及
图18为用于解释传统技术所引起的问题的示意图。
具体实施方式
在下文中将参照附图详细解释本发明的示例性实施方式。
下文中解释根据本发明的第一实施方式的解码器100的概述和特征。在图1中示出的实施例中,在功率频率平面上呈现高频分量。解码器100根据频带复制(SBR)方法编码的频率分辨率划分出高频分量的频带,并且基于低频侧的相邻频带的功率值和高频侧的相邻频带的功率值计算从低频侧到高频侧的近似表达式。应被补偿的频带被分成多个频带(在图1中示出的实施例中为三个频带),各频带的功率被调节为与近似表达式相对应。
因此,解码器100能够补偿被均分的且并非被最优编码的音频信号,从而改善了音频信号的声响质量。
在下文中对解码器100的构造进行解释。如图2中所示,解码器100包括:数据分离单元110、AAC解码单元120、正交镜像滤波器(QMF)分析滤波器130、高频生成单元140、高频分量分析单元150、补偿频带确定单元160、补偿单元170、以及QMF合成滤波器180。
当数据分离单元110获得根据HE-AAC方法编码的数据(下文中称作“HE-AAC数据”)时,数据分离单元110将该HE-AAC数据分成先进音频编码(AAC)数据和SBR数据;将AAC数据输出至AAC解码单元120;并且将SBR数据输出至高频生成单元140。AAC数据为通过AAC方法根据音频信号编码出的数据。SBR数据为通过SBR方法根据音频信号编码出的数据。
AAC解码单元120解码AAC数据,并且将经解码的AAC数据作为AAC解码音频数据输出至QMF分析滤波器130。QMF分析滤波器130将时间信号的AAC解码音频数据转换成频率信号。QMF分析滤波器130将AAC解码音频数据转换成包括低频分量的频率、时间和功率之间的关系的低频分量数据,并且将转换出的低频分量数据输出至高频生成单元140和QMF合成滤波器180。
高频生成单元140基于从数据分离单元110获得的SBR数据和从QMF合成滤波器130获得的低频分量数据生成音频信号的高频分量。随后,高频生成单元140将所生成的高频分量数据作为音频信号的高频分量数据输出至高频分量分析单元150和补偿单元170。
当高频分量分析单元150获得高频分量数据时,高频分量分析单元150计算在所获得的高频分量数据中观察的沿频率方向的功率值的变化率(变化的比率)。如图3中所示,高频分量分析单元150根据SBR方法的频率分辨率(或低频分量),将高频分量数据分成具有特定区间范围的多个频带,并且基于与分出的频带对应的功率值,计算变化率。图3示出了高频分量数据被分成三个频带的实施例,以便于解释。
应被补偿的功率和低频侧的相邻频带的功率之间的差额ΔE[b]可以通过以下表达式计算:
ΔE[b]=E[b-1]-E[b]
其中,E[b]代表与作为补偿对象候选的频带(第b个频带)相对应的功率,并且E[b-1]代表与低频侧的相邻频带(第b-1个频带)相对应的功率。变化率α[b]可以通过以下表达式计算:
α[b]=ΔE[b]/bw[b]
其中,bw[b]代表作为补偿对象候选的频带的带宽。
在图3中,变化率α[b]根据作为补偿对象候选的频带的功率E[b]和低频侧的相邻频带的功率E[b-1]之间的差额计算。然而,本发明并不限于此。例如,变化率α1[b]可以根据应被补偿的频带的功率和高频侧的相邻频带的功率E[b+1]之间的差额计算。在这种情况下,差额ΔE1[b]可以通过以下表达式计算:
ΔE1[b]=E[b]-E[b+1]
在这种情况下,变化率α1[b]可以通过以下表达式计算:
α1[b]=ΔE1[b]/bw[b]
另选地,变化率α2[b]可以根据低频侧的相邻频带的功率E[b-1]和高频侧的相邻频带的功率E[b+1]之间的差额计算。在这种情况下,差额ΔE2[b]可以通过以下表达式计算:
ΔE2[b]=E[b-1]-E[b+1]
在这种情况下,变化率α2[b]可以通过以下表达式计算:
α2[b]=ΔE2[b]/bw[b]
高频分量分析单元150将计算出的变化率α[b]的数据(或变化率α1[b]或变化率α2[b])(下文中称作“变化率数据”)输出至补偿频带确定单元160和补偿单元170。
当补偿频带确定单元160从高频分量分析单元150获得变化率数据时,补偿频带确定单元160基于获得的变化率数据确定应被补偿的频带(下文中称作“补偿对象频带”)。具体而言,补偿频带确定单元160将包括在变化率数据中的变化率α[b]与阈值A进行比较。如果变化率α[b]高于阈值A,则与变化率α[b]对应的频带被确定为补偿对象频带,并且确定结果被输出至补偿单元170。在这种情况下,分出的频带中的第b个频带将成为补偿对象频带。
相反,如果变化率α[b]等于或低于阈值A,则补偿频带确定单元160确定与变化率α[b]相对应的频带为不应被补偿的频带,并且将确定结果输出至补偿单元170。在这种情况下,分出的频带中的第b个频带将成为不应被补偿的频带。
补偿单元170基于从高频分量分析单元150获得的变化率数据和从补偿频带确定单元160获得的确定结果,对高频分量数据进行补偿。补偿单元170基于确定结果,使得高频分量数据中的不应被补偿的频带不发生变化,并且基于变化率数据补偿待补偿的频带。在下文中解释由补偿单元170执行的对补偿对象频带的补偿。
如图4中所示,补偿单元170将补偿对象频带细分成各自具有一个或更多个频谱的多个频带。细分单位可以为一个或更多个频谱,也可以是不均匀的。细分出的频带的能量E0通过以下表达式表达:
E0=E[b]/bw[b]
其中,bw[b]代表补偿对象频带的带宽,并且E[b]表示补偿对象频带的能量(功率)。
用于对补偿对象频带进行补偿的近似表达式E′[f]为:
E′[f]=α[b]×Δbw+E0
其中,α [b]表示包括在变化率数据中的变化率。在该等式中,Δbw与补偿对象频带中的频率变化相对应。补偿单元170根据近似表达式E′[f],对补偿对象频带中的多个细分出的频带中的每一个的功率进行补偿。
例如,当补偿功率与补偿对象频带的中部相对应,即Δbw=bw[b]/2时,补偿单元170将Δbw=bw[b]/2代入近似表达式E′[f]中,从而获得通过代入而计算出的功率,以作为补偿后的功率。类似地,也根据通过将与频带相对应的频率代入近似表达式E′[f]中而计算出的功率值对各其它细分出的频带进行补偿。补偿单元170将经补偿的高频分量数据输出至QMF合成滤波器180。
QMF合成滤波器180合成从QMF分析滤波器130获得的低频分量数据和从补偿单元170获得的经补偿的高频分量数据,并且输出合成的数据,作为HE-AAC输出音频数据。HE-AAC输出音频数据为对HE-AAC数据进行解码的结果。
在下文中解释解码器100执行的处理过程。如图5中所示,在解码器100中,数据分离单元110获得HE-AAC数据(步骤S101),并且将HE-AAC数据分成AAC数据和SBR数据(步骤S102)。
随后,AAC解码单元120根据AAC数据生成AAC解码音频数据(步骤S103),并且QMF分析滤波器130将AAC解码音频数据从时间信号转换成频率信号(步骤S104)。
高频生成单元140根据SBR数据和低频分量数据生成高频分量数据(步骤S105)。随后高频分量分析单元150计算该高频分量数据沿频率方向的变化率(步骤S106),并且补偿频带确定单元160确定补偿对象频带(步骤S107)。
随后,补偿单元170基于从高频分量分析单元150获得的变化率数据和从补偿频带确定单元160获得的确定结果,补偿高频分量数据(步骤S108)。QMF合成滤波器180合成低频分量数据和高频分量数据,以生成HE-AAC输出音频数据(步骤S109),并且输出该HE-AAC输出音频数据(步骤S110)。
因此,补偿单元170可以补偿编码时未精确编码的高频分量数据,从而改善了HE-AAC输出音频数据的声响质量。
如上所述,即使HE-AAC数据的高频分量未被适当地编码,解码器100也能够补偿HE-AAC数据的高频分量,从而能够改善HE-AAC输出音频数据的声响质量。
补偿单元170可以根据变化率,改变细分的块的数量。例如,以下的细分是可行的:如果变化率α[b]小于阈值a,则分块的数量为x;如果变化率α[b]等于或大于阈值a并小于阈值b,则分块的数量为y;并且如果变化率α[b]等于或大于阈值b,则分块的数量为z(x<y<z)。因此,补偿单元170可以有效地补偿高频分量数据。
下文中解释根据本发明的第二实施方式的解码器200的概述和特征。解码器200基于适于高频分量的时间分辨率的带宽,确定应被补偿的频带,并且基于根据高频分量的能量的时间变化而计算出的变化率,补偿高频分量的补偿对象频带。
因此,解码器200可以有效地确定补偿对象频带,从而可以改善音频信号的声响质量。
在下文中解释解码器200的构造。如图6中所示,解码器200包括:数据分离单元210、AAC解码单元220、QMF分析滤波器230、高频生成单元240、补偿频带确定单元250、高频分量分析单元260、补偿单元270、以及QMF合成滤波器280。
当数据分离单元210获得HE-AAC数据时,数据分离单元210将HE-AAC数据分成AAC数据和SBR数据;将AAC数据输出至AAC解码单元220;并且将SBR数据输出至高频生成单元240。
AAC解码单元220解码AAC数据,并且将经解码的AAC数据作为AAC解码音频数据输出至QMF分析滤波器230。QMF分析滤波器230将时间信号的AAC解码音频数据转换成频率信号。QMF分析滤波器230将AAC解码音频数据转换成包括低频分量的频率、时间和功率之间的关系的低频分量数据,并且将转换出的低频分量数据输出至高频生成单元240和QMF合成滤波器280。
高频生成单元240基于从数据分离单元210获得的SBR数据和从QMF分析滤波器230获得的低频分量数据生成音频信号的高频分量。随后,高频生成单元240将所生成的高频分量数据作为音频信号的高频分量数据输出至高频分量分析单元260和补偿单元270。此外,高频生成单元240将作为带宽数据的、适于高频分量数据的时间分辨率的带宽的数据输出至补偿频带确定单元250。
如图7中的左侧部分所示,高频分量数据包括以下参数:即频率、时间、和功率(与功率相对应的轴垂直于附图的平面)。在图7中的右侧部分通过提取出与左侧部分的频率b对应的列,在时间功率平面上呈现高频分量数据。
补偿频带确定单元250基于从高频生成单元240获得的带宽数据,确定应被补偿的频带。补偿频带确定单元250将图8中示出的带宽bw[b,t]与阈值B进行比较。如果带宽bw[b,t]大于阈值B,则补偿频带确定单元250将与带宽bw[b,t]相对应的频带作为补偿对象频带输出至高频分量分析单元260和补偿单元270。
相反,如果带宽bw[b,t]等于或低于阈值B,则补偿频带确定单元250将与带宽bw[b,t]相对应的频带作为不应被补偿的频带输出至高频分量分析单元260和补偿单元270。
高频分量分析单元260从高频生成单元240获得高频分量数据,并且计算在所获得的高频分量数据中观察的沿时间方向的功率值的变化率(变化的比率)。高频分量分析单元260计算与补偿对象频带相对应的功率值的变化率,并且不计算与其它频带有关的功率值的变化率。由于根据SBR编码方法,在同一帧中获得沿时间方向的频谱(参见图7),因此高频分量分析单元260可以根据时间方向上的频率信号来预估功率值的变化。
如图9所示,高频分量分析单元260将时间方向上的相邻频带细分成各自具有一个或更多个频谱的多个频带。细分单位可以为一个或更多个频谱,细分单位也可以是不均匀的。另选地,频带不需要被细分。细分出的频谱频带的功率E[f,t]通过以下表达式表达:
E[f,t]=E[b,t]/bw[b,t]
其中,bw[b,t]代表作为补偿对象的带宽,并且E[b,t]表示带宽的功率。
时间方向上的相邻频带的功率之间的差额ΔE[f,t]可以通过以下表达式计算:
ΔE[f,t]=E[f,t-1]-E[f,t]
其中,E[f,t-1]代表与时间(t-1)相对应的功率,并且E[f,t]代表与时间t相对应的功率。功率值的变化率α[f,t]可以通过以下表达式表达:
α[f,t]=ΔE[f,t]/tw[f,t]
其中,tw[f,t]代表与补偿对象频带相对应的时间宽度。高频分量分析单元260将所计算出的变化率α[f,t]的数据(在下文中称作“变化率数据”)输出至补偿单元270。获得变化率α[f,t]的方法不限于上述方法。变化率可以通过非线性方法获得。变化率也可以基于时间上在前的数据或时间上在后的数据,或者基于两者而获得。
补偿单元270基于从高频分量分析单元260获得的变化率数据和从补偿频带确定单元250获得的补偿对象频带,对高频分量数据进行补偿。如图10中所示,在与补偿对象频带相对应的时间功率平面上,补偿单元270将高频分量数据分成具有特定时间区间范围的多个细分块,并且补偿与各分出的时间范围相对应的功率。利用变化率α[f,t],用于对补偿对象频带进行补偿的近似表达式E′[f,t]为:
E′[f,t]=α[f,t]×Δt+E[f,t-1]
在该等式中,Δt相当于补偿对象频带中的时间变化量。补偿单元270根据近似表达式E′[f,t]补偿与各细分时间范围相对应的功率。
例如,当补偿与时间t相对应的功率时,补偿单元270将时间(t-1)和时间t之间的时间变化量Δt代入近似表达式E′[f,t],并且获得通过代入而计算出的功率,以作为补偿后的功率。类似地,也根据通过将时间变化量代入近似表达式E′[f,t]中而计算出的功率值来对各其它细分频带进行补偿。补偿单元270将经补偿的高频分量数据输出至QMF合成滤波器280。
QMF合成滤波器280合成从QMF合成滤波器230获得的低频分量数据和从补偿单元270获得的经补偿的高频分量数据,并且输出作为HE-AAC输出音频数据的合成数据。HE-AAC输出音频数据为对HE-AAC数据进行解码的结果。
在下文中解释解码器200执行的处理过程。如图11所示,在解码器200中,数据分离单元210获得HE-AAC数据(步骤S201),并且将HE-AAC数据分成AAC数据和SBR数据(步骤S202)。
随后AAC解码单元220根据AAC数据生成AAC解码音频数据(步骤S203),并且QMF分析滤波器230将AAC解码音频数据从时间信号转换成频率信号(步骤S204)。
高频生成单元240根据SBR数据和低频分量数据生成高频分量数据(步骤S205)。补偿频带确定单元250确定补偿对象频带(步骤S206)。高频分量分析单元260计算高频分量数据沿时间方向的变化率(步骤S207)。
随后,补偿单元270基于从高频分量分析单元260获得的变化率数据和从补偿频带确定单元250获得的补偿对象频带,对高频分量数据进行补偿(步骤S208)。QMF合成滤波器280合成低频分量数据和高频分量数据,以生成HE-AAC输出音频数据(步骤S209),并且输出该HE-AAC输出音频数据(步骤S210)。
因此,补偿单元270可以对编码时未精确编码的高频分量数据进行补偿,从而改善了HE-AAC输出音频数据的声响质量。
如上所述,解码器200可以有效地确定补偿对象频带,从而能够改善音频信号的声响质量。
下面解释根据本发明的第三实施方式的解码器300的概述和特征。解码器300划分一定频带的高频分量;基于相邻频带之间的功率差额确定补偿对象频带;以及补偿相应于补偿频带的高频分量。
因此,解码器300可以有效地确定补偿对象频带,从而可以改善音频信号的声响质量。
下面解释解码器300的构造。如图12中所示,解码器300包括:数据分离单元310、AAC解码单元320、QMF分析滤波器330、高频生成单元340、高频分量分析单元350、补偿频带确定单元360、补偿单元370、以及QMF合成滤波器380。
当数据分离单元310获得HE-AAC数据时,数据分离单元310将HE-AAC数据分成AAC数据和SBR数据;将AAC数据输出至AAC解码单元320;并且将SBR数据输出至高频生成单元340。
AAC解码单元320解码AAC数据,并且将作为AAC解码音频数据的经解码的AAC数据输出至QMF分析滤波器330。QMF分析滤波器330将时间信号的AAC解码音频数据转换成频率信号。QMF分析滤波器330将AAC解码音频数据转换成包括低频分量的频率、时间和功率之间的关系的低频分量数据,并且将转换出的低频分量数据输出至高频生成单元340和QMF合成滤波器380。
高频生成单元340基于从数据分离单元310获得的SBR数据和从QMF分析滤波器330获得的低频分量数据生成音频信号的高频分量。随后,高频生成单元340将所生成的高频分量数据作为音频信号的高频分量数据输出至高频分量分析单元350、补偿频带确定单元360和补偿单元370。此外,高频生成单元340将高频分量的带宽数据输出至高频分量分析单元350。
当高频分量分析单元350获得高频分量数据时,高频分量分析单元350计算在所获得的高频分量数据中观察到的频率方向上的功率值的变化率(变化的比率)。由于对高频分量分析单元350执行的处理的解释类似于在第一实施方式中描述的高频分量分析单元150的处理,因此省略其详细说明。高频分量分析单元350将计算出的变化率的数据输出至补偿单元370。
当补偿频带确定单元360从高频生成单元340获得高频分量数据时,补偿频带确定单元360基于获得的高频分量数据,确定应被补偿的频带。
如图13中所示,补偿频带确定单元360将高频分量数据分成多个频带,并且基于相邻的分出的频带的功率的差额,确定补偿对象频带。功率差额ΔE[b]通过以下表达式表达:
ΔE[b]=E[b-1]-E[b]
其中,E[b-1]代表与低频侧的相邻频带相对应的功率,并且E[b]为作为补偿对象候选的频带的功率。如果功率的差额ΔE[b]等于或大于阈值C,则补偿频带确定单元360将该作为补偿对象候选的频带输出至补偿单元370,作为补偿对象频带。
尽管补偿对象频带是根据低频侧的相邻频带的功率E[b-1]和作为补偿对象候选的频带的功率E(b)之间的功率的差额来确定的,然而本发明并不限于此。例如,补偿对象频带可以根据作为补偿对象候选的频带的功率E[b]和高频侧的相邻频带的功率E[b+1]之间的差额来确定。
补偿单元370基于从高频分量分析单元350获得的变化率数据和从补偿频带确定单元360获得的补偿对象频带的数据,对高频分量数据的补偿对象频带的功率进行补偿。补偿单元370执行的补偿类似于在第一实施方式中描述的补偿单元170执行的补偿,因此省略其详细说明。补偿单元370将经补偿的高频分量数据输出至QMF合成滤波器380。
QMF合成滤波器380合成从QMF分析滤波器330获得的低频分量数据和从补偿单元370获得的经补偿的高频分量数据,并且输出作为HE-AAC输出音频数据的合成数据。HE-AAC输出音频数据为对HE-AAC数据进行解码的结果。
在下文中解释解码器300执行的处理过程。如图14中所示,在解码器300中,数据分离单元310获得HE-AAC数据(步骤S301),并且将HE-AAC数据分成AAC数据和SBR数据(步骤S302)。
随后,AAC解码单元320根据AAC数据生成AAC解码音频数据(步骤S303),并且QMF分析滤波器330将AAC解码音频数据从时间信号转换成频率信号(步骤S304)。
高频生成单元340根据SBR数据和低频分量数据生成高频分量数据(步骤S305)。补偿频带确定单元360基于相邻频带之间的功率差额,确定补偿对象频带(步骤S306),并且高频分量分析单元350计算高频分量数据沿频率方向的变化率(步骤S307)。
接着,补偿单元370基于从高频分量分析单元350获得的变化率数据和从补偿频带确定单元360获得的补偿对象频带,补偿高频分量数据(步骤S308)。QMF合成滤波器380合成低频分量数据和高频分量数据,以生成HE-AAC输出音频数据(步骤S309),并且输出HE-AAC输出音频数据(步骤S310)。
因此,补偿单元370可以补偿编码时未精确编码的高频分量数据,从而改善了HE-AAC输出音频数据的声响质量。
如上所述,解码器300能够有效地确定补偿对象频带,从而能够改善音频信号的声响质量。
除了上述实施方式之外,本发明可以在权利要求书中所描述的技术观念的范围内,以各种实施方式执行。
在实施方式中解释的处理中,解释为自动执行的处理的整个处理或部分处理可以手动地执行,并且解释为手动执行的处理的整个处理或部分处理可以以公知的方式自动地执行。
处理过程、控制过程、具体名称、包括在说明书和附图中示出的各种数据和参数的信息可以根据需要变化,除非另有说明。
在附图中示出的各设备的各构造元件是功能性和概念性的,而无须被物理构造为如图中所示。换言之,各设备的分离和整合的实际形式不限于图中所示的情况。取决于各种载荷或使用条件,整个设备或部分设备可以在功能性上或在物理上、分立地或整合地、由任何规模的单元来构造。
根据本发明的一个方面,即使高频分量未被适当地编码,也能够通过补偿高频分量而精确地解码音频信号。
根据本发明的另一个方面,即使高频分量未被适当地编码,也能够精确地补偿高频分量。
根据本发明的又一方面,即使高频分量未被适当地编码,沿频率方向的高频分量的功率也能够被精确地补偿。
根据本发明的又一方面,即使高频分量未被适当地编码,沿时间方向的高频分量的功率也能够被精确地补偿。
根据本发明的又一方面,应被补偿的一定频带的高频分量能够被精确地确定。
尽管已经针对具体实施方式描述了本发明,从而完全且清楚地进行了公开,然而所附权利要求并不由此限定,而应被解释为包括本领域技术人员可能提出的、完全落入到在本文阐述的基本教导内的所有变型和另选构造。
Claims (12)
1.一种解码装置,其将从音频信号的低频分量编码出的第一编码数据和当根据低频分量产生音频信号的高频分量时使用的且根据特定的带宽编码的第二编码数据解码成所述音频信号,所述解码装置包括:
高频分量检测单元,其与所述特定的带宽相对应地将所述高频分量分成具有特定区间范围的多个频带,并且检测与各所述多个频带对应的高频分量的功率值;
补偿频带确定单元,其基于由所述高频分量检测单元分出的所述高频分量的区间范围,确定应被补偿的高频分量的频带;
高频分量补偿单元,其基于与所述高频分量检测单元检测出的各所述多个频带相对应的高频分量的功率值,对所述高频分量进行补偿;以及
解码单元,其将从所述第一编码数据中解码出的低频分量和经所述高频分量补偿单元补偿的高频分量解码成所述音频信号。
2.根据权利要求1所述的解码装置,其中,所述高频分量补偿单元基于被所述高频分量检测单元分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值的变化,对所述高频分量进行补偿。
3.根据权利要求2所述的解码装置,其中,所述高频分量补偿单元基于被所述高频分量检测单元分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值沿频率方向的变化,对所述高频分量进行补偿。
4.根据权利要求2所述的解码装置,其中,所述高频分量补偿单元基于被所述高频分量检测单元分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值沿时间方向的变化,对所述高频分量进行补偿。
5.根据权利要求1所述的解码装置,所述解码装置还包括补偿频带确定单元,其基于被所述高频分量检测单元分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值的变化,确定应被补偿的高频分量的频带。
6.根据权利要求1所述的解码装置,所述解码装置还包括补偿频带确定单元,其确定应被补偿的高频分量的频带为这样的频带,该频带的功率值与被所述高频分量检测单元分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值之间的差值等于或大于阈值。
7.一种解码方法,其用于将从音频信号的低频分量编码的第一编码数据和当根据低频分量产生音频信号的高频分量时使用的且根据特定的带宽编码的第二编码数据解码成所述音频信号,所述解码方法包括以下步骤:
高频分量检测步骤,其包括与所述特定的带宽对应地将所述高频分量分成具有特定区间范围的多个频带,并且检测与各所述多个频带相对应的高频分量的功率值;
基于由所述高频分量检测步骤分出的所述高频分量的区间范围,确定应被补偿的高频分量的频带;
补偿步骤,基于与在所述高频分量检测步骤中检测出的各所述多个频带相对应的高频分量的功率值,对所述高频分量进行补偿;以及
解码步骤,将从所述第一编码数据中解码出的低频分量和经所述补偿步骤补偿的高频分量解码成所述音频信号。
8.根据权利要求7所述的解码方法,其中,所述补偿步骤包括基于在所述高频分量检测步骤中被分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值的变化,对所述高频分量进行补偿。
9.根据权利要求8所述的解码方法,其中,
所述补偿步骤包括基于在所述高频分量检测步骤中被分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值沿频率方向的变化,对所述高频分量进行补偿。
10.根据权利要求8所述的解码方法,其中,
所述补偿步骤包括基于在所述高频分量检测步骤中被分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值沿时间方向的变化,对所述高频分量进行补偿。
11.根据权利要求7所述的解码方法,所述解码方法还包括基于在所述高频分量检测步骤中被分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值的变化,确定应被补偿的高频分量的频带。
12.根据权利要求7所述的解码方法,所述解码方法还包括确定应被补偿的高频分量的频带为这样的频带,该频带的功率值与在所述高频分量检测步骤中被分成具有所述特定区间范围的所述多个频带的所述高频分量中的相邻高频分量的功率值之间的差值等于或大于阈值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006317647A JP4967618B2 (ja) | 2006-11-24 | 2006-11-24 | 復号化装置および復号化方法 |
JP2006-317647 | 2006-11-24 | ||
JP2006317647 | 2006-11-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101188112A CN101188112A (zh) | 2008-05-28 |
CN101188112B true CN101188112B (zh) | 2011-11-02 |
Family
ID=38691096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200710180961.5A Expired - Fee Related CN101188112B (zh) | 2006-11-24 | 2007-10-10 | 解码装置和解码方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8788275B2 (zh) |
EP (1) | EP1926084B1 (zh) |
JP (1) | JP4967618B2 (zh) |
CN (1) | CN101188112B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
US9177569B2 (en) | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
ES2906085T3 (es) * | 2009-10-21 | 2022-04-13 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
CN102812636B (zh) | 2010-03-18 | 2016-06-08 | 杜比实验室特许公司 | 用于具有音质保护的失真减少多频带压缩器的技术 |
US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
EP2710588B1 (en) | 2011-05-19 | 2015-09-09 | Dolby Laboratories Licensing Corporation | Forensic detection of parametric audio coding schemes |
US8834449B2 (en) | 2012-01-23 | 2014-09-16 | Ikomed Technologies, Inc. | Mixing syringe |
US9751056B2 (en) | 2012-01-23 | 2017-09-05 | Merit Medical Systems, Inc. | Mixing syringe |
TWI693594B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
CN106205626B (zh) * | 2015-05-06 | 2019-09-24 | 南京青衿信息科技有限公司 | 一种针对被舍弃的子空间分量的补偿编解码装置及方法 |
CN112767954B (zh) * | 2020-06-24 | 2024-06-14 | 腾讯科技(深圳)有限公司 | 音频编解码方法、装置、介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1496559A (zh) * | 2001-01-12 | 2004-05-12 | 艾利森电话股份有限公司 | 语音带宽扩展 |
CN1527995A (zh) * | 2001-11-14 | 2004-09-08 | ���µ�����ҵ��ʽ���� | 编码设备和解码设备 |
CN1669073A (zh) * | 2002-07-19 | 2005-09-14 | 日本电气株式会社 | 音频解码设备以及解码方法和程序 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0685607A (ja) * | 1992-08-31 | 1994-03-25 | Alpine Electron Inc | 高域成分復元装置 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6539355B1 (en) * | 1998-10-15 | 2003-03-25 | Sony Corporation | Signal band expanding method and apparatus and signal synthesis method and apparatus |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
JP3576941B2 (ja) | 2000-08-25 | 2004-10-13 | 株式会社ケンウッド | 周波数間引き装置、周波数間引き方法及び記録媒体 |
US6691085B1 (en) * | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
JP4106624B2 (ja) * | 2001-06-29 | 2008-06-25 | 株式会社ケンウッド | 信号の周波数成分を補間するための装置および方法 |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
ATE288617T1 (de) * | 2001-11-29 | 2005-02-15 | Coding Tech Ab | Wiederherstellung von hochfrequenzkomponenten |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
BRPI0306434B1 (pt) * | 2002-09-19 | 2018-06-12 | Nec Corporation | Aparelho e método de decodificação de áudio |
JP2004198485A (ja) * | 2002-12-16 | 2004-07-15 | Victor Co Of Japan Ltd | 音響符号化信号復号化装置及び音響符号化信号復号化プログラム |
EP1672618B1 (en) * | 2003-10-07 | 2010-12-15 | Panasonic Corporation | Method for deciding time boundary for encoding spectrum envelope and frequency resolution |
JP4741476B2 (ja) * | 2004-04-23 | 2011-08-03 | パナソニック株式会社 | 符号化装置 |
KR20070012832A (ko) | 2004-05-19 | 2007-01-29 | 마츠시타 덴끼 산교 가부시키가이샤 | 부호화 장치, 복호화 장치 및 이들의 방법 |
KR100608062B1 (ko) | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
-
2006
- 2006-11-24 JP JP2006317647A patent/JP4967618B2/ja not_active Expired - Fee Related
-
2007
- 2007-09-19 EP EP07018370.2A patent/EP1926084B1/en not_active Ceased
- 2007-09-20 US US11/902,325 patent/US8788275B2/en not_active Expired - Fee Related
- 2007-10-10 CN CN200710180961.5A patent/CN101188112B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1496559A (zh) * | 2001-01-12 | 2004-05-12 | 艾利森电话股份有限公司 | 语音带宽扩展 |
CN1527995A (zh) * | 2001-11-14 | 2004-09-08 | ���µ�����ҵ��ʽ���� | 编码设备和解码设备 |
CN1669073A (zh) * | 2002-07-19 | 2005-09-14 | 日本电气株式会社 | 音频解码设备以及解码方法和程序 |
Non-Patent Citations (1)
Title |
---|
Per Ekstrand.BANDWIDTH EXTENSION OF AUDIO SIGNALS BY SPECTRAL BAND REPLICATION.《IEEE Benelux Workshop on Model based Processing and Coding of Audio》.2002,第53-58页. * |
Also Published As
Publication number | Publication date |
---|---|
EP1926084A3 (en) | 2011-08-10 |
JP2008129542A (ja) | 2008-06-05 |
EP1926084A2 (en) | 2008-05-28 |
JP4967618B2 (ja) | 2012-07-04 |
US8788275B2 (en) | 2014-07-22 |
US20080126102A1 (en) | 2008-05-29 |
EP1926084B1 (en) | 2013-10-16 |
CN101188112A (zh) | 2008-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101188112B (zh) | 解码装置和解码方法 | |
CN101933086B (zh) | 处理音频信号的方法和设备 | |
CN101790756B (zh) | 瞬态检测器以及用于支持音频信号的编码的方法 | |
US20170148452A1 (en) | Signal processing device, method, and program | |
CN101609680B (zh) | 压缩编码和解码的方法、编码器和解码器以及编码装置 | |
EP2381438B1 (en) | Signal classification processing method, classification processing device and encoding system | |
CN1787383B (zh) | 变换、编码、逆变换和解码音频信号的方法和设备 | |
CA2717584A1 (en) | Method and apparatus for processing an audio signal | |
HK1106863A1 (en) | Apparatus and method for robust classification of audio signals, and method for establishing and operating an audio-signal database | |
TWI350068B (en) | Device and method for postprocessing spectral values and encoder and decoder for audio signals | |
CN105118512B (zh) | 一种面向aac数字音频的通用隐写分析方法 | |
CN1826634B (zh) | 低比特率音频编码 | |
US20210366499A1 (en) | Low-complexity tonality-adaptive audio signal quantization | |
CN103366753A (zh) | 一种相同码率下的mp3音频双压缩检测方法 | |
CN101826326A (zh) | 一种立体声编码方法、装置和编码器 | |
EP1965523A1 (en) | Transmitting/receiving method, transmitter/receiver, and recording medium therefor | |
CN109785848B (zh) | 基于比例因子系数差值的aac双压缩音频检测方法 | |
CN108877816B (zh) | 基于qmdct系数的aac音频重压缩检测方法 | |
Huang et al. | AAC audio compression detection based on QMDCT coefficient | |
Bießmann et al. | Estimating MP3PRO encoder parameters from decoded audio | |
Hu et al. | An efficient low complexity encoder for MPEG advanced audio coding | |
KR100740807B1 (ko) | 공간정보기반 오디오 부호화에서의 공간정보 추출 방법 | |
KR101425354B1 (ko) | 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치 | |
KR101644883B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
Gangashetty et al. | A Study on Vowel Region Detection from a Continuous Speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111102 Termination date: 20181010 |
|
CF01 | Termination of patent right due to non-payment of annual fee |