CN103765509B - 编码装置及方法、解码装置及方法 - Google Patents
编码装置及方法、解码装置及方法 Download PDFInfo
- Publication number
- CN103765509B CN103765509B CN201280040017.9A CN201280040017A CN103765509B CN 103765509 B CN103765509 B CN 103765509B CN 201280040017 A CN201280040017 A CN 201280040017A CN 103765509 B CN103765509 B CN 103765509B
- Authority
- CN
- China
- Prior art keywords
- subband
- power
- signal
- frequency
- low frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Abstract
本技术涉及一种能够提高音频质量的编码装置及方法、解码装置及方法以及程序。QMF子带功率计算单元对构成输入信号的多个QMF子带中的高范围QMF子带的QMF子带信号的功率进行计算。相对于包括多个高范围QMF子带的子带,高范围子带功率计算单元通过执行对更大的QMF子带功率施加更大权重的运算来计算子带的高范围子带功率。复用电路复用并输出:通过对用于借助估计来获得输入信号的高区域部分并基于高区域子带功率所选择的信息进行编码所获得的高范围编码数据;以及通过对输入信号的低区域分量进行编码所获得的低范围编码数据。本技术能够应用于编码装置。
Description
技术领域
本发明涉及一种编码装置及方法、解码装置及方法以及程序,特别涉及一种能够提高音频质量的编码装置及方法、解码装置及方法以及程序。
背景技术
作为相关技术中的音频信号编码方法,已知HE-AAC(高效率MPEG(运动图像专家组)4AAC(高级音频编码))(国际标准ISO/IEC14496-3)。
在此编码方法中,使用称为SBR(频带复制)的高频特征编码技术(参照例如专利文献1)。根据SBR,当对音频信号进行编码时,用于生成音频信号的高频分量的SBR信息连同经编码的音频信号的低频分量一起被输出。更具体地,通过对称为高频分量的比例因子带的每个频带的功率(能量)进行量化来获得SBR信息。
此外,在解码装置中,当对经编码的音频信号的低频分量进行解码时,使用SBR信息和从解码获得的低频信号来生成高频信号。因此,获得了包括低频信号和高频信号的音频信号。
引用列表
专利文献
专利文献1:日本专利申请国家公布(特开)第2001-521648号
发明内容
本发明要解决的问题
然而,在以上技术中,由于构成高频比例因子带的频带中的每个频带的功率被视作比例因子带的功率,所以有时不可以在解码时再现原始信号的功率。在这样的情况下,减损了从解码获得的音频信号的清晰度,并降低了关于可听度的音频质量。
鉴于以上情况实现了本技术,并且本技术意在能够提高音频质量。
针对问题的解决方案
根据本技术的第一方面的编码装置包括:子带划分单元,所述子带划分单元被配置成划分输入信号的频带并生成在所述输入信号的高频侧的第一子带的第一子带信号;第一子带功率计算单元,所述第一子带功率计算单元被配置成基于所述第一子带信号来计算所述第一子带信号的第一子带功率;第二子带功率计算单元,所述第二子带功率计算单元被配置成执行运算以对具有更大功率的所述第一子带功率进行更大加权,并计算第二子带信号的第二子带功率,所述第二子带信号包括多个连续的第一子带;生成单元,所述生成单元被配置成基于所述第二子带功率来生成以下数据:所述数据用于通过估计来获得所述输入信号的高频信号;低频编码单元,所述低频编码单元被配置成对所述输入信号的低频信号进行编码以生成低频编码数据;以及复用单元,所述复用单元被配置成对所述数据和所述低频编码数据进行复用以生成输出代码串。
所述编码装置还包括伪高频子带功率计算单元,所述伪高频子带功率计算单元被配置成基于从所述低频信号获得的特征量或所述输入信号来计算伪高频子带功率,其中所述伪高频子带功率是所述第二子带功率的估计值,以及所述生成单元能够通过将所述第二子带功率与所述伪高频子带功率进行比较来生成所述数据。
所述伪高频子带功率计算单元能够基于所述特征量和预先准备的估计系数来计算所述伪高频子带功率,以及所述生成单元能够生成所述数据,所述数据用于获得多个所述估计系数中的任一个所述估计系数。
所述编码装置还包括高频编码单元,所述高频编码单元被配置成通过对所述数据进行编码来生成高频编码数据,以及所述复用单元能够对所述高频编码数据和所述低频编码数据进行复用以生成所述输出代码串。
所述第二子带功率计算单元能够通过对以指数m自乘过的所述第一子带功率的平均值以指数1/m自乘来计算所述第二子带功率。
所述第二子带功率计算单元能够通过使用随所述第一子带功率变得更大而变得更大的权重获得所述第一子带功率的加权平均值来计算所述第二子带功率。
根据本技术的第一方面的编码方法或程序包括以下步骤:划分输入信号的频带并生成在所述输入信号的高频侧的第一子带的第一子带信号;基于所述第一子带信号来计算所述第一子带信号的第一子带功率;执行运算以对具有更大功率的第一子带功率进行更大加权,并计算第二子带信号的第二子带功率,所述第二子带功率包括多个连续的第一子带;基于所述第二子带功率来生成以下数据:所述数据用于通过估计来获得所述输入信号的高频信号;对所述输入信号的低频信号进行编码以生成低频编码数据;以及对所述数据和所述低频编码数据进行复用以生成输出代码串。
根据本技术的第一方面,划分输入信号的频带,并生成在所述输入信号的高频侧的第一子带的第一子带信号;基于所述第一子带信号来计算所述第一子带信号的第一子带功率;执行运算以对具有更大功率的第一子带功率进行更大加权,并计算包括多个连续的第一子带的第二子带信号的第二子带功率;基于所述第二子带功率生成以下数据:所述数据用于通过估计来获得所述输入信号的高频信号;对所述输入信号的低频信号进行编码并生成低频编码数据;以及对所述数据和所述低频编码数据进行复用并生成输出代码串。
根据本技术的第二方面的解码装置包括:解复用单元,所述解复用单元被配置成将输入代码串解复用成数据和低频编码数据,其中基于第二子带信号的第二子带功率来生成所述数据,所述第二子带信号包括在输入信号的高频侧的多个连续的第一子带,所述第二子带功率是通过对所述第一子带的第一子带功率中具有更大功率的第一子带功率进行更大加权来计算的,并且所述第二子带功率被用于通过估计来获得所述输入信号的高频信号,以及通过对所述输入信号的低频信号进行编码来获得所述低频编码数据;低频解码单元,所述低频解码单元被配置成对所述低频编码数据进行解码以生成低频信号;高频信号生成单元,所述高频信号生成单元被配置成基于从所述数据获得的估计系数和从所述解码获得的低频信号来生成高频信号;以及合成单元,所述合成单元被配置成基于所生成的高频信号和从所述解码获得的低频信号来生成输出信号。
所述高频信号生成单元能够基于所述估计系数和从低频信号获取的特征量来计算所述第二子带功率的估计值,并基于从所述解码获得的低频信号和所述第二子带功率的估计值来生成高频信号,其中,所述低频信号是从所述解码获得的。
所述解码装置还能够包括高频解码单元,所述高频解码单元被配置成对所述数据进行解码并获得所述估计系数。
基于所述输入信号或从所述输入信号的低频信号获得的特征量来计算作为所述第二子带功率的估计值的伪高频子带功率,并且能够通过将所述第二子带功率与所述伪高频子带功率进行比较来生成所述数据。
基于所述输入信号或从所述输入信号的低频信号获得的特征量、以及预先准备的估计系数来计算所述伪高频子带功率,并且能够生成所述数据,所述数据用于获得多个所述估计系数中的任一个所述估计系数。
通过对以指数m自乘过的所述第一子带功率的平均值以指数1/m自乘能够计算出所述第二子带功率。
通过使用随所述第一子带功率变得更大而变得更大的权重获得所述第一子带功率的加权平均值能够计算出所述第二子带功率。
根据本技术的第二方面的解码方法或程序包括以下步骤:将输入代码串解复用成数据和低频编码数据,其中基于第二子带信号的第二子带功率来生成所述数据,所述第二子带信号包括在输入信号的高频侧的多个连续的第一子带,所述第二子带功率是通过对所述第一子带的第一子带功率中具有更大功率的第一子带功率进行更大加权来计算的,并且所述第二子带功率被用于通过估计来获得所述输入信号的高频信号,以及通过对所述输入信号的低频信号进行编码来获得所述低频编码数据;对所述低频编码数据进行解码以生成低频信号;基于从所述数据获得的估计系数和从所述解码获得的低频信号来生成高频信号;以及基于所生成的高频信号和从所述解码获得的低频信号来生成输出信号。
根据本技术的第二方面,将输入代码串解复用成数据和低频编码数据,其中基于第二子带信号的第二子带功率来生成所述数据,所述第二子带信号包括在输入信号的高频侧的多个连续的第一子带,通过对所述第一子带的第一子带功率中具有更大功率的第一子带功率进行更大加权计算出所述第二子带功率,并且所述第二子带功率被用于通过估计来获得所述输入信号的高频信号,以及通过对所述输入信号的低频信号进行编码获得所述低频编码数据;对所述低频编码数据进行解码并生成低频信号;基于从所述数据获得的估计系数和从所述解码获得的低频信号来生成高频信号;以及基于所生成的高频信号和从所述解码获得的低频信号来生成输出信号。
发明效果
根据本技术的第一方面和第二方面,能够提高音频质量。
附图说明
图1是用于描述输入信号的子带的图。
图2是用于描述子带和QMF子带的图。
图3是示出了应用了本技术的编码装置的示例性配置的图。
图4是描述了编码处理的流程图。
图5是示出了解码装置的示例性配置的图。
图6是示出了计算机的示例性配置的图。
具体实施方式
在下文中,将参照附图来描述应用了本技术的实施方式。
<本技术的概述>
[对输入信号进行编码]
采用本技术来对输入信号例如音频信号进行编码,该音频信号诸如作为输入信号的音乐信号。
在对输入信号进行编码的编码装置中,在编码时将输入信号划分成多个频带(在下文中称为子带)的子带信号,每个频带均具有预定带宽,如图1所示。注意,在图1中,纵轴表示输入信号的各个频率的功率,而横轴表示表示输入信号的各个频率。此外,曲线C11表示输入信号的各个频率分量的功率,以及在附图中,竖直虚线表示各个子带的边界位置。
在编码装置中,通过预定编码系统对输入信号的在低频侧的频率分量之中低于预定频率的分量进行编码,从而生成低频编码数据。
在图1的示例中,将与具有索引sb的子带sb的上限频率相比相等或更低的频率的子带视为输入信号的低频分量,并将与子带sb的上限频率相比更高的频率的子带视为输入信号的高频分量。注意,索引指定各子带。
在获得低频编码数据之后,后续基于输入信号的低频分量和高频分量来生成用于再现高频分量的每个子带的子带信号的信息。然后,通过预定编码系统定时地对信息进行编码,并生成高频编码数据。
更具体地,根据以下分量来生成高频编码数据:在低频侧沿频率方向连续排列的并具有最高频率的四个子带sb-3至sb的分量;以及在高频侧连续排列的(eb-(sb+1)+1)个子带sb+1至eb的分量。
这里,子带sb+1与子带sb相邻,并且子带sb是位于低频侧的最高频子带,并且子带eb是连续排列的子带sb+1至eb的最高频子带。
通过对高频分量进行编码所获得的高频编码数据是这样的信息,该信息用于通过估计来生成高频侧的子带ib(其中sb+1≤ib≤eb)的子带信号。高频编码数据包括系数索引,系数索引用于获得估计每个子带信号所使用的估计系数。
更具体地,使用包括系数Aib(kb)和系数Bib在内的估计系数来估计子带ib的子带信号。将系数Aib(kb)与低频侧的子带kb(其中sb-3≤kb≤sb)的子带信号的功率相乘,以及系数Bib是常数项。在高频编码数据中包括的系数索引是用于获得一组估计系数的信息,例如用于指定该组估计系数的信息,所述一组估计系数包括每个子带ib系数Aib(kb)和系数Bib。
更具体地,当生成高频编码数据时,将在低频侧的每个子带kb的子带信号的功率(在下文中,称为低频子带功率)乘以系数Aib(kb)。此外,将系数Bib与被乘以系数Aib(kb)的低频子带功率的总和相加以计算伪高频子带功率,该伪高频子带功率是在高频侧的子带ib的子带信号的功率的估计值。
另外,将在高频侧的每个子带的伪高频子带功率与在实际高频侧的每个子带的子带信号的功率进行比较。基于比较结果来选择最佳估计系数,并对包括所选择的估计系数的系数索引的数据进行编码以获得高频编码数据。
在这样获得低频编码数据和高频编码数据之后,对这些低频编码数据和高频编码数据进行复用,并获得输出代码串以被输出。
此外,接收了输出代码串的解码装置对低频编码数据进行解码以获得包括在低频侧的每个子带的子带信号的经解码的低频信号,并还根据该经解码的低频信号和通过对高频编码数据进行解码所获得的信息通过估计来生成在高频侧的每个子带的子带信号。随后,解码装置根据经解码的低频信号和经解码的高频信号来生成输出信号,所述经解码的高频信号包括通过估计所获得的在高频侧的每个子带的子带信号。
[QMF子带]
此外,如上所述,在编码装置中将输入信号划分成每个子带的分量以用于处理,然而更具体地,根据以下频带的分量来计算每个子带的功率:每个频带均具有比子带的带宽窄的带宽。
例如,如图2所示,在编码装置中,通过使用QMF(正交镜像滤波器)分析滤波器进行滤波处理来将输入信号划分成QMF子带信号(在下文中称为QMF子带信号),其中每个QMF子带信号均具有比以上子带中的每个子带的带宽窄的带宽。然后,通过捆绑多个QMF子带来形成一个子带。
注意,在图2中,纵轴表示输入信号的各个频率的功率,而横轴表示表示输入信号的各个频率。此外,曲线C12表示输入信号的各个频率分量的功率,以及在附图中,竖直虚线表示各个子带的边界位置。
在图2的示例中,P11至P17各表示每个子带的功率(在下文中,还称为子带功率)。例如,一个子带由三个QMF子带ib0至ib2形成,如该图右侧所示。
因此,在计算子带功率P17的情况下,例如,首先计算构成该子带的QMF子带ib0至ib2中的每个QMF子带的功率(在下文中称为QMF子带功率)。更具体地,针对QMF子带ib0至ib2来计算QMF子带功率Q11至Q13。
随后,基于QMF子带功率Q11至Q13来计算子带功率P17。
更具体地,例如假定:具有索引ibQMF的帧J的QMF子带信号是sigQMF(ibQMF,n),以及每帧QMF子带信号的采样的数目是FSIZEQMF。这里,索引ibQMF对应于图2中的索引ib0、ib1和ib2。
在此情况下,通过下面的表达式(1)来获得QMF子带ibQMF的QMF子带功率powerQMF(ibQMF,J)。
[表达式1]
...(1)
换句话说,通过帧J的QMF子带信号的每个采样的采样值的均方值来获得QMF子带功率powerQMF(ibQMF,J)。注意,QMF子带信号sigQMF(ibQMF,n)中的n表示离散时间的索引。
此外,作为根据每个QMF子带的QMF子带功率powerQMF(ibQMF,J)来获得在高频侧的子带ib的子带功率的方法,可以考虑通过下面的表达式(2)来计算子带功率power(ib,J)的方法。
[表达式2]
...(2)
注意,在表达式(2)中,start(ib)和end(ib)分别表示在构成子带ib的QMF子带之中具有最低频率的QMF子带和具有最高频率的QMF子带的索引。例如,在图2的示例中,在最右边的子带具有索引ib的情况下,start(ib)=ib0以及end(ib)=ib2。
因此,通过将构成子带ib的每个QMF子带的QMF子带功率的均值变换成对数值来获得子带功率power(ib,J)。
在根据表达式(2)中的运算来获得子带功率的情况下,例如通过将QMF子带功率Q11至Q13的均值变换成对数值来计算子带功率P17。在这样的情况下,例如子带功率P17大于QMF子带功率Q11和QMF子带功率Q13,且小于QMF子带功率Q12,如图2所示。
在编码时,将在高频侧的每个子带的子带功率(在下文中称为高频子带功率)与伪高频子带功率进行比较,并选择估计系数使得能够获得与高频子带功率最接近的伪高频子带功率。此外,将所选择的估计系数的系数索引包括在高频编码数据中。
在解码侧,根据低频子带功率和通过在高频编码数据中包括的系数索引所指定的估计系数来生成在高频侧的每个子带的伪高频子带功率。然后,根据伪高频子带功率通过估计来获得在高频侧的每个子带的子带信号。
然而,在具有比子带功率P17大的QMF子带功率Q12的频带如QMF子带ib1中,未必能在解码时再现原始输入信号的功率。换句话说,不能够再现原始QMF子带信号的功率。因此,减损了从解码获得的音频信号的清晰度,并降低了关于可听度的音频质量。
根据本申请的申请人的分析,发现通过获得具有以下值的子带功率能够抑制音频质量的降低:该值与构成每个子带的QMF子带之中具有更大功率的QMF子带功率的值接近。原因在于具有更大的QMF子带功率的QMF子带作为用于确定关于可听度的音频质量的要素而起着更重要的作用。
因此,在应用本技术的编码装置中,在计算子带功率时执行运算以对具有更大功率的QMF子带功率进行更大地加权,使得该子带功率的值变得更接近具有大功率的QMF子带功率的值。在此情况下,在解码时能够获得与原始输入信号的音频质量接近的音频信号。换句话说,对于具有大的QMF子带功率的QMF子带,能够在解码时再现与原始QMF子带信号的功率更接近的功率,并提高关于可听度的音频质量。
<第一实施方式>
[编码装置的示例性配置]
接下来,将描述上述输入信号编码技术的具体实施方式。首先,将描述对输入信号进行编码的编码装置的配置。图3是示出了编码装置的示例性配置的图。
编码装置11包括低通滤波器31、低频编码电路32、QMF子带划分电路33、特征量计算电路34、伪高频子带功率计算电路35、伪高频子带功率差计算电路36、高频编码电路37和复用电路38。在编码装置11中,待编码的输入信号被提供给低通滤波器31和QMF子带划分电路33。
低通滤波器31使用预定截止频率对所提供的输入信号进行滤波,并将由此所获得并具有比截止频率低的频率的信号(在下文中称为低频信号)提供给低频编码电路32、QMF子带划分电路33和特征量计算电路34。
低频编码电路32对来自低通滤波器31的低频信号进行编码,并将由此所获得的低频编码数据提供给复用电路38。
QMF子带划分电路33将来自低通滤波器31的低频信号划分成多个相等的QMF子带信号,并将这样获得的QMF子带信号(在下文中还称为低频QMF子带信号)提供给特征量计算电路34。
此外,QMF子带划分电路33将所提供的输入信号划分成多个相等的QMF子带信号,并将由此所获得的QMF子带信号之中在处于高频侧的预定频带中包括的每个QMF子带的QMF子带信号提供给伪高频子带功率差计算电路36。注意,在下文中,从QMF子带划分电路33提供给伪高频子带功率差计算电路36的每个QMF子带的QMF子带信号还称为高频QMF子带信号。
特征量计算电路34基于来自低通滤波器31的低频信号和来自QMF子带划分电路33的低频QMF子带信号中的至少任一者来计算特征量,以提供给伪高频子带功率计算电路35。
伪高频子带功率计算电路35基于来自特征量计算电路34的特征量来计算伪高频子带功率以提供给伪高频子带功率差计算电路36,该伪高频子带功率是在高频侧的每个子带的子带信号(在下文中还称为高频子带信号)的功率的估计值。此外,将根据统计学习所获得的多组估计系数记录在伪高频子带功率计算电路35中。基于该估计系数和特征量来计算伪高频子带功率。
伪高频子带功率差计算电路36基于来自QMF子带划分电路33的高频QMF子带信号和来自伪高频子带功率计算电路35的伪高频子带功率,从多个估计系数中选择最佳估计系数。
伪高频子带功率差计算电路36包括QMF子带功率计算单元51和高频子带功率计算单元52。
QMF子带功率计算单元51基于高频QMF子带信号来计算在高频侧的每个QMF子带的QMF子带功率。高频子带功率计算单元52基于QMF子带功率来计算在高频侧的每个子带的高频子带功率。
此外,伪高频子带功率差计算电路36基于伪高频子带功率和高频子带功率,来计算以下估计值:该估计值表示使得用估计系数所估计出的高频分量与输入信号的实际高频分量之差。此估计值表示对于高频分量按照该估计系数的估计精度。
伪高频子带功率差计算电路36基于针对每个估计系数所获得的估计值从多个估计系数中选择一个估计系数,并将指定所选择的估计系数的系数索引提供给高频编码电路37。
高频编码电路37对从伪高频子带功率差计算电路36提供的系数索引进行编码,并将由此所获得的高频编码数据提供给复用电路38。复用电路38对来自低频编码电路32的低频编码数据和来自高频编码电路37的高频编码数据进行复用以作为输出代码串来输出。
[编码处理的描述]
图3中示出的编码装置11接收输入信号,并在指示对输入信号进行编码时执行编码处理,且将输出代码串输出至解码装置。下面,将参照图4中的流程图来描述编码装置11的编码处理。注意,针对构成输入信号的每个帧来执行此编码处理。
在步骤S11中,低通滤波器31使用具有预定截止频率的低通滤波器来对所提供的包括待被处理的帧的输入信号进行滤波,并将由此所获得的低频信号提供给低频编码电路32、QMF子带划分电路33和特征量计算电路34。
在步骤S12中,低频编码电路32对从低通滤波器31提供的低频信号进行编码,并将由此所获得的低频编码数据提供给复用电路38。
在步骤S13中,QMF子带划分电路33通过使用QMF分析滤波器执行滤波处理来将输入信号和低频信号划分成多个相等的QMF子带信号。
换句话说,QMF子带划分电路33将所提供的输入信号划分成各个QMF子带的QMF子带信号。随后,QMF子带划分电路33将由此所获得的构成在高频侧从子带sb+1至子带eb的频带的每个QMF子带的高频QMF子带信号提供给伪高频子带功率差计算电路36。
另外,QMF子带划分电路33将从低通滤波器31提供的低频信号划分成各个QMF子带的QMF子带信号。此外,QMF子带划分电路33将由此所获得的构成在低频侧从子带sb-3至子带sb的频带的每个QMF子带的低频QMF子带信号提供给特征量计算电路34。
在步骤S14中,特征量计算电路34基于来自低通滤波器31的低频信号和来自QMF子带划分电路33的低频QMF子带信号中的至少任一者来计算特征量,以提供给伪高频子带功率计算电路35。
例如,计算每个低频子带信号的功率(低频子带功率)作为特征量。
更具体地,特征量计算电路34通过执行与上述表达式(1)相同的计算来计算在低频侧的每个QMF子带的QMF子带功率。换句话说,特征量计算电路34获得构成针对一帧的低频QMF子带信号的各个采样的采样值的均方值,以限定QMF子带功率。
此外,特征量计算电路34通过执行与上述表达式(2)相同的计算来计算待被处理的帧J的低频子带ib(其中sb-3≤ib≤sb)的用分贝来表达的子带功率power(ib,J)。换句话说,通过将构成每个子带的QMF子带的QMF子带功率的均值变换成对数值来计算低频子带功率。
在获得每个低频子带ib的低频子带功率之后,特征量计算电路34将所计算出作为特征量的低频子带功率提供给伪高频子带功率计算电路35。然后,处理进行至步骤S15。
在步骤S15中,伪高频子带功率计算电路35基于从特征量计算电路34提供的特征量来计算伪高频子带功率,以提供给伪高频子带功率差计算电路36。
更具体地,伪高频子带功率计算电路35针对预先记录的每个估计系数通过执行下面的表达式(3)所示出的计算来计算在高频侧的每个子带的子带功率powerest(ib,J)。在步骤S15中所获得的子带功率powerest(ib,J)是作为待被处理的帧J的在高频侧的子带ib(其中sb+1≤ib≤eb)的高频子带功率的估计值的伪高频子带功率。
[表达式3]
...(3)
注意,在表达式(3)中,系数Aib(kb)和系数Bib表示针对在高频侧的子带ib所准备的一组估计系数。更具体地,系数Aib(kb)是待乘以子带kb(其中sb-3≤kb≤sb)的低频子带功率power(ib,J)的系数。系数Bib是在对与系数Aib(kb)相乘的子带kb的子带功率进行线性组合时所使用的常数项。
因此,通过将在低频侧的每个子带的低频子带功率与针对每个子带的系数Aib(kb)相乘并将系数Bib与乘以系数的低频子带功率之和相加,来获得在高频侧的子带ib的伪高频子带功率power(ib,J)。
在伪高频子带功率计算电路35中,针对预先记录的每个估计系数来计算在高频侧的每个子带的伪高频子带功率。例如,在预先准备具有系数索引1至K的一组K个估计系数(其中2≤K)情况下,针对该组K个估计系数来计算每个子带的伪高频子带功率。
在步骤S16中,QMF子带功率计算单元51基于从QMF子带划分电路33提供的高频QMF子带信号来计算在高频侧的每个QMF子带的QMF子带功率。例如,QMF子带功率计算单元51通过执行上述表达式(1)中的计算来计算在高频侧的每个QMF子带的QMF子带功率powerQMF(ibQMF,J)。
在步骤S17中,高频子带功率计算单元52基于由QMF子带功率计算单元51所计算出的QMF子带功率通过执行下面的表达式(4)中的计算来计算在高频侧的每个子带的高频子带功率。
[表达式4]
...(4)
注意,在表达式(4)中,start(ib)和end(ib)分别表示在构成子带ib的QMF子带之中具有最低频率的QMF子带和具有最高频率的QMF子带的索引。此外,powerQMF(ibQMF,J)表示帧J中构成高频子带ib(其中sb+1≤ib≤eb)的QMF子带ibQMF的QMF子带功率。
因此,在表达式(4)的运算中,获得构成子带ib的每个QMF子带的QMF子带功率的立方值的均值,并以指数1/3对所获得的均值自乘,并且还将所获得的值变换成对数值。因此,将由此所获得的值确定为高频子带ib的高频子带功率power(ib,J)。
从而,通过在计算QMF子带功率的均值时以更大指数对QMF子带功率自乘,可以计算出对具有更大的值的QMF子带功率进行加权的均值。换句话说,在计算均值时对QMF子带功率进行指数化的情况下,各个QMF子带功率之差变大,因此变得可以获得对具有更大的值的QMF子带功率进行更大地加权的均值。
因此,对于具有更大的QMF子带功率的QMF子带,可以在对输入信号进行编码时再现与原始QMF子带信号的功率接近的功率,从而提高从解码所获得的音频信号的关于可听度的音频质量。
此外,在表达式(4)中,在计算QMF子带功率的均值时以指数3对QMF子带功率自乘,然而还可以指数m对QMF子带功率自乘(其中1<m)。在这样的情况下,将以指数m自乘过的QMF子带功率的均值以指数1/m自乘,并且将由此所获得的值变换成对数值,从而获得高频子带功率。
在这样获得每个高频子带的高频子带功率以及针对每个估计系数所获得的每个高频子带的伪高频子带功率之后,开始步骤S18中的处理,从而计算针对每个估计系数的估计值。
换句话说,在步骤S18中,伪高频子带功率差计算电路36使用待被处理的当前帧J来计算针对K个估计系数中的每个估计系数的估计值Res(id,J)。
更具体地,伪高频子带功率差计算电路36通过执行下面的表达式(5)中的计算来计算残差均方值Resstd(id,J)。
[表达式5]
...(5)
换句话说,对于在高频侧的每个子带ib(其中sb+1≤ib≤eb),获得帧J的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之差,并将该差的均方值确定为残差均方值Resstd(id,J)。
注意,伪高频子带功率powerest(ib,id,J)表示帧J中的针对具有系数索引id的估计系数所获得的子带ib的伪高频子带功率。
随后,伪高频子带功率差计算电路36通过执行下面的表达式(6)中的计算来计算残差的最大值Resmax(id,J)。
[表达式6]
Resmax(id,J)=maxib{|power(ib,J)-powerest(ib,id,J)|}
...(6)
注意,在表达式(6)中,maxib{|power(ib,J)-powerest(ib,id,J)|}表示每个子带ib的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之差的绝对值的最大值。因此,将帧J中的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之差的绝对值的最大值确定为残差的最大值Resmax(id,J)。
另外,伪高频子带功率差计算电路36通过执行下面的表达式(7)中的计算来计算残差均值Resave(id,J)。
[表达式7]
换句话说,对于在高频侧的每个子带ib,获得帧J中的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之差,并获得该差之和。随后,将所获得的该差之和除以在高频侧的子带的数目(eb-sb),并将由此所获得的值的绝对值确定为残差均值Resave(id,J)。此残差均值Resave(id,J)表示针对考虑待编码的每个子带的估计系数的均值的大小。
另外,在获得残差均方值Resstd(id,J)、残差的最大值Resmax(id,J)和残差均值Resave(id,J)之后,伪高频子带功率差计算电路36通过执行下面的表达式(8)中的计算来计算最终估计值Res(id,J)。
[表达式8]
Res(id,J)=Wstd×Resstd(id,J)+Wmax×Resmax(id,J)+Wave×Resave(id,J)...(8)
换句话说,对残差均方值Resstd(id,J)、残差的最大值Resmax(id,J)和残差均值Resave(id,J)进行加权,从而获得最终估计值Res(id,J)。注意,在表达式(8)中,Wstd、Wmax和Wave是预定权重,诸如,Wstd=1,Wmax=0.5和Wave=0.5。
伪高频子带功率差计算电路36通过执行上述处理来计算针对K个估计系数中的每个估计系数(即K个系数索引id中的每个索引id)的估计值Res(id,J)。
在步骤S19中,伪高频子带功率差计算电路36基于针对每个系数索引id所获得的估计值Res(id,J)来选择系数索引id。
从步骤S18中的处理所获得的估计值Res(id,J)表示根据实际高频子带信号所计算出的高频子带功率与使用具有系数索引id的估计系数所计算出的伪高频子带功率之间的相似度。就是说,表示了高频分量的估计差的大小。
因此,估计值Res(id,J)越小,使用估计系数通过运算就能够获得与实际高频子带信号越接近的信号。因此,伪高频子带功率差计算电路36从K个估计值Res(id,J)之中选择最小的估计值,并将表示与该估计值对应的估计系数的系数索引提供给高频编码电路37。
在步骤S20中,高频编码电路37对从伪高频子带功率差计算电路36提供的系数索引进行编码,并将由此所获得的高频编码数据提供给复用电路38。
例如,在步骤S20中,针对该系数索引执行熵编码等。注意,高频编码数据可以是任何种类的信息,只要该信息能够获得最佳估计系数即可。例如,可以使用系数索引作为高频编码数据,而无需变化。
在步骤S21中,复用电路38对从低频编码电路32提供的低频编码数据和从高频编码电路37提供的高频编码数据进行复用,并输出由此所获得的输出代码串,从而结束编码处理。
如上所述,编码装置11针对所记录的每个估计系数计算表示高频分量的估计差的估计值,并选择具有最小估计值的估计系数。然后,编码装置11对表示所选择的估计系数的系数索引进行编码以获得高频编码数据,并对低频编码数据和高频编码数据进行复用以获得输出代码串。
从而,接收输出代码串的解码装置能够获得用于通过对系数索引连同低频编码数据进行编码并输出由此所获得的作为输出代码串的高频编码数据来估计高频分量的最佳估计系数。这使得可以获得具有更高的音频质量的信号。
而且,在计算用于计算估计值的高频子带功率时执行运算以对具有更大的功率的QMF子带功率进行更大地加权。因此,在对输出代码串进行解码时,对于输入信号中的具有大的QMF子带功率的QMF子带可以再现与原始QMF子带信号的功率更接近的功率。这使得可以在解码时获得与输入信号的音频质量更接近的音频信号,并且还可以提高关于可听度的音频质量。
<修改例>
[子带功率的计算]
注意,虽然根据上述描述通过表达式(4)中的运算来计算高频子带功率,然而可以通过计算QMF子带功率的加权均值来计算高频子带功率。
在这样的情况下,例如,高频子带功率计算单元52通过在图4的步骤S17中执行下面的表达式(9)中的计算来计算待处理的帧J中的高频子带ib(其中sb+1≤ib≤eb)的子带功率power(ib,J)。
[表达式9]
...(9)
注意,在表达式(9)中,start(ib)和end(ib)分别表示在构成子带ib的QMF子带之中具有最低频率的QMF子带的索引和具有最高频率的QMF子带的索引。另外,powerQMF(ibQMF,J)表示帧J中构成高频子带ib的QMF子带ibQMF的QMF子带功率。
此外,在表达式(9)中,WQMF(powerQMF(ibQMF,J))是根据QMF子带功率powerQMF(ibQMF,J)的大小而变化的权重,并且例如如下面的表达式(10)所示来进行计算。
[表达式10]
WQMF(powerQMF(ibQMF,J))=0.01×10×log10{powerQMF(ibQMF,J)}+1...(10)
换句话说,QMF子带功率powerQMF(ibQMF,J)越大,权重WQMF(powerQMF(ibQMF,J))就越大。
因此,在表达式(9)中,添加根据QMF子带功率的大小而变化的权重,并且对每个QMF子带的QMF子带功率进行加权。然后,将由此所获得的值除以QMF子带的数目(end(ib)-start(ib)+1)。此外,将由此所获得的值变换成对数值并确定为高频子带功率。就是说,能够通过获得每个QMF子带功率的加权均值来获得高频子带功率。
在如上所述通过计算加权均值来获得高频子带功率的情况下,还对更高的功率的QMF子带功率进行更大地加权。因此,可以在对输出代码串进行解码时再现与原始QMF子带信号的功率更接近的功率。因此,可以在解码时获得与输入信号更接近的音频信号,从而提高关于可听度的音频质量。
[解码装置的配置]
接下来,将描述接收从编码装置11输出的输出代码串并对输出代码串进行解码的解码装置。
例如,如图5所示来配置这样的解码装置。
解码装置81包括解复用电路91、低频解码电路92、子带划分电路93、特征量计算电路94、高频解码电路95、解码高频子带功率计算电路96、解码高频信号生成电路97和合成电路98。
解复用电路91接收来自编码装置11的输出代码串作为输入代码串,并将输入代码串解复用成高频编码数据和低频编码数据。此外,解复用电路91将通过解复用所获得的低频编码数据提供给低频解码电路92,并将通过解复用所获得的高频编码数据提供给高频解码电路95。
低频解码电路92对来自解复用电路91的低频编码数据进行解码,并将由此所获得的经解码的低频信号提供给子带划分电路93和合成电路98。
子带划分电路93将来自低频解码电路92的经解码的低频信号划分成多个相等的低频子带信号(每个低频子带信号均具有预定带宽),并将所获得的低频子带信号提供给特征量计算电路94和解码高频信号生成电路97。
特征量计算电路94基于来自子带划分电路93的低频子带信号来计算在低频侧的每个子带的低频子带功率作为特征量,并将该特征量提供给解码高频子带功率计算电路96。
高频解码电路95对来自解复用电路91的高频编码数据进行解码,并将通过由此所获得的系数索引所指定的估计系数提供给解码高频子带功率计算电路96。换句话说,在高频解码电路95中,以相关联的方式预先记录多个系数索引和该系数索引所指定的估计系数,并且高频解码电路95输出与包括在高频编码数据中的系数索引对应的估计系数。
基于来自高频解码电路95的估计系数和来自特征量计算电路94的低频子带功率,解码高频子带功率计算电路96针对每个帧计算经解码的高频子带功率,该经解码的高频子带功率是在高频侧的每个子带的子带功率的估计值。例如,通过执行与以上表达式(3)相同的运算来计算该经解码的高频子带功率。解码高频子带功率计算电路96将所计算出的每个子带的经解码的高频子带功率提供给解码高频信号生成电路97。
解码高频信号生成电路97基于来自子带划分电路93的低频子带信号和来自解码高频子带功率计算电路96的经解码的高频子带功率来生成经解码的高频信号,以提供给合成电路98。
更具体地,解码高频信号生成电路97计算低频子带信号的低频子带功率,并响应于经解码的高频子带功率相对于低频子带功率的比率来调制低频子带信号的幅度。此外,解码高频信号生成电路97通过调制具有所调制的幅度的低频子带信号的频率来生成在高频侧的每个子带的经解码的高频子带信号。这样获得的经解码的高频子带信号是在输入信号的高频侧的每个子带的高频子带信号的估计值。解码高频信号生成电路97将包括针对每个子带所获得的经解码的高频子带信号的经解码的高频信号提供给合成电路98。
合成电路98将来自低频解码电路92的经解码的低频信号和来自解码高频信号生成电路97的经解码的高频信号进行合成,以作为输出信号来输出。通过对经编码的输入信号进行解码来获得此输出信号,并且此输出信号包括高频分量和低频分量。
此外,以上描述的本技术可以应用于音频编码系统,诸如HE-AAC(国际标准ISO/IEC14496-3)和AAC(MPEG2AAC(高级音频编码))(国际标准ISO/IEC13818-7)。
在HE-AAC中,使用称为SBR的高频特征编码技术。根据SBR,如上所述在对音频信号进行编码时,SBR信息连同经编码的音频信号的低频分量一起被输出用于生成音频信号的高频分量。
更具体地,由QMF分析滤波器将输入信号划分成QMF子带的多个QMF子带信号,并获得通过捆绑多个连续的QMF子带所形成的每个子带的功率的表示值。该功率的表示值对应于在图4的步骤S17的处理中所计算的高频子带功率。
此外,通过对每个高频子带的功率的表示值进行量化来获得SBR信息,并且将此SBR和包括低频编码数据的比特流输出至解码装置作为输出代码串。
另外,根据AAC,通过MDCT(ModifiedDiscreteCosineTransform,改进的离散余弦变换)将时间信号变换成表示频域的MDCT系数。并且将用浮点数表达的量化值的信息包括在比特流中。根据AAC,捆绑有多个连续的MDCT系数的频带称为比例因子带(scalefactorband)。
针对包括在每个比例因子带中的MDCT系数通常使用一个比例因子作为针对MDCT系数的用浮点数表达的比例因子(索引部分)。
编码装置根据多个MDCT系数获得针对每个比例因子的表示值,并确定比例因子值使得能够适当地描述该表示值,然后将该信息被包括在比特流中。本技术能够应用于根据多个MDCT系数来计算表示值以确定每个比例因子带的比例因子值。
注意,可以由硬件并且还可以由软件来执行上述一系列处理。在由软件来执行该系列处理的情况下,从程序记录介质中将构成其软件的程序例如安装在具有内建专用硬件的计算机中或安装在能够通过所安装的各种类型的程序来执行各种类型的功能的通用个人计算机中。
图6是示出了根据程序执行上述一系列处理的计算机的硬件的示例性配置的框图。
在计算机中,CPU(中央处理单元)301、ROM(只读存储器)302和RAM(随机存取存储器)303通过总线304相互连接。
输入/输出接口305还连接至总线304。输入/输出接口305连接至:输入单元306,输入单元306包括键盘、鼠标或麦克风等;输出单元307,输出单元307包括显示器或扬声器等;记录单元308,记录单元308包括硬盘或非易失性存储器等;通信单元309,通信单元309包括网络接口等;以及驱动器310,驱动器310用于驱动可移除介质311,诸如磁盘、光盘、磁光盘或半导体存储器等。
在如上所述那样配置的计算机中,CPU301通过输入/输出接口305和总线304将记录在记录单元308中的程序加载到RAM303中,并通过执行该程序来执行上述一系列处理。
通过将计算机(CPU301)执行的程序记录在可移除介质311中来提供该程序,其中可移除介质311是包括磁盘(包括软盘)、光盘(CD-ROM(致密盘只读存储器)或DVD(数字通用盘)等)、磁光盘或半导体存储器等的封装介质,或经由诸如局域网、互联网或数字卫星广播的有线或无线传输介质来提供该程序。
通过将可移除介质311安装在驱动器310上来经由输入/输出接口305将程序安装在记录单元308中。此外,可以经由有线或无线传输介质在通信单元339中接收程序,并将该程序安装在记录单元308中。另外,可以将程序预先安装在ROM302或记录单元308中。
要由计算机执行的程序可以是用于根据本说明书所描述的顺序按照时间顺序执行处理的程序,或用于并行地或在需要时诸如响应于调用来执行处理的程序。
此外,本技术的实施方式不限于上述实施方式,而可以在不偏离本技术的范围的情况下进行各种修改。
此外,本技术可以被配置如下。
[1]
一种编码装置,包括:
子带划分单元,被配置成划分输入信号的频带并生成在所述输入信号的高频侧的第一子带的第一子带信号;
第一子带功率计算单元,被配置成基于所述第一子带信号来计算所述第一子带信号的第一子带功率;
第二子带功率计算单元,被配置成执行运算以对具有更大功率的所述第一子带功率进行更大加权,并计算第二子带信号的第二子带功率,所述第二子带信号包括多个连续的第一子带;
生成单元,被配置成基于所述第二子带功率来生成以下数据:所述数据用于通过估计来获得所述输入信号的高频信号;
低频编码单元,被配置成对所述输入信号的低频信号进行编码以生成低频编码数据;以及
复用单元,被配置成对所述数据和所述低频编码数据进行复用并生成输出代码串。
[2]
根据[1]所述的编码装置,还包括:
伪高频子带功率计算单元,被配置成基于从所述低频信号获得的特征量或所述输入信号来计算伪高频子带功率,其中所述伪高频子带功率是所述第二子带功率的估计值,
其中,所述生成单元通过将所述第二子带功率与所述伪高频子带功率进行比较来生成所述数据。
[3]
根据[2]所述的编码装置,其中,
所述伪高频子带功率计算单元基于所述特征量和预先准备的估计系数来计算所述伪高频子带功率,以及
所述生成单元生成所述数据,所述数据用于获得多个所述估计系数中的任一个估计系数。
[4]
根据[1]至[3]中任一项所述的编码装置,还包括:
高频编码单元,被配置成通过对所述数据进行编码来生成高频编码数据,
其中,所述复用单元对所述高频编码数据和所述低频编码数据进行复用以生成所述输出代码串。
[5]
根据[1]至[4]中任一项所述的编码装置,其中,所述第二子带功率计算单元通过对以指数m自乘过的所述第一子带功率的平均值以指数1/m自乘来计算所述第二子带功率。
[6]
根据[1[至[4]中任一项所述的编码装置,
其中,所述第二子带功率计算单元通过使用随所述第一子带功率变得更大而变得更大的权重获得所述第一子带功率的加权平均值来计算所述第二子带功率。
[7]
一种编码方法,包括以下步骤:
划分输入信号的频带并生成在所述输入信号的高频侧的第一子带的第一子带信号;
基于所述第一子带信号来计算所述第一子带信号的第一子带功率;
执行运算以对具有更大功率的所述第一子带功率进行更大加权,并计算第二子带信号的第二子带功率,所述第二子带信号包括多个连续的所述第一子带;
基于所述第二子带功率来生成以下数据:所述数据用于通过估计来获得所述输入信号的高频信号;
对所述输入信号的低频信号进行编码以生成低频编码数据;以及
对所述数据和所述低频编码数据进行复用以生成输出代码串。
[8]
一种使计算机执行以下处理的程序,所述处理包括:
划分输入信号的频带并生成在所述输入信号的高频侧的第一子带的第一子带信号;
基于所述第一子带信号来计算所述第一子带信号的第一子带功率;
执行运算以对具有更大功率的所述第一子带功率进行更大加权,并计算第二子带信号的第二子带功率,所述第二子带信号包括多个连续的第一子带;
基于所述第二子带功率来生成以下数据:所述数据用于通过估计来获得所述输入信号的高频信号;
对所述输入信号的低频信号进行编码以生成低频编码数据;以及
对所述数据和所述低频编码数据进行复用以生成输出代码串。
[9]
一种解码装置,包括:
解复用单元,所述解复用单元被配置成将输入代码串解复用成数据和低频编码数据,其中基于第二子带信号的第二子带功率来生成所述数据,所述第二子带信号包括在输入信号的高频侧的多个连续的第一子带,所述第二子带功率是通过对所述第一子带的第一子带功率中具有更大功率的第一子带功率进行更大加权来计算的,并且所述第二子带功率被用于通过估计来获得所述输入信号的高频信号,以及通过对所述输入信号的低频信号进行编码来获得所述低频编码数据;
低频解码单元,被配置成对所述低频编码数据进行解码以生成低频信号;
高频信号生成单元,被配置成基于从所述数据获得的估计系数和从所述解码获得的低频信号来生成高频信号;以及
合成单元,被配置成基于所生成的高频信号和从所述解码获得的低频信号来生成输出信号。
[10]
根据[9]所述的解码装置,其中,
所述高频信号生成单元基于所述估计系数和从低频信号获取的特征量来计算所述第二子带功率的估计值,并基于从所述解码获得的低频信号和所述第二子带功率的估计值来生成高频信号,其中,所述低频信号是从所述解码获得的。
[11]
根据[9]或[10]所述的解码装置,还包括:高频解码单元,被配置成对所述数据进行解码以获得所述估计系数。
[12]
根据[9]至[11]中任一项所述的解码装置,其中,
基于从所述输入信号的低频信号获得的特征量或所述输入信号来计算作为所述第二子带功率的估计值的伪高频子带功率,并且通过将所述第二子带功率与所述伪高频子带功率进行比较来生成所述数据。
[13]
根据[12]所述的解码装置,其中,
基于从所述输入信号的低频信号获得的特征量或所述输入信号、以及预先准备的估计系数来计算所述伪高频子带功率,并且生成所述数据,所述数据用于获得多个所述估计系数中的任一个所述估计系数。
[14]
根据[9]至[13]中任一项所述的解码装置,其中,
通过对以指数m自乘过的所述第一子带功率的平均值以指数1/m自乘来计算所述第二子带功率。
[15]
根据[9]至[13]中任一项所述的解码装置,其中,
通过使用随所述第一子带功率变得更大而变得更大的权重获得所述第一子带功率的加权平均值来计算所述第二子带功率。
[16]
一种解码方法,包括以下步骤:
将输入代码串解复用成数据和低频编码数据,其中基于第二子带信号的第二子带功率来生成所述数据,所述第二子带信号包括在输入信号的高频侧的多个连续的第一子带,所述第二子带功率是通过对所述第一子带的第一子带功率中具有更大功率的第一子带功率进行更大加权来计算的,并且所述第二子带功率被用于通过估计来获得所述输入信号的高频信号,以及通过对所述输入信号的低频信号进行编码来获得所述低频编码数据;
对所述低频编码数据进行解码以生成低频信号;
基于从所述数据获得的估计系数和从所述解码获得的低频信号来生成高频信号;以及
基于所生成的高频信号和从所述解码获得的低频信号来生成输出信号。
[17]
一种使计算机执行处理的程序,所述处理包括以下步骤:
将输入代码串解复用成数据和低频编码数据,其中基于第二子带信号的第二子带功率来生成所述数据,所述第二子带信号包括在输入信号的高频侧的多个连续的第一子带,所述第二子带功率是通过对所述第一子带的第一子带功率中具有更大功率的第一子带功率进行更大加权来计算的,并且所述第二子带功率被用于通过估计来获得所述输入信号的高频信号,以及通过对所述输入信号的低频信号进行编码来获得所述低频编码数据;
对所述低频编码数据进行解码以生成低频信号;
基于从所述数据获得的估计系数和从所述解码获得的低频信号来生成高频信号;以及
基于所生成的高频信号和从所述解码获得的低频信号来生成输出信号。
参考标号列表
11编码装置
32低频编码电路
33QMF子带划分电路
34特征量计算电路
35伪高频子带功率计算电路
36伪高频子带功率差计算电路
37高频编码电路
38复用电路
51QMF子带功率计算单元
52高频子带功率计算单元
Claims (15)
1.一种编码装置,包括:
子带划分单元,被配置成划分输入信号的频带并生成在所述输入信号的高频侧的第一子带的第一子带信号;
第一子带功率计算单元,被配置成基于所述第一子带信号来计算所述第一子带信号的第一子带功率;
第二子带功率计算单元,被配置成执行运算以对具有更大功率的所述第一子带功率进行更大加权,并计算第二子带信号的第二子带功率,所述第二子带信号包括多个连续的第一子带;
生成单元,被配置成基于所述第二子带功率来生成以下数据:所述数据用于通过估计来获得所述输入信号的高频信号;
低频编码单元,被配置成对所述输入信号的低频信号进行编码以生成低频编码数据;以及
复用单元,被配置成对所述数据和所述低频编码数据进行复用以生成输出代码串。
2.根据权利要求1所述的编码装置,还包括:
伪高频子带功率计算单元,被配置成基于从所述低频信号获得的特征量或所述输入信号来计算伪高频子带功率,其中所述伪高频子带功率是所述第二子带功率的估计值,
其中,所述生成单元通过将所述第二子带功率与所述伪高频子带功率进行比较来生成所述数据。
3.根据权利要求2所述的编码装置,其中,
所述伪高频子带功率计算单元基于所述特征量和预先准备的估计系数来计算所述伪高频子带功率,以及
所述生成单元生成所述数据,所述数据用于获得多个所述估计系数中的任一个估计系数。
4.根据权利要求3所述的编码装置,还包括:
高频编码单元,被配置成通过对所述数据进行编码来生成高频编码数据,
其中,所述复用单元对所述高频编码数据和所述低频编码数据进行复用以生成所述输出代码串。
5.根据权利要求4所述的编码装置,其中,所述第二子带功率计算单元通过对以指数m自乘过的所述第一子带功率的平均值以指数1/m自乘来计算所述第二子带功率。
6.根据权利要求4所述的编码装置,
其中,所述第二子带功率计算单元通过使用随所述第一子带功率变得更大而变得更大的权重获得所述第一子带功率的加权平均值来计算所述第二子带功率。
7.一种编码方法,包括以下步骤:
划分输入信号的频带并生成在所述输入信号的高频侧的第一子带的第一子带信号;
基于所述第一子带信号来计算所述第一子带信号的第一子带功率;
执行运算以对具有更大功率的所述第一子带功率进行更大加权,并计算第二子带信号的第二子带功率,所述第二子带信号包括多个连续的所述第一子带;
基于所述第二子带功率来生成以下数据:所述数据用于通过估计来获得所述输入信号的高频信号;
对所述输入信号的低频信号进行编码以生成低频编码数据;以及
对所述数据和所述低频编码数据进行复用以生成输出代码串。
8.一种解码装置,包括:
解复用单元,所述解复用单元被配置成将输入代码串解复用成数据和低频编码数据,其中基于第二子带信号的第二子带功率来生成所述数据,所述第二子带信号包括在输入信号的高频侧的多个连续的第一子带,所述第二子带功率是通过对所述第一子带的第一子带功率中具有更大功率的第一子带功率进行更大加权来计算的,并且所述第二子带功率被用于通过估计来获得所述输入信号的高频信号,以及通过对所述输入信号的低频信号进行编码来获得所述低频编码数据;
低频解码单元,被配置成对所述低频编码数据进行解码以生成低频信号;
高频信号生成单元,被配置成基于从所述数据获得的估计系数和从所述解码获得的低频信号来生成高频信号;以及
合成单元,被配置成基于所生成的高频信号和从所述解码获得的低频信号来生成输出信号。
9.根据权利要求8所述的解码装置,其中,
所述高频信号生成单元基于所述估计系数和从低频信号获取的特征量来计算所述第二子带功率的估计值,并基于从所述解码获得的低频信号和所述第二子带功率的估计值来生成高频信号,其中,所述低频信号是从所述解码获得的。
10.根据权利要求9所述的解码装置,还包括:高频解码单元,被配置成对所述数据进行解码并获得所述估计系数。
11.根据权利要求9所述的解码装置,其中,
基于从所述输入信号的低频信号获得的特征量或所述输入信号来计算作为所述第二子带功率的估计值的伪高频子带功率,并且通过将所述第二子带功率与所述伪高频子带功率进行比较来生成所述数据。
12.根据权利要求11所述的解码装置,其中,
基于从所述输入信号的低频信号获得的特征量或所述输入信号、以及预先准备的估计系数来计算所述伪高频子带功率,并且生成所述数据,所述数据用于获得多个所述估计系数中的任一个所述估计系数。
13.根据权利要求9所述的解码装置,其中,
通过对以指数m自乘过的所述第一子带功率的平均值以指数1/m自乘来计算所述第二子带功率。
14.根据权利要求9所述的解码装置,其中,
通过使用随所述第一子带功率变得更大而变得更大的权重获得所述第一子带功率的加权平均值来计算所述第二子带功率。
15.一种解码方法,包括以下步骤:
将输入代码串解复用成数据和低频编码数据,其中基于第二子带信号的第二子带功率来生成所述数据,所述第二子带信号包括在输入信号的高频侧的多个连续的第一子带,所述第二子带功率是通过对所述第一子带的第一子带功率中具有更大功率的第一子带功率进行更大加权来计算的,并且所述第二子带功率被用于通过估计来获得所述输入信号的高频信号,以及通过对所述输入信号的低频信号进行编码来获得所述低频编码数据;
对所述低频编码数据进行解码以生成低频信号;
基于从所述数据获得的估计系数和从所述解码获得的低频信号来生成高频信号;以及
基于所生成的高频信号和从所述解码获得的低频信号来生成输出信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011182450A JP5975243B2 (ja) | 2011-08-24 | 2011-08-24 | 符号化装置および方法、並びにプログラム |
JP2011-182450 | 2011-08-24 | ||
PCT/JP2012/070684 WO2013027631A1 (ja) | 2011-08-24 | 2012-08-14 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103765509A CN103765509A (zh) | 2014-04-30 |
CN103765509B true CN103765509B (zh) | 2016-06-22 |
Family
ID=47746378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280040017.9A Active CN103765509B (zh) | 2011-08-24 | 2012-08-14 | 编码装置及方法、解码装置及方法 |
Country Status (12)
Country | Link |
---|---|
US (1) | US9361900B2 (zh) |
EP (2) | EP4156184A1 (zh) |
JP (1) | JP5975243B2 (zh) |
KR (1) | KR102055022B1 (zh) |
CN (1) | CN103765509B (zh) |
AU (1) | AU2012297805A1 (zh) |
BR (1) | BR112014003680A2 (zh) |
CA (1) | CA2840785A1 (zh) |
MX (1) | MX2014001870A (zh) |
RU (1) | RU2595544C2 (zh) |
WO (1) | WO2013027631A1 (zh) |
ZA (1) | ZA201401182B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP6037156B2 (ja) | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
RU2649944C2 (ru) | 2012-07-02 | 2018-04-05 | Сони Корпорейшн | Устройство декодирования, способ декодирования, устройство кодирования, способ кодирования и программа |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
RU2764260C2 (ru) | 2013-12-27 | 2022-01-14 | Сони Корпорейшн | Устройство и способ декодирования |
KR102384790B1 (ko) | 2014-08-25 | 2022-04-08 | 한국전자통신연구원 | 레이어드 디비전 멀티플렉싱을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법 |
WO2016032196A1 (ko) * | 2014-08-25 | 2016-03-03 | 한국전자통신연구원 | 레이어드 디비전 멀티플렉싱을 이용한 방송신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법 |
CA3065394C (en) | 2015-03-06 | 2022-05-17 | Electronics And Telecommunications Research Institute | Broadcast signal frame generating apparatus and broadcast signal frame generating method using bootstrap and preamble |
KR102454643B1 (ko) | 2015-03-06 | 2022-10-17 | 한국전자통신연구원 | 부트스트랩 및 프리앰블을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법 |
CN112233685B (zh) * | 2020-09-08 | 2024-04-19 | 厦门亿联网络技术股份有限公司 | 基于深度学习注意力机制的频带扩展方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
CN101996640A (zh) * | 2009-08-31 | 2011-03-30 | 华为技术有限公司 | 频带扩展方法及装置 |
EP2317509A1 (en) * | 2008-08-29 | 2011-05-04 | Sony Corporation | Device and method for expanding frequency band, device and method for encoding, device and method for decoding, and program |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
EP3336843B1 (en) * | 2004-05-14 | 2021-06-23 | Panasonic Intellectual Property Corporation of America | Speech coding method and speech coding apparatus |
KR20070084002A (ko) | 2004-11-05 | 2007-08-24 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 복호화 장치 및 스케일러블 부호화 장치 |
JP4899359B2 (ja) * | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR100813259B1 (ko) * | 2005-07-13 | 2008-03-13 | 삼성전자주식회사 | 입력신호의 계층적 부호화/복호화 장치 및 방법 |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
JP2007333785A (ja) | 2006-06-12 | 2007-12-27 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
US8498344B2 (en) * | 2008-06-20 | 2013-07-30 | Rambus Inc. | Frequency responsive bus coding |
JP5203077B2 (ja) * | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
GB0822537D0 (en) * | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
EP2555188B1 (en) * | 2010-03-31 | 2014-05-14 | Fujitsu Limited | Bandwidth extension apparatuses and methods |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
US8560330B2 (en) * | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP6037156B2 (ja) * | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) * | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5997592B2 (ja) * | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
-
2011
- 2011-08-24 JP JP2011182450A patent/JP5975243B2/ja active Active
-
2012
- 2012-08-14 BR BR112014003680A patent/BR112014003680A2/pt not_active Application Discontinuation
- 2012-08-14 MX MX2014001870A patent/MX2014001870A/es active IP Right Grant
- 2012-08-14 EP EP22202002.6A patent/EP4156184A1/en active Pending
- 2012-08-14 KR KR1020147003662A patent/KR102055022B1/ko active IP Right Grant
- 2012-08-14 EP EP12826007.2A patent/EP2750134B1/en active Active
- 2012-08-14 CN CN201280040017.9A patent/CN103765509B/zh active Active
- 2012-08-14 WO PCT/JP2012/070684 patent/WO2013027631A1/ja active Application Filing
- 2012-08-14 CA CA2840785A patent/CA2840785A1/en not_active Abandoned
- 2012-08-14 AU AU2012297805A patent/AU2012297805A1/en not_active Abandoned
- 2012-08-14 RU RU2014105812/08A patent/RU2595544C2/ru active
- 2012-08-14 US US14/237,990 patent/US9361900B2/en active Active
-
2014
- 2014-02-17 ZA ZA2014/01182A patent/ZA201401182B/en unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
EP2317509A1 (en) * | 2008-08-29 | 2011-05-04 | Sony Corporation | Device and method for expanding frequency band, device and method for encoding, device and method for decoding, and program |
CN101996640A (zh) * | 2009-08-31 | 2011-03-30 | 华为技术有限公司 | 频带扩展方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103765509A (zh) | 2014-04-30 |
EP2750134B1 (en) | 2022-11-16 |
US20140200900A1 (en) | 2014-07-17 |
BR112014003680A2 (pt) | 2017-03-01 |
MX2014001870A (es) | 2014-05-30 |
KR102055022B1 (ko) | 2019-12-11 |
KR20140050054A (ko) | 2014-04-28 |
JP5975243B2 (ja) | 2016-08-23 |
CA2840785A1 (en) | 2013-02-24 |
WO2013027631A1 (ja) | 2013-02-28 |
US9361900B2 (en) | 2016-06-07 |
RU2014105812A (ru) | 2015-08-27 |
ZA201401182B (en) | 2014-09-25 |
JP2013044923A (ja) | 2013-03-04 |
RU2595544C2 (ru) | 2016-08-27 |
EP4156184A1 (en) | 2023-03-29 |
EP2750134A4 (en) | 2015-04-29 |
EP2750134A1 (en) | 2014-07-02 |
AU2012297805A1 (en) | 2014-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103765509B (zh) | 编码装置及方法、解码装置及方法 | |
JP5253565B2 (ja) | 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム | |
JP4934427B2 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
EP1754222B1 (en) | Energy dependent quantization for efficient coding of spatial audio parameters | |
CN102656628B (zh) | 优化的低吞吐量参数编码/解码 | |
JP4272897B2 (ja) | 符号化装置、復号化装置およびその方法 | |
US9177569B2 (en) | Apparatus, medium and method to encode and decode high frequency signal | |
CA2489443C (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
Thiagarajan et al. | Analysis of the MPEG-1 Layer III (MP3) algorithm using MATLAB | |
RU2409874C2 (ru) | Сжатие звуковых сигналов | |
Spanias et al. | Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB | |
US20150149185A1 (en) | Audio encoding device and audio coding method | |
JP2000151414A (ja) | ディジタルオーディオ符号化装置、同符号化方法、及び同符号化プログラムを記録した記録媒体 | |
JP5569476B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |