CN102334159B - 编码装置、解码装置及其方法 - Google Patents

编码装置、解码装置及其方法 Download PDF

Info

Publication number
CN102334159B
CN102334159B CN201080009380.5A CN201080009380A CN102334159B CN 102334159 B CN102334159 B CN 102334159B CN 201080009380 A CN201080009380 A CN 201080009380A CN 102334159 B CN102334159 B CN 102334159B
Authority
CN
China
Prior art keywords
subband
unit
coded message
amplitude
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080009380.5A
Other languages
English (en)
Other versions
CN102334159A (zh
Inventor
山梨智史
押切正浩
江原宏幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN102334159A publication Critical patent/CN102334159A/zh
Application granted granted Critical
Publication of CN102334159B publication Critical patent/CN102334159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

公开了能够高效地对宽频带信号的高频部的频谱数据进行编码/解码,实现处理运算量的大幅度削减,并且还能改善解码信号的质量的编码装置。在该装置中,第1层编码单元(202)对输入信号的规定频率以下的低频部分进行编码,生成第1编码信息,第1层解码单元(203)对第1编码信息进行解码,生成解码信号,第2层编码单元(206)将输入信号的比规定频率高的高频部分分量割为多个子带,根据输入信号或解码信号,分别估计多个子带,部分地选择各个子带内的频谱分量,计算用于对选择出的频谱分量调整振幅的振幅调整参数,由此生成第2编码信息。

Description

编码装置、解码装置及其方法
技术领域
本发明涉及对信号进行编码来传输的通信系统所使用的编码装置、解码装置及其方法。
背景技术
在以互联网通信为代表的分组通信系统或移动通信系统等中传输声音/音乐信号的情况下,为了提高声音/音乐信号的传输效率,经常使用压缩/编码技术。另外,近年来,单纯地以低比特率对声音/音乐信号进行编码,另一方面,对于对更宽频带的声音/音乐进行编码的技术的需求正在提高。
对这种需求,已经开发了在不大幅增加编码后的信息量的情况下对宽频带的声音/音乐信号进行编码的各种技术。例如,在专利文献1公开的技术中,编码装置计算用于生成对一定时间量的输入音频信号进行变换而得到的频谱数据中的、高频部的频谱的参数,将该参数与低频部的编码信息一起输出。具体而言,编码装置将高频部的频谱数据分量割为多个子带,在各个子带中,计算确定与该子带的频谱最相似的低频部的频谱的参数。接着,编码装置对最相似的低频部的频谱使用二种比例因子,进行调整以使得生成的高频频谱中的峰值振幅、或子带的能量(以下称为子带能量)及形状与作为目标的输入信号的高频部的频谱的峰值振幅、子带能量、形状相似。
现有技术文献
专利文献
专利文献1:国际公开第2007/052088号
发明内容
发明要解决的问题
但是,在上述专利文献1中,编码装置在合成高频频谱时,对输入信号的频谱数据及合成的高频频谱数据中的所有样本(MDCT系数)进行对数变换。并且,编码装置计算各个子带能量及形状与作为目标的输入信号的高频部的频谱的峰值振幅、子带能量、形状相似的参数。因此,存在编码装置中的运算量非常大的问题。另外,解码装置将算出的参数适用于子带内的所有样本,未考虑各个样本的振幅大小。因此,使用上述算出的参数生成高频频谱时的解码装置中的运算量也非常大,并且生成的解码声音的质量不够好,有时还有可能产生异常声音。
本发明的目的是提供能够根据宽频带信号的低频部的频谱数据高效地对高频部的频谱数据进行编码、改善解码信号质量的编码装置、解码装置及其方法。
解决问题的方案
本发明的编码装置所采用的结构包括:第1编码单元,对输入信号的规定频率以下的低频部分进行编码,生成第1编码信息;解码单元,对所述第1编码信息进行解码,生成解码信号;以及第2编码单元,通过将所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号或所述解码信号分别估计所述多个子带,部分地选择所述各个子带内的频谱分量,计算调整选择出的频谱分量的振幅的振幅调整参数,从而生成第2编码信息,所述第2编码单元包括:分割单元,将所述输入信号的所述高频部分分割为P个子带,获得所述P个子带各自的开始位置和带宽作为频带分割信息,其中,P为大于1的整数;滤波单元,对所述解码信号进行滤波,生成从第1估计信号到第P估计信号为止的P个第p估计信号,其中,p=1,2,…,P;设定单元,使所述滤波单元中使用的音调系数变化并且进行设定;搜索单元,搜索所述音调系数中的、使所述第p估计信号与第p子带的相似度最大的音调系数作为第p最佳音调系数;以及复用单元,将从第1最佳音调系数到第P最佳音调系数为止的P个最佳音调系数与所述频带分割信息进行复用,获得所述第2编码信息,所述设定单元为了估计第1子带而使所述滤波单元中使用的音调系数在规定范围内变化并且进行设定,为了估计第2子带以后的第m子带而使所述滤波单元中使用的音调系数在与第m-1最佳音调系数对应的范围或所述规定范围内变化并且进行设定,其中,m=2,3,…,P。
本发明的解码装置所采用的结构包括:接收单元,接收在编码装置中生成了的第1编码信息和第2编码信息,所述第1编码信息是对输入信号的规定频率以下的低频部分进行编码而获得的信息,所述第2编码信息是通过以下方式而生成了的信息,即通过将所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号或对所述第1编码信息进行解码而获得的第1解码信号,分别估计所述多个子带,部分地选择所述各个子带内的频谱分量,计算调整选择出的频谱分量的振幅的振幅调整参数,并且,在生成所述第2编码信息时,将所述输入信号的所述高频部分分割为P个子带,获得所述P个子带各自的开始位置和带宽作为频带分割信息,对所述解码信号进行滤波,生成从第1估计信号到第P估计信号为止的P个第p估计信号,使所述滤波中使用的音调系数变化并且进行设定,搜索所述音调系数中的、使所述第p估计信号与第p子带的相似度最大的音调系数作为第p最佳音调系数,将从第1最佳音调系数到第P最佳音调系数为止的P个最佳音调系数与所述频带分割信息进行复用,获得所述第2编码信息,为了估计第1子带而用于所述滤波的音调系数在规定范围内变化并被设定,为了估计第2子带以后的第m子带而用于所述滤波的音调系数在与第m-1最佳音调系数对应的范围或所述规定范围内变化并被设定,其中,P为大于1的整数,p=1,2,…,P,m=2,3,…,P;第1解码单元,对所述第1编码信息进行解码,生成第2解码信号;以及第2解码单元,通过使用所述第2编码信息,从所述第2解码信号估计所述输入信号的高频部分,从而生成第3解码信号。
本发明的编码方法包括以下步骤:对输入信号的规定频率以下的低频部分进行编码,生成第1编码信息;对所述第1编码信息进行解码,生成解码信号;以及通过将所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号或所述解码信号,分别估计所述多个子带,部分地选择所述各个子带内的频谱分量,计算调整选择出的频谱分量的振幅的振幅调整参数,从而生成第2编码信息,生成所述第2编码信息的步骤包括:将所述输入信号的所述高频部分分割为P个子带,获得所述P个子带各自的开始位置和带宽作为频带分割信息的步骤,其中,P为大于1的整数;对所述解码信号进行滤波,生成从第1估计信号到第P估计信号为止的P个第p估计信号的步骤,其中,p=1,2,…,P;使所述滤波单元中使用的音调系数变化并且进行设定的步骤;搜索所述音调系数中的、使所述第p估计信号与第p子带的相似度最大的音调系数作为第p最佳音调系数的步骤;以及将从第1最佳音调系数到第P最佳音调系数为止的P个最佳音调系数与所述频带分割信息进行复用,获得所述第2编码信息的步骤,在设定所述音调系数的步骤中,为了估计第1子带而用于所述滤波的音调系数在规定范围内变化并且进行设定,为了估计第2子带以后的第m子带而使用于所述滤波的音调系数在与第m-1最佳音调系数对应的范围或所述规定范围内变化并且进行设定,其中,m=2,3,…,P。
本发明的解码方法包括以下步骤:接收在编码装置中生成了的第1编码信息和第2编码信息,所述第1编码信息是对输入信号的规定频率以下的低频部分进行编码而获得的信息,所述第2编码信息是通过以下方式而生成了的信息,即通过将所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号或对所述第1编码信息进行解码而获得的第1解码信号,分别估计所述多个子带,部分地选择所述各个子带内的频谱分量,计算调整选择出的频谱分量的振幅的振幅调整参数,并且,在生成所述第2编码信息时,将所述输入信号的所述高频部分分割为P个子带,获得所述P个子带各自的开始位置和带宽作为频带分割信息,对所述解码信号进行滤波,生成从第1估计信号到第P估计信号为止的P个第p估计信号,使所述滤波中使用的音调系数变化并且进行设定,搜索所述音调系数中的、使所述第p估计信号与第p子带的相似度最大的音调系数作为第p最佳音调系数,将从第1最佳音调系数到第P最佳音调系数为止的P个最佳音调系数与所述频带分割信息进行复用,获得所述第2编码信息,为了估计第1子带而用于所述滤波的音调系数在规定范围内变化并被设定,为了估计第2子带以后的第m子带而用于所述滤波的音调系数在与第m-1最佳音调系数对应的范围或所述规定范围内变化并被设定,其中,P为大于1的整数,p=1,2,…,P,m=2,3,…,P;对所述第1编码信息进行解码,生成第2解码信号;以及通过使用所述第2编码信息,从所述第2解码信号估计所述输入信号的高频部分,从而生成第3解码信号。
发明的效果
根据本发明,能够高效地对宽频带信号的高频部的频谱数据进行编码/解码,实现处理运算量的大幅度削减,并且还能改善解码信号的质量。
附图说明
图1是表示具有本发明的实施方式1的编码装置及解码装置的通信系统的结构的方框图。
图2是表示本发明实施方式1的图1所示的编码装置内部的主要结构的方框图。
图3是表示本发明实施方式1的图2所示的第2层编码单元内部的主要结构的方框图。
图4是表示本发明实施方式1的图3所示的增益编码单元的的主要结构的方框图。
图5是表示本发明实施方式1的图4所示的对数增益编码单元的的主要结构的方框图。
图6是用以详细说明本发明实施方式1的滤波单元中的滤波处理的图。
图7是表示本发明的实施方式1的搜索单元中对子带SBp搜索最佳音调系数Tp’的处理步骤的流程图。
图8是表示本发明实施方式1的图1所示的解码装置内部的主要结构的方框图。
图9是表示本发明实施方式1的图8所示的第2层解码单元内部的主要结构的方框图。
图10是表示本发明实施方式1的图9所示的频谱调整单元内部的主要结构的方框图。
图11是表示本发明实施方式1的图10所示的对数增益解码单元内部的主要结构的方框图。
图12是表示本发明的实施方式2的第2层编码单元内部的主要结构的方框图。
图13是表示本发明的实施方式2的图12所示的增益编码单元的主要结构的方框图。
图14是本发明的实施方式2的图13所示的对数增益编码单元内部的主要结构的方框图。
图15是表示本发明的实施方式2的对数增益解码单元内部的主要结构的方框图。
标号说明
101 编码装置
102 传输路径
103 解码装置
201 下采样处理单元
202 第1层编码单元
132、203 第1层解码单元
133、204 上采样处理单元
134、205、356 正交变换处理单元
206、226 第2层编码单元
207 编码信息合并单元
260 频带分割单元
261、352 滤波器状态设定单元
262、353 滤波单元
263 搜索单元
264 音调系数设定单元
235、265 增益编码单元
266 复用单元
241、271 理想增益编码单元
242、272 对数增益编码单元
253、281、371、381 最大振幅値搜索单元
251、282、372、382 样本群提取单元
252、283 对数增益计算单元
131 编码信息分离单元
135 第2层解码单元
351 分离单元
354 增益解码单元
355 频谱调整单元
361 理想增益解码单元
362 对数增益解码单元
373、383 对数增益适用单元
具体实施方式
本发明的主要特征在于,编码装置根据低频部的频谱数据生成作为编码对象的信号的高频部的频谱数据时,对根据子带内振幅最大的样本的位置而提取的样本群计算子带能量及形状的调整参数。并且,解码装置将所述参数适用于根据子带内振幅最大的样本的位置而提取出的样本群。通过这些特征,本发明能够高效地对宽频带信号的高频部的频谱数据进行编码/解码,实现处理运算量的大幅度削减,并且还能改善解码信号的质量。
以下,参照附图详细地说明本发明的实施方式。并且,作为本发明的编码装置及解码装置,以声音编码装置及声音解码装置为例进行说明。
(实施方式1)
图1是表示具有本发明的实施方式1的编码装置及解码装置的通信系统的结构的方框图。在图1中,通信系统具有编码装置101和解码装置103,分别处于可经由传输路径102进行通信的状态。并且,编码装置101及解码装置103通常均被安装在基站装置或通信终端装置等中来使用。
编码装置101以N个样本为单位划分输入信号(N为自然数),将N个样本作为1帧,对每帧进行编码。这里,将作为编码对象的输入信号表示为xn(n=0、…、N-1)。n表示以N个样本为单位划分的输入信号中的第n+1个信号要素。编码装置101经由传输路径102向解码装置103发送编码后的输入信息(编码信息)。
解码装置103接收经由传输路径102从编码装置101发送的编码信息,对其进行解码,得到输出信号。
图2是表示图1所示的编码装置101的内部主要结构的方框图。在将输入信号的采样频率设为SR1时,下采样处理单元201将输入信号的采样频率从SR1下采样到SR2(SR2<SR1),将下采样后的输入信号作为下采样后输入信号,输出到第1层编码单元202。并且,下面,作为一例,说明SR2为SR1的1/2的采样频率的情况。
第1层编码单元202例如使用CELP(Code Excited Linear Prediction:码激励线性预测)方式的声音编码方法对从下采样处理单元201输入的下采样后输入信号进行编码,生成第1层编码信息。具体而言,第1层编码单元202对输入信号的规定频率以下的低频部分进行编码,生成第1层编码信息。然后,第1层编码单元202将生成的第1层编码信息输出到第1层解码单元203及编码信息合并单元207。
第1层解码单元203例如使用CELP方式的声音解码方法对从第1层编码单元202输入的第1层编码信息进行解码,生成第1层解码信号。然后,第1层解码单元203将生成的第1层解码信号输出到上采样处理单元204。
上采样处理单元204将从第1层解码单元203输入的第1层解码信号的采样频率从SR2上采样到SR1,将上采样后的第1层解码信号作为上采样后第1层解码信号,输出到正交变换处理单元205。
正交变换处理单元205在内部具有缓存器buf1n及buf2n(n=0、…、N-1),对输入信号xn及从上采样处理单元204输入的上采样后第1层解码信号yn进行改进离散余弦变换(MDCT:Modified Discrete Cosine Transform)。
以下,对于正交变换处理单元205的正交变换处理,说明其计算顺序和面向内部缓存器的数据输出。
首先,正交变换处理单元205根据下式(1)及式(2),分别将“0”作为缓存器buf1n及buf2n的初始值,进行初始化。
buf1n=0  (n=0,…,N-1)···(1)
buf2n=0  (n=0,…,N-1)···(2)
接着,正交变换处理单元205根据下式(3)及式(4)对输入信号xn及上采样后第1层解码信号yn进行MDCT,求出输入信号的MDCT系数(以下称为输入频谱)S2(k)及上采样后第1层解码信号yn的MDCT系数(以下称为第1层解码频谱)S1(k)。
S 2 ( k ) = 2 N Σ n = 0 2 N - 1 x n ′ cos [ ( 2 n + 1 + N ) ( 2 k + 1 ) π 4 N ] , ( k = 0 , · · · , N - 1 ) · · · ( 3 )
S 1 ( k ) = 2 N Σ n = 0 2 N - 1 y n ′ cos [ ( 2 n + 1 + N ) ( 2 k + 1 ) π 4 N ] , ( k = 0 , · · · , N - 1 ) · · · ( 4 )
这里,k表示1帧中的各样本的索引。正交变换处理单元205根据下式(5)求出使输入信号xn与缓存器buf1n结合后的矢量即xn’。另外,正交变换处理单元205根据下式(6)求出使上采样后第1层解码信号yn与缓存器buf2n结合后的矢量即yn’。
x n ′ = buf 1 n ( n = 0 , · · · N - 1 ) x n - N ( n = N , · · · 2 N - 1 ) · · · ( 5 )
y n ′ = buf 2 n ( n = 0 , · · · N - 1 ) y n - N ( n = N , · · · 2 N - 1 ) · · · ( 6 )
接着,正交变换处理单元205根据式(7)及式(8),更新缓存器buf1n及buf2n
buf1n=xn(n=0,…N-1)···(7)
buf2n=yn(n=0,…N-1)···(8)
然后,正交变换处理单元205将输入频谱S2(k)及第1层解码频谱S1(k)输出到第2层编码单元206。
以上对正交变换处理单元205中的正交变换处理进行了说明。
第2层编码单元206使用从正交变换处理单元205输入的输入频谱S2(k)及第1层解码频谱S1(k)生成第2层编码信息,将生成的第2层编码信息输出到编码信息合并单元207。此外,第2层编码单元206的详细情况将在后面阐述。
编码信息合并单元207将从第1层编码单元202输入的第1层编码信息与从第2层编码单元206输入的第2层编码信息合并,在必要的情况下,对合并后的信息源码附加传输错误码等,然后将其作为编码信息,输出到传输路径102。
接下来使用图3说明图2所示的第2层编码单元206的内部主要结构。
第2层编码单元206具有频带分割单元260、滤波器状态设定单元261、滤波单元262、搜索单元263、音调系数(pitch factor)设定单元264、增益编码单元265及复用单元266,各部分进行以下动作。
频带分割单元260将从正交变换处理单元205输入的输入频谱S2(k)的比规定频率高的高频部(FL≤k<FH)分隔成P个(其中,P为大于1的整数)子带SBp(p=0,1,…,P-1)。然后,频带分割单元260将分割的各个子带的带宽BWp(p=0,1,…,P-1)及开头索引(即,子带的开始位置)BSp(p=0,1,…,P-1)(FL≤BSp<FH)作为频带分割信息,输出到滤波单元262、搜索单元263及复用单元266。以下将输入频谱S2(k)中的与子带SBp对应的部分记作子带频谱S2p(k)(BSp≤k<BSp+BWp)。
滤波器状态设定单元261将从正交变换处理单元205输入的第1层解码频谱S1(k)(0≤k<FL)设定为滤波单元262使用的滤波器状态。即,第1层解码频谱S1(k)作为滤波器的内部状态(滤波器状态)存储在滤波单元262的全部频带0≤k<FH的频谱S(k)的0≤k<FL频带内。
滤波单元262具有多抽头的音调滤波器,根据由滤波器状态设定单元261设定的滤波器状态、从音调系数设定单元264输入的音调系数、从频带分割单元260输入的频带分割信息,对第1层解码频谱进行滤波,计算各个子带SBp(p=0,1,…,P-1)的估计值S2p’(k)(BSp≤k<BSp+BWp)(p=0,1,…,P-1)(以下称为“子带SBp的估计频谱”)。滤波单元262将子带SBp的估计频谱S2p’(k)输出到搜索单元263。关于滤波部262的滤波处理的详细情况,在后面进行叙述。并且,多抽头的抽头数可取1以上的任意值(整数)。
搜索单元263根据从频带分割单元260输入的频带分割信息,计算从滤波单元262输入的子带SBp的估计频谱S2p’(k)与从正交变换处理单元205输入的输入频谱S2(k)的高频部(FL≤k<FH)中的各个子带频谱S2p(k)之间的相似度。该相似度的计算例如是通过相关运算等来进行的。另外,滤波单元262、搜索单元263及音调系数设定单元264的处理对于每个子带构成闭环的搜索处理,在各闭环中,搜索单元263使从音调系数设定单元264输入滤波单元262的音调系数T进行各种变化,由此计算与各音调系数对应的相似度。搜索单元263在每个子带的闭环中,例如,求出在与子带SBp对应的闭环中相似度最大的最佳音调系数Tp’(但需在Tmin~Tmax的范围内),将P个最佳音调系数输出到复用单元266。关于搜索单元263中的相似度计算方法的详细情况,在后面进行叙述。
搜索单元263使用各最佳音调系数Tp’,计算与各个子带SBp类似的第1层解码频谱的一部分频带(即,与各个子带的各频谱最相似的频带)。另外,搜索单元263将与各最佳音调系数Tp’(p=0,1,…,P-1)对应的估计频谱S2p’(k)及根据式(9)算出的、计算最佳音调系数Tp’(p=0,1,…,P-1)时的振幅调整参数即理想增益α1p输出到增益编码单元265。并且,在式(9)中,M’表示计算相似度D时的样本数,可以是各个子带的带宽以下的任意值。当然,M’也可以采用子带宽度BWi的值。并且,关于搜索单元263的最佳音调系数Tp’(p=0,1,…,P-1)的搜索处理的详细情况,将在后面叙述。
&alpha; 1 p = &Sigma; k = 0 M &prime; S 2 ( BS p + k ) &CenterDot; S 2 &prime; ( BS p + k ) &Sigma; k = 0 M &prime; S 2 &prime; ( BS p + k ) &CenterDot; S 2 &prime; ( BS p + k ) p = 0 , &CenterDot; &CenterDot; &CenterDot; , P - 1 0 < M &prime; &le; BW p &CenterDot; &CenterDot; &CenterDot; ( 9 )
音调系数设定单元264在搜索单元263的控制下与滤波单元262及搜索单元263一起使音调系数T在预先确定的搜索范围Tmin~Tmax中逐渐变化,依次输出到滤波单元262。并且,也可以是,音调系数设定单元264例如在进行与第1子带对应的闭环搜索处理的情况下,使音调系数T在预先设定的搜索范围Tmin~Tmax中逐渐变化来进行设定,在进行与第2子带以后的第m(m=2,3,…,P)子带对应的闭环搜索处理的情况下,根据在与第m-1子带对应的闭环搜索处理中求出的最佳音调系数,使音调系数T逐渐变化来设定。
增益编码单元265根据输入频谱S2(k)及从搜索单元263输入的各个子带的估计频谱S2p’(k)(p=0,1,…,P-1)、理想增益α1p,对各个子带计算对数增益,该对数增益是进行非线性区域中的能量比调整的参数。接着,增益编码单元265对理想增益及对数增益进行量化,将量化后的理想增益及对数增益输出到复用单元266。
图4是表示增益编码单元265的内部结构的图。增益编码单元265主要包括理想增益编码单元271及对数增益编码单元272。
理想增益编码单元271使从搜索单元263输入的各个子带的估计频谱S2p’(k)(p=0,1,…,P-1)在频域中连续地构成输入频谱的高频部的估计频谱S2’(k)。接着,理想增益编码单元271根据式(10),将对从搜索单元263输入的各个子带的理想增益α1p与估计频谱S2’(k)相乘,计算估计频谱S3’(k)。并且,在式(10)中,BLp表示各个子带的开头索引,BHp表示各个子带的末端索引。而且,理想增益编码单元271将算出的估计频谱S3’(k)输出到对数增益编码单元272。另外,理想增益编码单元271对理想增益α1p进行量化,将量化后的理想增益α1Qp作为理想增益编码信息输出到复用单元266。
S3'(k)=S2'(k)·α1p  (BLp≤k≤BHp,for all p)···(10)
对数增益编码单元272计算对数增益,该对数增益是进行从正交变换处理单元205输入的输入频谱S2(k)的高频部(FL≤k<FH)与从理想增益编码单元271输入的估计频谱S3’(k)的每个子带的非线性区域中的能量比调整的参数(即,振幅调整参数)。而且,对数增益编码单元272将算出的对数增益作为对数增益编码信息输出到复用单元266。
图5表示对数增益编码单元272的内部结构。对数增益编码单元272主要包括最大振幅值搜索单元281、样本群提取单元282及对数增益计算单元283。
最大振幅值搜索单元281如式(11)所示对从理想增益编码单元271输入的估计频谱S3’(k),对于每个子带搜索最大振幅值MaxValuep、以及振幅最大的样本(频谱分量)的索引、最大振幅索引MaxIndexp
MaxValu e p = max ( | S 3 &prime; ( k ) | ) MaxInde x p = k where MaxValu e p = | S 3 &prime; ( k ) | ( BL p &le; k &le; BH p , for all p ) ( 11 )
然后,最大振幅值搜索单元281将估计频谱S3’(k)、最大振幅值MaxValuep及最大振幅索引MaxIndexp输出到样本群提取单元282。
样本群提取单元282如式(12)所示,根据对算出的各个子带的最大振幅索引MaxIndexp,决定对各样本的提取标志SelectFlag(k)。然后,样本群提取单元282将估计频谱S3’(k)、最大振幅值MaxValuep及提取标志SelectFlag(k)输出到对数增益计算单元283。并且,在式(12)中,Nearp表示在决定提取标志SelectFlag(k)时作为基准的阈值。
SelectFlag ( k ) = 1 if ( MaxInde x p - Ne ar p &le; k &le; MaxIn d e x p + Near p ) or ( k = 0,2 , 4,6,8 , . . . ( eve n ) ) ) 0 ( otherwise ) ( BL p &le; k &le; BH p , f or all p ) &CenterDot; &CenterDot; &CenterDot; ( 12 )
即,样本群提取单元282如式(12)所示按照如下基准设定提取标志SelectFlag(k)的值,该基准是:样本(频谱分量)与具有各个子带中的最大振幅值MaxValuep的样本越接近,则提取标志SelectFlag(k)的值越容易变为1。即,样本群提取单元282利用如下这样的权重来部分地选择样本,该权重使得样本与具有各个子带中的最大振幅值MaxValuep的样本越接近,则越容易被选择。具体而言,样本群提取单元282如式(12)所示,选择作为距最大振幅值MaxValuep的距离为Nearp以内的范围的索引的样本。另外,样本群提取单元282如式(12)所示,即使不与具有最大振幅值的样本接近,对于索引为偶数的样本,也将提取标志SelectFlag(k)的值设定为1。由此,即使在远离具有最大振幅值的样本的频带中存在具有较大振幅的样本,也能提取该样本或与该样本接近的振幅的样本。
对数增益计算单元283对于从样本群提取单元282输入的提取标志SelectFlag(k)的值为1的样本,按照式(13),计算估计频谱S3’(k)和输入频谱S2(k)的高频部(FL≤k<FH)的对数区域中的能量比(对数增益)α2p。并且,在式(13)中,M’表示对数增益的计算时使用的样本数,可以是各个子带的带宽以下的任意值。当然,M’也可以采用子带宽度BWi的值。
&alpha; 2 p = &Sigma; K = 0 M &prime; ( log 10 ( | S 2 ( BS p + k ) | ) - MaxValu e p ) &CenterDot; ( log 10 ( | S 3 &prime; ( BS p + k ) | ) - MaxValu e p ) &Sigma; K = 0 M &prime; ( log 10 ( | S 3 &prime; ( BS p + k ) | ) - MaxValu e p ) &CenterDot; ( log 10 ( | S 3 &prime; ( BS p + k ) | ) - MaxValu e p ) if SelectFlag ( k ) = 1 p = 0 , &CenterDot; &CenterDot; &CenterDot; , P - 1 0 < M &prime; &le; BW p &CenterDot; &CenterDot; &CenterDot; ( 13 )
即,对数增益计算单元283仅对由样本群提取单元282部分地选择的样本,计算对数增益α2p。然后,对数增益计算单元283对对数增益α2p进行量化,将量化后的对数增益α2Qp作为对数增益编码信息输出到复用单元266。
以上对增益编码单元265的处理进行了说明。
复用单元266将从频带分割单元260输入的频带分割信息、从搜索单元263输入的对各个子带SBp(p=0,1,…,P-1)的最佳音调系数Tp’、分别与从增益编码单元265输入的理想增益α1Qp及对数增益α2Qp对应的索引(理想增益编码信息及对数增益编码信息)作为第2层编码信息进行复用,输出到编码信息合并单元207。并且,也可以将Tp’与α1Qp及α2Qp的索引直接输入编码信息合并单元207,在编码信息合并单元207中与第1层编码信息复用。
接着,使用图6详细说明图3所示的滤波单元262中的滤波处理。
滤波单元262使用从滤波器状态设定单元261输入的滤波器状态、从音调系数设定单元264输入的音调系数T、从频带分割单元260输入的频带分割信息,对子带SBp(p=0,1,…,P-1),生成频带BSp≤k<BSp+BWp(p=0,1,…,P-1)中的估计频谱。滤波单元262中使用的滤波器的传递函数F(z)用下式(14)表示。
以下,以子带SBp为例,说明生成子带频谱S2p(k)的估计频谱S2p’(k)的处理。
F ( z ) = 1 1 - &Sigma; i = - M M &beta; i z - T + i &CenterDot; &CenterDot; &CenterDot; ( 14 )
在式(14)中,T表示从音调系数设定单元264提供的音调系数、βi表示预先存储在内部的滤波器系数。例如,在抽头数为3的情况下,可列举(β-1、β0、β1)=(0.1、0.8、0.1)作为滤波器系数的候选的一例。此外,(β-1、β0、β1)=(0.2、0.6、0.2)、(0.3、0.4、0.3)等值也是合适的。另外,也可以是(β-1、β0、β1)=(0.0、1.0、0.0)的值,在该情况下意味着对于频带0≤k<FL的第1层解码频谱的一部分频带,不改变其形状,而将其直接复制到BSp≤k<BSp+BWp的频带中。在以下的说明中,以(β-1、β0、β1)=(0.0、1.0、0.0)的情况为例进行说明。另外,在式(14)中,M=1。M是关于抽头数的指标。
第1层解码频谱S1(k)作为滤波器的内部状态(滤波器状态)存储在滤波单元262的全部频带的频谱S(k)的0≤k<FL的频带中。
通过以下步骤的滤波处理,子带SBp的估计频谱S2p’(k)存储在S(k)的BSp≤k<BSp+BWp的频带中。即,如图6所示,基本上,在S2p’(k)中代入比该k低T的频率的频谱S(k-T)。但是,为了增加频谱的平滑性,实际上是将对所有i对频谱βi·S(k-T+i)进行相加而得到的频谱代入S2p’(k),该频谱βi·S(k-T+i)是将规定的滤波器系数βi乘以与频谱S(k-T)相距i的附近的频谱S(k-T+i)而得到的。该处理用下式(15)表示。
S 2 p &prime; ( k ) = &Sigma; i = - 1 1 &beta; i &CenterDot; S 2 ( k - T + i ) 2 &CenterDot; &CenterDot; &CenterDot; ( 15 )
使k从频率低的k=BSp起依次在BSp≤k<BSp+BWp的范围内变化来进行上述运算,由此计算BSp≤k<BSp+BWp内的估计频谱S2p’(k)。
每当从音调系数设定单元264提供音调系数T时,在BSp≤k<BSp+BWp的范围内,每次将S(k)清零来执行上述滤波处理。即,每当音调系数T变化时计算S(k),并将其输出到搜索单元263。
图7是表示图3所示的搜索单元263中对子带SBp搜索最佳音调系数Tp’的处理步骤的流程图。并且,搜索单元263通过重复图7所示的步骤,搜索与各个子带SBp(p=0,1,…,P-1)对应的最佳音调系数Tp’(p=0,1,…,P-1)。
首先,搜索单元263将用于保存相似度最小值的变量即最小相似度Dmin初始化为“+∞”(ST2010)。接着,搜索单元263按照下式(16),计算某个音调系数下的输入频谱S2(k)的高频部(FL≤k<FH)与估计频谱S2p’(k)间的相似度D(ST2020)。
D = &Sigma; k = 0 M &prime; S 2 ( BS p + k ) &CenterDot; S 2 ( BS p + k ) - ( &Sigma; k = 0 M &prime; S 2 ( BS p + k ) &CenterDot; S 2 &prime; ( BS p + k ) ) 2 &Sigma; k = 0 M &prime; S 2 &prime; ( BS p + k ) &CenterDot; S 2 &prime; ( BS p + k ) , ( 0 < M &prime; &le; BW p ) &CenterDot; &CenterDot; &CenterDot; ( 16 )
并且,在式(16)中,M’表示计算相似度D时的样本数,可以是各个子带的带宽以下的任意值。当然,M’也可以采用子带宽度BWi的值。并且,式(16)中不存在S2p’(k),这是因为使用BSp和S2’(k)表示S2p’(k)。
接着,搜索单元263判定所算出的相似度D是否小于最小相似度Dmin(ST2030)。在ST2020中算出的相似度小于最小相似度Dmin的情况下(ST2030:“是”),搜索单元263将相似度D代入最小相似度Dmin(ST2040)。另一方面,在ST2020中算出的相似度为最小相似度Dmin以上的情况下(ST2030:“否”),搜索单元263判定搜索范围内的处理是否已结束。即,搜索单元263判定是否对搜索范围内的所有音调系数在ST2020中按照上式(16)分别计算了相似度(ST2050)。当在搜索范围内未结束处理时(ST2050:“否”),搜索单元263使处理再次返回到ST2020。然后,搜索单元263对与在上次的ST2020步骤中按照式(16)计算相似度时不同的音调系数,按照式(16)计算相似度。另一方面,当搜索范围内的处理结束时(ST2050:“是”),搜索单元263将与最小相似度Dmin对应的音调系数T作为最佳音调系数Tp’输出到复用单元266(ST2060)。
接着,说明图1所示的解码装置103。
图8是表示解码装置103的内部主要结构的方框图。
在图8中,编码信息分离单元131从输入的编码信息(即,从编码装置101接收到的编码信息)中分离第1层编码信息与第2层编码信息,将第1层编码信息输出到第1层解码单元132,将第2层编码信息输出到第2层解码单元135。
第1层解码单元132对从编码信息分离单元131输入的第1层编码信息进行解码,将生成的第1层解码信号输出到上采样处理单元133。这里,第1层解码单元132的动作与图2所示的第1层解码单元203相同,因此省略详细说明。
上采样处理单元133对从第1层解码单元132输入的第1层解码信号进行使采样频率从SR2上采样到SR1的处理,将得到的上采样后第1层解码信号输出到正交变换处理单元134。
正交变换处理单元134对从上采样处理单元133输入的上采样后第1层解码信号实施正交变换处理(MDCT),将得到的上采样后第1层解码信号的MDCT系数(以下称为第1层解码频谱)S1(k)输出到第2层解码单元135。这里,正交变换处理单元134的动作与图2所示的正交变换处理单元205对上采样后第1层解码信号的处理相同,因此省略详细说明。
第2层解码单元135使用从正交变换处理单元134输入的第1层解码频谱S1(k)及从编码信息分离单元131输入的第2层编码信息,生成包含高频分量的第2层解码信号,将其作为输出信号输出。
图9是表示图8所示的第2层解码单元135的内部主要结构的方框图。
分离单元351将从编码信息分离单元131输入的第2层编码信息分离为包含各个子带的带宽BWp(p=0,1,…,P-1)、开头索引BSp(p=0,1,…,P-1)(FL≤BSp<FH)的频带分割信息、作为与滤波相关的信息的最佳音调系数Tp’(p=0,1,…,P-1)、作为与增益相关的信息的理想增益编码信息(j=0,1,…,J-1)及对数增益编码信息(j=0,1,…,J-1)的索引。然后,分离单元351将频带分割信息及最佳音调系数Tp’(p=0,1,…,P-1)输出到滤波单元353,将理想增益编码信息及对数增益编码信息的索引输出到增益解码单元354。另外,在编码信息分离单元131中已经分离频带分割信息、最佳音调系数Tp’(p=0,1,…,P-1)、理想增益编码信息及对数增益编码信息的索引的情况下,也可以不配置分离单元351。
滤波器状态设定单元352将从正交变换处理单元134输入的第1层解码频谱S1(k)(0≤k<FL)设定为滤波单元353中使用的滤波器状态。这里,在为了方便起见将滤波单元353中的全部频带0≤k<FH的频谱称为S(k)的情况下,第1层解码频谱S1(k)作为滤波器的内部状态(滤波器状态)存储在S(k)的0≤k<FL的频带内。这里,滤波器状态设定单元352的结构及动作与图3所示的滤波器状态设定单元261相同,因此省略详细说明。
滤波单元353具有多抽头(抽头数大于1)的音调滤波器。滤波单元353根据从分离单元351输入的频带分割信息、由滤波器状态设定单元352设定的滤波器状态、从分离单元351输入的音调系数Tp’(p=0,1,…,P-1)、预先存储在内部的滤波器系数,对第1层解码频谱S1(k)进行滤波,计算上式(15)所示的、各个子带SBp(p=0,1,…,P-1)的估计值S2p’(k)(BSp≤k<BSp+BWp)(p=0,1,…,P-1)。在滤波单元353中,也使用上式(14)所示的滤波器函数。但是,该情况下的滤波处理及滤波器函数将式(14)、式(15)中的T置换为Tp’。即,滤波单元353根据第1层解码频谱估计编码装置101中的输入频谱的高频部。
增益解码单元354对从分离单元351输入的、理想增益编码信息及对数增益编码信息的索引进行解码,求出理想增益α1p及对数增益α2p的量化值即量化理想增益α1Qp及量化对数增益α2Qp
频谱调整单元355根据从滤波单元353输入的各个子带SBp(p=0,1,…,P-1)的估计值S2p’(k)(BSp≤k<BSp+BWp)(p=0,1,…,P-1)及从增益解码单元354输入的每个子带的理想增益α1Qp,计算解码频谱。然后,频谱调整单元355将算出的解码频谱输出到正交变换处理单元356。
图10是表示频谱调整单元355的内部结构的图。频谱调整单元355主要包括理想增益解码单元361及对数增益解码单元362。
理想增益解码单元361使从滤波单元353输入的各个子带的估计值S2p’(k)(BSp≤k<BSp+BWp)(p=0,1,…,P-1)在频域内连续,求出相对于输入频谱的估计频谱S2’(k)。接着,理想增益解码单元361按照下式(17),将从增益解码单元354输入的每个子带的量化理想增益α1Qp乘以估计频谱S2’(k),计算估计频谱S3’(k)。然后,理想增益解码单元361将估计频谱S3’(k)输出到对数增益解码单元362。
S3'(k)=S2'(k)·α1Qp  (BLp≤k≤BHp,for all p)···(17)
对数增益解码单元362使用从增益解码单元354输入的每个子带的量化对数增益α2Qp对从理想增益解码单元361输入的估计频谱S3’(k)进行对数区域内的能量调整,将得到的频谱作为解码频谱输出到正交变换处理单元356。
图11是表示对数增益解码单元362的内部结构的图。对数增益解码单元362主要包括最大振幅值搜索单元371、样本群提取单元372及对数增益适用单元373。
最大振幅值搜索单元371如式(11)所示对从理想增益解码单元361输入的估计频谱S3’(k),对于每个子带搜索最大振幅值MaxValuep、以及振幅最大的样本(频谱分量)的索引、最大振幅索引MaxIndexp。然后,最大振幅值搜索单元371将估计频谱S3’(k)、最大振幅值MaxValuep及最大振幅索引MaxIndexp输出到样本群提取单元372。
样本群提取单元372如式(12)所示,根据对算出的各个子带的最大振幅索引MaxIndexp,决定对各样本的提取标志SelectFlag(k)。即,样本群提取单元372利用如下这样的权重来部分地选择样本,该权重使得样本与具有各个子带中的最大振幅值MaxValuep的样本越接近,则越容易被选择。然后,样本群提取单元372将估计频谱S3’(k)、最大振幅值MaxValuep及提取标志SelectFlag(k)输出到对数增益适用单元373。
并且,最大振幅值搜索单元371及样本群提取单元372中的处理与编码装置101的最大振幅值搜索单元281及样本群提取单元282的处理是相同的处理。
对数增益适用单元373根据从样本群提取单元372输入的估计频谱S3’(k)、以及提取标志SelectFlag(k),如式(18)所示,计算表示提取的样本群的符号(+、-)的Signp(k)。即,如式(18)所示,对数增益适用单元373在提取的样本的符号为‘+’的情况下(S3’(k)≥0的情况下),设为Signp(k)=1,在此外的情况下(提取的样本的符号为‘-’的情况下),设为Signp(k)=-1。
Sign p ( k ) = 1 ( if S 3 &prime; ( k ) &GreaterEqual; 0 ) - 1 ( else ) ( BL p &le; k &le; BH p , for all p ) &CenterDot; &CenterDot; &CenterDot; ( 18 )
对数增益适用单元373根据从样本群提取单元372输入的估计频谱S3’(k)、最大振幅值MaxValuep及提取标志SelectFlag(k)、从增益解码单元354输入的量化对数增益α2Qp、及按照式(18)算出的符号Signp(k),对于提取标志SelectFlag(k)的值为1的样本,按照式(19)、式(20)计算解码频谱S5’(k)。
S 4 &prime; ( k ) = &alpha; 2 Q p &CenterDot; ( log 10 ( S 3 &prime; ( k ) ) - MaxValu e p ) + MaxValue p if SelectFlag ( k ) = 1 BL p &le; k &le; BH p , for all p &CenterDot; &CenterDot; &CenterDot; ( 19 )
S 5 &prime; ( k ) = 10 S 4 &prime; ( k ) &CenterDot; Sign p ( k ) if SelectFlag ( k ) = 1 BL p &le; k &le; BH p , for all p &CenterDot; &CenterDot; &CenterDot; ( 20 )
即,对数增益适用单元373仅对由样本群提取单元372部分地选择的样本(提取标志SelectFlag(k)=1的样本),适用对数增益α2p。然后,对数增益适用单元373将解码频谱S5’(k)输出到正交变换处理单元356。这里,解码频谱S5’(k)的低频部(0≤k<FL)由第1层解码频谱S1(k)构成,解码频谱S5’(k)的高频部(FL≤k<FH)由对估计频谱S3’(k)进行对数区域内的能量调整后的频谱构成。但是,对于解码频谱S5’(k)的高频部(FL≤k<FH)中的、未被样本群提取单元372选择的样本(提取标志SelectFlag(k)=0的样本),其值采用估计频谱S3’(k)的值。
正交变换处理单元356将从频谱调整单元355输入的解码频谱S5’(k)正交变换为时域的信号,将得到的第2层解码信号作为输出信号输出。这里,根据需要,进行适当的加窗及叠加等处理,避免帧间产生的不连续。
以下,对正交变换处理单元356中的具体处理进行说明。
正交变换处理单元356在内部具有缓存器buf’(k),如下式(21)所示,对缓存器buf’(k)进行初始化。
buf′(k)=0    (k=0,…,N-1)···(21)
另外,正交变换处理单元356使用从频谱调整单元355输入的第2层解码频谱S5’(k),按照下式(22),求出第2层解码信号yn”。
y n &prime; &prime; = 2 N &Sigma; n = 0 2 N - 1 Z 4 ( k ) cos [ ( 2 n + 1 + N ) ( 2 k + 1 ) &pi; 4 N ] , ( n = 0 , &CenterDot; &CenterDot; &CenterDot; , N - 1 ) &CenterDot; &CenterDot; &CenterDot; ( 22 )
在式(22)中,如下式(23)所示,Z4(k)是将解码频谱S5’(k)与缓存器buf’(k)结合后的矢量。
Z 4 ( k ) = buf &prime; ( k ) ( k = 0 , &CenterDot; &CenterDot; &CenterDot; N - 1 ) S 5 &prime; ( k ) ( k = N , &CenterDot; &CenterDot; &CenterDot; 2 N - 1 ) &CenterDot; &CenterDot; &CenterDot; ( 23 )
接着,正交变换处理单元356根据下式(24),更新缓存器buf’(k)。
buf'(k)=S5'(k)  (k=0,…N-1)···(24)
然后,正交变换处理单元356将解码信号yn”作为输出信号输出。
这样,根据本实施方式,在使用低频部的频谱进行扩频来估计高频部的频谱的编码/解码中,在使用解码后的低频频谱估计了高频部的频谱后,进行对估计频谱的各个子带中的最大振幅值的样本周边的样本加以重视的选择(抽取),仅对选择出的样本进行对数区域内的增益调整。根据该结构,能够大幅度减少对数区域内的增益调整所需的处理运算量。另外,不是将子带内的全部样本作为增益调整对象,而是仅将在听觉上重要的最大振幅值周边的样本作为增益调整对象,由此能够抑制放大振幅值低的样本而导致的异常声音的产生等,从而能够提高解码信号的音质。
并且,在本实施方式中,在提取标志的设定中,对于不与具有子带内最大振幅值的样本接近的样本,仅在索引为偶数的情况下,将提取标志的值设为1。但是,本发明不限于此,例如,在将索引相对于3的余数为0的样本的提取标志值设为1的情况下,也可同样适用。即,本发明不限于上述提取标志的设定方法,对于根据子带内的最大振幅值的位置,通过如下这样的权重(尺度)来提取的方法也可同样适用,该权重使得样本与具有最大振幅值的样本越接近,则提取标志的值越容易变为1。例如,编码装置及解码装置作为例子可举出如下这样的三阶段的提取标志设定方法:提取与具有最大振幅值的样本非常接近的所有样本(即,将提取标志的值设为1);对于距离稍远的样本,仅在索引为偶数的情况下提取;对于距离更远的样本,仅在索引相对于3的余数为0的情况下提取。当然,对于三阶段以上的设定方法,本发明也可适用。
并且,在本实施方式中,以如下结构为例进行了说明,即:在提取标志的设定中,在搜索具有子带内最大振幅值的样本后,根据与该样本间的距离设定提取标志。但是,本发明不限于此,在以下情况下也可适用,即:编码装置及解码装置例如搜索具有最小振幅值的样本,根据与具有最小振幅值的样本间的距离设定各样本的提取标志,仅对所提取的样本(提取标志的值被设为1的样本)计算并适用对数增益等振幅调整参数。可以说,这种结构例如在振幅调整参数具有使估计的高频频谱衰减的效果的情况下有效。虽然会出现由于使振幅大的样本衰减而导致异常声音产生的情况,但通过仅对具有最小振幅值的样本周边适用衰减处理,有可能提高音质。另外,在上述结构中,可考虑不是搜索最小振幅值而是搜索最大振幅值,利用样本与具有最大振幅值的样本间的距离越远则越容易被提取的这种权重(尺度)来提取样本的结构,本发明对于这种结构也可同样适用。
并且,在本实施方式中,以如下结构为例进行了说明,即:在提取标志的设定中,在搜索具有子带内最大振幅值的样本后,根据与该样本间的距离设定提取标志。但是,本发明不限于此,对于如下结构也可同样适用:编码装置对各个子带从振幅大的样本中选择多个样本,根据与各样本间的距离设定提取标志。通过采用上述结构,当子带内存在振幅大小相近的多个样本时,能够高效地提取样本
另外,在本实施方式中说明了通过根据阈值(式(12)所示的Nearp)判断各个子带内的样本是否与具有最大振幅值的样本接近来部分地选择样本的情况。在本发明中,例如,编码装置及解码装置也可以以如下方式进行选择:对于越是处于高频的子带,则选择范围越大的样本作为与具有最大振幅值的样本接近的样本。即,在本发明中,也可以是,越是多个子带中的高频子带,则越增大式(12)所示的Nearp的值。由此,在频带分割时,例如对于如巴克标度那样设定为越是高频则子带宽度越大的情况,也能够在子带间均衡地部分地选择样本,从而能够防止解码信号的音质劣化。并且,作为式(12)所示的Nearp的值,通过试验确认到:例如,当1帧的样本(MDCT系数)的数量为320左右时,如果设定为5~21左右的值(例如,最低频的子带的Nearp的值为5,最高频的子带的Nearp的值为21),则能够得到良好结果。
另外,在本实施方式中,说明了编码装置及解码装置在样本群提取单元中如式(12)所示,利用如下这样的权重来部分地选择样本的结构,该权重使得样本与具有各个子带中的最大振幅值MaxValuep的样本越接近,则越容易被选择。这里,通过式(12)所示的样本群提取方法,对于在各个子带的边界存在具有最大振幅值的样本的情况,也可与子带的边界无关地易于选择接近最大振幅值的样本。即,在本实施方式中说明的结构还考虑了具有相邻子带内的最大振幅值的样本的位置来选择样本,因此能够更加高效地选择在听觉上重要的样本。
另外,在本实施方式中,最大振幅值搜索单元不是在对数区域中而是在线性区域中计算最大振幅值。在对全部样本(MDCT系数)进行对数变换的情况(例如,专利文献1等)下,无论是在对数区域还是线性区域中进行最大振幅值的计算,运算量都不会增加很多。但是,如本实施方式的结构这样,在对部分地选择的样本进行对数变换的情况下,在最大振幅值搜索单元中,如上所述,通过在线性区域中计算最大振幅值,例如与专利文献1等相比,能够大幅度地减少最大振幅值计算时的运算量。
(实施方式2)
本发明的实施方式2说明采用在第2层编码单元内的增益编码单元中利用与实施方式1示出的结构不同的结构能够进一步减少运算量的结构。
实施方式2的通信系统(未图示)与图1所示的通信系统基本相同,仅在编码装置、解码装置的结构及动作的一部分与图1的通信系统的编码装置101、解码装置103不同。以下,对本实施方式的通信系统的编码装置及解码装置分别标注标号“111”及“113”进行说明。
本实施方式的编码装置111的内部主要结构(未图示)主要包括下采样处理单元201、第1层编码单元202、第1层解码单元203、上采样处理单元204、正交变换处理单元205、第2层编码单元226及编码信息合并单元207。这里,第2层编码单元226以外的结构要素进行与实施方式1的情况(图2)相同的处理,因此省略说明。
第2层编码单元226使用从正交变换处理单元205输入的输入频谱S2(k)及第1层解码频谱S1(k)生成第2层编码信息,将生成的第2层编码信息输出到编码信息合并单元207。
接下来使用图12说明第2层编码单元226的内部主要结构。
第2层编码单元226具有频带分割单元260、滤波器状态设定单元261、滤波单元262、搜索单元263、音调系数设定单元264、增益编码单元235及复用单元266。但是,增益编码单元235以外的结构要素与实施方式1(图3)中说明的结构要素相同,因此这里省略说明。
增益编码单元235根据输入频谱S2(k)及从搜索单元263输入的各个子带的估计频谱S2p’(k)(p=0,1,…,P-1)、理想增益α1p,对各个子带计算对数增益,该对数增益是用于进行非线性区域中的能量比调整的参数。接着,增益编码单元235对理想增益及对数增益进行量化,将量化后的理想增益及对数增益输出到复用单元266。
图13是表示增益编码单元235的内部结构的图。增益编码单元235主要包括理想增益编码单元241及对数增益编码单元242。另外,理想增益编码单元241与实施方式1说明的结构要素相同,因此这里省略说明。
对数增益编码单元242计算对数增益,该对数增益是用于进行从正交变换处理单元205输入的输入频谱S2(k)的高频部(FL≤k<FH)与从理想增益编码单元241输入的估计频谱S3’(k)的每个子带的非线性区域中的能量比调整的参数(振幅调整参数)。而且,对数增益编码单元242将算出的对数增益作为对数增益编码信息输出到复用单元266。
图14表示对数增益编码单元242的内部结构。对数增益编码单元242主要包括最大振幅值搜索单元253、样本群提取单元251及对数增益计算单元252。
最大振幅值搜索单元253如式(25)所示对从理想增益编码单元241输入的估计频谱S3’(k),对于每个子带搜索最大振幅值MaxValuep、以及振幅最大的样本(频谱分量)的索引最大振幅索引MaxIndexp
MaxValu e p = max ( | S 3 &prime; ( k ) | ) MaxInde x p = k where MaxValu e p = | S 3 &prime; ( k ) | ( BL p &le; k &le; BH p ( k = 0,2,4,6 , . . . ( even ) ) , for all p ) &CenterDot; &CenterDot; &CenterDot; ( 25 )
即,最大振幅值搜索单元253仅对索引为偶数的样本进行最大振幅值的搜索。由此,能够高效地削减最大振幅值搜索的运算量。
然后,最大振幅值搜索单元253将估计频谱S3’(k)、最大振幅值MaxValuep及最大振幅索引MaxIndexp输出到样本群提取单元251。
样本群提取单元251按照下式(26),对从最大振幅値搜索部253输入的估计频谱S3’(k),决定对各样本(频谱分量)的提取标志SelectFlag(k)的值。
SelectFlag ( k ) = 0 k = 1,3,5,7,9 , . . . ( odd ) 1 k = 0,2,4,6,8 , . . . ( even ) ( BL p &le; k &le; BH p , for all p ) &CenterDot; &CenterDot; &CenterDot; ( 26 )
即,样本群提取单元251如式(26)所示,对于索引为奇数的样本,将提取标志SelectFlag(k)的值设定为0,对于索引为偶数的样本,将提取标志SelectFlag(k)的值设定为1。即,样本群提取单元251对于估计频谱S3’(k),部分地选择样本(频谱分量)(这里仅选择偶数索引的样本)。然后,样本群提取单元251将提取标志SelectFlag(k)、估计频谱S3’(k)、以及最大振幅值MaxValuep输出到对数增益计算单元252。
对数增益计算单元252对于从样本群提取单元251输入的提取标志SelectFlag(k)的值为1的样本,按照式(13),计算估计频谱S3’(k)和输入频谱S2(k)的高频部(FL≤k<FH)的对数区域中的能量比(对数增益)α2p。即,对数增益计算单元252仅对由样本群提取单元251部分地选择的样本,计算对数增益α2p
然后,对数增益计算单元252对对数增益α2p进行量化,将量化后的对数增益α2Qp作为对数增益编码信息输出到复用单元266。
以上对增益编码单元235的处理进行了说明。
以上是本实施方式的编码装置111的处理的说明。
另一方面,本实施方式的解码装置113的内部主要结构(未图示)主要包括编码信息分离单元131、第1层解码单元132、上采样处理单元133、正交变换处理单元134、及第2层解码单元295。这里,第2层编码单元295以外的结构要素进行与实施方式1的情况(图8)相同的处理,因此省略说明。
第2层解码单元295使用从正交变换处理单元134输入的第1层解码频谱S1(k)及从编码信息分离单元131输入的第2层编码信息,生成包含高频分量的第2层解码信号,将其作为输出信号输出。
第2层解码单元295主要包括分离单元351、滤波器状态设定单元352、滤波单元353、增益解码单元354、频谱调整单元396、及正交变换处理单元356(未图示)。这里,频谱调整单元396以外的结构要素进行与实施方式1的情况(图9)相同的处理,因此省略说明。
频谱调整单元396主要包括理想增益解码单元361及对数增益解码单元392(未图示)。这里,理想增益解码单元361进行与实施方式1的情况(图10)相同的处理,因此省略说明。
图15是表示对数增益解码单元392的内部结构的图。对数增益解码单元392主要包括最大振幅值搜索单元381、样本群提取单元382及对数增益适用单元383。
最大振幅值搜索单元381如式(25)所示对从理想增益解码单元361输入的估计频谱S3’(k),对于每个子带搜索最大振幅值MaxValuep、以及振幅最大的样本(频谱分量)的索引、最大振幅索引MaxIndexp。即,最大振幅值搜索单元381仅对索引为偶数的样本进行最大振幅值的搜索。即,最大振幅值搜索单元381仅对估计频谱S3’(k)中的一部分样本(频谱分量)进行最大振幅值的搜索。由此,能够高效地削减最大振幅值搜索所需的运算量。然后,最大振幅值搜索单元381将估计频谱S3’(k)、最大振幅值MaxValuep及最大振幅索引MaxIndexp输出到样本群提取单元382。
样本群提取单元382如式(12)所示,根据对算出的各个子带的最大振幅索引MaxIndexp,决定对各样本的提取标志SelectFlag(k)。即,样本群提取单元382利用如下这样的权重来部分地选择样本,该权重使得样本与具有各个子带中的最大振幅值MaxValuep的样本越接近,则越容易被选择。具体而言,样本群提取单元382如式(12)所示,选择作为距最大振幅值MaxValuep的距离为Nearp以内的范围的索引的样本。另外,样本群提取单元382如式(12)所示,即使不与具有最大振幅值的样本接近,对于索引为偶数的样本,也将提取标志SelectFlag(k)的值设定为1。由此,即使在远离具有最大振幅值的样本的频带中存在具有较大振幅的样本,也能提取该样本或与该样本接近的振幅的样本。然后,样本群提取单元382将估计频谱S3’(k)、每个子带的最大振幅值MaxValuep及提取标志SelectFlag(k)输出到对数增益适用单元383。
并且,最大振幅值搜索单元381及样本群提取单元382中的处理分别与编码装置111的最大振幅值搜索单元253及编码装置101的样本群提取单元282的处理是相同的处理。
对数增益适用单元383根据从样本群提取单元382输入的估计频谱S3’(k)、以及提取标志SelectFlag(k),如式(18)所示,计算表示提取的样本群的符号(+、-)的Signp(k)。即,如式(18)所示,对数增益适用单元383在提取的样本的符号为‘+’的情况下(S3’(k)≥0的情况下),设为Signp(k)=1,在此外的情况下(提取的样本的符号为‘-’的情况下),设为Signp(k)=-1。
对数增益适用单元383根据从样本群提取单元382输入的估计频谱S3’(k)、最大振幅值MaxValuep及提取标志SelectFlag(k)、从增益解码单元354输入的量化对数增益α2Qp、及按照式(18)算出的符号Signp(k),对于提取标志SelectFlag(k)的值为1的样本,按照式(19)、式(20)计算解码频谱S5’(k)。
即,对数增益适用单元383仅对由样本群提取单元382部分地选择的样本(提取标志SelectFlag(k)=1的样本),适用对数增益α2p。然后,对数增益适用单元383将解码频谱S5’(k)输出到正交变换处理单元356。这里,解码频谱S5’(k)的低频部(0≤k<FL)由第1层解码频谱S1(k)构成,解码频谱S5’(k)的高频部(FL≤k<FH)由对估计频谱S3’(k)进行对数区域内的能量调整后的频谱构成。但是,对于解码频谱S5’(k)的高频部(FL≤k<FH)中的、未被样本群提取单元382选择的样本(提取标志SelectFlag(k)=0的样本),其值采用估计频谱S3’(k)的值。
以上对频谱调整单元396的处理进行了说明。
以上是本实施方式的解码装置113的处理的说明。
这样,根据本实施方式,在使用低频部的频谱进行扩频来估计高频部的频谱的编码/解码中,在使用解码后的低频频谱估计了高频部的频谱后,进行估计频谱的各个子带中的样本的选择(抽取),仅对选择出的样本进行对数区域内的增益调整。另外,与实施方式1不同,编码装置及解码装置不考虑与最大振幅值间的距离就计算增益调整参数(对数增益),另外,解码装置仅在适用增益调整参数(对数增益)时才考虑与子带内的最大振幅值间的距离。根据该结构,与实施方式1相比,能够进一步削减处理运算量。
并且,如本实施方式所示,通过实验确认:编码装置仅根据偶数索引的样本计算增益调整参数,解码装置将增益调整参数适用于考虑与具有子带内的最大振幅值的样本间的距离而提取的样本中的情况下,也没有音质劣化。即,可以说即使作为计算增益调整参数时的对象的样本集合(样本群)与作为适用增益调整参数时的对象的样本集合(样本群)不一致,也没问题。这意味着,例如,如本实施方式所示,如果编码装置及解码装置在子带全体中均等地提取样本,则即使不提取全部样本,也能高效地计算增益调整参数。另外可见,解码装置只是将得到的增益调整参数仅适用于考虑与具有子带内最大振幅值的样本间的距离而提取的样本中,也能高效地削减运算量。本实施方式通过采用这种结构,在没有音质的劣化前提下,与实施方式1相比进一步削减了运算量。
另外,在本实施方式中,对分别单独进行输入信号的低频分量的编码/解码处理与高频分量的编码/解码处理的结构的情况,即,以两阶段的阶层结构进行编码/解码的情况进行了说明。但是,本发明不限于此,对于以三阶段以上的阶层结构进行编码/解码的情况,也可同样适用。并且,在考虑三阶段以上的阶层编码单元的情况下,在用于生成第2层编码单元的本地解码信号的第2层解码单元中,适用增益调整参数(对数增益)的样本集合(样本群)可以是不考虑与具有在本实施方式的编码装置内算出的最大振幅值的样本间的距离的样本集合,或者也可以是考虑与具有在本实施方式的解码装置内算出的最大振幅值的样本间的距离的样本集合。
并且,在本实施方式中,在提取标志的设定中,仅在样本的索引为偶数的情况下,将提取标志的值设为1。但是,本发明不限于此,例如对于索引相对于3的余数为0的情况等,也可同样适用。
以上对本发明的各实施方式进行了说明。
并且,在上述实施方式中,以在增益编码单元265(或增益编码单元235)中分割输入频谱S2(k)的高频部而得到的子带的数量J与在搜索单元263中分割输入频谱S2(k)的高频部而得到的子带的数P不同的情况为例进行了说明。但是,本发明不限于此,也可以将在增益编码单元265(或增益编码单元235)中分割输入频谱S2(k)的高频部而得到的子带的数量设为P个。
另外,在上述实施方式中,对利用从第1层解码单元得到的第1层解码频谱的低频分量来估计输入频谱的高频部的结构进行了说明。但是,本发明不限于此,对于利用输入频谱的低频分量代替第1层解码频谱来估计输入频谱的高频部的结构,也可同样适用。并且,在该结构中,编码装置计算用于根据输入频谱的低频分量生成输入频谱的高频分量的编码信息(第2层编码信息),解码装置将该编码信息适用于第1层解码频谱,生成解码频谱的高频分量。
另外,在上述实施方式中,基于专利文献1中的处理,以在计算/适用用于调整对数区域内的能量比的参数的结构中削减运算量及提高音质的处理为例进行了说明。但是,本发明不限于此,对于在对数变换以外的非线性变换区域中调整能量比等的结构,也可同样适用。另外,除了非线性变换区域以外,对于线性变换区域,也可同样适用。
另外,在上述实施方式中,基于专利文献1中的处理,在扩频处理中,以在计算/适用用于调整对数区域内的能量比的参数的结构中削减运算量及提高音质的处理为例进行了说明。但是,本发明不限于此,对于扩频处理以外的处理,也可同样适用。
另外,本发明的编码装置、解码装置及其方法不限于上述实施方式,而是可进行多种变更来加以实施。例如,可以适当组合各实施方式来实施。
另外,说明了上述实施方式中的解码装置使用从上述各实施方式中的编码装置传输的编码信息进行处理的情况。但是,本发明不限于此,只要是包含必要参数、数据的编码信息,即使不是来自上述各实施方式中的编码装置的编码信息,也能够进行处理。
另外,在上述实施方式中,将编码对象作为声音信号进行了说明,但也可以是音乐信号,还可以是包含它们两者的音频信号。
另外,在将信号处理的程序记录、写入存储器、盘、带、CD、DVD等机械式可读取的记录介质进行动作的情况下,也可采用本发明,并且能够取得与本实施方式相同的作用和效果。
另外,在上述各实施方式中以通过硬件来构成本发明的情况为例进行了说明,但是本发明还可以通过软件来实现。
另外,在上述各实施方式的说明中所使用的各个功能块,典型地被实现为由集成电路构成的LSI(大规模集成电路)。这些既可以分别实行单芯片化,也可以包含其中一部分或者是全部而实行单芯片化。这里称为LSI,但根据集成度的不同,也可以称为IC、系统LSI、超大LSI、特大LSI。
另外,集成电路化的方式不限于LSI,也可以使用专用电路或通用处理器来实现。也可以利用LSI制造后能够编程的FPGA(Field Programmable GateArray,现场可编程门阵列),或可以利用对LSI内部的电路块的连接或设定能进行重新构置的可重构置处理器(Reconfigurable Processor)。
再有,如果随着半导体技术的进步或者其他技术的派生,出现了代替LSI集成电路化的技术,当然也可以利用该技术来实现功能块的集成化。还存在适用生物技术等的可能性。
在2009年2月26日提交的特愿第2009-044676号、2009年4月2日提交的特愿第2009-089656号及2010年1月7日提交的特愿第2010-001654号的日本专利申请所包含的说明书、附图和说明书摘要的公开内容,全部引用于本申请。
工业实用性
本发明的编码装置、解码装置及其方法能够在使用低频部的频谱进行扩频来估计高频部的频谱时提高解码信号的质量,例如能够适用于分组通信系统、移动通信系统等中。

Claims (13)

1.编码装置,包括:
第1编码单元,对输入信号的规定频率以下的低频部分进行编码,生成第1编码信息;
解码单元,对所述第1编码信息进行解码,生成解码信号;以及
第2编码单元,通过将所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号或所述解码信号分别估计所述多个子带,部分地选择各个子带内的频谱分量,计算调整选择出的频谱分量的振幅的振幅调整参数,从而生成第2编码信息,
所述第2编码单元包括:
分割单元,将所述输入信号的所述高频部分分割为P个子带,获得所述P个子带各自的开始位置和带宽作为频带分割信息,其中,P为大于1的整数;
滤波单元,对所述解码信号进行滤波,生成从第1估计信号到第P估计信号为止的P个第p估计信号,其中,p=1,2,…,P;
设定单元,使所述滤波单元中使用的音调系数变化并且进行设定;
搜索单元,搜索所述音调系数中的、使所述第p估计信号与第p子带的相似度最大的音调系数作为第p最佳音调系数;以及
复用单元,将从第1最佳音调系数到第P最佳音调系数为止的P个最佳音调系数与所述频带分割信息进行复用,获得所述第2编码信息,
所述设定单元为了估计第1子带而使所述滤波单元中使用的音调系数在规定范围内变化并且进行设定,为了估计第2子带以后的第m子带而使所述滤波单元中使用的音调系数在与第m-1最佳音调系数对应的范围或所述规定范围内变化并且进行设定,其中,m=2,3,…,P。
2.如权利要求1所述的编码装置,
所述第2编码单元还包括:
相似部分搜索单元,从所述输入信号或所述解码信号的频谱中,搜索与所述多个子带的各自的频谱最相似的频带和第1振幅调整参数;
振幅值搜索单元,对于根据所述最相似的频带和所述第1振幅调整参数而估计的高频的频谱,对每个所述子带搜索振幅值最大或最小的频谱分量;
频谱分量选择单元,利用频谱分量与所述振幅值最大或最小的频谱分量越接近就越容易被选择的权重,部分地选择频谱分量;以及
振幅调整参数计算单元,对部分地选择出的频谱分量,计算第2振幅调整参数。
3.如权利要求1所述的编码装置,
所述第2编码单元包括:
相似部分搜索单元,从所述输入信号或所述解码信号的频谱中,搜索与所述多个子带的各自的频谱最相似的频带和第1振幅调整参数;
频谱分量选择单元,对根据所述最相似的频带和所述第1振幅调整参数而估计的高频的频谱,部分地选择频谱分量;以及
振幅调整参数计算单元,对部分地选择出的频谱分量,计算第2振幅调整参数。
4.如权利要求2所述的编码装置,
对所述多个子带中越高频的子带,所述频谱分量选择单元选择范围越宽的频谱分量作为与所述振幅值最大或最小的频谱分量接近的频谱分量。
5.通信终端装置,具有权利要求1所述的编码装置。
6.基站装置,具有权利要求1所述的编码装置。
7.解码装置,包括:
接收单元,接收在编码装置中生成了的第1编码信息和第2编码信息,所述第1编码信息是对输入信号的规定频率以下的低频部分进行编码而获得的信息,所述第2编码信息是通过以下方式而生成了的信息,即通过将所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号或对所述第1编码信息进行解码而获得的第1解码信号,分别估计所述多个子带,部分地选择各个子带内的频谱分量,计算调整选择出的频谱分量的振幅的振幅调整参数,并且,在生成所述第2编码信息时,将所述输入信号的所述高频部分分割为P个子带,获得所述P个子带各自的开始位置和带宽作为频带分割信息,对所述解码信号进行滤波,生成从第1估计信号到第P估计信号为止的P个第p估计信号,使所述滤波中使用的音调系数变化并且进行设定,搜索所述音调系数中的、使所述第p估计信号与第p子带的相似度最大的音调系数作为第p最佳音调系数,将从第1最佳音调系数到第P最佳音调系数为止的P个最佳音调系数与所述频带分割信息进行复用,获得所述第2编码信息,为了估计第1子带而用于所述滤波的音调系数在规定范围内变化并被设定,为了估计第2子带以后的第m子带而用于所述滤波的音调系数在与第m-1最佳音调系数对应的范围或所述规定范围内变化并被设定,其中,P为大于1的整数,p=1,2,…,P,m=2,3,…,P;
第1解码单元,对所述第1编码信息进行解码,生成第2解码信号;以及
第2解码单元,通过使用所述第2编码信息,从所述第2解码信号估计所述输入信号的高频部分,从而生成第3解码信号。
8.如权利要求7所述的解码装置,
所述第2解码单元包括:
振幅值搜索单元,对于根据与从所述第2解码信号的频谱计算出的所述多个子带的各自的频谱最相似的频带和包含在所述第2编码信息中的第1振幅调整参数而估计的高频的频谱,对每个所述子带搜索振幅值最大或最小的频谱分量;
频谱分量选择单元,利用频谱分量与所述振幅值最大或最小的频谱分量越接近就越容易被选择的权重,部分地选择频谱分量;以及
振幅调整参数适用单元,对部分地选择出的频谱分量,适用第2振幅调整参数。
9.如权利要求8所述的解码装置,
所述振幅值搜索单元对于所述估计出的高频的频谱中的一部分频谱分量,对每个所述子带搜索振幅值最大或最小的频谱分量。
10.通信终端装置,具有权利要求7所述的解码装置。
11.基站装置,具有权利要求7所述的解码装置。
12.编码方法,包括以下步骤:
对输入信号的规定频率以下的低频部分进行编码,生成第1编码信息;
对所述第1编码信息进行解码,生成解码信号;以及
通过将所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号或所述解码信号,分别估计所述多个子带,部分地选择所述各个子带内的频谱分量,计算调整选择出的频谱分量的振幅的振幅调整参数,从而生成第2编码信息,
生成所述第2编码信息的步骤包括:
将所述输入信号的所述高频部分分割为P个子带,获得所述P个子带各自的开始位置和带宽作为频带分割信息的步骤,其中,P为大于1的整数;
对所述解码信号进行滤波,生成从第1估计信号到第P估计信号为止的P个第p估计信号的步骤,其中,p=1,2,…,P;
使所述滤波单元中使用的音调系数变化并且进行设定的步骤;
搜索所述音调系数中的、使所述第p估计信号与第p子带的相似度最大的音调系数作为第p最佳音调系数的步骤;以及
将从第1最佳音调系数到第P最佳音调系数为止的P个最佳音调系数与所述频带分割信息进行复用,获得所述第2编码信息的步骤,
在设定所述音调系数的步骤中,为了估计第1子带而使用于所述滤波的音调系数在规定范围内变化并且进行设定,为了估计第2子带以后的第m子带而使用于所述滤波的音调系数在与第m-1最佳音调系数对应的范围或所述规定范围内变化并且进行设定,其中,m=2,3,…,P。
13.解码方法,包括以下步骤:
接收在编码装置中生成了的第1编码信息和第2编码信息,所述第1编码信息是对输入信号的规定频率以下的低频部分进行编码而获得的信息,所述第2编码信息是通过以下方式而生成了的信息,即通过将所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号或对所述第1编码信息进行解码而获得的第1解码信号,分别估计所述多个子带,部分地选择所述各个子带内的频谱分量,计算调整选择出的频谱分量的振幅的振幅调整参数,并且,在生成所述第2编码信息时,将所述输入信号的所述高频部分分割为P个子带,获得所述P个子带各自的开始位置和带宽作为频带分割信息,对所述解码信号进行滤波,生成从第1估计信号到第P估计信号为止的P个第p估计信号,使所述滤波中使用的音调系数变化并且进行设定,搜索所述音调系数中的、使所述第p估计信号与第p子带的相似度最大的音调系数作为第p最佳音调系数,将从第1最佳音调系数到第P最佳音调系数为止的P个最佳音调系数与所述频带分割信息进行复用,获得所述第2编码信息,为了估计第1子带而用于所述滤波的音调系数在规定范围内变化并被设定,为了估计第2子带以后的第m子带而用于所述滤波的音调系数在与第m-1最佳音调系数对应的范围或所述规定范围内变化并被设定,其中,P为大于1的整数,p=1,2,…,P,m=2,3,…,P;
对所述第1编码信息进行解码,生成第2解码信号;以及
通过使用所述第2编码信息,从所述第2解码信号估计所述输入信号的高频部分,从而生成第3解码信号。
CN201080009380.5A 2009-02-26 2010-02-25 编码装置、解码装置及其方法 Active CN102334159B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2009-044676 2009-02-26
JP2009044676 2009-02-26
JP2009089656 2009-04-02
JP2009-089656 2009-04-02
JP2010-001654 2010-01-07
JP2010001654 2010-01-07
PCT/JP2010/001289 WO2010098112A1 (ja) 2009-02-26 2010-02-25 符号化装置、復号装置およびこれらの方法

Publications (2)

Publication Number Publication Date
CN102334159A CN102334159A (zh) 2012-01-25
CN102334159B true CN102334159B (zh) 2014-05-14

Family

ID=42665325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080009380.5A Active CN102334159B (zh) 2009-02-26 2010-02-25 编码装置、解码装置及其方法

Country Status (9)

Country Link
US (1) US8983831B2 (zh)
EP (1) EP2402940B9 (zh)
JP (1) JP5511785B2 (zh)
KR (1) KR101661374B1 (zh)
CN (1) CN102334159B (zh)
BR (1) BRPI1008484A2 (zh)
MX (1) MX2011008685A (zh)
RU (1) RU2538334C2 (zh)
WO (1) WO2010098112A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
WO2011161886A1 (ja) * 2010-06-21 2011-12-29 パナソニック株式会社 復号装置、符号化装置およびこれらの方法
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9767822B2 (en) * 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
MX346012B (es) * 2013-01-29 2017-02-28 Fraunhofer Ges Forschung Aparato y metodo para procesar una señal codificada y codificador y metodo par a generar una señal codificada.
ES2836194T3 (es) * 2013-06-11 2021-06-24 Fraunhofer Ges Forschung Dispositivo y procedimiento para la extensión de ancho de banda para señales acústicas
US8879858B1 (en) * 2013-10-01 2014-11-04 Gopro, Inc. Multi-channel bit packing engine
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
EP3113181B1 (en) * 2014-02-28 2024-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoding device and decoding method
CN105874534B (zh) * 2014-03-31 2020-06-19 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
CA3019506C (en) 2016-04-12 2021-01-19 Markus Multrus Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band
CN110655516B (zh) * 2018-06-29 2023-10-20 鲁南制药集团股份有限公司 一种抗凝血药物的晶型
EP4002870A4 (en) * 2019-07-19 2022-09-28 Sony Group Corporation SIGNAL PROCESSING DEVICE AND METHOD AND PROGRAM
CN113808597A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HU214139B (en) * 1989-05-17 1997-12-29 Thomson Consumer Electronics Process for transmitting a signal
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
DE60208426T2 (de) * 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
AU2002352182A1 (en) * 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
JP4272897B2 (ja) * 2002-01-30 2009-06-03 パナソニック株式会社 符号化装置、復号化装置およびその方法
DE60323331D1 (de) 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8417515B2 (en) * 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
KR100608062B1 (ko) 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
EP1798724B1 (en) * 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
JP2007052088A (ja) 2005-08-16 2007-03-01 Sanyo Epson Imaging Devices Corp 表示装置
US8396717B2 (en) 2005-09-30 2013-03-12 Panasonic Corporation Speech encoding apparatus and speech encoding method
AU2005337961B2 (en) 2005-11-04 2011-04-21 Nokia Technologies Oy Audio compression
JP4912979B2 (ja) 2007-08-10 2012-04-11 オリンパス株式会社 画像処理装置、画像処理方法及びプログラム
JP4458435B2 (ja) 2007-10-09 2010-04-28 株式会社グリーンテック 栽培用袋を用いた栽培方法
JP2010001654A (ja) 2008-06-20 2010-01-07 Shinmaywa Engineering Ltd エレベータ式駐車装置及びその運転管理方法

Also Published As

Publication number Publication date
EP2402940A4 (en) 2013-10-02
MX2011008685A (es) 2011-09-06
EP2402940A1 (en) 2012-01-04
CN102334159A (zh) 2012-01-25
RU2011135533A (ru) 2013-04-20
JPWO2010098112A1 (ja) 2012-08-30
BRPI1008484A2 (pt) 2018-01-16
EP2402940B1 (en) 2019-05-29
JP5511785B2 (ja) 2014-06-04
KR101661374B1 (ko) 2016-09-29
US8983831B2 (en) 2015-03-17
US20110307248A1 (en) 2011-12-15
EP2402940B9 (en) 2019-10-30
RU2538334C2 (ru) 2015-01-10
KR20110131192A (ko) 2011-12-06
WO2010098112A1 (ja) 2010-09-02

Similar Documents

Publication Publication Date Title
CN102334159B (zh) 编码装置、解码装置及其方法
CN101971253B (zh) 编码装置、解码装置以及其方法
CN101925953B (zh) 编码装置、解码装置以及其方法
EP1959433B1 (en) Subband coding apparatus and method of coding subband
EP2056294B1 (en) Apparatus, Medium and Method to Encode and Decode High Frequency Signal
KR100958144B1 (ko) 오디오 압축
CN102099855B (zh) 频谱平滑化装置、编码装置、解码装置、通信终端装置、基站装置以及频谱平滑化方法
EP2323131A1 (en) Audio encoding device, audio decoding device, and their method
CN102656628B (zh) 优化的低吞吐量参数编码/解码
CN101568959B (zh) 用带宽扩展进行编码和/或解码的方法
CN103718240A (zh) 编码装置、解码装置、编码方法和解码方法
CN102947881A (zh) 解码装置、编码装置和解码方法、编码方法
US8898057B2 (en) Encoding apparatus, decoding apparatus and methods thereof
US20090248407A1 (en) Sound encoder, sound decoder, and their methods
EP2562750B1 (en) Encoding device, decoding device, encoding method and decoding method
US9472200B2 (en) Encoding apparatus and encoding method
US20140244274A1 (en) Encoding device and encoding method
JP5606457B2 (ja) 符号化装置および符号化方法
EP2500901A1 (en) Encoder apparatus, decoder apparatus and methods of these

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140724

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140724

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.