CN101925953B - 编码装置、解码装置以及其方法 - Google Patents

编码装置、解码装置以及其方法 Download PDF

Info

Publication number
CN101925953B
CN101925953B CN2009801029644A CN200980102964A CN101925953B CN 101925953 B CN101925953 B CN 101925953B CN 2009801029644 A CN2009801029644 A CN 2009801029644A CN 200980102964 A CN200980102964 A CN 200980102964A CN 101925953 B CN101925953 B CN 101925953B
Authority
CN
China
Prior art keywords
frequency
low
unit
medium
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009801029644A
Other languages
English (en)
Other versions
CN101925953A (zh
Inventor
山梨智史
押切正浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101925953A publication Critical patent/CN101925953A/zh
Application granted granted Critical
Publication of CN101925953B publication Critical patent/CN101925953B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

公开了在将输入信号频带分割为低频分量和高频分量,将各个分量分别通过不同的编码单元进行编码的结构中,能够提高解码信号的质量的编码装置。在编码装置(101)中,频带分割处理单元(201)对输入信号进行频带分割处理而获得低于第一频率的低中频分量、以及第一频率以上的高频分量,低频编码单元(202)抑制低中频分量中的第二频率以上的部分而获得低频分量,并且对低频分量进行编码而获得低频编码信息,中频校正单元(203)对抑制后的低中频分量中的第二频率以上的中频分量进行校正而获得校正中频分量,中高频编码单元(204)对校正中频分量和高频分量进行编码而获得中高频编码信息,复用单元(205)将低频编码信息与中高频编码信息复用而获得编码信息。

Description

编码装置、解码装置以及其方法
技术领域
本发明涉及对信号进行编码而传输的通信系统中使用的编码装置、解码装置以及其方法。 
背景技术
近年来,由于通信基础设施的发展,通过电话线路不仅发送接收单纯的语音信号,甚至发送接收大容量的运动图像数据。此时,为了将从即使以低比特率也能够发送的语音信号到需要以高比特率发送的运动图像数据为止通过同一架构进行处理,并提高线路效率,开发了可变比特率传输方式等。 
另外,也开发了以下技术,即在语音信号/音乐信号的编码中,即使从编码信息的一部分,也能够解码出语音信号/音乐信号,即使在产生分组丢失的状况下,也能够抑制音质劣化的可扩展编码技术(例如,参照专利文献1)。 
作为该可扩展编码技术的代表性的技术,公开了以下的方法,即将输入信号在频域上分割为低频分量和高频分量(和中频分量),并对各个频带的信号进行编码而传输,由此实现频率轴上的可扩展性的方法(例如,参照专利文献2、专利文献3和专利文献4)。 
专利文献1:特开平10-97295号公报 
专利文献2:特开2005-114814号公报 
专利文献3:特开2006-189836号公报 
专利文献4:特开2006-119301号公报 
发明内容
发明需要解决的问题 
 在上述专利文献2、专利文献3和专利文献4中,公开了以下结构,即首先对输入信号(例如,设为32kHz采样频率的信号)进行基于QMF(QuadratureMirror Filter:正交镜像滤波器)等的频带分割处理,由此分割为低频分量的信号和高频分量的信号。另外,也公开了将输入信号分割为除了低频分量的信号和高频分量的信号,还包含中频分量的信号的三个信号的结构。以下,考虑在第一层(最低层)的编码单元中使用以ITU-T标准化的G.729.1编码的情况。 
在G.729.1编码单元中,为了获得直至7kHz频带为止的频率特性,对进行了QMF分析的16kHz采样频率的输入信号适用低通滤波器,并对限制到7kHz频带为止的信号进行编码。然而,例如即使在被输入的信号包含直至8kHz频带为止的频率分量时,G.729.1编码单元也对直至7kHz频带为止的分量进行编码,而不对7~8kHz频带的分量进行编码。因此,需要在与G.729.1编码单元不同的编码单元中对7~8kHz频带的分量进行编码。 
因此,考虑以下的方法,即为了避免限制到7kHz频带为止造成的7~8kHz频带的分量的欠缺,使G.729.1编码单元内部的低通滤波器不动作的方法。但是,在采用了这样的结构时,由于对7kHz频带以下的分量也不适用低通滤波器造成的影响,无法保证G.729.1编码单元原来的性能。 
另外,当然也考虑以下的结构,即从输入到G.729.1编码单元的16kHz采样频率的信号,获得7~8kHz频带(7kHz以上且低于8kHz的频带)的分量。例如,能够对输入到G.729.1编码单元的0~8kHz频带的信号进行改进离散余弦变换(MDCT:Modified Discrete Cosine Transform)等的正交变换处理,计算7~8kHz频带的频率分量。但是,在采用了这样的结构时,除了G.729.1编码单元进行的MDCT的运算之外,还需要新运算0~8kHz的分量的MDCT系数,运算量极大增加。 
本发明的目的在于,提供在通过QMF等的处理,将输入信号频带分割为低频分量和高频分量,并通过不同的编码单元对各个分量进行编码的结构中,在低频分量的编码单元内部适用低通滤波器,由此抑制运算量并且复原欠缺了的频带的分量而对其进行编码,从而能够提高解码信号的质量的编码装置、解码装置以及其方法。另外,本发明的技术不仅是单纯的信号处理中的逆滤波处理,而是对语音/音频信号特有的质量改善技术。 
解决问题的方案 
本发明的编码装置用于对包括语音/音乐信号的音频信号进行编码的编码装置,包括:频带分割单元,对输入包括语音/音乐信号的音频信号进行频带分割处理而获得低于第一频率的低中频分量、以及所述第一频率以上的高频分量;低频编码单元,抑制所述低中频分量中的第二频率以上的部分而 获得低频分量,并对所述低频分量进行编码而获得低频编码信息;中频校正单元,对在求所述低频编码信息的过程中计算出的、所述第二频率以上的中频分量的频谱进行校正而获得校正中频频谱;以及中高频编码单元,对所述校正中频频谱和所述高频分量进行编码而获得中高频编码信息。 
本发明的解码装置用于获得包括语音/音乐信号的音频信号而进行解码处理的解码装置,包括:接收单元,接收低频编码信息和中高频编码信息,所述低频编码信息是在编码装置中对将输入包括语音/音乐信号的音频信号频带分割所得的频率比第一频率低的低中频分量中抑制第二频率以上的部分所得的低频分量进行了编码而获得的信息,所述中高频编码信息是在编码装置中对在求所述低频编码信息的过程中计算出的、所述第二频率以上的中频分量的频谱所得的校正中频频谱和通过所述频带分割所得的所述第一频率以上的高频分量进行了编码而获得的信息;低中频解码单元,对所述低频编码信息进行解码而获得解码低频频谱;以及高频解码单元,使用所述解码低频频谱,对所述中高频编码信息进行解码而获得解码高频信号和解码中频频谱。 
本发明的编码方法用于对包括语音/音乐信号的音频信号进行编码的编码方法,包括以下步骤:对输入包括语音/音乐信号的音频信号进行频带分割处理而获得低于第一频率的低中频分量、以及所述第一频率以上的高频分量;抑制所述低中频分量中的第二频率以上的部分而获得低频分量,并对所述低频分量进行编码而获得低频编码信息;对在求所述低频编码信息的过程中计算出的、所述第二频率以上的中频分量的频谱进行校正而获得校正中频频谱;以及对所述校正中频频谱和所述高频分量进行编码而获得中高频编码信息。 
本发明的解码方法用于获得包括语音/音乐信号的音频信号而进行解码处理的解码方法,包括以下步骤:接收低频编码信息和中高频编码信息,所述低频编码信息是在编码装置中对将输入包括语音/音乐信号的音频信号频带分割所得的频率比第一频率低的低中频分量中抑制第二频率以上的部分所得的低频分量进行了编码而获得的信息,所述中高频编码信息是在编码装置中对校正在求所述低频编码信息的过程中计算出的、所述第二频率以上的中频分量的频谱所得的校正中频频谱和通过所述频带分割所得的所述第一频率以上的高频分量进行了编码而获得的信息;对所述低频编码信息进行解码而获得解码低频频谱;以及使用所述解码低频频谱,对所述中高频编码信息进 行解码而获得解码高频信号和解码中频频谱。 
发明的效果 
根据本发明,能够在通过QMF等的处理,将输入信号频带分割为低频分量和高频分量,并将各个分量通过不同的编码单元进行编码的结构中,在低频分量的编码单元内部适用低通滤波器,由此抑制运算量并且复原欠缺了的频带的分量而对其进行编码,从而提高解码信号的质量。
附图说明
图1是表示具有本发明的实施方式1的编码装置和解码装置的通信系统的结构的方框图。 
图2是表示图1所示的编码装置的内部的主要结构的方框图。 
图3是表示图2所示的低频编码单元的内部的主要结构的方框图。 
图4是表示图3所示的低通滤波器的频率特性的图。 
图5是表示图3所示的低通滤波器的频率特性的图。 
图6是表示图2所示的中高频编码单元的内部的主要结构的方框图。 
图7是表示图6所示的频带扩展编码单元的内部的主要结构的方框图。 
图8是用于说明图7所示的滤波单元中的滤波处理的细节的图。 
图9是表示在图7所示的搜索单元中搜索最佳基音系数的处理的步骤的流程图。 
图10是表示图1所示的解码装置的内部的主要结构的方框图。 
图11是表示图10所示的低中频解码单元的内部的主要结构的方框图。 
图12是表示图10所示的高频解码单元的内部的主要结构的方框图。 
图13是表示本发明的实施方式2的解码装置的内部的主要结构的方框图。 
图14是表示图13所示的低频解码单元的内部的主要结构的方框图。 
图15是表示本发明的实施方式3的编码装置的内部的主要结构的方框图。 
图16是表示图15所示的低频编码单元的内部的主要结构的方框图。 
图17是表示图15所示的中频编码单元的内部的主要结构的方框图。 
图18是表示图15所示的高频编码单元的内部的主要结构的方框图。 
图19是表示本发明的实施方式3的解码装置的内部的主要结构的方框图。 
图20是表示图19所示的中频解码单元的内部的主要结构的方框图。 
图21是表示图19所示的高频解码单元的内部的主要结构的方框图。 
具体实施方式
以下,参照附图详细地说明本发明的实施方式。此外,作为本发明的编码装置和解码装置,以语音编码装置和语音解码装置为例进行说明。 
(实施方式1) 
图1是表示具有本发明的实施方式1的编码装置和解码装置的通信系统的结构的方框图。在图1中,通信系统包括编码装置101和解码装置103,通过传输路径102而为可互相通信的状态。 
编码装置101将输入信号每N样本进行划分(N为自然数),将N样本作为1帧对每个帧进行编码。这里,假设将作为编码的对象的输入信号表示为xn(n=0、...、N-1)。n表示在每N样本划分了的输入信号中,是第n+1的信号要素。以下,有时省略样本“n ”而记述信号。例如,有时将xn(n=0、...、N-1)省略为x而记述。编码后的输入信息(编码信息)通过传输路径102,被发送到解码装置103。 
解码装置103接收通过传输路径102从编码装置101发送的编码信息,将其解码后获得输出信号。 
图2是表示图1所示的编码装置101的内部的主要结构的方框图。 
在图2中,编码装置101包括频带分割处理单元201、低频编码单元202、中频校正单元203、中高频编码单元204以及复用单元205,各个单元进行以下的动作。 
频带分割处理单元201对采样频率为SRinput的输入信号x进行基于QMF等的频带分割处理,生成采样频率都为SRinput/2的低中频信号x_lo和高频信号x_hi。这里,以SRinput是32kHz为例,低频表示0~7kHz频带,中频表示7~8kHz频带,高频表示8~16kHz频带。另外,低中频信号x_lo是指0~8kHz频带的信号,高频信号x_hi是指8~16kHz频带的信号。频带分割处理单元201将生成的低中频信号x_lo输出到低频编码单元202,并将高频信号x_hi输出到中高频编码单元204。 
低频编码单元202抑制从频带分割处理单元201输入的0~8kHz频带的低中频信号x_lo中的7~8kHz的部分,对0~7kHz的部分进行例如以ITU-T标准化的G.729.1等的编码,并将生成的低频编码信息输出到复用单元205。另外,低频编码单元202将在求低频编码信息的过程中计算出的中频(7~8kHz频带)的频率分量输出到中频校正单元203作为中频频谱X_mid。另外,低频编码单元202对生成的低频编码信息进一步进行解码,并将获得的解码 信号的低频的频率分量输出到中高频编码单元204作为解码低频频谱S_lo(k)(0≤k<7kHz)。以下,有时省略频率“k”而记述频谱。例如,有时将S_lo(k)(0≤k<7kHz)省略为S_lo而记述。另外,在后面叙述低频编码单元202的细节。 
中频校正单元203在频域上对从低频编码单元202输入的中频频谱X_mid进行校正,并将获得的频谱输出到中高频编码单元204作为校正中频频谱S_mid。另外,在后面叙述中频校正单元203的细节。 
中高频编码单元204使用从低频编码单元202输入的解码低频频谱S_lo,对从中频校正单元203输入的校正中频频谱S_mid、以及从频带分割处理单元201输入的高频信号x_hi(8~16kHz频带)进行编码,并将生成的中高频编码信息输出到复用单元205。另外,在后面叙述中高频编码单元204的细节。 
复用单元205将从低频编码单元202输入的低频编码信息和从中高频编码单元204输入的中高频编码信息复用,并将复用结果输出到传输路径102作为编码信息。 
图3是表示图2所示的低频编码单元202的内部的主要结构的方框图。 
在图3中,低频编码单元202包括频带分割处理单元301、高通滤波器302、CELP(Code Excited Linear Prediction:码激励线性预测)编码单元303、FEC(Forward Error Correction:前向纠错)编码单元304、加法单元305、低通滤波器306、TDAC(Time-Domain Aliasing Cancellation:时域混叠消除)编码单元307、TDBWE(Time-Domain BandWidth Extension:时域频带扩展)编码单元308、以及复用单元309,各个单元进行以下的动作。 
频带分割处理单元301与频带分割处理单元201同样地,对从频带分割处理单元201输入的低中频信号x_lo进行基于QMF等的频带分割处理,生成0~4kHz频带的第一低频信号、以及4~8kHz频带的第二低频信号。频带分割处理单元301将生成的第一低频信号输出到高通滤波器302,并将第二低频信号输出到低通滤波器306。 
高通滤波器302对从频带分割处理单元301输入的第一低频信号抑制0.05kHz以下的频率分量,获得主要由高于0.05kHz的频率分量构成的信号,并将其输出到CELP编码单元303和加法单元305作为滤波后第一低频信号。 
CELP编码单元303对从高通滤波器302输入的滤波后第一低频信号进行CELP方式的编码,并将获得的CELP参数输出到FEC编码单元304、TDAC 编码单元307和复用单元309。这里,CELP编码单元303也可以将CELP参数的一部分或在求CELP参数的过程中获得的信息,输出到FEC编码单元304和TDAC编码单元307。另外,CELP编码单元303对求出的CELP参数进行CELP方式的解码,并将获得的CELP解码信号输出到加法单元305。 
FEC编码单元304使用从CELP编码单元303输入的CELP参数,计算在解码装置103的丢失帧补偿处理中所利用的FEC参数,并将FEC参数输出到复用单元309。 
加法单元305计算从高通滤波器302输入的滤波后第一低频信号和从CELP编码单元303输入的CELP解码信号之差分,并将获得的差分信号输出到TDAC编码单元307。 
低通滤波器306对从频带分割处理单元301输入的第二低频信号抑制大于7kHz的频率分量,获得主要由7kHz以下的频率分量构成的信号,并将其输出到TDAC编码单元307和TDBWE(Time-Domain BandWidth Extension:时域频带扩展)编码单元308作为滤波后第二低频信号。 
TDAC编码单元307分别对从加法单元305输入的差分信号、以及从低通滤波器306输入的滤波后第二低频信号进行MDCT等的正交变换,并将获得的0~8kHz频带的频域信号(MDCT系数)中的7~8kHz频带的部分,输出到中频校正单元203作为中频频谱X_mid。另外,在对从加法单元305输入的差分信号进行正交变换时,TDAC编码单元307使用从CELP编码单元303输入的CELP参数之一的听觉加权信息,在对差分信号进行了加权后进行正交变换,并计算频域信号。另外,TDAC编码单元307对通过MDCT等的正交变换所得的频域信号(MDCT系数)进行量化,并将获得的TDAC参数输出到复用单元309。另外,TDAC编码单元307对TDAC参数进行解码,并将获得的解码信号中的0~7kHz频带的部分输出到中高频编码单元204作为解码低频频谱S_lo。 
TDBWE编码单元308对从低通滤波器306输入的滤波后第二低频信号进行在时间轴上的频带扩展编码,并将获得的TDBWE参数输出到复用单元309。 
复用单元309将FEC参数、CELP参数、TDAC参数和TDBWE参数复用,并将其输出到复用单元205作为低频编码信息。另外,也可以通过复用单元205复用这些参数,而不设置复用单元309。 
图3所示的本实施方式的低频编码单元202中的编码与G.729.1方式的编码的不同之处在于,在TDAC编码单元307中,不仅分别对从加法单元305输入的差分信号、以及从低通滤波器306输入的滤波后第二低频信号进行MDCT等的正交变换,而且将MDCT系数的7~8kHz频带的部分输出到中频校正单元203作为中频频谱X_mid,并将对TDAC参数进行了解码所得的解码信号中的0~7kHz频带的部分输出到中高频编码单元204作为解码低频频谱S_lo。 
接着,说明中频校正单元203的处理。 
为了说明中频校正单元203的处理,首先说明低频编码单元202内的低通滤波器306的滤波特性。 
低频编码单元202内的低通滤波器306的传递函数H(z)例如通过下式(1)表示。 
H ( z ) = 0.3500277721 + 1.3045646694 z - 1 + 1.9127698530 z - 2 + 1.3045646694 z - 3 + 0.350027772 1 - 4 1 + 1.79857371201 z - 1 + 1.69962113314 z - 2 + 0.70669663302 z - 3 + 0.16954708937 z - 4
...(1) 
图4和图5是表示具有式(1)所表示的传递函数的低通滤波器306的频率特性的图。在图4和图5中,表示将低通滤波器306适用于0~4kHz频带的输入信号时的频率特性,但在本实施方式中,输入到低通滤波器306的第二低频信号具有的频带为4~8kHz,所以这种情况下,实际上将图4和图5所示的低通滤波器306的频率特性适用于4~8kHz。在图4和图5中,横轴表示频率f(Hz),纵轴表示了表示低通滤波器306的频率特性的LPF(f)的值。另外,在图4中,使用对数(log)比例(dB)表示频率特性,在图5中,使用线性标度表示频率特性,此时,LPF(f)的值取0~1。通过具有图4和图5所示的频率特性的低通滤波器306对从频带分割处理单元301输入的第二低频信号(4~8kHz)进行滤波,并获得7~8kHz频带的频率分量被抑制的、主要由4~7kHz频带的频率分量构成的滤波后第二低频信号。接着,在TDAC编码单元307中,对滤波后第二低频信号进行MDCT。因此,从TDAC编码单元307输入到中频校正单元203的中频频谱X_mid为,对通过低通滤波器306抑制的7~8kHz频带的信号进行了MDCT所得的结果。 
中频校正单元203利用图5所示的低通滤波器306的频率特性,对从低 频编码单元202输入的中频频谱X_mid进行在频率轴上的校正,计算校正中频频谱S_mid。具体而言,中频校正单元203通过根据下式(2),将7~8kHz频带的中频频谱X_mid除以图5所示的低通滤波器306的3~4kHz频带的LPF(f)的值,计算校正中频频谱S_mid。这里,低通滤波器306的频率特性LPF(f)的3~4kHz的频带相当于输入到频带分割处理单元301之前的低频信号的7~8kHz的频带。也就是说,中频校正单元203通过将低通滤波器306的频率特性的倒数乘以中频频谱X_mid,获得与复原为低通滤波器306的处理前的状态的第二低频信号的7~8kHz频带对应的MDCT系数。 
S _ mid ( k ) = W ( f ) · X _ mid ( k ) LPF ( f ) · , k = 0 , . . . , N lo - 1 f = 3000 , . . . , 4000 LPF ( f ) ≠ 0 . . . ( 2 )
在式(2)中,LPF(f)是图5所示的3~4kHz部分的频率特性(纵轴的值),取0~1.0的范围。Nlo是7~8kHz频带的频率分量的样本数。另外,在式(2)中,f取3000~4000Hz为止的值,但将其适用于第二低频信号的4~8kHz的频带,所以实际上意味着7000~8000Hz的频率。另外,在式(2)中,k取与3000~4000Hz的f的值对应的中频频谱X_mid(k)的频率索引的值。也就是说,在f=3000时,将对第二低频信号的7000Hz的分量的LPF(3000)的值适用于中频频谱X_mid(0)的值,而在f=4000时,也就是将对第二低频信号的8000Hz的分量的LPF(4000)的值适用于中频频谱X_mid(Nlo-1)。 
另外,在式(2)中,W(f)是校正系数,其具备下述功能,即抑制单纯地将中频频谱(7~8kHz频带)除以LPF(f)而求校正中频频谱时可能产生的异常噪声。具体而言,通过实验已确认W(f)取0.95~0.97左右的值是合适的。以下,说明W(f)的异常噪声的抑制效果。 
这里,若着眼于图5中的0~1500Hz频带,则在0~1500Hz频带中,低通滤波器306的频率特性取0.95~1.00左右的值。这里,适用了图5所示的低通滤波器306的频率特性中的、0~1500Hz的值是第二低频信号的4000~5500Hz的频带。因此,第二低频信号的4000~5500Hz频带的分量为适用低通滤波器306的处理前的信号的约0.95~0.97倍。也就是说,从TDAC编码单元307输入到中高频编码单元204的解码低频频谱的4000~5500Hz频带是与适用低通滤波器306的处理前的第二低频信号的约0.95倍的信号对应的MDCT系数。对此,在式(2)中,不与W(f)相乘而将低通滤波器306的频率特性的倒数乘以中频频谱X_mid(k)所得的7~8kHz频带的频谱是与低通滤波器 306的处理前的第二低频信号本身对应的MDCT系数。中频校正单元203将根据式(2)计算出的校正中频频谱S_mid(k)输出到中高频编码单元204,所以假设在式(2)中不与W(f)目乘时,输入到中高频编码单元204的频谱的4000~5500Hz频带和7~8kHz频带的频谱的大小的平衡崩解,产生异常噪声。 
另外,计算机的运算精度不是无限的,所以若LPF(f)是非常小的值,则LPF(f)的倒数是非常大的值,产生舍入误差等的计算误差。 
为了避免这样的问题,中频校正单元203将中频频谱X_mid(k)除以低通滤波器306的频率特性,并进一步与考虑了低通滤波器306的0~3000Hz的值的校正系数W(f)相乘。由此,也取得与4000~5500Hz频带的频谱的平衡,还能够抑制起因于计算误差的音质劣化,并且校正7~8kHz频带的频谱。用于抑制与相邻频带之间的能量平衡的失真(不连续性等)造成的异常噪声的、如上所述的处理,不仅是单纯的信号处理中的逆滤波处理,而且是对语音/音频信号特有的质量改善技术。 
这里,中频校正单元203在内部预先存储表示低通滤波器306的频率特性的LPF(f)(f=0,...,4000)以及与LPF(f)对应的W(f)。另外,也可以预先求LPF(f)的倒数与W(f)目乘所得的值,并在内部存储该值,由此能够预计进一步减少运算量。 
图6是表示图2所示的中高频编码单元204的内部的主要结构的方框图。 
在图6中,中高频编码单元204包括正交变换处理单元401、中高频频谱计算单元402、以及频带扩展编码单元403,各个单元进行以下的动作。 
正交变换处理单元401在内部具有缓冲器bufn(n=0、...、N-1),对从频带分割处理单元201输入的8~16kHz频带的高频信号x_hi进行改进离散余弦变换(MDCT)等作为正交变换处理,由此计算作为高频信号x_hi的频率分量的高频频谱S_hi。 
具体而言,首先,正交变换处理单元401如下式(3)所示那样地使用“0”,对缓冲器bufn进行初始化。 
bufn=0  (n=0,...,N-1)...(3) 
接着,正交变换处理单元401根据下式(4),对高频信号x_hi进行MDCT,求高频信号的MDCT系数S_hi作为高频频谱。 
S _ hi ( k ) = 2 N Σ n = 0 2 N - 1 x _ hi n ′ cos [ ( 2 n + 1 + N ) ( 2 k + 1 ) π 4 N ] , ( k = 0 , . . . , N - 1 ) . . . ( 4 )
在式(4)中,k表示1帧中的各个样本的索引。另外,x_hi’是根据下式(5)使高频信号x_hi和缓冲器bufn结合所得的矢量。 
x _ h i n ′ = buf n ( n = 0 , . . . N - 1 ) x _ hi n - N ( n = N , . . . 2 N - 1 ) . . . ( 5 )
接着,如下式(6)所示,正交变换处理单元401更新缓冲器bufn。 
bufn=x_hin  (n=0,...N-1)                ...(6) 
然后,正交变换处理单元401将高频频谱S_hi(k)输出到中高频频谱计算单元402。 
中高频频谱计算单元402使用从正交变换处理单元401输入的高频频谱S_hi、以及从中频校正单元203输入的校正中频频谱S_mid,根据下式(7),计算中高频频谱S_mid_hi而将其输出到频带扩展编码单元403。这里,设具有7~16kHz频带的分量的S_mid_hi的样本数为Nmid_hi。也就是说,如式(7)所示,中高频频谱S_mid_hi是使校正中频频谱S_mid和高频频谱S_hi在频率轴上连续(结合)所得的频谱。 
S _ mid _ hi ( k ) = S _ mid ( k ) ( k = 0 , . . . N lo - 1 ) S _ hi ( k - N lo ) ( k = N lo , . . . N mid _ hi ) . . . ( 7 )
频带扩展编码单元403使用从低频编码单元202输入的解码低频频谱S_lo和从中高频频谱计算单元402输入的中高频频谱S_mid_hi,计算用于从解码低频频谱生成中高频频谱的中高频编码信息而将其输出到复用单元205。 
图7是表示图6所示的频带扩展编码单元403的内部的主要结构的方框图。 
在图7中,频带扩展编码单元403包括:滤波器状态设定单元501、滤波单元502、搜索单元503、基音系数设定单元504、增益编码单元505、以及复用单元506,各个单元进行以下的动作。 
滤波器状态设定单元501设定从低频编码单元202输入的解码低频频谱S_lo作为滤波单元502中使用的滤波器状态。也就是说,在滤波单元502中的全频带(0~16kHz频带)的频谱S(k)(0≤k<16kHz)的0~7kHz频带,存储解码低频频谱S_lo作为滤波器的内部状态(滤波器状态)。 
滤波单元502具有多抽头(multi tap,抽头数多于1)的基音滤波器,基于由滤波器状态设定单元501设定的滤波器状态和从基音系数设定单元504输入的基音系数,对解码低频频谱S_lo进行滤波,并计算中高频频谱的估计值 S_mid_hi’(7~16kHz频带)(以下,称为“估计中高频频谱”)。滤波单元502将估计中高频频谱S_mid_hi’输出到搜索单元503。此外,在后面叙述滤波单元502中的滤波处理的细节。 
搜索单元503计算从中高频频谱计算单元402输入的中高频频谱S_mid_hi(7~16kHz频带)和从滤波单元502输入的估计中高频频谱S_mid_hi’之间的相似度。该相似度的计算例如通过相关运算等来进行。滤波单元502、搜索单元503、以及基音系数设定单元504的处理构成闭环。在该闭环中,搜索单元503通过使从基音系数设定单元504输入到滤波单元502的基音系数T发生各种变化,计算与各个基音系数对应的相似度。搜索单元503将其中相似度最大的最佳基音系数T′输出到复用单元506。另外,搜索单元503将与该基音系数T′对应的估计中高频频谱S_mid_hi’输出到增益编码单元505。另外,在后面叙述搜索单元503中的最佳基音系数T’的搜索处理的细节。 
基音系数设定单元504在搜索单元503的控制下,使基音系数T在预先规定的搜索范围Tmin~Tmax内一点一点地变化,同时将其依次输出到滤波单元502。 
增益编码单元505计算有关从中高频频谱计算单元402输入的中高频频谱S_mid_hi(k)(7~16kHz频带)的增益信息。具体而言,增益编码单元505将7~16kHz频带分割为J个子带,求中高频频谱S_mid_hi(k)的每个子带的频谱功率。此时,第j子带的频谱功率B(j)通过下式(8)表示。 
B ( j ) = Σ k = BL ( j ) BH ( j ) S _ mid _ hi ( k ) 2 , ( j = 0 , . . . , J - 1 ) . . . ( 8 )
在式(8)中,BL(j)表示第j子带的最小频率,BH(j)表示第j子带的最大频率。 
另外,增益编码单元505同样按照下式(9)计算与最佳基音系数T’对应的估计中高频频谱S_mid_hi’的每个子带的频率功率B′(j)。 
B ′ ( j ) = Σ k = BL ( j ) BH ( j ) S _ mid _ hi ′ ( k ) 2 , ( j = 0 , . . . , J - 1 ) . . . ( 9 )
接着,增益编码单元505根据下式(10)计算对中高频频谱S_mid_hi的估计中高频频谱S_mid_hi’的每个子带的频谱功率的变动量V(j)。 
V ( j ) = B ( j ) B ′ ( j ) , ( j = 0 , . . . , J - 1 ) . . . ( 10 )
然后,增益编码单元505对变动量V(j)进行编码,并将与编码后的变动量Vq(j)对应的索引输出到复用单元506。 
复用单元506将从搜索单元503输入的最佳基音系数T’和从增益编码单元505输入的编码后的变动量Vq(j)的索引复用作为高频编码信息,并将其输出到复用单元205。另外,也可以将T’和Vq(j)的索引直接输入到复用单元205,并在复用单元205中将其与低频编码信息复用。 
图8是用于说明图7所示的滤波单元502中的滤波处理的细节的图。 
滤波单元502使用从基音系数设定单元504输入的基音系数T,生成7~16kHz频带的频谱。滤波单元502的传递函数通过下式(11)表示。 
P ( z ) = 1 1 - Σ i = - M M β i z - T + i . . . ( 11 )
在式(11)中,T表示从基音系数设定单元504提供的基音系数,βi表示预先在内部存储的滤波器系数。例如,将抽头数为3时,滤波器系数的候补可以举例为(β-1、β0、β1)=(0.1、0.8、0.1)。除此之外,(β-1、β0、β1)=(0.2、0.6、0.2)、(0.3、0.4、0.3)等的值也是适当的。另外,在式(11)中,设M=1。M是关于抽头数的指标。 
在滤波单元502中的全频带的频谱S(k)的0~7kHz中,存储解码低频频谱S_lo作为滤波器的内部状态(滤波器状态)。 
在S(k)的7~16kHz频带中,通过以下的步骤的滤波处理,估计中高频频谱S_mid_hi’被存储。也就是说,在S_mid_hi’中,原则上,代入频率比该k低T的频率的频谱S(k-T)。但是,为了增加频谱的平滑性,实际上,将与规定的滤波器系数βi相乘所得的频谱βi·S(k-T+i)代入从频谱S(k-T)隔开i的附近的频谱S(k-T+i),并将对所有的i进行加法运算所得的频谱代入S_mid_hi’(k)。该处理通过下式(12)表示。 
S _ mid _ hi ′ ( k ) = Σ i = - 1 1 β i · S ( k - T + i ) . . . ( 12 )
通过从频率低的k=7kHz开始,依序在7~16kHz频带的范围内使频率变化而进行上述运算,计算7~16kHz频带中的估计中高频频谱S_mid_hi’(k)。 
在每次从基音系数设定单元504提供基音系数T时,在7~16kHz频带的范围内,每次将S(k)清零后进行以上的滤波处理。也就是说,每次基音系数T发生变化,都计算S(k),并将其输出到搜索单元503。 
图9是表示在图7所示的搜索单元503中搜索最佳基音系数T’的处理的步骤的流程图。 
首先,搜索单元503将作为用于保存相似度的最小值的变量的最小相似度Dmin初始化为“+∞”(ST2010)。接着,搜索单元503根据下式(13),计算某个基音系数中的中高频频谱S_mid_hi和估计中高频频谱S_mid_hi’之间的相似度D(ST2020)。 
D = Σ k = 0 M ′ S _ mid _ hi ( k ) · S _ mid _ hi ( k ) - ( Σ k = 0 M ′ S _ mid _ hi ( k ) · S _ mid _ hi ′ ( k ) ) 2 Σ k = 0 M ′ S _ mid _ hi ′ ( k ) · S _ mid _ hi ′ ( k ) . . . ( 13 )
在式(13)中,M’表示计算相似度D时的样本数,也可以是中高频部分的样本长度Nmid_hi以下的任意的值。 
另外,如上所述,在滤波单元502中生成的估计中高频频谱S_mid_hi’是对解码低频频谱S_lo进行滤波所得的频谱。因此,搜索单元503中计算出的中高频频谱S_mid_hi和估计中高频频谱S_mid_hi’之间的相似度,也能够表示中高频频谱S_mid_hi和解码低频频谱S_lo之间的相似度。 
接下来,搜索单元503判定计算出的相似度D是否小于最小相似度Dmin(ST2030)。当在ST2020中计算出的相似度D小于最小相似度Dmin时(ST2030:“是”),搜索单元503将相似度D代入最小相似度Dmin(ST2040)。另一方面,在ST2020中计算出的相似度D为最小相似度Dmin以上时(ST2030:“否”),搜索单元503判定搜索范围是否已经结束。也就是说,搜索单元503对于搜索范围内的所有基音系数,分别判定是否在ST2020中根据上式(13)计算出了相似度D(ST2050)。在搜索范围尚未结束时(ST2050:“否”),搜索单元503将处理重新返回ST2020。然后,搜索单元503对于与上次在ST2020的步骤中根据式(13)计算出相似度时不同的基音系数,根据式(13)计算相似度。另一方面,在搜索范围结束了时(ST20S0:“是”),搜索单元503将与最小相似度Dmin对应的基音系数T输出到复用单元506作为最佳基音系数T′,并将与最佳基音系数T’对应的估计中高频频谱S_mid_hi’(k)输出到增益编码单元505(ST2060)。 
图10是表示图1所示的解码装置103的内部的主要结构的方框图。 
解码装置103包括分离单元601、低中频解码单元602、高频解码单元 603、以及频带合成处理单元604,各个单元进行以下的动作。 
分离单元601将通过传输路径102从编码装置101传输的编码信息分离为低频编码信息和中高频编码信息,将低频编码信息输出到低中频解码单元602,并将中高频编码信息输出到高频解码单元603。 
低中频解码单元602对从分离单元601输入的低频编码信息进行解码,并将获得的解码低频频谱输出到高频解码单元603。另外,低中频解码单元602以该解码低频频谱和从高频解码单元603输入的解码中频频谱生成解码低中频信号,并将其输出到频带合成处理单元604。另外,在后面叙述低中频解码单元602的细节。 
高频解码单元603基于从分离单元601输入的中高频编码信息和从低中频解码单元602输入的解码低频频谱生成解码高频信号,并将其输出到频带合成处理单元604。另外,高频解码单元603将生成解码高频信号时计算出的解码中频频谱输出到低中频解码单元602。另外,在后面叙述高频解码单元603的细节。 
在频带合成处理单元604中,输入从低中频解码单元602输入的解码低中频信号,并从高频解码单元603输入解码高频信号。频带合成处理单元604通过进行与频带分割处理单元201相反的处理,以从低中频解码单元602输入的采样频率为16kHz的解码低中频信号(0~8kHz频带)、以及从高频解码单元603输入的解码高频信号(8~16kHz频带),生成并输出采样频率为32kHz(0~16kHz频带)的输出信号。 
图11是表示图10所示的低中频解码单元602的内部的主要结构的方框图。这里,对应于图2的低频编码单元202,举例说明低中频解码单元602中进行以ITU-T标准化的G.729.1等的解码的结构。另外,图11所示的低中频解码单元602的结构是不产生帧差错时的结构,未图示用于帧差错补偿处理的结构要素,并省略其说明。但是,本发明也能够适用于产生帧差错的情况。 
低中频解码单元602包括分离单元701、CELP解码单元702、TDAC解码单元703、TDBWE解码单元704、预/后回波削减单元705、加法单元706、自适应后处理单元707、低通滤波器708、预/后回波削减单元709、高通滤波器710、以及频带合成处理单元711,各个单元进行以下的动作。 
分离单元701将从分离单元601输入的低频编码信息分离为CELP参数、 TDAC参数和TDBWE参数,将CELP参数输出到CELP解码单元702,将TDAC参数输出到TDAC解码单元703,并将TDBWE参数输出到TDBWE解码单元704。另外,也可以在分离单元601中集中地分离这些参数,而不设置分离单元701。 
CELP解码单元702对从分离单元701输入的CELP参数进行CELP方式的解码,并将获得的解码信号输出到TDAC解码单元703、加法单元706和预/后回波削减单元705作为解码第一低频信号。或者,CELP解码单元702也可以除了输出解码第一低频信号之外,还将以CELP参数生成解码第一低频信号的解码过程中获得的其他的信息输出到TDAC解码单元703。 
TDAC解码单元703使用从分离单元701输入的TDAC参数、从CELP解码单元702输入的解码第一低频信号或生成解码第一低频信号时获得的其他的信息、从TDBWE解码单元704输入的解码TDBWE信号、以及从高频解码单元603输入的7~8kHz频带的解码中频频谱,计算解码低频频谱,并将其输出到高频解码单元603。另外,TDAC解码单元703利用从高频解码单元603输入的解码中频频谱,计算0~8kHz频带的解码低中频频谱。具体而言,通过在解码低中频频谱中,将0~7kHz频带的值设为解码低频频谱,并且将7~8kHz频带的值设为解码中频频谱,计算解码低中频频谱。另外,TDAC解码单元703对计算出的解码低中频频谱的0~4kHz频带和4~8kHz频带的各个频带进行MDCT等的正交变换处理,并计算解码第一TDAC信号(0~4kHz频带)和解码第二TDAC信号(4~8kHz频带)。TDAC解码单元703将计算出的解码第一TDAC信号输出到预/后回波削减单元705,并将解码第二TDAC信号输出到预/后回波削减单元709。 
TDBWE解码单元704对从分离单元701输入的TDBWE参数进行解码,并将获得的解码信号输出到TDAC解码单元703和预/后回波削减单元709作为解码TDBWE信号。 
预/后回波削减单元705对从CELP解码单元702输入的解码CELP信号、以及从TDAC解码单元703输入的解码第一TDAC信号进行削减预/后回波的处理,并将回波削除后的信号输出到加法单元706。 
加法单元706对从CELP解码单元702输入的解码CELP信号和从预/后回波削减单元705输入的回波削除后的信号进行加法运算,并将获得的加法运算信号输出到自适应后处理单元707。 
自适应后处理单元707对从加法单元706输入的加法信号自适应地进行后处理,并将获得的解码第一低频信号(0~4kHz频带)输出到低通滤波器708。 
低通滤波器708对从自适应后处理单元707输入的解码第一低频信号抑制大于4kHz的频率分量,获得主要由4kHz以下的频率分量构成的信号,并将其输出到频带合成处理单元711作为滤波器后解码第一低频信号。 
预/后回波削减单元709对从TDAC解码单元703输入的解码第二TDAC信号、以及从TDBWE解码单元704输入的解码TDBWE信号进行削减预/后回波的处理,并将回波削除后的信号输出到高通滤波器710作为解码第二低频信号(4~8kHz频带)。 
高通滤波器710对从预/后回波削减单元709输入的解码第二低频信号抑制4kHz以下的频率分量,获得主要由高于4kHz的频率分量构成的信号,并将其输出到频带合成处理单元711作为滤波器后解码第二低频信号。 
在频带合成处理单元711中,从低通滤波器708输入滤波器后解码第一低频信号,从高通滤波器710输入滤波器后解码第二低频信号。频带合成处理单元711通过进行与频带分割处理单元301相反的处理,以采样频率为8kHz的滤波器后解码第一低频信号(0~4kHz频带)和滤波器后解码第二低频信号(4~8kHz频带),生成采样频率为16kHz(0~8kHz频带)的解码低中频信号,并将其输出到频带合成处理单元604。 
另外,也可以通过频带合成处理单元604集中地进行频带合成处理,而不设置频带合成处理单元711。 
图11所示的本实施方式的低中频解码单元602中的解码与G.729.1方式的解码的不同之处在于,在TDAC解码单元703中,在以TDAC参数计算出0~7kHz频带的解码低频频谱时将其输出到高频解码单元603、以及对由该解码低频频谱和从高频解码单元603输入的7~8kHz频带的解码中频频谱构成的解码低中频频谱进行正交变换而计算TDAC解码信号,而不是仅对解码低频频谱进行正交变换。 
图12是表示图10所示的高频解码单元603的内部的主要结构的方框图。 
在图12中,高频解码单元603包括:分离单元801、滤波器状态设定单元802、滤波单元803、增益解码单元804、频谱调整单元805、以及正交变换处理单元806,各个单元进行以下的动作。 
分离单元801将从分离单元601输入的中高频编码信息分离为与滤波有 关信息即最佳基音系数T′、以及与增益有关信息即编码后变动量Vq(j)的索引,将最佳基音系数T′输出到滤波单元803,并将编码后变动量Vq(j)的索引输出到增益解码单元804。此外,在分离单元601中已经分离了T′和Vq(j)的索引时,也可以不配置分离单元801。 
滤波器状态设定单元802设定从低中频编码单元602输入的解码低频频谱S_lo(k)(0~7kHz频带)作为滤波单元803中使用的滤波器状态。这里,在为了方便而将滤波单元803中的全频带(0~16kHz频带)的频谱称为S(k)时,在S(k)的0~7kHz的频带中存储解码低频频谱S_lo(k)作为滤波器的内部状态(滤波器状态)。另外,滤波器状态设定单元802的结构和动作与图7所示的滤波器状态设定单元501相同,因此,省略详细的说明。 
滤波单元803具有多抽头(抽头数多于1)的基音滤波器。滤波单元803基于滤波器状态设定单元802所设定的滤波器状态、从分离单元801输入的基音系数T’、预先在内部存储的滤波器系数,对解码低频频谱S_lo进行滤波,计算上式(12)所示的、中高频频谱S_mid_hi的估计中高频频谱S_mid_hi’。滤波单元803中也使用上式(11)所示的传递函数。 
增益解码单元804对从分离单元801输入的编码后变动量Vq(j)的索引进行解码,求作为变动量V(j)的量化值的变动量Vq(j)。 
频谱调整单元805根据下式(14)将从增益解码单元804输入的每个子带的变动量Vq(j)乘以从滤波单元803输入的估计中高频频谱S_mid_hi’。由此,频谱调整单元805调整估计中高频频谱S_mid_hi’的7~8kHz频带中的频谱形状,并生成解码中高频频谱S_mid_hi2(k)。 
S_mid_hi2(k)=S_mid_hi′(k)·Vq(j),(BL(j)≤k≤BH(j),for all j)...(14) 
然后,频谱调整单元805使用解码低频频谱S_lo(k)作为低频部分(0~7kHz),使用解码中高频频谱S_mid_hi2(k)作为中高频部分(7~16kHz),构成解码频谱S2(k)。 
另外,频谱调整单元805仅将解码频谱S2(k)的中频部分(7~8kHz频带)的频谱输出到低中频解码单元602作为解码中频频谱S_mid2(k),并仅将解码频谱S2(k)的高频部分(8~16kHz频带)的频谱输出到正交变换处理单元806作为解码高频频谱S_hi2(k)。 
正交变换处理单元806对从频谱调整单元805输入的解码高频频谱S_hi2进行改进离散余弦逆变换(IMDCT:Inverse Modified Discrete Cosine Transform) 等的正交变换处理而生成时域的信号,并将其作为解码高频信号输出。这里,根据需要,进行适当的加窗和叠加运算等处理,避免在帧间产生不连续。 
以下,说明在正交变换处理单元806中的具体的处理。 
正交变换处理单元806在其内部具有缓冲器buf(k),如下式(15)所示对缓冲器buf(k)进行初始化。 
buf′(k)=0  (k=0,...,N-1)  ...(15) 
另外,正交变换处理单元806使用从频谱调整单元805输入的解码高频频谱S_hi2,根据下式(16),求解码高频信号y”而将其输出。 
y ′ ′ n = 2 N Σ n = 0 2 N - 1 Z ( k ) cos [ ( 2 n + 1 + N ) ( 2 k + 1 ) π 4 N ] , ( n = 0 , . . . , N - 1 ) . . . ( 16 )
在式(16)中,如下式(17)所示,Z(k)是将解码高频频谱S_hi2(k)和缓冲器buf(k)结合所得的矢量。 
Z ( k ) = buf ′ ( k ) ( k = 0 , . . . N - 1 ) S _ hi 2 ( k ) ( k = N , . . . 2 N - 1 ) . . . ( 17 )
接下来,正交变换处理单元806根据下式(18)更新缓冲器buf(k)。 
buf′(k)=S_hi2(k)  (k=0,...N-1)...(18) 
如上所述,在本实施方式的编码装置101中,通过频带分割处理单元201将输入信号分割为低中频信号和高频信号后,中频校正单元203对通过低频编码单元202内的低通滤波器306的处理抑制后的中频的频率分量,适用与低通滤波器306的滤波器特性相反的特性或与相反的特性近似的特性,由此将中频的频率分量复原为与不适用低通滤波器306的状态相同的状态。接着,在中高频编码单元204中,利用复原后的中频的频率分量,计算用于从低频生成中高频的频率分量的频带扩展参数。然后,本实施方式的解码装置103基于通过低中频解码单元602获得的解码低频频谱、以及从编码装置101传输的频带扩展参数,计算解码中高频频谱。低中频解码单元602利用从高频解码单元603输入的解码中频频谱、以及从分离单元601输入的低频编码信息,计算具有低中频的频率分量的解码低中频信号。接着,通过频带合成处理单元604对高频解码单元603中从解码高频频谱计算出的解码高频信号和上述解码低中频信号进行频带合成处理,能够获得包含因低频编码单元202内的低通滤波器306而欠缺了的中频的频率分量的输出信号(解码信号)。 
这样,根据本实施方式,编码装置将输入信号通过QMF等频带分割为 低频分量和高频分量,从而将各个分量通过不同的编码单元进行编码,并且使用通过低频编码的TDAC编码获得的MDCT系数,对因在低频编码过程中适用低通滤波器而欠缺了的频带的分量进行复原并编码。因此,能够抑制该复原所需的运算量,并且提高解码信号的质量。另外,在本实施方式中,中频校正处理对低频编码单元中利用的编码方法(在本实施方式中为G.729.1方式的编码)的编码性能几乎不造成影响,所以能够保证低频编码的编码性能。 
另外,在本实施方式中,举例说明了低频编码单元202和低中频解码单元602中进行CELP类型(G.729.1等)的语音编码/解码的情况,但本发明并不限于此,低频编码单元202和低中频解码单元602也可以通过CELP类型以外的语音/音乐编码方式对低频信号进行编码/解码。 
另外,在本实施方式中,举例说明了在中频校正单元203中预先计算并存储低通滤波器306的特性的情况,但本发明并不限于此,中频校正单元203也可以每次低通滤波器306的特性产生变化时都计算并利用。另外,在预先计算并存储低通滤波器306的特性时,在内部存储低通滤波器306特性的倒数作为表,将表内的系数乘以中频频谱,从而能够削减运算量。 
另外,在本实施方式中,举例说明了QMF作为频带分割处理单元201中的频带分割方法,但本发明并不限于此,也可以将QMF以外的频带分割方法用于频带分割处理单元201。 
另外,在本实施方式中,对低通滤波器306的滤波器特性的计算方法没有特别限定,但优选使用与TDAC编码单元307内使用的正交变换方法相同的方法,计算滤波器特性。因此,在本实施方式的结构中,优选使用MDCT处理来计算低通滤波器306的滤波器特性。另外,例如,在低频编码单元202内通过FFT处理来计算频率分量时,同样地优选通过FFT处理来计算低通滤波器306的滤波器特性。 
另外,在本实施方式中,说明了以下的结构,即在频带扩展编码单元403中计算中高频编码信息时,对包含校正中频频谱的中高频频谱不特别进行区别中频和高频的处理。但是,本发明并不限于此,也可以同样地适用于对中高频频谱中的中频部分判定校正结果,并进行与判定结果对应的编码处理的情况。 
例如,举例说明以下的情况,即在中高频频谱计算单元402中,计算校正中频频谱的频谱平坦度测量值(SFM:Spectral Flatness Measure),将计算出 的SFM的值与预先规定的阈值进行比较,并根据该判定结果,对校正中频频谱进行修正处理。另外,这里,SFM以振幅频谱的几何平均与算术平均之比(=几何平均/算术平均)表示。频谱的峰性越强,SFM越接近0.0,而频谱的杂声性越强,SFM越接近1.0。此时,在中高频频谱计算单元402中,首先将校正中频频谱的SFM与预先规定的阈值进行比较。在SFM小于阈值时,能够判定为校正中频频谱的偏差较强,但此时,中高频频谱计算单元402对校正中频频谱进行基于多抽头滤波器的频谱的平滑化(钝化),使用获得的校正中频频谱计算中高频频谱,并将其输出到频带扩展编码单元403。 
频带扩展编码单元403利用从中高频频谱计算单元402输入的修正后的中高频频谱,通过如上所述的方法,计算中高频编码信息。通过这样的结构,在由中频校正单元203校正后的校正中频频谱的频谱特性的频谱上的偏差较强,成为解码信号的异常噪声的原因时,通过对校正中频频谱进行平滑化处理,能够提高解码信号的质量。另外,对中高频频谱计算单元402中的校正中频频谱的修正处理,除了如上所述的平滑化处理之外,也能够同样地适用对每个子带衰减校正中频频谱的方法,或者以预先存储在内部的噪声频谱置换校正中频频谱的方法,或者从低频频谱和高频频谱线性预测校正中频频谱的方法等。这里,在从低频频谱和高频频谱来线性预测校正中频频谱时,在中高频频谱计算单元402中,需要从低频编码单元202输入解码低频频谱。 
另外,对校正中频频谱是否进行如上所述的修正处理的判定中除了利用校正中频频谱的SFM以外,还能够利用校正中频频谱的时间上的功率(energy)的变动。此时,在对每个帧计算校正中频频谱的功率,与先前帧的功率之间的变动量为预先规定的阈值以上时,对校正中频频谱进行如上所述的修正处理(平滑化处理)。通过这样的结构,即使在校正中频频谱的时间上的功率的变动非常大,由此在解码信号中产生异常噪声时,也能够提供良好的质量的解码信号。 
另外,作为频带扩展编码单元403中的编码处理的其他的切换方法,例如,可举出对作为参考的中高频频谱内的中频部分,切换搜索时的权重的方法。具体而言,在搜索单元503中,能够代替式(13)而根据式(19)计算相似度来实现。 
D = { Σ k = 0 M ′ S _ mid _ hi ( k ) · S _ mid _ hi ( k ) - ( Σ k = 0 M ′ S _ mid _ hi ( k ) · S _ mid _ hi ′ ( k ) ) 2 Σ k = 0 M ′ S _ mid _ hi ′ ( k ) · S _ mid _ hi ′ ( k ) } · W ( k )
...(19) 
其中,在式(19)中,W(k)是计算相似度时的系数。在k的值属于中频部分(7-8kHz)时,取1.0以下的预先规定的值,而在k的值属于高频部分时,取1.0的值,由此能够降低中高频频谱整体的相似度中的校正中频频谱的部分的相似度的比例,即使在校正中频频谱的精度较差时,也能够抑制在解码信号中产生异常噪声。 
另外,在频带扩展编码单元403、中高频频谱计算单元402、低频编码单元202中的上述的结构也可以相互组合使用。 
另外,在本实施方式中,举例说明了低频编码单元(低中频解码单元)和中高频编码单元(高频解码单元)的层数为2时的可扩展编码/解码方法,但本发明并不限于此,也能够同样地适用于层数为3以上的可扩展编码/解码方法。另外,在层数为3以上的可扩展编码/解码方法中,在将本发明的中高频编码单元的结构适用于最高层以外的层(例如为层L)时,在层(L+1)中,进行控制以对中频部分的误差频谱优先进行编码,由此能够更加提高层(L+1)的解码信号的质量。 
(实施方式2) 
本发明的实施方式2的通信系统(未图示)与图1所示的通信系统基本上相同,与图1的通信系统的解码装置103的不同之处仅在于解码装置的结构和一部分的动作。以下,对本实施方式的通信系统的解码装置附加标号“113”,并进行说明。 
图13是表示本实施方式的解码装置113的内部的主要结构的方框图。另外,本实施方式的解码装置113具有与图10所示的解码装置103基本上相同的结构,并进行基本上相同的动作。解码装置113与解码装置103的不同之处在于,还具有加法单元904和中频解码单元903。另外,解码装置113的低频解码单元901、高频解码单元902和频带合成处理单元905仅在一部分的动作上与解码装置103的低中频解码单元602、高频解码单元603和频带合成处理单元603不同。 
低频解码单元901与图10所示的低中频解码单元602不同,对从分离单元601输入的低频编码信息进行解码来生成解码低频频谱和解码低频信号,而不从高频解码单元902输入解码中频频谱。另外,低频解码单元901将解码低频频谱输出到高频解码单元902,并将解码低频信号输出到加法单元904。另外,在后面叙述低频解码单元901的细节。 
高频解码单元902以从分离单元601输入的中高频编码信息和从低频解码单元901输入的解码低频频谱生成解码高频信号,并将其输出到频带合成处理单元905。另外,高频解码单元902与图10所示的高频解码单元603不同,将生成解码高频信号时计算的解码中频频谱输出到中频解码单元903,而不输出低频解码单元901。 
中频解码单元903对从高频解码单元902输入的解码中频频谱进行逆MDCT等的正交变换处理而生成解码中频信号,并将其输出到加法单元904。另外,中频解码单元903中的逆MDCT与实施方式1的正交变换处理单元806中的逆MDCT基本上相同,仅处理对象不同,所以省略详细的说明。 
加法单元904将从低频解码单元901输入的解码低频信号和从中频解码单元903输入的解码中频信号相加,并将获得的相加信号输出到频带合成处理单元905作为解码低中频信号。 
在频带合成处理单元905中,从加法单元904输入解码低中频信号,并从高频解码单元902输入解码高频信号。频带合成处理单元905通过进行与频带分割处理单元201相反的处理,以采样频率为16kHz的解码低中频信号(0~8kHz频带)、以及解码高频信号(8~16kHz频带),生成并输出采样频率为32kHz(0~16kHz频带)的输出信号。 
图14是表示图13所示的低频解码单元901的内部的主要结构的方框图。另外,低频解码单元901具有与图11所示的低中频解码单元602基本上相同的结构,并进行基本上相同的动作。低频解码单元901的TDAC解码单元1003仅在一部分的动作上与低中频解码单元602的TDAC解码单元703不同。 
TDAC解码单元1003与图11所示的TDAC解码单元703不同,不从高频解码单元902输入7~8kHz频带的解码中频频谱,而使用从分离单元701输入的TDAC参数、从CELP解码单元702输入的解码第一低频信号或生成解码第一低频信号时计算出的信息、以及从TDBWE解码单元704输入的解码TDBWE信号,计算解码低频频谱,并将其输出到高频解码单元902。另 外,TDAC解码单元1003对计算出的解码低频频谱的0~4kHz频带和4~7kHz频带的各个频带分别进行正交变换处理,从而计算解码第一TDAC信号(0~4kHz频带)和解码第二TDAC信号(4~7kHz频带)。TDAC解码单元1003将解码第一TDAC信号输出到预/后回波削减单元705,并将解码第二TDAC信号输出到预/后回波削减单元709。 
从TDAC解码单元1003输入到预/后回波削减单元709的解码第二TDAC信号不包含中频(7~8kHz)的分量,所以通过预/后回波削减单元709和高通滤波器710输入到频带合成处理单元711的信号也不包含中频的分量。因此,从频带合成处理单元711输出的信号也不包含中频的分量,其是解码低频信号而不是解码低中频信号。 
图14所示的低频解码单元901中的解码与G.729.1方式的解码的不同之处仅在于,将计算出的解码低频频谱输出到高频解码单元902,少于图11所示的低中频解码单元602中的解码与G.729.1方式的解码的不同之处。 
这样,根据本实施方式,在编码侧,将输入信号通过QMF等频带分割为低频分量和高频分量,从而将各个分量通过不同的编码单元进行编码,并且在低频编码过程中适用低通滤波器,由此复原欠缺了的频带的分量而对其进行编码。另外,在解码侧,通过与对低频分量进行解码的解码单元不同的解码单元,进行上述的复原后的频带的分量的解码。因此,能够对现有的G.729.1方式的解码进行更少的修正而利用低频分量的解码。 
(实施方式3) 
本发明的实施方式3的通信系统(未图示)与图1所示的通信系统基本相同,与图1的通信系统的编码装置101和解码装置103的不同之处仅在于编码装置和解码装置的结构和一部分的动作。以下,对本实施方式的通信系统的编码装置和解码装置分别附加标号“121”和“123”,并进行说明。 
图15是表示本实施方式的编码装置121的内部的主要结构的方框图。另外,本实施方式的编码装置121具有与图2所示的编码装置101基本上相同的结构,并进行基本上相同的动作。编码装置121与编码装置101的不同之处在于,还具有中频编码单元1103。另外,编码装置121的低频编码单元1101、中频校正单元1102、高频编码单元1104和复用单元1105仅在一部分的动作与编码装置101的低频编码单元202、中频校正单元203、中高频编码单元204和复用单元205不同。 
低频编码单元1101与图2所示的低频编码单元202相比不同之处仅在于,不将解码低频频谱S_lo输出到高频编码单元1104。具体而言,低频编码单元1101使用从频带分割处理单元201输入的0~8kHz频带的低中频信号x_lo,进行例如以ITU-T标准化的G.729.1等的编码,并将生成的低频编码信息输出到复用单元1105。另外,低频编码单元1101将在求低频编码信息的过程中计算出的中频(7~8kHz频带)的频率分量输出到中频校正单元1102作为中频频谱X_mid。另外,在后面叙述低频编码单元1101的细节。 
中频校正单元1102在频域上对从低频编码单元1101输入的中频频谱X_mid进行校正,并将获得的频谱输出到中频编码单元1103作为校正中频频谱S_mid。也就是说,中频校正单元1102与图2所示的中频校正单元203相比不同之处仅在于,将生成的校正中频频谱S_mid输出到中频编码单元1103而不输出到高频编码单元1104。另外,中频校正单元1102中的中频频谱的校正处理与图2的中频校正单元203中的处理相同,所以省略详细的说明。 
中频编码单元1103对从中频校正单元1102输入的校正中频频谱S_mid进行量化,并将获得的中频编码信息输出到复用单元1105。另外,在后面叙述中频编码单元1103的细节。 
高频编码单元1104对从频带分割处理单元201输入的8~16kHz频带的高频信号进行量化,并将获得的高频编码信息输出到复用单元1105。在后面叙述高频编码单元1104的细节。 
复用单元1105将从低频编码单元1101输入的低频编码信息、从中频编码单元1103输入的中频编码信息与从高频编码单元1104输入的高频编码信息复用,并将复用结果输出到传输路径102作为编码信息。 
图16是表示图15所示的低频编码单元1101的内部的主要结构的方框图。另外,图16所示的低频编码单元1101具有与图3所示的低频编码单元202基本上相同的结构,并进行基本上相同的动作。低频编码单元1101的TDAC编码单元1201仅在一部分的动作与低频编码单元202的TDAC编码单元307不同。 
TDAC编码单元1201与图3所示的TDAC编码单元307相比不同之处仅在于,不将解码低频频谱S_lo输出到高频编码单元1104。具体而言,TDAC编码单元1201分别对从加法单元305输入的差分信号、以及从低通滤波器306输入的滤波后第二低频信号进行MDCT等的正交变换,并将获得的0~ 8kHz频带的频域信号(MDCT系数)中的7~8kHz频带的部分,输出到中频校正单元1102作为中频频谱X_mid。另外,TDAC编码单元1201对通过MDCT等的正交变换所得的频域信号(MDCT系数)进行量化,并将获得的TDAC参数输出到复用单元309。 
图17是表示图15所示的中频编码单元1103的内部的主要结构的方框图。 
在图17中,中频编码单元1103包括形状量化单元1301、增益量化单元1302、以及复用单元1303,各个单元进行以下的动作。 
形状量化单元1301对从中频校正单元1102输入的校正中频频谱S_mid’(k)按每个子带进行形状量化。具体而言,形状量化单元1301将中频(7~8kHz频带)分割为L_mid个子带,对每个子带搜索由SQ_mid个形状代码矢量构成的内置的形状码本而求使下式(20)的结果为最大的形状代码矢量的索引。 
Shape _ q ( i ) = { Σ k ′ = 0 W ( j ) ( S _ mi d ′ k ′ + B ( j ) · SC k ′ i ) } 2 Σ k ′ = 0 W ( j ) SC k ′ i · SC k ′ i , ( j = 0 , . . . , L _ mid - 1 , i = 0 , . . . , SQ _ mid - 1 )
...(20) 
在式(20)中,SCi k’表示构成形状码本的形状码向量,i表示形状码向量的索引,k’表示形状码向量的元素的索引。另外,W(j)表示子带索引为j的子带的带宽。另外,B(j)表示子带索引为j的子带的开头样本的索引。 
形状量化单元1301将使上述的式(20)的结果为最大的形状码向量的索引S_max_mid输出到复用单元1303作为中频形状编码信息。另外,形状量化单元1301根据下述的式(21),计算理想增益值Gain_i_mid(j),并将其输出到增益量化单元1302。 
Gain _ i _ mid ( j ) = Σ k ′ = 0 W ( j ) ( S _ mi d ′ k ′ + B ( j ) · SC k ′ S _ max _ mid ) Σ k ′ = 0 W ( j ) SC k ′ + B ( j ) S _ max _ mid · SC k ′ + B ( j ) S _ max _ mid , ( j = 0 , . . . , L _ mid - 1 ) . . . ( 21 )
形状量化单元1302根据下式(22),对从形状量化单元1301输入的理想增益值Gain_i_mid(j)进行量化。这里,增益量化单元1302将理想增益值作为L_mid维矢量来处理,并进行矢量量化。另外,在式(22)中,GCi j表示构成增 益码本的增益码向量,i表示增益码向量的索引,j表示增益码向量的元素的索引。 
Gain _ q ( i ) = Σ j = 0 L _ mid - 1 { Gain _ i _ mid ( j ) - GC j i } 2 , ( i = 0 , . . . , GQ _ mid - 1 ) . . . ( 22 )
这里,将使上述的式(22)为最小的码本的索引记为G_min_mid。 
增益量化单元1302将G_min_mid输出到复用单元1303作为中频增益编码信息。 
复用单元1303将从形状量化单元1301输入的中频形状编码信息和从增益量化单元1302输入的中频增益编码信息复用,并将复用结果输出到复用单元1105作为中频编码信息。 
图18是表示图15所示的高频编码单元1104的内部的主要结构的方框图。 
在图18中,高频编码单元1104包括正交变换处理单元1401、形状量化单元1402、增益量化单元1403、以及复用单元1404,各个单元进行以下的动作。 
正交变换处理单元1401对从频带分割处理单元201输入的高频信号(8~16kHz频带)进行MDCT等的正交变换处理,并计算作为高频信号的频率分量的高频频谱S_hi而将其输出到形状量化单元1402。另外,正交变换处理单元1401中的MDCT等的正交变换处理与实施方式1的正交变换处理单元401中的MDCT等的正交变换处理相同,所以省略详细的说明。 
形状量化单元1402对从正交变换处理单元1401输入的高频频谱S_hi按每个子带进行形状量化。具体而言,形状量化单元1402将高频(8~16kHz频带)分割为L_hi个子带,对每个子带搜索由SQ_hi个形状代码矢量构成的内置的形状码本而求使下式(23)的结果为最大的形状代码矢量的索引。 
Shape _ q ( i ) = { Σ k ′ = 0 W ( j ) ( S _ hi k ′ + B ( j ) · SC k ′ i ) } 2 Σ k ′ = 0 W ( j ) S C k ′ i · SC k ′ i , ( j = 0 , . . . , L _ hi - 1 , i = 0 , . . . , SQ _ hi - 1 )
...(23) 
在式(23)中,SCi k’表示构成形状码本的形状码向量,i表示形状码向量的索引,k’表示形状码向量的元素的索引。另外,W(j)表示子带索引为j的 子带的带宽。另外,B(j)表示子带索引为j的子带的开头样本的索引。 
形状量化单元1402将使上式(23)的结果为最大的形状代码矢量的索引S_max_hi输出到复用单元1404作为高频形状编码信息。另外,形状量化单元1402根据下式(24),计算理想增益值Gain_i_hi(j),并将其输出到增益量化单元1403。 
Gain _ i _ hi ( j ) = Σ k ′ = 0 W ( j ) ( S _ h i k ′ + B ( j ) · S C k ′ S _ max _ hi ) Σ k ′ = 0 W ( j ) SC k ′ + B ( j ) S _ max _ hi · SC k ′ + B ( j ) S _ max _ hi , ( j = 0 , . . . , L _ hi - 1 ) . . . ( 24 )
形状量化单元1403根据下式(25),对从形状量化单元1402输入的理想增益值Gain_i_hi(j)进行量化。这里,增益量化单元1403将理想增益值作为L维向量来处理,进行向量量化。另外,在式(25)中,GCi j表示构成增益码本的增益码向量,i表示增益码向量的索引,j表示增益码向量的元素的索引。另外,这里,在增益量化单元1403中,使用与增益量化单元1302不同的码本。 
Gain _ q ( i ) = Σ j = 0 L _ hi - 1 { Gain _ i _ hi ( j ) - GC j i } 2 , ( i = 0 , . . . , GQ _ hi - 1 ) . . . ( 25 )
这里,将使上述的式(25)为最小的码本的索引记为G_min_hi。 
增益量化单元1403将G_min_hi输出到复用单元1404作为高频增益编码信息。 
复用单元1404将从形状量化单元1402输入的高频形状编码信息和从增益量化单元1403输入的高频增益编码信息复用,并将复用结果输出到复用单元1105作为高频编码信息。 
图19是表示本实施方式的解码装置123的内部的主要结构的方框图。另外,本实施方式的解码装置123具有与图13所示的解码装置113基本上相同的结构,并进行基本上相同的动作。解码装置123的分离单元1501、低频解码单元1502、中频解码单元1503和高频解码单元1504仅在一部分的动作上与解码装置113的分离单元601、低频解码单元901、中频解码单元903和高频解码单元902不同。 
分离单元1501将通过传输路径102从编码装置121传输的编码信息分离为低频编码信息、中频编码信息和高频编码信息,将低频编码信息输出到低频解码单元1502,将中频编码信息输出到中频解码单元1503,并将高频编码信息输出到高频解码单元1504。 
低频解码单元1502与图13所示的低频解码单元901相比不同之处仅在于,不将解码低频频谱输出到高频解码单元1504。低频解码单元1502对从分离单元1501输入的低频编码信息进行解码,并将生成的解码低频信号输出到加法单元904。另外,低频解码单元1502的结构和动作与实施方式2的低频解码单元901的结构和动作基本上相同,所以省略详细的说明。 
中频解码单元1503与图13所示的中频解码单元903相比不同之处在于,不从高频解码单元1504输入解码中频频谱。中频解码单元1503对从分离单元1501输入的中频编码信息进行解码,并将获得的解码中频信号输出到加法单元904。另外,在后面叙述中频解码单元1503的细节。 
高频解码单元1504与图13所示的高频解码单元902相比不同之处在于,不从低频解码单元1502输入解码低频频谱,不将中频解码频谱输出到中频解码单元1503。具体而言,高频解码单元1504对从分离单元1501输入的高频编码信息进行解码,并将获得的解码高频信号输出到频带合成处理单元905。另外,在后面叙述高频解码单元1504的细节。 
图20是表示图19所示的中频解码单元1503的内部的主要结构的方框图。 
在图20中,中频解码单元1503包括分离单元1601、形状反量化单元1602、增益反量化单元1603、以及正交变换处理单元1604,各个单元进行以下的动作。 
分离单元1601将从分离单元1501输入的中频编码信息分离为中频形状编码信息S_max_mid和中频增益编码信息G_min_mid,将中频形状编码信息S_max_mid输出到形状反量化单元1602,并将中频增益编码信息G_min_mid输出到增益反量化单元1603。 
形状反量化单元1602通过对从分离单元1601输入的中频形状编码信息进行反量化而求形状的值,并将求出的形状的值输出到增益反量化单元1603。具体而言,形状反量化单元1602内置与编码装置121的形状量化单元1301所配备的形状码本相同的形状码本,并搜索以从分离单元1601输入的中频形状编码信息S_max_mid为索引的形状代码矢量。形状反量化单元1602将搜索出的代码矢量输出到增益反量化单元1603作为形状的值。这里,将作为形状的值而搜索出的形状代码矢量记为Shape_q_mid(k’)(k’=B(j),...,B(j+L mid)-1)。 
增益反量化单元1603通过对从分离单元1601输入的中频增益编码信息进行反量化而求增益的值。另外,增益反量化单元1603以求出的增益的值和从形状反量化单元1602输入的形状的值,计算解码中频频谱。增益反量化单元1603将计算出的解码中频频谱输出到正交变换处理单元1604。 
具体而言,增益反量化单元1603内置与编码装置121的增益量化单元1302所配备的增益码本相同的增益码本,并使用该增益码本,根据下式(26),对增益的值进行反量化。这里,增益反量化单元1603将增益的值作为L_mid维矢量来处理而进行矢量反量化。也就是说,增益反量化单元1603将与增益编码信息G_min_mid对应的增益代码矢量GCj G_min_mid直接作为增益值。 
Gain _ q ′ ( j ) = GC j G _ min _ mid , ( j = 0 , . . . , L _ mid - 1 ) . . . ( 26 )
接着,增益反量化单元1603使用对当前帧进行反量化获得的增益值以及从形状反量化单元1602输入的形状的值,根据下式(27),计算解码MDCT系数S_mid2’(k)。这里,在式(27)中,k是0~Nmid_hi-1的值,从k’和j计算k。增益反量化单元1603将计算出的解码MDCT系数S_mid2’(k)输出到正交变换处理单元1604作为解码中频频谱。 
S _ mid 2 ′ ( k ) = Gain _ q ′ ( j ) · Shape _ q ′ ( k ′ ) k = BL ( j ) + k ′ ( k = 0 , . . . , N mid _ hi - 1 ) BL ( j ) ≤ k ′ ≤ BH ( j ) , forallj j = 0 , . . . , L _ mid - 1 . . . ( 27 )
正交变换处理单元1604对从增益反量化单元1603输入的解码中频频谱进行改进离散余弦逆变换等的正交变换处理而生成时域的信号,并将其输出到加法单元904作为解码中频信号。另外,正交变换处理单元1604中的正交变换处理与实施方式1的正交变换处理单元806(参照图12)中的正交变换处理相同,所以省略详细的说明。 
图21是表示图19所示的高频解码单元1504的内部的主要结构的方框图。 
在图21中,高频解码单元1504包括分离单元1701、形状反量化单元1702、增益反量化单元1703、以及正交变换处理单元1704,各个单元进行以下的动作。 
分离单元1701将从分离单元1501输入的高频编码信息分离为高频形状编码信息S_max_hi和高频增益编码信息G_min_hi,将高频形状编码信息S_max_hi输出到形状反量化单元1702,并将高频增益编码信息G_min_hi输 出到增益反量化单元1703。 
形状反量化单元1702通过对从分离单元1701输入的高频形状编码信息S_max_hi进行反量化而求形状的值,并将求出的形状的值输出到增益反量化单元1703。 
增益反量化单元1703通过对从分离单元1701输入的高频增益编码信息G_min_hi进行反量化,求增益的值。另外,增益反量化单元1703以求出的增益的值和从形状反量化单元1702输入的形状的值,计算解码高频频谱,并将其输出到正交变换处理单元1704。另外,增益反量化单元1703中的反量化等的处理与增益反量化单元1603(参照图20)中的反量化等的处理基本上相同,所以省略详细的说明。 
正交变换处理单元1704对从增益反量化单元1703输入的解码高频频谱进行改进离散余弦逆变换等的正交变换处理而生成时域的信号,并将其输出到频带合成处理单元905作为解码高频信号。另外,正交变换处理单元1704中的正交变换处理与实施方式1的正交变换处理单元806(参照图12)中的正交变换处理相同,所以省略详细的说明。 
这样,根据本实施方式,在编码侧,将输入信号通过QMF等频带分割为低频分量和高频分量,从而将各个分量通过不同的编码单元进行编码,并且在低频编码过程中适用低通滤波器,由此复原欠缺了的频带的分量而对其进行编码。另外,在解码侧,分别通过不同的解码单元对低频分量、上述复原后的频带的分量和高频分量进行解码。因此,即使在对高频分量进行编码而不利用低频分量进行扩展编码时,也通过在低频编码过程中适用低通滤波器,能够复原欠缺了的频带的分量而对其进行编码,能够提高解码信号的质量。 
以上,说明了本发明的各个实施方式。 
另外,在上述各个实施方式中,对于在将编码信息或参数等进行复用时,两级且连续地进行复用的结构(如复用单元309和复用单元205等),也可以通过后级的复用单元集中地进行复用,而不设置前级的复用单元。相反地,对于在将复用后的编码信息或参数等分离时,两级且连续地进行分离的机构(如分离单元601和分离单元701等),也可以通过前级的分离单元集中地进行分离,而不设置后级的分离单元。 
而且,本发明的编码装置、解码装置以及其方法,并不限于上述各个实 施方式,可以进行各种变更后实施。例如,也可以适当地组合各个实施方式而实施。 
另外,虽然上述各个实施方式的解码装置使用从上述各个实施方式的编码装置传输的编码信息进行处理,但本发明并不限于此,只要是包含所需的参数和数据的编码信息,即便并非是来自上述各个实施方式的编码装置的编码信息也能够进行处理。 
本发明的编码装置以及解码装置,可以搭载在移动通信系统的通信终端装置以及基站装置上,由此能够提供具有与上述同样的作用效果的通信终端装置、基站装置以及移动通信系统。 
另外,虽然在上述各个实施方式中以由硬件构成本发明的情况为例进行了说明,但是本发明还可以由软件实现。 
另外,本发明也能够适用于将信号处理程序记录、写入到存储器、磁盘、磁带、CD、DVD等能由机器读取的存储介质中,进行动作的情况,能够获得与本实施方式同样的作用和效果。 
另外,在上述各个实施方式的说明中所使用的各个功能模块典型的通过集成电路的LSI(大规模集成电路)来实现。这些块既可以被单独地集成为一个芯片,也可以包含一部分或全部地被集成为一个芯片。虽然此处称为LSI,但根据集成程度的不同,可以被称为IC、系统LSI、超大LSI(Super LSI)、特大LSI(Ultra LSI)。 
另外,集成电路化的方法不仅限于LSI,也可以使用专用电路或通用处理器来实现。也可以使用可在LSI制造后编程的FPGA(Field ProgrammableGate Array,现场可编程门阵列),或者可重构LSI内部的电路单元的连接和设定的可重构处理器(Reconfigurable Processor)。 
再有,如果随着半导体技术的进步或者随之派生的其他技术的出现,如果出现能够代替LSI集成电路化的技术,当然也可以利用该技术进行功能块的集成化。还存在着适用生物技术等的可能性。 
2008年1月25日提交的特愿第2008-015650号以及2008年5月16日提交的特愿第2008-129711号的日本专利申请中包含的说明书、附图以及说明书摘要的公开内容全部引用于本中请。 
工业实用性 
本发明的编码装置、解码装置以及其方法能够在将输入信号通过QMF等频带分割为低频分量和高频分量,从而将各个分量分别通过不同的编码单元进行编码时,提高解码信号的质量,例如,能够适用于分组通信系统、移动通信系统等。 

Claims (10)

1.用于对包括语音/音乐信号的音频信号进行编码的编码装置,包括:
频带分割单元,对输入包括语音/音乐信号的音频信号进行频带分割处理而获得低于第一频率的低中频分量、以及所述第一频率以上的高频分量;
低频编码单元,抑制所述低中频分量中的第二频率以上的部分而获得低频分量,并对所述低频分量进行编码而获得低频编码信息;
中频校正单元,对在求所述低频编码信息的过程中计算出的、所述第二频率以上的中频分量的频谱进行校正而获得校正中频频谱;以及
中高频编码单元,对所述校正中频频谱和所述高频分量进行编码而获得中高频编码信息。
2.如权利要求1所述的编码装置,
所述低频编码单元包括:
低通滤波器,对所述低中频分量进行低通滤波而抑制所述中频分量,获得所述低频分量;以及
编码单元,对所述低频分量进行编码而获得所述低频编码信息,并且在所述编码的过程中获得所述中频分量的频谱,
所述中频校正单元将所述低通滤波器的特性的倒数乘以所述中频分量的频谱而获得所述校正中频频谱。
3.如权利要求2所述的编码装置,
所述中频校正单元将小于1的校正系数乘以所述校正中频频谱。
4.如权利要求2所述的编码装置,
所述低频编码单元还对所述低频编码信息进行解码而获得解码低频频谱,
所述中高频编码单元包括:
正交变换单元,对所述高频分量进行正交变换而获得高频频谱;
中高频频谱构成单元,由所述高频频谱和所述校正中频频谱构成中高频频谱;以及
频带扩展单元,使用所述解码低频频谱和所述中高频频谱进行频带扩展处理,获得用于从所述解码低频频谱估计所述中高频频谱的参数作为所述中高频编码信息。
5.如权利要求4所述的编码装置,
所述中高频频谱构成单元计算所述校正中频频谱的频谱平坦度测量值,
在所述校正中频频谱的频谱平坦度测量值小于规定的阈值时,对所述校正中频频谱进行平滑。
6.如权利要求2所述的编码装置,
所述中高频编码单元包括:
中频编码单元,对所述校正中频频谱的形状和增益进行量化而获得中频编码信息;
高频编码单元,对高频频谱的形状和增益进行量化而获得高频编码信息;以及
复用单元,将所述中频编码信息与高频编码信息复用而获得所述中高频编码信息。
7.用于获得包括语音/音乐信号的音频信号而进行解码处理的解码装置,包括:
接收单元,接收低频编码信息和中高频编码信息,所述低频编码信息是在编码装置中对将输入包括语音/音乐信号的音频信号频带分割所得的频率比第一频率低的低中频分量中抑制第二频率以上的部分所得的低频分量进行了编码而获得的信息,所述中高频编码信息是在编码装置中对校正在求所述低频编码信息的过程中计算出的、所述第二频率以上的中频分量的频谱所得的校正中频频谱和通过所述频带分割所得的所述第一频率以上的高频分量进行了编码而获得的信息;
低中频解码单元,对所述低频编码信息进行解码而获得解码低频频谱;以及
高频解码单元,使用所述解码低频频谱,对所述中高频编码信息进行解码而获得解码高频信号和解码中频频谱。
8.如权利要求7所述的解码装置,
所述低中频解码单元包括:
低频解码单元,对所述低频编码信息进行解码而获得所述解码低频频谱和解码低频信号;
中频解码单元,对所述解码中频频谱进行解码而获得解码中频信号;以及
加法单元,将所述解码低频信号和所述解码中频信号相加而获得解码低中频信号。
9.用于对包括语音/音乐信号的音频信号进行编码的编码方法,包括以下步骤:
对输入包括语音/音乐信号的音频信号进行频带分割处理而获得低于第一频率的低中频分量、以及所述第一频率以上的高频分量;
抑制所述低中频分量中的第二频率以上的部分而获得低频分量,并对所述低频分量进行编码而获得低频编码信息;
对在求所述低频编码信息的过程中计算出的、所述第二频率以上的中频分量的频谱进行校正而获得校正中频频谱;以及
对所述校正中频频谱和所述高频分量进行编码而获得中高频编码信息。
10.用于获得包括语音/音乐信号的音频信号而进行解码处理的解码方法,包括以下步骤:
接收低频编码信息和中高频编码信息,所述低频编码信息是在编码装置中对将输入包括语音/音乐信号的音频信号频带分割所得的频率比第一频率低的低中频分量中抑制第二频率以上的部分所得的低频分量进行了编码而获得的信息,所述中高频编码信息是在编码装置中对校正在求所述低频编码信息的过程中计算出的、所述第二频率以上的中频分量的频谱所得的校正中频频谱和通过所述频带分割所得的所述第一频率以上的高频分量进行了编码而获得的信息;
对所述低频编码信息进行解码而获得解码低频频谱;以及
使用所述解码低频频谱,对所述中高频编码信息进行解码而获得解码高频信号和解码中频频谱。
CN2009801029644A 2008-01-25 2009-01-23 编码装置、解码装置以及其方法 Expired - Fee Related CN101925953B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2008015650 2008-01-25
JP015650/08 2008-01-25
JP129711/08 2008-05-16
JP2008129711 2008-05-16
PCT/JP2009/000262 WO2009093466A1 (ja) 2008-01-25 2009-01-23 符号化装置、復号装置およびこれらの方法

Publications (2)

Publication Number Publication Date
CN101925953A CN101925953A (zh) 2010-12-22
CN101925953B true CN101925953B (zh) 2012-06-20

Family

ID=40900975

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801029644A Expired - Fee Related CN101925953B (zh) 2008-01-25 2009-01-23 编码装置、解码装置以及其方法

Country Status (5)

Country Link
US (1) US8422569B2 (zh)
EP (1) EP2239731B1 (zh)
JP (1) JP5448850B2 (zh)
CN (1) CN101925953B (zh)
WO (1) WO2009093466A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8660851B2 (en) 2009-05-26 2014-02-25 Panasonic Corporation Stereo signal decoding device and stereo signal decoding method
ES2825032T3 (es) * 2009-06-23 2021-05-14 Voiceage Corp Cancelación de solapamiento de dominio de tiempo directo con aplicación en dominio de señal original o ponderado
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
ES2706061T3 (es) 2010-01-13 2019-03-27 Voiceage Corp Decodificación de audio con cancelación directa de distorsión por repliegue espectral en el dominio del tiempo usando filtrado predictivo lineal
EP2357649B1 (en) * 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
EP2584561B1 (en) 2010-06-21 2018-01-10 III Holdings 12, LLC Decoding device, encoding device, and methods for same
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN102985969B (zh) 2010-12-14 2014-12-10 松下电器(美国)知识产权公司 编码装置、解码装置和编码方法、解码方法
SG191771A1 (en) * 2010-12-29 2013-08-30 Samsung Electronics Co Ltd Apparatus and method for encoding/decoding for high-frequency bandwidth extension
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
MX2019006535A (es) * 2016-12-16 2019-08-21 Ericsson Telefon Ab L M Metodos, codificador y decodificador para manejar coeficientes de representacion de envolvente.
CN110931028B (zh) * 2018-09-19 2024-04-26 北京搜狗科技发展有限公司 一种语音处理方法、装置和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1457482A (zh) * 2001-02-09 2003-11-19 索尼株式会社 信号再生设备和方法,信号记录设备和方法,信号接收设备以及信息处理方法
CN101067931A (zh) * 2007-05-10 2007-11-07 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
CN101086845A (zh) * 2006-06-08 2007-12-12 北京天籁传音数字技术有限公司 声音编码装置及方法以及声音解码装置及方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
JPH0750589A (ja) * 1993-08-04 1995-02-21 Sanyo Electric Co Ltd サブバンド符号化装置
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
JPH1097295A (ja) 1996-09-24 1998-04-14 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
JP2005114814A (ja) 2003-10-03 2005-04-28 Nippon Telegr & Teleph Corp <Ntt> 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体
DE602004010188T2 (de) * 2004-03-12 2008-09-11 Nokia Corp. Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
CN101006495A (zh) * 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
JP4574320B2 (ja) 2004-10-20 2010-11-04 日本電信電話株式会社 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
KR100707174B1 (ko) 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
BRPI0520729B1 (pt) * 2005-11-04 2019-04-02 Nokia Technologies Oy Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
CN101317217B (zh) * 2005-11-30 2012-07-18 松下电器产业株式会社 子带编码装置和子带编码方法
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1457482A (zh) * 2001-02-09 2003-11-19 索尼株式会社 信号再生设备和方法,信号记录设备和方法,信号接收设备以及信息处理方法
CN101086845A (zh) * 2006-06-08 2007-12-12 北京天籁传音数字技术有限公司 声音编码装置及方法以及声音解码装置及方法
CN101067931A (zh) * 2007-05-10 2007-11-07 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特开平8-263096A 1996.10.11

Also Published As

Publication number Publication date
US8422569B2 (en) 2013-04-16
JP5448850B2 (ja) 2014-03-19
EP2239731A4 (en) 2016-04-06
JPWO2009093466A1 (ja) 2011-05-26
EP2239731B1 (en) 2018-10-31
US20100284455A1 (en) 2010-11-11
WO2009093466A1 (ja) 2009-07-30
CN101925953A (zh) 2010-12-22
EP2239731A1 (en) 2010-10-13

Similar Documents

Publication Publication Date Title
CN101925953B (zh) 编码装置、解码装置以及其方法
CN101971253B (zh) 编码装置、解码装置以及其方法
CN102334159B (zh) 编码装置、解码装置及其方法
CN101140759B (zh) 语音或音频信号的带宽扩展方法及系统
US7275036B2 (en) Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
EP0942411B1 (en) Audio signal coding and decoding apparatus
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
CN101903945B (zh) 编码装置、解码装置以及编码方法
CN101842832B (zh) 编码装置和解码装置
CN102099855B (zh) 频谱平滑化装置、编码装置、解码装置、通信终端装置、基站装置以及频谱平滑化方法
CN101548316A (zh) 编码装置、解码装置以及其方法
CN102915739A (zh) 用于对高频信号进行编码和解码的方法和设备
CN103069483B (zh) 编码装置以及编码方法
CN102947881A (zh) 解码装置、编码装置和解码方法、编码方法
CN102272831A (zh) 基于峰值检测的选择性缩放掩码计算
CN102598123B (zh) 编码装置、解码装置及其方法
CN102656628A (zh) 优化的低吞吐量参数编码/解码
CN101027718A (zh) 可扩展性编码装置以及可扩展性编码方法
CN101185123B (zh) 可扩展编码装置及可扩展编码方法
JP2891193B2 (ja) 広帯域音声スペクトル係数量子化装置
US6064698A (en) Method and apparatus for coding
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
CN103119650B (zh) 编码装置和编码方法
WO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法
WO2011045927A1 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140806

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140806

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20170605

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: California, USA

Patentee before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120620

CF01 Termination of patent right due to non-payment of annual fee