CN101044553A - 可扩展编码装置、可扩展解码装置及其方法 - Google Patents

可扩展编码装置、可扩展解码装置及其方法 Download PDF

Info

Publication number
CN101044553A
CN101044553A CNA2005800360148A CN200580036014A CN101044553A CN 101044553 A CN101044553 A CN 101044553A CN A2005800360148 A CNA2005800360148 A CN A2005800360148A CN 200580036014 A CN200580036014 A CN 200580036014A CN 101044553 A CN101044553 A CN 101044553A
Authority
CN
China
Prior art keywords
frequency
pitch
coding
spectrum
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800360148A
Other languages
English (en)
Other versions
CN101044553B (zh
Inventor
押切正浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101044553A publication Critical patent/CN101044553A/zh
Application granted granted Critical
Publication of CN101044553B publication Critical patent/CN101044553B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

公开了可扩展编码装置,能够使编码参数的比特率减少,并对混合存在多个谐波结构的语音信号也能够高效率地编码。在该装置中,MDCT分析单元(111)对语音信号(S15)进行MDCT分析,以便进行变换编码。音调频率变换单元(112)求音调周期的倒数而计算音调频率。选择单元(113)选择位于音调频率的整数倍的频率上的频谱。第二层编码单元(106)对该所选择的多个频谱进行编码处理。

Description

可扩展编码装置、可扩展解码装置及其方法
技术领域
本发明涉及在高层中进行变换编码的可扩展编码装置、可扩展解码装置及其方法。
背景技术
在移动通信系统中,为了电波资源等的有效利用,人们期求将语音信号压缩为低比特率进行传输的技术。但另一方面,用户要求通话语音的质量提高和亲临现场感高的通话服务的实现。因此除了语音信号的高质量化以外,也要求能够将频带更宽的音频信号等语音以外的信号高质量地编码。
对于这种相反的两种要求,分层地合并多个编码技术的技术备受关注。在该技术中,分层地组合第一层和第二层,该第一层使用适合于语音信号的模式将输入信号以低比特率编码,该第二层使用也适合于语音以外的信号的模式将输入信号与在第一层的解码信号的差值信号编码。这种分层地进行编码的技术因为通过编码装置而获得的比特流具有可扩展性,即,即使从比特流的一部分信息也能够获得解码信号的特性,所以一般被称为可扩展编码。该可扩展编码能够灵活地对应比特率不同的网络之间的通信。因此,可扩展编码可以说适合于在将来由IP协议合并多种多样的网络的网络环境。
作为使用以MPEG-4(Moving Picture Experts Group phase-4)标准化的技术而实现可扩展编码的技术,例如有在非专利文献1所公开的技术。该技术是,在第一层采用适合于语音信号的CELP(Code Excited Linear Prediction;码激励线性预测)编码,而在第二层,对从原始信号减去第一层解码信号的残差信号适用AAC(Advanced Audio Coder)和Twin VQ(Transform DomainWeighted Interleave Vector Quantization;变换域加权交织矢量量化)等变换编码。这种变换编码是指将时域的信号变换到频率的信号后,对该频域的信号进行编码的技术。
另外,作为变换编码的具体例,有在专利文献1公开的技术。该技术是,通过对输入信号进行音调分析而求音调频率,将位于该音调频率的整数倍的频率的频谱集中编码。这里,将相当于音调频率的整数倍的频率称为谐波频率,该音调频率是用于确定语音信号的谐波结构的参数,并将在谐波频率的频谱称为谐波谱,此时,专利文献1的技术可以认为,对谐波谱进行解码之后,从输入谱将其减而求出误差谱,然后再对该误差谱进行编码。通过该结构,能够以较少的运算量对谐波谱高效率地进行编码,并提供了音质恶化较少的编码方式。
(专利文献1)特开平9-181611号公报
(非专利文献1)三木弼一编著,“MPEG-4の全て”,初版,(株)工业调查会,1998年9月30日,p.126-127
发明内容
本发明需要解决的问题
然而,在将专利文献1的技术适用于可扩展编码时,为了确定谐波频率需要将音调频率编码并传输到解码端。并且需要对谐波频率进行解码后求误差谱分量,然后再对该误差谱进行编码。因此,编码参数的比特率增大。
而且,在专利文献1的技术,假设了只有与一个音调频率对应的一组谐波谱的情况,即,只有一种音源的情况,因此,例如在输入信号中包含多个说话者或乐器等多种音源时,难以进行高质量的编码。因为在有多个音源时,主要的谐波谱(主谐波谱)和次要的谐波谱(副谐波谱),即由不同音调频率确定的多种谐波谱混合存在。
因此,本发明的目的为提供能够减少编码参数的比特率,同时也能够对多个谐波结构混合存在的语音信号高效率地进行编码的可扩展编码装置、可扩展解码装置和这些的方法。
解决问题的方案
本发明的可扩展编码装置所采用的结构包括:第一编码单元,对语音信号使用该语音信号的音调周期进行编码;计算单元,根据所述音调周期计算音调频率;以及第二编码单元,在所述语音信号的频谱中,对在所述音调频率的整数倍的频率的频谱进行编码。
本发明的有益效果
根据本发明,在可扩展编码中,能够减少编码参数的比特率。并且,在编码端,也能够对多个谐波结构混合存在的语音信号高效率地进行编码,同时在解码端,能够提高解码后的语音信号的音质。
附图说明
图1是表示实施方式1的可扩展编码装置的主要结构的方框图。
图2是表示实施方式1的第二层编码单元内部的主要结构的方框图。
图3是表示音频信号的频谱的一个例子的图。
图4是表示残差谱的一个例子的图。
图5是表示本发明实施方式1的可扩展解码装置的主要结构的方框图。
图6是表示实施方式1的第二层解码单元内部的主要结构的方框图。
图7是表示实施方式1的可扩展编码装置的第一变形例的主要结构的方框图。
图8是表示实施方式1的第二层编码单元的主要结构的方框图。
图9是表示实施方式1的可扩展解码装置的主要结构的方框图。
图10是表示实施方式1的第二层解码单元的主要结构的方框图。
图11是表示实施方式1的第二层编码单元的变形例的主要结构的方框图。
图12是表示实施方式1的第二层解码单元的结构的方框图。
图13是表示实施方式2的第二层编码单元的主要结构的方框图。
图14是用于说明残差谱和起点频率的关系的图。
图15是表示实施方式2的第二层解码单元的主要结构的方框图。
图16是表示实施方式3的可扩展编码装置的主要结构的方框图。
图17是表示实施方式3的第二层编码单元内部的主要结构的方框图。
图18是表示实施方式3的第三层编码单元内部的主要结构的方框图。
图19是示意地表示第一谐波频率和第二谐波频率的图。
图20是表示实施方式3的可扩展解码装置的主要结构的方框图。
图21是表示实施方式3的第二层解码单元内部的主要结构的方框图。
图22是表示实施方式3的第三层解码单元内部的主要结构的方框图。
具体实施方式
下面,参照附图详细地说明本发明的实施方式。
(实施方式1)
图1是表示本发明实施方式1的可扩展编码装置的主要结构的方框图。
本实施方式的可扩展编码装置的各个单元进行以下的动作。
第一层编码单元102以CELP方式对输入的语音信号(原始信号)S11进行编码,并将获得的编码参数S12提供给复用单元103和第一层解码单元104。另外,第一层编码单元102从获得的编码参数中,将音调周期S14提供给第二层编码单元106。作为该音调周期,采用通过自适应码本的搜索而获得的自适应码本延迟。第一层解码单元104由从第一层编码单元102输出的编码参数S12而生成第一层的解码信号S13,并输出到第二层编码单元106。
另一方面,延迟单元105对输入的语音信号S11提供规定的长度的延迟。该延迟是用于校正在第一层编码单元102和第一层解码单元104等产生的时间延迟。第二层编码单元106使用由第一层解码单元104生成的第一层解码信号S13,对从延迟单元105输出的被延迟规定时间的语音信号S15,进行使用MDCT(Modified Discrete Cosine Transform;改进离散余弦变换)的变换编码,并将所生成的编码参数S16输出到复用单元103。
复用单元103将第一层编码单元102求出的编码参数S12与第二层编码单元106求出的编码参数S16复用,并将它作为输出编参数的比特流输出到外部。
图2是表示上述的第二层编码单元106内部的主要结构的方框图。
MDCT分析单元111为了进行变换编码,对语音信号S15进行MDCT分析,并将分析结果的频谱输出到选择单元113。变换编码是将时域的信号变换到频域的信号,然后对该频域的信号进行编码的技术。作为使用MDCT分析的变换编码,有AAC(Advanced Audio Coder)和Twin VQ(TransformDomain Weighted Interleave Vector Quantization;变换域加权交织矢量量化)等等。
音调频率变换单元112将由第一层编码单元102提供的音调周期S14变换为秒单位的值,然后求其倒数而计算音调频率,并输出到选择单元113和115。
选择单元113使用从音调频率变换单元112输出的音调频率,在从MDCT分析单元111输出的语音信号的频谱中选择一部分频谱,并输出到加法单元117。具体地说,选择单元113选择位于音调频率的整数倍的频率(谐波频率)的频谱(谐波谱),并输出到加法单元117。第二层编码单元106对该选择出的多个谐波谱进行以后的编码处理。这样,通过将编码对象的频谱限定为部分范围而不是全范围,从而能够实现编码率的低比特率化。另外,这里所谓谐波谱是指位于谐波频率上的非常窄的频带的如同线谱的频谱。
MDCT分析单元114与MDCT分析单元111同样地对从第一层解码单元104输出的第一层解码信号S13进行MDCT分析,并将分析结果的频谱输出到选择单元115。
选择单元115与选择单元113同样地使用从音调频率变换单元112输出的音调频率,在从MDCT分析单元114输出的第一层解码信号的频谱中选择一部分范围的频谱,并输出到加法单元116。
残差谱码本121生成与后述的搜索单元120指示的索引对应的残差谱,并输出到乘法器123。
增益码本122将与后述的搜索单元120指示的索引对应的增益输出到乘法器123。
乘法器123将由残差谱码本121生成的残差谱乘以从增益码本122输出的增益,并将增益调整后的残差谱输出到加法器116。
加法器116将从选择单元115输出的、被限定在一部分范围的第一层解码信号的频谱与从乘法器123输出的增益调整后的残差谱相加,并输出到加法器117。
加法器117从选择单元113输出的、被限定在一部分范围的语音信号的频谱减去从加法器116输出的第一层解码信号的频谱而求残差谱,并输出到加权单元119。在第二层编码单元106以使该残差谱最小的方式进行编码。
听觉掩蔽计算单元118对于语音信号S15计算不被人察觉的噪声功率的阈值,即听觉掩蔽,并输出到加权单元119。人的听觉中有在被提供某个频率的信号时,难以听见该频率附近的信号的特性(掩蔽效应),听觉掩蔽计算单元118由输入的语音信号S15的频谱计算听觉掩蔽,以在第二层编码单元106利用这种特性。
加权单元119对从加法器117输出的残差谱进行使用由听觉掩蔽计算单元118计算出的听觉掩蔽的加权,并输出到搜索单元120。
上述的残差谱码本121、增益码本122、乘法器123、加法器116、117以及加权单元119构成闭环(反馈环),搜索单元120使对残差谱码本121和增益码本122指示的索引各式各样地变化,以使从加权单元119输出的残差谱最小。
进一步详细地说,存储于残差谱码本121的残差谱的矢量候补以及存储于增益码本122的增益候补,例如以使下面的式(1)表示的失真E最小的方式而被决定。其中,w(k)代表基于听觉掩蔽决定的加权函数,o(k)代表原始信号谱,g(j)代表第j增益候补,e(i,k)代表第i残差谱候补,b(k)代表基本层频谱。
(式1)
E = Σ k w ( k ) · ( o ( k ) - ( g ( j ) · e ( i , k ) + b ( k ) ) ) 2
另外,在第二层编码单元106是使用标度因子的编码单元时,失真E被定义为例如下面的式(2)。其中,SF(k)代表对原始信号谱的标度因子进行编码的结果获得的解码标度因子,b’(k)代表将基本层频谱以它本身的标度因子归一化的结果获得的频谱。
(式2)
E = Σ k w ( k ) · ( o ( k ) - ( g ( j ) · e ( i , k ) + SF ( k ) · b ′ ( k ) ) ) 2
搜索单元120将通过上述的闭环最后获得的残差谱码本121和增益码本122的索引,作为编码参数S16输出到第二层编码单元106的外部。
接着,以下使用附图详细地说明通过由选择单元113和115选择一部分范围的频率的处理,能够提高编码效率的原理。
图3是表示作为原始信号的音频信号的频谱的一个例子的图。采样频率为16kHz。
在本例子中,音调频率为约600Hz。可以看出,在一般的音频信号中,在音调频率的整数倍的位置,即,谐波频率f1、f2、f3、…的位置上出现多个频谱的尖峰(谐波频)。
图4是表示从在图3所示的原始信号谱减去第一层解码信号的频谱后所获得的残差谱的一个例子的图。在本图中,实线表示残差谱,虚线表示听觉掩蔽阈值。
如该图所示,因为在第一层中被施以编码,残差谱的振幅从整体来看比原始信号谱小。并且,低频带的频谱的振幅比高频带的频谱的振幅小。这是因为,在第一层编码单元102进行的CELP编码有如下特征,即,对信号能量越大的分量,进行使编码失真越小的处理。
另外,虽然位于谐波频率上的残差谱与原始信号谱相比振幅衰减,但依然保留其尖峰形状。即,即使振幅衰减,也常常发生在谐波频率上残差谱的尖峰超过听觉掩蔽阈值的情况。并且,由于CELP编码的上述特征,与低频带相比,在高频带超过听觉掩蔽阈值的残差谱的尖峰数更多。
另一方面,在残差谱比听觉掩蔽阈值小时,其编码失真在听觉上不被察觉。如上述,超过听觉掩蔽阈值的残差谱大多是位于谐波频率上或其附近,越是高频带该倾向越明显。另外,在谐波频率以外的频率上的残差谱大多比听觉掩蔽阈值小,无需作为编码对象。
于是,考虑以上的特性,在本实施方式,为了进行输入信号的高效率的编码,在第二层中,将位于谐波频率上的频谱作为编码对象。
图5是表示对在上述的可扩展编码装置被编码的代码进行解码的装置,即,本实施方式的可扩展解码装置的主要结构的方框图。
分离单元151将由上述可扩展编码装置编码的代码分离为第一层解码单元152用的编码参数和第二层解码单元153用的编码参数。
第一层解码单元152对由分离单元151获得的编码参数进行CELP方式的解码,并将获得的第一层解码信号提供给第二层解码单元153。另外,第一层解码单元152将通过上述的CELP方式的解码而获得的音调周期输出到第二层解码单元153。作为该音调周期,采用自适应码本延迟。根据需要,该第一层解码信号也作为低质量的解码信号直接被输出到外部。
第二层解码单元153使用从第一层解码单元152获得的第一层解码信号,对由分离单元151分离的第二层编码参数进行后述的解码处理,并根据需要将获得的第二层解码信号作为高质量的解码信号输出到外部。
这样,能够由第一层解码信号担保再现语音的最低限度的质量,并由第二层解码信号提高再现语音的质量。另外,输出第一层解码信号或第二层解码信号的哪一方是依赖于能否根据网络环境(分组丢失的发生等)获得第二层编码参数,或应用和用户的设定等。
图6是表示上述的第二层解码单元153内部的主要结构的方框图。
该图所示的MDCT分析单元161、加法器162、音调频率变换单元164、残差谱码本166、乘法器167和增益码本168是分别与上述的可扩展编码装置的第二层编码单元106(参照图2)具备的MDCT分析单元114、加法器116、音调频率变换单元112、残差谱码本121、乘法器123和增益码本122对应的结构,并且,各个单元基本上具有同样的功能。
残差谱码本166使用由分离单元151提供的编码参数(振幅信息),从所存储的多个残差谱候补中选择一个残差谱,并输出到乘法单元167。
增益码本168使用由分离单元151提供的编码参数(增益信息),从所存储的多个增益候补中选择一个增益,并输出到乘法单元167。
乘法单元167将由残差谱码本166提供的残差谱与由增益码本168提供的增益相乘,并将增益调整后的残差谱输出到配置单元165。
音调频率变换单元164使用由第一层解码单元152提供的音调周期,计算音调频率,并输出到配置单元165。该音调频率是,将音调周期变换为秒单位的值,并以其倒数表示。
配置单元165在以音调频率变换单元164提供的音调频率表示的谐波频率上配置由乘法单元167提供的增益调整后的残差谱,并输出到加法单元162。该残差谱的配置方法依赖于在编码端的第二层编码单元106内部的选择单元113和115中,如何使用音调频率配置MDCT系数。在解码端也采用与编码端同样的配置方法。
MDCT分析单元161通过MDCT变换对从第一层解码单元152输出的第一层解码信号进行频率分析,并将获得的MDCT系数、即第一层解码频谱输出到加法器162。
加法器162通过将从MDCT分析单元161输出的第一层解码频谱与从配置单元165输出的各个配置残差谱后的频谱相加,从而生成第二层解码频谱,将它输出到时域变换单元163。
时域变换单元163将从加法器162输出的第二层解码频谱变换到时域的信号后,根据需要进行适当的窗口乘法和重叠相加等处理,从而避免在帧间产生的间断,并输出最终的高质量的解码信号。
如以上的说明,根据本实施方式,使用通过在第一层的CELP方式的编码而求的音调周期,在第二层确定谐波频率,它决定语音信号的谐波结构,并只将在该谐波频率上的频谱作为编码对象。由此,因为不将语音信号的整个频带作为编码对象,能够降低编码参数的比特率,同时,因为谐波频率上的频谱是很好地表示语音信号的特征的频谱,所以能够以较少的比特率获得高质量的解码信号,且编码效率高。而且,也不需将有关音调频率的附加信息传输到解码端。
另外,在本实施方式,举例说明了在第二层的变换编码中,将谐波谱、即谐波频率上的频谱作为编码对象的情况,但作为编码对象的频谱不一定必需限定为谐波频率上的频谱,也可例如在位于谐波频率附近的频谱中选择具有比其它频谱更尖锐的尖峰形状的频谱而作为编码对象。此时,必需将从谐波频率到所选择的频谱的相对的位置信息编码并传输到解码单元。
另外,在本实施方式,举例说明了在第二层的变换编码中,将谐波谱、即位于谐波频率上的频带非常窄的如同线谱的频谱作为编码对象的情况。但作为编码对象的频谱不一定必需为如同线谱的频谱,还可例如将谐波频率附近的具有一定的带宽(但为窄带)的频谱作为编码对象。例如,可以设定以谐波频率为中心的一定范围的频域作为该一定的带宽。
图7是表示本实施方式的可扩展编码装置的变形例1的主要结构的方框图。其中,对与已经说明的结构元素相同的结构元素赋予相同的标号,并省略其说明。
虽然第一层编码单元102a的基本动作与第一层编码单元102相同,但在不将音调周期输出到第二层编码单元206这一点上有所不同。第二层编码单元206对从第一层解码单元104输出的第一层解码信号S13进行相关分析,从而求音调周期。
图8是表示上述的第二层编码单元206内部的主要结构的方框图。其中,对与已经说明的结构元素相同的结构元素赋予相同的标号,并省略其说明。
在相关分析单元211的相关分析,设第一层解码信号为y(n)时,例如根据下面的式(3)进行。这里,τ代表音调周期的候补,在搜索范围TMIN~TMAX中,将在使Cor(τ)最大时的τ作为音调周期输出。
式(3)
Cor ( τ ) = Σ n y ( n ) · y ( n - τ ) Σ n y ( n - τ ) 2 TMIN ≤ τ ≤ TMAX
在第一层编码单元102a求出的音调周期是,通过在使内部的自适应码本所包含的自适应矢量候补与原始信号的失真最小化的处理中决定的,有可能由于自适应码本所包含的自适应矢量候补的内容而不能求正确的音调周期,有时求其整数倍或整数分之一的音调周期。但是,第一层编码单元102a还具备对无法以自适应码本表达的误差分量进行编码的噪声码本。假如在自适应码本不能有效发挥功能时,也通过使用噪声码本生成编码参数,从而使对该编码参数进行解码而获得的第一层解码信号更接近于原始信号。因此,在本变形例中,通过对该第一层解码信号进行音调分析,能够获得更正确的音调信息。
因此,根据本变形例,能够提高编码性能。另外,因为在解码端也能够获得第一层解码信号,所以根据本变形例,无需将有关音调周期的信息传输到解码端。
图9是表示与图7所示的可扩展编码装置对应的可扩展解码装置的主要结构的方框图。另外,图10是表示该可扩展解码装置内的第二层解码单元253的主要结构的方框图。也在这里,对与已经说明的结构元素相同的结构元素赋予相同的标号,并省略其说明。
图11是表示本实施方式的可扩展编码装置的变形例2,尤其是第二层编码单元106的变形例(第二层编码单元306)的主要结构的方框图。在这里,也对与已经说明的结构元素相同的结构元素赋予相同的标号,并省略其说明。
音调周期修正单元311以在第一层获得的音调周期为基准,从其周边的音调频率重新求出更正确的音调频率,并对其相差分量进行编码。更详细地说,音调周期修正单元311将在第一层获得的音调周期T与差分量ΔT相加,将T+ΔT变换为秒单位的值后,取其倒数而求音调周期。并取位于根据该音调频率确定的谐波频率的下面式(4)中的d(k),或者取以谐波频率为中心而限定的频率范围所包含的下述d(k)的总和S。其中,M(k)代表听觉掩蔽阈值,o(k)代表原始信号谱,b(k)代表第一层解码信号的频谱,MAX()代表返回最大值的函数,d(k)代表参数,该参数表示在将听觉掩蔽阈值(M(k))与残差谱(o(k)-b(k))比较时残差谱的振幅超过听觉掩蔽阈值多大程度。
式(4)
           d(k)=Max(|o(k)-b(k)|-M(k),0.0)
这里的d(k)相当于被定量化的听觉上的失真。音调周期修正单元311对在该总和S为最大时的ΔT进行编码并作为音调周期修正信息输出。另外,将T+ΔT输出到音调频率变换单元112。
图12是表示与图11所示的第二层编码单元306对应的第二层解码单元353的结构的方框图。
音调周期修正单元361基于从第二层编码单元306传输的音调周期修正信息对差分量ΔT进行解码并与音调周期T相加,从而生成修正后的音调周期并输出它。
根据这些结构,通过附加较少的比特而求更正确的音调周期,从而能够实现解码信号的高质量。
(实施方式2)
在本发明的实施方式2,根据残差谱(从原始信号谱减去第一层解码信号谱的频谱)和听觉掩蔽阈值的关系,求用于决定在第二层作为编码对象的高频带频谱的频率(起点频率),并对比该起点频率更高频带的频谱进行在实施方式1说明的谐波谱的编码。然后,对起点频率的信息进行编码并传输到解码单元。
由于在第一层的编码是CELP方式,有使信号能量较大的分量的编码失真减小的特性,因此在高频部分容易发生听觉上被察觉失真的频谱。利用该特性,通过限定作为编码对象的频谱数量来改善编码效率。
本实施方式的可扩展编码装置具有与在实施方式1所示的可扩展编码装置同样的基本结构,因此省略全体图的说明,以下对与实施方式1不同结构的第二层编码单元406加以说明。
图13是表示第二层编码单元406的主要结构的方框图。其中,对与在实施方式1所示的第二层编码单元106相同的结构元素赋予相同的标号,并省略其说明。
起点频率决定单元411根据残差谱和听觉掩蔽阈值的关系来决定起点频率。起点频率的候补被预先决定,并在编码端和解码端都具备存储起点频率和编码参数的候补的同一表格。
例如,计算以下面的式表示的d(k),并使用该d(k)决定起点频率。
式(5)
                d(k)=Max(|o(k)-b(k)|-M(k),0.0)
d(k)是表示残差谱的振幅超过听觉掩蔽阈值多大程度的参数,例如,将残差谱的振幅不超过听觉掩蔽阈值的频谱视为0。
起点频率决定单元411对于起点频率的各个候补,取谐波频率或以谐波频率为中心而限定的区间的d(k)的总和,并选择其变化量大时的起点频率,输出其编码参数。
图14是用于说明残差谱和起点频率的关系的图。上段表示残差谱(实线)和听觉掩蔽阈值(虚线),下段表示在使起点频率从0Hz变化到3000Hz时的,即,在起点频率#0~#3中的编码对象的频谱频率(频带)(这里,以信号的接通/断开表示编码对象的频率和编码对象以外的频率)。
残差谱是将采样频率16kHz的音频信号作为原始信号,从该原始信号谱减去第一层解码信号的频谱而求出的。在此例中,频率2000Hz以下的残差谱为听觉掩蔽阈值以下,在2000Hz以上的高谐波位置上出现超过听觉掩蔽阈值的残差谱。也就是说,上述的d(k)的总和的变化量在从起点频率#2(2000Hz)到起点频率#3(3000Hz)之间极大地变化。因此,此时,作为确定编码对象的频谱频率的信息输出表示起点频率#2的编码参数。
图15是表示与上述的第二层编码单元406对应的第二层解码单元453的主要结构的方框图。对与在实施方式1所示的第二层解码单元153(参照图6)相同的结构元素赋予相同的标号,并省略其说明。
起点频率解码单元461使用起点频率的编码参数对起点频率进行解码,并输出到配置单元165b。配置单元165b使用该起点频率和从音调频率变换单元164输出的音调频率来求出配置解码残差谱的频率,并在该频率上配置从乘法器167输出的解码残差谱。
根据本实施方式,能够获得以下的效果。即,因为第一层的编码是CELP方式的编码,能量较大的低频带的频谱被编码后,编码失真较少。因此,在第二层通过只对位于比起点频率高的频带的谐波谱进行编码,作为编码对象的频谱变少,从而能够降低编码参数的比特率。即使在必需将有关起点频率的信息传输到解码端时,也能够实现编码参数的低比特率化。
(实施方式3)
在本发明的实施方式3,在存在多个音源,并且存在用于确定谐波谱的多个音调频率时,对不仅一组而是多个组的谐波谱分别进行编码。
图16是表示本发明的实施方式3的可扩展编码装置的主要结构的方框图。该可扩展编码装置也与在实施方式1所示的可扩展编码装置具有相同的基本结构,对相同的结构元素赋予相同的标号,并省略其说明。
本实施方式的可扩展编码装置的结构由以下结构构成,即,第二层编码单元106c,使用在第一层编码单元102c获得的音调周期S14进行编码;以及第三层编码单元501,从以音调周期S14为基准的周边的音调周期求新的用于编码谐波谱的音调周期并进行编码。
第二层编码单元106c基于在第一层编码单元102c获得的音调周期S14而求音调频率,对由该音调频率确定的谐波谱(第一谐波谱)进行编码,并将所获得的各个参数,即,解码第一谐波谱(S51)、听觉掩蔽阈值(S52)、原始信号谱(S53)以及第一层解码信号谱(S54)输出到第三层编码单元501。
第三层编码单元501以在第一层编码单元102c获得的音调周期S14为基准,从其周边的音调周期,即,从与音调周期S14接近的值的其它音调周期计算最适当的音调周期,并对由计算出的音调周期确定的谐波谱(第二谐波谱)进行编码。另外,与实施方式1的变形例2同样地,第三层编码单元501也对计算出的音调周期与音调周期S14的相差分量进行编码。另外,上述的重新计算的音调周期的计算方法采用与实施方式1的变形例2相同的方法。
图17是表示上述的第二层编码单元106c内部的主要结构的方框图。另外,图18是表示上述的第三层编码单元501内部的主要结构的方框图。
第二层编码单元106c内部的第一谐波谱解码单元511从由音调周期S14求出的音调频率和对第一谐波谱进行编码而获得的编码参数(第一谐波编码参数)解码第一谐波谱,并提供给第三层编码单元501(S51)。
第三层编码单元501将第一层解码谱(S54)与第一谐波谱(S51)相加,并利用其结果,通过搜索来决定第二谐波谱的编码参数(第二谐波编码参数)。
图19是示意地表示在第二层编码单元106c作为编码对象的第一谐波频率和在第三层编码单元501作为编码对象的第二谐波频率的图。其中,以信号的接通/断开表示编码对象的频率和编码对象以外的频率。
这样,根据本实施方式,对于具有两个不同的谐波谱的输入信号,也能够分别将各个谐波谱高效率地编码。并且,通过应用这种编码,例如包含多个说话者或乐器的情况,对包含谐波频率不同的多个谐波谱的信号,能够进行高质量的编码。由此能够改善主观质量。根据该结构,因为对与基准的音调周期之间的相差分量进行编码,从而能够使编码参数低比特率化。
另外,如在实施方式1的变形例1所示,第二层编码单元106c可以使用对第一层解码信号S13进行分析而求出的音调周期以代替音调周期S14。
图20是表示与上述的本实施方式的可扩展编码装置对应的可扩展解码装置的主要结构的方框图。对与在实施方式1所示的可扩展解码装置相同的结构元素赋予相同的标号,并省略其说明。
第二层解码单元153c使用第一层编码参数和直到第一谐波编码参数为止的信息进行解码处理,并输出高质量#1的解码信号。第三层解码单元551使用第一层编码参数、第一谐波编码参数和第二谐波编码参数的信息来进行解码处理,并输出与高质量#1的解码信号相比更高质量的高质量#2的解码信号。
图21是表示上述的第二层解码单元153c内部的主要结构的方框图。另外,图22是表示上述的第三层解码单元551内部的主要结构的方框图。
第二层解码单元153c从音调周期和第一谐波编码参数对第一谐波谱进行解码,并将第一谐波谱与第一层解码谱的相加结果提供给第三层解码单元551。第三层解码单元551将第一层解码谱与解码第一谐波谱相加后的频谱(S55)再与解码第二谐波谱相加。
根据本结构,通过使用编码参数的一部分或全部,能够生成三种质量的解码信号,即,低质量的解码信号、高质量#1的解码信号和高质量#2的解码信号。这意味着能够更细致地控制可扩展功能。
以上说明了本发明的各个实施方式。
本发明的可扩展编码装置、可扩展解码装置和这些的方法不限于上述各个实施方式,能够进行各种变更而实施。例如,各个实施方式能够适当地组合而实施。
本发明的可扩展编码装置和可扩展解码装置也可装载于移动通信系统中的通信终端装置和基站装置。由此能够提供具有与上述同样的作用效果的通信终端装置和基站装置。
另外,在上述各个实施方式中,举例说明了可扩展编码的层数为两层或三层的情况,但不限于此,也能够适用于具有四层以上的可扩展编码。
另外,在上述各个实施方式中,举例说明在第一层编码单元进行CELP方式的编码的情况,但不限于此,在第一层编码单元的编码方法是利用语音信号的音调周期的编码方法即可。
另外,本发明在各个层处理的信号的采样率不同时也可适用。例如,在以Fs(n)表示第n层处理的信号的采样率时,Fs(n)≤Fs(n+1)的关系成立。
另外,在上述各个实施方式中,举例说明作为在第二层的变换编码的方式使用MDCT的情况,但不限于此,也可以是例如使用DFT(离散傅立叶变换)、余弦变换或小波变换等其它变换编码方式。
还有,以在第一层获得的音调周期(T1)为基准而决定周边的音调周期时,也可将包含T1的整数倍或整数分之一的至少一方的音调周期作为决定音调周期时的基准。这也可作为对半音调(half pitch)、倍音调(double pitch)等的对策。
另外,这里,举例说明由硬件构成本发明的情况,但本发明还能够以软件实现。
另外,用于上述实施方式的说明中的各功能块通常被作为集成电路的LSI来实现。这些块既可以被单独地集成为一个芯片,也可以是一部分或全部被集成为一个芯片。
另外,虽然此处称为LSI,但根据集成程度,可以被称为IC、系统LSI、超级LSI(Super LSI)、或特大LSI(Ultra LSI)。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器实现之。在LSI制造后可利用可编程的FPGA(Field Programmable GateArray),或者可以使用可重构LSI内部的电路单元的连接和设定的可重构处理器。
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果能够出现替代LSI集成电路化的新技术,当然可利用新技术进行功能块的集成化。还存在着适用生物技术等的可能性。
本说明书是根据2004年10月28日申请的日本专利申请第2004-314230号。其内容全部包含于此。
工业实用性
本发明的可扩展编码装置、可扩展解码装置及其方法可适用于在移动通信系统中的通信终端装置和基站装置等的用途。

Claims (17)

1.一种可扩展编码装置,包括:
第一编码单元,对语音信号使用该语音信号的音调周期进行编码;
计算单元,根据所述音调周期计算音调频率;以及
第二编码单元,从所述语音信号的频谱中,对在所述音调频率的整数倍的频率上的频谱进行编码。
2.如权利要求1所述的可扩展编码装置,还包括:
第三编码单元,对于存在多个音调频率的语音信号的频谱,使用与在所述第二编码单元使用的音调频率不同的音调频率,对在该音调频率的整数倍的频率上的频谱进行编码。
3.如权利要求2所述的可扩展编码装置,其中,
所述第三编码单元还对所述不同音调频率和所述第二编码单元所使用的音调频率之间的差进行编码。
4.如权利要求1所述的可扩展编码装置,其中,
所述计算单元从由所述第一编码单元获得的编码参数的解码信号中获得所述音调周期,并计算所述音调频率。
5.如权利要求1所述的可扩展编码装置,其中,
所述第二编码单元在所述语音信号的频谱中,对高于规定频率的频带的频谱进行所述编码。
6.如权利要求5所述的可扩展编码装置,其中,
所述第二编码单元还对有关所述规定频率的信息进行编码。
7.如权利要求1所述的可扩展编码装置,还包括:
修正单元,对所述音调周期基于该音调周期周边的音调周期进行修正,
所述计算单元由修正后的音调周期计算所述音调频率。
8.如权利要求7所述的可扩展编码装置,其中,
所述第二编码单元还对所述音调周期和所述修正后的音调周期之间的差进行编码。
9.如权利要求1所述的可扩展编码装置,其中,
所述第二编码单元进行使用了MDCT(Modified Discrete CosineTransform,改进离散余弦变换)的编码。
10.如权利要求1所述的可扩展编码装置,其中,
所述音调频率的整数倍的频率上的频谱是具有一定的带宽的频谱。
11.一种可扩展解码装置,包括:
第一解码单元,对使用语音信号的音调周期而编码的所述语音信号的第一编码参数,利用所述音调周期进行解码;
计算单元,根据所述音调周期计算音调频率;
生成单元,使用对所述语音信号的频谱中的一部分频谱进行编码所获得的第二编码参数生成所述一部分频谱;以及
配置单元,在由所述计算单元计算的音调频率的整数倍的频率上,配置由所述生成单元所生成的频谱。
12.一种通信终端装置,包括如权利要求1所述的可扩展编码装置。
13.一种通信终端装置,包括如权利要求11所述的可扩展解码装置。
14.一种基站装置,包括如权利要求1所述的可扩展编码装置。
15.一种基站装置,包括如权利要求11所述的可扩展解码装置。
16.一种可扩展编码方法,包括:
对语音信号使用该语音信号的音调周期进行编码的步骤;
根据所述音调周期计算音调频率的步骤;以及
在所述语音信号的频谱中,对所述音调频率的整数倍的频率上的频谱进行编码的步骤。
17.一种可扩展解码方法,包括:
第一解码步骤,对使用语音信号的音调周期而编码的所述语音信号的第一编码参数,利用所述音调周期进行解码;
计算步骤,根据所述音调周期计算音调频率;
生成步骤,使用对所述语音信号的频谱中的一部分频谱进行编码所获得的第二编码参数生成所述一部分频谱;以及
配置步骤,在所述计算步骤所计算的音调频率的整数倍的频率上,配置在所述生成步骤中所生成的频谱。
CN2005800360148A 2004-10-28 2005-10-26 可扩展编码装置、可扩展解码装置及其方法 Expired - Fee Related CN101044553B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP314230/2004 2004-10-28
JP2004314230 2004-10-28
PCT/JP2005/019661 WO2006046587A1 (ja) 2004-10-28 2005-10-26 スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法

Publications (2)

Publication Number Publication Date
CN101044553A true CN101044553A (zh) 2007-09-26
CN101044553B CN101044553B (zh) 2011-06-01

Family

ID=36227828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800360148A Expired - Fee Related CN101044553B (zh) 2004-10-28 2005-10-26 可扩展编码装置、可扩展解码装置及其方法

Country Status (9)

Country Link
US (1) US8019597B2 (zh)
EP (1) EP1806736B1 (zh)
JP (1) JP5036317B2 (zh)
KR (1) KR20070083856A (zh)
CN (1) CN101044553B (zh)
AT (1) ATE480851T1 (zh)
BR (1) BRPI0517246A (zh)
DE (1) DE602005023503D1 (zh)
WO (1) WO2006046587A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101552005A (zh) * 2008-04-03 2009-10-07 华为技术有限公司 编码方法、解码方法、系统及装置
CN102105931B (zh) * 2008-07-11 2013-04-10 弗朗霍夫应用科学研究促进协会 用于生成带宽扩展信号的装置与方法
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4977471B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
JPWO2008066071A1 (ja) * 2006-11-29 2010-03-04 パナソニック株式会社 復号化装置および復号化方法
WO2008072732A1 (ja) * 2006-12-14 2008-06-19 Panasonic Corporation 音声符号化装置および音声符号化方法
WO2008072733A1 (ja) * 2006-12-15 2008-06-19 Panasonic Corporation 符号化装置および符号化方法
US20100017199A1 (en) * 2006-12-27 2010-01-21 Panasonic Corporation Encoding device, decoding device, and method thereof
JP5294713B2 (ja) * 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
JP5400059B2 (ja) * 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CN101604983B (zh) * 2008-06-12 2013-04-24 华为技术有限公司 编解码装置、系统及其方法
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
WO2011048798A1 (ja) 2009-10-20 2011-04-28 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
JP2011253045A (ja) * 2010-06-02 2011-12-15 Sony Corp 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
US9947331B2 (en) 2012-05-23 2018-04-17 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program and recording medium
US10410398B2 (en) * 2015-02-20 2019-09-10 Qualcomm Incorporated Systems and methods for reducing memory bandwidth using low quality tiles

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4809334A (en) * 1987-07-09 1989-02-28 Communications Satellite Corporation Method for detection and correction of errors in speech pitch period estimates
KR940002854B1 (ko) * 1991-11-06 1994-04-04 한국전기통신공사 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JPH0685607A (ja) 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JP3528258B2 (ja) * 1994-08-23 2004-05-17 ソニー株式会社 符号化音声信号の復号化方法及び装置
JPH0955778A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
DE69628103T2 (de) * 1995-09-14 2004-04-01 Kabushiki Kaisha Toshiba, Kawasaki Verfahren und Filter zur Hervorbebung von Formanten
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
JP3840684B2 (ja) * 1996-02-01 2006-11-01 ソニー株式会社 ピッチ抽出装置及びピッチ抽出方法
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US6345246B1 (en) * 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
US6298322B1 (en) * 1999-05-06 2001-10-02 Eric Lindemann Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal
FR2796189B1 (fr) * 1999-07-05 2001-10-05 Matra Nortel Communications Procedes et dispositifs de codage et de decodage audio
KR100474833B1 (ko) * 1999-11-17 2005-03-08 삼성전자주식회사 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
JP2002229599A (ja) 2001-02-02 2002-08-16 Nec Corp 音声符号列の変換装置および変換方法
US6633839B2 (en) * 2001-02-02 2003-10-14 Motorola, Inc. Method and apparatus for speech reconstruction in a distributed speech recognition system
US6584437B2 (en) * 2001-06-11 2003-06-24 Nokia Mobile Phones Ltd. Method and apparatus for coding successive pitch periods in speech signal
EP1351401B1 (en) 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
JP2003036097A (ja) * 2001-07-25 2003-02-07 Sony Corp 情報検出装置及び方法、並びに情報検索装置及び方法
KR100880480B1 (ko) * 2002-02-21 2009-01-28 엘지전자 주식회사 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템
EP1489599B1 (en) 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
JP2003323199A (ja) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
KR100462611B1 (ko) 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
JP4313993B2 (ja) * 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8352248B2 (en) * 2003-01-03 2013-01-08 Marvell International Ltd. Speech compression method and apparatus

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101552005A (zh) * 2008-04-03 2009-10-07 华为技术有限公司 编码方法、解码方法、系统及装置
WO2009121298A1 (zh) * 2008-04-03 2009-10-08 华为技术有限公司 编码方法、解码方法、系统及装置
CN102105931B (zh) * 2008-07-11 2013-04-10 弗朗霍夫应用科学研究促进协会 用于生成带宽扩展信号的装置与方法
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
USRE49801E1 (en) 2008-07-11 2024-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal

Also Published As

Publication number Publication date
BRPI0517246A (pt) 2008-10-07
ATE480851T1 (de) 2010-09-15
CN101044553B (zh) 2011-06-01
US20090125300A1 (en) 2009-05-14
WO2006046587A1 (ja) 2006-05-04
EP1806736A1 (en) 2007-07-11
KR20070083856A (ko) 2007-08-24
JPWO2006046587A1 (ja) 2008-05-22
DE602005023503D1 (de) 2010-10-21
EP1806736A4 (en) 2008-03-19
EP1806736B1 (en) 2010-09-08
US8019597B2 (en) 2011-09-13
JP5036317B2 (ja) 2012-09-26

Similar Documents

Publication Publication Date Title
CN101044553A (zh) 可扩展编码装置、可扩展解码装置及其方法
RU2387025C2 (ru) Способ и устройство для векторного квантования спектрального представления огибающей
CN101044554A (zh) 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法
CN1096148C (zh) 信号编码方法和装置
CN1950883A (zh) 可伸缩性解码装置及增强层丢失的隐藏方法
JP4859670B2 (ja) 音声符号化装置および音声符号化方法
US8560307B2 (en) Systems, methods, and apparatus for context suppression using receivers
CN104321815B (zh) 用于带宽扩展的高频编码/高频解码方法和设备
CN1265217A (zh) 在语音通信系统中语音增强的方法和装置
CN1795495A (zh) 音频编码设备、音频解码设备、音频编码方法和音频解码方法
CN101048814A (zh) 编码装置、解码装置、编码方法及解码方法
CN1152776A (zh) 复制语言信号、解码语音、合成语音的方法和装置
JP5602769B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
CN1689069A (zh) 声音编码设备和声音编码方法
WO2007088853A1 (ja) 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
CN101031960A (zh) 可扩展性编码装置和可扩展性解码装置及其方法
CN101057275A (zh) 矢量变换装置以及矢量变换方法
CN1787383A (zh) 变换、编码、逆变换和解码音频信号的方法和设备
CN1849648A (zh) 编码装置和译码装置
CN1795491A (zh) 分析基频信息的方法以及实现所述分析方法的话音转换方法和系统
CN1732530A (zh) 运动图像专家组音频编码方法及装置
CN1901043A (zh) 立体声音频编码方法及装置,音频流解码方法及装置
Żernicki et al. Enhanced coding of high-frequency tonal components in MPEG-D USAC through joint application of ESBR and sinusoidal modeling
CN1476673A (zh) 编码方法和设备以及解码方法和设备
CN1625681A (zh) 产生lsf矢量

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140723

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140723

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170601

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: California, USA

Patentee before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110601

CF01 Termination of patent right due to non-payment of annual fee