CN1947174B - 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法 - Google Patents

可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法 Download PDF

Info

Publication number
CN1947174B
CN1947174B CN2005800131755A CN200580013175A CN1947174B CN 1947174 B CN1947174 B CN 1947174B CN 2005800131755 A CN2005800131755 A CN 2005800131755A CN 200580013175 A CN200580013175 A CN 200580013175A CN 1947174 B CN1947174 B CN 1947174B
Authority
CN
China
Prior art keywords
lsp
unit
arrowband
broadband
wide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005800131755A
Other languages
English (en)
Other versions
CN1947174A (zh
Inventor
江原宏幸
吉田幸司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1947174A publication Critical patent/CN1947174A/zh
Application granted granted Critical
Publication of CN1947174B publication Critical patent/CN1947174B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/38Synchronous or start-stop systems, e.g. for Baudot code
    • H04L25/40Transmitting circuits; Receiving circuits
    • H04L25/49Transmitting circuits; Receiving circuits using code conversion at the transmitter; using predistortion; using insertion of idle bits for obtaining a desired frequency spectrum; using three or more amplitude levels ; Baseband coding techniques specific to data transmission systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/20Repeater circuits; Relay circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Power Engineering (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

公开一种能够提高从窄带LSP到宽带LSP的变换性能(从窄带LSP预测宽带LSP时的预测精度),实现高性能的频带可扩展LSP编码的可扩展编码装置。在该装置中,变换系数计算单元(109)使用从窄带LSP编码单元(103)以前输出的窄带的量化LSP和从宽带LSP编码单元(107)以前输出的宽带的量化LSP来求变换系数。宽带LSP编码单元(107)将窄带的量化LSP乘以从变换系数计算单元(109)输入的变换系数,从而变换为宽带LSP,并将该宽带LSP乘以加权系数来求预测宽带LSP。然后,宽带LSP编码单元(107)对求出的预测宽带LSP和宽带LSP之间的误差信号进行编码,获得宽带的量化LSP。

Description

可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
技术领域
本发明涉及在移动通信系统或使用因特网协议的分组通信系统等中,进行语音通信时所使用的可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法。
背景技术
在如VoIP(Voice over IP)等使用分组的语音通信中,在语音数据的编码上被期望抗帧丢失性的编码方式。这是因为在以因特网通信为代表的分组通信中,有时因拥塞等而使得分组在传输路径上丢失。
作为提高抗帧丢失性的方法之一,有以下方法:即使传输信息的一部分丢失,通过以其他的一部分进行解码处理来尽量减少帧丢失的影响(例如,参照专利文献1)。在专利文献1中,公开了使用可扩展编码而将核心层编码信息和增强层的编码信息装入不同的分组进行传输的方法。另外,作为分组通信的应用,可举出使用了宽的线路(宽频线路)和窄的线路(传输率低的线路)混合的网络的组播通信(一对多的通信)。即使在这样不均匀的网络上进行多地点间的通信的情况,只要编码信息对应于各个网络被分层,就不必对每个网络发送不同的编码信息,因此可扩展编码是有效的。
例如有专利文献2公开的技术,即,以能够对语音信号进行高效编码的CELP方式为基础,在信号带宽,也就是频率轴方向具有扩展性(scalability)的频带可扩展编码技术。在专利文献2中,表示出以LSP(线谱对)参数表示语音信号的频谱包络信息的CELP方式的例子。在此,通过使用下面的(式1)将在窄带语音用的编码部(核心层)获得的量化LSP参数(窄带编码LSP)变换为宽带语音编码用的LSP参数,并在宽带语音用的编码部(增强层)使用经变换的LSP参数,由此实现频带可扩展性的LSP编码方法。
fw(i)=0.5×fn(i)  [其中,i=0,…,Pn-1]
=0.0              [其中,i=Pn,…,Pw-1]    (式1)
并且,fw(i)表示宽带信号中i次的LSP参数,fn(i)表示窄带信号中i的LSP参数,Pn表示窄带信号的LSP分析次数,Pw表示宽带信号的LSP分析次数。
可是,在专利文献2中,是以下面的情况为例进行说明,即,作为窄带信号,采样频率为8kHz,作为宽带信号,采样频率为16kHz,宽带LSP分析次数为窄带LSP分析次数的两倍,因此能够以(式1)所表示的单纯式子进行从窄带LSP到宽带LSP的变换。然而,宽带LSP的低次端的Pn次的LSP参数的存在位置是相对于包含高次端的(Pw-Pn)次的宽带信号全体而决定,并不是一定对应于窄带LSP的Pn次的LSP参数。因此,以(式1)表示的变换无法获得高变换效率(如果视为从窄带LSP预测宽带LSP,也可说是预测精度),基于(式1)而设计的宽带LSP编码器对于编码性能有很大的改善空间。
例如,在非专利文献1中,公开了使与(式1)的i次的窄带LSP参数相乘的变换系数为0.5,并且如下面的(式2)所示,使用变换系数的最佳化算法对每个次数求最佳的变换系数β(i)的方法。
fw_n(i)=α(i)×L(i)+β(i)×fn_n(i)(式2)
其中,fw_n(i)表示第n个帧的i次的宽带量化LSP参数,α(i)×L(i)表示将预测误差信号量化的向量的i次的元素(α(i)表示i次的加权系数),L(i)表示LSP预测残差向量,β(i)表示对预测宽带LSP的加权系数,fn_n(i)表示第n个帧的窄带LSP参数。通过这样的变换系数的最佳化,虽然是与专利文献2相同结构的LSP编码器,却实现了更高的编码性能。
[专利文献1]特开2003-241799号公报
[专利文献2]特开平11-30997号公报
[非专利文献1]K.Koishida et al,i°Enhancing MPEG-4 CELP by jointlyoptimized inter/intra-frame LSP predictors,i±IEEE Speech Coding Workshop2000,Proceeding,pp.90-92,2000
发明内容
然而,宽带LSP的低次端的Pn次的LSP参数的位置是相对于宽带信号全体而决定,如果着眼于各个LSP参数(各个分析帧的LSP参数),最佳的变换系数β(i)的值会随着时间(视帧而定)而变化。因此,专利文献2公开的技术有以下的问题。
图1是表示对宽带信号进行频带限制的信号,也就是先对宽带信号进行下采样后进行上采样,再回复成原本的采样频率的信号,以Pw=18进行LSP分析所获得的窄带的LSP参数的例子的图。
另外,图2是表示对与图1所示的窄带LSP参数对应的宽带信号,以Pw-=18进行LSP分析所获得的宽带LSP参数的例子的图。在这些图中,横轴代表时间(分析帧编号),纵轴为归一化频率(以1.0作为奈奎斯特频率,在图中的例子为8kHz)。
如这些图所示,可得知即使是除了信号的频带不同之外使所有条件相同而获得的LSP参数,即,以相同的采样频率(16kHz)进行相同分析次数的LSP分析所获得的LSP参数,从在窄带进行频带限制的信号所获得的低次端的(Pw/2)次的LSP参数与从宽带信号获得的低次端的(Pw/2)次的LSP参数的对应关系随时间变化。这个变化是因不包含在窄带信号,但包含在宽带信号的频率分量(主要是高频分量)的不同所产生的。
图3是表示使用图1及图2所示的LSP数据,将对每个次数求得的窄带LSP变换为宽带LSP的情况的理想的变换系数的图。这里,变换系数是将宽带LSP除以窄带LSP所得的值,横轴表示时间(分析帧编号),以次数为0次、4次、8次的情况为例加以表示。
从此图可明确得知,理想的变换系数的值随时间变动。也就是说,将窄带LSP变换为宽带LSP时的变换系数,换个方式说的话就是从窄带LSP预测宽带LSP时的变换系数,其理想值随时间变动,因此,即使使用由非专利文献1所示的设计方法获得的变换系数,如果变换系数为固定值,就无法正确地表示出随时间变动的理想的变换系数。
然而,在此为了凑齐LSP分析的条件,以采样频率及分析次数相同而仅有信号的频带不同的情况为例加以表示,但即使是在使用经下采样的信号以比宽带LSP还要低的次数进行LSP分析的情况也是相同的。只要是这个领域的技术人员,应可容易理解此事实。但是,由于LSP分析的条件变得不同,窄带LSP和宽带LSP的对应关系变得比上述的例子还要差。
因此,本发明的目的在于提供一种提高从窄带LSP到宽带LSP的变换性能,也就是提高从窄带LSP预测宽带LSP时的预测精度,能够实现高性能的频带可扩展LSP编码的可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法。
本发明的可扩展编码装置是,从输入信号生成在频率轴方向具有扩展性的窄带和宽带的量化LSP参数的可扩展编码装置,所采用的结构包括:窄带编码单元,对窄带的输入信号的LSP参数进行编码,生成窄带的第一量化LSP参数;变换单元,将所述第一量化LSP参数的频带变换为宽带;宽带编码单元,使用变换为宽带后的所述第一量化LSP参数进行宽带的输入信号的LSP参数的编码,生成宽带的第二量化LSP参数;以及计算单元,基于以前生成的所述第一和第二量化LSP参数之间的关系,计算由所述变换单元使用的变换系数。
根据本发明,能够提高从窄带LSP到宽带LSP的变换性能,实现高性能的频带可扩展LSP编码。
附图说明
图1是表示窄带的LSP参数的例子的图。
图2是表示宽带的LSP参数的例子的图。
图3是表示理想的变换系数的图。
图4是表示实施方式1的可扩展编码装置的主要结构的方框图。
图5是表示实施方式1的宽带LSP编码单元内部的主要结构的方框图。
图6是表示实施方式1的变换系数计算单元内部的主要结构的方框图。
图7是表示实施方式1的可扩展解码装置的主要结构的方框图。
图8是表示实施方式1的宽带LSP解码单元内部的主要结构的方框图。
图9是表示实施方式2的变换系数计算单元内部的主要结构的方框图。
图10是表示实施方式2的宽带LSP编码单元内部的主要结构的方框图。
图11是表示实施方式2的宽带LSP解码单元内部的主要结构的方框图。
图12是表示实施方式3的可扩展编码装置的主要结构的方框图。
图13是表示实施方式3的变换系数计算单元内部的主要结构的方框图。
图14是表示实施方式3的可扩展解码装置的主要结构的方框图。
图15是表示实施方式4的可扩展编码装置的主要结构的方框图。
图16是表示实施方式4的可扩展解码装置的主要结构的方框图。
图17是表示实施方式5的宽带LSP编码单元的主要结构的方框图。
图18是表示实施方式5的变换系数计算单元的主要结构的方框图。
图19是表示实施方式5的可扩展编码装置的主要结构的方框图。
图20是表示实施方式6的宽带LSP编码单元的主要结构的方框图。
图21是表示实施方式6的变换系数计算单元的主要结构的方框图。
图22是表示实施方式7的宽带LSP编码单元的主要结构的方框图。
具体实施方式
以下,参照附图详细说明本发明的实施方式。
(实施方式1)
图4是表示本发明实施方式1的可扩展编码装置的主要结构的方框图。
本实施方式的可扩展编码装置包括:下采样单元101、LSP分析单元(窄带用)102、窄带LSP编码单元103、声源编码单元(窄带用)104、相位校正单元105、LSP分析单元(宽带用)106、宽带LSP编码单元107、声源编码单元(宽带用)108、变换系数计算单元109、上采样单元110、加法器111以及复用单元112。
本实施方式的可扩展编码装置的各个部分进行以下的动作。
下采样单元101对输入语音信号进行下采样处理,将窄带信号输出到LSP分析单元(窄带用)102和声源编码单元(窄带用)104。另外,输入语音信号是已数字化的信号,视需要而被施以HPF或背景噪声抑制处理等预处理。
LSP分析单元(窄带用)102对从下采样单元101输入的窄带信号计算LSP(线谱对)参数,并将结果输出到窄带LSP编码单元103。
窄带LSP编码单元103对从LSP分析单元(窄带用)102输入的窄带LSP参数进行编码,将量化的窄带LSP参数输出到宽带LSP编码单元107、变换系数计算单元109以及声源编码单元(窄带用)104。另外,窄带LSP编码单元103将编码数据输出到复用单元112。
声源编码单元(窄带用)104将从窄带LSP编码单元103输入的、被量化的窄带LSP参数变换为线性预测系数,使用所获得的线性预测系数构筑线性预测合成滤波器。声源编码单元104求使用此线性预测合成滤波器合成的合成信号和另外从下采样单元101输入的窄带输入信号之间的听觉加权误差,进行使该听觉加权误差为最小的声源参数的编码。将获得的代码信息输出到复用单元112。另外,声源编码单元104生成窄带解码语音信号并输出到上采样单元110。
再有,关于窄带LSP编码单元103或声源编码单元(窄带用)104,可应用在使用LSP参数的CELP型语音编码装置中普遍使用的电路,例如可利用记载于专利文献2或ITU-TI建议G729等技术。
在声源编码单元104合成的窄带解码语音信号输入上采样单元110,上采样单元110对其进行上采样处理后输出到加法器111。
在加法器111分别从相位校正单元105输入相位校正后的输入信号,从上采样单元110输入经过上采样的窄带解码语音信号,求两信号的差分信号并输出到声源编码单元(宽带用)108。
相位校正单元105用于对下采样单元101以及上采样单元110产生的相位偏差(延迟)进行校正,在下采样处理和上采样处理是以线性相位低通滤波器和采样稀疏处理/插零处理(zero insertion)等进行时,进行使输入信号延迟相当于由线性相位低通滤波器产生的延迟的处理,并输出到LSP分析单元(宽带用)106和加法器111。
LSP分析单元(宽带用)106输入从相位校正单元105输出的宽带信号,并进行公知的LSP分析所获得宽带LSP参数输出到宽带LSP编码单元107。
变换系数计算单元109使用窄带LSP编码单元103以前输出的窄带的量化LSP和宽带LSP编码单元107以前输出的宽带的量化LSP来求出变换系数,并将结果输出到宽带LSP编码单元107。
宽带LSP编码单元107对从窄带LSP编码单元103输入的窄带的量化LSP乘以从变换系数计算单元109输入的变换系数,变换为宽带LSP,对该宽带LSP乘以加权系数而求预测宽带LSP。然后,宽带LSP编码单元107使用向量量化等方法对从LSP分析单元(宽带用)106输入的宽带LSP和求得的预测宽带LSP的误差信号进行编码,将获得的宽带的量化LSP输出到声源编码单元(宽带用)108。这里,量化LSP由下面的(式3)表示。
fw_n(i)=α(i)×L(i)+β(i)×
{fw_n-1(i)/fn_n-1(i)}×fn_n(i)(式3)
其中,fw_n(i)表示第n个帧的i次的宽带量化LSP参数,α(i)×L(i)表示将预测误差信号量化的向量的i次的元素(α(i)表示i次的加权系数),L(i)表示LSP预测残差向量,β(i)表示对预测宽带LSP的加权系数,fw_n-1(i)表示第(n-1)个帧的宽带量化LSP参数,fn_n-1(i)表示第(n-1)个帧的窄带量化LSP参数,fn_n(i)表示第n个帧的窄带LSP参数。
另外,宽带LSP编码单元107将获得的编码信息输出到复用单元112。再有,与上述LSP预测残差向量相乘的加权系数α(i)可以是1.0的固定值,也可以是由另外学习而获得的常数,或是将由另外学习而获得的多个系数存储为码本,从其中选择一个也可以。
声源编码单元(宽带用)108将从宽带LSP编码单元107输入的、被量化的宽带LSP参数变换为线性预测系数,使用所获得的线性预测系数构筑线性预测合成滤波器。然后,声源编码单元108求使用该线性预测合成滤波器合成的合成信号和经相位校正的输入信号之间的听觉加权误差,决定使这个听觉加权误差为最小的声源参数。更详细地说,宽带输入信号和上采样后的窄带解码信号的误差信号另外从加法器111输入声源编码单元108,求该误差信号和声源编码单元108生成的解码信号之间的误差,并决定声源参数,以使对该误差施以听觉加权后的误差最小。将获得的声源参数的代码信息输出到复用单元112。关于这个声源编码,例如公开在「K.Koishida et al,“A16-kbit/sbandwidth scalable audio coder based on the G.729 standard,”IEEE Proc.ICASSP 2000,pp.1149-1152,2000」。
在复用单元112,从窄带LSP编码单元103输入窄带LSP的编码信息,从声源编码单元(窄带用)104输入窄带信号的声源编码信息,从宽带LSP编码单元107输入宽带LSP的编码信息,并且从声源编码单元(宽带用)108输入宽带信号的声源编码信息。复用单元112对这些信息进行复用,并作为比特流送到传输路径。另外,比特流根据传输路径的规格,被帧化为传输信道帧或被分组化。另外,为了提高对传输路径差错的抗性,附加差错保护或差错检测码,或采用交织处理等。
图5是表示上述宽带LSP编码单元107内部的主要结构的方框图。
该宽带LSP编码单元107包括:误差最小化单元121、LSP码本122、加权系数码本123、放大器124~126以及加法器127、128。
加法器127对从LSP分析单元106输入的、作为量化目标的LSP参数和从加法器128输入的量化LSP参数候选的误差进行计算,将求得的误差输出到误差最小化单元121。然而,这个误差计算可以是输入的LSP向量间的均方误差。另外,根据输入的LSP向量的特征进行加权的话,能够进一步地提高听觉上的质量。例如,在ITU-T建议G.729中,使用3.2.4章(Quantization ofthe LSP coefficients)的(21)式的加权均方误差(加权欧几里得距离)进行误差最小化。
误差最小化单元121分别从LSP码本122和加权系数码本123中,选择使从加法器127输出的误差为最小的LSP向量和加权系数向量,将对应的索引编码,并输出到复用单元112(S11)。
LSP码本122将所存储的LSP向量输出到放大器124。这里,LSP码本122存储的LSP向量是基于从放大器125输出的窄带量化LSP而预测的宽带LSP的(对从LSP分析单元106输入的宽带LSP的)预测残差向量。
加权系数码本123从所存储的加权系数集之中选择1个集,从所选择的加权系数集之中将放大器124用的系数和放大器125用的系数输出到放大器124和125。并且,该加权系数集包括分别对放大器124和放大器125按LSP的每个次数准备的加权系数。
放大器124对从LSP码本122输入的LSP向量乘以从加权系数码本123输出的放大器124用的加权系数,将结果输出到加法器128。
放大器125对从放大器126输入的宽带LSP的向量,也就是对量化后的窄带LSP进行变换后获得的宽带LSP的向量乘以从加权系数码本123输出的放大器125用的加权系数,将结果输出到加法器128。
加法器128计算从放大器124和放大器125输出的LSP向量之和,将结果输出到加法器127。另外,在误差最小化单元121判断误差为最小的LSP向量之和作为宽带的量化LSP参数被输出到声源编码单元108和变换系数计算单元109。另外,在作为宽带的量化LSP参数输出的LSP参数未满足稳定条件(第n次的LSP大于第0次~第(n-1)次的任何一个的LSP时,也就是LSP的值按照次数的顺序变大)时,加法器128进行操作,以满足LSP的稳定条件。再有,在相邻的量化LSP的间隔比预定间隔小时,一般也进行操作,以使其成为规定的间隔以上。
放大器126对从窄带LSP编码单元103输入的LSP参数乘以从变换系数计算单元109输入的系数,将结果输出到放大器125。然而,从窄带LSP编码单元103输入到放大器126的LSP参数,也可以直接就是窄带LSP编码单元103的量化结果,但进行上采样以和宽带信号的采样频率匹配,同时和宽带LSP的次数匹配的话更好。作为该上采样的方法,可以举出对从窄带LSP获得的LPC合成滤波器的脉冲响应进行上采样,从经上采样的脉冲响应求自相关(例如,参照专利文献2),将求得的自相关系数以公知的方法变换为期望的次数的LSP的方法等,但不限于此。
图6是表示图4所示的变换系数计算单元109内部的主要结构的方框图。
该变换系数计算单元109包括:延迟器131和132、除法器133、限制器134以及平滑化单元135。
延迟器131将从窄带LSP编码单元103输入的窄带LSP参数延迟1处理单位时间(LSP参数的更新周期),将结果输出到除法器133。另外,如上述,从窄带LSP编码单元103输入的窄带LSP也可以直接是参数窄带LSP,但进行上采样使次数匹配的话更好。
延迟器132将从宽带LSP编码单元107输入的宽带LSP参数延迟1处理单位时间(LSP参数的更新周期),将结果输出到除法器133。
除法器133将从延迟器132输入的、在1处理单位时间前量化的宽带LSP参数除以从延迟器131输入的在1处理单位时间前量化的窄带LSP参数,将除法结果输出到限制器134。从延迟器131输出的窄带LSP参数的次数和从延迟器132输出的宽带LSP参数的次数不同的时候,除法器133仅进行相当于较少一方的次数(一般是窄带LSP参数的次数)的除法运算,并进行输出。
限制器134以预先设定的上限值和下限值对从除法器133输入的除法结果进行消波(超过上限值的话重新设定该上限值,低于下限制的话重新设定该下限值的处理),并输出到平滑化单元135。然而,上限值和下限值可以所有次数都相同,但对每个次数设定最佳的值会更好。
平滑化单元135对从限制器134输入的消波后的除法结果随时间进行平滑化,作为变换系数数输出到宽带LSP编码单元107。该平滑化处理例如可通过使用下面的(式4)来实现。
Xn(i)=K×Xn-1(i)+(1-K)×γ(i)  (式4)
这里,Xn(i)表示适用于第n个处理单位时间的i次的窄带LSP参数的变换系数,K表示平滑化系数,取0≤K<1的值,γ(i)表示对从限制器134输出i次的LSP参数的除法结果。
以上,详细说明了本实施方式的可扩展编码装置。
图7是表示对以上述可扩展编码装置编码的编码信息进行解码的可扩展解码装置的主要结构的方框图。
该可扩展解码装置包括:复用分离单元151、声源解码单元(窄带用)152、窄带LSP解码单元153、声源解码单元(宽带用)154、变换系数计算单元155、宽带LSP解码单元156、语音合成单元(窄带用)157、语音合成单元(宽带用)158、上采样单元159以及加法器160。
复用分离单元151接受由上述的可扩展编码装置编码的编码信息,分离为各个参数的编码信息,分别将窄带声源编码信息输出到声源解码单元(窄带用)152,将窄带LSP编码信息输出到窄带LSP解码单元153,将宽带声源编码信息输出到声源解码单元(宽带用)154,将宽带LSP编码信息输出到宽带LSP解码单元156。
声源解码单元(窄带用)152使用与在上述的可扩展编码装置的声源编码单元(窄带用)104进行的处理相反的处理,来对从复用分离单元151输入的窄带声源信号的编码信息进行解码,并将量化的窄带声源信号输出到语音合成单元(窄带用)157。
窄带LSP解码单元153使用与在上述的可扩展编码装置的窄带LSP编码单元103进行的处理相反的处理,来对从复用分离单元151输入的窄带LSP的编码信息进行解码,并将所获得的窄带的量化LSP输出到语音合成单元(窄带用)157、变换系数计算单元155以及宽带LSP解码单元156。
语音合成单元(窄带用)157将从窄带LSP解码单元153输入的、被量化的窄带LSP参数变换为线性预测系数,使用所获得的线性预测系数构筑线性预测合成滤波器。语音合成单元(窄带用)157以从声源解码单元(窄带用)152输入的窄带的量化声源信号来驱动该线性预测合成滤波器,合成解码语音信号后作为窄带解码语音信号输出。为获得宽带解码语音信号,该窄带解码语音信号被输出到上采样单元159。另外,该窄带解码语音信号可以直接作为最终输出来使用。使窄带解码语音信号直接作为最终输出的时候,一般先由后置滤波器等进行改善主观质量的后处理,再进行输出。
上采样单元159对从语音合成单元(窄带用)157输入的窄带语音信号进行上采样处理后输出到加法器160。
声源解码单元(宽带用)154使用与在上述的可扩展编码装置的声源编码单元(宽带用)108进行的处理相反的处理,来对从复用分离单元151输入的宽带声源信号的编码信息进行解码,并将获得的宽带量化声源信号输出到语音合成单元(宽带用)158。
变换系数计算单元155使用从窄带LSP解码单元153以前输入的窄带的量化LSP和从宽带LSP解码单元156以前输入的宽带的量化LSP来求出变换系数,并将结果输出到宽带LSP解码单元156。
宽带LSP解码单元156对从窄带LSP解码单元153输入的窄带的量化LSP乘以从变换系数计算单元155输入的变换系数,变换为宽带LSP,对该宽带LSP乘以加权系数而求预测宽带LSP。另外,该加权系数使用与上述的可扩展编码装置的宽带LSP编码单元107使用的加权系数相同的值。再有,宽带LSP解码单元156从复用分离单元151输入的宽带LSP编码信息对量化的宽带LSP预测残差(编码端的输入宽带LSP和所述预测宽带LSP的误差)进行解码。然后,宽带LSP解码单元156将该量化的宽带LSP预测残差和上述已求出的预测宽带LSP相加,对宽带的量化LSP进行解码。所获得的宽带的量化LSP参数被输出到语音合成单元(宽带用)158和变换系数计算单元155。
语音合成单元(宽带用)158将从宽带LSP解码单元156输入的、被量化的宽带LSP参数变换为线性预测系数,使用所获得的线性预测系数构筑线性预测合成滤波器。语音合成单元(宽带用)158以从声源解码单元(宽带用)154输入的宽带的量化声源信号驱动该线性预测合成滤波器,对宽带解码语音信号(主要是高频分量)进行合成,输出到加法器160。
加法器160将从上采样单元159输入的上采样后的窄带解码语音信号和从语音合成单元(宽带用)158输入的宽带解码语音信号(主要是高频分量)相加,输出最终的宽带解码语音信号。
图8是表示上述宽带LSP解码单元156内部的主要结构的方框图。
该宽带LSP解码单元156包括:索引解码单元161、LSP码本162、加权系数码本163、放大器164~166以及加法器167。
索引解码单元161从复用分离单元151获得宽带LSP的编码信息,对用于LSP码本162和用于加权系数码本163的索引信息进行解码,将各个索引输出到各个码本。
LSP码本162从索引解码单元161获得LSP码本索引,从码本中取出该索引指定的LSP向量,并输出到放大器164。另外,在码本为分离型或多级结构的情况,从多个子码本取出所指定的向量而生成LSP向量。
加权系数码本163从索引解码单元161获得加权系数码本索引,从码本取出该索引指定的加权系数集,在取出的系数集中,分别将放大器164用(LSP码本用)的系数子集(由与LSP向量的各个次数相乘的系数构成)输出到放大器164,将放大器165用(窄带LSP用)的系数子集(由与预测宽带LSP向量的各个次数相乘的系数构成)输出到放大器165。
放大器164对从LSP码本162输入的LSP向量乘以从加权系数码本163输入的放大器164用的加权系数,将结果输出到加法器167。
放大器165对从放大器166输入的、从量化的窄带LSP变换的宽带LSP的向量乘以从加权系数码本163输入的放大器165用的加权系数,将结果输出到加法器167。
加法器167计算从放大器164和放大器165输入的LSP向量之和,将其作为量化(解码)宽带LSP参数输出到语音合成单元(宽带用)158和变换系数计算单元155。另外,作为宽带的量化LSP参数而输出的LSP参数未满足稳定条件时,也就是第n次的LSP小于第0次~第(n-1)次的任何一个LSP的时候(LSP的值没有按照次数的顺序变大的时候),进行操作,以满足LSP的稳定条件。再有,相邻的量化LSP的间隔比预定间隔小的时候,也进行操作,以使其成为预定间隔以上。
另外,0图7所示的变换系数计算单元155的内部结构基本上与图6所示的变换系数计算单元109相同。因此省略详细说明,但下述为与图6所示的变换系数计算单元109的不同点:在该变换系数计算单元155中,对延迟器131的输入是来自窄带LSP解码单元153,对延迟器132的输入是来自宽带LSP解码单元156,平滑化单元135的输出被送到宽带LSP解码单元156。
以上,详细说明了本实施方式的可扩展解码装置。
如上述,根据本实施方式,变换系数计算单元109使用在以前的帧(例如,前一个帧等)编码的窄带和宽带的量化LSP参数,求以前的帧的理想的变换系数的近似值,基于该近似值决定从当前帧的窄带的量化LSP向宽带LSP的变换系数。具体地说,理想的变换系数的近似值,通过对以前的帧的宽带的量化LSP除以相同帧的窄带的量化LSP来求。换言之,在由窄带LSP参数乘以变换系数Xn(i)来对宽带LSP参数进行估计的时候,使用以前的窄带LSP参数和宽带LSP参数的关系,自适应地对每个帧决定变换系数。因此,变换系数随时间而变化。通过采用这个结构,能够提高从窄带LSP预测宽带LSP时的预测精度。
另外,在上述结构中,由于能够仅从以前的帧的窄带和宽带的量化LSP参数计算上述变换系数,所以例如在解码端不需要另外从编码端获得信息。换言之,能够改善宽带LSP参数的编码性能,而未使通信的传输率增加。
并且,在上述结构中,由于上述变换系数能够以预定的计算从以前的帧的窄带和宽带的LSP参数直接求出,因此不需要事先在数据表等中保持多个变换系数的集。
另外,在上述结构中,变换系数计算单元109内的限制器134为了避免计算出的变换系数成为极端的数值,对变换系数进行限制,使其容纳于例如平均值的上下10%左右的范围内。例如,语音模式从有声模式切换到无声模式,或从无声模式切换到有声模式等的时候,由于LSP参数大幅变动,有时候计算出的变换系数也变动而不会成为妥当的数值。变换系数在短时间内大幅变动的时候,使用前面帧的宽带/窄带的LSP比的预测失去作用,反而使误差增大。于是,在LSP码本尝试对变大的误差进行校正,如果在码本存储像这样误差大的向量的话,在预测误差小的时候会使误差增大。也就是说,变换系数和LSP码本之间的关系会陷于一种振荡状态,为防止这种情形,必须为能在两者之间取得平衡的结构。
因此,在本实施方式中,首先根据上述的算式对所有的帧求变换系数,但对变换系数设置上限和下限,在计算出的变换系数不在这个范围内时进行校正,使变换系数容纳于该范围内。由此,能够使实际用于变换的变换系数成为一定范围内的数值,可保证变换系数的稳定性(或准稳定性),可防止振荡状态。由此,虽然使用变换系数的预测能力被限制,而会产生预测误差变大的情况,但如果在使变换系数为固定值的时候将范围限定在“固定值”的附近,则预测误差不会极大地超出使变换系数为固定值的情况,能够与使变换系数为固定值的情况同样地,在LSP码本端对应。变换系数的近似值通过对前一个帧的宽带量化LSP除以前一个帧的窄带量化LSP而求,用于当前帧的变换系数通过将近似值限定在平均变换系数的附近(例如为前后10%左右的范围或是变换系数的标准偏差程度的范围)来获得。
另外,在上述的结构中,上述的变换系数在分析帧之间(在前后的帧之间)被施以平滑化处理,以使其随时间平缓的变动。因此,变换系数相对于LSP参数的变动平缓地推移,能够防止对传输路径差错太过敏感。另外,由于变换系数的值变得稳定,使对应的LSP代码向量码本的设计变得容易。量化LSP的预测值是由变换系数和LSP代码向量的积表示,因此其中一方的参数变动激烈的话,另一方也变动激烈,使得相互之间的关系陷于发散状态(上述的振荡状态),而无法设计性能佳的码本。通过上述结构,例如能够将SD性能改善0.05dB。然而,该改善程度随量化比特数和帧长度而变化。
另外,在本实施方式中虽然示出了不使用MA预测型LSP编码器的例子,但在使用MA预测器的情况也可适用本发明。此时,MA预测系数被存储在加权系数码本163中,加权系数向量的维数与MA预测次数相应地增加。
再有,在本实施方式中,虽然以变换系数计算单元109包括限制器134和平滑化单元135双方的情况为例进行了说明,但也可以是仅包括其中一方的结构。
(实施方式2)
在实施方式1中,在计算出的变换系数大幅变动时,通过进行校正,使变换系数容纳于一定范围内,由此来稳定地进行从窄带LSP预测宽带LSP时的预测。在本实施方式中,着眼于量化LSP参数,通过观察该量化LSP参数的变化,判断LSP参数是否有变动,并切换用于变换的变换系数。
具体地说,着眼于在编码端的窄带LSP编码单元或解码端的窄带LSP解码单元获得的窄带的量化LSP参数,将该窄带的量化LSP参数没有变动的时候判定为稳定模式,将窄带的量化LSP参数有变动的时候判定为非稳定模式,根据这个模式的判定结果,切换使用LSP码本和加权系数码本。也就是说,在稳定模式时,根据上述的算式(式2)对每个帧计算变换系数,由此进行自适应控制,另一方面,在非稳定模式时,使用上述的(式3),将变换系数设定为固定值或准固定值。在此,准固定值是指,预先设定多个变换系数,根据语音信号的编码结果(音质)切换变换系数。换言之,持有多种固定值的变换系数集,在量化时选择一个最佳的来使用。
以下,参照附图具体说明本实施方式。
本发明的实施方式2的可扩展编码装置的基本结构与实施方式1的可扩展编码装置相同。因此,省略本实施方式的可扩展编码装置的详细说明,在下面对结构不同的变换系数计算单元109a和宽带LSP编码单元107a进行详细说明。并且,对于相同的构成要素赋予相同的编号,并省略其说明。
图9是表示变换系数计算单元109a内部的主要结构的方框图。
该变换系数计算单元109a包括模式判定单元201、系数表202以及切换开关203,以取代限制器134。变换系数计算单元109a根据模式判定单元201的模式判定结果,来切换使用计算出的变换系数和预先存储在系数表中的变换系数。
模式判定单元201对从窄带LSP编码单元103输入的窄带的量化LSP和作为延迟器131的输出的、在1处理单位时间前量化的窄带LSP之间的距离(变化量)进行计算,基于计算出的距离判定是稳定模式还是非稳定模式。例如,在计算出的距离为预先设定的阈值以下时判定为稳定模式,在超过阈值时判定为非稳定模式。判定结果被输出到宽带LSP编码单元107a和切换开关203。然而,计算出的距离可以直接用于阈值判定,也可以在帧间进行平滑化之后再用于阈值判定。
在模式判定单元201的判定结果为稳定模式时,切换开关203被切换成将从平滑化单元135输出的变换系数输出到宽带LSP编码单元107a,另一方面,在模式判定单元201的判定结果为非稳定模式时,切换开关203被切换成将存储在系数表的变换系数输出到宽带LSP编码单元107a。
在LSP参数显示稳定的值时,当前帧的宽带/窄带的LSP参数比和前面帧的宽带/窄带的量化LSP参数比接近,通过应用使用(式2)的量化,可提高从窄带LSP参数预测宽带LSP参数时的预测精度,改善量化性能。
图10是表示上述宽带LSP编码单元107a内部的主要结构的方框图。
LSP码本和加权系数码本分别由相当于模式数(在此为两个)的子码本构成(LSP码本222-1、222-2,加权系数码本223-1、223-2),其结构是,切换开关224、225基于从模式判定单元201输入的模式信息,分别选择子码本中的一个。
本发明的实施方式2的可扩展解码装置的基本结构也和实施方式1的可扩展解码装置相同。因此,省略详细的说明,对不同结构的变换系数计算单元155a和宽带LSP解码单元156a进行以下的说明。并且,对于相同的构成要素赋予相同的编号,并省略其说明。
变换系数计算单元155a的内部结构基本上与图9所示的变换系数计算单元109a相同。因此省略详细说明,但下述为与图9所示的变换系数计算单元109a的不同点:对延迟器131的输入是来自窄带LSP解码单元153,对延迟器132的输入是来自宽带LSP解码单元156a,平滑化单元135的输出被送到宽带LSP解码单元156a。并且,为了方便与编码端的模式判定单元201区分,使模式判定单元的编号为251。
图11是表示上述宽带LSP解码单元156a内部的主要结构的方框图。
LSP码本和加权系数码本分别由相当于模式数(在此为两个)的子码本构成(LSP码本262-1、262-2,加权系数码本263-1、263-2),其结构是,切换开关264、265基于从模式判定单元251输入的模式信息,分别选择子码本中的一个。
这样,根据本实施方式,对输入的未量化的宽带LSP或在当前帧量化的窄带LSP的稳定性进行判定,仅在判定为稳定(帧间的变动小)时,选择地使用所述计算出的变换系数,在判定为非稳定(帧间的变动大)时,使用另外存储在表中的变换系数。换言之,根据LSP参数的稳定性对计算出的变换系数和预先设计并存储在表中的变换系数进行切换。
通过采用上述结构,能够提高从窄带LSP预测宽带LSP时的预测精度。另外,由于使用编码后的量化LSP参数来对LSP参数的变动进行判断,即使编码端不发送模式信息到解码端,也能够判断LSP参数的变动。由于也不需要从编码端发送模式信息,所以未浪费通信系统的资源。
(实施方式3)
在实施方式2中,观测窄带的量化LSP参数的变化,对LSP参数的变动的有无进行判断(模式判定)。可是,有时在窄带的量化LSP参数不处于变动状态的时候,宽带的量化LSP参数产生变动。
并且,由于在解码端根据以前的模式判定结果进行当前帧的解码,所以在实施方式2的方法中,如果以前的模式判定出错,该差错会传播到之后的处理。
因此,在本实施方式中,在编码端新设置使用宽带LSP参数进行模式判定的模式判定单元,将所获得的模式判定结果发送到解码端。在解码端新设置对该模式判定结果进行解码的模式解码单元。
以下,参照附图具体说明本实施方式。
图12是表示本发明实施方式3的可扩展编码装置的主要结构的方框图。并且,该可扩展编码装置具有与实施方式1所示的可扩展编码装置(参照图4)相同的基本结构,对于相同的构成要素赋予相同的编号,并省略其说明。
模式判定单元301基本上进行与实施方式2所示的模式判定单元201(251)相同的动作。也就是说,对延迟1处理单位时间的LSP参数和当前的LSP参数之间的距离进行计算,当该距离为预先设定的阈值以下时判定为稳定模式,当超过阈值时判定为非稳定模式。可是,作为输入信息而使用的是从LSP分析单元(宽带用)106输出的宽带LSP参数,这一点与实施方式2不同。模式判定单元301的判定结果被输出到变换系数计算单元109b和宽带LSP编码单元107a,模式信息的编码信息被输出到复用单元112。并且,宽带LSP编码单元107a是已在实施方式2说明的宽带LSP编码单元。
这样,模式判定单元301使用宽带LSP参数而不是已编码的信息(量化LSP参数)来对稳定/非稳定进行判定,因此也可对应仅在宽带信号的高频率域大幅变动的信号。
另外,模式判定单元301对所获得的模式结果和其他的编码参数一起进行复用,并发送到解码端。由此,由于模式信号传输到解码端,即使在解码端在模式信息的判定发生一次错误,在后续帧下一个模式信息被发送过来,因此,前面帧的判定差错的影响不会传播,传输路径的抗错能力得到改善。
图13是表示变换系数计算单元109b内部的主要结构的方框图。并且,该变换系数计算单元109b具有和实施方式2的图9所示的变换系数计算单元109a相同的基本结构,仅针对不同点在下面进行说明。
变换系数计算单元109b在其内部不包括模式判定单元,仅将模式判定结果从外部输入。然后,变换系数计算单元109b根据输入的模式判定结果对切换开关进行切换。具体地说,在稳定模式的时候,切换开关203被切换,使从平滑化单元135输出的变换系数被输出到宽带LSP编码单元107a。在非稳定模式的时候,切换开关203被切换,使由离线的学习等预先设计的变换系数从系数表202输出到宽带LSP编码单元107a。
图14是表示本发明实施方式3的可扩展解码装置的主要结构的方框图。
该可扩展解码装置也具有与实施方式1所示的可扩展解码装置(参照图7)相同的基本结构,对于相同的构成要素赋予相同的编号,并省略其说明。与实施方式1所示的可扩展解码装置的不同点在于,新设置有模式解码单元351,对本实施方式的可扩展编码装置的模式判定单元301的输出信息进行解码,将解码信息输出到变换系数计算单元155b和宽带LSP解码单元156a。另外,变换系数计算单元155b也具有和编码端的变换系数计算单元109b(参照图13)相同的基本结构。
再有,本实施方式虽然说明了基于LSP参数的时间变化来进行模式判定的情况,但也可以基于变换系数的变换增益来进行模式判定。该变换系数的变换增益表示前面帧的“宽带量化LSP/窄带量化LSP”比和当前帧的“输入宽带LSP/窄带量化LSP”比有多接近。
(实施方式4)
本实施方式的特征在于,编码端不将模式信息发送到解码端,而在编码端的窄带LSP编码单元或解码端的窄带LSP编码单元的内部进行模式判定。
图15是表示本发明实施方式4的可扩展编码装置的主要结构的方框图。并且,该可扩展编码装置具有与实施方式3所示的可扩展编码装置(参照图12)相同的基本结构,对于相同的构成要素赋予相同的编号,并省略其说明。
在本实施方式的可扩展编码装置中,窄带LSP编码单元103c进行多模式编码,使用该模式信息(S41)进行变换系数计算单元109b的模式切换以及宽带LSP编码单元107a的模式切换。
窄带LSP编码单元以LSP的稳定性进行模式切换的技术例如记载于:T.Eriksson,J.Linden,and J.Skoglund,“Exploiting interframe correlation inspectral quantization-A study of different memory VQ schemes,”Proc.IEEEICASSP-96,pp.765-768,1996等。在该文献中,提出一种为对应帧间相关强(稳定性高)的帧和其他帧,而在用于帧间预测的模式和不用于帧间预测的模式之间切换的“safety-net VQ”的方法。如果像这样在窄带LSP编码单元使用量化器,可将其模式信息使用为宽带LSP编码单元/变换系数计算单元的模式切换信息。
图16是表示本发明实施方式4的可扩展解码装置的主要结构的方框图。并且,该可扩展解码装置也具有与实施方式3所示的可扩展解码装置(参照图14)相同的基本结构,对于相同的构成要素赋予相同的编号,并省略其说明。
本实施方式的可扩展解码装置在窄带LSP解码单元153c具有模式信息解码功能。也就是说,窄带LSP解码单元153c进行多模式的解码,将该模式信息(S42)输出到变换系数计算单元155b和宽带LSP解码单元156a。变换系数计算单元155b和宽带LSP解码单元156a使用从窄带LSP解码单元153c输入的模式信息(S42)进行模式切换。
这样,根据本实施方式,由于使用窄带LSP编码信息的模式信息来切换宽带LSP编码的模式,所以没有添加的比特,就能够进行宽带LSP编码单元、宽带LSP解码单元或变换系数单元的模式切换。另外,由于传输模式信息,即使在产生传输路径差错时,也可以防止错误的影响传播到后续帧。
(实施方式5)
在实施方式3中,模式判定比LSP的量化先执行,基于该模式判定结果切换搜索的码本。也就是说,模式判定在量化前以开环执行,因此不一定选择使量化误差为最小的模式。例如,实施方式3的模式判定是基于量化前的LSP参数进行,但不是说量化前的LSP参数变动,所以量化后的LSP参数也一定会变动;也不是说量化前的LSP参数稳定,所以量化后的LSP参数也一定稳定。并且,即使一部分的次数的LSP参数为稳定,如果剩余的次数的LSP参数为非稳定,从所有次数看变化时,有时会判定为稳定。这样,以开环方式进行模式判定时,难以选择确实地使量化误差为最小的模式。
因此,在本实施方式中,以闭环进行模式判定,而不是以开环判定模式。也就是说,对于稳定模式/非稳定模式,在有2以上的模式时,对全部模式实际进行码本搜索,根据该结果来选择使量化误差(量化失真)为最小的模式。再换言之,在宽带LSP编码单元中,使用求出变换系数对宽带LSP进行量化的模式和使用预先决定的固定的变换系数来对宽带LSP进行量化的模式的两种模式,来实际进行量化,将使用量化误差变小的一方的模式进行量化的结果,选择为最终的量化结果。
以下,参照附图具体说明本实施方式。
图17是表示本发明实施方式5的宽带LSP编码单元107d的主要结构的方框图。并且,该宽带LSP编码单元107d具有与实施方式2所示的宽带LSP编码单元107a(参照图10)相同的基本结构,对于相同的构成要素赋予相同的编号,并省略其说明。
误差最小化单元121d进行所有模式的码本搜索,在所有的模式的码本中,从LSP码本222-1和222-2、加权系数码本223-1和223-2中,分别选择使量化误差为最小的LSP向量和加权系数向量,对对应的索引进行编码,并输出到复用单元112(S11)。此时,所选择的LSP向量以及被生成的加权系数向量的模式信息(表示从哪个模式的码本选择的信息)S51也被输出到复用单元112。
图18是表示本发明实施方式5的变换系数计算单元109d的主要结构的方框图。并且,该变换系数计算单元109d具有与实施方式2所示的变换系数计算单元109a(参照图9)相同的基本结构,对于相同的构成要素赋予相同的编号,并省略其说明。
变换系数计算单元109d根据从宽带LSP编码单元107d内的误差最小化单元121d输出的控制信号C51,来切换所使用的预测系数。也就是说,变换系数计算单元109d根据控制信号C51来切换是以(式2)还是(式3)来表示量化LSP。
由此,变换系数计算单元109d实际进行量化,根据该量化结果来决定是否进行使用(式3)的量化。因此,仅对于能够期待由(式3)的量化使性能确实变好的帧,选择使用(式3)的模式,所以能获得良好的预测性能。
另外,根据本实施方式,仅对前面帧的宽带/窄带的量化LSP参数比和当前帧的宽带/窄带的LSP参数比接近的帧,进行基于(式3)的量化。也就是说,对宽带/窄带LSP参数比被判断为稳定的帧进行基于(式3)的量化,而不是宽带/窄带LSP参数被判断为稳定的帧。因此,能够提高抗错能力。这是因为,根据本实施方式,在基于(式3)的量化模式持续被选择的区间中,大体上保障宽带/窄带的量化LSP参数比为稳定。因此,例如前一个帧出错时,能够使用2帧前的帧或更前面帧的宽带/窄带的量化LSP参数比来进行近似。另一方面,在根据LSP参数是否稳定来进行模式判定时,即使LSP参数为稳定,宽带/窄带的量化LSP参数不一定稳定。因此,在前一个帧出错时,很有可能会使用可能不稳定的2帧前的宽带/窄带的量化LSP参数比作为近似值,以代替该帧。这个时候,会得到与没有差错时的解码结果大不相同的解码结果。
另外,根据本实施方式,前一个帧错误的时候,基于(式2)的模式被选择。因此,在这个阶段预测编码会被重置,所以能够防止错误传播到后续帧,抗错能力更加提高。
图19是表示具备上述宽带LSP编码单元107d和变换系数计算单元109d的、本发明实施方式5的可扩展编码装置的主要结构的方框图。从宽带LSP编码单元107d输出的信号(S11,S51)与实施方式1~4所示的可扩展编码装置不同。
本实施方式的可扩展解码装置的结构与实施方式3所示的可扩展解码装置(参照图14)相同,故省略其说明。
以上,说明了本实施方式的可扩展编码装置以及可扩展解码装置。
(实施方式6)
实施方式1~5的发明,由于积极地使用前面帧的量化结果来进行当前帧的预测,所以能够提高量化性能。因此,对于没有传输路径差错,或是几乎没有传播路径错误的应用特别有效。可是,在实施方式1~5中,如果发生传输路径差错,有可能会使错误在较长的时间对后续帧进行传播。具体地说,在实施方式1~5,由于使用以前的窄带量化LSP和宽带量化LSP的关系,来从当前的窄带量化LSP预测宽带量化LSP,因此在发生传输路径差错的时候,有可能在编码装置和解码装置生成不同的量化结果。在这种情况,在解码装置中,由于无法正确地进行后续帧的预测,所以错误传播到后续帧。但是,在实施方式2~5中会产生这样的错误传播的,只限于使用利用以前的量化LSP的预测的模式连续被使用,且在该连续的帧中发生传输路径差错的情况。
作为这种情况的改善方法,已知有在依存于以前的量化结果的预测中引入“遗忘因子”的方法(例如,参照Allen  Gersho,Robert M.Gray著,古井、田崎、小寺、渡边合译“べクトル量子化と情報压縮”,第16章,698页~,小节“利得適応VQにおける伝送誤り”,コロナ社,1998年11月10日发行)。根据这个引入遗忘因子的方法,使用依存于以前的量化结果的预测(自适应预测模式分量)和不依存于以前的量化结果的预测(固定预测模式分量)的和,从当前的窄带量化LSP来预测当前的宽带量化LSP。因此,通过对自适应预测模式分量和固定预测模式分量的比率进行最佳化,能够达到互为折衷选择关系的、得自自适应预测模式分量的量化性能改善效果和得自固定预测模式分量的抗错能力恶化抑制效果之间的调和。
在本发明的实施方式6,通过适用在实施方式5引入所述遗忘因子的方法,在发生传输路径差错的情况也能够减轻传输路径差错的影响。也就是说,在当前帧的宽带量化LSP的计算中,对使用了当前帧的量化结果的自适应预测模式分量和不使用以前的帧的量化结果的固定预测模式分量(固定值)进行组合来加以使用。由此,能够在自适应预测模式的帧发生传输路径差错时,通过使用固定值来随着时间的经过遗忘自适应预测分量,使编码装置和解码装置的内部状态随着时间而变得接近,从而减轻传输路径差错的影响。再有,在本实施方式中,由于具有仅进行固定预测的模式,在切换成固定预测模式的帧,编码装置和解码装置的内部状态被同时重置,防止传输路径差错的影响传播到后续帧,可改善抗错能力。
图20是表示本实施方式的宽带LSP编码单元107e的主要结构的方框图。并且,图21是表示本实施方式的变换系数计算单元109e的主要结构的方框图。另外,这个宽带LSP编码单元107e和变换系数计算单元109e是在实施方式5中,取代宽带LSP编码单元107d(参照图17)和变换系数计算单元109d(参照图18)而被使用的。因此,在本实施方式中,对于可扩展编码装置和可扩展解码装置,仅说明宽带LSP编码单元107e和变换系数计算单元109e。再有,在本实施方式中,对于宽带LSP编码单元107e和变换系数计算单元109e的构成要素,对与宽带LSP编码单元107d和变换系数计算单元109d的构成要素发挥相同功能的构成要素赋予相同的编号,并省略其说明。
在宽带LSP编码单元107e中,放大器126-1对从窄带LSP编码单元103输入的LSP参数乘以从变换系数计算单元109e的系数表202-2输入的变换系数,将该乘法结果输出到放大器125-1。另一方面,放大器126-2对于从窄带LSP编码单元103输入的LSP参数,在稳定模式(自适应预测模式)时乘以从变换系数计算单元109e的平滑化单元135输出的变换系数,并且在非稳定模式(固定预测模式)时乘以存储在系数表202-1的变换系数,将该乘法结果输出到放大器125-2。因此,放大器126-1和126-2构成本发明的乘法单元。
另外,在宽带LSP编码单元107e中,放大器125-1和125-2分别对从放大器126-1和126-2输入的宽带LSP的向量,也就是对窄带量化LSP进行变换后获得的宽带LSP的向量乘以从加权系数码本223-1和223-2输出的既定的加权系数,将该乘法结果输出到加法器128。然后,加法器128计算从放大器124和放大器125-1、125-2输出的LSP向量的和,将该加法结果输出到加法器127。
如上述,在本实施方式,放大器126-1和放大器125-1、125-2总是对当前帧的窄带量化LSP乘以固定变换系数。也就是说,只要从窄带LSP编码单元103输入的窄带量化LSP未受到以前发生的传输路径差错的影响,通过放大器126-1和126-2输入加法器128的信号就不受以前发生的传输路径差错的影响。并且,固定预测模式的预测中,放大器126-2也将固定变换系数和所述窄带量化LSP相乘,因此在前后帧之间不进行信息的交换,较早发生的传输路径差错的影响不传播到后续帧。其结果,根据本实施方式,在传输路径差错发生的时候,能够抑制该错误的影响传播到后续帧,并改善抗错能力。
另外,在本实施方式中虽然说明了在变换系数计算单元109e设置两个系数表202-1和202-2,并与此对应地在宽带LSP编码单元107e设置两个放大器126-1和126-2的情况,但本发明不限于此,也可以设置更多的系数表202以及放大器126。
再有,在本实施方式中,虽然说明了变换系数计算单元109e的系数表202-1和202-2为个别设置的情况,但本发明不限于此情况,例如也可以在变换系数计算单元109e仅设置一个系数表202,相同的变换系数从该系数表202分别输入到宽带LSP编码单元107e的两个放大器126-1和126-2。
另外,在本实施方式中虽然说明了变换系数计算单元109e需要平滑化单元135的情况,但本发明不限于此情况,例如也可以是不设置平滑化单元135,将除法器133的输出直接连接到切换开关203的结构。根据这样的结构,切换开关203一旦切换到系数表202-1端,就能够完全将传输路径差错的传播重置。
另外,即使是变换系数计算单元109e具备平滑化单元135的情况,前一个帧为固定预测模式(即,切换开关203连接到系数表202-1端)的时候,使(式4)中的K为0,换言之,使Xn(i)=γ(i)来求出适用于当前帧的窄带量化LSP的变换系数,则能够同样地完全将传输路径差错的传播重置。
另外,可以使用图21所示的变换系数计算单元109e,来取代实施方式3所示的可扩展解码装置(参照图14)的变换系数计算单元155b。
顺便说明一句,由于语音信号的主要分量有集中在其低频的倾向,对语音信号的低频分量预测宽带量化LSP的时候,以使自适应预测模式分量的构成比率降低的方式(例如成为50%以下)来设计加权系数,另一方面,对语音信号的高频分量预测宽带量化LSP的时候,以使自适应预测模式分量的构成比率提高的方式(例如成为50%以上)来设计加权系数,则可以实现主观质量的抗错能力和量化性能的调和。
(实施方式7)
在本发明的实施方式7,在实施方式6的方法中,根据窄带量化LSP的误差敏感度,对每个帧自适应地决定宽带量化LSP的预测中的固定预测模式分量和自适应预测模式分量的比率。换言之,在实施方式6,从加权系数码本223-1和223-2输出的加权系数是既定值,但在本实施方式,以从当前帧的窄带量化LSP计算出的加权系数,对在稳定模式时选择的加权系数码本223-1进行逐次更新。
这里,在LSP的量化中,为了利用位于频谱的峰的部分的LSP和位于谷的部分的LSP在主观上允许的量化噪声的电平不同的事实,已知有下面的方法,即,以在计算量化误差的时候乘以“权重”的加权后的欧几里得距离对量化误差进行评价。将这个“权重”作为与误差敏感度对应的标准来使用的话,能够对每个帧从窄带量化LSP计算出“权重”,使宽带量化LSP的预测中的固定预测模式分量和自适应预测模式分量的比率基于计算出的“权重”自适应地变化。其结果,能够对每个帧实现为折衷选择关系的抗错能力和量化性能的调节。
图22是表示本实施方式的宽带LSP编码单元107f的主要结构的方框图。另外,该宽带LSP编码单元107f在实施方式6中,取代宽带LSP编码单元107e(参照图20)而被使用。因此,在本实施方式中,对于可扩展编码装置,仅说明宽带LSP编码单元107f。再有,在本实施方式中,对于宽带LSP编码单元107f的构成要素,对与宽带LSP编码单元107e的构成要素发挥相同功能的构成要素赋予相同的编号,并省略其说明。
宽带LSP编码单元107f在实施方式6所示的宽带LSP编码单元107e中,进一步包括加权系数计算器2201。加权系数计算器2201用于对每个帧进行“基于误差敏感度的加权”,根据从窄带LSP编码单元103输入的窄带量化LSP,例如计算「R.Salami et al,“Design and Description of CS-ACELP:A TollQuality 8kb/s Speech Coder,”IEEE Trans.on Speech and Audio Process.,vol.6,no.2,pp.116-130,March 1998.」的(9)式和「K.K.Paliwal and B.S.Atal,“Efficient Vector Quantization of LPC Parameters at 24 Bits/Frame,”IEEETrans.on Speech and Audio Process.,vol.1,no.1,pp.3-14,January 1993.」的(9)式所记载的加权,使用计算出的加权来计算出加权系数码本223-1用的加权系数。然后,加权系数计算器2201以对每个帧计算出的加权系数对加权系数码本223-1的加权系数码本的内容进行逐次更新。另外,在本实施方式中,加权系数计算器2201在计算出的权重越大(误差敏感度越大)时,将宽带量化LSP的预测中的固定预测模式分量的比率设定得越高(例如将固定预测模式分量的比率设定为50%以上),相反地,该加权越小,越进行学习以使量化性能变好。然后,加权系数计算器2201对加权系数码本223-1的内容进行更新,以接近经由该学习而获得的最佳构成比(一般说来,自适应预测模式分量的比率变高)。
由此,根据本实施方式,加权系数计算器2201根据当前帧的窄带量化LSP的误差敏感度,对在稳定模式被选择的加权系数码本223-1的内容进行逐次更新,因此通过对当前帧的宽带量化LSP的预测中的固定预测模式分量和自适应预测模式分量的比率进行最佳化,能够在抑制抗差错能力的恶化的同时,使量化性能最大化。例如,加权计算器2201在宽带量化LSP的预测中使固定预测模式分量为100%的话,也就是使放大器125-1的权重的比率为100%,该放大器125-1与对窄带量化LSP乘以固定变换系数的放大器126-1连接,并且使放大器125-2的比率为0%的话,就能够改善抗差错能力。相反地,加权系数计算器2201使自适应预测模式分量的比率为100%的话,虽然抗差错能力恶化,可是能改善量化性能。并且,加权系数计算器2201使固定预测模式分量和自适应预测模式分量的比率为例如50%和50%的话,产生得自自适应预测模式分量的量化性能改善效果,与此同时,由于固定预测分量根据宽带LSP编码单元107f的计算次数来减少传输路径的影响,使得该传输路径差错的影响难以传播到后续帧。
另外,根据本实施方式,由于加权系数计算器2201在每个帧逐次更新加权系数码本223-1的内容,即使在窄带量化LSP的误差敏感度在每个帧改变的情况,能够自适应地实现互为折衷选择关系的、得自自适应预测模式分量的量化性能改善效果和得自固定预测模式分量的抗差错能力恶化抑制效果之间的调和。
再有,在语音信号的情况,由于即使有关其高频分量的LSP参数发生错误,对主观质量的影响较小,因此加权系数计算单元2201以使有关其低频分量的固定预测模式分量的比率变高,另一方面以使有关其高频分量的自适应预测模式分量的比率变高的方式,来决定加权系数较理想。
另外,在本实施方式中,虽然说明了加权系数乘法器2201根据窄带量化LSP的误差敏感度,来计算加权系数码本223-1用的加权系数的情况,但本发明不限于这个情况,例如加权系数乘法器2201可从离线的学习数据计算出加权系数码本223-1用的加权系数。
以上,对本发明的各个实施方式进行了说明。
本发明的可扩展编码装置以及可扩展解码装置不限于上述各个实施方式,可进行各种变更加以实施。例如,可适宜地组合各个实施方式加以实施。
本发明的可扩展编码装置和可扩展解码装置也可以安装在移动通信系统中的通信终端装置和基站装置,由此能够提供具有与上述相同作用效果的通信终端装置和基站装置。
然而,这里虽然说明了对LSP参数进行编码/解码的情况,但本发明也可适用于ISP(Immittance Spectrum Pairs)参数。
另外,虽然有时特别将取LSP的余弦,也就是使LSP为L(i)的时候的cos(L(i))称为LSF(Line Spectral Frequency),并与LSP进行区分,但在本说明书中,LSF是LSP的一个形态,并使LSF包含于LSP,来使用LSP一词。换言之,也可将LSP读作LSF。
另外,在此虽然使1帧前的宽带/窄带的量化LSP参数的比作为当前帧的窄带-宽带变换系数,但也可以以时间序列的方式使用以前的帧的宽带/窄带的量化LSP参数的比,通过预测或外推(Extrapolation)地求当前帧的宽带/窄带的量化LSP参数的比,将求出的值作为当前帧的窄带-宽带变换系数来使用。
并且,虽然这里以包括稳定模式/非稳定模式的两个模式的模式为例进行了说明,但模式可以是三个以上。
另外,这里以频带可扩展编码的层为两个的情况,也就是由窄带和宽带的两个频带构成的频带可扩展编码或频带可扩展解码为例进行了说明,但本发明也可适用于由三个以上的频带(层)构成的频带可扩展编码或频带可扩展解码。
再有,这里以硬件构成本发明的情况为例进行了说明,但本发明也能够以软件实现。例如,通过以程序语言描述本发明的可扩展编码方法或可扩展解码方法的算法,并使该程序存储在存储器,由信息处理单元执行,由此能够实现与本发明的可扩展编码装置或可扩展解码装置相同的功能。
再有,上述各实施方式的说明中的各功能块可实现为一般作为集成电路的LSI。这些块既可是每个块分别集成到一个芯片,或者可以是部分或所有块集成到一个芯片。
并且,虽然此处称为LSI,但根据集成程度,可以称为IC、系统LSI、高级LSI(Super LSI)、或超级LSI(Ultra LSI)。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器来实现。在LSI制造后可利用可编程的FPGA(Field Programmable GateArray),或者可以使用可重构LSI内部的电路单元的连接或设定的可重构处理器。
再有,随着半导体的技术进步或随之派生的其他技术的出现,如果能够出现替代LSI集成回路化的新技术,当然可利用此技术进行功能块的集成化。并且存在着适用生物技术的可能性。
本说明书基于2004年4月27日提交的日本专利申请第2004-132113号和2004年9月6日提交的日本专利申请第2004-259036号。其内容都包含于此以资参考。
工业利用性
本发明的可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法适用于移动通信系统或使用因特网协议的分组通信系统等的通信装置的用途。

Claims (18)

1.一种可扩展编码装置,从输入信号生成在频率轴方向具有扩展性的窄带和宽带的量化LSP参数,该可扩展编码装置包括:
窄带编码单元,对窄带的输入信号的LSP参数进行编码,生成窄带的第一量化LSP参数;
变换单元,将所述第一量化LSP参数的频带变换为宽带;
宽带编码单元,使用变换为宽带后的所述第一量化LSP参数,进行对宽带的输入信号的LSP参数的编码,生成宽带的第二量化LSP参数;以及
计算单元,基于以前生成的所述第一和第二量化LSP参数之间的关系,计算出由所述变换单元使用的变换系数。
2.如权利要求1所述可扩展编码装置,其中,还包括:
限制器,对由所述计算单元计算出的变换系数进行修正,以使变换系数收纳于预定的范围内。
3.如权利要求1所述可扩展编码装置,其中,还包括:
平滑化单元,对由所述计算单元计算出的变换系数随时间进行平滑化。
4.如权利要求1所述可扩展编码装置,其中
所述计算单元还包括预先保持一个或多个变换系数的系数表,并根据所述输入信号的语音模式,来对基于以前生成的所述第一和第二量化LSP参数之间的关系而计算出的变换系数和所述系数表保持的变换系数进行切换并输出。
5.如权利要求4所述的可扩展编码装置,其中
基于窄带的所述第一量化LSP的时间变化来决定所述输入信号的语音模式。
6.如权利要求4所述的可扩展编码装置,其中
基于宽带的所述输入信号的LSP参数的时间变化来决定所述输入信号的语音模式。
7.如权利要求4所述的可扩展编码装置,其中
基于所述变换系数的变换增益来决定所述输入信号的语音模式。
8.如权利要求4所述的可扩展编码装置,其中
基于量化误差以闭环方式决定所述输入信号的语音模式。
9.如权利要求4所述的可扩展编码装置,其中
将所述输入信号的语音模式发送到解码装置。
10.如权利要求1所述的可扩展编码装置,其中,还包括:
加法单元,对由所述变换单元获得的所述第一量化LSP参数进行加法运算,
所述计算单元包括预先保持一个以上的变换系数的系数表,将基于以前生成的所述第一和第二量化LSP参数之间的关系而计算出的变换系数和所述系数表中保持的变换系数一起输出,
所述变换单元通过对所述第一量化LSP参数单独乘以从所述计算单元输出的至少两个所述变换系数,将所述第一量化LSP参数的频带变换为宽带,生成至少两个变换为宽带后的所述第一量化LSP参数,
所述加法单元对由所述变换单元变换为宽带的至少两个所述第一量化LSP参数进行加法运算,
所述宽带编码单元使用所述加法单元进行加法运算后的所述第一量化LSP参数,进行宽带的输入信号的LSP参数的编码,生成宽带的第二量化LSP参数。
11.如权利要求10所述的可扩展编码装置,其中,还包括:
乘法单元,分别对由所述变换单元变换为宽带的至少两个所述第一量化LSP参数单独地乘以规定的加权系数;以及
加权系数计算单元,计算在所述乘法单元使用的所述加权系数,
所述加法单元对由所述乘法单元乘以了所述加权系数的至少两个所述第一量化LSP参数进行加法运算,
所述加权系数计算单元基于所述第一量化LSP参数的误差敏感度,计算由所述乘法单元使用的所述加权系数。
12.一种通信终端装置,包括如权利要求1所述的可扩展编码装置。
13.一种基站装置,包括如权利要求1所述的可扩展编码装置。
14.一种可扩展解码装置,对在频率轴方向具有扩展性的窄带和宽带的量化LSP参数进行解码,该可扩展解码装置包括:
窄带解码单元,对窄带的量化LSP参数进行解码,生成窄带的第一LSP参数;
变换单元,将所述第一LSP参数的频带变换为宽带;
宽带解码单元,使用变换为宽带后的所述第一LSP参数进行宽带的量化LSP参数的解码,生成宽带的第二LSP参数;以及
计算单元,基于以前生成的所述第一和第二LSP参数之间的关系,计算由所述变换单元使用的变换系数。
15.一种通信终端装置,包括如权利要求14所述的可扩展解码装置。
16.一种基站装置,包括如权利要求14所述的可扩展解码装置。
17.一种可扩展编码方法,
在将对窄带的输入信号进行编码所获得的窄带量化LSP参数的频带变换为宽带时,基于以前的窄带量化LSP参数和与其对应的宽带量化LSP参数的关系,对各个帧自适应地进行所述变换。
18.一种可扩展解码方法,
在将对窄带量化LSP参数进行解码所获得的窄带LSP参数的频带变换为宽带时,基于以前的窄带LSP参数和与其对应的宽带LSP参数的关系,对各个帧自适应地进行所述变换。
CN2005800131755A 2004-04-27 2005-04-19 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法 Expired - Fee Related CN1947174B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP132113/2004 2004-04-27
JP2004132113 2004-04-27
JP2004259036 2004-09-06
JP259036/2004 2004-09-06
PCT/JP2005/007438 WO2005112005A1 (ja) 2004-04-27 2005-04-19 スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法

Publications (2)

Publication Number Publication Date
CN1947174A CN1947174A (zh) 2007-04-11
CN1947174B true CN1947174B (zh) 2012-03-14

Family

ID=35394383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800131755A Expired - Fee Related CN1947174B (zh) 2004-04-27 2005-04-19 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法

Country Status (8)

Country Link
US (1) US8271272B2 (zh)
EP (1) EP1755109B1 (zh)
JP (1) JP4546464B2 (zh)
KR (1) KR20070009644A (zh)
CN (1) CN1947174B (zh)
BR (1) BRPI0510303A (zh)
RU (1) RU2006137841A (zh)
WO (1) WO2005112005A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0510014B1 (pt) * 2004-05-14 2019-03-26 Panasonic Intellectual Property Corporation Of America Dispositivo de codificação, dispositivo de decodificação e método do mesmo
EP1785985B1 (en) * 2004-09-06 2008-08-27 Matsushita Electric Industrial Co., Ltd. Scalable encoding device and scalable encoding method
CN102237094B (zh) * 2005-10-12 2013-02-20 三星电子株式会社 处理/发送比特流以及接收/处理比特流的方法和设备
ATE548727T1 (de) * 2007-03-02 2012-03-15 Ericsson Telefon Ab L M Nachfilter für geschichtete codecs
JP5377287B2 (ja) * 2007-03-02 2013-12-25 パナソニック株式会社 ポストフィルタ、復号装置およびポストフィルタ処理方法
KR20100006492A (ko) * 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
CA2972808C (en) * 2008-07-10 2018-12-18 Voiceage Corporation Multi-reference lpc filter quantization and inverse quantization device and method
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
JP4977268B2 (ja) * 2011-12-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
US20120053949A1 (en) * 2009-05-29 2012-03-01 Nippon Telegraph And Telephone Corp. Encoding device, decoding device, encoding method, decoding method and program therefor
US8964966B2 (en) * 2010-09-15 2015-02-24 Avaya Inc. Multi-microphone system to support bandpass filtering for analog-to-digital conversions at different data rates
MY185091A (en) 2011-04-21 2021-04-30 Samsung Electronics Co Ltd Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium
CN105244034B (zh) * 2011-04-21 2019-08-13 三星电子株式会社 针对语音信号或音频信号的量化方法以及解码方法和设备
US9117455B2 (en) * 2011-07-29 2015-08-25 Dts Llc Adaptive voice intelligibility processor
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients
EP2830062B1 (en) 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
US20140307808A1 (en) * 2012-12-14 2014-10-16 Boris Kudryashov Protection against packet loss during transmitting video information
EP3742440B1 (en) * 2013-04-05 2024-07-31 Dolby International AB Audio decoder for interleaved waveform coding
CN104143336B (zh) * 2013-05-29 2015-12-02 腾讯科技(深圳)有限公司 一种获取语音信号的平滑谱的方法和装置
EP3399522B1 (en) * 2013-07-18 2019-09-11 Nippon Telegraph and Telephone Corporation Linear prediction analysis device, method, program, and storage medium
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
JP6270992B2 (ja) * 2014-04-24 2018-01-31 日本電信電話株式会社 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、プログラム及び記録媒体
EP3139383B1 (en) * 2014-05-01 2019-09-25 Nippon Telegraph and Telephone Corporation Coding and decoding of a sound signal
JP6270993B2 (ja) * 2014-05-01 2018-01-31 日本電信電話株式会社 符号化装置、及びその方法、プログラム、記録媒体
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10824917B2 (en) 2018-12-03 2020-11-03 Bank Of America Corporation Transformation of electronic documents by low-resolution intelligent up-sampling

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3237089B2 (ja) * 1994-07-28 2001-12-10 株式会社日立製作所 音響信号符号化復号方法
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
TW326070B (en) * 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3134817B2 (ja) 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
CA2429832C (en) * 2000-11-30 2011-05-17 Matsushita Electric Industrial Co., Ltd. Lpc vector quantization apparatus
JP2003241799A (ja) 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KOISHIDA K ET AL."Enhancing MPEG-4 celp by jointly optimized inter/intra-frame LSP predictors.SPEECH CODING, 2000. PROCEEDINGS.2000,90-92. *
KOISHIDAKETAL."EnhancingMPEG-4celpbyjointlyoptimizedinter/intra-frameLSPpredictors.SPEECHCODING 2000. PROCEEDINGS.2000

Also Published As

Publication number Publication date
RU2006137841A (ru) 2008-05-10
BRPI0510303A (pt) 2007-10-02
EP1755109A4 (en) 2008-04-02
US20070223577A1 (en) 2007-09-27
KR20070009644A (ko) 2007-01-18
JPWO2005112005A1 (ja) 2008-03-27
EP1755109B1 (en) 2012-08-15
JP4546464B2 (ja) 2010-09-15
WO2005112005A1 (ja) 2005-11-24
US8271272B2 (en) 2012-09-18
CN1947174A (zh) 2007-04-11
EP1755109A1 (en) 2007-02-21

Similar Documents

Publication Publication Date Title
CN1947174B (zh) 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
CN106462557B (zh) 重采样音频信号的方法、设备、编/解码器及存储介质
CN102394066B (zh) 语音编码装置、解码装置和语音编码方法、解码方法
TWI407432B (zh) 用於可縮放的語言及音頻編碼之方法、器件、處理器及機器可讀媒體
CN101903945B (zh) 编码装置、解码装置以及编码方法
RU2557455C2 (ru) Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
CN101076853B (zh) 宽带编码装置、宽带线谱对预测装置、频带可扩展编码装置以及宽带编码方法
Skoglund et al. Improving Opus low bit rate quality with neural speech synthesis
KR101853352B1 (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
CN104025189B (zh) 编码语音信号的方法、解码语音信号的方法,及使用其的装置
KR102222838B1 (ko) 다른 샘플링 레이트들을 가진 프레임들간의 전환시 사운드 신호의 선형 예측 인코딩 및 디코딩을 위한 방법, 인코더 및 디코더
CN101622662A (zh) 编码装置和编码方法
CN101395661A (zh) 音频编码和解码的方法和设备
JP6812504B2 (ja) 音声符号化方法および関連装置
KR20060131782A (ko) 최적의 다중 부호화 방법
CN101847414B (zh) 用于语音编码的方法和设备
CN103915100A (zh) 一种编码模式切换方法和装置、解码模式切换方法和装置
KR100480341B1 (ko) 광대역 저전송률 음성 신호의 부호화기
Yeh et al. An efficient complexity reduction algorithm for G. 729 speech codec
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
Cuperman et al. Backward adaptive configurations for low-delay vector excitation coding
KR100463577B1 (ko) 음성 부호화기용 선스펙트럼주파수 벡터 양자화 장치
Garrido et al. Towards iLBC speech coding at lower rates through a new formulation of the start state search
Chang et al. Vector sum codebook structure for variable rate coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140716

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140716

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170524

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: California, USA

Patentee before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120314

CF01 Termination of patent right due to non-payment of annual fee