CN1055585C - 代码激励线性预测编码器和译码器 - Google Patents

代码激励线性预测编码器和译码器 Download PDF

Info

Publication number
CN1055585C
CN1055585C CN95119729A CN95119729A CN1055585C CN 1055585 C CN1055585 C CN 1055585C CN 95119729 A CN95119729 A CN 95119729A CN 95119729 A CN95119729 A CN 95119729A CN 1055585 C CN1055585 C CN 1055585C
Authority
CN
China
Prior art keywords
signal
code table
code
sound
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN95119729A
Other languages
English (en)
Other versions
CN1132423A (zh
Inventor
青柳弘美
有山义博
细田贤一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Publication of CN1132423A publication Critical patent/CN1132423A/zh
Application granted granted Critical
Publication of CN1055585C publication Critical patent/CN1055585C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

目的旨在在低编码速度下也可以得到高品质的再生声音信号。将包含在编码声音信号中的声道预测信号取为LSP系数。选择使用杂音码表106和脉冲性码表107,在该选择激励信号ec中反映出原声音信号S的频率特性。根据声音功率P对自适应激励信号ea和选择激励信号ev进行增益控制。

Description

代码激励线性预测编码器和译码器
本发明涉及按照代码激励线性预测(CE、LP)编码方式的编码器和译码器,例如,可以适用于具有所谓的留守录音功能的电话机。
在具有留守录音功能的电话机中,以往,多数是使用盒式磁带作为记录呼叫者或被呼叫者的信息的记录媒体。
但是,当作为记录媒体使用盒式磁带时,信息的记录再生结构将占据很多空间,另外,当有多个信息时,存在找到想听的信息的开头需要一定的时间以及信息单位的消去是困难的等问题。
因此,作为信息的记录媒体已提出了使用半导体存储器(IC存储器)的方案。这样,在使用IC存储器作为信息记录媒体时,若想能够用尽可能简单的结构记录很多信息,最好使用将声音信号压缩后进行记录、再生时进行扩展的压缩编码方式。
如所周知,作为对声音信号的高效率压缩编码方式,有代码激励线性预测编码方式。代码激励线性预测编码方式是为了声音信号的狭义的传送而提出的,是以很少的传送量在译码一侧能够再生尽可能忠实于输入声音信号的声音信号。
但是,在具有留守录音功能的电话机中,作为信息的记录再生用的压缩编码方式,使用现有的代码激励线性预测编码方式时,不能满足与留守录音功能相关联的各种要求。
因此,对于迄今代码激励线性预测编码方式不适用的具有留守录音功能的电话机等装置,为了能够适用而在寻求合适的代码激励线性预测编码器和译码器。
为了解决上述问题,在第1个本发明中,使用以下各部分构成代码激励线性预测编码器。
即,由(1)声道信息生成器、(2)声音功率量化器、(3)自适应码表、(4)噪音码表、(5)脉冲码表、(6)固定激励信号选择器、(7)频率特性操作器、(8)增益码表、(9)加法器、(10)最佳激励信号搜索器和(11)编码声音信号形成器构成。声道信息生成器根据原声音信号或局部再生的合成声音信号得到LPC系数、将其变换为LSP系数后进行量化,同时将该量化的LSP系数进行反量化,恢复为LPC系数;声音功率量化器计算原声音信号的功率、并进行量化和反量化处理;自适应码表自适应地输出更新的自适应激励信号;噪音码表输出噪音性激励信号;脉冲码表输出脉冲性激励信号;固定激励信号选择器选择噪音码表和脉冲码表的激励信号;频率特性操作器将固定激励信号选择器输出的噪音性激励信号或脉冲性激励信号变换为具有与原声音信号相似的频率特性;增益码表输出与从自适应码表输出的自适应激励信号和从频率特性操作器输出的噪音激励信号或脉冲性激励信号对应的、由声音功率量化器输出的反量化功率决定的激励增益;加法器将进行了增益控制的从自适应码表输出的自适应激励信号和从频率特性操作器输出的噪音性激励信号或脉冲性激励信号进行加法运算,形成最终的激励信号;最佳激励信号搜索器根据从声道信息生成器输出的LPC系数和加法器输出的最终的激励信号,确定使用从自适应码表、噪音码表、脉冲码表和增益码表输出的最佳激励信号还是使用噪音码表和脉冲码表中的哪一个码表的输出激励信号;编码信号形成器在确定了最佳激励信号时,根据各种码表的指数、固定激励信号选择器的选择状态指数、声音功率量化器的量化功率和声道信息生成器的量化LSP系数形成编码声音信号。
另外,本发明的第2个代码激励线性预测译码器的特征在于:与本发明的第1个代码激励线性预测编码器对应,由以下各部分构成。
即,由(1)编码声音信号分离器、(2)声道信息再生器、(3)声音功率反量化器、(4)自适应码表、(5)噪音码表、(6)脉冲码表、(7)固定激励信号选择器、(8)频率特性操作器、(9)增益码表、(10)加法器和(11)再生声音信号形成器。编码声音信号分离器将编码声音信号分离为各种信息;声道信息再生器将分离的量化LSP系数进行反量化处理,恢复为LPC系数;声音功率反量化器将分离的量化功率进行反量化处理;自适应码表输出与分离的自适应激励信号指数对应的自适应激励信号;噪音码表在分离了噪音激励信号指数时输出与该指数对应的噪音性激励信号;脉冲码表在分离了脉冲性激励信号指数时,输出与该指数对应的脉冲性激励信号;固定激励信号选择器根据分离的选择状态指数选择噪音码表和脉冲码表的激励信号;频率特性操作器将从该固定激励信号选择器输出的噪音性激励信号或脉冲性激励信号变换为具有与原声音信号相似的频率特性;增益码表输出与从自适应码表输出的自适应激励信号和从频率特性操作器输出的噪音性激励信号或脉冲性激励信号对应、的由从声音功率反量化器输出的反量化功率和分离的激励增益确定的激励增益;加法器将从进行过增益控制的自适应码表输出的自适应激励信号和从频率特性操作器输出的噪音性激励信号或脉冲性激励信号进行加法运算,形成最终的激励信号;再生声音信号形成器根据从声道信息再生器输出的LPC系数和从加法器输出的最终的激励信号形成再生声音信号。
本发明的第3个特征在于:在至少具有自适应码表的代码激励线性预测编码器中,具有指数变换器,在指示了音调控制模式时,该指数变换器将按照自适应码表确定的自适应激励信号指数,变换为固定的自适应激励信号指数,并供给编码声音信号形成器以使编码声音信号中含有固定的自适应激励信号指数。
本发明的第4个特征在于:在至少具有自适应码表的代码激励线性预测译码器中,具有指数变换器,在指示了音调控制模式时,该指数变换器将按照将编码声音信号分离后得到的自适应码表确定的自适应激励信号指数,变换为固定的自适应激励信号指数并供给自适应码表。
本发明的第5个特征在于:在按照代码激励线性预测编码方式对输入的原声音信号进行编码的代码激励线性预测编码器中,具有再生速度控制器,在指示了再生速度控制模式时,该再生速度控制器根据指示的变倍率和原声音信号具有的周期性对原声音信号进行间抽或内插处理,并供给编码处理器。
本发明的第6个特征在于:在具有根据输入的编码声音信号形成激励信号的激励信号再生器,根据输入的编码声音信号形成声道预测系数的声道信息再生器,和根据激励信号再生器的激励信号和声道信息再生器的声道预测系数形成再生声音信号的再生声音信号形成器的代码激励线性预测译码器中,具有再生速度控制器,在指示了再生速度控制模式时,该再生速度控制器根据指示的变倍率和激励信号具有的周期性,对激励信号再生器的激励信号进行间抽或内插处理并供给再生声音信号形成器。
本发明的第7个特征在于:在具有根据输入的编码声音信号形成激励信号的激励信号再生器,根据输入的编码声音信号形成声道预测系数的声道信息再生器,和根据激励信号再生器的激励信号和声道信息再生器的声道预测系数形成再生声音信号的再生声音信号形成器的代码激励线性预测译码器中,在再生声音信号形成器的后级设有向再生声音信号中加进白色噪音的白色噪音添加器。
本发明的第1代码激励线性预测编码器和本发明的第2代码激励线性预测译码器旨在实现低编码速度,具有对称的结构。因此,下面归纳起来说明其作用。
作为编码声音信号中包含的声道预测系数,使用LSP系数。其理由在于对声道的频率特性的内插特性好,LSP系数即使利用很少的编码位数进行编码,也比LPC系数等引起声道频谱的畸变小,通过与矢量量化方法组合,可以进行高效率的编码。
另外,作为码表,除了一般的自适应码表和噪音码表外,还设有脉冲码表和增益码表,有选择地使用噪音码表和脉冲码表对所选择的噪音性激励信号或脉冲性激励信号进行操作,可以具有与原声音信号相似的频率特性。
之所以有选择地使用噪音码表和脉冲码表,在于对周期性的很强的有声音的前沿和脉冲性明确的有声音的稳定部分的贡献,以及即使使用脉冲性激励信号也可以适应低编码速度。即,即使在分配的位数少的情况下,也可以形成良好的激励信号。之听以进行频率特性操作,在于激励信号的频率特性虽然在理论上是作为白色而模式化的,但是,实际上并不是白色的,具有与原声音信号的频率特性相近的特性,只要使噪音性激励信号及脉冲性激励信号的频率特性与原声音信号的频率特性靠近,就可以得到高品质的再生声音信号,另外,激励信号的有效频率成分远远大于量化误差信号,可以获得量化误差信号的掩蔽效果。之所以进行增益控制,在于在编码位数的限制大的情况下,虽然不能使激励信号的长度大,但是,在这种情况下,通过引入与声音功率对应的增益控制,可以实现高品质。
根据上述理由,在本发明的第1代码激励线性预测编码器和第发明的第2代码激励线性预测译码器中,利用低编码速度编码声音信号可以获得高品质的再生声音信号。
本发明的第3代码激励线性预测编码器和本发明的第4代码激励线性预测译码器都使再生声音信号的音调可变,前者不改变译码器一侧,利用编码器一侧的处理使再生声音信号的音调可变,后者不改变编码器一侧,利用译码器一侧的处理使再生声音信号的音调可变。
从自适应码表输出的自适应激励信号的指数,粗略地说来,受声音信号的频率的影响最大,如果将指数固定,基本上就可以使再生声音信号的频率(音调)固定。因此,考虑到不给其他各部分以影响,在本发明的第3代码激励线性预测编码器中,在编码声音信号的形成器之前,另外,在本发明的第4代码激励线性预测译码器中,在将从编码声音信号分离出来的指数供给自适应码表的路径中,设有指数变换器,用于将按照自适应码表确定的自适应激励信号指数变换为固定的自适应激励信号指数。
本发明的第5代码激励线性预测编码器和本发明的第6代码激励线性预测译码器都可以使原声音信号具有的速度变为再生声音信号的速度,前者不改变译码器一侧,利用编码器一侧的处理使再生声音信号的速度可变,后者不改变编码器一侧,利用译码器一侧的处理使再生声音信号的速度可变。
为了使再生速度可变,可从对采样进行间抽或内插处理。只要简单地进行间抽或内插,就容易产生不连续点。因此,考虑到信号的周期性,可以以其周期为单位进行间抽或内插。这里,最好使速度变换尽可能对其他结构不产生影响,并且,还希望将再生声音信号的品质的降低限制到最小限度。因此,在本发明的第5代码激励线性预测编码器中,在原声音信号的输入级,或者,在本发明的第6代码激励线性预测译码器中,在将激励信号供给再生声音信号形成器的路径中,设有根据指示的变倍率和处理对象信号具有的周期性对处理对象信号进行间抽或内插处理的再生速度控制器。
本发明的第7代码激励线性预测译码器是考虑到随着成为低编码速度再生声音信号中的噪音成分容易形成颤噪杂音而构成的(在本说明书中,将被白色噪音调制而变为与白色噪音不同的影响耳听的音色的现象称为杂音,以后将该影响耳听的噪音称为颤噪杂音)。若将白色噪音加到颤噪杂音内,颤噪杂音就变得不明显,并接近于自然的声音信号。因此,本发明的第7代码激励线性预测译码器在再生声音信号形成器的后级,设有向再生声音信号中添加白色噪音的白色噪音添加器。
图1是代码激励线性预测编码器的第1实施例的框图。
图2是代码激励线性预测译码器的第1实施例的框图。
图3是代码激励线性预测编码器的第2实施例的框图。
图4是代码激励线性预测译码器的第2实施例的框图。
图5是代码激励线性预测编码器的第3实施例的框图。
图6是间抽/内插操作器132的操作说明图(之一)。
图7是间抽/内插操作器132的操作说明图(之二)。
图8是代码激励线性预测译码器的第3实施例的框图。
图9是代码激励线性预测译码器的第4实施例的框图。
101...声道分析器、102...声道预测系数量化器、
103,213...合成滤波器、104...帧功率量化器、
105,204...自适应码表、106,205...杂音码表、
107,206...脉冲码表、108,207...增益码表、
109,209...矢量变换器、
110,111,210,211...乘法器
112,212,241...加法器
113,208...固定激励矢量选择开关
114...加权距离计算器、115...码表检索器
116,201...存储器接口、120,220...指数变换器
130,230...缓冲存储器、131,231...周期性分析器
132,232...间抽/内插操作器
202...声道预测系数反量化器
203...帧功率反量化器、214...后置滤波器
240...杂音发生器
【实施例】
(A)代码激励线性预测编码器的第1实施例
图1是本发明的代码激励线性预测编码器的第1实施例,可以将编码声音信号存贮到例如带留守录音功能的电话机的IC存储器内。
该代码激励线性预测编码器的第1实施例和后面所述的代码激励线性预测译码器的第1实施例,为了能够将很多信息存储到IC存储器内,着眼于低编码速度(例如,4kbit/s)。
在图1中,从输入端子100按帧单位归纳作为矢量而输入的原声音矢量(原声音信号)S输入帧功率量化器104。帧功率量化器104计算原声音矢量S的功率后进行量化处理,将其指数Io向存储器接口116输出,同时,计算反量化值P后,向增益码表108输出。
另外,原声音矢量S输入声道分析器101,计算声道预测系数(LPC系数)a,并向声道预测系数量化器102传送。声道预测系数量化器102将LPC系数a变换为LSP(Line Spectrum Pair)系数后进行量化处理,并将其指数Ic向存储器接口116输出。另外,声道预测系数量化器102根据指数Ic计算LSP系数的反量化值,变换为LPC系数aq后,向合成滤波器103和矢量变换器109输出。
这里,作为记录码(编码声音信号)中包含的声道预测系数,之所以使用LSP系数在于,对声道的频率特性的内插特性好,即使在很少的编码位数下进行编码,LSP系数也比LPC系数等引起声道频谱的畸变小,通过与矢量量化方法组合,可以进行高效率的编码。
合成滤波器103根据局部再生的LPC系数aq和加法器112输出的激励矢量(激励信号)e计算合成声音矢量(局部再生的合成声音信号)Sw,并向加权距离计算器114输出。
搜索该局部再生的合成声音矢量Sw,找出其最接近于原声音矢量S的最佳激励矢量e,这时的各种码表105~108的指数等包含在记录码内。
另外,与例如按每帧求声道预测系数及帧功率的情况相反,后面所述的最佳的激励信号e的搜索则按将1帧分割为多个的子帧单位进行。
在本实施例的情况下,作为码表,设有自适应码表105、噪音码表106、脉冲码表107和增益码表108。
自适应码表105、噪音码表106和脉冲码表107分别存储着关于激励信号的波形代码矢量(作为激励信号的自适应激励矢量、噪音激励矢量、脉冲性激励矢量),增益码表108存储着关于自适应激励矢量和固定激励矢量(将噪音性激励矢量和脉冲性激励矢量合并的称呼)的增益代码。
自适应激励矢量和噪音激励矢量分别和以往一样,是在统计上对周期性强的有声音有贡献的波形激励矢量,和在统计上对周期性弱的随机的无声音有贡献的波形激励矢量。另外,自适应码表105的自适应激励矢量如后面所述的那样进行自适应地更新。脉冲性激励矢量是由孤立脉冲构成的波形激励矢量。脉冲性激励矢量是考虑了对周期性强的有声音的前沿及脉冲性明确的有声音的稳定部分的贡献。增益代码例如进行矢量量化处理,代码的一部分是关于自适应激励矢量的增益的代码,另一部分是关于固定激励矢量的增益的代码(二维量化表)。
另外,脉冲性的声源信号是具有周期性的单纯的信号,所以,也可以认为是脉冲信号发生器发生的,但是,最好是如本实施例那样,进行编码后从码表107读出来发生。其理由为下,即,容易和自适应码表105的输出同步,另外,通过采用和噪音码表106相同的书卷结构,如后面所述的那样,选择噪音激励矢量或脉冲性激励矢量后归纳到记录码内时的多路处理等就容易了。
使用这样的各种激励矢量,求出局部再生的合成声音矢量Sw与原声音矢量S最相似的,关于各种激励矢量的最佳激励矢量后,将其指数供给存储器接口116,纳入到记录码(编码声音信号)内,存储到图中未示出的IC存储器中。由于本实施例着眼于低编码速度,所以,对于固定激励矢量,选择噪音激励矢量或脉冲性激励矢量并记录其指数。因此,选择某一个作为固定激励矢量的选择信息也包含在记录码内。
这种最佳激励矢量的搜索(包括噪音激励矢量或脉冲性激励矢量的选择处理),这里假定按照自适应激励矢量、噪音激励矢量、脉冲性激励矢量、增益代码的顺序执行而进行说明。另外,只要能够得到最佳的自适应激励矢量、噪音激励矢量、脉冲性激励矢量和增益代码,该搜索顺序等不限于以下的说明。
在进行最佳的内适应激励矢量的搜索时,令噪音码表106和脉冲性码表107的输出为0,另外,乘法器110进行乘以合适值的增益系数bk(例如1)的乘法运算。在这样的状态下,按时间顺序或者并行地输出存储在自适应码表105内的所有的自适应激励矢量eai,作为激励矢量通过乘法器110和加法器112输给合成滤波器103。合成滤波器103将LPC系数aq作为分支系数对该激励矢量ea(eai)进行卷积处理,作为声源参量对所有的自适应激励矢量eai(i=1~n)求只反映自适应激励矢量eai的内容的合成声音矢量(这里,用Swi表示)。
带权重的距离计算器114进行原声音矢量S与各候补的合成声音矢量Swi的减法运算,进而进行频率的加权之后,对各候补的矢量计算各成分的平方和ew(ewi),并向码表检索器115输出。码表检索器115将与n个平方和ewi中的最小值对应的最小的自适应激励矢量ea确定为最佳的自适应激励矢量。
然后,进行最佳的噪音激励矢量的搜索。在进行该搜索时,将固定激励矢量选择开关113切换到噪音码表106一侧,令自适应码表105的输出为0(输出最佳自适应激励矢量也可以),另外,乘法器111进行乘以合适值的增益系数gk(例如1)的乘法运算。在这样的状态下,按照时间顺序或者并行地输出存储在噪音码表106内的所有的噪音激励矢量esj(j=1~m),并通过固定激励矢量选择开关113输入到矢量变换器(频率特性操作器)109中。
矢量变换器109根据LPC系数aq和最佳自适应激励矢量指数Ia,将输入的各噪音激励矢量esj的频率特性与噪音激励矢量的时间长度对应地变换为靠近原声音矢量S的频率特性。这样进行过频率特性变换操作的所有的噪音激励矢量ev(evj)通过乘法器111和加法器112作为激励矢量e(ej)供给合成滤波器103。
以后,进行和最佳的自适应激励矢量的搜索相同的处理,码表检索器115确定最佳的噪音激励矢量es。
这里,之所以设置矢量变换器109,在于以下的理由。以往,激励矢量的频率特性在理论上是作为白色而模式化的,但是,实际上并不是白色的,实验上已经确认具有与原声音矢量S的频率特性相近的特性。因此,只要使噪音激励矢量和脉冲性激励矢量的频率特性与原声音矢量S的频率特性接近,就可以得到那样高品质的合成声音矢量,另外,激励矢量的有效频率成分远远大于量化误差信号,从而可以得到量化误差信号的掩蔽效果。因此,设置矢量变换器109。这里,作为表示原声音矢量S的频率特性的信息有LPC系数ac,另外,还有表示音调预测信息的最佳的自适应激励矢量的信息(包括与其对应的增益)Ia。因此,矢量变换器109根据这些信息进行噪音激励矢量及脉冲性激励矢量的频率特性的操作。
这样,当最佳的噪音激励矢量的搜索结束时,接着就进行最佳的脉冲性激励矢量的搜索。在进行该搜索时,将固定激励矢量选择开关113切换到脉冲性码表107一侧,令自适应码表105的输出为0(也可以输出最佳自适应激励矢量),另外,乘法器111进行乘以合适值的增益系数gk(例如1)的乘法运算。在这样的状态下,按照时间顺序或者并行地输出存储在脉冲性码表107内的所有的脉冲性激励矢量epk(k=1~m)。以后的处理和进行最佳的噪音激励矢量的搜索时一样,所以,说明从略。
这样,当确定了最佳的脉冲性激励矢量ep时,码表检索器115将最佳的噪音激励矢量es的平方和ew与最佳的脉冲性激励矢量ep的平方和ew进行比较,将平方和ew小的确定为记录的固定激励矢量的信息。
此后,进行最佳的增益代码的搜索。在进行该增益代码的搜索时,从自适应码表105输出最佳的自适应激励矢量ea,将固定激励矢量选择开关113切换到所选择的噪音码表106或脉冲性码表107一侧,从选择的固定码表106或107输出最佳的固定激励矢量es或ep。从增益码表108输出的1个增益代码由自适应激励矢量用的增益和固定激励矢量用的增益构成,在这些增益中反映出帧功率P之后,将自适应激励矢量用的增益bk(k=1~t)输给乘法器110,将固定激励矢量用的增益gk输给乘法器111。这样,便由加法器112对进行过增益控制的最佳自适应激励矢量与进行过频率特性操作和增益控制的最佳固定激励矢量进行加法运算,并作为激励矢量e输给合成滤波器103。对增益码表108内的所有的增益代码按照时间顺序或者并行地进行这样的处理。带权重的合成滤波器103以后的搜索时的处理,和进行各种激励矢量的搜索时的处理一样。
当码表检索器115得到最佳自适应激励矢量、最佳固定激励矢量和最佳增益代码时,就将它们的指数Ia、Is或者Ip、和Ig供给存储器接口116,同时,也将表示选择噪音激励矢量和脉冲性激励矢量中的哪一个的固定代码选择开关信息Iw供给存储器接口116。
存储器接口116将关于这些激励源的信息Ia、Is或者Ip、Ig和Iw、上述LSP系数量化信自Ic和帧功率信息Io进行多路变换,变换为符合与外部连接的IC存储器的存储形式的信号M后,从输出端子117输出。
另外,码表检索器115将供给存储器接口116的指数和固定代码选择开关信息输给对应的码表(105和108、106或者107)及固定代码选择开关113。这时,开关113进行切换,从各码表输出最佳激励矢量及最佳代码。这样,就从加法器112输出在进行本次的帧处理时也可以形成最接近于原声音矢量S的合成声音矢量Sw的激励矢量e(eo),并将其供给自适应码表105。并且,自适应码表105进行自适应激励矢量cai的更新处理。
以上的编码处理,对每帧及子帧反复进行,编码声音信号M顺序记录到IC存储器内。
另外,对于带留守录音功能的电话机,在记录其所有者(被呼叫者)外出时的留言的信息时和记录呼叫者向外出的使用者传达的信息时,这样的编码处理根据控制整个电话机的控制器(CPU)的指令进行。
因此,按照上述第1实施例的代码激励线性预测编码器,在低编码速度下也可以得到高品质的再生声音,可以将大量的信息存储到IC存储器内。
下面,具体地说明在低编码速度下也可以得到高品质的再生声音。
(1)当采用低编码速度时,由于分配给声源参量(激励信号)的编码位数少,所以,准备的固定激励矢量也少,难于明确地再生原声音矢量S中包含的脉冲性噪音,在本实施例的情况下,由于利用了脉冲性激励矢量,所以,可以提高这时的声音的再生品质。
另外,由于是在切换脉冲性激励矢量和噪音激励矢量后使用的,所以,可以与低编码速度对应,同时,可以提高对象有声音的过渡部分那样的、随机信号和脉冲的信号混合存在的信号的再生品质。
(2)当采用低编码速度时,不仅对声源参量的编码位数少,而且对声道参量的编码位数也少。在本实施例的情况下,即使以少的编码位数进行编码,也可以记录比LPC系数等引起的声道频谱畸变小的LSP系数的信息,所以,可以提高再生品质。
(3)如上述那样,由于考虑到实际的激励信号(对应激励矢量e)具有与输入声音信号(对应原声音矢量S)的频率特性相近的频率特性而设有矢量变换器109,所以,实际上可以相应地提高再生品质,同时,具有对伴随该变换的量化误差信号的掩蔽效果,从而可以提高再生品质。
(B)代码激励线性预测译码器的第1实施例
下面,参照附图详细说明本发明的代码激励线性预测译码器的第1实施例。本实施例与图1所示的代码激励线性预测编码器的第1实施例对应,具有图2的框图所示的结构。
在图2中,第1实施例的代码激励线性预测译码器由存储器接口201、声道预测系数反量化器202、帧功率反量化器203、自适应码表204、噪音码表205、脉冲码表206、增益码表207、固定激励矢量选择开关208、矢量变换器209、乘法器210,211、加法器212、合成滤波器213和后置滤波器214构成。
从IC存储器读出并从输入端子200输入该代码激励线性预测译码器的编码声音信号M,输入存储器接口201。存储器接口201将该编码声音信号M分离为LSP系数的量化信息Ic、帧功率信息Io、最佳自适应激励矢量ea的指数Ia、最佳固定激励矢量es或ep的指数Is或Ip、最佳增益代码的指数Ig和固定激励矢量选择开关信息Iw。并且,将LSP系数的量化信息Ic供给声道预测系数反量化器202,将帧功率信息Io供给帧功率反量化器203,将最佳自适应激励矢量ea的指数Ia供给自适应码表204和矢量变换器209,将最佳增益代码的指数Ig供给增益码表207,将固定激励矢量选择开关信息Iw供给固定激励矢量选择开关208。另外,将最佳固定激励矢量es或ep的指数Is或Ip供给根据固定激励矢量选择开关信息Iw确定的噪音码表205或脉冲码表206。
声道预测系数反量化器202将供给的经过编码的LSP系数进行译码(例如,进行矢量反量化处理),再变换为LPC系数aq。这样变换的LPC系数aq,作为声道预测系数信息供给矢量变换器209、合成滤波器213和后置滤波器214。
帧功率反量化器203根据帧功率信息Io,求帧功率反量化值(再生的帧功率)P,并供给增益码表207。
增益码表207将帧功率P在由供给的指数Ig确定的自适应激励矢量用和固定激励矢量用的增益代码中反映出来,分别将增益代码b、g供给自适应激励矢量用的乘法器210和固定激励矢量用的乘法器211。
自适应码表204输出由供给的指数Ia确定的自适应激励矢量ea,该自适应激励矢量ea通过乘法器210进行增益控制,并供给加法器212。
噪音码表205或脉冲码表206通过固定激励矢量选择开关208将与供给的指数Is或Ip对应的噪音激励矢量es或脉冲性激励矢量ep输出给矢量变换器209,矢量变换器209根据LPC系数aq、自适应激励矢量es的指数Is进行其频率特性操作。这样,经过频率特性操作的固定激励矢量ev由增益控制器211进行增益控制后输给加法器212。
加法器212将供给的自适应激励矢量和固定激励矢量进行加法运算后,将其加法信号作为激励矢量e供给合成滤波器213。合成滤波器213将该激励矢量e利用LPC系数aq进行卷积得到合成声音矢量Sw后,输给后置滤波器214。后置滤波器214对合成声音矢量Sw进行与听觉特性对应的频率变换后,作为再生声音矢量Sp从输出端子215输出。
另外,从加法器212输出的激励矢量e也输给自适应码表204。这时,自适应码表204使用该激励矢量e进行自适应激励矢量的更新。
代码激励线性预测译码器在每次供给编码声音信号时,即对每帧(对于激励信号就是对每子帧)进行上述处理。
因此,按照该第1实施例的代码激励线性预测译码器,由于具有处理供给的LSP系数的结构,作为声源有脉冲码表206,具有使固定声源的频率特性与输入声音信号的频率特性接近的矢量变换器209,所以,据此便可使上述第1实施例的代码激励线性预测编码器的效果实际有效。
(C)代码激励线性预测编码器的第2实施例
图3是本发明的代码激励线性预测编码器的第2实施例,是可以将编码声音信号存储到例如带留守录音功能的电话机的IC存储器内的例子。在图3中,对于和图1相同及对应的部分标以相同的符号。
第2实施例的代码激励线性预测编码器,是以使用上述第1实施例的代码激励线性预测译码器作为译码器为前提的。
第2实施例的代码激励线性预测编码器和后面所述的第2实施例的代码激励线性预测译码器着眼于使再生声音矢量的周期性(声音的高度)保持一定。
根据图3与图1的比较可知,第2实施例的代码激励线性预测编码器是在第1实施例的结构中增加了指数变换器120。音调控制信号con1和最佳自适应激励矢量ea的指数Ia输入该指数变换器120。当音调控制信号con1指示音调的非控制状态时,指数变换器120就使最佳自适应激励矢量ea的指数Ia直接通过,供给存储器接口116,当音调控制信号con1指示音调的控制状态时,就与最佳自适应激励矢量ea的指数Ia无关地发生固定的指数Iac,并供给存储器接口116。
这里,自适应码表105的指数Ia是表示声音信号的周期性(声音的高度)的信息的参量。声音信号的周期随讲话人而异,另外,即使同一个讲话者,也会由于讲话时的抑扬顿挫等而随时间变化。通过使固定的指数Iac包含在编码声音信号M中,使声音信号的周期总是固定为某一恒定的值,由第1实施例的代码激励线性预测译码器(参见图2)再生的声音信号就成为声音的高度不变的机器人的声音。
对于带留守录音功能的电话机,还要求对付无用电话。作为满足这一要求的一个方法,使被呼叫者的信息声音信号成为机器人的声音信号是有效的。因此,设置这种动作模式的选择操作按钮,当操作了该选择操作按钮时,控制整个电话机的控制器(CPU)就将指示音调的控制状态的音调控制信号con1供给指数变换器120,将与最佳自适应激励矢量ea的指数Ia无关的固定的指数Iac包含在编码声音信号M中进行存储,在进行再生时便可输出音调基本上一定的声音信号。
按照上述第2实施例的代码激励线性预测编码器,也可以得到与第1实施例的代码激励线性预测编码器相同的效果,另外,在进行再生时,还可以获得可以适当地形成音调基本上一定的声音信号的效果。
(D)代码激励线性预测译码器的第2实施例
图4是本发明的代码激励线性预测译码器的第2实施例。在图4中,和图2相同及对应的部分,标以相同的符号。第2实施例的代码激励线性预测译码器,是以使用上述图2所示的第1实施例的代码激励线性预测编码器作为编码器为前提的
由图4与图2的比较可知,第2实施例的代码激励线性预测译码器是在第1实施例的结构中增加了指数变换器220。音调控制信号con1和存储器接口201把从编码声音信号M中分离的最佳自适应激励矢量ea的指数Ia输入该指数变换器220。当音调控制信号con1指示音调的非控制状态时,指数变换器220就使最佳自适应激励矢量ea的指数Ia直接通过供给自适应码表204和矢量变换器209,当音调控制信号con1指示音调的控制状态时,就发生与最佳自适应激励矢量ea的指数Ia无关的固定的指数Iac并供给自适应码表204和矢量变换器209。
因此,当音调控制信号con1指示音调的非控制状态时,第2实施例的代码激励线性预测译码器就使用已分离的最佳自适应激励矢量ea的指数Ia进行译码,当音调控制信号con1指示音调的控制状态时,就使用固定指数Iac取代已分离的最佳自适应激励矢量ea的指数Ia进行译码。
结果,在信息声音信号的记录中,即使不进行音调控制,在进行再生时,对于第2实施例的代码激励线性预测编码器,由于和上述相同的理由,也可以适当地输出音调基本上一定的声音信号。
按照上述第2实施例的代码激励线性预测译码器,也可以得到和第1实施例的代码激励线性预测译码器相同的效果,另外,还可以获得可以适当地形成音调基本上一定的声音信号的效果。
(E)代码激励线性预测编码器的第3实施例
图5是本发明的代码激励线性预测编码器的第3实施例。在图5中,和图1相同及对应的部分标以相同的符号。
第3实施例的代码激励线性预测编码器是以使用上述第1实施例的代码激励线性预测译码器(图2)作为译码器为前提的。
第3实施例的代码激励线性预测编码器和第3实施例的代码激励线性预测译码器是着眼于可以任意选择再生声音矢量的再生速度。
由图5与图1的比较可知,第3实施例的代码激励线性预测编码器是在第1实施例的结构中增加了缓冲存储器130、周期性分析器131和间抽/内插操作器132。这些新的结构131~132设置在原声音矢量S的输入级,将从间抽/内插操作器132输出的声音矢量Sm作为输入声音矢量,和第1实施例一样进行编码处理。
这里,速度控制信号con2供给缓冲存储器130~间抽/内插操作器132。当该速度控制信号con2指示非控制状态时,缓冲存储器130~间抽/内插操作器132不动作,原声音矢量S直接供给编码处理机构。另一方面,当速度控制信号con2指示控制状态时,缓冲存储器130~间抽/内插操作器132就进行声音信号的速度变更动作。
缓冲存储器130是将原声音矢量S存储为数帧。周期性分析器131对每帧分析缓冲存储器130存储的原声音矢量Sf的周期性,并将由采样数表现的周期性信息(音调周期)cc供给间抽/内插操作器132。当速度控制信号con2指示控制状态时,还将变倍倍率sf供给间抽/内插操作器132。间抽/内插操作器132根据该变倍倍率sf计算进行间抽或内插的采样数di。间抽/内插操作器132在周期性信息cc的整数倍中求出与计算的采样数di最接近的数n×cc,按周期性信息cc的周期单位只将该采样数n×cc的采样点进行间抽或内插,并且重新构成帧,输出经过间抽或内插处理的声音矢量Sm。
图6是高速再生的指示时(变倍倍率sf<1)间抽/内插操作器132的动作(间抽动作)的说明图。如图6所示,根据1帧(320个采样点)的原声音矢量S,求其周期性(音调周期)cc时,约为50个采样点,另外,根据由变倍率sf确定的采样数di求对多少周期(n周期)进行间抽时,可以得到2周期(n=2)的结果。因此,在本实施例的情况下,如图6所示的那样,从帧的开头部分开始,间抽2个周期的采样点。于是,1帧的采样数就比指定的采样数(320)少,因此,根据本次间抽处理后的采样点和对下一帧进行同样间抽处理的采样点重新形成1帧的声音矢量后,供给编码处理机构。
图7是低速再生的指示时(变倍倍率sf>1)间抽/内插操作器132的动作(内插动作)的说明图。如图7所示,根据1帧(320个采样点)的原声音矢量S求其周期性(音调周期)cc时,约为80个采样点,另外,根据由变倍率sf确定的采样数di求对多少周期(n周期)进行内插时,可以得到周期(n=2)的结果。因此,在本实施例的情况下,如图7所示的那样,对帧的开头一侧的周期(1)的采样点和第2周期(2)的采样点各反复进行2次内插。于是,1帧的采样数就比指定的采样数(320)多,因此,将本次内插处理后的采样列内的320个采样点作为1帧的采样点供给编码处理机构,同时,根据其余的采样点和对下一帧进行同样内插处理的采样点重新形成1帧的声音矢量后供给编码处理机构。
对于带留守录音功能的电话机,如上述那样,有对付恶作剧电话的要求。另外,对于有很多电话打进来的使用者(被呼叫者)的情况,呼叫者的留守录音信息也多,所以,有时希望高速再生。作为满足这一要求的一个方法,把被呼叫者及呼叫者的信息声音信号的再生速度从通常速度进行改变是有效的。因此,设置有这种动作模式的选择操作按钮,当操作了该选择操作按钮时,控制整个电话机的控制器(CPU)就将指示再生速度的控制状态的速度控制信号con2和指示的变倍率sf供给缓冲存储器130~间抽/内插操作器132进行编码,以使在编码阶段(记录阶段)再生速度与通常速度不同。
按照上述第3实施例的代码激励线性预测编码器,也可以得到和第1实施例的代码激励线性预测编码器相同的效果,并且,在进行再生时,还可以获得可以适当地形成具有与使用者的指示对应的再生速度的声音信号的效果。
由于是在分析周期性后进行内插或间抽处理的,所以,进行内插或间抽处理也可以保持再生声音的连续性,另外,还可以保持音调。
(F)代码激励线性预测译码器的第3实施例
图8是本发明的代码激励线性预测译码器的第3实施例。在图8中,和图2相同及对应的部分标以相同的符号。第3实施例的代码激励线性预测译码器是以使用上述图1所示的第1实施例的代码激励线性预测编码器作为编码器为前提的。
第3实施例的代码激励线性预测译码器也是使声音信号的再生速度与输入声音本身具有的通常速度不同,但是,不是在编码器一侧进行再生速度的变更,而是由译码器一侧的处理进行。
由图8和图2的比较可知,第3实施例的代码激励线性预测译码器是在第1实施例的加法器212和合成滤波器213之间增加了缓冲存储器230、周期性分析器231和间抽/内插操作器232,另外,合成滤波器213和后置滤波器214还与1帧的指定采样数以外的采样数对应。因此,加法器212之前的处理和第1实施例的代码激励线性预测译码器相同。
这里,将速度控制信号con2供给缓冲存储器230~间抽/内插操作器232。当该速度控制信号con2指示非控制状态时,缓冲存储器230~间抽/内插操作器232不动作,使最佳激励矢量e直接通过。另一方面,当速度控制信号con2指示控制状态时,缓冲存储器230~间抽/内插操作器232进行速度变更动作。
缓冲存储器230至少存储1帧的最佳激励矢量e。周期性分析器231计算缓冲存储器230存储的最佳激励矢量ef的周期性的值(音调周期;换算为采样数)cc。间抽/内插操作器232根据变速倍率sf计算进行间抽或内插的采样数di,求最接近该改变部分的采样数di的周期性的值的整数倍cc×n,按周期性的值cc的采样数为单位对最佳激励矢量ef进行间抽或内插处理。第3实施例的代码激励线性预测译码器与第3实施例的代码激励线性预测编码器比较,虽然有间抽/内插对象是声音矢量的采样点还是最佳激励矢量的采样点的不同,但以上的处理相同。
但是,第3实施例的代码激励线性预测译码器的间抽/内插操作器232进而还求间抽/内插处理后的最佳激励矢量em的矢量长度(采样数)s1。并且,间抽/内插操作器232将间抽/内插处理后的最佳激励矢量em输给合成滤波器213,同时,将矢量长度s1输给合成滤波器213和后置滤波器214。
合成滤波器213和后置滤波器214进行和第1实施例的代码激励线性预测译码器一样的处理,但是,输入矢量的矢量长度经间抽/内插处理后与原来的矢量长度不同,所以,对于该矢量长度s1的输入采样系列,使用声道分析系数aq进行滤波。
按照上述第3实施例的代码激励线性预测译码器,也可以得到和第1实施例的代码激励线性预测译码器相同的效果,并且,还可以获得可以适当地形成具有与使用者的指示对应的再生速度的再生声音信号的效果。
这里,由于是在分析周期性之后进行间抽或内插处理的,所以,即使进行间抽或内插处理还可以保持再生声音的连续性,另外,还可以保持音调。
另外,由于是在最佳激励矢量的阶段进行间抽或内插处理的,所以,可以得到更自然的再生合成声音信号。即,由间抽/内插处理造成的影响通过合成滤波器213和后置滤波器214的滤波缓和,可以得到更自然的再生声音信号。因此,也可以考虑在后置滤波器214的输出阶段进行间抽/内插处理,但是,即使在进行周期性分析后进行间抽/内插处理,其影响进入输出声音信号的程度也大于本实施例。
(G)代码激励线性预测译码器的第4实施例
图9是本发明的代码激励线性预测译码器的第4实施例。在图9中,和图2相同及对应的部分标以相同的符号。第4实施例的代码激励线性预测译码器是以使用上述图1所示的第1实施例的代码激励线性预测编码器作为编码器为前提的。
图1所示的第1实施例的代码激励线性预测编码器,如上述那样,编码时是应能将大量的信息存储到IC存储器内且具有低编码速度的。编码速度降低多少,编码畸变进入再生声音信号内就有多少,这是不可避免的。在实验上已经知道,由于编码畸变,再生声音信号中的杂音成分有成为颤噪杂音化的倾向。第4实施例的代码激励线性预测译码器就是为了解决再生声音信号中的杂音成分出现颤噪杂音化的问题。
由图9和图2的比较可知,第4实施例的代码激励线性预测译码器是在第1实施例的结构中增加了杂音发生器140和加法器141。
杂音发生器140与帧功率P的值对应地发生白色杂音nz。另外,发生与帧功率无关的保持一定变化的杂音或者预先捕捉背景杂音进行存储后再发生杂音,可以构成其他实施例。加法器141将该杂音nz与后置滤波器214输出的再生声音矢量进行加法运算,并将加法运算后的再生声音矢量Sp从输出端子215向外部输出。
这里,即使从后置滤波器214输出的再生声音矢量中的杂音成分出现颤噪杂音化,通过加入杂音发生器140的白色杂音,便可使加法器141输出的再生声音矢量Sp的杂音成分呈现白色杂音化,从而颤噪杂音成分变得不明显,接近于自然的杂音成分。
按照上述第4实施例的代码激励线性预测译码器,也可以得到和第1实施例的代码激励线性预测译码器相同的效果,并且,即使通过编码/译码而使  背景杂音等受到调制、变化为能感觉到影响收听的程度,由于加入指定的适当大小的人为地生成的杂音,所以,也可以掩蔽影响收听的部分,从而可以得到更自然的再生声音信号。
(H)其他实施例
在上述各实施例中,示出了按照根据原声音矢量得到声道分析系数的所谓向前式代码激励线性预测编码方式的情况,但是,对于第1实施例、第3实施例和第4实施例的特征结构,可以应用于按照根据局部再生的声音矢量得到声道分析系数的所谓向后式代码激励线性预测编码方式的情况。
在上述各实施例中,作为激励信号(激励矢量)的发生结构,具有自适应码表、杂音码表、脉冲码表和增益码表,但是,对于第2实施例~第4实施例,激励信号(激励矢量)的发生结构不限于此,只要是至少具有自适应码表和杂音码表,就可以应用。
上述各实施例都是着眼于应用到带留守录音功能的电话机的信息记录再生的结构中,但是,其用途不限于此,可以应用于狭义的传输系统。
按照本发明的第1代码激励线性预测编码器或本发明的第2代码激励线性预测译码器,是令包含在编码声音信号中的声道预测系数为LSP系数,选择使用杂音码表和脉冲性码表,在该选择激励信号中反映原声音信号的频率,对自适应激励信号和选择激励信号进行增益控制的,所以,即使在低编码速度下也可以得到高品质的再生声音信号。
按照本发明的第3代码激励线性预测编码器或本发明的第4代码激励线性预测译码器,由于设置有指数变换器,当指示了音调控制模式时,将自适应激励信号指数变换为固定的自适应激励信号指数,所以,可以根据需要改变再生声音信号的音调。
按照本发明的第5代码激励线性预测编码器或本发明的第6代码激励线性预测译码器,由于设置有根据指示的变倍率和处理对象信号具有的周期性对处理对象信号进行间抽或内插处理的再生速度控制器,所以,可以根据需要改变再生声音信号的速度。
按照本发明的第7代码激励线性预测译码器,由于在再生声音信号形成器的后级设置有向再生声音信号中添加白色杂音的白色杂音添加器,所以,虽然在低编码速度下再生声音信号的杂音成分容易发生颤噪杂音,但是,将颤噪杂音淹没到白色杂音中就不明显了,从而可以得到自然的再生声音信号。

Claims (7)

1.一种代码激励线性预测编码器,其特征在于:具有声道信息生成器、声音功率量化器、自适应码表、噪音码表、脉冲码表、固定激励信号选择器、频率特性操作器、增益码表、加法器、最佳激励信号搜索器和编码声音信号形成器,声道信息生成器根据原声音信号或局部再生的合成声音信号得到LPC系数、将其变换为LSP系数后进行量化,同时将该量化的LSP系数进行反量化,恢复为LPC系数;声音功率量化器计算原声音信号的功率、并进行量化和反量化处理;自适应码表自适应地输出更新的自适应激励信号;噪音码表输出噪音性激励信号;脉冲码表输出脉冲性激励信号;固定激励信号选择器选择噪音码表和脉冲码表的激励信号;频率特性操作器将固定激励信号选择器输出的噪音性激励信号或脉冲性激励信号变换为具有与原声音信号相似的频率特性;增益码表输出与从自适应码表输出的自适应激励信号和从频率特性操作器输出的噪音激励信号或脉冲性激励信号对应的、由声音功率量化器输出的反量化功率决定的激励增益;加法器将进行了增益控制的从自适应码表输出的自适应激励信号和从频率特性操作器输出的噪音性激励信号或脉冲性激励信号进行加法运算,形成最终的激励信号;最佳激励信号搜索器根据从声道信息生成器输出的LPC系数和加法器输出的最终的激励信号,确定使用从自适应码表、噪音码表、脉冲码表和增益码表输出的最佳激励信号,还是使用噪音码表和脉冲码表中的哪一个码表的输出激励信号;编码信号形成器在确定了最佳激励信号时,根据各种码表的指数、固定激励信号选择器的选择状态指数、声音功率量化器的量化功率和声道信息生成器的量化LSP系数形成编码声音信号。
2.一种代码激励线性预测译码器,其特征在于:具有编码声音信号分离器、声道信息再生器、声音功率反量化器、自适应码表、噪音码表、脉冲码表、固定激励信号选择器、频率特性操作器、增益码表、加法器和再生声音信号形成器。编码声音信号分离器将编码声音信号分离为各种信息;声道信息再生器将分离的量化LSP系数进行反量化处理,恢复为LPC系数;声音功率反量化器将分离的量化功率进行反量化处理;自适应码表输出与分离的自适应激励信号指数对应的自适应激励信号;噪音码表在分离了噪音激励信号指数时输出与该指数对应的噪音性激励信号;脉冲码表在分离了脉冲性激励信号指数时输出与该指数对应的脉冲性激励信号;固定激励信号选择器根据分离的选择状态指数选择噪音码表和脉冲码表的激励信号;频率特性操作器将从该固定激励信号远择器输出的噪音性激励信号或脉冲性激励信号变换为具有与原声音信号相似的频率特性;增益码表输出与从自适应码表输出的自适应激励信号和从频率特性操作器输出的噪音性激励信号或脉冲性激励信号对应的、由从声音功率反量化器输出的反量化功率和分离的激励增益确定的激励增益;加法器将从经过增益控制的自适应码表输出的自适应激励信号和从频率特性操作器输出的噪音性激励信号或脉冲性激励信号进行加法运算,形成最终的激励信号;再生声音信号形成器根据从声道信息再生器输出的LPC系数和从加法器输出的最终的激励信号形成再生声音信号。
3.一种代码激励线性预测编码器,其特征在于:在至少具有自适应码表的代码激励线性预测编码器中,具有指数变换器,在指示了音调控制模式时,该指数变换器将按照自适应码表确定的自适应激励信号指数变换为固定的自适应激励信号指数,并供给编码声音信号形成器,以使编码声音信号中含有固定的自适应激励信号。
4.一种代码激励线性预测译码器,其特征在于:在至少具有自适应码表的代码激励线性预测译码器中,具有指数变换器,在指示了音调控制模式时,该指数变换器将按照将编码声音信号分离后得到的自适应码表确定的自适应激励信号指数,变换为固定的自适应激励信号指数并供给自适应码表。
5.一种代码激励线性预测编码器,其特征在于:在按照代码激励线性预测编码方式对输入的原声音信号进行编码的代码激励线性预测编码器中,具有再生速度控制器,在指示了再生速度控制模式时,该再生速度控制器根据指示的变倍率和原声音信号具有的周期性,对原声音信号进行间抽或内插处理并供给编码处理器。
6.一种代码激励线性预测译码器,其特征在于:在具有根据输入的编码声音信号形成激励信号的激励信号再生器,根据输入的编码声音信号形成声道预测系数的声道信息再生器和根据激励信号再生器的激励信号和声道信息再生器的声道预测系数形成再生声音信号的再生声音信号形成器的代码激励线性预测译码器中,具有再生速度控制器,在指示了再生速度控制模式时,该再生速度控制器根据指示的变倍率和激励信号具有的周期性对激励信号再生器的激励信号进行间抽或内插处理,并供给再生声音信号形成器。
7.一种代码激励线性预测译码器,其特征在于:在具有根据输入的编码声音信号形成激励信号的激励信号再生器、根据输入的编码声音信号形成声道预测系数的声道信息再生器和根据激励信号再生器的激励信号和声道信息再生器的声道预测系数形成再生声音信号的再生声音信号形成器的代码激励线性预测译码器中,在再生声音信号形成器的后级设有向再生声音信号中加进白色噪音的白色噪音添加器。
CN95119729A 1994-11-22 1995-11-17 代码激励线性预测编码器和译码器 Expired - Fee Related CN1055585C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP287654/1994 1994-11-22
JP287654/94 1994-11-22
JP28765494A JP3328080B2 (ja) 1994-11-22 1994-11-22 コード励振線形予測復号器

Publications (2)

Publication Number Publication Date
CN1132423A CN1132423A (zh) 1996-10-02
CN1055585C true CN1055585C (zh) 2000-08-16

Family

ID=17720008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95119729A Expired - Fee Related CN1055585C (zh) 1994-11-22 1995-11-17 代码激励线性预测编码器和译码器

Country Status (6)

Country Link
US (1) US5752223A (zh)
EP (2) EP0714089B1 (zh)
JP (1) JP3328080B2 (zh)
KR (1) KR100272477B1 (zh)
CN (1) CN1055585C (zh)
DE (1) DE69527410T2 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
JP3092652B2 (ja) * 1996-06-10 2000-09-25 日本電気株式会社 音声再生装置
EP1071081B1 (en) * 1996-11-07 2002-05-08 Matsushita Electric Industrial Co., Ltd. Vector quantization codebook generation method
JP3206497B2 (ja) * 1997-06-16 2001-09-10 日本電気株式会社 インデックスによる信号生成型適応符号帳
EP1746583B1 (en) 1997-10-22 2008-09-17 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
US6092040A (en) * 1997-11-21 2000-07-18 Voran; Stephen Audio signal time offset estimation algorithm and measuring normalizing block algorithms for the perceptually-consistent comparison of speech signals
CN1494055A (zh) 1997-12-24 2004-05-05 ������������ʽ���� 声音编码方法和声音译码方法以及声音编码装置和声音译码装置
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
KR100249235B1 (ko) * 1997-12-31 2000-03-15 구자홍 에이치디티브이 비디오 디코더
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6449313B1 (en) * 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6728344B1 (en) * 1999-07-16 2004-04-27 Agere Systems Inc. Efficient compression of VROM messages for telephone answering devices
JP3365360B2 (ja) * 1999-07-28 2003-01-08 日本電気株式会社 音声信号復号方法および音声信号符号化復号方法とその装置
US6452517B1 (en) * 1999-08-03 2002-09-17 Dsp Group Ltd. DSP for two clock cycle codebook search
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
US7133823B2 (en) * 2000-09-15 2006-11-07 Mindspeed Technologies, Inc. System for an adaptive excitation pattern for speech coding
JP3566220B2 (ja) * 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US6912495B2 (en) * 2001-11-20 2005-06-28 Digital Voice Systems, Inc. Speech model and analysis, synthesis, and quantization methods
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
US20040102975A1 (en) * 2002-11-26 2004-05-27 International Business Machines Corporation Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
JP4525693B2 (ja) * 2007-03-27 2010-08-18 パナソニック株式会社 音声符号化装置および音声復号化装置
JP4525694B2 (ja) * 2007-03-27 2010-08-18 パナソニック株式会社 音声符号化装置
US9343079B2 (en) * 2007-06-15 2016-05-17 Alon Konchitsky Receiver intelligibility enhancement system
WO2009114656A1 (en) * 2008-03-14 2009-09-17 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
US20120045001A1 (en) * 2008-08-13 2012-02-23 Shaohua Li Method of Generating a Codebook
JP5299631B2 (ja) * 2009-05-13 2013-09-25 日本電気株式会社 音声復号装置およびその音声処理方法
JP5287502B2 (ja) * 2009-05-26 2013-09-11 日本電気株式会社 音声復号装置及び方法
CN101834586A (zh) * 2010-04-21 2010-09-15 四川和芯微电子股份有限公司 随机信号产生电路及方法
CN104040624B (zh) * 2011-11-03 2017-03-01 沃伊斯亚吉公司 改善低速率码激励线性预测解码器的非语音内容
JP6201043B2 (ja) 2013-06-21 2017-09-20 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. エラー封じ込め中の切替音声符号化システムについての向上した信号フェードアウトのための装置及び方法
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
CN105007094B (zh) * 2015-07-16 2017-05-31 北京中宸泓昌科技有限公司 一种指数对扩频编码解码方法
WO2019089341A1 (en) * 2017-11-02 2019-05-09 Bose Corporation Low latency audio distribution

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1047157A (zh) * 1989-05-11 1990-11-21 艾利森电话股份有限公司 线性预测语音编码激励脉冲的定位方法
CN1051100A (zh) * 1989-10-17 1991-05-01 莫托罗拉公司 带有自适应音调前置滤波器的线性预测编码语言合成器

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5650398A (en) * 1979-10-01 1981-05-07 Hitachi Ltd Sound synthesizer
US4624012A (en) * 1982-05-06 1986-11-18 Texas Instruments Incorporated Method and apparatus for converting voice characteristics of synthesized speech
FR2530101A1 (fr) * 1982-07-06 1984-01-13 Thomson Brandt Procede et systeme de transmission cryptee d'un signal, notamment audio-frequence
US4709390A (en) * 1984-05-04 1987-11-24 American Telephone And Telegraph Company, At&T Bell Laboratories Speech message code modifying arrangement
JP2884163B2 (ja) * 1987-02-20 1999-04-19 富士通株式会社 符号化伝送装置
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
EP0287741B1 (en) * 1987-04-22 1993-03-31 International Business Machines Corporation Process for varying speech speed and device for implementing said process
CA1321646C (en) * 1988-05-20 1993-08-24 Eisuke Hanada Coded speech communication system having code books for synthesizing small-amplitude components
EP0427953B1 (en) * 1989-10-06 1996-01-17 Matsushita Electric Industrial Co., Ltd. Apparatus and method for speech rate modification
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式
US5138661A (en) * 1990-11-13 1992-08-11 General Electric Company Linear predictive codeword excited speech synthesizer
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
US5195137A (en) * 1991-01-28 1993-03-16 At&T Bell Laboratories Method of and apparatus for generating auxiliary information for expediting sparse codebook search
JP2776050B2 (ja) * 1991-02-26 1998-07-16 日本電気株式会社 音声符号化方式
JP2661391B2 (ja) * 1991-03-01 1997-10-08 ヤマハ株式会社 楽音信号処理装置
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
DE69228211T2 (de) * 1991-08-09 1999-07-08 Koninklijke Philips Electronics N.V., Eindhoven Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals
US5305420A (en) * 1991-09-25 1994-04-19 Nippon Hoso Kyokai Method and apparatus for hearing assistance with speech speed control function
WO1993018505A1 (en) * 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5727122A (en) * 1993-06-10 1998-03-10 Oki Electric Industry Co., Ltd. Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1047157A (zh) * 1989-05-11 1990-11-21 艾利森电话股份有限公司 线性预测语音编码激励脉冲的定位方法
CN1051100A (zh) * 1989-10-17 1991-05-01 莫托罗拉公司 带有自适应音调前置滤波器的线性预测编码语言合成器

Also Published As

Publication number Publication date
JP3328080B2 (ja) 2002-09-24
US5752223A (en) 1998-05-12
JPH08146998A (ja) 1996-06-07
CN1132423A (zh) 1996-10-02
DE69527410D1 (de) 2002-08-22
KR100272477B1 (ko) 2000-11-15
DE69527410T2 (de) 2003-08-21
KR960019069A (ko) 1996-06-17
EP1160771A1 (en) 2001-12-05
EP0714089A2 (en) 1996-05-29
EP0714089A3 (en) 1998-07-15
EP0714089B1 (en) 2002-07-17

Similar Documents

Publication Publication Date Title
CN1055585C (zh) 代码激励线性预测编码器和译码器
CN1264138C (zh) 复制语音信号、解码语音、合成语音的方法和装置
CN1212606C (zh) 处理丢失帧的语音通信系统及方法
CN1021938C (zh) 控制代码激发信号编码器的方法和装置
CN1202514C (zh) 编码和解码语音及其参数的方法、编码器、解码器
CN1152164A (zh) 码激励线性预测编码装置
CN1468427A (zh) 一种码激励线性预测语音编码器的增益量化
CN1151491C (zh) 音频编码装置和音频编码译码装置
CN1297222A (zh) 信息处理设备、方法和记录媒体
CN1816847A (zh) 保真度优化的可变帧长编码
CN1873778A (zh) 解码语音信号的方法
CN1113492C (zh) 发送接收装置
CN101044554A (zh) 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法
CN1291375C (zh) 声信号编码方法和设备、解码方法和设备
CN1359513A (zh) 话音解码装置和编码差错补偿方法
JP4304360B2 (ja) 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
JP3033060B2 (ja) 音声予測符号化・復号化方式
CN1293535C (zh) 声音编码设备和方法以及声音解码设备和方法
JPH08305398A (ja) 音声復号化装置
CN1135528C (zh) 声音编码装置以及声音解码装置
US7047186B2 (en) Voice decoder, voice decoding method and program for decoding voice signals
JP5604572B2 (ja) 複雑さ分散によるデジタル信号の転送誤り偽装
WO2014034697A1 (ja) 復号方法、復号装置、プログラム、及びその記録媒体
JPH11175098A (ja) 音声及び音楽符号化方式
CN1475988A (zh) 声音编码装置和声音译码装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20000816

Termination date: 20141117

EXPY Termination of patent right or utility model