CN1187735C - 多模式话音编码装置和解码装置 - Google Patents
多模式话音编码装置和解码装置 Download PDFInfo
- Publication number
- CN1187735C CN1187735C CNB018000150A CN01800015A CN1187735C CN 1187735 C CN1187735 C CN 1187735C CN B018000150 A CNB018000150 A CN B018000150A CN 01800015 A CN01800015 A CN 01800015A CN 1187735 C CN1187735 C CN 1187735C
- Authority
- CN
- China
- Prior art keywords
- noise
- mode
- code book
- interval
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Abstract
平方和计算部603计算平滑过的每个量化LPC参数次数的差的平方和。由此,获得第1动态参数。求第1动态参数。在平方和计算器605中,用各次数的平方值来计算平方和。该平方和作为第2动态参数。在最大值计算器606中在各次数的平方值中选择最大值。该最大值作为第3动态参数。将上述第1至第3动态参数传送到模式决定器607,根据上述阈值判定来决定话音模式,作为模式信息输出。
Description
技术领域
本发明涉及对话音信号进行编码传输的移动通信系统等中的位速率低的话音编码装置,特别涉及将话音信号分离为声道信息和音源信息来表现的CELP(Code Excited Linear Prediction:代码激励线性预测)型话音编码装置等。
背景技术
在数字移动通信和话音积蓄领域中,使用进行话音信息压缩,以便有效利用电波和存储媒体,并以高效率进行编码的话音编码装置。其中,以CELP(Code Excited Linear Prediction:代码激励线性预测)方式为基础的方式在位速率中等和低时被广泛使用。CELP技术披露于M.R.Schroeder andB.S.Atal:“Code-Excited Linear Prediction(CELP):High-quality Speech at VeryLow Bit Rates”,Proc.ICASSP-85,25.1.1,pp.937-940,1985”。
CELP型话音编码方式将话音分隔成某个一定的帧长度(5ms~50ms左右),对应每个帧进行话音的线性预测,对每个帧的线性预测的预测残差(激励信号)用已知波形组成的自适应码矢量和噪声码矢量进行编码。噪声码矢量从存储以前生成的驱动音源矢量的自适应码簿中选择使用,而噪声码矢量从存储具有预先准备的预定数目的固定形状的矢量的噪声码簿中选择使用。在噪声码簿中存储的噪声码矢量中,使用将随机的噪声序列的矢量和几个脉冲配置在不同位置所生成的矢量等。
在现有的CELP编码装置中,用输入的数字信号来进行LPC的分析、量化和间隔检索、噪声码簿检索及增益码簿检索,将量化LPC代码(L)、间隔周期(P)、噪声码簿索引(S)、以及增益码簿索引(G)传送到解码器。
但是,在上述现有的话音编码装置中,需要用一种类的噪声码簿来对付有声话音和无声话音以及背景噪声等,难以将所有的输入信号以高品质来编码。
发明内容
本发明的目的在于提供一种多模式话音编码装置和话音解码装置,可以实现音源编码的多模式化而不重新传输模式信息,特别是除了有声区间/无声区间的判定以外,还可进行话音区间/非话音区间的判定,可以进一步提高多模式化产生的编码/解码性能的改善度。
本发明的主题是使用表示频谱特性的量化参数的静态/动态特征来进行模式判定,根据表示话音区间/非话音区间、有声区间/无声区间的模式判定结果来进行音源构成的切换和后处理。
本发明提供一种模式判定装置,其特征在于,包括:平均LSP计算部件(609),计算量化LSP参数为定常的区间中的平均量化LSP参数;差计算部件(610、604),按各个次数计算所述平均量化LSP参数的各个次数分量和当前帧的量化LSP参数的各个次数分量之间的差;以及第1模式判定部件(606、607),将在任何一个次数计算出大于规定量的所述差的帧的模式判定为话音模式。
本发明还提供一种多模式话音解码装置,其特征在于,包括:解码器(201),对表现量化LPC的代码进行解码,生成量化LSP参数;使用所述解码器生成的量化LSP参数的如权利要求1所述的模式判定装置(202);以及噪声码簿(203),根据该模式判定装置的判定结果,从表现噪声码矢量的代码生成脉冲的噪声码矢量或是噪声的噪声码矢量。
本发明还提供一种多模式话音解码装置,其特征在于,包括:解码器(1803),对表现量化LPC的代码进行解码,生成量化LSP参数;使用所述解码器生成的量化LSP参数的如权利要求1所述的模式判定装置(1802);以及定常噪声生成器(1801),在不被该模式判定装置判定为话音模式的区间,通过用从噪声码簿(1804)中取得的随机信号来驱动由根据所述平均量化LSP参数中求出的LPC参数构筑的合成滤波器(1813),将生成的定常噪声重叠在解码话音。
本发明还提供一种多模式话音编码装置,其特征在于,包括:LPC分析器(102),对输入信号进行LPC分析,计算LPC;LPC量化器(103),对所述LPC进行量化获得量化LSP参数;使用所述量化LSP参数的如权利要求1所述的模式判定装置(105);以及噪声码簿(109),根据该模式判定装置的判定结果生成脉冲的噪声码矢量或是噪声的噪声码矢量。
本发明还提供一种模式判定方法,其特征在于,包括:计算量化LSP参数为定常的区间中的平均量化LSP参数的步骤;按各个次数计算所述平均量化LSP参数的各个次数分量和当前帧的量化LSP参数的各个次数分量之间的差的步骤;以及将在任何一个次数计算出大于规定量的所述差的帧的模式判定为话音模式的步骤。
附图说明
图1表示本发明实施例1的话音编码装置的结构方框图;
图2表示本发明实施例2的话音解码装置的结构方框图;
图3表示本发明实施例1的话音编码处理流程的流程图;
图4表示本发明实施例2的话音解码处理流程的流程图;
图5A表示本发明实施例3的话音信号发送装置的结构方框图;
图5B表示本发明实施例3的话音信号接收装置的结构方框图;
图6表示本发明实施例4的模式选择器的结构方框图;
图7表示本发明实施例4的模式选择器的结构方框图;
图8表示本发明实施例4的前级的模式选择处理流程的流程图;
图9表示本发明实施例5的间隔检索的结构方框图;
图10表示本发明实施例5的间隔检索的检索范围的图;
图11表示本发明实施例5的进行间隔周期化增益的切换控制的结构图;
图12表示本发明实施例5的进行间隔周期化增益的切换控制的结构图;
图13表示本发明实施例6的进行加权处理的结构方框图;
图14表示在上述实施例中选择候选间隔周期来进行加权处理情况的流程图;
图15表示在上述实施例中不选择候选间隔周期来进行加权处理情况的流程图;
图16表示本发明实施例7的话音编码装置的结构方框图;
图17表示本发明实施例7的话音解码装置的结构方框图;
图18表示本发明实施例8的话音解码装置的结构方框图;以及
图19表示上述实施例中的话音解码装置的模式判定器的结构方框图。
具体实施方式
以下,参照附图来详细说明本发明的实施例。
(实施例1)
图1表示本发明实施例1的话音编码装置的结构方框图。将数字化的话音信号等组成的输入数据输入到预处理器101。预处理器101用高通滤波器和带通滤波器等来进行直流分量的切除和输入数据的频带限制等,并输出到LPC分析器102和加法器106。在该预处理器101中无论进行什么处理,都可以进行后续的编码处理,但进行了上述处理可提高编码性能。变换为容易编码的波形等而不使主观的品质恶化,例如将间隔周期的操作和间隔波形的内插处理等作为预处理是有效的。
LPC分析器102进行线性预测分析,计算线性预测系数(LPC),并输出到LPC量化器103。
LPC量化器103对输入的LPC进行量化,将量化后的LPC分别输出到合成滤波器104和模式选择器105,并将表现量化LPC的代码L输出到解码器。LPC的量化一般是进行内插特性良好的LSP(Line Spectrum Pair:线状频谱对)变换。LSP一般用LSF(Line Spectrum Frequency:线状频谱频率)来表示。
合成滤波器104用输入的量化LPC来构筑LPC合成滤波器。将对该合成滤波器从加法器114输出的驱动音源信号作为输入来进行滤波处理,将合成信号输出到加法器106。
模式选择器105用从LPC量化器103输入的量化LPC来确定噪声码簿109的模式。
模式选择器105还存储以前输入的量化LPC的信息,用帧间的量化LPC的变动特征和当前帧的量化LPC特征两者来进行模式的选择。该模式至少在2种以上,例如由对应于有声话音部的模式和对应于无声话音部及定常噪声部等的模式构成。此外,模式选择所用的信息不需要量化LPC本身,使用变换为量化LSP、反射系数或线性预测残差功率等参数的方法是有效的。在LPC量化器103具有作为LSP量化器构成因素的情况下(将LPC变换为LSP来进行量化的情况),也可以将量化LSP作为模式选择器105的输入参数之一。
加法器106计算从预处理器101输入的预处理后的输入数据和合成信号之间的误差,输出到听觉加权滤波器107。
听觉加权滤波器107对加法器106计算出的误差进行听觉加权,输出到误差最小化器108。
误差最小化器108一边调整噪声码簿索引、自适应码簿索引(间隔周期)和增益码簿索引,一边分别输出到噪声码簿109、自适应码簿110和增益码簿111,分别决定噪声码簿109、自适应码簿110和增益码簿111生成的噪声码矢量、自适应码矢量、噪声码簿增益、以及自适应码簿增益,使得从听觉加权滤波器107输入的听觉加权过的误差最小,并将表现噪声码矢量的代码S、表现自适应码矢量的P、以及表现增益信息的代码G分别输出到解码器。
噪声码簿109存储预定个数的形状不同的噪声码矢量,根据从误差最小化器108输入的噪声码矢量的索引Si来输出指定的噪声码矢量。该噪声码簿109至少有2种以上的模式,例如在有声话音部所对应的模式中具有生成脉冲式的噪声码矢量的构造,而在无声话音部和定常噪声部等所对应的模式中,具有生成噪声的噪声码矢量的构造。由模式选择器105在上述2种以上的模式中选择出的一个模式来生成从噪声码簿109输出的噪声码矢量,在用乘法器112乘以噪声码簿增益后输出到加法器114。
自适应码簿110一边依次更新以前生成的驱动音源信号一边进行缓冲,用从误差最小化器108输入的自适应码簿增益(间隔周期(间隔滞后))Pi来生成自适应码矢量。由乘法器113将自适应码簿110生成的自适应码矢量与自适应码簿增益相乘后输出到加法器114。
增益码簿111将自适应码簿增益和噪声码簿增益的置位(增益矢量)存储预定的个数,将从误差最小化器108输入的增益码簿索引Gi指定的增益矢量的自适应码簿增益分量输出到乘法器113,将噪声码簿增益分量输出到乘法器112。如果增益码簿多级构成,则可以削减增益码簿所需要的存储量和增益码簿检索所需要的运算量。如果对增益码簿分配的位数充分,则也可以对自适应码簿增益和噪声码簿增益进行独立标量量化。此外,也可以考虑将多个子帧的自适应码簿增益和噪声码簿增益集中,一边进行矢量量化一边进行矩阵量化。
加法器114将从乘法器112和113输入的噪声码矢量和自适应码矢量相加来生成驱动音源信号,输出到合成滤波器104和自适应码簿110。
在本实施例中,多模式化的码簿仅是噪声码簿109,但通过将自适应码簿110和增益码簿111多模式化,可以进一步进行品质改善。
下面,参照图3来说明上述实施例中的话音编码方法的处理流程。在本说明中,表示以每个预定时间长度的处理单位(帧:作为时间长度为几十毫秒左右)来进行话音编码处理,并以整数个的每个短处理单位(子帧)来处理一帧的例子。
在步骤(以下,省略为ST)301中,将自适应码簿的内容、合成滤波器存储器、输入缓冲器等所有存储器清零。
接着,在ST302中,输入一帧量的数字化的话音信号等输入数据,通过高通滤波器或带通滤波器等来消除输入数据的偏差量或限制频带。预处理后的输入数据在输入缓冲器中被缓冲,用于以后的编码处理。
接着,在ST303中,进行LPC分析(线性预测分析),计算LPC系数(线性预测系数)。
接着,在ST304中,将ST303中计算出的LPC系数进行量化。提出了各种LPC系数的量化方法,但如果变换为内插特性良好的LSP参数,采用利用多级矢量量化和帧间相关的预测量化,则可以高效率地量化。例如在将一帧分割为2个子帧来处理的情况下,将第2子帧的LPC系数量化,第1子帧的LPC系数使用前一个帧中的第2子帧的量化LPC系数和当前帧的第2子帧的量化LPC系数通过内插处理来决定。
接着,在ST305中,对预处理后的输入数据进行听觉加权来构筑听觉加权滤波器。
接着,在ST306中,根据驱动音源信号来构筑生成听觉加权区域的合成信号的听觉加权合成滤波器。该滤波器是将合成滤波器和听觉加权滤波器进行从属连接的滤波器,合成滤波器使用ST304中已量化的量化LPC系数来构筑,听觉加权滤波器使用ST303中计算出的LPC系数来构筑。
接着,在ST307中,进行模式的选择。模式的选择使用ST304中已量化的量化LPC系数的动态和静态特征来进行。具体地说,使用量化LSP的变动、根据量化LPC系数计算出的反射系数、以及预测残差功率等。根据本步骤中选择的模式,进行噪声码簿的检索。本步骤中可选择的模式至少为2种以上,例如可考虑有声话音模式和定常噪声模式这两个模式结构等。
接着,在ST308中,进行自适应码簿的检索。自适应码簿的检索是检索在对预处理后的输入数据进行听觉加权的波形中生成最接近听觉加权合成波的自适应码矢量,决定切除自适应码矢量的位置,使得对预处理后的输入数据用ST305构筑的听觉加权滤波器进行滤波所得的信号和用ST306构筑的听觉加权合成滤波器对作为驱动音源信号的从自适应码簿中切除的自适应码矢量进行滤波所得的信号之间的误差最小。
接着,在ST309中,进行噪声码簿的检索。噪声码簿的检索是选择生成与对预处理后的输入数据进行了听觉加权的波形最接近的听觉加权合成波形所生成的驱动音源信号的噪声码矢量,进行考虑了将自适应码矢量和噪声码矢量相加所生成的驱动音源信号的检索。因此,将已在ST308中决定的自适应码矢量和噪声码簿中存储的噪声码矢量相加来生成驱动音源信号,从噪声码簿中选择噪声码矢量,使得用ST306构筑的听觉加权合成滤波器对生成的驱动音源信号进行滤波所得的信号和用ST305构筑的听觉加权滤波器对预处理后的输入数据进行滤波所得的信号之间的误差最小。
在对噪声码矢量进行间隔周期化等处理的情况下,进行还考虑了该处理的检索。此外,该噪声码簿至少有2种以上的模式,例如在有声话音部对应的模式中用存储脉冲的噪声码矢量的噪声码簿来进行检索,而在无声话音部和定常噪声部等对应的模式中用存储噪声的噪声码矢量的噪声码簿来进行检索。在ST307中选择检索时使用哪种模式的噪声码簿。
接着,在ST310中,进行增益码簿的检索。增益码簿的检索是从增益码簿中选择将已经在ST308中决定的自适应码矢量和在ST309中决定的噪声码矢量分别乘以自适应码簿增益和噪声码簿增益的组,将自适应码簿增益相乘后的自适应码矢量和噪声码增益相乘后的噪声码矢量相加来生成驱动音源信号,从增益码簿中选择自适应码簿增益和噪声码簿增益组,该组使得用ST306构筑的听觉加权合成滤波器对生成的驱动音源信号进行滤波所得的信号和用ST305构筑的听觉加权滤波器对预处理后的输入数据进行滤波所得的信号之间的误差最小。
接着,在ST311中,生成驱动音源信号。将ST308中选择的自适应码矢量与ST310中选择的自适应码簿增益相乘所得的矢量、以及ST309中选择的噪声码矢量与ST310中选择的噪声码簿增益相乘所得的矢量相加来生成驱动音源信号。
接着,在ST312中,进行子帧处理环所用的存储器的更新。具体地说,进行自适应码簿的更新和听觉加权滤波器及听觉加权合成滤波器的状态更新等。
在对自适应码簿增益和固定码簿增益分别进行量化的情况下,一般在ST308后立即进行自适应码簿增益的量化,在ST309之后立即进行噪声码簿增益的量化。
上述ST305~312是子帧单位的处理。
接着,在ST313中,进行帧处理环所用的存储器的更新。具体地说,进行预处理器所用的滤波器的状态更新、量化LPC系数缓冲器的更新及输入数据缓冲器的更新等。
接着,在ST314中,进行编码数据的输出。编码数据根据传输的形态来进行位流化和复用处理等后被传送到传输路径。
上述ST302~304及313~314是帧单位的处理。重复进行帧单位和子帧单位的处理,直至没有输入数据。
(实施例2)
图2表示本发明实施例2的话音解码装置的结构。
将从编码器传输的、表现量化LPC的代码L、表现噪声码矢量的代码S、表示自适应码矢量的代码P、以及表现增益信息的代码G分别输入到LPC解码器201、噪声码簿203、自适应码簿204、以及增益码簿205。
LPC解码器201从代码L中对量化LPC进行解码,分别输出到模式选择器202和合成滤波器209。
模式选择器202用从LPC解码器201输入的量化LPC来决定噪声码簿203和后处理器211的模式,将模式信息M分别输出到噪声码簿203和后处理器211。模式选择器202用从LPC解码器201输出的量化LSP参数来求定常噪声区间的平均LSP(LSPn),将该LSPn输出到后处理器211。模式选择器202还积蓄以前输入的量化LPC的信息,用帧间的量化LPC的变动特征和当前帧的量化LPC的特征两者来进行模式的选择。该模式至少为两种以上,例如由有声话音部对应的模式、无声话音部对应的模式、以及定常噪声部等对应的模式来构成。模式选择所用的信息不需要量化LPC本身,使用变换为量化LSP、反射系数或线性预测残差功率等参数的方法是有效的。在LPC解码器201具有作为LSP解码器构成因素的情况下(将LPC变换为LSP来进行量化的情况),也可以将解码LSP作为模式选择器105的输入参数之一。
噪声码簿203存储预定个数的形状不同的噪声码矢量,根据对输入的代码S进行解码所得的噪声码簿索引来输出指定的噪声码矢量。该噪声码簿203至少有2种以上的模式,例如在有声话音部所对应的模式中具有生成脉冲的噪声码矢量的构造,而在无声话音部和定常噪声部等所对应的模式中,具有生成噪声的噪声码矢量的构造。模式选择器202用在上述2种以上的模式中选择出的一个模式来生成从噪声码簿203输出的噪声码矢量,在用乘法器206乘以噪声码簿增益Gs后输出到加法器208。
自适应码簿204一边依次更新以前生成的驱动音源信号一边进行缓冲,用对输入的代码P进行解码所得的自适应码簿索引(间隔周期(间隔滞后))来生成自适应码矢量。用自适应码簿204生成的自适应码矢量由乘法器207乘以自适应码簿增益Ga后输出到加法器208。
增益码簿205将自适应码簿增益和噪声码簿增益的置位(增益矢量)存储预定的个数,根据对输入的代码G进行解码所得的增益码簿索引,将指定的增益矢量的自适应码簿增益分量输出到乘法器207,将噪声码簿增益分量输出到乘法器206。
加法器208将从乘法器206和207输入的噪声码矢量和自适应码矢量相加来生成驱动音源信号,输出到合成滤波器209和自适应码簿204。
合成滤波器209用输入的量化LPC来构筑LPC合成滤波器。该合成滤波器将从加法器208输出的驱动音源信号作为输入来进行滤波器处理,将合成信号输出到后置滤波器210。
后置滤波器210对从合成滤波器209输入的合成信号进行间隔增强、特性频带增强、频谱倾斜校正、增益调整等改善话音信号的主观品质的处理,输出到后处理器211。
后处理器211通过对从后置滤波器210输入的信号模拟生成重叠定常噪声来改善主观品质。该处理利用从模式选择器202输入的模式信息M和噪声区间的平均LSP(LSPn)自适应地进行。具体的后处理将后述。
在本实施例中,从模式选择器202输出的模式信息M无论使用噪声码簿203的模式切换和后处理器211双方所用的结构,或仅使用其中一个,都能获得效果。
下面,参照图4来说明上述实施例中的话音解码方法的处理流程。在本说明中,表示以每个预定时间长度的处理单位(帧:作为时间长度为几十毫秒左右)来进行话音编码处理,并以整数个的每个短处理单位(子帧)来处理一帧的例子。
在ST401中,将自适应码簿的内容、合成滤波器存储器、输入缓冲器等所有存储器清零。
接着,在ST402中,对编码数据进行解码。具体地说,将分离复用的接收信号和位流化的接收信号分别变换为分别表现量化LPC系数、自适应码矢量、噪声码矢量、以及增益信息的代码。
接着,在ST403中,对LPC系数进行解码。从表现ST402中获得的量化LPC系数的代码中,按照与实施例1所示的LPC系数的量化方法相反的步骤来解码LPC系数。
接着,在ST404中,用ST403中解码所得的LPC系数来构筑合成滤波器。
接着,在ST405中,用ST403中解码所得的LPC系数的静态和动态特征来选择噪声码簿和后处理的模式。具体地说,使用从量化LSP的变动和量化LPC系数中计算出的反射系数和预测残差功率等。根据本步骤中选择的模式来进行噪声码簿的解码和后处理。该模式至少有两种以上,例如由有声话音部对应的模式、无声话音部对应的模式、以及定常噪声部等对应的模式来构成。
接着,在ST406中,对自适应码矢量进行解码。通过对从表现自适应码矢量的代码中将自适应码矢量从自适应码簿中切除的位置进行解码,从该位置切除自适应码矢量来对自适应码矢量进行解码。
接着,在ST407中,对噪声码矢量进行解码。通过从表现噪声码矢量的代码中对噪声码簿索引进行解码,将该索引对应的噪声码矢量从噪声码簿中取出来对噪声码矢量进行解码。在采用噪声码矢量的间隔周期化等时,进行了间隔周期化等后的矢量成为解码噪声码矢量。该噪声码簿至少有两种以上的模式,例如在有声话音部对应的模式中生成脉冲的噪声码矢量,在无声话音部和定常噪声部对应的模式中生成噪声的噪声码矢量。
接着,在ST408中,对自适应码簿增益和噪声码簿增益进行解码。通过从表示增益信息的代码中对增益码簿索引进行解码,将该索引中所示的自适应码簿增益和噪声码簿增益的组从增益码簿中取出,来对增益信息进行解码。
接着,在ST409中,生成驱动音源信号。将ST406中选择的自适应码矢量与ST408中选择的自适应码簿增益相乘所得的矢量、以及将ST407中选择的噪声码矢量与ST408中选择的噪声码簿增益相乘所得的矢量相加来生成驱动音源信号。
接着,在ST410中,将解码信号合成。通过用ST404中构筑的合成滤波器对ST409中生成的驱动音源信号进行滤波,来合成解码信号。
接着,在ST411中,对解码信号进行后置滤波器处理。后置滤波器处理由间隔增强处理、特性频带增强处理、频谱倾斜校正处理、增益调整处理等用于改善解码信号中解码话音信号的主观品质的处理构成。
接着,在ST412中,对后置滤波器处理后的解码信号进行最终的后处理。该后处理是与ST405中选择出的模式对应的处理,其细节将后述。本步骤所生成的信号为输出数据。
接着,在ST413中,进行子帧处理环所用的存储器的更新。具体地说,进行自适应码簿的更新和后置滤波器处理中包含的各滤波器的状态更新等。
上述ST404~413是子帧单位的处理。
接着,在ST414中,进行帧处理环所用的存储器的更新。具体地说,进行量化(解码)LPC系数缓冲器的更新和输出数据缓冲器的更新等。
上述ST402~403及414是帧单位的处理。重复进行帧单位的处理,直至没有编码数据。
(实施例3)
图5表示包括实施例1的话音编码装置或实施例2的话音解码装置的话音信号发送机和接收机的方框图。图5A表示发送机,图5B表示接收机。
在图5A的话音信号发送机中,由话音输入装置501将话音变换为电模拟信号,输出到A/D变换器502。模拟话音信号由A/D变换器502变换为数字话音信号,输出到话音编码器503。话音编码器503进行话音编码处理,将编码后的信息输出到RF调制器504。RF调制器将编码后的话音信号的信息作为电波进行调制、放大、码扩频等用于发射的操作,输出到发送天线505。最后,从发送天线505发射电波(RF信号)506。
另一方面,在图5B的接收机中,由接收天线507接收电波(RF信号)506,将接收信号传送到RF解调部508。RF解调部508进行码解扩、解调等用于将电波信号变换为编码信息的处理,将编码信息输出到话音解码器509。话音解码器509进行编码信息的解码处理,将数字解码话音信号输出到D/A变换器510。D/A变换器510将从话音解码器509输出的数字解码话音信号变换为模拟解码话音信号,输出到话音输出装置511。最后,话音输出装置511将电模拟解码话音信号变换为解码话音并输出。
上述发送装置和接收装置可以用于携带电话等的移动通信设备和移动台或基站装置。传送信息的媒体不限于本实施例所示的电波,可以利用光信号等,也可以使用有线传输线路。
上述实施例1所示的话音编码装置、上述实施例2所示的话音解码装置、以及上述实施例3所示的发送装置和接收装置也可以作为软件记录在磁盘、光磁盘、ROM盒式磁盘等记录媒体上来实现,通过使用该记录媒体,通过使用这种记录媒体的个人计算机等,可以实现话音编码装置/话音解码装置以及发送装置/接收装置。
(实施例4)
实施例4是表示上述实施例1、2中的模式选择器105、202的结构例的示例。
图6表示实施例4的模式选择器的结构。
在本实施例的模式选择器中,将当前的量化LSP参数输入到平滑部601来进行平滑处理。在平滑部601中,将每处理单位时间对应输入的各次的量化LSP参数作为时间序列数据进行式(1)所示的平滑处理。
Ls[i]=(1-α)×Ls[i]+α×L[i],i=1、2、...、M、0<α<1 (1)
Ls[i]:i次的平滑量化LSP参数
L[i]:i次的量化LSP参数
α:平滑系数
M:LSP分析次数
在式(1)中,将α的值设定为0.7左右,越接近该值平滑越强。上述式(1)求出的平滑的量化LSP参数经延迟部602输入到加法器611,同时直接输入到加法器611。延迟部602将输入的平滑的量化LSP参数延迟一个处理单位时间后输出到加法器611。
将当前的处理单位时间的平滑过的量化LSP参数和前一个处理单位时间的平滑过的量化LSP参数输入到加法器611。在该加法器611中,计算当前的处理单位时间的平滑量化LSP参数和前一个处理单位时间的平滑量化LSP参数之间的差。对应LSP参数的各次数来计算该差。将加法器606产生的计算结果输出到平方和计算部603。
平方和计算部603计算当前的处理单位时间的平滑过的量化LSP参数和前一个处理单位时间的平滑过的量化LSP参数之间每个次数的差的平方和。由此,获得第1动态参数(Para 1)。通过对该第1动态参数进行阈值判定可以识别出是否是话音区间。即,在第1动态参数比阈值Th1大的情况下,判定为话音区间。该判定在后述的模式决定器607中进行。
平均LSP计算器609根据与平滑部601相同的式(1)来计算噪声区间的平均LSP参数,通过延迟器612输出到加法器610。其中,式(1)中的α由平均LSP计算器控制器608来控制。α的值为0.05左右~0,通过进行非常强的平滑处理,来计算平均的LSP参数。具体地说,考虑在话音区间中使α的值为0,仅在话音区间以外的区间中取平均(进行平滑)。
加法器610对应各次数来计算当前的处理单位时间的量化LSP参数和平均LSP计算器609在前一个处理单位时间中计算出的噪声区间的平均量化LSP参数之间的差,输出到平方值计算器604。即,在进行了后述的模式决定后,平均LSP计算器609计算噪声区间的平均LSP,该噪声区间的平均LSP参数通过延迟器612被延迟一个处理单位时间,在加法器610中用作下一个处理单位。
平方值计算器604输入从加法器610输出的量化LSP参数的差分信息,计算各次数的平方值,输出到总和计算器605,同时输出到最大值计算器606。
在平方和计算器605中,用各次数的平方值来计算平方和。该平方和为第2动态参数(Para 2)。通过对该第2动态参数进行阈值判定,可以识别是否是话音区间。即,在第2动态参数比阈值Th2大的情况下判定为话音区间。该判定在后述的模式决定器607中进行。
在最大值计算器606中,在各次的平方值中选择最大值。该最大值为第3动态参数(Para 3)。通过对该第3动态参数进行阈值判定,可以识别是否是话音区间。即,在第3动态参数比阈值Th3大的情况下判定为话音区间。该判定在后述的模式决定器607中进行。对该第3动态参数所用的阈值判定通过将所有次数的平方误差进行平均,检测可能被埋没的变化,来正确地判定是否是话音区间。
例如,在多个平方和的结果中,在大多数结果都未超过阈值、而一个或两个结果超过阈值的情况下,平均后的结果不会超过阈值,不会判定为话音区间。如上所述,通过使用第3动态参数来进行阈值判定,即使在大多数结果都未超过阈值、而一个或两个结果超过阈值的情况下,由于用最大值进行阈值判定,所以也可以更正确地判定为话音区间。
将上述的从第1至第3动态参数传送到模式决定器607,根据上述阈值判定,来决定话音模式,作为模式信息输出。该模式信息被传送到平均LSP计算器控制器608。在平均LSP计算器控制器608中,根据模式信息来控制平均LSP计算器609。
具体地说,在控制平均LSP计算器609的情况下,将式(1)的α值在0~0.05左右的范围内进行切换,切换平滑的强度。在最简单的例子中,在话音模式中,假设α=0,使平滑处理停止(OFF),在非话音(定常噪声)模式中,假设α=0.05,通过强平滑处理来进行定常噪声区间的平均LSP的计算。考虑控制LSP的各次数对应的α的值,在该情况下,还考虑在话音模式中更新一部分(例如指定频带中包含的次数)LSP。
图7表示包括上述结构的模式判定器的结构方框图。
该模式判定器包括提取量化LSP参数的动态特征的动态特征提取部701,以及提取量化LSP参数的静态特征的静态特征提取部702。动态特征提取部701由图6中从平滑部601至延迟器612的部分构成。
静态特征量提取部702根据归一化预测残差功率计算部704中的量化LSP参数来计算预测残差功率。将该预测残差功率提供给模式决定器607。
在相邻LSP间隔计算部705中,如式(2)所示,计算量化LSP参数的每个相邻次数对应的间隔。
Ld[i]=L[i+1]-L[i],i=1、2、...、M-1 (1)
L[i]:i次的量化LSP参数
将相邻LSP间隔计算部705的计算值提供给模式决定器607。
频谱倾斜计算部703用量化LSP参数来计算频谱倾斜信息。具体地说,作为表示频谱倾斜的参数,可利用1次反射系数。在反射系数和线性预测系数(LPC)之间如果使用Levinson-Durbin算法,则由于是相互可变换的关系,所以从量化LPC中可以求1次反射系数,将该系数用作频谱倾斜信息。在归一化预测残差功率部704中,也从量化LPC中使用Levinson-Durbin算法来计算归一化预测残差功率。即,无论反射系数还是归一化预测残差功率都使用相同的算法从量化LPC中同时来求。将该频谱倾斜信息提供给模式决定器607。
通过以上的频谱倾斜计算部703~相邻LSP间隔计算部705的要素,来构成量化LSP参数的静态特征量计算部702。
将动态特征量计算部701和静态特征量计算部702的输出提供给模式决定器607。从平方和计算器603输入平滑量化LSP参数的变动量,从平方和计算器605输入噪声区间的平均量化LSP参数和当前的量化LSP参数之间的距离,从最大值计算器606输入噪声区间的量化LSP参数和当前的量化LSP参数之间隔离的最大值,从归一化预测残差功率计算部704输入量化预测残差功率,从相邻LSP间隔计算部705输入相邻LSP间隔数据的频谱倾斜信息,从频谱倾斜计算部703输入分散信息。然后,用这些信息决定当前的处理单位时间的输入信号(或解码信号)是否是话音区间的模式。更具体的是否是话音区间的判定将用图8后述。
下面,参照图8来详细说明上述实施例的话音区间判定方法。
首先,在ST801中,计算第1动态参数(Para1)。第1动态参数的具体内容是每个处理单位时间的量化LSP参数的变动量,如式(3)所示。
Lsi(t):时刻(子帧)t中的平滑量化LSP
在ST802中,检查第1动态参数是否大于预定的阈值Th1。在超过阈值Th1的情况下,由于量化LSP参数的变动量大,所以判定为话音区间。另一方面,在阈值Th1以下的情况下,由于量化LSP参数的变动量小,所以进至ST803,而且进至使用其他参数的判定处理步骤。
在ST802中,在第1动态参数低于阈值Th1以下的情况下,进至ST803,检查表示以前是否判定为哪个定常噪声区间的计数器的数。计数器的初始值是0,根据本模式判定方法对判定是定常噪声区间的每个处理单位时间增加1。在ST803中,计数器的数在预先设定的阈值ThC以下的情况下,进至ST804,用静态参数来判定是否是话音区间。另一方面,在超过阈值ThC的情况下,进至ST806,用第2动态参数来判定是否是话音区间。
在ST804中,计算两种参数。一个参数是从量化LSP参数计算出的线性预测残差功率(Para4),另一个参数是量化LSP参数的相邻次数的差分信息的分散(Para5)。
通过将量化LSP参数变换为线性预测系数,使用Levinson-Durbin算法的关系式,可以求线性预测残差功率。由于已知线性预测残差功率具有无声部比有声部大的倾向,所以可用作有声/无声的判定基准。由于量化LSP参数的相邻次数的差分信息如式(2)所示,所以可求这些数据的分散。其中,由于因噪声的种类和频带限制的方法,在低频带中容易存在频谱的山(峰值),所以不使用低频带端的相邻次数的差分信息(式(2)中,i=1),在式(2)中,用从i=2至M-1(M是分析次数)的数据来求分散的方法使噪声区间和话音区间分类容易。在话音信号中,在电话频带(200Hz~3.4kHz)内具有3个程度的特性频带,所以有几个LSP的间隔窄的部分和宽的部分,存在间隔的数据的分散大的倾向。
另一方面,在定常噪声中,由于不具有特性频带构造,所以LSP比较容易变为等间隔,所述分散有变小的倾向。利用该性质,可以进行是否是话音区间的判定。其中,因上述噪声的种类和传输线路的频率特性等,存在低频带具有频谱山(峰值)的情况,由于这样的情况低频带侧的LSP间隔最窄,所以如果用所有相邻LSP差分数据来求分散,则特性频带构造的有无所产生的差变小,判定精度降低。
因此,通过除去低频带端的相邻LSP差分信息来求分散,可避免这样的精度恶化。其中,由于这样的静态参数的判定能力比动态参数低,所以最好用作辅助信息。在ST805中使用ST804中计算出的两种参数。
接着,在ST805中,进行使用ST804中计算出的两种参数的阈值处理。具体地说,在线性预测残差功率(Para4)比阈值Th4小,并且相邻LSP间隔数据的分散(Para5)比阈值Th5大的情况下,判定为话音区间。在除此以外的情况下,判定为定常噪声区间(非话音区间)。在判定为定常噪声区间的情况下,使计数器的值增加1。
在ST806中,计算第2动态参数(Para2)。第2动态参数是表示以前的定常噪声区间的平均量化LSP参数和当前处理单位时间的量化LSP参数之间相似度的参数,具体地说,如式(4)所示,是用上述两种量化LSP参数来求各次数对应的差分值,求平方和。求出的第2动态参数在ST807中用于阈值处理。
Li(t):时刻(子帧)t中的量化LSP LAi:噪声区间的平均量化LSP
接着,在ST807中,进行第2动态参数是否超过阈值Th2的判定。如果超过阈值Th2,则由于与以前的定常噪声区间的平均量化LSP参数相似度低,所以判定为话音区间,如果在阈值Th2以下,由于与以前的定常噪声区间的平均量化LSP参数相似度高,所以判定为定常噪声区间。在判定为定常噪声区间的情况下,使计数器的值增加。
在ST808中,计算第3动态参数(Para3)。第3动态参数是在使用第2动态参数的判定中难以判定、即仅用量化LSP的差的平方和不能判定的、用于检测对于平均量化LSP具有有效的差的次数的参数,具体地说,如式(5)所示,是求各次数的量化LSP参数的最大值的参数。求出的第3动态参数在ST808中用于阈值处理。
E(i)=max{Li(t)-LAi}2 i=1、2、...、M (5)
Li(t):时刻(子帧)t中的量化LSP LAi:噪声区间的平均量化LSP
其中,M是LSP(LPC)的分析次数
接着,在ST808中,进行第3动态参数是否超过阈值Th3的判定。如果超过阈值Th3,由于与以前的定常噪声区间的平均量化LSP参数相似度低,所以判定为话音区间,如果在阈值Th3以下,由于与以前的定常噪声区间的平均量化LSP参数相似度高,所以判定为定常噪声区间。在判定为定常噪声区间的情况下,使计数器的值增加。
本发明人发现在仅使用第1和第2动态参数的判定中,对于产生模式判定差错来说,模式判定差错的原因在于,噪声区间的平均量化LSP和对应该处的量化LSP呈现非常接近的值,并且对应该处的量化LSP的变动非常小。其中,着眼于某个特定次数的量化LSP时,由于在噪声区间的平均量化LSP和对应该处的量化LSP中存在有效的差,所以如上所述,使用第3动态参数,不仅求所有次数的量化LSP的差(噪声区间的平均量化LSP和对应子帧中的量化LSP之间的差)的平方和,而且求每个次数的量化LSP的差,即使仅在一个次数中确认出参数差大的情况下,就判定为话音区间。
由此,即使在噪声区间的平均量化LSP和对应该处的量化LSP呈现非常接近的值,并且对应该处的量化LSP的变动非常小的情况下,也可以更正确地进行模式判定。
在本实施例中,说明了在模式判定时使用所有的第1至第3动态参数来进行模式判定的情况,但在本发明中,也可以使用第1动态参数和第3动态参数来进行模式判定。
通过在编码器端包括判定其他噪声区间的算法,在判定为噪声区间的区间中进行作为LSP量化器的目标的LSP平滑,如果与使量化LSP的变动非常小的结构组合来使用,则可以进一步改善本模式判定的精度。
(实施例5)
在本实施例中,说明根据模式来设定自适应码簿检索范围的情况。
图9表示本实施例的进行间隔检索的结构方框图。在该结构中,包括:根据模式信息来决定检索范围的检索范围决定部901;在决定的检索范围中用目标矢量来进行间隔检索的间隔检索部902;用检索出的间隔从自适应码簿903中生成自适应码矢量的自适应码矢量生成部905;用自适应码矢量、目标矢量、以及间隔信息来检索噪声码簿的噪声码簿检索部906;以及用检索出的噪声码簿矢量和间隔信息从噪声自适应码簿904中生成噪声码矢量的噪声码矢量生成部907。
下面,说明用该结构来进行间隔检索的情况。首先,在进行了如实施例4所述的模式判定后,将模式信息输入到检索范围决定部901。在检索范围决定部901中,根据模式信息来决定间隔检索的范围。
具体地说,在定常噪声模式(或定常噪声模式和无声模式)中,将间隔检索范围设定在子帧长度以上(即,可追溯到以前子帧以上),在除此以外的模式中,将间隔检索范围包含在子帧长度以下。由此,防止在定常噪声区间的子帧内引起周期化。本发明人根据以下理由发现了最好在噪声码簿的结构中基于模式信息来限定间隔检索范围。
在构成经常采用固定的间隔周期化的噪声码簿时,即使将随机码簿(噪声的码簿)率提高至100%,也可确认出被称为swirling(旋涡)或water falling(瀑布)失真的代码失真残留大。对于该swirling失真来说,例如T.Wigren等人在“Improvements of Background Sound Coding in Linear Predictive SpeechCoders”IEEE Proc.ICASSP 95,pp25-28中所披露的,已知原因在于短期频谱(合成滤波器的频率特性)的变动。但是,间隔周期化的模型显然不适于表现不具有周期性的噪声信号,有可能产生周期化造成的特有失真。因此,在噪声码簿的结构中调查是否有间隔周期化的影响。分别对于在对噪声码矢量没有间隔周期化的情况、使自适应码矢量都为0的情况进行试听的结果,可确认无论哪个情况都残留swirling那样的失真。此外,在使自适应码矢量都为0,并且避开对噪声码矢量的间隔周期化处理时,可确认所述失真进一步减轻。因此,可以确认1个子帧内的间隔周期化很多成为所述失真的原因。
因此,本发明人首先在噪声模式中,在自适应码矢量的生成中,将间隔周期的检索范围仅限定为子帧长度以上的部分。由此,可以避免1个子帧内的周期性增强。
根据这样的模式信息,进行仅使用自适应码簿的一部分的控制、即在定常噪声模式中进行限定间隔周期的检索范围的控制,以及在解码端定常噪声模式中检测短的间隔周期,也可以检测差错。
用图10(a)来说明时,在模式信息为定常噪声模式情况下,检索范围成为限定在子帧长度(L)以上的检索范围②,而在模式信息是定常噪声模式以外的模式情况下,检索范围成为包含低于子帧长度范围的检索范围①(在图中,示出检索范围的下限(最短的间隔滞后)作为0,但8kHz采样时0~20个采样左右的范围作为间隔周期,由于过短,所以一般不检索,将15~20个采样以上的范围作为检索范围①)。该检索范围的切换在检索范围决定部901中进行。
在间隔检索部902中,在检索范围决定部901决定的检索范围中,用输入的目标矢量来进行间隔检索。具体地说,在决定的间隔检索范围中,通过对从自适应码簿903中取出的自适应码矢量卷积冲击响应,来计算自适应码簿分量,提取生成使该值和目标矢量之间的误差最小的自适应码矢量的间隔。在自适应码矢量生成部905中,根据求出的间隔来生成自适应码矢量。
在噪声码簿检索部906中,使用生成的自适应码矢量和目标矢量,以求出的间隔来检索噪声码簿。具体地说,噪声码簿检索部906通过对从噪声码簿904中取出的噪声码矢量卷积冲击响应,来计算噪声码簿分量,选出使该值和目标矢量之间的误差最小的噪声码矢量。
这样,在本实施例中,在定常噪声模式(或定常噪声模式和无声模式)中,通过将检索范围限定在子帧长度以上,可以抑制对噪声码矢量的间隔周期性,可以防止发生噪声码簿构成时的间隔周期化引起的特有失真。其结果,可以提高合成的定常噪声信号的自然性。
如果从控制间隔周期性的观点来考虑,在定常噪声模式(或定常噪声模式和无声模式)中,控制间隔周期化增益,即在定常噪声模式中,在自适应码矢量生成中,通过将间隔周期化增益下降至0或低于1,可以抑制对自适应码矢量的间隔周期化(自适应码矢量的间隔周期性)。例如,在定常噪声模式中,如图10(b)所示,使间隔周期化增益为0,并且如图10(c)所示,使间隔周期化增益下降至1以下。图10(d)是一般的自适应码矢量生成方法。图中的T0表示间隔周期。
对噪声码矢量也进行同样的控制。这样的控制可以由图11所示的结构来实现。在该结构中,从噪声码簿1103将噪声码矢量输入到周期化滤波器1102,周期化增益控制器1101根据模式信息来控制周期化滤波器1102的间隔周期化增益。
而且,对于一部分噪声码簿减弱间隔周期,对于残留的噪声码簿增强间隔周期化的结构也是有效的。
这样的控制可以由图12所示的结构来实现。在该结构中,从噪声码簿1203将噪声码矢量输入到周期化滤波器1201,从噪声码簿1204将噪声码矢量输入到周期化滤波器1202,周期化增益控制器1206根据模式信息来控制周期化滤波器1201、1202的间隔周期。例如,在噪声码簿1203是代数码簿,噪声码簿1204是随机码簿(例如,可列举出高斯码簿等)的情况下,使代数码簿所用的周期化滤波器1201的间隔周期化增益为1或接近1的值,而随机码簿所用的周期化滤波器1202的间隔周期化增益为比其低的值。由开关1205来选择任何一个噪声码簿的输出,作为噪声码簿整体的输出。
这样,在定常噪声模式(或定常噪声模式和无声模式)中,通过将检索范围限定在子帧长度以上,可以抑制对噪声码矢量的间隔周期性,可以防止发生噪声码簿构成时的间隔周期化引起的失真。其结果,可以改善对没有周期性的噪声信号这样的输入信号的编码性能。
在切换间隔周期化增益的情况下,对于自适应码簿,也可以形成与第2周期以后的周期化增益相同的结构,或使自适应码簿在第2周期以后都为0而没有周期化。这种情况下,为了对付周期化增益,通过复制使信号振幅衰减的当前子帧的线性预测残差信号等,可以就用现有的间隔检索法来进行间隔检索。
(实施例6)
在本实施例中,说明根据模式来切换间隔加权的情况。
在间隔检索时,一般使用防止倍间隔误差(选择间隔周期的整数倍的间隔的差错)的方法。但是,对于没有周期性的信号来说,该方法存在成为导致品质恶化因素的情况。在本实施例中,通过根据模式来ON/OFF切换防止该倍间隔差错的方法来避免这样的恶化。
图13表示本实施例的加权处理部的结构图。在该结构中,在进行候选间隔的选择的情况下,根据上述实施例中选择的模式信息来切换来自自相关函数计算器1301的输出,通过加权处理器1302或直接输入到最大化间隔选择器1303。即,在模式信息不是定常噪声模式的情况下,为了选择短的间隔,将来自自相关函数计算器1301的输出输入到加权处理器1302,在加权处理器1302中进行后述的加权处理,将该输出输入到最大化间隔选择器1303。在图13中,参考标号1304、1305是根据模式信息来切换来自自相关函数计算器1301的输出目的地的开关。
图14是根据上述模式信息来进行加权处理情况的流程图。在自相关函数计算器1301中,计算残差信号的归一化自相关函数(间隔周期)(ST1401)。即,设定开始比较的采样时刻(n=Pmax),求该时刻的自相关函数的结果(ST1402)。开始该比较的采样时刻是时间上最靠后的时刻。
接着,比较在该采样时刻的自相关函数的结果上加权后所得的结果(ncor_max×α)和在该采样的前一个采样时刻的自相关函数的结果(ncor[n-1])(ST1403)。这种情况下,加权以增大前一个采样时刻来设定(α<1)。
然后,如果(ncor[n-1])比(ncor_max×α)大,则假设该时刻的最大值(ncor_max)为ncor[n-1],间隔为n-1(ST1404)。然后,将加权的值α与系数γ(这里例如为0.994)相乘,将n的值设定为前一个采样时刻(n-1)(ST1405),判断n是否为最小值(Pmin)(ST1406)。另一方面,如果(ncor[n-1])不比(ncor_max×α)大,则将加权的值α与系数γ(0<γ≤1.0,这里例如为0.994)相乘,将n的值设定为前一个采样时刻(n-1)(ST1405),判断n是否为最小值(Pmin)(ST1406)。该判断在最大化间隔选择器1303中进行。
如果n为Pmin,则结束比较,输出候选帧间隔周期(pit)。如果n不是Pmin,则返回到ST1403,重复进行一连串的处理。
通过进行这样的加权,即通过将采样时刻移动到前一个时刻来减小加权系数(α),使前一个采样时刻的自相关函数所对应的阈值变小,所以容易选择短周期,可以避免倍间隔差错。
图15是不进行加权处理时选择候选间隔情况的流程图。在自相关函数计算器1301中,计算残差信号的归一化自相关函数(间隔周期)(ST1501)。即,设定开始比较的采样时刻(n=Pmax),求该时刻的自相关函数的结果(ST1502)。开始该比较的采样时刻是时间上最靠后的时刻。
接着,比较在该采样时刻的自相关函数的结果上加权后所得的结果(ncor_max)和在该采样的前一个采样时刻的自相关函数的结果(ncor[n-1])(ST1503)。
然后,如果(ncor[n-1])比(ncor_max)大,则假设该时刻的最大值(ncor_max)为ncor[n-1],间隔为n-1(ST1504)。然后,将n的值设定为前一个采样时刻(n-1)(ST1505),判断n是否为子帧(N_subframe)(ST1506)。另一方面,如果(ncor[n-1])不比(ncor_max×α)大,则将n的值设定为前一个采样时刻(n-1)(ST1505),判断n是否为子帧(N_subframe)(ST1506)。该判断在最大化间隔选择器1303中进行。
如果n为子帧(N_subframe),则结束比较,输出候选帧间隔周期(pit)。如果n不是子帧(N_subframe),则在采样时刻错开前一个采样时刻时返回到ST1503,重复进行一连串的处理。
这样,通过在不引起子帧内的间隔周期化的范围内进行间隔检索和不使短的间隔具有优先权,可以抑制定常噪声模式的品质恶化。在选择候选间隔周期中,对于所有的采样时刻进行比较来选择最大值,但在本发明中,将采样时刻至少分割成2个区域,分别在该区域中求出最大值后,可以用该最大值来进行比较。此外,间隔的检索顺序也可以从间隔周期短的顺序开始。
(实施例7)
在本实施例中,说明根据上述实施例中选择的模式信息来切换是否使用自适应码簿的情况。即,在模式信息为定常噪声模式(或定常噪声模式和无声模式)中,进行切换,以便不使用自适应码簿。
图16表示本实施例的话音编码装置的结构方框图。在图16中,对于与图1所示部分相同的部分附以与图1相同的标号,并省略其详细说明。
图16所示的话音编码装置包括:在定常噪声模式时使用的噪声码簿1602;与该噪声码簿1602对应的增益码簿1601;将增益与来自噪声码簿1602的噪声码矢量相乘的乘法器1603;根据来自模式选择器105的模式信息来进行码簿切换的开关1604;以及对代码进行复用并输出复用代码的复用装置1605。
在具有上述结构的话音编码装置中,根据来自模式选择器105的模式信息,开关1604对自适应码簿110和噪声码簿109的组合、以及噪声码簿1602进行切换。即,根据从模式选择器105输出的模式信息M来切换自适应码簿109所用的代码S1、自适应码簿110所用的代码P、和增益码簿11 1所用的代码G1的组合,以及噪声码簿1602所用的代码S2和增益码簿1601所用的代码G2的组合。
在模式选择器105输出定常噪声模式(定常噪声模式和无声模式)的信息时,开关1604切换到噪声码簿1602,不使用自适应码簿。另一方面,在模式选择器105输出定常噪声模式(定常噪声模式和无声模式)以外的模式信息时,开关1604切换到噪声码簿109和自适应码簿110。
将噪声码簿109所用的代码S1、自适应码簿110所用的代码P、增益码簿111所用的代码、噪声码簿1602所用的代码S2和增益码簿1601所用的代码G2暂时输入到复用装置1605。如上所述,复用装置1605根据模式信息M选择上述的某个组合,输出对选择的组合代码进行了复用的复用代码C。
图17表示本实施例的话音解码装置的结构方框图。在图17中,对与图2所示部分相同的部分附以相同的标号,并省略其详细说明。
图17所示的话音解码装置包括:定常噪声模式时使用的噪声码簿1702;与该噪声码簿1702对应的增益码簿1701;将增益与来自噪声码簿1702的噪声码矢量相乘的乘法器1703;根据来自模式选择器202的模式信息来进行码簿切换的开关1704;以及分离复用代码的复用分离装置1705。
在具有上述结构的话音解码装置中,根据来自模式选择器202的模式信息,开关1704对自适应码簿204和噪声码簿203的组合、以及噪声码簿1702进行切换。即,将复用代码C输入到复用分离装置1705,首先将模式信息进行分离、解码,根据解码的模式信息,将G1、P、S1的代码置位或G2、S2的代码置位的某一个进行分离、解码。将代码G1输出到增益码簿205,将代码P输出到自适应码簿204,将代码S1输出到噪声码簿203。此外,将代码S2输出到噪声码簿1702,将代码G2输出到增益码簿1701。
在模式选择器202输出定常噪声模式(定常噪声模式和无声模式)的信息时,开关1704切换到噪声码簿1702,不使用自适应码簿。另一方面,在模式选择器202输出定常噪声模式(定常噪声模式和无声模式)以外的模式信息时,开关1704切换到噪声码簿203和自适应码簿204。
这样,根据模式信息,通过对是否使用自适应码簿进行切换,根据输入(话音)信号的状态来选择适当的音源模型,所以可以改善解码信号的品质。
(实施例8)
在本实施例中,说明根据模式信息来使用模拟定常噪声生成器的情况。
作为定常噪声的音源,最好尽可能使用白色高斯噪声这样的音源,但在将脉冲音源用作音源的情况下,通过合成滤波器后不能得到期望的定常噪声。因此,在本实施例中,提供由生成白色高斯噪声那样的音源的音源生成部、以及表示定常噪声的频谱包络的LSP合成滤波器构成的定常噪声生成器。由于该定常噪声生成器生成的定常噪声不能在CELP的结构中表示,所以包括将上述结构的定常噪声生成器模型化来包括在话音解码装置中。然后,将该定常噪声生成器生成的定常噪声信号重叠在与话音区间/非话音区间无关的解码信号中。
在将该定常噪声信号重叠在解码信号中的情况下,经常在进行固定的听觉加权时,由于噪声区间的噪声电平有变小的倾向,所以即使将该定常噪声信号重叠在解码信号中,也可以在噪声电平不过于增大的情况下进行调整。
在本实施例中,通过从作为CELP型解码装置的构成要素的噪声码簿中随机地选择矢量来生成噪声驱动音源矢量,以生成的噪声驱动音源矢量为驱动信号,用定常噪声区间的平均LSP所指定的LPC合成滤波器来生成定常噪声信号。生成的定常噪声信号进行使定常噪声区间的平均功率成为常数倍(0.5倍左右)功率的定标,并与解码信号(后置滤波器输出信号)相加。由于将定常噪声相加后的信号功率与定常噪声相加前的信号功率相加,所以对相加后的信号也可以进行定标处理。
图18表示本实施例的话音解码装置的结构方框图。其中,定常噪声生成器1801包括:将噪声区间的平均LSP变换为LPC的LPC变换器1812;将来自噪声码簿1804中的随机码簿1804a的随机信号作为输入来生成噪声的噪声生成器1814;由生成的噪声信号驱动的合成滤波器1813;根据模式判定器1802判定的模式来计算定常噪声的功率的定常噪声功率计算器1815;以及将定常噪声的功率与合成滤波器1813合成的噪声信号相乘来进行定标的乘法器1816。
在包括这样的模拟定常噪声生成器的话音解码装置中,将从编码器传输的LSP代码L、表现噪声码矢量的码簿索引S、表现自适应码矢量的码簿索引A、以及表现增益信息的码簿索引G分别输入到LPC解码器1803、噪声码簿1804、自适应码簿1805、以及增益码簿。
LSP解码器1803从LSP代码L中对量化LSP进行解码,分别输出到模式判定器1802和LPC变换器1809。
模式判定器1802具有图19所示的结构,在模式决定器1901中,用从LSP解码器1803输入的量化LSP来决定模式,将该模式信息传送到噪声码簿1804和LPC变换器1809。此外,在平均LSP计算器控制器1902中,根据模式决定器1901决定的模式信息来控制平均LSP计算器1903。即,平均LSP计算器控制器1902在定常噪声模式中控制平均LSP计算器1902,以便从当前的量化LSP和以前的量化LSP中计算噪声区间的平均LSP。将该噪声区间的平均LSP输出到LPC变换器1812,同时输出到模式决定器1901。
噪声码簿1804存储预定个数的形状不同的噪声码矢量,输出由输入的代码S进行解码所得的噪声码簿索引指定的噪声码矢量。该噪声码簿1804具有随机码簿1804a和作为代数码簿的部分代数码簿1804b,例如在有声话音部对应的模式中,从部分代数码簿1804b中生成脉冲的噪声码矢量,在无声话音部和定常噪声部等对应的模式中,从随机码簿1804a中生成噪声的噪声码矢量。
根据模式判定器1802的判定结果,将随机码簿1804a的入口数和部分代数码簿1804b的入口数的比率进行切换。从噪声码簿1804输出的噪声码矢量从上述两种以上的模式的入口中选择最合适的入口,在乘法器1806乘以噪声码簿增益G后输出到加法器1808。
自适应码簿1805一边逐次更新以前生成的驱动音源信号一边进行缓冲,用对输入的代码P进行解码所得的自适应码簿索引(间隔周期(间隔滞后))来生成自适应码矢量。将自适应码簿1805生成的自适应码矢量用乘法器1807与自适应码簿增益G相乘后输出到加法器1808。
加法器1808进行从乘法器1806和1807输入的噪声码矢量和自适应码矢量的相加来生成驱动音源信号,并输出到合成滤波器1810。
合成滤波器1810用输入的量化LPC来构筑LPC合成滤波器。该合成滤波器将从加法器1808输出的驱动音源信号作为输入进行滤波器处理,将合成信号输出到后置滤波器1811。
后置滤波器1811对从合成滤波器1810输入的合成信号进行间隔增强、特性频带增强、频谱倾斜校正、增益调整等用于改善话音信号的主观品质的处理。
另一方面,将从模式判定器1802输出的噪声区间的平均LSP输入到定常噪声生成器1801的LPC变换器1812,在那里变换为LPC。将该LPC输入到合成滤波器1813。
噪声生成器1814从随机码簿1804a中随机地选择随机矢量,用选择出的矢量来生成噪声信号。合成滤波器1813由噪声生成器1814生成的的噪声信号来驱动。合成后的噪声信号被输出到乘法器1816。
定常噪声功率计算器1815用从模式判定器1802输出的模式信息、以及从后置滤波器1811输出的信号的功率变化的信息来判定可靠的定常噪声区间。所谓可靠的定常噪声区间表示所述模式信息为非话音区间(定常噪声区间),并且是所述功率变化少的区间。即使所述模式信息表示定常噪声区间,在所述功率变化极大上升的情况下,因存在作为话音上升部的可能性而用作话音区间。然后,计算判定为定常噪声区间的区间平均功率。而且,在乘法器1816中求应该与合成滤波器1813的输出信号相乘的定标系数,使得解码话音信号中重叠的定常噪声信号的功率不过大,以便获得将一定的系数与所述平均功率相乘所得的功率。在乘法器1816中,通过从定常噪声功率计算器1815输出的定标系数,使合成滤波器1813输出的噪声信号被定标。将该定标的噪声信号输出到加法器1817。在加法器1817中,将定标的噪声信号重叠在上述后置滤波器1811的输出上,可获得解码话音。
在上述结构的话音解码装置中,由于使用随机生成音源的滤波器驱动型的模拟定常噪声生成器1801,所以即使重复使用相同的合成滤波器、相同的功率信息,也不发生因段间的不连续造成的蜂鸣器声的噪声,可生成自然的噪声。
本发明不限于上述实施例1至8,可以实施各种变更。例如,可以将上述实施例1至8适当组合来实施。此外,本发明的定常噪声生成器可适用于任何类型的解码器,根据需要,也可以设置供给噪声区间的平均LSP的部件、判定噪声区间(模式信息)的部件、适当的噪声生成器(或适当的随机码簿)、以及供给(计算)噪声区间的平均功率(平均能量)的部件。
本发明的多模式话音编码装置包括:第1编码部,对表示话音信号中包含的声道信息的至少一种以上的参数进行编码;第2编码部,对表示所述话音信号中包含的音源信息的至少一种以上的参数可用几种模式来编码;模式判定部,根据所述第1编码部编码出的指定参数的动态特征来判定所述第2编码部的模式;以及合成部,根据所述第1和第2编码部编码出的多种参数信息来对输入话音信号进行合成;
所述模式切换部采用的结构包括:计算量化LSP参数的帧间变化的计算部;计算量化LSP参数为定常的帧中的平均量化LSP参数的计算部;以及计算所述平均量化LSP参数和当前量化LSP参数之间的距离,并检测指定次数的量化LSP参数和所述平均量化LSP参数之间的规定量的差的检测部。
根据该结构,由于检测指定次数的量化LSP参数和平均的量化LSP参数之间的规定量的差分,所以即使在对于平均化结果进行了判定的情况下未判定为话音区间时,也可以正确地判定话音区间。由此,即使在噪声区间的平均量化LSP和对应区间中的量化LSP呈现非常接近的值,并且对应区间中的量化LSP的变动非常小的情况下,也可以正确地进行模式判定。
本发明的多模式话音编码装置在上述结构中采用以下结构:包括检索范围决定部件,在模式为定常噪声模式的情况下,将间隔周期的检索范围设定为子帧长度以上的范围。
根据该结构,在定常噪声模式(或定常噪声模式和无声模式)中,通过将检索范围限定在子帧长度以上,可以抑制噪声码矢量所对应的间隔周期性,可以防止因解码话音信号产生的间隔周期化模型引起的编码失真。
本发明的多模式话音编码装置在上述结构中采用以下结构:包括间隔周期化增益控制部,在用码簿来决定间隔周期时,根据模式来控制间隔周期化增益。
根据该结构,可以避免一个子帧内的周期性增强。由此,可以防止自适应码矢量生成时产生的间隔周期化模型引起的编码失真。
本发明的多模式话音编码装置在上述结构中采用以下结构:间隔周期化增益控制部对应每个噪声码簿来控制增益。
根据该结构,在定常噪声模式(或定常噪声模式和无声模式)中,通过改变对每个噪声码簿的增益,可以抑制噪声码矢量所对应的间隔周期性,可以防止因噪声码矢量生成时产生的间隔周期化模型引起的编码失真。
本发明的多模式话音编码装置在上述结构中采用以下结构:间隔周期化增益控制部在模式是定常噪声模式的情况下降低间隔周期化增益。
本发明的多模式话音编码装置在上述结构中采用以下结构:包括:自相关函数计算部,在间隔周期的检索时,求输入话音的残差信号的自相关函数;加权处理部,根据模式对自相关函数的结果进行加权处理;以及选择部,用加权处理过的自相关函数的结果来选择候选间隔。
根据该结构,可以避免不具有间隔构造的信号所对应的解码话音信号的品质恶化。
本发明的多模式话音解码装置包括:第1解码部,对表示话音信号中包含的声道信息的至少一种以上的参数进行解码;第2解码部,对表示所述话音信号中包含的音源信息的至少一种以上的参数可用几种编码模式来解码;模式判定部,根据所述第1解码部解码出的指定参数的动态特征来进行所述第2解码部的模式判定;以及合成部,根据所述第1和第2解码部解码出的多种参数信息来对话音信号进行解码;
所述模式切换部采用如下结构,包括:计算量化LSP参数的帧间变化的计算部;计算量化LSP参数为定常的帧中的平均量化LSP参数的计算部;以及计算所述平均量化LSP参数和当前量化LSP参数之间的距离,并检测指定次数的量化LSP参数和所述平均量化LSP参数之间的规定量的差的检测部。
根据该结构,由于检测指定次数的量化LSP参数和平均的量化LSP参数之间的规定量的差分,所以即使在对于平均化结果进行了判定的情况下未判定为话音区间时,也可以正确地判定话音区间。由此,即使在噪声区间的平均量化LSP和对应区间中的量化LSP呈现非常接近的值,并且对应区间中的量化LSP的变动非常小的情况下,也可以正确地进行模式判定。
本发明的多模式话音解码装置在上述结构中采用以下结构:包括定常噪声生成部,在模式判定部件判定的模式是定常噪声模式的情况下,输出噪声区间的平均量化LSP参数,并且通过用从噪声码簿中取得的随机信号来驱动由根据所述平均量化LSP参数中求出的LPC参数构筑的合成滤波器,来生成定常噪声。
根据该结构,由于使用随机地生成音源的滤波器驱动型的模拟定常噪声生成器1801,所以即使重复使用相同的合成滤波器、相同的功率信息,也不发生因段间的不连续造成的蜂鸣器声的噪声,可生成自然的噪声。
如以上说明,根据本发明,在模式判定中,由于用第3动态参数以最大值来进行阈值判定,所以即使在大多数结果不超过阈值,而一个或两个结果超过阈值的情况下,也可以正确地判定话音区间。
本说明书基于2000年1月11日申请的(日本)特愿2000-002874专利申请。其内容全部包含于此。本发明使用LSP的帧间变化、以及求出的LSP和以前的噪声区间(定常区间)的平均LSP之间的距离来判定定常噪声区间的模式判定器作为基本构成。该内容基于1998年8月21日申请的(日本)特愿平10-236147号专利申请和1998年9月21日申请的特愿平10-266883号专利申请。这些内容也包含于此。
产业上的可利用性
本发明可以适用于数字移动通信系统等的位速低的话音编码装置,特别适用于将话音信号分离成声道信息和音源信息来表现的CELP型话音编码装置等。
Claims (7)
1、一种模式判定装置,其特征在于,包括:
平均LSP计算部件(609),计算量化LSP参数为定常的区间中的平均量化LSP参数;
差计算部件(610、604),按各个次数计算所述平均量化LSP参数的各个次数分量和当前帧的量化LSP参数的各个次数分量之间的差;以及
第1模式判定部件(606、607),将在任何一个次数计算出大于规定量的所述差的帧的模式判定为话音模式。
2、如权利要求1所述的模式判定装置,其特征在于,包括:
帧间变化计算部件(611、603),计算所述量化LSP参数的帧间变化;以及
第2模式判定部件(607),将所述帧间变化大于规定量的区间的模式判定为话音模式;其中
所述平均LSP计算部件将不被所述第2模式判定部件判定为话音模式的区间的全部或部分视为所述量化LSP参数为定常的区间;
所述第1模式判定部件在不被所述第2模式判定部件判定为话音模式的区间判定话音模式。
3、一种多模式话音解码装置,其特征在于,包括:
解码器(201),对表现量化LPC的代码进行解码,生成量化LSP参数;
使用所述解码器生成的量化LSP参数的如权利要求1所述的模式判定装置(202);以及
噪声码簿(203),根据该模式判定装置的判定结果,从表现噪声码矢量的代码生成脉冲的噪声码矢量或是噪声的噪声码矢量。
4、一种多模式话音解码装置,其特征在于,包括:
解码器(1803),对表现量化LPC的代码进行解码,生成量化LSP参数;
使用所述解码器生成的量化LSP参数的如权利要求1所述的模式判定装置(1802);以及
定常噪声生成器(1801),在不被该模式判定装置判定为话音模式的区间,通过用从噪声码簿(1804)中取得的随机信号来驱动由根据所述平均量化LSP参数中求出的LPC参数构筑的合成滤波器(1813),将生成的定常噪声重叠在解码话音。
5、一种多模式话音编码装置,其特征在于,包括:
LPC分析器(102),对输入信号进行LPC分析,计算LPC;
LPC量化器(103),对所述LPC进行量化获得量化LSP参数;
使用所述量化LSP参数的如权利要求1所述的模式判定装置(105);以及
噪声码簿(109),根据该模式判定装置的判定结果生成脉冲的噪声码矢量或是噪声的噪声码矢量。
6、如权利要求5所述的多模式话音编码装置,其特征在于,包括:
检索范围决定部(901),在不被如权利要求1所述的模式判定装置判定为话音模式的区间,将自适应码簿(903)的间隔周期的检索范围设定在子帧长度以上。
7、一种模式判定方法,其特征在于,包括:
计算量化LSP参数为定常的区间中的平均量化LSP参数的步骤;
按各个次数计算所述平均量化LSP参数的各个次数分量和当前帧的量化LSP参数的各个次数分量之间的差的步骤;以及
将在任何一个次数计算出大于规定量的所述差的帧的模式判定为话音模式的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2874/00 | 2000-01-11 | ||
JP2874/2000 | 2000-01-11 | ||
JP2000002874 | 2000-01-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1358301A CN1358301A (zh) | 2002-07-10 |
CN1187735C true CN1187735C (zh) | 2005-02-02 |
Family
ID=18531921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB018000150A Expired - Lifetime CN1187735C (zh) | 2000-01-11 | 2001-01-10 | 多模式话音编码装置和解码装置 |
Country Status (5)
Country | Link |
---|---|
US (2) | US7167828B2 (zh) |
EP (1) | EP1164580B1 (zh) |
CN (1) | CN1187735C (zh) |
AU (1) | AU2547201A (zh) |
WO (1) | WO2001052241A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105336337A (zh) * | 2011-04-21 | 2016-02-17 | 三星电子株式会社 | 针对语音信号或音频信号的量化方法以及解码方法和设备 |
US10229692B2 (en) | 2011-04-21 | 2019-03-12 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7167828B2 (en) * | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
EP1279167B1 (en) * | 2000-04-24 | 2007-05-30 | QUALCOMM Incorporated | Method and apparatus for predictively quantizing voiced speech |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
US8725501B2 (en) * | 2004-07-20 | 2014-05-13 | Panasonic Corporation | Audio decoding device and compensation frame generation method |
NZ562188A (en) * | 2005-04-01 | 2010-05-28 | Qualcomm Inc | Methods and apparatus for encoding and decoding an highband portion of a speech signal |
ES2350494T3 (es) * | 2005-04-01 | 2011-01-24 | Qualcomm Incorporated | Procedimiento y aparatos para codificar y decodificar una parte de banda alta de una señal de habla. |
US8892448B2 (en) * | 2005-04-22 | 2014-11-18 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor smoothing |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US8006155B2 (en) * | 2007-01-09 | 2011-08-23 | International Business Machines Corporation | Testing an operation of integrated circuitry |
US8364472B2 (en) * | 2007-03-02 | 2013-01-29 | Panasonic Corporation | Voice encoding device and voice encoding method |
ATE548727T1 (de) * | 2007-03-02 | 2012-03-15 | Ericsson Telefon Ab L M | Nachfilter für geschichtete codecs |
CN101266798B (zh) * | 2007-03-12 | 2011-06-15 | 华为技术有限公司 | 一种在语音解码器中进行增益平滑的方法及装置 |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US8768690B2 (en) * | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
KR20100006492A (ko) | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
GB2466674B (en) * | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466669B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
CN101859568B (zh) * | 2009-04-10 | 2012-05-30 | 比亚迪股份有限公司 | 一种语音背景噪声的消除方法和装置 |
CN101615910B (zh) | 2009-05-31 | 2010-12-22 | 华为技术有限公司 | 压缩编码的方法、装置和设备以及压缩解码方法 |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
RU2591661C2 (ru) * | 2009-10-08 | 2016-07-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума |
WO2011083849A1 (ja) * | 2010-01-08 | 2011-07-14 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 |
KR101702561B1 (ko) * | 2010-08-30 | 2017-02-03 | 삼성전자 주식회사 | 음원출력장치 및 이를 제어하는 방법 |
CN107170459B (zh) * | 2012-03-29 | 2020-08-04 | 瑞典爱立信有限公司 | 矢量量化器 |
JPWO2014034697A1 (ja) | 2012-08-29 | 2016-08-08 | 日本電信電話株式会社 | 復号方法、復号装置、プログラム、及びその記録媒体 |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
TWI615834B (zh) * | 2013-05-31 | 2018-02-21 | Sony Corp | 編碼裝置及方法、解碼裝置及方法、以及程式 |
US20150025894A1 (en) * | 2013-07-16 | 2015-01-22 | Electronics And Telecommunications Research Institute | Method for encoding and decoding of multi channel audio signal, encoder and decoder |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
US9135923B1 (en) * | 2014-03-17 | 2015-09-15 | Chengjun Julian Chen | Pitch synchronous speech coding based on timbre vectors |
JP6270993B2 (ja) | 2014-05-01 | 2018-01-31 | 日本電信電話株式会社 | 符号化装置、及びその方法、プログラム、記録媒体 |
ES2843300T3 (es) * | 2014-05-01 | 2021-07-16 | Nippon Telegraph & Telephone | Codificación de una señal de sonido |
JP6911939B2 (ja) * | 2017-12-01 | 2021-07-28 | 日本電信電話株式会社 | ピッチ強調装置、その方法、およびプログラム |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
DE69029120T2 (de) * | 1989-04-25 | 1997-04-30 | Toshiba Kawasaki Kk | Stimmenkodierer |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
JP2800599B2 (ja) * | 1992-10-15 | 1998-09-21 | 日本電気株式会社 | 基本周期符号化装置 |
JPH06180948A (ja) * | 1992-12-11 | 1994-06-28 | Sony Corp | ディジタル信号処理装置又は方法、及び記録媒体 |
JP3003531B2 (ja) | 1995-01-05 | 2000-01-31 | 日本電気株式会社 | 音声符号化装置 |
US5751903A (en) * | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
JPH0990974A (ja) * | 1995-09-25 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 信号処理方法 |
JPH09152896A (ja) | 1995-11-30 | 1997-06-10 | Oki Electric Ind Co Ltd | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 |
JP3299099B2 (ja) | 1995-12-26 | 2002-07-08 | 日本電気株式会社 | 音声符号化装置 |
US5802109A (en) | 1996-03-28 | 1998-09-01 | Nec Corporation | Speech encoding communication system |
JP3092652B2 (ja) | 1996-06-10 | 2000-09-25 | 日本電気株式会社 | 音声再生装置 |
EP1136985B1 (en) * | 1996-11-07 | 2002-09-11 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for CELP speech coding and decoding |
US6269331B1 (en) * | 1996-11-14 | 2001-07-31 | Nokia Mobile Phones Limited | Transmission of comfort noise parameters during discontinuous transmission |
JP4230550B2 (ja) | 1997-10-17 | 2009-02-25 | ソニー株式会社 | 音声符号化方法及び装置、並びに音声復号化方法及び装置 |
JP4308345B2 (ja) | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
JP3180786B2 (ja) | 1998-11-27 | 2001-06-25 | 日本電気株式会社 | 音声符号化方法及び音声符号化装置 |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
JP3490324B2 (ja) | 1999-02-15 | 2004-01-26 | 日本電信電話株式会社 | 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体 |
US6765931B1 (en) * | 1999-04-13 | 2004-07-20 | Broadcom Corporation | Gateway with voice |
US7167828B2 (en) * | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
-
2001
- 2001-01-10 US US09/914,916 patent/US7167828B2/en not_active Expired - Fee Related
- 2001-01-10 WO PCT/JP2001/000062 patent/WO2001052241A1/ja active Application Filing
- 2001-01-10 AU AU25472/01A patent/AU2547201A/en not_active Abandoned
- 2001-01-10 CN CNB018000150A patent/CN1187735C/zh not_active Expired - Lifetime
- 2001-01-10 EP EP01900640.2A patent/EP1164580B1/en not_active Expired - Lifetime
-
2006
- 2006-12-12 US US11/637,128 patent/US7577567B2/en not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105336337A (zh) * | 2011-04-21 | 2016-02-17 | 三星电子株式会社 | 针对语音信号或音频信号的量化方法以及解码方法和设备 |
US10224051B2 (en) | 2011-04-21 | 2019-03-05 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore |
US10229692B2 (en) | 2011-04-21 | 2019-03-12 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor |
CN105336337B (zh) * | 2011-04-21 | 2019-06-25 | 三星电子株式会社 | 针对语音信号或音频信号的量化方法以及解码方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
US20020173951A1 (en) | 2002-11-21 |
EP1164580A4 (en) | 2005-09-14 |
US7167828B2 (en) | 2007-01-23 |
AU2547201A (en) | 2001-07-24 |
WO2001052241A1 (en) | 2001-07-19 |
CN1358301A (zh) | 2002-07-10 |
EP1164580B1 (en) | 2015-10-28 |
EP1164580A1 (en) | 2001-12-19 |
US7577567B2 (en) | 2009-08-18 |
US20070088543A1 (en) | 2007-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1187735C (zh) | 多模式话音编码装置和解码装置 | |
CN1236420C (zh) | 量化线谱对参数特征提取器及其特征提取方法 | |
CN1240049C (zh) | 语音编码系统 | |
CN1172292C (zh) | 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备 | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN1252681C (zh) | 一种码激励线性预测语音编码器的增益量化 | |
CN1097396C (zh) | 声音编码装置和方法 | |
CN1161751C (zh) | 语音分析方法和语音编码方法及其装置 | |
CN1131507C (zh) | 音频信号编码装置、解码装置及音频信号编码·解码装置 | |
CN1202514C (zh) | 编码和解码语音及其参数的方法、编码器、解码器 | |
CN1201288C (zh) | 解码方法和设备 | |
CN1106710C (zh) | 向量量化装置和方法 | |
CN1488135A (zh) | 线性预测编码参数的矢量量化装置 | |
CN1703736A (zh) | 用于源控制可变比特率宽带语音编码的方法和装置 | |
CN1265355C (zh) | 音源矢量生成装置及语音编码/解码装置 | |
CN1391689A (zh) | 宽带语音和音频信号解码器中的增益平滑 | |
CN1249035A (zh) | 声音编码装置、声音译码装置及声音编码译码装置、以及声音编码方法、声音译码方法及声音编码译码方法 | |
CN1139912C (zh) | 码激励线性预测编码型语音编码装置 | |
CN1947173A (zh) | 分层编码装置及分层编码方法 | |
CN1122256C (zh) | 用前向和反向线性预测编码分析编码音频信号的方法和装置 | |
CN1222926C (zh) | 语音编码方法及其装置 | |
CN1890713A (zh) | 用于数字信号压缩编码的多脉冲字典的索引间的编码转换 | |
CN1293535C (zh) | 声音编码设备和方法以及声音解码设备和方法 | |
CN1144178C (zh) | 音频信号编码装置和译码装置以及音频信号编码和译码方法 | |
CN1135528C (zh) | 声音编码装置以及声音解码装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170524 Address after: Delaware Patentee after: III Holdings 12 Limited liability company Address before: Osaka Japan Patentee before: Matsushita Electric Industrial Co., Ltd. |
|
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20050202 |