CN116052700B - 声音编解码方法以及相关装置、系统 - Google Patents
声音编解码方法以及相关装置、系统 Download PDFInfo
- Publication number
- CN116052700B CN116052700B CN202210908196.9A CN202210908196A CN116052700B CN 116052700 B CN116052700 B CN 116052700B CN 202210908196 A CN202210908196 A CN 202210908196A CN 116052700 B CN116052700 B CN 116052700B
- Authority
- CN
- China
- Prior art keywords
- codebook
- gain
- algebraic codebook
- algebraic
- linear
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Abstract
本申请实施例提供了声音编解码方法以及相关装置、系统,改进了CELP编解码关于第一子帧中代数码本增益的计算过程。首先,可根据当前帧的分类参数CT的索引CTindex查表获得线性域中代数码本增益的线性估计值。之后,利用线性域中来自代数码本的代数码本矢量的能量(表示为)去除线性域中代数码本增益的线性估计值,得到第一子帧中代数码本的估计增益这样,在编解码计算第一子帧的代数码本的估计增益时,可以完全避免对数log运算和以10为底的指数运算这类复杂度高的运算,显著降低算法复杂度。
Description
技术领域
本申请涉及声音编解码领域,特别涉及基于码激励线性预测(code-excitedlinear prediction,CELP)的声音编解码技术。
背景技术
码激励线性预测(CELP)技术能够实现良好的质量和比特率折衷,最早由ManfredR. Schroeder和Bishnu S.Atal在1985年提出。在CELP编码器中,以帧为单位处理输入语音或音频信号(声音信号)。帧进一步被划分成更小的块,该更小的块被称为子帧。编解码器中,激励信号在每个子帧内被确定,包括两种分量:一种是来自过去的激励(也称为自适应码本),另一种是来自代数码本(也称为固定码本或创新码本)。编码侧向解码侧传输的不是原始声音,而是编码参数,例如代数码本的增益、自适应码本的增益,这些编码参数是在重构语音信号声音与原始语音信号之间的误差为最小值时计算出来的。如何降低计算复杂度是本领域的一个研究热点。
发明内容
本申请的各种实施例提供了一种声音编解码方法,能够降低计算码本增益的复杂度。
第一方面,提供了一种编码声音信号的方法,应用于当前帧中的第一子帧,该方法可包括:接收当前帧的帧分类参数索引,根据当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值,其中第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值。计算来自代数码本的代数码本矢量的能量,将线性域中代数码本增益的线性估计值除以代数码本矢量的能量的平方根得到代数码本的估计增益,然后将代数码本的估计增益乘以校正因子得到代数码本的量化增益。校正因子来自获胜码本矢量,获胜码本矢量选自增益码本。
第一方面提供的方法还可以包括:传输编码参数。该编码参数可包括:当前帧的帧分类参数索引,获胜码本矢量在增益码本中的索引。
第二方面,相对于第一方面的编码声音信号的方法,提供了一种解码声音信号的方法,同样应用于当前帧中的第一子帧,该方法可包括:接收编码参数,编码参数可包括:当前帧的帧分类参数索引,获胜码本矢量的索引,基于当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值。其中第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值。并且,计算来自代数码本的代数码本矢量的能量,将线性域中代数码本增益的线性估计值除以代数码本矢量的能量的平方根得到代数码本的估计增益。最后,将代数码本的估计增益乘以校正因子得到代数码本的量化增益,校正因子来自获胜码本矢量,获胜码本矢量是基于获胜码本矢量的索引选自于增益码本。
第一方面和第二方面提供的方法至少具有如下有益效果:在编解码计算第一子帧的代数码本的估计增益时,可以完全避免对数log运算和以10为底的指数运算这类复杂度高的运算,显著降低算法复杂度。并且,编解码器可直接查表获得当前帧的参数CT对应的的值,避免编解码器运行时再计算,从而降低了算法复杂度。
第三方面,提供了一种编码声音信号的方法,应用于当前帧中的第一子帧,该方法可包括:接收当前帧的帧分类参数索引,根据当前帧的帧分类参数索引在第一映射表中查找对数域中代数码本增益的线性估计值,其中第一映射表中的每一个条目包括两个值:帧分类参数索引和对数域中代数码本增益的线性估计值。并且,将对数域中代数码本增益的线性估计值通过指数运算转换到线性域中得到线性域中代数码本增益的线性估计值,计算来自代数码本的代数码本矢量的能量,将线性域中代数码本增益的线性估计值除以代数码本矢量的能量的平方根,得到代数码本的估计增益。最后,将代数码本的估计增益乘以校正因子得到代数码本的量化增益;校正因子来自获胜码本矢量,获胜码本矢量选自增益码本。
第三方面提供的方法还可以包括:传输编码参数,编码参数包括:当前帧的帧分类参数索引,获胜码本矢量在增益码本中的索引。
第四方面,相对于第三方面的编码声音信号的方法,提供了一种解码声音信号的方法,同样应用于当前帧中的第一子帧,该方法可包括:接收编码参数;编码参数包括:当前帧的帧类型,第一子帧中的线性估计常数,获胜码本矢量的索引;利用第一子帧中的线性估计常数和当前帧的帧类型进行线性估计,得到对数域中代数码本增益的线性估计值;将对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到线性域中代数码本增益的线性估计值;计算来自代数码本的代数码本矢量的能量;将线性域中代数码本增益的线性估计值除以代数码本矢量的能量的平方根,得到代数码本的估计增益;将代数码本的估计增益乘以校正因子得到代数码本的量化增益,校正因子来自获胜码本矢量,获胜码本矢量是基于获胜码本矢量的索引选自于增益码本。
第三方面和第四方面提供的方法至少具有如下有益效果:在编解码计算第一子帧的代数码本的估计增益时,可以避免代数码本矢量的能量Ec涉及的对数运算和指数运算,降低算法复杂度。并且,编解码器可直接查表获得当前帧的参数CT对应的a0+a1CT的值,可以避免编解码器运行时再计算该值,节约了计算量。
第五方面,提供了一种编码声音信号的方法,应用于当前帧中的第一子帧,该方法可包括:利用第一子帧中的线性估计常数和当前帧的帧类型进行线性估计,得到对数域中代数码本增益的线性估计值;将对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到线性域中代数码本增益的线性估计值;计算来自代数码本的代数码本矢量的能量;将线性域中代数码本增益的线性估计值除以代数码本矢量的能量的平方根,得到代数码本的估计增益;将代数码本的估计增益乘以校正因子得到代数码本的量化增益;校正因子来自获胜码本矢量,获胜码本矢量选自增益码本。
第五方面提供的方法还可以包括:传输编码参数,编码参数包括:当前帧的帧类型,线性估计常数,获胜码本矢量在增益码本中的索引。
第六方面,相对于第五方面的编码声音信号的方法,提供了一种解码声音信号的方法,同样应用于当前帧中的第一子帧,该方法可包括:接收编码参数;编码参数包括:当前帧的帧类型,第一子帧中的线性估计常数,获胜码本矢量的索引;利用第一子帧中的线性估计常数和当前帧的帧类型进行线性估计,得到对数域中代数码本增益的线性估计值;将对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到线性域中代数码本增益的线性估计值;计算来自代数码本的代数码本矢量的能量;将线性域中代数码本增益的线性估计值除以代数码本矢量的能量的平方根,得到代数码本的估计增益;将代数码本的估计增益乘以校正因子得到代数码本的量化增益,校正因子来自获胜码本矢量,获胜码本矢量是基于获胜码本矢量的索引选自于增益码本。
第五方面和第六方面提供的方法至少具有如下有益效果:在编解码计算第一子帧的代数码本的估计增益时,可以避免代数码本矢量的能量Ec涉及的对数运算和指数运算,降低算法复杂度。
第七方面,提供了一种编码声音信号的方法,应用于当前帧中的第一子帧,该方法可包括:接收当前帧的帧分类参数索引;根据当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;计算来自代数码本的代数码本矢量的能量Ec,并对能量的平方根进行以10为底的对数运算,再对对数运算后的值取相反数后进行以10为底的指数运算得到将线性域中代数码本增益的线性估计值乘以得到代数码本的估计增益;将代数码本的估计增益/>乘以校正因子得到代数码本增益的量化增益,校正因子来自获胜码本矢量,获胜码本矢量选自增益码本。
第七方面提供的方法还可以包括:传输编码参数,编码参数包括:当前帧的帧分类参数索引,获胜码本矢量在增益码本中的索引。
第八方面,相对于第七方面的编码声音信号的方法,提供了一种解码声音信号的方法,同样应用于当前帧中的第一子帧,该方法可包括:接收编码参数;编码参数包括:当前帧的帧分类参数索引,获胜码本矢量的索引;根据当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;计算来自代数码本的代数码本矢量的能量Ec,并对能量的平方根进行以10为底的对数运算,再对对数运算后的值取相反数后进行以10为底的指数运算得到将线性域中代数码本增益的线性估计值乘以得到代数码本的估计增益;将代数码本的估计增益/>乘以校正因子得到代数码本增益的量化增益,校正因子来自获胜码本矢量,获胜码本矢量是基于获胜码本矢量的索引选自于增益码本。
第七方面和第八方面提供的方法至少具有如下有益效果:编解码器可直接查表获得当前帧的参数CT对应的的值,可以避免代数码本增益的线性估计值涉及的以10为底的指数运算,降低了算法复杂度。
以上第一方面至第八方面提供的编解码声音信号的方法,还可以包括:利用代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献。并且,利用选自增益码本的获胜码本矢量包括的。最后,将代数码本的激励贡献与自适应码本的激励贡献相加,得到总的激励。总的激励可以通过合成滤波器重构出语音信号。
第九方面,提供了一种具有语音编码功能的装置,可用于实现上述第一方面提供的方法,该装置可包括:查找部件,如图6中示出的查表模块601,用于根据当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值。其中,第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值。第一计算器,包括如图6中示出的平方求和器603、平方根计算器604,用于计算来自代数码本的代数码本矢量的能量。第一乘法器,如图6中示出的乘法器602,用于将线性域中代数码本增益的线性估计值乘以代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益。第二乘法器,如图6中示出的乘法器605,用于将代数码本的估计增益乘以获胜码本矢量包括的校正因子,得到代数码本的量化增益;获胜码本矢量选自增益码本。
第九方面提供的装置还可以包括:通信部件,通信部件用于传输编码参数,编码参数包括:当前帧的帧分类参数索引,获胜码本矢量在增益码本中的索引。
第十方面,提供了一种具有语音解码功能的装置,可用于实现上述第二方面提供的方法,该装置可包括:通信部件,通信部件用于接收编码参数。编码参数包括:当前帧的帧分类参数索引,获胜码本矢量的索引。第一查找部件,如图6中示出的查表模块601,用于基于当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值。第一计算器,包括如图6中示出的平方求和器603、平方根计算器604,用于计算来自代数码本的代数码本矢量的能量。第一乘法器,如图6中示出的乘法器602,用于将线性域中代数码本增益的线性估计值乘以代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益。第二乘法器,如图6中示出的乘法器605,用于将代数码本的估计增益乘以校正因子得到代数码本的量化增益,校正因子来自获胜码本矢量。第二查找部件,用于基于获胜码本矢量的索引从增益码本查找出获胜码本矢量。
第十一方面,提供了一种具有语音编码功能的装置,可用于实现上述第三方面提供的方法,该装置可包括:查找部件,如图7中示出的查表模块701,用于根据当前帧的帧分类参数索引在第一映射表中查找对数域中代数码本增益的线性估计值;第一映射表中的每一个条目包括两个值:帧分类参数索引和对数域中代数码本增益的线性估计值。转换器,如图7中示出的指数计算器702,用于将对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到线性域中代数码本增益的线性估计值。第一计算器,包括如图7中示出的平方求和器704、平方根计算器705,用于计算来自代数码本的代数码本矢量的能量。第一乘法器,如图7中示出的乘法器703,用于将线性域中代数码本增益的线性估计值乘以代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益。第二乘法器,如图7中示出的乘法器707,用于将代数码本的估计增益乘以获胜码本矢量包括的校正因子,得到代数码本的量化增益;获胜码本矢量选自增益码本。
第十一方面提供的装置还可以包括:通信部件,通信部件用于传输编码参数,编码参数包括:当前帧的帧分类参数索引,获胜码本矢量在增益码本中的索引。
第十二方面,提供了一种具有语音解码功能的装置,可用于实现上述第四方面提供的方法,该装置可包括:通信部件,通信部件用于接收编码参数。其中编码参数包括:当前帧的帧分类参数索引,获胜码本矢量的索引。第一查找部件,如图7中示出的查表模块701,用于基于当前帧的帧分类参数索引在第一映射表中查找对数域中代数码本增益的线性估计值;第一映射表中的每一个条目包括两个值:帧分类参数索引和对数域中代数码本增益的线性估计值。转换器,如图7中示出的指数计算器702,用于将对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到线性域中代数码本增益的线性估计值。
第一计算器,包括如图7中示出的平方求和器704、平方根计算器705,用于计算来自代数码本的代数码本矢量的能量。第一乘法器,如图7中示出的乘法器703,用于将线性域中代数码本增益的线性估计值乘以代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益。第二乘法器,如图7中示出的乘法器707,用于将代数码本的估计增益乘以校正因子得到代数码本的量化增益,校正因子来自获胜码本矢量。第二查找部件,用于基于获胜码本矢量的索引从增益码本查找出获胜码本矢量。
第十三方面,提供了一种具有语音编码功能的装置,可用于实现上述第五方面提供的方法,该装置可包括:线性预测部件,如图8中示出的线性估计模块801,用于利用第一子帧中的线性估计常数和当前帧的帧类型进行线性估计,得到对数域中代数码本增益的线性估计值。转换器,如图8中示出的指数计算器802,用于将对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到线性域中代数码本增益的线性估计值。第一计算器,包括如图8中示出的平方求和器804、平方根计算器805,用于计算来自代数码本的代数码本矢量的能量。第一乘法器,如图8中示出的乘法器803,用于将线性域中代数码本增益的线性估计值乘以代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益。第二乘法器,如图8中示出的乘法器806,用于将代数码本的估计增益乘以获胜码本矢量包括的校正因子,得到代数码本的量化增益;获胜码本矢量选自增益码本。
第十三方面提供的装置还可以包括:通信部件,通信部件用于传输编码参数,编码参数包括:当前帧的帧类型,线性估计常数,获胜码本矢量在增益码本中的索引。
第十四方面,提供了一种具有语音解码功能的装置,可用于实现上述第六方面提供的方法,该装置可包括:通信部件,通信部件用于接收编码参数。编码参数包括:当前帧的帧类型,第一子帧中的线性估计常数,获胜码本矢量的索引。线性预测部件,如图8中示出的线性估计模块801,用于利用第一子帧中的线性估计常数和当前帧的帧类型进行线性估计,得到对数域中代数码本增益的线性估计值。转换器,如图8中示出的指数计算器802,用于将对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到线性域中代数码本增益的线性估计。第一计算器,包括如图8中示出的平方求和器804、平方根计算器805,用于计算来自代数码本的代数码本矢量的能量。第一乘法器,如图8中示出的乘法器803,用于将线性域中代数码本增益的线性估计值乘以代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益。第二乘法器,如图8中示出的乘法器806,用于将代数码本的估计增益乘以校正因子得到代数码本的量化增益,校正因子来自获胜码本矢量。查找部件,用于基于获胜码本矢量的索引从增益码本查找出获胜码本矢量。
第十五方面,提供了一种具有语音编码功能的装置,可用于实现上述第七方面提供的方法,该装置可包括:第一查找部件,如图9中使出的查表模块901,用于根据当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值。第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值。第一计算器,包括如图9中示出的平方求和器903、平方根计算器904,用于计算来自代数码本的代数码本矢量的能量Ec。对数运算器,如图9中示出的计算器905,用于对能量的平方根进行以10为底的对数运算。指数运算器,如图9中示出的计算器906,用于对对数运算后的值取相反数后进行以10为底的指数运算得到第一乘法器,如图9中示出的乘法器902,用于将线性域中代数码本增益的线性估计值乘以/>得到代数码本的估计增益。第二乘法器,如图9中示出的乘法器907,用于将代数码本的估计增益/>乘以校正因子得到代数码本增益的量化增益,校正因子来自获胜码本矢量,获胜码本矢量选自增益码本。
第十五方面提供的装置还可以包括:通信部件,通信部件用于传输编码参数,编码参数包括:当前帧的帧分类参数索引,获胜码本矢量在增益码本中的索引。
第十六方面,提供了一种具有语音解码功能的装置,可用于实现上述第八方面提供的方法,该装置可包括:通信部件,用于接收编码参数。编码参数包括:当前帧的帧分类参数索引,获胜码本矢量在增益码本中的索引。第一查找部件,如图9中使出的查表模块901,用于根据当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值。第一计算器,包括如图9中示出的平方求和器903、平方根计算器904,用于计算来自代数码本的代数码本矢量的能量Ec。对数运算器,如图9中示出的计算器905,用于对能量的平方根进行以10为底的对数运算。指数运算器,如图9中示出的计算器906,用于对对数运算后的值取相反数后进行以10为底的指数运算得到第一乘法器,如图9中示出的乘法器902,用于将线性域中代数码本增益的线性估计值乘以/>得到代数码本的估计增益。第二乘法器,如图9中示出的乘法器907,用于将代数码本的估计增益乘以校正因子得到代数码本增益的量化增益,校正因子来自获胜码本矢量。第二查找部件,用于基于获胜码本矢量的索引从增益码本查找出获胜码本矢量。
以上第九方面至第十六方面提供的具有语音编、解码功能的装置,还可以进一步包括:
第三乘法器,用于利用代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献;
第四乘法器,用于利用选自增益码本的获胜码本矢量包括的自适应码本的量化增益乘以来自自适应码本的自适应码本矢量,得到自适应码本的激励贡献;
加法器,用于将代数码本的激励贡献与自适应码本的激励贡献相加,得到总的激励。
第十七方面,提供了一种语音通信系统,可包括:第一装置、第二装置,其中:第一装置可用于执行上述第一、第三、第五、第七提供的编码声音信号的方法,第二装置可用于执行上述第二、第四、第六、第八提供的编码声音信号的方法。第一装置可以是上述第九、第十一、第十三、第十五提供的具有语音编码功能的装置,第二装置可以是上述第时、第十二、第十四、第十六提供的具有语音解码功能的装置。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例中所需要使用的附图进行说明。
图1示出了一种现有的CELP编码算法框图;
图2示出了一种现有的CELP解码算法框图;
图3示出了无记忆联合增益编码的编码器中的增益量化过程;
图4示出了第一子帧中计算代数码本增益的过程;
图5示出了第二子帧及以后子帧中计算代数码本增益的过程;
图6示出了本申请实施例一提供的第一子帧中计算代数码本增益的过程;
图7示出了本申请实施例二提供的第一子帧中计算代数码本增益的过程;
图8示出了本申请实施例三提供的第一子帧中计算代数码本增益的过程;
图9示出了本申请实施例四提供的第一子帧中计算代数码本增益的过程;
图10示出了利用计算的估计常数用于增益码本设计的流程;
图11示出了本申请实施例提供的包括语音编码装置和语音解码装置的语音通信系统。
具体实施方式
本申请实施例对CELP编解码的现有技术进行了改进,可以在实现无记忆联合增益编码的同时,降低计算码本增益的复杂度。
现有的CELP编解码技术
图1示出了一种现有的CELP编码算法框图。
输入语音信号首先被进行预处理。在预处理中,可以对输入语音信号进行采样和预加重等。预处理后的信号进一步输出给LPC分析量化插值模块101和加法器102。LPC分析量化插值模块101对输入语音信号进行线性预测分析,并对分析结果进行量化、插值,计算出线性预测编码(linear prediction coding,LPC)参数。LPC参数用于构造合成滤波器(synthesis filter)103。来自代数码本的代数码本矢量乘以代数码本增益gc的结果,与来自自适应码本的自适应码本矢量乘以自适应码本增益gp的结果都输出加法器104相加,相加结果输出到合成滤波器103,以此构造激励信号经合成滤波器103后所生成的重构语音信号。重构语音信号也输出到加法器102,与输入语音信号相减得到误差信号。
该误差信号经感知加权(perceptual weighting)滤波器105处理,根据听觉感受改变频谱,反馈给基音分析(pitch analysis)模块106和代数码本搜索(algebra codebooksearch) 模块107。感知加权滤波器105也是依据LPC参数构造的。
根据使感知加权的误差信号均方差最小的原则确定激励信号及码本增益。基音分析模块 106通过自相关分析推得基音周期,据此搜索自适应码本以确定最佳自适应码本矢量,得到语音中具有准周期特性的激励信号。代数码本搜索模块107搜索代数码本,根据最小化加权均方差的准则确定最佳代数码本矢量,得到语音模型的随机激励信号。然后,确定最佳自适应码本矢量的增益和最佳代数码本矢量的增益。码本的量化增益、最佳自适应码本矢量在自适应码本中的索引、最佳代数码本矢量在代数码本中的索引,以及线性预测编码参数等这些编码参数形成比特流传输至解码侧。
图2示出了一种现有的CELP解码算法框图。
首先,解码侧从压缩比特流中取得各编码参数。然后,解码侧利用这些编码参数生成激励信号。对每个子帧进行如下处理:自适应码本矢量和代数码本矢量乘以各自的量化增益得到激励信号;激励信号经过线性预测合成滤波器201得到重构语音信号。解码侧,线性预测合成滤波器201也同样是依据LPC参数构造的。
无记忆联合增益编码(memory-less joint gain coding)
进一步的,可以在每一个子帧对自适应码本增益和代数码本增益可实施无记忆联合增益编码,尤其是在低比特速率(如7.2kbps、8kbps)下。实施联合增益编码后,随比特流传输的是自适应码本的量化增益gp在增益码本(gain codebook)中的索引。
在增益量化过程之前,假设滤波的自适应码本和代数码本已经知道。编码器中的增益量化通过基于最小均方差MMSE原则搜索已设计好的增益码本来实现。增益码本中的每一个条目包括两个值:自适应码本的量化增益gp和用于代数码本增益的校正因子γ。代数码本增益的估计提前完成,其结果gc0被用来乘以从增益码本中选择出的校正因子γ。在每一个子帧内,增益码本都会被完全的搜索一遍,例如索引q=0,...,Q-1。如果激励的自适应部分的量化增益被强制要求低于特定阈值,则限制搜索范围是可能的。为允许减小搜索范围,增益码本中的码本条目可以以gp的取值进行升序排列。增益量化过程可如图3所示。
增益量化通过最小化误差信号e(i)的能量来实现。误差能量通过如下公式表示:
E=eTe=(x-gPy-gcz)T(x-gPy-gcz) 公式(1)
将gc替换成γ*gc0,该公式可展开成:
常量c0,c1,c2,c3,c4和c5以及估计的增益gc0在搜索增益码本之前被计算。针对每一个码本条目计算误差能量E。导致最小误差能量的码本矢量[gp;γ]被选为获胜码本矢量,其条目对应自适应码本的量化增益gp和γ。
然后,固定码本的量化增益gc可如下计算:
gc=gc0*γ 公式(3)
在解码器中,接收到的索引被用来获取自适应激励的的量化增益gp以及代数激励的估计增益的量化校正因子γ。在编码器中,激励的代数部分的估计增益也通过同样方式完成。
在当前帧的第一个子帧中,代数码本的估计(预测)增益由下面公式(4)给出:
其中,CT是编码分类参数(编码模式),是在编码器预处理部分为当前帧选择的类型。 Ec是滤波后的代数码本矢量的能量,以dB为单位,在下面的公式(5)中计算得到。估计常数a0和a1是在大信号数据库上通过MSE最小化确定的。上式中的编码模式参数CT,它对于当前帧的所有子帧都是恒定的。上标[0]表示当前帧的第一个子帧。
其中,c(n)是滤波后的代数码矢量。
图4中示出了第一个子帧的增益估计过程。
代数码本增益的估计过程概述如下:根据当前帧的分类参数CT估计代数码本增益,估计的代数码本增益中已经排除了来自代数码本的代数码矢量的能量。最后,代数码本的估计增益乘以从增益码本中选择的校正因子γ,得到量化后的代数码本增益gc。
具体的,如图4所示,首先在对数域中根据分类参数CT对代数码本增益进行线性估计,得到代数码本增益的线性估计值:a0+a1CT。然后,从该线性估计值中减去来自代数码本的代数码本矢量的能量参数得到对数域中代数码本的估计增益:其中 Ec通过上面公式(5)得到。之后,将对数域中代数码本的估计增益转换到线性域,得到线性域中代数码本的估计增益/>参考上面公式(4)。最后,将代数码本的估计增益/>乘以从增益码本中选择的校正因子γ,得到量化后的代数码本增益/>
自适应码本的量化增益直接从增益码本中选择,具体基于最小均方差MMSE原则搜索增益码本,参考上面公式(2)。
在当前帧的第一个子帧之后的所有子帧使用略有不同的估计方案。不同之处在于,在这些子帧中,来自先前子帧的自适应码本和代数码本的量化增益都用作辅助估计参数以提高效率。第k个子帧中代数码本的估计增益,k>0,由下面公式(6)给出:
其中k=1,2,3。指数中的第一个和第二个求和项∑,分别表示先前子帧的代数码本的量化增益和自适应码本的量化增益。估计常数b0,…,b2k+1也是在大信号数据库上通过MSE最小化确定的。
图5中示出了第二个子帧以及之后子帧的增益估计过程。与第一帧中不同的是,除了当前帧的分类参数CT,还要根据之前子帧的自适应和代数码本的量化增益估计在后子帧的代数码本增益。
具体的,如图5所示,首先在对数域中计算得到代数码本的估计增益: 即公式(6)中的指数项。然后,将对数域中代数码本的估计增益转换到线性域。最后将线性域估计的代数码本增益乘以来自增益码本中选择的校正因子γ,形成量化后的代数码本增益/>
第二个子帧以及之后子帧中,自适应码本的量化增益同样直接从增益码本中选择。
第二个子帧以及之后子帧与第一子帧的估计过程的不同之处还在于,没有从对数域的代数码本的估计增益中减去来自代数码本的代数码本矢量的能量。其原因在于,在后子帧的增益估计依据了在前子帧的代数码本增益,而在前的第一个子帧的代数码本增益中已经减去了该能量,在后子帧的增益估计无需再考虑移除该能量的影响。
关于无记忆联合增益编码,可进一步参考如下文献:3GPP TS26.445,"Codec forEnhanced Voice Services(EVS);Detailed algorithmic description",在此通过引用将其全部内容并入本文中。
在解码器中,根据索引从增益码本中找到导致最小误差能量的获胜码本矢量[gp;γ],其中gp为自适应码本的量化增益,并利用校正因子γ乘以代数码本的估计增益gc0得到代数码本的量化增益gc。gc0的计算方式与编码器中采用的方式相同。从比特流中解码获得自适应码本矢量和代数码本矢量,分布乘以自适应、代数码本的量化增益,得到自适应、代数激励贡献。最后,将这两种激励贡献加在一起以形成总激励,并通过线性预测合成滤波器滤波总激励重构出语音信号。
上述CELP编解码的现有技术存在计算复杂度较高的问题。例如,上面公式(4),在第一子帧中估算代数码本增益需要同时进行对数log运算和以10为底的指数运算,计算量较大。
为此,本申请各个实施例改进了第一子帧中代数码本增益的计算过程,可节约对数log 运算和以10为底的指数运算这类复杂度高的运算,降低码本增益的计算复杂度。
实施例一
实施例一提供的第一子帧中代数码本增益的计算过程,对第一子帧中代数码本的估计增益的计算公式进行了如下优化,以实现复杂度的降低(保证计算结果不变,不影响效果):
由于线性域中代数码本增益的线性估计值只与分类参数CT以及对数域中的估计常数a0、a1有关,因此,/>的取值可以提前通过表格枚举出来。/>表示线性域中代数码本增益的线性估计值。编解码器可维护着一张映射表b,表b中每一个条目包括两个值:分类参数CT的索引CTindex和线性域中代数码本增益的线性估计值这样,编解码器可直接查表获得当前帧的参数CT对应的/>的值,避免编解码器运行时再计算,从而降低了算法复杂度。
令
公式(7)计算过程可进一步简化为:
公式(9)所表示的第一子帧中代数码本的估计增益的计算过程可概述如下:首先,根据当前帧的分类参数CT的索引CTindex查表获得线性域中代数码本增益的线性估计值。之后,利用线性域中来自代数码本的代数码本矢量的能量Ec的平方根(表示为)去除线性域中代数码本增益的线性估计值,得到第一子帧中代数码本的估计增益/>这样,在编解码计算第一子帧的代数码本的估计增益时,可以完全避免对数log运算和以10为底的指数运算这类复杂度高的运算,显著降低算法复杂度。
编码侧向解码侧可以传输以下编码参数:当前帧的分类参数CT的索引CTindex,获胜码本矢量[gp;γ]在增益码本中的索引。
图6示出了实施例一提供的第一子帧中代数码本增益的计算过程。
如图6所示,首先向查表模块601输入当前前帧的分类参数CT的索引CTindex。然后,查表模块601根据索引CTindex查表获得线性域中代数码本增益的线性估计值(下面表示为b[CTindex]),并输出b[CTindex]到乘法器602。并且,依次通过平方求和器603、平方根计算器604计算来自代数码本的代数码本矢量的能量的平方根值:平方求和器603通过上面公式(5)计算得到Ec,之后输出/>的倒数值至乘法器602,用以去除b[CTindex]进而获得代数码本的估计增益/>然后,输出代数码本的估计增益/>至乘法器605,用以来乘以来自增益码本的校正因子γ得到代数码本的量化增益/>代数码本的量化增益/>可进一步输出到乘法器606,用以来乘以自代数码本的代数码本矢量(滤波后的代数激励)得到激励的代数码本贡献。最终,激励的代数码本贡献输出到加法器607,用以和激励的自适应码本贡献相加得到总的滤波后的激励。
其中,激励的自适应码本贡献由输出到乘法器608的来自自适应码本的自适应码本矢量 (滤波后的自适应激励)乘以来自增益码本的自适应码本的量化增益得到。自适应码本的量化增益/>直接从增益码本中选择,具体基于最小均方差MMSE原则搜索增益码本,参考上面公式(2)。
实施例二
实施例二提供的第一子帧中代数码本增益的计算过程,对第一子帧中代数码本的估计增益的计算公式也进行了如下优化(同上述公式(7)),以实现复杂度的降低:
与实施例一稍有不同的是,只将公式(7)中a0+a1CT的取值提前通过表格枚举出来。a0+a1CT 表示对数域中代数码本增益的线性估计值。此时,编解码器维护的映射表b中每一个条目可包括两个值:分类参数CT的索引CTindex和对数域中代数码本增益的线性估计值a0+a1CT。这样,编解码器可直接查表获得当前帧的参数CT对应的a0+a1CT的值,可以避免编解码器运行时再计算该值,节约了计算量。
令b[CTindex]=a0+a1CT 公式(10)
公式(7)计算过程可进一步简化为:
公式(11)所表示的第一子帧中代数码本的估计增益的计算过程可概述如下:首先,根据当前帧的分类参数CT的索引CTindex查表获得对数域中代数码本增益的线性估计值。之后,利用线性域中来自代数码本的代数码本矢量的能量Ec的平方根(表示为)去除线性域中代数码本增益的线性估计值,得到第一子帧中代数码本的估计增益/>这样,在编解码计算第一子帧的代数码本的估计增益时,可以减少对数log运算和以10为底的指数运算这类复杂度高的运算,降低算法复杂度。
编码侧向解码侧可以传输以下编码参数:当前帧的分类参数CT的索引CTindex,获胜码本矢量[gp;γ]在增益码本中的索引。
图7示出了实施例二提供的第一子帧中代数码本增益的计算过程。
如图7所示,首先向查表模块701输入当前前帧的分类参数CT的索引CTindex。然后,查表模块701根据索引CTindex查表获得对数域中代数码本增益的线性估计值(下面表示为b[CTindex]),并输出b[CTindex]到以10为底的指数计算器702获得线性域中代数码本增益的线性估计值:接着,输出线性域中代数码本增益的线性估计值/>到乘法器703。并且,依次通过平方求和器704、平方根计算器705计算来自代数码本的代数码本矢量的能量的平方根值:/>平方求和器704通过上面公式(5)计算得到Ec,之后输出/>的倒数值至乘法器703,用以去除/>进而获得代数码本的估计增益/>然后,输出代数码本的估计增益/>至乘法器706,用以来乘以来自增益码本的校正因子γ得到代数码本的量化增益/>代数码本的量化增益/>可进一步输出到乘法器707,用以来乘以自代数码本的代数码本矢量 (滤波后的代数激励)得到激励的代数码本贡献。最终,激励的代数码本贡献输出到加法器 708,用以和激励的自适应码本贡献相加得到总的滤波后的激励。
其中,激励的自适应码本贡献由输出到乘法器709的来自自适应码本的自适应码本矢量 (滤波后的自适应激励)乘以来自增益码本的自适应码本的量化增益得到。自适应码本的量化增益/>直接从增益码本中选择,具体基于最小均方差MMSE原则搜索增益码本,参考上面公式(2)。
实施例三
实施例三提供的第一子帧中代数码本增益的计算过程,对第一子帧中代数码本的估计增益的计算公式也进行了如下优化(同上述公式(7)),以实现复杂度的降低:
与前面实施例不同的是,并不将线性域中代数码本增益的线性估计值或对数域中代数码本增益的线性估计值a0+a1CT的取值提前通过表格枚举出来,而是通过以10为底的指数运算得到/>
公式(7)所表示的第一子帧中代数码本的估计增益的计算过程可概述如下:首先,根据当前帧的分类参数CT计算得到对数域中代数码本增益的线性估计值a0+a1CT。之后,通过以 10为底的指数运算将对数域中代数码本增益的线性估计值a0+a1CT转换到线性域中,得到利用线性域中来自代数码本的代数码本矢量的能量Ec的平方根(表示为)去除线性域中代数码本增益的线性估计值/>得到第一子帧中代数码本的估计增益/>这样,在编解码计算第一子帧的代数码本的估计增益时,可以避免部分因式涉及的对数 log运算和以10为底的指数运算,降低了算法复杂度。
编码侧向解码侧可以传输以下编码参数:当前帧的帧类型CT,线性估计常数a0、a1,获胜码本矢量[gp;γ]在增益码本中的索引。
图8示出了实施例三提供的第一子帧中代数码本增益的计算过程。
如图8所示,首先向线性估计模块801输入当前前帧的分类参数CT。然后,线性估计模块801根据参数CT计算出对数域中代数码本增益的线性估计值a0+a1CT,并输出a0+a1CT到以10为底的指数计算器802获得线性域中代数码本增益的线性估计值:接着,输出线性域中代数码本增益的线性估计值/>到乘法器803。并且,依次通过平方求和器 804、平方根计算器805计算来自代数码本的代数码本矢量的能量的平方根值:/>平方求和器804通过上面公式(5)计算得到Ec,之后输出/>的倒数值至乘法器803,
用以去除进而获得代数码本的估计增益/>然后,输出代数码本的估计增益/>至乘法器806,用以来乘以来自增益码本的校正因子γ得到代数码本的量化增益/>代数码本的量化增益/>可进一步输出到乘法器807,用以来乘以自代数码本的代数码本矢量(滤波后的代数激励) 得到激励的代数码本贡献。最终,激励的代数码本贡献输出到加法器808,用以和激励的自适应码本贡献相加得到总的滤波后的激励。
其中,激励的自适应码本贡献由输出到乘法器809的来自自适应码本的自适应码本矢量 (滤波后的自适应激励)乘以来自增益码本的自适应码本的量化增益得到。自适应码本的量化增益/>直接从增益码本中选择,具体基于最小均方差MMSE原则搜索增益码本,参考上面公式(2)。
实施例四
实施例四提供的第一子帧中代数码本增益的计算过程,对第一子帧中代数码本的估计增益的计算公式进行了如下优化,以实现复杂度的降低:
可以和实施例一相同的地方是,由于线性域中代数码本增益的线性估计值只与分类参数CT以及对数域中的估计常数a0、a1有关,因此,/>的取值可以提前通过表格枚举出来。/>表示线性域中代数码本增益的线性估计值。编解码器可维护着一张映射表b,表b中每一个条目包括两个值:分类参数CT的索引CTindex和线性域中代数码本增益的线性估计值/>这样,编解码器可直接查表获得当前帧的参数CT对应的/>的值,避免编解码器运行时再计算,从而降低了算法复杂度。
公式(12)计算过程可进一步简化为:
公式(13)所表示的第一子帧中代数码本的估计增益的计算过程可概述如下:首先,根据当前帧的分类参数CT的索引CTindex查表获得线性域中代数码本增益的线性估计值并且,对来自代数码本的代数码本矢量的能量参数/>取相反数,对该相反数进行以 10为底的指数运算得到/>最后,将线性域中代数码本增益的线性估计值/>乘以/>得到代数码本的估计增益/>这样,在编解码计算第一子帧的代数码本的估计增益时,可以避免代数码本增益的线性估计值涉及的以10为底的指数运算,降低了算法复杂度。
编码侧向解码侧可以传输以下编码参数:当前帧的分类参数CT的索引CTindex,获胜码本矢量[gp;γ]在增益码本中的索引。
图9示出了实施例四提供的第一子帧中代数码本增益的计算过程。
如图9所示,首先向查表模块901输入当前前帧的分类参数CT的索引CTindex。然后,查表模块901根据索引CTindex查表获得线性域中代数码本增益的线性估计值(下面表示为b[CTindex]),并输出b[CTindex]到乘法器902。并且,依次通过平方求和器903、平方根计算器904计算来自代数码本的代数码本矢量的能量的平方根值:平方求和器903通过上面公式(5)计算得到Ec。之后输出/>到计算器905,用以对/>进行对数log运算后取相反数进而得到/>之后输出/>到计算器906,用以对/>进行以10为底的指数运算得到/>再输出/>到乘法器902,用以乘以b[CTindex]进而获得代数码本的估计增益/>然后,输出代数码本的估计增益/>至乘法器907,用以来乘以来自增益码本的校正因子γ得到代数码本的量化增益/>代数码本的量化增益/>可进一步输出到乘法器908,用以来乘以自代数码本的代数码本矢量(滤波后的代数激励)得到激励的代数码本贡献。最终,激励的代数码本贡献输出到加法器909,用以和激励的自适应码本贡献相加得到总的滤波后的激励。
其中,激励的自适应码本贡献由输出到乘法器910的来自自适应码本的自适应码本矢量 (滤波后的自适应激励)乘以来自增益码本的自适应码本的量化增益得到。自适应码本的量化增益/>直接从增益码本中选择,具体基于最小均方差MMSE原则搜索增益码本,参考上面公式(2)。
实施例四中,也可以令b[CTindex]=a0+a1CT,即通过表b仅将a0+a1CT的取值提前通过表格枚举出来。此时,公式(12)计算过程可进一步简化为:
公式(14)所表示的第一子帧中代数码本的估计增益的计算过程可概述如下:首先,根据当前帧的分类参数CT的索引CTindex查表获得对数域中代数码本增益的线性估计值。并且,在对数域中从代数码本增益的线性估计值a0+a1CT中减去来自代数码本的代数码本矢量的能量得到/>最后,对/>进行以10为底的指数运算得到/>公式(14)所表示的计算过程能通过查表获得对数域中代数码本的先行估计值,而无需编解码器计算,节约了计算量。
以上实施例中,当前帧的分类参数CT的数值可以依据信号类型来选择。例如,对于窄带信号,对于清音、浊音、一般或过渡帧,将参数CT的数值分别设置成1,3,5和7,而对于宽带信号,将它们分别设置成0,2,4和6。下面会介绍信号分类,这里先不展开。
信号类型
用于确定帧的分类(参数CT)的方法可以不同。例如,仅按照浊音或清音地进行基础分类。又例如,可以增加强浊音或强清音那样的更多类别。
信号分类可以通过以下三个步骤进行。首先,语音活动检测器(speech activedetector, SAD)区分有效和无效语音帧。如果检测到无效语音帧,例如本底噪声(groundnoise),则分类终止,利用舒适噪声生成(comfort noise generator,CNG)编码帧。如果检测到有效语音帧,则对该帧实施进一步分类,以区分出清音帧。如果该帧进一步被分类成清音信号,则分类终止,使用最适合清音信号的编码方法编码该帧。否则,再进一步确定该帧是否为稳定浊音。如果该帧被分类成稳定浊音帧,则使用最适合稳定浊音信号的编码方法编码该帧。否则,该帧有可能包含像浊音发端或迅速演变浊音信号那样的非稳定信号段。
清音信号的区分可以基于以下参数:发声度量平均频谱倾斜/>低水平上的最大短时能量增量dE0和最大短时能量偏差dE。本申请对区分出清音信号的算法不做限制,可例如采用如下文献中提及的算法:Jelinek,M.,etal.,"Advances in source-controlledvariable bitrate wideband speech coding",Special Workshop in MAUI(SWIM);Lectures by masters in speech processing,Maui,January12-24,2004,在此通过引用将其全部内容并入本文中。
如果一个帧未被分类成有效帧或清音帧,则测试是否是稳定浊音帧。稳定浊音帧的区分可以基于以下参数:每个子帧(具有1/4子样本分辨率)的归一化相关性平均频谱倾斜/>和所有子帧(具有1/4子样本分辨率)的开环音调估计。本申请对区分稳定浊音帧的算法也不做限制。
以上实施例中,除了分类参数CT,当前帧的第一子帧中代数码本的线性估计增益还与估计常数ai有关。估计常数ai可以通过大样本的数据训练确定。
估计常数的计算
大样本的训练数据可包含不同语言、不同性别、不同年龄、不同环境等等的多样的大量语音信号。并且,假设该大样本的训练数据包括N+1个帧。
通过在大样本的训练数据中的所有帧上使代数码本的估计增益与对数域中的最佳增益之间的均方误差最小来寻找估计系数。
对于第n帧中的第一子帧,均方误差能量通过下式给出:
其中,在第n帧中的第一子帧中,对数域中代数码本的估计增益通过下面公式得出:
其中,i=0,...,L-1。L表示输入语音信号的L个样本。Ei(n)表示第n帧中来自代数码本的代数码本矢量的能量,可参考上面公式(5)计算。
代入公式(16)后,公式(15)变为:
在上面的公式(17)中,表示第一子帧中的最佳代数码本增益,其可以通过下面公式(18)和(19)计算得到:
其中,常数或相关性系数c0,c1,c2,c3,c4和c5通过下面公式计算得到:
c0=yty,c1=xty,c2=ztz,c3=xtz,c4=ytz,c5=xtx公式(19)
通过在对数域中定义代数码本的归一化增益来简化最小均方误差MSE的计算过程:
其中,
上面定义的最小均方误差MSE的解(即估计常数a0、a1的最佳值)通过如下一对偏导数求出:
至此,估计常数a0、a1的最佳值便能确定出。这里不提供估计常数a0、a1的最佳值的表达式,即不展示公式(21)的求解,表达式比较复杂。实际应用中,可以通过MATLAB等计算软件提前计算出其值。
对于第n帧中的第二子帧及以后子帧,均方误差能量通过下式给出:
其中,k≥2,的值同样通过上面公式(18)和(19)计算得到;/>表示在第k个子帧中对数域代数码本的估计增益。/>通过下面公式(23) 计算得到:
为了求解实现最小均方误差MSE的估计常数b0,b1,...,bk的最佳值,类似第一子帧中的求解方法,可以对公式(22)求偏导得出。
至此,估计常数b0,b1,...,bk的最佳值便能确定出。这里不提供估计常数b0,b1,..., bk的最佳值的表达式,表达式比较复杂。实际应用中,可以通过MATLAB等计算软件提前计算出其值。
如图10所示,计算得到的估计常数可用于为每一个子帧设计增益码本,进而可如上述内容根据估计常数和增益码本确定每个子帧的增益量化。如上所述,代数码本增益的估计在每个子帧中稍有不同,估计系数通过最小均方误差MSE求出。增益码本可以参考下面文献中的 KMEANS算法来设计:MacQueen,J.B.(1967),"Some Methods forclassification and Analysis of Multivariate Observations",Proceedings of 5thBerkeley Symposium on Mathematical Statistics and Probability,University ofCaliforniaPress.pp.281-297,在此通过引用将其全部内容并入本文中。
图11示出了本申请实施例提供的包括语音编码装置113和语音解码装置117的语音通信系统110。语音通信系统110支持通过通信信道115传输语音信号。通信信道115可以是无线通信链路,也可以是导线等形成的有线链路。通信信道115可以支持需要共享带宽资源的多个同时进行的语音通信。不限于装置与装置之间的通信,通信信道115还可以扩展至单个装置内部用于实现共享通信的存储单元,例如单个装置的存储单元记录和存储编码的语音信号以便之后播放。
在发射器端,话筒等语音采集装置111将语音转换为提供给模数(A/D)转换器112的模拟语音信号120。A/D转换器112的功能是将模拟语音信号120转换为数字语音信号121。语音编码装置113对数字语音信号121进行编码,以产生一组二进制形式的编码参数122,并通过通信部件将其传送到信道编码器114。信道编码器114对编码参数122执行添加冗余等信道编码操作形成比特流123,通过通信信道115对其进行传输。
在接收器端,信道解码器116对通过通信部件所接收的比特流124执行信道解码操作,例如利用比特流124中的冗余信息来检测和校正传输期间发生的信道错误。语音解码装置117 将从信道解码器中接收的比特流125转换回编码参数,用以创建合成的语音信号126。在数模(D/A)转换器108中将在语音解码装置117中重构的合成语音信号126转换回模拟语音信号 127。最后,通过扬声器单元119等声音播放装置播放模拟语音信号127。
语音编码装置113对语音信号进行编码得到编码参数、语音解码装置117利用比特流中携带的编码参数重构语音信号,可以参考以上内容,不再赘述。
发射器端的各个器件可以集成于一个电子装置中,接收器端的各个器件可以集成于另一个电子装置中。此时,这两个电子装置之间通过有线或无线链路形成的通信信道进行通信,例如传输编码参数,例如传输编码参数。发射器端的各个器件和接收器端的各个器件也可以集成于同一个电子装置中。此时,在该电子装置内部,发射器端和接收器端之间通过共享的存储单元实现数据交换,即通信,例如传输编码参数。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (33)
1.一种编码声音信号的方法,应用于当前帧中的第一子帧,其特征在于,所述方法包括:
接收所述当前帧的帧分类参数索引;
根据所述当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;
计算来自代数码本的代数码本矢量的能量;
将所述线性域中代数码本增益的线性估计值除以所述代数码本矢量的能量的平方根,得到代数码本的估计增益;
将所述代数码本的估计增益乘以校正因子得到代数码本的量化增益;所述校正因子来自获胜码本矢量,所述获胜码本矢量选自增益码本。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
传输编码参数,所述编码参数包括:所述当前帧的帧分类参数索引,所述获胜码本矢量在所述增益码本中的索引。
3.一种编码声音信号的方法,应用于当前帧中的第一子帧,其特征在于,所述方法包括:
接收所述当前帧的帧分类参数索引;
根据所述当前帧的帧分类参数索引在第一映射表中查找对数域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和对数域中代数码本增益的线性估计值;
将所述对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到所述线性域中代数码本增益的线性估计值;
计算来自代数码本的代数码本矢量的能量;
将所述线性域中代数码本增益的线性估计值除以所述代数码本矢量的能量的平方根,得到代数码本的估计增益;
将所述代数码本的估计增益乘以校正因子得到代数码本的量化增益;所述校正因子来自获胜码本矢量,所述获胜码本矢量选自增益码本。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
传输编码参数,所述编码参数包括:所述当前帧的帧分类参数索引,所述获胜码本矢量在所述增益码本中的索引。
5.一种编码声音信号的方法,应用于当前帧中的第一子帧,其特征在于,所述方法包括:
利用所述第一子帧中的线性估计常数和所述当前帧的帧类型进行线性估计,得到对数域中代数码本增益的线性估计值;
将所述对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到所述线性域中代数码本增益的线性估计值;
计算来自代数码本的代数码本矢量的能量;
将所述线性域中代数码本增益的线性估计值除以所述代数码本矢量的能量的平方根,得到代数码本的估计增益;
将所述代数码本的估计增益乘以校正因子得到代数码本的量化增益;所述校正因子来自获胜码本矢量,所述获胜码本矢量选自增益码本。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
传输编码参数,所述编码参数包括:所述当前帧的帧类型,所述线性估计常数,所述获胜码本矢量在所述增益码本中的索引。
7.一种解码声音信号的方法,应用于当前帧中的第一子帧,其特征在于,所述方法包括:
接收编码参数;所述编码参数包括:所述当前帧的帧分类参数索引,获胜码本矢量的索引;
基于所述当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;
计算来自代数码本的代数码本矢量的能量;
将所述线性域中代数码本增益的线性估计值除以所述代数码本矢量的能量的平方根,得到代数码本的估计增益;
将所述代数码本的估计增益乘以校正因子得到代数码本的量化增益,所述校正因子来自所述获胜码本矢量,所述获胜码本矢量是基于所述获胜码本矢量的索引选自于增益码本。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
利用所述代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献;
利用选自增益码本的获胜码本矢量包括的自适应码本的量化增益乘以来自自适应码本的自适应码本矢量,得到自适应码本的激励贡献;
将所述代数码本的激励贡献与所述自适应码本的激励贡献相加,得到总的激励。
9.一种解码声音信号的方法,应用于当前帧中的第一子帧,其特征在于,所述方法包括:
接收编码参数;所述编码参数包括:所述当前帧的帧分类参数索引,获胜码本矢量的索引;
基于所述当前帧的帧分类参数索引在第一映射表中查找对数域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和对数域中代数码本增益的线性估计值;
将所述对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到所述线性域中代数码本增益的线性估计值;
计算来自代数码本的代数码本矢量的能量;
将所述线性域中代数码本增益的线性估计值除以所述代数码本矢量的能量的平方根,得到代数码本的估计增益;
将所述代数码本的估计增益乘以校正因子得到代数码本的量化增益,所述校正因子来自所述获胜码本矢量,所述获胜码本矢量是基于所述获胜码本矢量的索引选自于增益码本。
10.如权利要求9所述的方法,其特征在于,所述方法还包括:
利用所述代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献;
利用选自增益码本的获胜码本矢量包括的自适应码本的量化增益乘以来自自适应码本的自适应码本矢量,得到自适应码本的激励贡献;
将所述代数码本的激励贡献与所述自适应码本的激励贡献相加,得到总的激励。
11.一种解码声音信号的方法,应用于当前帧中的第一子帧,其特征在于,所述方法包括:
接收编码参数;所述编码参数包括:所述当前帧的帧类型,所述第一子帧中的线性估计常数,获胜码本矢量的索引;
利用所述第一子帧中的线性估计常数和所述当前帧的帧类型进行线性估计,得到对数域中代数码本增益的线性估计值;
将所述对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到所述线性域中代数码本增益的线性估计值;
计算来自代数码本的代数码本矢量的能量;
将所述线性域中代数码本增益的线性估计值除以所述代数码本矢量的能量的平方根,得到代数码本的估计增益;
将所述代数码本的估计增益乘以校正因子得到代数码本的量化增益,所述校正因子来自所述获胜码本矢量,所述获胜码本矢量是基于所述获胜码本矢量的索引选自于增益码本。
12.如权利要求11所述的方法,其特征在于,所述方法还包括:
利用所述代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献;
利用选自增益码本的获胜码本矢量包括的自适应码本的量化增益乘以来自自适应码本的自适应码本矢量,得到自适应码本的激励贡献;
将所述代数码本的激励贡献与所述自适应码本的激励贡献相加,得到总的激励。
13.一种编码声音信号的方法,应用于当前帧中的第一子帧,其特征在于,所述方法包括:
接收所述当前帧的帧分类参数索引;
根据所述当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;
计算来自代数码本的代数码本矢量的能量Ec,并对所述能量的平方根进行以10为底的对数运算,再对所述对数运算后的值取相反数后进行以10为底的指数运算得到将线性域中代数码本增益的线性估计值乘以/>得到代数码本的估计增益;
将所述代数码本的估计增益乘以校正因子得到代数码本增益的量化增益,所述校正因子来自获胜码本矢量,所述获胜码本矢量选自增益码本。
14.如权利要求13所述的方法,其特征在于,所述方法还包括:
传输编码参数,所述编码参数包括:所述当前帧的帧分类参数索引,所述获胜码本矢量在所述增益码本中的索引。
15.一种解码声音信号的方法,应用于当前帧中的第一子帧,其特征在于,所述方法包括:
接收编码参数;所述编码参数包括:所述当前帧的帧分类参数索引,获胜码本矢量的索引;
根据所述当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;
计算来自代数码本的代数码本矢量的能量Ec,并对所述能量的平方根进行以10为底的对数运算,再对所述对数运算后的值取相反数后进行以10为底的指数运算得到将线性域中代数码本增益的线性估计值乘以/>得到代数码本的估计增益;
将所述代数码本的估计增益乘以校正因子得到代数码本增益的量化增益,所述校正因子来自获胜码本矢量,所述获胜码本矢量是基于所述获胜码本矢量的索引选自于增益码本。
16.如权利要求15所述的方法,其特征在于,所述方法还包括:
利用所述代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献;
利用选自增益码本的获胜码本矢量包括的自适应码本的量化增益乘以来自自适应码本的自适应码本矢量,得到自适应码本的激励贡献;
将所述代数码本的激励贡献与所述自适应码本的激励贡献相加,得到总的激励。
17.一种语音通信系统,其特征在于,包括:第一装置、第二装置,其中:所述第一装置用于执行权利要求1-6,13-14中任一项所述方法,所述第二装置用于执行权利要求7-12,15-16中任一项所述方法。
18.一种具有语音编码功能的装置,其特征在于,包括:
查找部件,用于根据当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;
第一计算器,用于计算来自代数码本的代数码本矢量的能量;
第一乘法器,用于将所述线性域中代数码本增益的线性估计值乘以所述代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益;
第二乘法器,用于将所述代数码本的估计增益乘以获胜码本矢量包括的校正因子,得到代数码本的量化增益;所述获胜码本矢量选自增益码本。
19.如权利要求18所述的装置,其特征在于,还包括:通信部件,所述通信部件用于传输编码参数,所述编码参数包括:所述当前帧的帧分类参数索引,所述获胜码本矢量在所述增益码本中的索引。
20.一种具有语音编码功能的装置,其特征在于,包括:
查找部件,用于根据当前帧的帧分类参数索引在第一映射表中查找对数域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和对数域中代数码本增益的线性估计值;
转换器,用于将所述对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到所述线性域中代数码本增益的线性估计值;
第一计算器,用于计算来自代数码本的代数码本矢量的能量;
第一乘法器,用于将所述线性域中代数码本增益的线性估计值乘以所述代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益;
第二乘法器,用于将所述代数码本的估计增益乘以获胜码本矢量包括的校正因子,得到代数码本的量化增益;所述获胜码本矢量选自增益码本。
21.如权利要求20所述的装置,其特征在于,还包括:通信部件,所述通信部件用于传输编码参数,所述编码参数包括:所述当前帧的帧分类参数索引,所述获胜码本矢量在所述增益码本中的索引。
22.一种具有语音编码功能的装置,其特征在于,包括:
线性预测部件,用于利用第一子帧中的线性估计常数和当前帧的帧类型进行线性估计,得到对数域中代数码本增益的线性估计值;
转换器,用于将所述对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到所述线性域中代数码本增益的线性估计值;
第一计算器,用于计算来自代数码本的代数码本矢量的能量;
第一乘法器,用于将所述线性域中代数码本增益的线性估计值乘以所述代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益;
第二乘法器,用于将所述代数码本的估计增益乘以获胜码本矢量包括的校正因子,得到代数码本的量化增益;所述获胜码本矢量选自增益码本。
23.如权利要求22所述的装置,其特征在于,还包括:通信部件,所述通信部件用于传输编码参数,所述编码参数包括:所述当前帧的帧类型,所述线性估计常数,所述获胜码本矢量在所述增益码本中的索引。
24.一种具有语音解码功能的装置,其特征在于,包括:
通信部件,所述通信部件用于接收编码参数;所述编码参数包括:当前帧的帧分类参数索引,获胜码本矢量的索引;
第一查找部件,用于基于所述当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;
第一计算器,用于计算来自代数码本的代数码本矢量的能量;
第一乘法器,用于将所述线性域中代数码本增益的线性估计值乘以所述代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益;
第二乘法器,用于将所述代数码本的估计增益乘以校正因子得到代数码本的量化增益,所述校正因子来自所述获胜码本矢量;
第二查找部件,用于基于所述获胜码本矢量的索引从增益码本查找出所述获胜码本矢量。
25.如权利要求24所述的装置,其特征在于,还包括:
第三乘法器,用于利用所述代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献;
第四乘法器,用于利用选自增益码本的获胜码本矢量包括的自适应码本的量化增益乘以来自自适应码本的自适应码本矢量,得到自适应码本的激励贡献;
加法器,用于将所述代数码本的激励贡献与所述自适应码本的激励贡献相加,得到总的激励。
26.一种具有语音解码功能的装置,其特征在于,包括:
通信部件,所述通信部件用于接收编码参数;所述编码参数包括:当前帧的帧分类参数索引,获胜码本矢量的索引;
第一查找部件,用于基于所述当前帧的帧分类参数索引在第一映射表中查找对数域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和对数域中代数码本增益的线性估计值;
转换器,用于将所述对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到所述线性域中代数码本增益的线性估计值;
第一计算器,用于计算来自代数码本的代数码本矢量的能量;
第一乘法器,用于将所述线性域中代数码本增益的线性估计值乘以所述代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益;
第二乘法器,用于将所述代数码本的估计增益乘以校正因子得到代数码本的量化增益,所述校正因子来自所述获胜码本矢量;
第二查找部件,用于基于所述获胜码本矢量的索引从增益码本查找出所述获胜码本矢量。
27.如权利要求26所述的装置,其特征在于,还包括:
第三乘法器,用于利用所述代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献;
第四乘法器,用于利用选自增益码本的获胜码本矢量包括的自适应码本的量化增益乘以来自自适应码本的自适应码本矢量,得到自适应码本的激励贡献;
加法器,用于将所述代数码本的激励贡献与所述自适应码本的激励贡献相加,得到总的激励。
28.一种具有语音解码功能的装置,其特征在于,包括:
通信部件,所述通信部件用于接收编码参数;所述编码参数包括:当前帧的帧类型,第一子帧中的线性估计常数,获胜码本矢量的索引;
线性预测部件,用于利用所述第一子帧中的线性估计常数和所述当前帧的帧类型进行线性估计,得到对数域中代数码本增益的线性估计值;
转换器,用于将所述对数域中代数码本增益的线性估计值通过指数运算转换到线性域中,得到所述线性域中代数码本增益的线性估计值;
第一计算器,用于计算来自代数码本的代数码本矢量的能量;
第一乘法器,用于将所述线性域中代数码本增益的线性估计值乘以所述代数码本矢量的能量的平方根的倒数,得到代数码本的估计增益;
第二乘法器,用于将所述代数码本的估计增益乘以校正因子得到代数码本的量化增益,所述校正因子来自所述获胜码本矢量;
查找部件,用于基于所述获胜码本矢量的索引从增益码本查找出所述获胜码本矢量。
29.如权利要求28所述的装置,其特征在于,还包括:
第三乘法器,用于利用所述代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献;
第四乘法器,用于利用选自增益码本的获胜码本矢量包括的自适应码本的量化增益乘以来自自适应码本的自适应码本矢量,得到自适应码本的激励贡献;
加法器,用于将所述代数码本的激励贡献与所述自适应码本的激励贡献相加,得到总的激励。
30.一种具有语音编码功能的装置,其特征在于,包括:
第一查找部件,用于根据当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;
第一计算器,用于计算来自代数码本的代数码本矢量的能量Ec;
对数运算器,用于对所述能量的平方根进行以10为底的对数运算;
指数运算器,用于对所述对数运算后的值取相反数后进行以10为底的指数运算得到
第一乘法器,用于将线性域中代数码本增益的线性估计值乘以得到代数码本的估计增益;
第二乘法器,用于将所述代数码本的估计增益乘以校正因子得到代数码本增益的量化增益,所述校正因子来自获胜码本矢量,所述获胜码本矢量选自增益码本。
31.如权利要求30所述的装置,其特征在于,还包括:通信部件,所述通信部件用于传输编码参数,所述编码参数包括:所述当前帧的帧分类参数索引,所述获胜码本矢量在所述增益码本中的索引。
32.一种具有语音解码功能的装置,其特征在于,包括:
通信部件,用于接收编码参数;所述编码参数包括:当前帧的帧分类参数索引,获胜码本矢量在增益码本中的索引;
第一查找部件,用于根据所述当前帧的帧分类参数索引在第一映射表中查找线性域中代数码本增益的线性估计值;所述第一映射表中的每一个条目包括两个值:帧分类参数索引和线性域中代数码本增益的线性估计值;
第一计算器,用于计算来自代数码本的代数码本矢量的能量Ec;
对数运算器,用于对所述能量的平方根进行以10为底的对数运算;
指数运算器,用于对所述对数运算后的值取相反数后进行以10为底的指数运算得到
第一乘法器,用于将线性域中代数码本增益的线性估计值乘以得到代数码本的估计增益;
第二乘法器,用于将所述代数码本的估计增益乘以校正因子得到代数码本增益的量化增益,所述校正因子来自获胜码本矢量;
第二查找部件,用于基于所述获胜码本矢量的索引从增益码本查找出所述获胜码本矢量。
33.如权利要求32所述的装置,其特征在于,还包括:
第三乘法器,用于利用所述代数码本增益的量化增益乘以来自代数码本的代数码本矢量,得到代数码本的激励贡献;
第四乘法器,用于利用选自增益码本的获胜码本矢量包括的自适应码本的量化增益乘以来自自适应码本的自适应码本矢量,得到自适应码本的激励贡献;
加法器,用于将所述代数码本的激励贡献与所述自适应码本的激励贡献相加,得到总的激励。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311218550.6A CN117476022A (zh) | 2022-07-29 | 2022-07-29 | 声音编解码方法以及相关装置、系统 |
CN202210908196.9A CN116052700B (zh) | 2022-07-29 | 2022-07-29 | 声音编解码方法以及相关装置、系统 |
PCT/CN2023/092547 WO2024021747A1 (zh) | 2022-07-29 | 2023-05-06 | 声音编解码方法以及相关装置、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210908196.9A CN116052700B (zh) | 2022-07-29 | 2022-07-29 | 声音编解码方法以及相关装置、系统 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311218550.6A Division CN117476022A (zh) | 2022-07-29 | 2022-07-29 | 声音编解码方法以及相关装置、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116052700A CN116052700A (zh) | 2023-05-02 |
CN116052700B true CN116052700B (zh) | 2023-09-29 |
Family
ID=86127993
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311218550.6A Pending CN117476022A (zh) | 2022-07-29 | 2022-07-29 | 声音编解码方法以及相关装置、系统 |
CN202210908196.9A Active CN116052700B (zh) | 2022-07-29 | 2022-07-29 | 声音编解码方法以及相关装置、系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311218550.6A Pending CN117476022A (zh) | 2022-07-29 | 2022-07-29 | 声音编解码方法以及相关装置、系统 |
Country Status (2)
Country | Link |
---|---|
CN (2) | CN117476022A (zh) |
WO (1) | WO2024021747A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117476022A (zh) * | 2022-07-29 | 2024-01-30 | 荣耀终端有限公司 | 声音编解码方法以及相关装置、系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010073396A (ko) * | 2000-01-14 | 2001-08-01 | 대표이사 서승모 | 음성 부호화기의 lsp 코드북을 위한 고속탐색 방법 |
CN1470051A (zh) * | 2000-10-17 | 2004-01-21 | �����ɷ� | 非话音语音的高性能低比特率编码方法和设备 |
CN1701353A (zh) * | 2002-01-08 | 2005-11-23 | 迪里辛姆网络控股有限公司 | 基于celp的语音代码之间的代码转换方案 |
EP1833047A1 (en) * | 2006-03-10 | 2007-09-12 | Matsushita Electric Industrial Co., Ltd. | Fixed codebook searching apparatus and fixed codebook searching method |
CN101118748A (zh) * | 2006-08-04 | 2008-02-06 | 北京工业大学 | 一种代数码本的搜索方法、装置及语音编码器 |
CN101266795A (zh) * | 2007-03-12 | 2008-09-17 | 华为技术有限公司 | 一种格矢量量化编解码的实现方法及装置 |
CN101572092A (zh) * | 2008-04-30 | 2009-11-04 | 华为技术有限公司 | 编解码端的固定码本激励的搜索方法及装置 |
CN103392203A (zh) * | 2011-02-15 | 2013-11-13 | 沃伊斯亚吉公司 | 用于在码激励线性预测编解码器中量化激励的自适应和固定贡献的增益的设备和方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9275644B2 (en) * | 2012-01-20 | 2016-03-01 | Qualcomm Incorporated | Devices for redundant frame coding and decoding |
CN104517612B (zh) * | 2013-09-30 | 2018-10-12 | 上海爱聊信息科技有限公司 | 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法 |
CN117476022A (zh) * | 2022-07-29 | 2024-01-30 | 荣耀终端有限公司 | 声音编解码方法以及相关装置、系统 |
-
2022
- 2022-07-29 CN CN202311218550.6A patent/CN117476022A/zh active Pending
- 2022-07-29 CN CN202210908196.9A patent/CN116052700B/zh active Active
-
2023
- 2023-05-06 WO PCT/CN2023/092547 patent/WO2024021747A1/zh unknown
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010073396A (ko) * | 2000-01-14 | 2001-08-01 | 대표이사 서승모 | 음성 부호화기의 lsp 코드북을 위한 고속탐색 방법 |
CN1470051A (zh) * | 2000-10-17 | 2004-01-21 | �����ɷ� | 非话音语音的高性能低比特率编码方法和设备 |
CN1701353A (zh) * | 2002-01-08 | 2005-11-23 | 迪里辛姆网络控股有限公司 | 基于celp的语音代码之间的代码转换方案 |
EP1833047A1 (en) * | 2006-03-10 | 2007-09-12 | Matsushita Electric Industrial Co., Ltd. | Fixed codebook searching apparatus and fixed codebook searching method |
CN101118748A (zh) * | 2006-08-04 | 2008-02-06 | 北京工业大学 | 一种代数码本的搜索方法、装置及语音编码器 |
CN101266795A (zh) * | 2007-03-12 | 2008-09-17 | 华为技术有限公司 | 一种格矢量量化编解码的实现方法及装置 |
CN101572092A (zh) * | 2008-04-30 | 2009-11-04 | 华为技术有限公司 | 编解码端的固定码本激励的搜索方法及装置 |
CN103392203A (zh) * | 2011-02-15 | 2013-11-13 | 沃伊斯亚吉公司 | 用于在码激励线性预测编解码器中量化激励的自适应和固定贡献的增益的设备和方法 |
CN104505097A (zh) * | 2011-02-15 | 2015-04-08 | 沃伊斯亚吉公司 | 检索激励的固定贡献的量化增益的设备和方法 |
Non-Patent Citations (2)
Title |
---|
A frame erasure concealment algorithm based on gain parameter re-estimation for CELP coders;Hong kook kim,et al.;《IEEE Signal Processing Letters 》;第8卷(第9期);全文 * |
基于CELP编码的语音帧擦除掩蔽算法;王春柳等;《现代信息科技》;第3卷(第17期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
WO2024021747A1 (zh) | 2024-02-01 |
CN116052700A (zh) | 2023-05-02 |
CN117476022A (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6316398B2 (ja) | Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法 | |
EP0698877B1 (en) | Postfilter and method of postfiltering | |
US8346544B2 (en) | Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision | |
CN102341852B (zh) | 滤波语音信号的方法和滤波器 | |
US8392178B2 (en) | Pitch lag vectors for speech encoding | |
US8090573B2 (en) | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision | |
JPH0736118B2 (ja) | セルプを使用した音声圧縮装置 | |
US6691085B1 (en) | Method and system for estimating artificial high band signal in speech codec using voice activity information | |
JP3254687B2 (ja) | 音声符号化方式 | |
JP2004526213A (ja) | 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム | |
KR20190060887A (ko) | 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템 | |
JPH0850500A (ja) | 音声エンコーダ及び音声デコーダ、並びに音声符号化方法及び音声復号化方法 | |
CN116052700B (zh) | 声音编解码方法以及相关装置、系统 | |
EP1114414B1 (en) | An adaptive criterion for speech coding | |
EP1672619A2 (en) | Speech coding apparatus and method therefor | |
JP3684751B2 (ja) | 信号符号化方法及び装置 | |
US10115408B2 (en) | Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec | |
Li et al. | A variable-bit-rate speech coding algorithm based on enhanced mixed excitation linear prediction | |
KR0155798B1 (ko) | 음성신호 부호화 및 복호화 방법 | |
JPH0954600A (ja) | 音声符号化通信装置 | |
Ozerov et al. | Flexible quantization of audio and speech based on the autoregressive model | |
JP3089967B2 (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JPH09269799A (ja) | 雑音抑圧処理機能を備えた音声符号化回路 | |
JPH08160996A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |