CN103366752B - 生成用于编码信息信号的候选码矢的方法和设备 - Google Patents

生成用于编码信息信号的候选码矢的方法和设备 Download PDF

Info

Publication number
CN103366752B
CN103366752B CN201310116042.7A CN201310116042A CN103366752B CN 103366752 B CN103366752 B CN 103366752B CN 201310116042 A CN201310116042 A CN 201310116042A CN 103366752 B CN103366752 B CN 103366752B
Authority
CN
China
Prior art keywords
vector
code
candidate
weighting
liftering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310116042.7A
Other languages
English (en)
Other versions
CN103366752A (zh
Inventor
詹姆斯·P·阿什利
乌达·米塔尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google Technology Holdings LLC
Original Assignee
Google Technology Holdings LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google Technology Holdings LLC filed Critical Google Technology Holdings LLC
Publication of CN103366752A publication Critical patent/CN103366752A/zh
Application granted granted Critical
Publication of CN103366752B publication Critical patent/CN103366752B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种生成用于编码信息信号的候选码矢的方法和设备。该方法(300)和设备(100)生成用于编码信息信号的候选码矢。该方法可以包括:从接收到的输入信号产生(310)目标矢量。该方法可以包括:基于目标矢量来构建(320)多个反加权函数。该方法可以包括:评估(330)与该多个反加权函数中的每一个相关联的误差值,以产生固定码本码矢。该方法可以包括:生成(340)表示固定码本码矢的码字,其中,该码字可以由解码器使用来生成输入信号的近似。

Description

生成用于编码信息信号的候选码矢的方法和设备
技术领域
本公开总体上涉及信号压缩系统,并且更具体地,涉及码激励线性预测(CELP)型语音编码系统。
背景技术
数字语音和音频信号的压缩是公知的。通常需要压缩以有效地通过通信信道发射信号,或者压缩信号以存储在诸如固态存储器装置或计算机硬盘的数字媒体装置上。虽然存在许多压缩技术,但是已经对于数字语音编码保持非常普遍的一种方法被称为码激励线性预测(CELP),这是“合成式分析”编码算法族中的一个。合成式分析通常指编码过程,通过该编码过程,使用数字模型的多个参数来合成与输入信号作比较并且针对失真被分析的候选信号集合。然后,传送或存储产生最低失真的参数集合,并且最终用于重建对原始输入信号的估计。CELP是特定的合成式分析方法,该方法使用一个或多个码本,其中,每一个码本实质上包括响应于码本索引而从该码本中检索的码矢的集合。
例如,图6是现有技术的CELP编码器600的框图。在CELP编码器600中,诸如语音信号的输入信号s(n)被施加到线性预测编码(LPC)分析块601,其中,线性预测编码用于估计短期频谱包络。通过传递函数A(z)来表示得到的频谱参数。将频谱参数施加到LPC量化块602,该LPC量化块602对频谱参数进行量化以产生适用于在复用器608中使用的量化频谱参数Aq。然后,向复用器608传递量化频谱参数Aq,并且复用器608基于该量化频谱参数以及由平方误差最小化/参数量化块607确定的码本相关的参数τ、β、k和γ的集合来产生编码比特流。
还将量化频谱或线性预测参数本地传送到LPC合成滤波器605,该LPC合成滤波器605具有对应的传递函数1/Aq(z)。LPC合成滤波器605还从第一组合器610接收组合的激励信号u(n),并且基于量化频谱参数Aq和组合的激励信号u(n)来产生输入信号的估计如下产生组合的激励信号u(n)。基于来自前一个子帧的组合的激励信号u(n-L)和索引参数τ从自适应码本(ACB)603中选择自适应码本码矢cτ。然后,基于增益参数β630来加权自适应码本码矢cτ,并且向第一组合器610传递加权的自适应码本码矢。基于索引参数k从固定码本(FCB)604中选择固定码本码矢ck。然后,固定码本码矢ck基于增益参数γ被加权,并且也被传递到第一组合器610。然后,第一组合器610通过下述方式来产生组合的激励信号u(n):将自适应码本码矢cτ的加权版本与固定码本码矢ck的加权版本进行组合。
LPC合成滤波器605向第二组合器612传递输入信号估计第二组合器612还接收输入信号s(n),并且从输入信号s(n)中减去输入信号的估计在输入信号s(n)和输入信号的估计之间的差被施加到感知误差加权滤波器606,该滤波器基于在和s(n)之间的差以及加权函数W(z)来产生感知加权的误差信号e(n)。然后,将感知加权的误差信号e(n)传递到平方误差最小化/参数量化块607。平方误差最小化/参数量化块607使用误差信号e(n)来确定产生输入信号s(n)的最优估计的码本相关的参数τ、β、k和γ的最优集合。
图7是与编码器600相对应的现有技术的解码器700的框图。如本领域内的普通技术人员认识到的,解码器700中的解复用器708使用由编码器600产生的编码比特流来解码该码本相关的参数τ、β730、k和γ740的最优集合。解码器700通过使用自适应码本703、固定码本704、信号u(n)和u(n-L)、码矢cτ和ck以及LPC合成滤波器705来使用与由编码器600执行的合成处理相同的处理以生成输出语音。因此,如果解码器700在无误差的情况下接收到由编码器600产生的编码比特流,则可以将由解码器700输出的语音重建为由编码器600产生的输入语音估计的精确的副本。
虽然CELP编码器600原理上是实用的,但是在期望将计算复杂度保持得尽可能低的情况下它不是编码器的实际实现方式。结果,图8是现有技术的示例性编码器800的框图,该编码器800利用与由编码器600图示的编码系统作相比等同但是更实用的系统。为了更好地理解在编码器600和编码器800之间的关系,有益的是,查看从编码器600的对编码器800的数学推导。为了读者方便,在变量的z变换上给出该变量。
从图6中可以看出,感知误差加权滤波器606基于在输入信号和估计的输入信号之间的差来产生加权误差信号e(n),即,
E ( z ) = W ( z ) ( S ( z ) - S ^ ( z ) ) . - - - ( 1 )
从该表达式,可以分配加权函数W(z),并且可以将输入信号估计分解为加权码本码矢的滤波和:
E ( z ) = W ( z ) S ( z ) - W ( z ) A q ( z ) ( βC τ ( z ) + γC k ( z ) ) - - - ( 2 )
W(z)S(z)项与输入信号的加权版本相对应。通过使加权输入信号W(z)S(z)被定义为Sw(z)=W(z)S(z)并且通过进一步现在通过传递函数H(z)=W(z)/Aq(z)来定义编码器600的加权合成滤波器605,等式2可以如下重写:
E(z)=Sw(z)-H(z)(βCτ(z)+γCk(z))(3)
通过使用z变换表示,不需要明确限定滤波器状态。现在使用矢量表示来继续,其中,矢量长度L是当前语音输入子帧的长度,通过使用叠加原理来将等式3重写如下:
e = s w - H ( βc τ + γc k ) - h zir - - - ( 4 )
其中:
●H是由诸如合成滤波器815和805的加权合成滤波器h(n)的冲激响应形成的LxL零状态加权合成卷积矩阵,并且与传递函数Hzs(z)或H(z)相对应,该矩阵可以被表示为:
●hzir是由于来自前一个语音输入子帧的状态而导致的H(z)的Lx1零输入响应,
●sw是Lx1感知地加权的输入信号,
●β是标量自适应码本(ACB)增益,
●cτ是由索引τ指示的Lx1ACB码矢,
●γ是标量固定码本(FCB)增益,并且
●ck是由索引k指示的Lx1FCB码矢。
通过分配H,并且设输入目标矢量xw=sw-hzir,可以获得下面的表达式:
e=xw-βHcτ-γHck(6)
等式6表示由编码器800的第三组合器808产生并且通过组合器808耦合到平方误差最小化/参数量化块807的感知加权的误差(或失真)矢量e(n)。
从上面的表达式,可以通过平方误差最小化/参数量化块807来得出用于最小化感知加权的误差的加权版本的公式,即║e║2。平方误差的范数被给出为:
ε=||e||2=||xw-βHcτ-γHck||2(7)
注意,||e||2还可以被写作(n)或||e||2=eTe,其中,eT是e的矢量转置,并且被假定为列矢量。
由于复杂性限制,语音编码系统的实际实现方式通常以顺序的方式最小化平方误差。即,首先通过假定固定码本(FCB)贡献是0来优化自适应码本(ACB)分量,并且然后,使用给定的(先前优化的)ACB分量来优化FCB分量。在给出顺序选择的ACB/FCB码矢cτ和ck的情况下,可以或可以不重新优化,即量化,ACB/FCB增益,即,与码本相关的参数β和γ。
用于执行这样的顺序优化处理的示例的原理如下。首先,通过设置γ=0来修改在等式7中提供的平方误差的范数,并且然后将该范数扩展以产生:
ϵ = | | x w - βH c τ | | 2 = x w T x w - 2 β x w T Hc τ + β 2 c τ T H T Hc τ . - - - ( 8 )
然后,通过获得ε相对于β的偏导数并且将该量设置为零来确定平方误差的最小化:
∂ ϵ ∂ β = x w T Hc τ - βc τ T H T Hc τ = 0 . - - - ( 9 )
这得出了最优ACB增益:
β = x w T Hc τ c τ T H T Hc τ . - - - ( 10 )
将最优ACB增益代回等式8给出:
τ * = arg min τ { x w T x w - ( x w T Hc τ ) 2 c τ T H T Hc τ } , - - - ( 11 )
其中,τ*是最优ACB索引参数,即,使花括号的表达式最小化的ACB索引参数。通常,τ是与输入信号的基音滞后(或基频)的预期值的范围相关的参数,并且被限制为可以由相对小数目的比特表示的有限值集合。因为xw不取决于τ,所以可以将等式11重写如下:
τ * = arg max τ { ( x w T Hc τ ) 2 c τ T H T Hc τ } . - - - ( 12 )
现在,通过设yτ等于通过加权合成滤波器815滤波的ACB码矢cτ,即,yτ=Hcτ,可以将等式13简化为:
τ * = arg max τ { ( x w T y τ ) 2 y τ T y τ } , - - - ( 13 )
并且类似地,可以将等式10简化为:
β = x w T y τ y τ T y τ . - - - ( 14 )
因此,等式13和14表示以顺序的方式确定最优ACB索引τ和ACB增益β所需要的两个表达式。这些表达式现在可以用于确定最优FCB索引和增益表达式。首先,从图8中可以看出第二组合器806产生矢量x2,其中,x2=xw-βHcτ。在通过加权合成零输入响应Hzir(z)滤波器801滤波过去的合成激励信号u(n-L)之后,从输入语音信号s(n)的感知误差加权滤波器W(z)802的输出sw(n)中减去滤波的过去合成激励信号hzir(n)的第一组合器804来产生矢量xw(或xw(n))。βHcτ项是ACB码矢cτ的滤波和加权版本,即,ACB码矢cτ由零状态加权合成滤波器Hzs(z)815滤波以生成y(n)并且然后基于ACB增益参数β830被加权。将表达式x2=xw-βHcτ代入等式7得到:
ε=||x2-γHck||2。(15)
其中,γHck是FCB码矢ck的滤波和加权版本,即,FCB码矢ck由零状态加权合成滤波器Hzs(z)805滤波并且然后基于FCB增益参数γ840被加权。类似于最优ACB索引参数τ*的上面的导出,明显的是:
k * = arg max k { ( x 2 T Hc k ) 2 c k T H T Hc k } , - - - ( 16 )
其中,k*是最优FCB索引参数,即,使花括号的表达式最大化的FCB索引参数。通过对不取决于k的项进行分组,即,通过设和Φ=HTH,等式16可以被简化为:
k * = arg max k { ( d 2 T c k ) 2 c k T Φ c k } , - - - ( 17 )
其中,将最优FCB增益γ给出为:
γ = d 2 T c k c k T Φ c k . - - - ( 18 )
编码器800提供了用于确定最优激励矢量相关的参数τ、β、k和γ的方法和设备。不幸的是,更高比特率的CELP编码由于更大数目的码本条目而导致通常需要更高的计算复杂度,该更大数目的码本条目需要在闭环处理中的误差评估。因此,存在用于生成候选码矢以降低用于编码信息信号的计算复杂度的机会。
附图说明
图1是根据一个实施例的诸如在图6中的编码器的一部分的编码器的至少一部分的示例性框图;
图2是根据一个实施例的FCB候选码矢生成器的示例性框图;
图3是概述根据一个实施例的编码器的操作的流程图的示例性图示;
图4是概述根据一个实施例的编码器的候选码矢构建操作的流程图的示例性图示;
图5是根据一个实施例的两个概念性候选码矢ck [i]的示例性图示;
图6是现有技术的码激励线性预测(CELP)编码器的框图;
图7是现有技术的CELP解码器的框图;以及
图8是现有技术的另一种CELP编码器的框图。
具体实施方式
如上所述,由于在闭环处理中需要误差评估的更大数目的码本条目,更高比特率的CELP编码通常需要更高的计算复杂度。本公开的实施例可以通过提供码激励线性预测(CELP)语音编码器中的前置量化器候选生成来解决搜索更高比特率码本的问题。实施例可以通过下述方式来处理该问题:通过使用反加权函数(inverseweightingfunction)和FCB目标信号所形成的矢量集合的直接量化来生成多个初始FCB候选,并且然后评估那些初始候选的加权误差以产生更好的整体码矢。实施例还可以对矢量应用可变权重,并且可以使加权矢量相加作为预先选择候选码矢的一部分。另外,实施例可以通过使用反加权函数和固定码本目标信号所形成的矢量集合的直接量化来生成多个初始固定码本候选,并且然后可以评估那些初始候选的加权误差以产生更好的整体码矢。其他实施例还可以通过使用反加权函数和FCB目标信号所形成的矢量集合的直接量化来生成多个初始FCB候选,并且然后评估那些初始候选的加权误差以确定用于给定的前置量化器函数的更好的初始加权函数。
为了实现上面的益处,方法和设备可以生成用于编码信息信号的候选码矢。该方法可以包括接收输入信号。该方法可以包括从输入信号产生目标矢量。该方法可以包括基于目标矢量来构建多个反加权函数。该方法可以包括评估与多个反加权函数中的每一个相关联的误差值以产生固定码本(FCB)码矢。该方法可以包括生成表示FCB码矢的码字,其中,解码器可以使用码字来生成输入信号的近似。
图1是根据一个实施例的诸如编码器600的一部分的编码器100的至少一部分的示例性框图。编码器100可以包括输入122、目标矢量生成器124、FCB候选码矢生成器110、FCB104、零状态加权合成滤波器H105、误差最小化块107、第一增益参数γ加权块141、组合器108和输出126。编码器100还可以包括第二零状态加权合成滤波器H115、第二误差最小化块117、第二增益参数γ加权块142和第二组合器118。
零状态加权合成滤波器H105、误差最小化块107和组合器108以及第二零状态加权合成滤波器H115、第二误差最小化块117和第二组合器118可以分别与如图8中所示的零状态加权合成滤波器805、平方误差最小化参数量化器807和组合器808类似地进行操作。诸如FCB104的码本可以包括脉冲幅度和位置组合的集合。每个脉冲幅度和位置组合可以限定L个不同的位置,并且可以包括指配给该组合的相应位置p=1、2、...L的零幅度脉冲和非零幅度脉冲二者。
在操作中,输入122可以接收并且可以处理输入信号s(n)。输入信号s(n)可以是数字或模拟输入信号。可以通过硬连线的连接无线地从存储介质、从麦克风接收输入,或者以其他方式接收输入。例如,输入信号s(n)可以基于可听信号,诸如语音。目标矢量生成器124可以从输入122接收输入信号s(n),并且可以从输入信号s(n)产生目标矢量x2
FCB候选码矢生成器110可以接收目标矢量x2,并且可以构建多个候选码矢ck [i]和反加权函数f(x2,i),其中,i可以是用于候选码矢ck [i]的索引,其中,0≤i<N并且N至少是2。该多个候选码矢ck [i]可以基于目标矢量x2,并且可以基于反加权函数。该反加权函数可以以特定方式从目标矢量x2移除加权。例如,反加权函数可以基于下述或者可以是下述的其他反加权函数。另外,FCB104还可以例如通过仅搜索全部脉冲/位置组合的子集来使用反加权函数结果作为进一步降低搜索复杂度的手段。误差最小化块117还可以选择多个候选码矢ck [i]中的具有较小的平方和值ei的一个作为ck i*。即,在通过平方误差最小化找到最佳候选码矢ck i*之后,固定码本104可以使用ck i*作为可以在其上迭代的初始“种子”码矢。还可以在这个过程中使用反加权函数结果f(x2,i*)来辅助降低搜索复杂度。因此,i*可以表示最优候选码矢ck [i]的索引值。如果编码器100不包括第二零状态加权合成滤波器H115、第二误差最小化块117、第二增益参数γ加权块142和第二组合器118,则剩余的块可以执行相应的功能。例如,误差最小化块107可以提供候选码矢的索引i以及最优候选码矢的索引值i*,并且零状态加权合成滤波器105可以接收候选码矢ck [i](未示出)。
根据一个示例性实施例,FCB候选码矢生成器110可以基于目标矢量x2、基于逆滤波矢量(inversefilteredvector)并且基于反向滤波矢量(backwardfilteredvector)来构建多个候选码矢ck [i],如下所述。多个候选码矢ck [i]还可以基于目标矢量x2并且基于加权逆滤波矢量和加权反向滤波矢量的和,如下所述。
误差最小化块117可以评估与多个候选码矢ck [i]中的每一个相关联的误差矢量ei。可以分析该误差矢量以选择单个FCB码矢ck [i*],其中,FCB码矢ck [i*]可以是候选码矢ck [i]中的一个。平方误差最小化/参数量化块107可以生成表示FCB码矢ck [i]的码字k。解码器可以使用码字k来生成输入信号s(n)的近似。误差最小化块107或其他元件可以通过传送码字k和/或存储码字来在输出126处输出码字k。例如,误差最小化块117可以生成和输出码字k。
对于每个候选码矢ck [i]可以通过经由零状态加权合成滤波器105对其进行滤波来将每个候选码矢ck [i]处理为就像由FCB104生成的那样。FCB候选码矢生成器110可以评估与多次中的多个候选码矢ck [i]的每次迭代相关联的误差值,以基于具有最小误差值的候选码矢ck [i]来生成FCB码矢ck
还可以在不使其通过多于一级的迭代的情况下生成码字k。例如,可以在不使用块104、105和108的修改的情况下生成码字k。例如,当FCB候选码矢生成器110产生足够数目的脉冲时,在不需要第二级的情况下,可能已经是目标信号x2的良好近似。当其具有足够的比特时,其可以汇聚成最佳值。因此,来自固定码本104的ck可以与在初始固定码本候选码矢ck [i]的矢量中的一个相同。而且,FCB104甚至可以诸如在ck [i]可能足够好的高比特率应用中不存在。在任何一种情况下,候选码矢ck [i]等同于最后的码矢ck,并且可以随后传送或存储索引k,以供稍后由解码器来使用。
根据一些实施例,可以存在对于语音的每个帧评估的多个反函数f(x2,i),其中,1<=i<=N并且N>1。可以使用多个f(x2,i)输出来确定码本输出,该码本输出可以是ck [i]或ck。另外,ck [i]可以是用于确定ck的开始点,其中,ck [i]可以允许k的较少的迭代,并且可以通过避免极小值来支持更好的整体结果。
图2是根据一个实施例的FCB候选码矢生成器110的示例性框图。FCB候选码矢生成器110可以包括逆滤波器210、反向滤波器220以及用于FCB候选码矢生成器的另一个处理块230。
FCB候选码矢生成器110可以构建多个候选码矢ck [i],其中,i可以是用于候选码矢ck [i]的索引。多个候选码矢ck [i]可以基于目标矢量x2,并且可以基于诸如f(x2,i)的反加权函数。反加权函数可以基于逆滤波矢量,并且逆滤波器210可以根据目标矢量x2构建逆滤波矢量。例如,可以基于r=H-1x2来构建逆滤波矢量,其中r可以是逆滤波矢量,其中H-1可以是从加权合成滤波器的冲激响应形成的零状态加权合成卷积矩阵,并且其中x2可以是目标矢量。在其他实施例中描述了其他变体。
该反加权函数可以基于反向滤波矢量,并且反向滤波器220可以根据目标矢量x2构建反向滤波矢量。例如,可以基于d2=HTx2来构建反向滤波矢量,其中,d2可以是反向滤波矢量,其中,HT可以是从加权合成滤波器的冲激响应形成的零状态加权合成卷积矩阵的转置,并且其中,x2可以是目标矢量。在其他实施例中描述了其他变体。
根据一个示例实施例,从背景技术回顾
ε=||x2-γHck||2,(15)(19)
如果FCB码矢被给出为:
c k = 1 &gamma; H - 1 x 2 , - - - ( 20 )
则误差ε可能趋于零,并且输入信号s(n)和相应的编码输出信号s可以相同。因为这对于低速率语音编码系统来说不实际,所以通常仅生成等式20的粗近似。通过引用合并于此的对Adoul的美国专利No.5,754,976公开了将逆滤波目标信号r=H-1x2用作用于码矢ck的脉冲幅度的低比特率预选的方法的一个示例。
在评估在等式19中的误差项ε中的一个问题在于,当在加权合成域中评估误差ε的同时,在剩余域中生成FCB码矢ck。因此,因为量化误差生成在与加权合成域相对的剩余域中,所以在等式20中的右侧项的直接类PCM量化通常不产生在等式19中的最小可能误差。更具体地,表达式:
c k = Q P { 1 &gamma; H - 1 x 2 } , - - - ( 21 )
其中,QP{}是P比特量化运算符,因为由于QP{}而导致的误差是剩余域误差,所以通常不会导致全局最小加权误差。为了在加权域中实现最低的可能误差,可能需要ck的许多迭代来最小化等式19的误差ε。下面描述的本公开的各种实施例可以通过减少迭代并且通过减少剩余的域误差来解决该问题。
首先,FCB候选码矢生成器119可以使用下面的表达式来生成第i个前置量化器候选
c k [ i ] = Q P { f ( x 2 , i ) } , 0 &le; i &le; N , - - - ( 22 )
其中,f(x2,i)可以是目标矢量的特定函数,并且N可以是前置量化器候选的数目。该表达式可以是用于生成可以评估在加权域中的误差的多个前置量化器候选的一般化形式。这样的函数的示例被给出为:
f ( x 2 , i ) = a i r | | r | | + b i d 2 | | d 2 | | , - - - ( 23 )
其中,r=H-1x2是逆滤波目标信号,d2=HTx2是在等式17中计算/定义的反向滤波目标,并且ai和bi是用于迭代i的相应的加权系数集合。在此,||r||可以是诸如逆滤波目标矢量r的剩余域矢量r的范数,通过给出,并且类似地系数ai和bi的效果可以用于产生逆滤波目标矢量和反向滤波目标矢量的加权和,该逆滤波目标矢量和反向滤波目标矢量的加权和然后可以然后形成前置量化器候选矢量集合。
本公开的实施例可以允许将各种系数函数并入在等式23中的范化的矢量的加权。例如,函数:
ai=1-i/(N-1),0≤i<N,(24)
bi=i/(N-1),
其中,N是前置量化器候选的总数,可以具有值的线性分布。例如,如果N=4,则系数集合可以是:ai∈{1.0,0.667,0.333,0.0}并且bi∈{0.0,0.333,0.667,1.0}。另一个示例可以包含诸如Linde-Buzo-Gray(或LBG)算法的训练算法的结果,其中,可以使用培训数据库并且然后基于统计分布来选择ai和bi而离线地评估a和b的许多值。用于训练的这样的方法是本领域中公知的。其他函数也是可能的。例如,可以发现下面的函数有益于特定类别的信号:
f(x2,i)=air+birlpf,(25)
其中,rlpf可以是r的低通滤波版本。替代地,LPF特性可以被改变为作为i的函数:
f(x2,i)=Bir,(26)
其中,Bi可以是意在以更接近地近似在加权域中的误差的整形方式来对剩余的域量化误差进行整形的一类线性相位滤波特性。另一种方法可以涉及指定可以还可以以有益于对剩余域误差进行整形的方式来整形误差的反感知加权函数族:
f ( x 2 , i ) = H i - 1 x 2 , - - - ( 27 )
然后,可以将加权信号量化为可以由特定FCB编码处理利用的形式。通过引用包含在此的对Adoul的美国专利No.5,754,976和对Peng的美国专利No.6,236,960公开了使用在本质上为代数的单位幅度脉冲码本的编码方法。即,与存储在存储器中相反,在进行中(onthefly)生成码本,搜索各种脉冲位置和幅度组合,找到低误差脉冲组合,并且然后使用组合技术来编码位置和幅度以形成码字k,该码字k随后由解码器使用来再生ck并且进一步生成输入信号s(n)的近似。
根据一个实施例,在美国专利中No.6,236,960中公开的码本可以用于将加权信号量化为可以由特定FCB编码过程利用的形式。可以通过将增益项gQ迭代地调整为下式来从等式22获得第i个前置量化器候选
c k [ i ] = round ( g Q f ( x 2 , i ) ) : &Sigma; n | c k [ i ] ( n ) | = M - - - ( 28 )
其中round()运算符将gQf(x2,i)的相应矢量元素圆整为最近的整数值,其中n表示矢量的第n个元素,并且M是单位幅度脉冲的总数。该表达式描述了下述处理:选择gQ使得在中的单位幅度脉冲的总数等于M。
存在用于从f(x2,i)确定的许多其他方式。例如,可以采用基于中值搜索的量化方法。这可以是迭代过程,该迭代过程涉及找到满足对于给定增益的脉冲和限制的最优脉冲配置,并且然后找到用于最优脉冲配置的最优增益。在通过引用合并在此的标题目为“Frameerrorrobustnarrow-bandandwidebandembeddedvariablebit-ratecodingofspeechandaudiofrom8-32kbit/s”的ITU-T推荐G.718的6.11.6.2.4部分,第153页中给出了这样的基于中值搜索的量化的实际示例。
然后,可以根据下面的表达式(其基于等式17)来评估该N个不同的前置量化器候选:
i * = arg max 0 &le; i &le; N { ( d 2 T c k [ i ] ) 2 c k [ i ] T &Phi; c k [ i ] } - - - ( 29 )
其中,可以将替代为ck,并且可以选择在N个候选中的最佳候选i*。替代地,可以通过强力计算来确定i*
i * = arg max 0 &le; i &le; N { ( x 2 T y 2 [ i ] ) 2 y 2 [ i ] T y 2 [ i ] } - - - ( 30 )
其中,并且可以是通过零状态加权合成滤波器105滤波的第i个前置量化器候选。后一种方法可以用于复杂度原因,特别是当在前置量化器候选中的非零位置的数目相对高时或者当不同的前置量化器候选具有非常不同的脉冲位置时。在那些情况下,在现有技术中描述的有效搜索技术不一定有效。
在选择了最佳前置量化器候选之后,可以进行后搜索以改善脉冲位置和/或符号,使得进一步减小整体加权误差。后搜索可以是通过等式29描述的一个。在该情况下,可以通过设并且然后,在k上迭代以降低加权误差来初始化等式29的分子和分母。不必包含由FCB允许的精确数目的脉冲。例如,FCB配置可以允许ck包含20个脉冲,但是前置量化器级可以仅使用10或15个脉冲。可以通过后搜索来布置剩余的脉冲。在另一种情况下,前置量化器级可以布置比由FCB配置所允许的更多的脉冲。在该实施例中,后搜索可以以试图最小化加权误差的方式来移除脉冲。在另一个实施例中,因为前置量化器候选可以提供用于特定应用的足够的质量,所以脉冲的数目可以高得足以不需要后搜索。然而,在一个实施例中,在前置量化器矢量中的脉冲的数目通常可以等于由特定FCB配置所允许的脉冲的数目。在该情况下,后搜索可以涉及从一个位置移除单位幅度脉冲,并且将该脉冲布置在导致更低的加权误差的不同的位置。可以重复该过程直到码字汇聚或者直到达到迭代的预定最大数目。
为了进一步详述其中候选码矢ck [i]和最后的FCB输出矢量ck可能或可能不包含相同数目的单位幅度脉冲的上述实施例,存在另一个实施例,其中,用于生成ck [i]的候选码本可以与用于生成ck的码本不同。即,最佳候选ck [i*]通常可以用于通过使用ck [i*]作为用于确定最佳反函数f(x2,i*)的手段并且然后继续使用f(x2,i*)作为用于搜索第二码本ck [i*]的手段来降低复杂度或改善得到的码矢ck的整体性能。这样的示例可以包括使用用于生成ck [i*]的阶乘脉冲编码(FPC)码本,并且然后使用传统ACELP码本来生成c’k,其中,在辅助码本搜索c’k中使用反函数f(x2,i*),并且丢弃候选码矢ck [i]。以该方式,例如,用于辅助码本c’k的脉冲符号的预先选择可以基于多个反函数f(x2,i),并且不直接基于候选码矢ck [i]。该实施例可以允许对于使用特定码本设计的现有编解码器的性能改善,同时保持互操作性和向后兼容性。
在另一个实施例中,可以使用非常大的值的N。例如,如果N=100,则加权系数[aibi]可以跨很高的分辨率集合,并且可以得到将得出最优结果的解。
根据通过引用合并于此的Mittal的美国专利7,054,807,可以联合地优化ACB/FCB参数。联合优化还可以用于N个前置量化器候选的评估。现在,等式29可以变成:
i * = arg max 0 &le; i &le; N { ( d 2 T c k [ i ] ) 2 c k [ i ] T &Phi; &prime; c k [ i ] } - - - ( 31 )
其中,Φ'=Φ-yyT,并且其中,y可以是调整的反向滤波ACB激励。现在,可以通过强力计算来确定i*
i * = arg max 0 &le; i &le; N { ( x 2 T y 2 [ i ] ) 2 y 2 [ i ] T y 2 [ i ] - ( y T c k [ i ] ) 2 } - - - ( 32 )
其中,可以是通过零状态加权合成滤波器105滤波的第i个前置量化器候选,并且可以是在第i个前置量化器候选和调整的反向滤波的ACB激励之间的相关性。
图3是概述根据一个实施例的编码器100的操作的流程图300的示例性图示。流程图300图示了可以包括上面公开的实施例的方法。
在310处,可以从接收到的输入信号s(n)生成目标矢量x2。输入信号s(n)可以基于可听语音输入信号。在320处,可以基于目标矢量x2构建多个反加权函数f(x2,i)。可选地,还可以基于目标矢量x2并且基于反加权函数f(x2,i)来构建多个候选码矢ck [i]。可以基于逆滤波矢量并且基于反向滤波矢量以及目标矢量x2来构建多个反加权函数f(x2,i)(和/或多个候选码矢ck [i])。还可以基于加权逆滤波矢量和加权反向滤波矢量以及目标矢量x2的和来构建多个反加权函数f(x2,i)(和/或多个候选码矢ck [i])。
在330处,可以评估与多个反加权函数f(x2,i)(和/或多个候选码矢ck [i])中的每个码矢相关联的误差值ε以产生固定码本码矢ck。例如,可以评估ck [i]的误差ε[i]以产生ck [i*],然后可以将ck [i*]用作用于进一步在ck上搜索的基础。值k可以是输出的最后码本索引。
在340处,可以生成表示固定码本码矢ck的码字k,其中,解码器可以使用该码字来生成输入信号s(n)的近似。在350处,可以输出码字k。例如,码字k可以是固定码本索引参数码字k,可以通过传送固定码本索引参数k和/或存储固定码本索引参数k来输出该固定码本索引参数码字k。
图4是概述根据一个实施例的图3的块320的操作的流程图400的示例图示。在410处,可以从目标矢量x2构建逆滤波矢量r。块320的反加权函数f(x2、i)可以基于从目标矢量x2构建的逆滤波矢量r。可以基于r=H-1x2来构建逆滤波矢量r,其中r可以是逆滤波矢量,其中H-1可以是从加权合成滤波器的冲激响应形成的零状态加权合成卷积矩阵,并且其中x2可以是目标矢量。在上面的其他实施例中描述了其他变体。
在420处,可以从目标矢量x2构建反向滤波矢量d2。块320的反加权函数f(x2,i)可以基于从目标矢量x2构建的反向滤波矢量d2。可以基于d2=HTx2来构建反向滤波矢量d2,其中d2可以是反向滤波矢量,其中HT可以是从加权合成滤波器的冲激响应形成的零状态加权合成卷积矩阵的转置,并且其中x2可以是目标矢量。在上面的其他实施例中描述了其他变体。
在430处,可以基于逆滤波矢量r的加权和反向滤波矢量d2的加权来构建多个反加权函数f(x2,i)(和/或多个候选码矢ck [i]),其中,对于相关联的候选码矢ck [i]中的每一个加权可以是不同的。例如,加权可以基于或如上所述的其他加权。
图5是根据一个实施例的用于i=1和i=2的两个概念性候选码矢ck [i]的示例性图示500。候选码矢ck [1]和ck [2]可以与用于目标矢量的不同函数f(x2,1)和f(x2,2)的阶乘脉冲编码矢量相对应。如上所述,候选码矢ck [i]中的一个可以用作用于选择生成固定码本索引参数k的码字ck的基础。固定码本索引参数k可以至少部分地识别在码本中脉冲幅度和位置组合的集合,诸如包括脉冲幅度510和位置520。每个脉冲幅度和位置组合可以定义L个不同位置,并且可以包括指配给该组合的相应位置p=1、2、...L的零幅度脉冲和非零幅度脉冲二者。该脉冲幅度和位置组合集合可以用于诸如码矢ck [1]的所选候选码矢ck [i*]的函数f(x2,1)和f(x2,2)。图示500仅意在作为概念性示例,并且不与任何实际数目的脉冲、脉冲的位置、码矢或信号相对应。
虽然已经使用本公开的特定实施例描述了本公开,但是显然,许多替代、修改和变化对于本领域内的技术人员是明显的。例如,实施例的各种部件可以在其他实施例中被交换、增加或替代。而且,每个附图的所有元件不必用于所公开的实施例的操作。例如,将使得所公开的实施例的本领域内的普通技术人员能够通过简单地使用独立权利要求的元素来建立和使用本公开的教导。因此,在此阐述的本公开的实施例意在是说明性的,而不是限制性的。在不偏离本公开的精神和范围的情况下可以进行各种改变。
在本文中,诸如“第一”和“第二”等关系术语仅用于将一个实体或行为与另一个实体或行为进行区分,而不必要求或暗示在这样的实体或行为之间的任何实际的这样的关系或顺序。术语“耦合”除了被修改之外暗示元件可以连接在一起,但是不要求直接连接,例如,可以通过一个或多个中间元件来连接。而且,可以通过使用在两个元件之间的物理连接、通过使用在两个元件之间的电信号、通过使用在两个元件之间的射频信号、通过使用在两个元件之间的光信号、通过在两个元件之间提供功能交互或通过以其他方式将两个元件彼此相关来耦合该元件。而且,诸如“顶”、“底”、“前”、“后”、“水平”和“垂直”等关系术语可以仅用于相对于彼此区分元件的空间定位,而不必暗示相对于任何其他物理坐标系的空间定位。术语“包括”或其任何其他变体意在涵盖非排他性包括,使得包括一系列元件的过程、方法、物品或设备不仅包括那些元件,而且可以包括未明确地列出并且这样的过程、方法、物品或设备所固有的其他元件。以“一个”等引导的元件在没有更多限制的情况下不排除在包括该元件的过程、方法、物品或设备中存在其他的相同元件。而且,术语“另一个”被定义为至少第二或更多。在此使用的术语“包括”和“具有”等被定义为“包含”。

Claims (23)

1.一种用于生成用于编码信息信号的候选码矢的方法,包括:
接收输入信号;
从所述输入信号产生目标矢量;
基于所述目标矢量并且基于至少一个反加权函数来构建多个候选码矢;
评估与所述多个候选码矢中的每一个码矢相关联的误差值以产生固定码本码矢;以及
生成表示所述固定码本码矢的码字,其中,所述码字由解码器使用来生成所述输入信号的近似。
2.根据权利要求1所述的方法,其中,所述方法进一步包括:
通过下述中的一个来输出所述码字:传送所述码字以及存储所述码字。
3.根据权利要求1所述的方法,其中,所述至少一个反加权函数基于从所述目标矢量构建的逆滤波矢量。
4.根据权利要求3所述的方法,
其中,基于r=H-1x2来构建所述逆滤波矢量,
其中,r包括所述逆滤波矢量,
其中,H-1包括从加权合成滤波器的冲激响应形成的零状态加权合成卷积矩阵,并且
其中,x2包括所述目标矢量。
5.根据权利要求1所述的方法,其中,所述至少一个反加权函数基于从所述目标矢量构建的反向滤波矢量。
6.根据权利要求5所述的方法,
其中,基于d2=HTx2来构建所述反向滤波矢量,
其中,d2包括所述反向滤波矢量,
其中,HT包括从加权合成滤波器的冲激响应形成的零状态加权合成卷积矩阵的转置,并且
其中,x2包括所述目标矢量。
7.根据权利要求1所述的方法,其中,所述构建包括:
基于所述目标矢量、基于逆滤波矢量并且基于反向滤波矢量来构建所述多个反加权函数。
8.根据权利要求1所述的方法,其中,所述构建包括:
基于所述目标矢量并且基于加权的逆滤波矢量和加权的反向滤波矢量的和来构建所述多个反加权函数。
9.根据权利要求1所述的方法,其中,所述多个候选码矢基于以下中的一个:从所述目标矢量构建的逆滤波矢量以及从所述目标矢量构建的反向滤波矢量。
10.根据权利要求9所述的方法,进一步包括:
使用固定码本并且通过零状态加权合成滤波器来多次处理所述多个候选码矢中的每个,
其中,所述评估包括:
评估与所述多次中的所述多个候选码矢的每次迭代相关联的至少一个误差值,以基于具有最低误差值的所述候选码矢来产生所述固定码本码矢。
11.一种用于生成用于编码信息信号的候选码矢的设备,所述设备包括:
输入,所述输入被配置为接收输入信号;
目标矢量生成器,所述目标矢量生成器被配置为从所述输入信号产生目标矢量;
固定码本候选码矢生成器,所述固定码本候选码矢生成器被配置为基于所述目标矢量并且基于至少一个反加权函数来构建多个候选码矢;
误差最小化单元,所述误差最小化单元被配置为评估与所述多个候选码矢中的每一个码矢相关联的误差值,以产生固定码本码矢;以及
输出,所述输出被配置为基于所述固定码本码矢来输出码字。
12.根据权利要求11所述的设备,进一步包括:
其中,所述输出被配置为通过传送所述码字以及存储所述码字中之一来输出所述码字。
13.根据权利要求11所述的设备,其中,所述固定码本候选码矢生成器包括:
逆滤波器,所述逆滤波器用于从所述目标矢量构建逆滤波矢量,其中,所述至少一个反加权函数基于所述逆滤波矢量。
14.根据权利要求13所述的设备,
其中,基于r=H-1x2来构建所述逆滤波矢量,
其中,r包括所述逆滤波矢量,
其中,H-1包括从加权合成滤波器的冲激响应形成的零状态加权合成卷积矩阵,并且
其中,x2包括所述目标矢量。
15.根据权利要求11所述的设备,其中,所述固定码本候选码矢生成器包括:
反向滤波器,所述反向滤波器用于从所述目标矢量构建反向滤波矢量,其中,所述至少一个反加权函数基于所述反向滤波矢量。
16.根据权利要求15所述的设备,
其中,基于d2=HTx2来构建所述反向滤波矢量,
其中,d2包括所述反向滤波矢量,
其中,HT包括从加权合成滤波器的冲激响应形成的零状态加权合成卷积矩阵的转置,并且
其中,x2包括所述目标矢量。
17.根据权利要求11所述的设备,其中,反加权函数包括通过加权系数来加权的逆滤波矢量。
18.根据权利要求11所述的设备,其中,反加权函数包括通过加权系数来加权的反向滤波矢量。
19.根据权利要求11所述的设备,其中,所述多个候选码矢基于以下中的一个:由逆滤波器从所述目标矢量构建的逆滤波矢量以及由反向滤波器从所述目标矢量构建的反向滤波矢量。
20.根据权利要求19所述的设备,进一步包括:
组合器,所述组合器被配置为基于从所述固定码本候选码矢生成器构建的所述多个候选码矢中的每一个来生成所述误差值。
21.根据权利要求11所述的设备,进一步包括:码字生成器,所述码字生成器被配置为基于所述固定码本码矢来生成所述码字,其中,所述码字用于由解码器使用来生成所述输入信号的近似。
22.一种用于生成用于编码信息信号的候选码矢的方法,所述方法包括:
接收基于可听语音的输入信号;
从所述输入信号产生目标矢量;
基于所述目标矢量并且基于多个反加权函数来构建多个候选码矢;
评估与所述多个候选码矢中的每一个相关联的误差值以产生固定码本码矢;
生成表示所述固定码本码矢的码字,其中,所述码字用于生成固定码本索引参数,所述固定码本索引参数至少部分地识别在用于生成所述输入信号的近似的码本中的脉冲幅度和位置组合的集合;以及
通过下述中的一个来输出所述码字:传送所述码字或者存储所述码字。
23.根据权利要求22所述的方法,其中,所述构建包括:
基于所述目标矢量、基于加权逆滤波矢量并且基于加权反向滤波矢量来构建所述多个候选码矢。
CN201310116042.7A 2012-04-04 2013-04-03 生成用于编码信息信号的候选码矢的方法和设备 Active CN103366752B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/439,121 2012-04-04
US13/439,121 US9070356B2 (en) 2012-04-04 2012-04-04 Method and apparatus for generating a candidate code-vector to code an informational signal

Publications (2)

Publication Number Publication Date
CN103366752A CN103366752A (zh) 2013-10-23
CN103366752B true CN103366752B (zh) 2016-06-01

Family

ID=47913226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310116042.7A Active CN103366752B (zh) 2012-04-04 2013-04-03 生成用于编码信息信号的候选码矢的方法和设备

Country Status (6)

Country Link
US (1) US9070356B2 (zh)
EP (1) EP2648184A1 (zh)
KR (1) KR101453200B1 (zh)
CN (1) CN103366752B (zh)
BR (1) BR102013008010A2 (zh)
MX (1) MX2013003443A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9070356B2 (en) 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0843302A2 (en) * 1996-11-19 1998-05-20 Sony Corporation Voice coder using sinusoidal analysis and pitch control
CN1189263A (zh) * 1996-02-15 1998-07-29 菲利浦电子有限公司 复杂度减小的信号传输系统
WO2009022454A1 (ja) * 2007-08-10 2009-02-19 Panasonic Corporation 音声分離装置、音声合成装置および声質変換装置
CN101501759A (zh) * 2006-06-30 2009-08-05 弗劳恩霍夫应用研究促进协会 具有动态可变规整特性的音频编码器、音频解码器和音频处理器
CN101925953A (zh) * 2008-01-25 2010-12-22 松下电器产业株式会社 编码装置、解码装置以及其方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
EP1686563A3 (en) * 1997-12-24 2007-02-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for speech decoding
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6330533B2 (en) * 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
EP2040253B1 (en) * 2000-04-24 2012-04-11 Qualcomm Incorporated Predictive dequantization of voiced speech
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
WO2009033288A1 (en) * 2007-09-11 2009-03-19 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
NO2669468T3 (zh) * 2011-05-11 2018-06-02
US9070356B2 (en) 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1189263A (zh) * 1996-02-15 1998-07-29 菲利浦电子有限公司 复杂度减小的信号传输系统
EP0843302A2 (en) * 1996-11-19 1998-05-20 Sony Corporation Voice coder using sinusoidal analysis and pitch control
CN101501759A (zh) * 2006-06-30 2009-08-05 弗劳恩霍夫应用研究促进协会 具有动态可变规整特性的音频编码器、音频解码器和音频处理器
WO2009022454A1 (ja) * 2007-08-10 2009-02-19 Panasonic Corporation 音声分離装置、音声合成装置および声質変換装置
CN101925953A (zh) * 2008-01-25 2010-12-22 松下电器产业株式会社 编码装置、解码装置以及其方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Frame error robust narrow-band and wideband embedded variable bitrate coding of speech and audio from 8-32kbit/s,;ITU-T;《TELCOMMUNICATION STANDARIZATION SECTOR OF ITU》;20080601;摘要,第71,77-79,96-98页,图1,8,24 *

Also Published As

Publication number Publication date
EP2648184A1 (en) 2013-10-09
KR101453200B1 (ko) 2014-10-22
US9070356B2 (en) 2015-06-30
BR102013008010A2 (pt) 2016-11-01
MX2013003443A (es) 2014-05-22
KR20130112796A (ko) 2013-10-14
CN103366752A (zh) 2013-10-23
US20130268266A1 (en) 2013-10-10

Similar Documents

Publication Publication Date Title
JP3112681B2 (ja) 音声符号化方式
US5271089A (en) Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
AU668817B2 (en) Vector quantizer method and apparatus
KR100982211B1 (ko) 다중의 속도 애플리케이션에 대한 단일 코드북 벡터 양자화
JP4005359B2 (ja) 音声符号化及び音声復号化装置
US6161086A (en) Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search
EP2487681A1 (en) Multi-stage quantization method and device
US20040181400A1 (en) Apparatus, methods and articles incorporating a fast algebraic codebook search technique
JPH04264500A (ja) 音声信号伝送方法および音声信号伝送装置
US6094630A (en) Sequential searching speech coding device
CN103366752B (zh) 生成用于编码信息信号的候选码矢的方法和设备
CN100580772C (zh) 对信息信号编码的方法和设备
JP2000132197A (ja) Celp型音声符号化装置
CN104854656A (zh) 在自相关域中利用acelp编码语音信号的装置
US7337110B2 (en) Structured VSELP codebook for low complexity search
US5864650A (en) Speech encoding method and apparatus using tree-structure delta code book
CN101572092A (zh) 编解码端的固定码本激励的搜索方法及装置
KR100736504B1 (ko) 확률적 코드북의 음원 부호화 방법
US9263053B2 (en) Method and apparatus for generating a candidate code-vector to code an informational signal
CN101223580B (zh) 用于搜索固定码本的方法和设备
CN100367347C (zh) 话音信号编码器和话音信号解码器
JPH096396A (ja) 音響信号符号化方法及び音響信号復号化方法
CN101630510B (zh) Amr语音编码中lsp系数量化的快速码本搜索的方法
CN105122358A (zh) 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法
JP3954716B2 (ja) 音源信号符号化装置、音源信号復号化装置及びそれらの方法、並びに記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160412

Address after: American California

Applicant after: Technology Holdings Co., Ltd of Google

Address before: Illinois State

Applicant before: Motorola Mobility, Inc.

C14 Grant of patent or utility model
GR01 Patent grant