CN1051392C - 矢量量化器方法 - Google Patents

矢量量化器方法 Download PDF

Info

Publication number
CN1051392C
CN1051392C CN94190277A CN94190277A CN1051392C CN 1051392 C CN1051392 C CN 1051392C CN 94190277 A CN94190277 A CN 94190277A CN 94190277 A CN94190277 A CN 94190277A CN 1051392 C CN1051392 C CN 1051392C
Authority
CN
China
Prior art keywords
vector
reflection coefficient
array
interrelationship
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN94190277A
Other languages
English (en)
Other versions
CN1109697A (zh
Inventor
艾瑞·A·格森
马克·A·杰休科
马休·A·哈特曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BlackBerry Ltd
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of CN1109697A publication Critical patent/CN1109697A/zh
Application granted granted Critical
Publication of CN1051392C publication Critical patent/CN1051392C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Abstract

矢量相加激励的线性预测编码(VSELP)语音编码器提供了改进的质量,减少了通常语音编码器的复杂性。VSELP使用代码簿,它有一预先定义的结构使得代码簿搜索过程所要求的计算大为减少。这个VSELP语音编码器运用基于定点阵技术(FLAT)的反射系数的单一或多段矢量量化器。此外,这个语音编码器使用预量化器来减小搜索的复杂性,使用高分辨标量量化器来减小所需要的存贮总量。以减少计算量和存贮要求。

Description

矢量量化器方法
本发明一般地涉及使用代码激励的线性预测编码(CELP),使用随机编码或矢量激励的语音编码方法,以及更具体地讲,涉及用于矢量相加激励的线性预测编码(VSELP)的矢量量化器方法。
代码激励的线性预测(CELP)是一用于产生高质量合成语音的语音编码技术。这种语音编码也称为矢量激励的线性预测,被用于许多的语音通信和语音合成应用中。CELP特别是应用于数字语音加密和数字无线电话通信系统,这里语音质量,数据速率,大小和费用都是重要的问题。
在CELP语音编码器中,模拟输入语音信号特性的长期(音调(pitch))和短期(峰段(formant))预测器包含在一套时变滤波器内。具体地,可使用一个长期和一个短期滤波器。用于滤波器的激励信号从已存贮的改进序列的代码簿或码矢(codevectors)中选择。
对于每一帧语音,选择一最佳的激励信号。语音编码器施加一单独码矢到滤波器以产生一重建的语音信号,该重建的语音信号和原始输入的语音信号相比较,产生一误差信号。该误差信号通过一谱噪声加权滤波器被加权。谱噪声加权滤波器有一以人体听力感觉为基础的响应。最佳激励信号是一选出的码矢,对当时的语音帧它以最小能量产生加权的误差信号。
典型地,线性预测编码(LPC)是用来模拟采样区段内的短期信号相关,也称为短期滤波器。短期信号相关表示声道的谐振频率。LPC系数是一组语音模型参量。其它的参量组可用来表示加于短期预测滤波器的激励信号的特性。这些其它的语音模型参量包括:线谱频率(LSF),逆谱(cepstral)系数,反射系数,对数面积比和反正弦。
语音编码器通常对激励信号进行矢量量化以减少为表示信号特性所必需的比特数。LPC系数可在量化前被转换为其它的上述的参量组。这些系数可被单独地量化(标量量化)或被一组地量化(矢量量化)。标量量化不如矢量量化那样有效。然而标量量化在计算和存贮要求上比矢量量化费便宜。LPC参量的矢量量化是应用于主要考虑编码效率的地方。
多段矢量量化可被用来均衡编码效率,矢量量化器搜索复杂性,和矢量量化器存贮要求等。第一类多段矢量量化是将一Np元素的LPC参量矢量划分为n段,n段的每一段是单独地被矢量量化。第二类多段矢量量化是在n个矢量的代码簿中划分LPC参量,这里每个矢量代码簿复盖所有Np矢量元素。为了说明矢量量化,假设Np=10个元素,每个元素以2比特代表。传统的矢量量化每10个元素将要求220个码矢来表示所有可能码矢的可能性。第一类带有两段的多段矢量量化每5个元素将要求210+210个码矢。第二类带有2段的多段矢量量化每5个元素将要求210+210个码矢。这些矢量量化的每一种方法对于编码效率,搜索复杂性和存贮要求等方面都提供不同的利益。这样,现代技术的语音编码器将会从矢量量化方法和设备(这些设备和方法增加了编码效率,或减少了搜索复杂性或存贮要求而无需改变相应的要求)中得益。
图1是一无线电通信系统的方框图,它包括依据本发明的语音编码器。
图2是依据本发明的语音编码器的方框图。
图3是依据本发明所使用的反正弦函数的曲线图。
这里描述代码激励线性预测编码(CELP)的一种变形,被称为矢量相加激励的线性预测编码(VSELP)是本发明的优选实施例。VSELP使用一具有预先定义的结构的激励代码簿,这样,代码簿搜索过程所要求的计算就大大减少。这个VSELP语音编码器使用基于定点点阵技术(FLAT)的反射系数的单一或多段矢量量化器。此外,这个语音编码器使用了预量化器以减少矢量代码簿搜索复杂性,和使用高分辨率标量量化器以减少为存贮反射系数矢量代码簿所需要的存贮器总量。这就得到一反射系数的高性能的矢量量化器,它在计算上是有效的并已减少了存贮要求。
图1是无线电通信系统100的方框图。无线电通信系统100包括两个收发机101,113,他们互相发送和接收语音数据。这两个收发机101,113可以是中继无线电系统,或无线电话通信系统或任何其它发送和接收语音数据的无线电通信系统的一部分。在发射机中,语音信号被输入到话筒-108,语音编码器选择被量化的语音模型参量。被量化的参量的代码被发送到另一收发信机113。在另一收发信机113,所发送的被量化参量的代码被接收机121接收,并用来在语音译码器123中再生语音。再生的语音输出到扬声器124。
图2是一VSELP语音编码器200的方框图。VSELP语音编码器200使用所接收的代码来决定使用代码簿中的激励矢量。VSELP编码器使用有2M个码矢(它由M个基本矢量构成)的激励代码簿。字度Vm(n)为第m个基本矢量,定义ui(n)为代码簿中的第i个码矢。于是 u i ( n ) = Σ m = 1 M θ im v m ( n ) - - - ( 1.10 )
这里0≤i-≤2M-1;0≤n≤N-1。换句话说,代码簿中的每一个码矢被构成为M个基本矢量的线性组合。线性组合由Q参量定义。θim被定义为
θim=+1如果码字i的比特m=1
θim=-1如果码字i的比特m=0码矢i被构成为M个基本矢量之和,这里每一基本矢量的符号(正号或负号)由码字i中相应的比特状态来决定。注意如果我们求补码字i中全部比特数,相应的码矢就是码矢i的负数。所以,对于每个码矢,它的负数也是代码簿中的一个码矢。由于为相应的码字彼此互补,这些码矢对被称为互补码矢。
适宜的矢量被选择后,增益单元205对所选择的矢量乘以增益项γ换算。增益单元205的输出加到一组线性滤波器207和209以获得重建语音的N个样值。滤波器包括一“长期”(或“音调”)滤波器207,它将音调周期性插入激励中。“长期”滤波器207的输出又加到“短期”(或“峰段”)滤波器209。短期滤波器209给信号加上谱包络。
长期滤波器207包括长期预测器系数(LTP)。长期滤波器207试图从一个或多个很远以前的样值中预测下一个输出样值。如果仅有一个过去的样值被应用于预测器中,那么,预测器就是一单抽头预测器。典型地使用一到三个抽头。含有一个单抽头长期预测器的长期(“音调”)滤波器207,其传递函数由(1.1)给出 B ( z ) = 1 1 - βz - L - - - ( 1.1 ) B(z)的特性由两个量L和β表示。L称为“滞后”。对于声频的语音,L典型地应是音调周期或是它的倍数。L也可能是一非整数值。如果L是一非整数,一个内插的有限脉冲响应(FIR)滤波器被用来产生部分延迟的样值。β是长期(或“音调”)预测器系数。
短朝滤波器209包括短期预测器系数αi,它试图从前面的Np个输出样值中预测下一个输出样值。Np典型的范围是从8到12。在本优选的实施例中,Np等于10。短期滤波器209相当于传统的Lpc合成滤波器。短期滤波器209的传递函数由(1.2)给出 A ( z ) = 1 1 - Σ i = 1 N p α i z - i - - - ( 1.2 ) 短期滤波器209的特性由αi参量表示。对于全极点“合成”滤波器,它是直接形式滤波器系数。关于αi参量的详情可在下面见到。
各种参量(代码,增益,滤波器参量)并不以相同的速率发送到合成器(语音译码器)。典型地,短期参量的更新通常比代码少。我们将定义短期参量更新率为“帧频”,更新之间的间隔为一“帧”。代码更新率由矢量长度N决定。我们将定义代码更新率为“子帧频”,代码更新间隔为“子帧”。一帧通常由整数个子帧组成。增益和长期参量可以子帧频,帧频或根据语音编码器设计的两者之间的某些速率更新。
代码簿搜索过程包括尝试每一个码矢作为可能激励CELP合成器的码矢。合成语音S′(n)在比较器211和输入语音S(n)相比较,而产生一差值信号ei。这个差值信号ei(n)由一谱加权滤波器W(z)213(也可能由第二加权滤波器C(z)加以滤波以产生一加权的误差信号e′(n)。e′(n)中的功率在能量计算器215上计算。产生最小加权误差功率的码矢被选为该子帧的码矢。谱加权滤波器213用来对基于感官考虑的误差谱进行加权。这个加权滤波器213是语音谱的一个函数,并能以短期(谱)滤波器209的α参量来表示。 W ( z ) = 1 - Σ i = 1 N p α i z - i 1 - Σ i = 1 N p α ~ i z - i - - - ( 1.3 )
有两种方法能用来计算增益γ。可以在根据残余能量的代码簿搜索之前决定增益。这个增益然后可被固定用于代码簿搜索。另一个方法是当代码簿搜索时优化每个码矢的增益。产生最小加权误差的码矢将被选择,并且它相应的最佳增益将被用于γ。由于增益是对每个码矢的优化,所以后一方法一般地能产生更好的效果。这个方法也意味着增益项必须以子帧频更新。此技术的最佳代码和增益可计算如下:
1.对于子帧计算已加权的输入信号y(n)。
2.计算d(n),子帧的B(z)和W(z)(和(C(z),如果使C(z)的情况下)滤波器的零输入响应。(零输入响应是滤波器没有输入时的响应;滤波器状态的衰减)。
3.在整个子帧计算  p(n)=y(n)-d(n)  (0≤n≤N-1)。
4.对于每个代码i。
a.计算g(n),即码矢i的B(z)和W(z)(和C(z),如果使用的情况下)的零状态响应。(零状态响应是将起始滤波状态置为零的滤波器输出)。
b.计算 C i = Σ n = 0 N - 1 g i ( n ) p ( n ) - - - - ( 1.5 ) 即,已滤波的码矢i和p(n)之间的互相关
c.计算 G i = Σ n = 0 N - 1 | g i ( n ) | 2 - - - ( 1.6 ) 即,已滤波的码矢i中的功率。
5.选择i,它使
Figure C9419027700123
达到最大。
6.使用所选择的码字和它相应的量化增益,更新B(z)和W(z)(和C(z),如使用的情况下)滤波器的滤波状态,以得到合成器在步骤2的下一子帧起始的同样滤波状态。码矢i的最佳增益由(1.8)式给出 γ i = C i G i - - - ( 1.8 ) 使用最佳增益γi的码矢i的总加权误差由(1.9)给出 E i = ( Σ n = 0 N - 1 p 2 ( n ) ) - ( C i ) 2 G i - - - ( 1.9 )
短期预测器参量是图2短期滤波器209的αi′。这些是标准的LPC直接形式滤波器系数,许多LPC分析技术可被用来决定这些系数。在本优选实施例中,使用了一个快速定点协方差点阵算法(FLAT)。FLAT具有点阵算法的全部优点,包括有保证的滤波器稳定性,非窗口分析和在循环内量化反射系数的能力。此外,FLAT在数值上是健全的,并能在一定点处理器上很容易实现。
短期预测器参量是从输入语音计算的,没有使用预加重。用于参量计算的分析长度是170个样值(NA=170)。预测器的阶数是10(Np=10)。
这部分将详细描述FLAT算法。令落入分析间隔内输入语音的样值用S(n)表示;0≤n≤NA-1。因为FLAT是一点阵算法,可以认为该技术是试图逐级地建立一最佳(它使残余能量最小)的逆点阵滤波器。定义bj(n)为来自逆点阵滤波器第j级的反向余项,fj(n)为来自逆点阵滤波器第j级的正向余项,我们可定义 F j ( i , k ) = Σ n = N p N A - 1 f j ( n - i ) f j ( n - k ) - - - ( 2.1 ) 为fj(n)的自相关; B j ( i , k ) = Σ n = N p N A - 1 b j ( n - i - 1 ) b j ( n - k - 1 ) - - - ( 2.2 ) 为bj(n-1)的自相关;以及 C j ( i , k ) = Σ n = N p N A - 1 f j ( n - i ) b j ( n - k - 1 ) - - - ( 2.3 ) 为fj(n)和bj(n-1)之间的互相关。令rj表示逆点阵第j级的反射系数。于是 F j ( i , k ) = F j - 1 ( i , k ) + r j ( C j - 1 ( i , k ) + C j - 1 ( k , i ) ) + r j 2 B j - 1 ( i , k ) - - ( 2.4 ) B j ( i , k ) = B j - 1 ( i + 1 , k + 1 ) + r j ( C j - 1 ( i + 1 , k + 1 ) + C j - 1 ( k + 1 , i + 1 ) ) + r j 2 F j - 1 ( i + 1 , k + 1 ) - - - ( 2.5 ) C j ( i , k ) = C j - 1 ( i , k + 1 ) + r j ( B j - 1 ( i , k + 1 ) + F j - 1 ( i , k + 1 ) ) + r j 2 C j - 1 ( k + 1 , i ) - - - ( 2.6 ) 我们已选择的用来决定rj的公式可表示为 r j = - 2 C j - 1 ( 0,0 ) + C j - 1 ( N P - j , N P - j ) F j - 1 ( 0,0 ) + B j - 1 ( 0,0 ) + F j - 1 ( N P - j , N P - j ) + B j - 1 ( N P - j , N P - j ) - - - ( 2.7 ) FLAT算法现可描述如下:
1.首先从输入语音中计算协方差(自相关)矩阵 φ ( i , k ) = Σ N P N A - 1 s ( n - i ) s ( n - k ) - - - ( 2.8 ) 0≤i,k≤NP.
F0(i,k)=f(i,k)    0≤i,k≤NP-1    (2.9)B0(i,k)=f(i+1,k+1)    0≤i,k≤NP-1    (2.10)C0(i,k)=f(i,k+1)0≤i,k≤NP-1    (2.11)
3.设j=1
4.用(2.7)式计算rj
5.如j=Np,于是结束
6.用(2.4)计算Fj(i,k)    0≤i,k≤Np-j-1
  用(2.5)计算B(i,k)     0≤i,k≤Np-j-1
  用(2.6)计算Cj(i,k)    0≤i,k≤Np-j-1
7.j=j+1;转到4
在解出反射系数之前,用给自相关函数开窗的方法修正φ数值
φ′(i,k)=φ(i,k)w(|i-k|)      (2.12)在计算反射系数之前,给自相关函数开窗通称为谱平滑(SST)。
从反射系数rj,可计算短期LPC预测系数αi
使用反射系数的28比特三段矢量量化器。矢量量化器的段分别复盖反射系数r1-r3,r4-r6,和r7-r10。矢量量化器段的比特分配是
Q1    11比特
Q2    9比特
Q3    8比特为避免穷举的矢量量化器搜索的计算复杂性,在每一段使用了反射系数矢量的预量化器。每段预量化器的大小是:
P1    6比特
P2    5比特
P3     4比特在一给定段,来自预量化器的每个矢量的残余误差被计算并存入暂时存贮器中。搜索这个表以识别最低失真的4个预量化器矢量。每个选出的预量化器矢量的指数是用来计算进入矢量量化器表中的偏移,与预量化器矢量相连系的量化器矢量邻接的子集从这里开始。在第k段每个矢量量化器子集的大小由下式给出: S k = 2 Q k 2 P k - - - ( 2.13 ) 与选出的预量化器矢量相连系的量化器矢量的4个子集被检索用来寻找产生最低残余误差的量化器矢量。这样,在第一段估算64个预量化器矢量和128个量化器矢量,在第二段估算32个预量化器矢量和64个量化器矢量,在第三段估算16个预量化器矢量和64个量化器矢量。通过上述具有频带扩展的FLAT技术所计算的最佳反射系数在矢量量化之前被转换为一自相关矢量。
FLAT算法的自相关方案AFLAT是被用来计算正在被估算的反射系数矢量的残余误差能量。象FLAT一样,当计算最佳反射系数或从当前段的矢量量化器中选择反射系数时,这个算法具有部分地补偿来自以前点阵级中反射系数量化误差的能力。这个改善对于具有高反射系数量化失真的帧是很重要的。现在描述AFLAT算法(在带有预量化器的多段矢量量化器的范围内):
在0≤i≤Np范围内,根据最佳反射系数计算自相关序列R(i)。或者,可根据其它的LPC参量表示(如直接形式LPC预测器系数αi′)来计算自相关序列,或直接根据输入语音来计算。定义AFLAT循环的起始条件:P0(i)=R(i),0≤i≤Np-1(2.14)V0(i)=R(|i+1|),1-Np≤i≤NP-1     (2.15)初始化矢量量化器段指数k:
k=1                           (2.16)令I1(k)是第k段中第一点阵级的指数,Ih(k)是第k段的最后点阵级的指数。在第k段估算来自点阵级Ih(k)的残余误差的循环,已知r,来自预量化器的反射系数矢量或来自量化器的反射系数矢量表示如下。初始化点阵级的指数jj以指向第k段的开始:j=Ij(k)       (2.17)设置Pj-1和Vj-1的起始条件为Pj-1(i)=Pj-1(i),0≤j≤Ih(k)-I1(k)-1  (2.18)Vj-1(i)= Vj-1(i),-Ib(k)+I1(k)-1≤i≤Ib(k)-Il(k)+1(2.19)用下式计算Vi和Pj数值, P j ( i ) = ( 1 + r ^ j 2 ) P j - 1 ( i ) + r ^ j [ V j - 1 ( i ) + V j - 1 ( - i ) ] , 0 ≤ i ≤ I b ( k ) - j - - - ( 2.20 ) V j ( i ) = V j - 1 ( i + 1 ) + r ^ j 2 V j - 1 ( - i - 1 ) + 2 r ^ j P j - 1 ( | i + 1 | ) , j - I b ( k ) ≤ i ≤ I b ( k ) - j - - - ( 2.21 ) j增加:
j=j+1(2.22)如j≤Ih(k)转到(2.20)式。已知反射系数矢量
Figure C9419027700193
,来自点阵级Ih(k)的残余误差由下式给出: E T = P I b ( k ) ( 0 ) - - - ( 2.23 ) 使用概述的AFLAT循环,估算来自第k段预量化器的每个矢量引起的残余误差,识别要搜索的量化器矢量的4个子集,并计算来自所选出的4个子集的每个量化器矢量引起的残余误差。在4个子集中所有量化器矢量范围内使Er为最小的量化器矢量
Figure C9419027700195
的指数,被用Qk比特编码。如k<3,于是在k+1段进行循环的起始条件需要计算。设点阵级指数j等于:
j=Il(k)           (2.24)计算: P - j ( i ) = ( 1 + r ~ j 2 ) P - j - 1 ( i ) + r ~ j [ V - j - 1 ( i ) + V - j - 1 ( - i ) ] , 0 ≤ i ≤ N p - j - 1 - - - ( 2.25 ) V - j ( i ) = V - j - 1 ( i + 1 ) + r ~ j 2 V - j - 1 ( - i - 1 ) + 2 r ~ j P - j - 1 ( | i + 1 | ) , j - N p + 1 ≤ i ≤ N p - j - 1 - - - ( 2 . 26 ) j增加,
j=j+1               (2.27)如 j≤Ih(k),转到式(2.25)增加矢量量化器分段指数k:k=k+1            (2.28)如k≤3,转到(2.17)。否则,选择三段的反射系数矢量的指数,并终止反射系数矢量量化器的搜索。
为了使反射系数矢量量化器的存贮要求为最小,单个反射系数的八位代码而不是实际的反射系数值被存贮于矢量量化器表中,该代码被用来从有256项的标量量化表中查寻反射系数值。八位代码表示通过均匀采样图3所示的反正弦函数所得到的反射系数值。反射系数值从-1到+1变化。当值是接近于+/-1的极限时,在反射系数域(X轴)中的非线性间隔提供更精确的反射系数。而当值是近于0时,提供稍差的精确度。假设为256量化级时,和在反射系数域中均匀采样相比较,这减少了由于反射系数的标量量化引起的谱失真。

Claims (11)

1.矢量量化一反射系数矢量的方法,其中,该反射系数矢量具有M个元素,反射系数矢量代表了一个输入语音信号,该方法包括以下步骤:
a)提供反射系数的预定矢量的第一数组,每一预定矢量有L个元素,其中L<M;
b)根据输入语音信号的相互关系初始化第一段相互关系;
c)从预定矢量的第一数组中选择第一选出矢量;
d)对应于第一选出的矢量和第一段相互关系计算第一段残余误差;
e)对于第一数组的每一预定矢量,重复步骤c)和d)。
f)从具有最低第一段残余误差的第一数组中选择一个矢量,形成第一所选的矢量;
g)响应于第一所选的矢量和第一段相互关系,定义一组第二段相互关系;
h)提供反射系数的预定矢量的第二数组,每一预定矢量有K个元素,其中L+K≤M;
i)从预定矢量的第二数组中选择一第二所选矢量;
j)对应于第二选出的矢量和第二段相互关系组计算第二段残余误差;
k)对第二数组的每个预定矢量重复步骤i)和j);
l)由具有最低第二段残余误差的第二数组中选择一矢量,形成第二所选矢量;和
m)组合至少第一所选矢量和第二所选矢量以形成量化的反射系数矢量。
2.根据权利要求1的矢量化一反射系数矢量的方法,其中该方法进一步包括步骤:
n)根据第二所选矢量和第二段相互关系定义一组第三段相互关系;
o)提供反射系数预定矢量的第三数组,每个预定矢量具有P个元素,其中L+K+P≤M,
p)由预定矢量的第三数组中选择第三选出的矢量;
q)对应于第三所选矢量和该组第三段相互关系计算一第三段残余误差;
r)对第三数组中的每个预定矢量重复步骤p)和q);和
s)由具有最低第三段残余误差的第三数组中选择一矢量,形成第三所选矢量;
其中组合步骤包括步骤:将带有第一所选矢量的第三所选矢量和第二所选矢量组合,以形成量化的反射系数矢量。
3.根据权利要求2的矢量量化一反射系数矢量的方法,其中M是10,并且第一数组的每个矢量有三个元素,第二数组的每个矢量有三个元素,第三数组的每个矢量有四个元素。
4.根据权利要求3的矢量量化一反射系数矢量的方法,其中每个反射系数矢量包括10个指定为1至10的反射系数,预定矢量的第一数组的每个预定矢量覆盖反射系数1、反射系数2和反射系数3;预定矢量的第二数组的每个预定矢量覆盖反射系数4、反射系数5和反射系数6;和,预定矢量的第三数组的每个预定矢量覆盖反射系数7、反射系数8、反射系数9和反射系数10。
5.根据权利要求2的矢量量化一反射系数矢量的方法,其中初始化第一段相互关系的步骤包括步骤:对应于输入的语音信号计算一自相关序列。
6.根据权利要求5的矢量量化一反射系数矢量的方法,其中定义一组第二段相互关系的步骤包括步骤:根据第一所选矢量和第一段相互关系计算一自相关序列;和定义一组第三段相互关系的步骤包括步骤:根据第二所选矢量和第二段相互关系组计算一自相关序列。
7.根据权利要求2的矢量量化一反射系数矢量的方法,其中提供预定矢量的第一数组的步骤包括步骤:建立一第一段反射系数矢量代码薄;提供预定矢量的第二数组的步骤包括步骤:建立一第二段反射系数矢量代码簿;和,提供预定矢量第三数组的步骤包括步骤:建立一第三段反射系数矢量代码簿。
8.根据权利要求1的矢量量化一反射系数矢量的方法,其中定义一组第二段相互关系的步骤包括:根据第一段相互关系和第一所选矢量使用自相关点阵递归技术。
9.根据权利要求8的矢量量化一反射系数的方法,其中自相关点阵递归技术包括定点阵递归技术。
10.根据权利要求1的矢量量化一反射系数的方法,其中计算第一段残余误差的步骤包括使用自相关点阵递归技术。
11.根据权利要求10的矢量量化一反射系数的方法,其中自相关点阵递归技术包括定点阵递归技术。
CN94190277A 1993-03-26 1994-03-07 矢量量化器方法 Expired - Lifetime CN1051392C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US3779393A 1993-03-26 1993-03-26
US08/037,793 1993-03-26

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNB971034516A Division CN1150516C (zh) 1993-03-26 1997-03-12 语音编码方法和语音编码器

Publications (2)

Publication Number Publication Date
CN1109697A CN1109697A (zh) 1995-10-04
CN1051392C true CN1051392C (zh) 2000-04-12

Family

ID=21896370

Family Applications (2)

Application Number Title Priority Date Filing Date
CN94190277A Expired - Lifetime CN1051392C (zh) 1993-03-26 1994-03-07 矢量量化器方法
CNB971034516A Expired - Lifetime CN1150516C (zh) 1993-03-26 1997-03-12 语音编码方法和语音编码器

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNB971034516A Expired - Lifetime CN1150516C (zh) 1993-03-26 1997-03-12 语音编码方法和语音编码器

Country Status (12)

Country Link
US (2) US5826224A (zh)
JP (1) JP3042886B2 (zh)
CN (2) CN1051392C (zh)
AU (2) AU668817B2 (zh)
BR (1) BR9404725A (zh)
CA (1) CA2135629C (zh)
DE (2) DE4492048C2 (zh)
FR (1) FR2706064B1 (zh)
GB (2) GB2282943B (zh)
SE (2) SE518319C2 (zh)
SG (1) SG47025A1 (zh)
WO (1) WO1994023426A1 (zh)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
IT1277194B1 (it) * 1995-06-28 1997-11-05 Alcatel Italia Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato
FR2738383B1 (fr) * 1995-09-05 1997-10-03 Thomson Csf Procede de quantification vectorielle de vocodeurs bas debit
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
TW307960B (en) * 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
JP2914305B2 (ja) * 1996-07-10 1999-06-28 日本電気株式会社 ベクトル量子化装置
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
US6826524B1 (en) 1998-01-08 2004-11-30 Purdue Research Foundation Sample-adaptive product quantization
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
IL129752A (en) 1999-05-04 2003-01-12 Eci Telecom Ltd Telecommunication method and system for using same
GB2352949A (en) * 1999-08-02 2001-02-07 Motorola Ltd Speech coder for communications unit
US6910007B2 (en) * 2000-05-31 2005-06-21 At&T Corp Stochastic modeling of spectral adjustment for high quality pitch modification
JP2002032096A (ja) * 2000-07-18 2002-01-31 Matsushita Electric Ind Co Ltd 雑音区間/音声区間判定装置
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
CA2733453C (en) * 2000-11-30 2014-10-14 Panasonic Corporation Lpc vector quantization apparatus
JP4857468B2 (ja) * 2001-01-25 2012-01-18 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US6584437B2 (en) * 2001-06-11 2003-06-24 Nokia Mobile Phones Ltd. Method and apparatus for coding successive pitch periods in speech signal
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
WO2003091989A1 (en) * 2002-04-26 2003-11-06 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
CA2388358A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
US7337110B2 (en) * 2002-08-26 2008-02-26 Motorola, Inc. Structured VSELP codebook for low complexity search
US7047188B2 (en) * 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
US7272557B2 (en) * 2003-05-01 2007-09-18 Microsoft Corporation Method and apparatus for quantizing model parameters
CN1890711B (zh) * 2003-10-10 2011-01-19 新加坡科技研究局 将数字信号编码成可扩缩比特流的方法和对可扩缩比特流解码的方法
US8473286B2 (en) * 2004-02-26 2013-06-25 Broadcom Corporation Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure
US7697766B2 (en) * 2005-03-17 2010-04-13 Delphi Technologies, Inc. System and method to determine awareness
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
CN101030377B (zh) * 2007-04-13 2010-12-15 清华大学 提高声码器基音周期参数量化精度的方法
CN102089810B (zh) * 2008-07-10 2013-05-08 沃伊斯亚吉公司 多基准线性预测系数滤波器量化和逆量化设备及方法
US8363957B2 (en) * 2009-08-06 2013-01-29 Delphi Technologies, Inc. Image classification system and method thereof
CN101968778A (zh) * 2010-08-13 2011-02-09 广州永日电梯有限公司 点阵串行显示方法
CN107170459B (zh) * 2012-03-29 2020-08-04 瑞典爱立信有限公司 矢量量化器
WO2015145266A2 (ko) * 2014-03-28 2015-10-01 삼성전자 주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
KR102400540B1 (ko) 2014-05-07 2022-05-20 삼성전자주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
CA2959450C (en) * 2014-08-28 2019-11-12 Nokia Technologies Oy Audio parameter quantization
CN109887519B (zh) * 2019-03-14 2021-05-11 北京芯盾集团有限公司 提高语音信道数据传输准确性的方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
JPS59116698A (ja) * 1982-12-23 1984-07-05 シャープ株式会社 音声デ−タ圧縮方法
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
DE3883519T2 (de) * 1988-03-08 1994-03-17 Ibm Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
EP0331857B1 (en) * 1988-03-08 1992-05-20 International Business Machines Corporation Improved low bit rate voice coding method and system
JPH02250100A (ja) * 1989-03-24 1990-10-05 Mitsubishi Electric Corp 音声符合化装置
US4974099A (en) * 1989-06-21 1990-11-27 International Mobile Machines Corporation Communication signal compression system and method
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
US5012518A (en) * 1989-07-26 1991-04-30 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
US4963030A (en) * 1989-11-29 1990-10-16 California Institute Of Technology Distributed-block vector quantization coder
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
JP3129778B2 (ja) * 1991-08-30 2001-01-31 富士通株式会社 ベクトル量子化器
US5307460A (en) * 1992-02-14 1994-04-26 Hughes Aircraft Company Method and apparatus for determining the excitation signal in VSELP coders
US5351338A (en) * 1992-07-06 1994-09-27 Telefonaktiebolaget L M Ericsson Time variable spectral analysis based on interpolation for speech coding

Also Published As

Publication number Publication date
SE518319C2 (sv) 2002-09-24
CA2135629C (en) 2000-02-08
SE9404086L (sv) 1995-01-25
SG47025A1 (en) 1998-03-20
AU6084396A (en) 1996-10-10
BR9404725A (pt) 1999-06-15
GB9802900D0 (en) 1998-04-08
JP3042886B2 (ja) 2000-05-22
CN1150516C (zh) 2004-05-19
AU678953B2 (en) 1997-06-12
US5675702A (en) 1997-10-07
DE4492048T1 (de) 1995-04-27
WO1994023426A1 (en) 1994-10-13
SE0201109D0 (sv) 2002-04-12
DE4492048C2 (de) 1997-01-02
SE0201109L (sv) 2002-04-12
AU668817B2 (en) 1996-05-16
FR2706064A1 (fr) 1994-12-09
CN1166019A (zh) 1997-11-26
US5826224A (en) 1998-10-20
FR2706064B1 (fr) 1997-06-27
GB2282943B (en) 1998-06-03
CA2135629A1 (en) 1994-10-13
GB9422823D0 (en) 1995-01-04
SE524202C2 (sv) 2004-07-06
GB2282943A (en) 1995-04-19
AU6397094A (en) 1994-10-24
CN1109697A (zh) 1995-10-04
SE9404086D0 (sv) 1994-11-25
JPH07507885A (ja) 1995-08-31

Similar Documents

Publication Publication Date Title
CN1051392C (zh) 矢量量化器方法
CN101622662B (zh) 编码装置和编码方法
EP0942411B1 (en) Audio signal coding and decoding apparatus
EP0673014A2 (en) Acoustic signal transform coding method and decoding method
JPH08263099A (ja) 符号化装置
CN101176148B (zh) 编码装置、解码装置和其方法
CN1138183A (zh) 综合分析语音编码器中噪声隐蔽电平适应性修改方法
KR20000010994A (ko) 오디오 신호 부호화 방법 및 복호화 방법, 오디오 신호 부호화장치 및 복호화 장치
EP0865029B1 (en) Efficient decomposition in noise and periodic signal waveforms in waveform interpolation
JP4059350B2 (ja) 分析合成線形予測音声符号化における利得量子化方法
US5651026A (en) Robust vector quantization of line spectral frequencies
CN1050633A (zh) 具有改进的子样求解长期预测器的数字化语言编码器
CN1192357C (zh) 用于语音编码的自适应规则
EP1513137A1 (en) Speech processing system and method with multi-pulse excitation
CN1104010A (zh) 产生用于话音编码器的频谱噪音加权滤波器的方法
CA2792545A1 (en) Coding method, decoding method, apparatus, program and recording medium
CN101572092B (zh) 编解码端的固定码本激励的搜索方法及装置
CN1124588C (zh) 信号编码方法及设备
US5657419A (en) Method for processing speech signal in speech processing system
US7337110B2 (en) Structured VSELP codebook for low complexity search
US6208962B1 (en) Signal coding system
EP0866443B1 (en) Speech signal coder
US5943644A (en) Speech compression coding with discrete cosine transformation of stochastic elements
EP0658873A1 (en) Robust vector quantization of line spectral frequencies
KR960015861B1 (ko) 선 스펙트럼 주파수 벡터의 양자화 방법 및 양자화기

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: RESEARCH IN MOTION LTD.

Free format text: FORMER OWNER: MOTOROLA INC.

Effective date: 20110212

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: ILLINOIS, USA TO: ONTARIO, CANADA

TR01 Transfer of patent right

Effective date of registration: 20110212

Address after: Ontario, Canada

Patentee after: Research In Motion Ltd.

Address before: Illinois Instrunment

Patentee before: Motorola Inc.

C17 Cessation of patent right
CX01 Expiry of patent term

Expiration termination date: 20140307

Granted publication date: 20000412