CN1109697A - 矢量量化器方法和设备 - Google Patents

矢量量化器方法和设备 Download PDF

Info

Publication number
CN1109697A
CN1109697A CN94190277A CN94190277A CN1109697A CN 1109697 A CN1109697 A CN 1109697A CN 94190277 A CN94190277 A CN 94190277A CN 94190277 A CN94190277 A CN 94190277A CN 1109697 A CN1109697 A CN 1109697A
Authority
CN
China
Prior art keywords
vector
array
select
section
reflection coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN94190277A
Other languages
English (en)
Other versions
CN1051392C (zh
Inventor
艾瑞·A·格森
马克·A·杰休科
马休·A·哈特曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BlackBerry Ltd
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of CN1109697A publication Critical patent/CN1109697A/zh
Application granted granted Critical
Publication of CN1051392C publication Critical patent/CN1051392C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Abstract

矢量相加激励的线性预测编码(VSELP)语音编 码器提供了改进的质量,减少了通常语音编码器的复 杂性。VSELP使用代码簿,它有一预先定义的结构 使得代码簿搜索过程所要求的计算大为减少。这个 VSELP语音编码器运用基于定点阵技术(FLAT)的 反射系数的单一或多段矢量量化器。此外,这个语音 编码器使用预量化器来减小搜索的复杂性,使用高分 辨标量量化器来减小所需要的存贮总量。以减少计 算量和存贮要求。

Description

本发明一般地涉及使用代码激励的线性预测编码(CELP),使用随机编码或矢量激励的语音编码的语音编码器,以及更具体地讲,涉及用于矢量相加激励的线性预测编码(VSELP)的矢量量化器。
代码激励的线性预测(CELP)是一用于产生高质量合成语音的语音编码技术。这种语音编码也称为矢量激励的线性预测,被用于许多的语音通信和语音合成应用中。CELP特别是应用于数字语音加密和数字无线电话通信系统,这里语音质量,数据速率,大小和费用都是重要的问题。
在CELP语音编码器中,模拟输入语音信号特性的长期(音调(pitch))和短期(峰段(formant))预测器包含在一套时变滤波器内。具体地,可使用一个长期和一个短期滤波器。用于滤波器的激励信号从已存贮的改进序列的代码簿或码矢(codevectors)中选择。
对于每一帧语音,选择一最佳的激励信号。语音编码器施加一单独码矢到滤波器以产生一重建的语音信号,该重建的语音信号和原始输入的语音信号相比较,产生一误差信号。该误差信号通过一谱噪声加权滤波器被加权。谱噪声加权滤波器有一以人体听力感觉为基础的响应。最佳激励信号是一选出的码矢,对当时的语音帧它以最小能量产生加权的误差信号。
典型地,线性预测编码(LPC)是用来模拟采样区段内的短期信号相关,也称为短期滤波器。短期信号相关表示声道的谐振频率。LPC系数是一组语音模型参量。其它的参量组可用来表示加于短期预测滤波器的激励信号的特性。这些其它的语音模型参量包括:线谱频率(LSF),逆谱(cepstral)系数,反射系数,对数面积比和反正弦。
语音编码器通常对激励信号进行矢量量化以减少为表示信号特性所必需的比特数。LPC系数可在量化前被转换为其它的上述的参量组。这些系数可被单独地量化(标量量化)或被一组地量化(矢量量化)。标量量化不如矢量量化那样有效。然而标量量化在计算和存贮要求上比矢量量化费便宜。LPC参量的矢量量化是应用于主要考虑编码效率的地方。
多段矢量量化可被用来均衡编码效率,矢量量化器搜索复杂性,和矢量量化器存贮要求等。第一类多段矢量量化是将一Np元素的LPC参量矢量划分为n段,n段的每一段是单独地被矢量量化。第二类多段矢量量化是在n个矢量的代码簿中划分LPC参量,这里每个矢量代码簿复盖所有Np矢量元素。为了说明矢量量化,假设Np=10个元素,每个元素以2比特代表。传统的矢量量化每10个元素将要求220个码矢来表示所有可能码矢的可能性。第一类带有两段的多段矢量量化每5个元素将要求210+210个码矢。第二类带有2段的多段矢量量化每5个元素将要求210+210个码矢。这些矢量量化的每一种方法对于编码效率,搜索复杂性和存贮要求等方面都提供不同的利益。这样,现代技术的语音编码器将会从矢量量化方法和设备(这些设备和方法增加了编码效率,或减少了搜索复杂性或存贮要求而无需改变相应的要求)中得益。
图1是一无线电通信系统的方框图,它包括依据本发明的语音编码器。
图2是依据本发明的语音编码器的方框图。
图3是依据本发明所使用的反正弦函数的曲线图。
这里描述代码激励线性预测编码(CELP)的一种变形,被称为矢量相加激励的线性预测编码(VSELP)是本发明的优选实施例。VSELP使用一具有预先定义的结构的激励代码簿,这样,代码簿搜索过程所要求的计算就大大减少。这个VSELP语音编码器使用基于定点点阵技术(FLAT)的反射系数的单一或多段矢量量化器。此外,这个语音编码器使用了预量化器以减少矢量代码簿搜索复杂性,和使用高分辨率标量量化器以减少为存贮反射系数矢量代码簿所需要的存贮器总量。这就得到一反射系数的高性能的矢量量化器,它在计算上是有效的并已减少了存贮要求。
图1是无线电通信系统100的方框图。无线电通信系统100包括两个收发机101,113,他们互相发送和接收语音数据。这两个收发机101,113可以是中继无线电系统,或无线电话通信系统或任何其它发送和接收语音数据的无线电通信系统的一部分。在发射机中,语音信号被输入到话筒108,语音编码器选择被量化的语音模型参量。被量化的参量的代码被发送到另一收发信机113。在另一收发信机113,所发送的被量化参量的代码被接收机121接收,并用来在语音译码器123中再生语音。再生的语音输出到扬声器124。
图2是一VSELP语音编码器200的方框图。VSELP语音编码器200使用所接收的代码来决定使用代码簿中的激励矢量。VSELP编码器使用有2M个码矢(它由M个基本矢量构成)的激励代码簿。字度Vm(n)为第m个基本矢量,定义ui(n)为代码簿中的第i个码矢。
于是
u i (n)= Σ m-1 M θ im V m (n) (1.10)
这里0≤i-≤2M-1;0≤n≤N-1。换句话说,代码簿中的每一个码矢被构成为M个基本矢量的线性组合。线性组合由Q参量定义。
θim被定义为
θim=+1如果码字i的比特m=1
θim=-1如果码字i的比特m=0
码矢i被构成为M个基本矢量之和,这里每一基本矢量的符号(正号或负号)由码字i中相应的比特状态来决定。注意如果我们求补码字i中全部比特数,相应的码矢就是码矢i的负数。所以,对于每个码矢,它的负数也是代码簿中的一个码矢。由于为相应的码字彼此互补,这些码矢对被称为互补码矢。
适宜的矢量被选择后,增益单元205对所选择的矢量乘以增益项γ换算。增益单元205的输出加到一组线性滤波器207和209以获得重建语音的N个样值。滤波器包括一“长期”(或“音调”)滤波器207,它将音调周期性插入激励中。“长期”滤波器207的输出又加到“短期”(或“峰段”)滤波器209。短期滤波器209给信号加上谱包络。
长期滤波器207包括长期预测器系数(LTP)。长期滤波器207试图从一个或多个很远以前的样值中预测下一个输出样值。如果仅有一个过去的样值被应用于预测器中,那么,预测器就是一单抽头预测器。典型地使用一到三个抽头。含有一个单抽头长期预测器的长期(“音调”)滤波器207,其传递函数由(1.1)给出
B(z)= 1 1-β Z -L (1.1)
B(z)的特性由两个量L和β表示。L称为“滞后”。对于声频的语音, L典型地应是音调周期或是它的倍数。L也可能是一非整数值。如果L是一非整数,一个内插的有限脉冲响应(FIR)滤波器被用来产生部分延迟的样值。β是长期(或“音调”)预测器系数。
短期滤波器209包括短期预测器系数ai,它试图从前面的Np个输出样值中预测下一个输出样值。Np典型的范围是从8到12。在本优选的实施例中,Np等于10。短期滤波器209相当于传统的Lpc合成滤波器。短期滤波器209的传递函数由(1.2)给出
A(z)= 1 1- Σ i = 1 N P a i z -1 (1.2)
短期滤波器209的特性由ai参量表示。对于全极点“合成”滤波器,它是直接形式滤波器系数。关于ai参量的详情可在下面见到。
各种参量(代码,增益,滤波器参量)并不以相同的速率发送到合成器(语音译码器)。典型地,短期参量的更新通常比代码少。我们将定义短期参量更新率为“帧频”,更新之间的间隔为一“帧”。代码更新率由矢量长度N决定。我们将定义代码更新率为“子帧频”,代码更新间隔为“子帧”。一帧通常由整数个子帧组成。增益和长期参量可以子帧频,帧频或根据语音编码器设计的两者之间的某些速率更新。
代码簿搜索过程包括尝试每一个码矢作为可能激励CELP合成器的码矢。合成语音S′(n)在比较器211和输入语音S(n)相比较,而产生一差值信号ei。这个差值信号ei(n)由一谱加权滤波器W(z)213(也可能由第二加权滤波器C(z)加以滤波以产生一加权的误差信号e′(n)。e′(n)中的功率在能量计算器215上计算。产生最小加权误差功率的码矢被选为该子帧的码矢。谱加权滤波器213用来对基于感官考虑的误差谱进行加权。这个加权滤波器213是语音谱的一个函数,并能以短期(谱)滤波器209的a参量来表示。
Figure 941902773_IMG2
有两种方法能用来计算增益γ。可以在根据残余能量的代码簿搜索之前决定增益。这个增益然后可被固定用于代码簿搜索。另一个方法是当代码簿搜索时优化每个码矢的增益。产生最小加权误差的码矢将被选择,并且它相应的最佳增益将被用于γ。由于增益是对每个码矢的优化,所以后一方法一般地能产生更好的效果。这个方法也意味着增益项必须以子帧频更新。此技术的最佳代码和增益可计算如下:
1.对于子帧计算已加权的输入信号y(n)。
2.计算d(n),子帧的B(z)和W(z)(和(C(z),如果使C(z)的情况下)滤波器的零输入响应。(零输入响应是滤波器没有输入时的响应;滤波器状态的衰减)。
3.在整个子帧计算    p(n)=y(n)-d(n)  (0≤n≤N-1)
4.对于每个代码i。
a.计算g(n),即码矢i的B(z)(和C(z),如果使用的情况下)的零状态响应。(零状态响应是将起始滤波状态置为零的滤波器输出)。
b.计算
C i = Σ n=0 N-1 g i (n)P(n) (1.5)
即,已滤波的码矢i和p(n)之间的互相关
c.计算
G i = Σ n=0 N -1 | g i (n) | 2 (1.6)
即,已滤波的码矢i中的功率。
5.选择i,它使 ((Gi)2)/(Gi) (1.7)达到最大。
6.使用所选择的码字和它相应的量化增益,更新B(z)和W(z)(和C(z),如使用的情况下)滤波器的滤波状态,以得到合成器在步骤2的下一子帧起始的同样滤波状态。码矢i的最佳增益由(1.8)式给出
γ i = C i G i (1.8)
使用最佳增益γi的码矢i的总加权误差由(1.9)给出
E i =( Σ n=0 N-1 P 2 (n) )- (C i ) 2 G i (1.9)
短期预测器参量是图2短期滤波器209的ai'。这些是标准的LPC直接形式滤波器系数,许多LPC分析技术可被用来决定这些系数。在本优选实施例中,使用了一个快速定点协方差点阵算法(FLAT)。FLAT具有点阵算法的全部优点,包括有保证的滤波器稳定性,非窗口分析和在循环内量化反射系数的能力。此外,FLAT在数值上是健全的,并能在一定点处理器上很容易实现。
短期预测器参量是从输入语音计算的,没有使用预加重。用于参量计算的分析长度是170个样值(NA=170)。预测器的阶数是10(Np=10)。
这部分将详细描述FLAT算法。令落入分析间隔内输入语音的样值用S(n)表示;0≤n≤NA-1。因为FLAT是一点阵算法,可以认为该技术是试图逐级地建立一最佳(它使残余能量最小)的逆点阵滤波器。定义bj(n)为来自逆点阵滤波器第j级的反向余项,fj(n)为来自逆点阵滤波器第j级的正向余项,我们可定义
F j (i,k)= Σ n-N P N A -1 f j (n-i )f j (n-k) (2.1)
为fj(n)的自相关;
B j (i,k)= Σ n-N P N A -1 b j (n-i-1 )b j (n-k-1) (2.2)
为bj(n-1)的自相关;以及
C j (i,k)= Σ n-N P N A -1 f j (n-i )f j (n-k-1) (2.3)
为fj(n)和bj(n-1)之间的互相关。
令rj表示逆点阵第j级的反射系数。于是
Fj(i,k)=Fj-1(i,k)+rj(Cj-1(i,k)+Cj-1(k,i)+rj 2Bj-1(i,k) (2.4)
Bj(i,k)=Bj-1(i+1,k+1)+rj(Cj-1(i+1,k+1)+Cj-1(k+1,i+1)+rj 2Fj-1(i+1,k+1) (2.5)
Cj(i,k)=Cj-1(i,k+1)+rj(Bj-1(i,k+1)+Fj-1(i,k+1))+rj 2Cj-1(k+1,i) (2.6)
我们已选择的用来决定rj的公式可表示为
r j =-2 C j - 1 (0,0)+C j - 1 (N P -j,N P -j) F j-1 (0,0)+B j-1 (0,0)+F j-1 (N P -j,N P -j)+B j-1 (N P -j,N P -j) (2.7)
FLAT算法现可描述如下:
1.首先从输入语音中计算协方差(自相关)矩阵
φ(i,k)= Σ N P N A -1 s(n-i)s(n-k) (2.8)
0≤i,k≤NP
2.FO(i,k)=f(i,k)      0≤i,k≤NP-1      (2.9)
BO(i,k)=f(i+1,k+1)    0≤i,k≤NP-1      (2.10)
CO(i,k)=f(i,k+1)        0≤i,k≤NP-1      (2.11)
3.设j=1
4.用(2.7)式计算rj
5.如j=Np,于是结束
6.用(2.4)计算Fj(i,k) 0≤i,k≤Np-j-1
用(2.5)计算B(i,k)    0≤i,k≤Np-j-1
用(2.6)计算Cj(i,k) 0≤i,k≤Np-j-1
7.j=j+1;转到4
在解出反射系数之前,用给自相关函数开窗的方法修正φ数值
φ'(i,k)=φ'(i,k)w(li-kl)      (2.12)
在计算反射系数之前,给自相关函数开窗通称为谱平滑(SST)。
从反射系数rj,可计算短期LPC预测系数ai
使用反射系数的28比特三段矢量量化器。矢量量化器的段分别复盖反射系数r1-r3,r4-r6,和r7-r10。矢量量化器段的比特分配是
Q111比特
Q29比特
Q38比特
为避免穷举的矢量量化器搜索的计算复杂性,在每一段使用了反射系数矢量的预量化器。每段预量化器的大小是:
P16比特
P25比特
P34比特
在一给定段,来自预量化器的每个矢量的残余误差被计算并存入暂时存贮器中。搜索这个表以识别最低失真的4个预量化器矢量。每个选出的预量化器矢量的指数是用来计算进入矢量量化器表中的偏移,与预量化器矢量相连系的量化器矢量邻接的子集从这里开始。在第k段每个矢量量化器子集的大小由下式给出:
SK= (2Qk)/(2Pk) (2.13)
与选出的预量化器矢量相连系的量化器矢量的4个子集被检索用来寻找产生最低残余误差的量化器矢量。这样,在第一段估算64个预量化器矢量和128个量化器矢量,在第二段估算32个预量化器矢量和64个量化器矢量,在第三段估算16个预量化器矢量和64个量化器矢量。通过上述具有频带扩展的FLAT技术所计算的最佳反射系数在矢量量化之前被转换为一自相关矢量。
FLAT算法的自相关方案AFLAT是被用来计算正在被估算的反射系数矢量的残余误差能量。象FLAT一样,当计算最佳反射系数或从当前段的矢量量化器中选择反射系数时,这个算法具有部分地补偿来自以前点阵级中反射系数量化误差的能力。这个改善对于具有高反射系数量化失真的帧是很重要的。现在描述AFLST算法(在带有预量化器的多段矢量量化器的范围内):
在0≤i≤Np范围内,根据最佳反射系数计算自相关序列R(i)。或者,可根据其它的LPC参量表示(如直接形式LPC预测器系数ai')来计算自相关序列,或直接根据输入语音来计算。
定义AFLAT循环的起始条件:
Po(i)=R(i),0≤i≤Np-1 (2.14)
Vo(i)=R(︱i+1︱),1-Np≤i≤Np-1 (2.15)
初始化矢量量化器段指数k:
k=1    (2.16)
令I1(k)是第k段中第一点阵级的指数,Ih(k)是第k段的最后点阵级的指数。在第k段估算来自点阵级Ih(k)的残余误差的循环,已知r,来自预量化器的反射系数矢量或来自量化器的反射系数矢量表示如下。
初始化点阵级的指数j,以指向第k段的开始:
j=I1(k) (2.17)
设置Pj-1和Vj-1的起始条件为
Pj-1(i)=Pj-1(i),0≤i≤Ib(k)-I1(k)+1 (2.18)
Vj-1(i)=Vj-1(i),-Ib(k)+I1(k)-1≤i≤Ib(k)-I1(k)+1 (2.19)
用下式计算Vj和Pj数值,
Pj(i)=(1+
Figure 941902773_IMG3
)Pj-1(i)+
Figure 941902773_IMG4
[Vj-1(i)+Vj-1(-i)],0≤i≤Ih(k)-j (2.20)
Vj(i)=Vj-1(i+1)+
Figure 941902773_IMG5
Vj-1(-i-1)+2
Figure 941902773_IMG6
Pj-1(︱i+1︱),j-Ih(k)≤i≤Ib(k)-j (2.21)
j增加:
j=j+1    (2.22)
如j≤Ih(k)转到(2.20)式。
已知反射系数矢量 ,来自点阵级Ih(k)的残余误差由下式给出:
E r =P I b (k) (0) (2.23)
使用概述的AFLAT循环,估算来自第k段预量化器的每个矢量引起的残余误差,识别要搜索的量化器矢量的4个子集,并计算来自所选出的4个子集的每个量化器矢量引起的残余误差。在4个子集中所有量化器矢量范围内使Er为最小的量化器矢量
Figure 941902773_IMG8
的指数,被用Qk比特编码。如k<3,于是在k+1段进行循环的起始条件需要计算。设点阵级指数j等于:
j=I1(k) (2.24)
计算:
Pj(i)=(1+ ) Pj-1(i)+
Figure 941902773_IMG10
[ Vj-1(i)+ Vj-1(-i)],0≤i≤Np-j-1 (2.25)
Vj(i)= Vj-1(i+1)+
Figure 941902773_IMG11
Vj-1(-i-1)+2 Pj-1(︱i+1︱),j-Np+1≤i≤Np-j-1 (2.26)
j增加,
j=j+1    (2.27)
如j≤Ih(k),转到式(2.25)
增加矢量量化器分段指数k:
k=k+1    (2.28)
如k≤3,转到(2.17)。否则,选择三段的反射系数矢量的指数,并终止反射系数矢量量化器的搜索。
为了使反射系数矢量量化器的存贮要求为最小,单个反射系数的八位代码而不是实际的反射系数值被存贮于矢量量化器表中,该代码被用来从有256项的标量量化表中查寻反射系数值。八位代码表示通过均匀采样图3所示的反正弦函数所得到的反射系数值。反射系数值从-1到+1变化。当值是接近于+/-1的极限时,在反射系数域(X轴)中的非线性间隔提供更精确的反射系数。而当值是近于0时,提供稍差的精确度。假设为256量化级时,和在反射系数域中均匀采样相比较,这减少了由于反射系数的标量量化引起的谱失真。

Claims (8)

1、矢量量化一最佳反射系数矢量的方法,该方法包括以下步骤:
a)将最佳反射系数矢量分为至少第一段和第二段;
b)提供反射系数的预定矢量的第一数组,每一矢量有多个元素;
c)从预定矢量的第一数组中选择第一矢量,提供第一选出的矢量;
d)对应于第一送出的矢量计算残余误差;
e)对于第一数组的每一矢量,重复步骤c和d;
f)从具有最低残余误差的第一数组中选择一个矢量,形成第一所选的矢量;
g)响应于第一所选的矢量,定义第二段的起始条件;
h)提供反射系数的预定矢量的第二数组,每一矢量有多个元素;
i)利用预定矢量的第二数组对于第二段重复步骤c-f并形成第二被选的矢量。
2、矢量量化一最佳反射参数矢量的方法,该方法包含以下步骤:
a)将最佳反射系数分为至少第一和第二段;
b)提供反射系数的预定矢量的第一数组,每一矢量有多个元素;
c)提供相应于最佳反射系数矢量的自相关矢量;
d)相应于提供自相关矢量的步骤,定义相关数组和互相关数组的起始条件;
e)把相关数组和互相关数组设置到已定义的起始条件;
f)从预定矢量的第一数值中选择第一矢量,提供第一选出的矢量;
g)对于第一选出的矢量的每一元素,更新相关数组和互相关数组;
h)响应于更新的步骤,定义对应于第一选出的矢量的残余误差;
i)对第一数组的每一矢量,重复步骤e-h;
j)从具有最低残余误差的第一数组中选择矢量,形成第一所选的矢量;
k)响应于第一所选的矢量,定义第二段的起始条件;
l)提供反射系数的预定矢量的第二数值,每一矢量有多个元素;以及
m)利用预定矢量的第二数组对于第二段重复步骤e-j,并形成第二所选的矢量。
3、矢量量化一最佳反射系数矢量的方法包含以下步骤:
提供反射系数的预定矢量的第一数组X;
预量化最佳反射系数矢量包含以下步骤:
提供反射系数的预定矢量的第二数组Y,这里X大于Y,
将预定矢量Y的每一个与预定矢量X的至少一个相关联起来;
计算相应于预定矢量Y的每一个矢量的残余误差,以及
响应于残余误差,选择预定矢量Y的一部分,形成被选中的预定矢量Y;
选择预定的矢量X的子集,它和被选的预定矢量Y有关;
决定相应于预定矢量X子集的每一个矢量的残余误差;以及
选择预定矢量X的子集的矢量,该矢量具有最低的残余误差。
4、语音编码的方法包含以下步骤:
接收语音数据,形成语音数据矢量;
提供预定矢量的第一数组;
从第一数组选择第一预定矢量,形成表示语音数据矢量第一段的第一被选的矢量;
提供预定矢量的第二数组;以及
从第二数组中选择第二预定矢量,形成表示语音数据矢量的第二段的第二被选的矢量。
5、无线电通信系统包含:
第一收发信机,包含:
接收数据形成数据矢量的装置;
提供预定矢量第一数组的装置;
从第一数组中选择第一预定矢量,形成表示语音数据矢量的第一段的第一被选的矢量的装置;
提供预定矢量的第二数组的装置;
从第二数组选择第二预定矢量,形成表示语音数据矢量的第二段的第二被选的矢量的装置;
发送第一和第二选择的矢量到第二收发信机的装置;以及
第二收发机,包括:
接收第一和第二被选矢量的装置,以及
响应于接收上述装置,重建数据矢量的装置。
6、存贮反射系数矢量的方法包含以下步骤:
提供具有2N个反射系数值的表,每个反射系数值以N位代码寻址;和
存贮一个N位代码以表示表中的反射系数值中的一个值。
7、依照权利要求6存贮的方法,其中,反射系数值是非线性范围的。
8、依照权利要求6存贮的方法,其中,反射系数值是范围在-1和+1之间的反正弦。
CN94190277A 1993-03-26 1994-03-07 矢量量化器方法 Expired - Lifetime CN1051392C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US3779393A 1993-03-26 1993-03-26
US08/037,793 1993-03-26

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNB971034516A Division CN1150516C (zh) 1993-03-26 1997-03-12 语音编码方法和语音编码器

Publications (2)

Publication Number Publication Date
CN1109697A true CN1109697A (zh) 1995-10-04
CN1051392C CN1051392C (zh) 2000-04-12

Family

ID=21896370

Family Applications (2)

Application Number Title Priority Date Filing Date
CN94190277A Expired - Lifetime CN1051392C (zh) 1993-03-26 1994-03-07 矢量量化器方法
CNB971034516A Expired - Lifetime CN1150516C (zh) 1993-03-26 1997-03-12 语音编码方法和语音编码器

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNB971034516A Expired - Lifetime CN1150516C (zh) 1993-03-26 1997-03-12 语音编码方法和语音编码器

Country Status (12)

Country Link
US (2) US5826224A (zh)
JP (1) JP3042886B2 (zh)
CN (2) CN1051392C (zh)
AU (2) AU668817B2 (zh)
BR (1) BR9404725A (zh)
CA (1) CA2135629C (zh)
DE (2) DE4492048C2 (zh)
FR (1) FR2706064B1 (zh)
GB (2) GB2282943B (zh)
SE (2) SE518319C2 (zh)
SG (1) SG47025A1 (zh)
WO (1) WO1994023426A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030377B (zh) * 2007-04-13 2010-12-15 清华大学 提高声码器基音周期参数量化精度的方法
CN1659785B (zh) * 2002-05-31 2011-04-20 沃伊斯亚吉公司 信号多速率点阵矢量量化的方法和系统
CN107077856A (zh) * 2014-08-28 2017-08-18 诺基亚技术有限公司 音频参数量化

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
IT1277194B1 (it) * 1995-06-28 1997-11-05 Alcatel Italia Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato
FR2738383B1 (fr) * 1995-09-05 1997-10-03 Thomson Csf Procede de quantification vectorielle de vocodeurs bas debit
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
TW307960B (en) * 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
JP2914305B2 (ja) * 1996-07-10 1999-06-28 日本電気株式会社 ベクトル量子化装置
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
US6826524B1 (en) 1998-01-08 2004-11-30 Purdue Research Foundation Sample-adaptive product quantization
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
IL129752A (en) 1999-05-04 2003-01-12 Eci Telecom Ltd Telecommunication method and system for using same
GB2352949A (en) * 1999-08-02 2001-02-07 Motorola Ltd Speech coder for communications unit
US6910007B2 (en) * 2000-05-31 2005-06-21 At&T Corp Stochastic modeling of spectral adjustment for high quality pitch modification
JP2002032096A (ja) * 2000-07-18 2002-01-31 Matsushita Electric Ind Co Ltd 雑音区間/音声区間判定装置
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
CA2733453C (en) * 2000-11-30 2014-10-14 Panasonic Corporation Lpc vector quantization apparatus
JP4857468B2 (ja) * 2001-01-25 2012-01-18 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US6584437B2 (en) * 2001-06-11 2003-06-24 Nokia Mobile Phones Ltd. Method and apparatus for coding successive pitch periods in speech signal
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
WO2003091989A1 (en) * 2002-04-26 2003-11-06 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
US7337110B2 (en) * 2002-08-26 2008-02-26 Motorola, Inc. Structured VSELP codebook for low complexity search
US7047188B2 (en) * 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
US7272557B2 (en) * 2003-05-01 2007-09-18 Microsoft Corporation Method and apparatus for quantizing model parameters
CN1890711B (zh) * 2003-10-10 2011-01-19 新加坡科技研究局 将数字信号编码成可扩缩比特流的方法和对可扩缩比特流解码的方法
US8473286B2 (en) * 2004-02-26 2013-06-25 Broadcom Corporation Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure
US7697766B2 (en) * 2005-03-17 2010-04-13 Delphi Technologies, Inc. System and method to determine awareness
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
CN102089810B (zh) * 2008-07-10 2013-05-08 沃伊斯亚吉公司 多基准线性预测系数滤波器量化和逆量化设备及方法
US8363957B2 (en) * 2009-08-06 2013-01-29 Delphi Technologies, Inc. Image classification system and method thereof
CN101968778A (zh) * 2010-08-13 2011-02-09 广州永日电梯有限公司 点阵串行显示方法
CN107170459B (zh) * 2012-03-29 2020-08-04 瑞典爱立信有限公司 矢量量化器
WO2015145266A2 (ko) * 2014-03-28 2015-10-01 삼성전자 주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
KR102400540B1 (ko) 2014-05-07 2022-05-20 삼성전자주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
CN109887519B (zh) * 2019-03-14 2021-05-11 北京芯盾集团有限公司 提高语音信道数据传输准确性的方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
JPS59116698A (ja) * 1982-12-23 1984-07-05 シャープ株式会社 音声デ−タ圧縮方法
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
DE3883519T2 (de) * 1988-03-08 1994-03-17 Ibm Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
EP0331857B1 (en) * 1988-03-08 1992-05-20 International Business Machines Corporation Improved low bit rate voice coding method and system
JPH02250100A (ja) * 1989-03-24 1990-10-05 Mitsubishi Electric Corp 音声符合化装置
US4974099A (en) * 1989-06-21 1990-11-27 International Mobile Machines Corporation Communication signal compression system and method
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
US5012518A (en) * 1989-07-26 1991-04-30 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
US4963030A (en) * 1989-11-29 1990-10-16 California Institute Of Technology Distributed-block vector quantization coder
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
JP3129778B2 (ja) * 1991-08-30 2001-01-31 富士通株式会社 ベクトル量子化器
US5307460A (en) * 1992-02-14 1994-04-26 Hughes Aircraft Company Method and apparatus for determining the excitation signal in VSELP coders
US5351338A (en) * 1992-07-06 1994-09-27 Telefonaktiebolaget L M Ericsson Time variable spectral analysis based on interpolation for speech coding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1659785B (zh) * 2002-05-31 2011-04-20 沃伊斯亚吉公司 信号多速率点阵矢量量化的方法和系统
CN101030377B (zh) * 2007-04-13 2010-12-15 清华大学 提高声码器基音周期参数量化精度的方法
CN107077856A (zh) * 2014-08-28 2017-08-18 诺基亚技术有限公司 音频参数量化

Also Published As

Publication number Publication date
SE518319C2 (sv) 2002-09-24
CA2135629C (en) 2000-02-08
SE9404086L (sv) 1995-01-25
SG47025A1 (en) 1998-03-20
AU6084396A (en) 1996-10-10
BR9404725A (pt) 1999-06-15
GB9802900D0 (en) 1998-04-08
JP3042886B2 (ja) 2000-05-22
CN1150516C (zh) 2004-05-19
AU678953B2 (en) 1997-06-12
US5675702A (en) 1997-10-07
DE4492048T1 (de) 1995-04-27
WO1994023426A1 (en) 1994-10-13
SE0201109D0 (sv) 2002-04-12
DE4492048C2 (de) 1997-01-02
SE0201109L (sv) 2002-04-12
AU668817B2 (en) 1996-05-16
FR2706064A1 (fr) 1994-12-09
CN1166019A (zh) 1997-11-26
US5826224A (en) 1998-10-20
FR2706064B1 (fr) 1997-06-27
GB2282943B (en) 1998-06-03
CA2135629A1 (en) 1994-10-13
CN1051392C (zh) 2000-04-12
GB9422823D0 (en) 1995-01-04
SE524202C2 (sv) 2004-07-06
GB2282943A (en) 1995-04-19
AU6397094A (en) 1994-10-24
SE9404086D0 (sv) 1994-11-25
JPH07507885A (ja) 1995-08-31

Similar Documents

Publication Publication Date Title
CN1150516C (zh) 语音编码方法和语音编码器
CN1154086C (zh) Celp转发
CN1123866C (zh) 一种语音编/解码方法和装置
US8209188B2 (en) Scalable coding/decoding apparatus and method based on quantization precision in bands
CN1244907C (zh) 宽带语音编解码器中的高频增强层编码方法和装置
CN1130057C (zh) 有关传输信道对数字语言信号的影响的盲目均衡过程和装置
CN1241170C (zh) 语音编解码器中用于线频谱频率矢量量化的方法和系统
CN1271597C (zh) 对声源信号进行编码/解码的方法和装置
CN1159691A (zh) 用于声频信号线性预测分析的方法
AU2008222241B2 (en) Encoding device and encoding method
CN1113332C (zh) 包括至少一个编码器的传输系统
US6928406B1 (en) Excitation vector generating apparatus and speech coding/decoding apparatus
CN1167048C (zh) 语音编码设备和语音解码设备
CN1265217A (zh) 在语音通信系统中语音增强的方法和装置
CN1152164A (zh) 码激励线性预测编码装置
CN101044554A (zh) 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法
CN1334952A (zh) 用于改善编码通信信号性能的编码增强特性
CN1083294A (zh) 对语音编码的随时间变化的频谱按内插法进行分析的方法
CN1026274C (zh) 采用长期预测器的语言合成方法及其装置
CN1151492C (zh) 综合-分析线性预测语音编码中的增益量化方法
CN1192357C (zh) 用于语音编码的自适应规则
CN1266671C (zh) 估算声音编码器的谐波的装置和方法
CN101572092B (zh) 编解码端的固定码本激励的搜索方法及装置
US7580834B2 (en) Fixed sound source vector generation method and fixed sound source codebook
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: RESEARCH IN MOTION LTD.

Free format text: FORMER OWNER: MOTOROLA INC.

Effective date: 20110212

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: ILLINOIS, USA TO: ONTARIO, CANADA

TR01 Transfer of patent right

Effective date of registration: 20110212

Address after: Ontario, Canada

Patentee after: Research In Motion Ltd.

Address before: Illinois Instrunment

Patentee before: Motorola Inc.

C17 Cessation of patent right
CX01 Expiry of patent term

Expiration termination date: 20140307

Granted publication date: 20000412