CN1140894C - 可变位速率语音传输系统 - Google Patents
可变位速率语音传输系统 Download PDFInfo
- Publication number
- CN1140894C CN1140894C CNB988004313A CN98800431A CN1140894C CN 1140894 C CN1140894 C CN 1140894C CN B988004313 A CNB988004313 A CN B988004313A CN 98800431 A CN98800431 A CN 98800431A CN 1140894 C CN1140894 C CN 1140894C
- Authority
- CN
- China
- Prior art keywords
- frame
- frames
- coefficient
- signal
- bit rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005540 biological transmission Effects 0.000 title claims description 28
- 238000004458 analytical method Methods 0.000 claims abstract description 42
- 238000005259 measurement Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 4
- 230000005284 excitation Effects 0.000 abstract description 17
- 238000009432 framing Methods 0.000 abstract 1
- 239000002131 composite material Substances 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000013139 quantization Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 230000005574 cross-species transmission Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
在一个可变位速率的语音编码器(4)中,利用帧装置(20)从输入语音信号提取出语音样本帧。利用分析装置(22)根据语音样本帧确定LPC分析参数(诸如LPC参数),并利用查寻装置(36)确定由代码本索引和代码本增益代表的激发信号。这些LPC系数和激发参数被以帧发送到接收机(12)。为了能根据位速率设置R来改变语音编码器的位速率,向语音编码器(4)提供了控制装置(30),它确定携带LPC系数的被发送帧所占的份额,该份额能在0.5至1之间改变。其余帧的LPC系数由接收机(12)中的内插器(85)通过内插确定。根据本发明的一个实施例,与由其近邻内插所得值相差最大的那些LPC系数被发送到接收机(12)。
Description
本发明是关于包含带有语音编码器的发射机的一种传输系统,该语音编码器包含分析装置,用于根据输入的语音信号来确定分析系数,该发射机被安排成通过传输介质向接收机发送代表语音信号的数据帧,一部分(fraction)数据帧比其余帧携带更多的关于所述分析系数的信息,该接收机包含语音解码器,用于从代表语音信号的数据帧中提取出重建的语音信号。
本发明还涉及发射机、语音编码器和语音编码方法。
从美国专利4,379,949号中可得知根据本前序的传输系统。
这种传输系统被用于这样一些应用中,在这些应用中语音信号不得不以有限的传输容量在传输介质上传送,或者不得不以有限的存储容量存储到存储介质上。这种应用的实例是:在因特网上传送语音信号,从移动电话向基站传送语音信号和反过来从基站向移动电话传送语音信号,以及把语音信号存储在CD-ROM上,在固态存储器中或硬盘驱动器上。
在语音编码器中,由分析装置分析语音信号,该分析装置对一个语音样本块(也称作一帧)确定多个分析系数。一组这些系数描述该语音信号的短时谱。分析系数的另一实例是代表语音信号音调(pitch)的系数。将该分析系数通过传输介质传送到接收机,在那里将这些分析系数用作为一个合成滤波器的系数。
除了分析参数外,语音编码器还确定每个语音样本帧的激发(excitation)序列数(例如4)。将被这种激发序列复盖的时间间隔称作子帧(subframe)。安排语音编码器用于找出这样的激发信号,使得当使用上述分析系数的合成滤波器被所述激发序列激发时能得到最好的语音质量。将所述激发序列的一种表达(representation)通过传输信道送到接收机。在接收机中,该激发序列被从接收的信号中恢复出来并加到合成滤波器的输入端。在合成滤波器的输出端便可以得到一个合成的语音信号。
以一定质量描述语音信号所需要的位速率(bitrate)取决于语音的内容。在一个长时间段上该分析系数基本上为常数的情况下,传送这些分析系数的位速率能被降低。这种可能性被用在根据前述的美国专利的传输系统中,该专利描述了一个带有语音编码器的传输系统,其中并不是每一帧都传送分析系数。只有当一帧中有至少一个实际分析系数与对相邻帧的分析系数进行内插所得到的一个相应分析系数之间的差值超过一个预定阈值时,这些分析系数才被传送。这导致降低了传输语音信号所需的位速率。在这个已知的传输系统中,能通过增大或减小该阈值来任意设定位速率,从而使位速率降低或提高。然而,其平均位速率仍然强烈地依赖于语音的内容。
本发明的一个目的是提供一个根据前序所提出的传输系统,其中的位速率能被设定为任意值,它基本上不依赖于语音内容。
所以,根据本发明的传输系统的特点在于:该语音编码器包含控制装置,用于根据位速率设置来控制比其余帧携带更多的关于所述分析系数信息的帧数所占的份额。
通过规定位速率设置和响应所述位速率设置控制携带关于分析系数信息的帧所实际占的部分,便有可能得到基本上不依赖于语音内容的平均位速率。甚至还可能通过改变该位速率设置在运行过程中来改变平均位速率。
能以不同的方式控制实际所占的份额。第一种方式是使用一个模为M(modulo-M)的计数器,它对每个帧按步数N增大。每次计数器溢出时,便在该帧中包括分析系数。于是携带分析系数的帧数所占的份额是N/M。
本发明的一个实施例的特点在于控制装置包含比较装置,用于将实际位速率的测量值与位速率设置的测量值进行比较,该控制装置被安排成如果实际位速率的测量值小于位速率设置的测量值则增加其携带的关于所述分析系数的信息多于其余帧的那些帧所占的实际份额,如果实际位速率的测量值大于位速率设置的测量值则减少其携带的关于所述分析系数的信息多于其余帧的那些帧所占的实际份额。根据这一实施例,总能保证编码语音信号的平均位速率基本上等于其位速率设置。
本发明的又一实施例的特点在于,安排该控制装置用于指出这样一些分析参数,它们与从前后帧中传输的分析参数进行内插所得到的值之间的差距测量值超过了一个阈值,将该控制装置安排成如果实际位速率的测量值小于位速率设置的测量值则减小该阈值,如果位速率的实际测量值大于位速率设置的测量值则增大该阈值。在这一实施例中,与内插值相差最大的那些分析参数被传送。如果实际位速率大于位速率设置则增大阈值,否则则减小阈值,通过这种做法使得平均位速率基本上等于位速率设置值。
本发明的又一实施例的特点在于其携带的关于所述分析系数的信息多于其余帧的那些帧所占的份额大于或等于0.5而小于或等于1。实验表明,在0.5和1之间的参考份额造成一个不会使编码质量产生显著损失的足够的控制区间。
本发明的又一实施例的特征在于,安排该语音编码器,用于响应一个粗略的位速率设置从多个帧长度中选择一个帧长度和从多个每帧中激发子帧个数中选择一个每帧中激发子帧个数。通过响应位速率设置从多个可能值中选出帧长度和子帧个数,便有可能得到连续可变的位速率,而且其位速率变化范围实质上被增大了。
本发明的又一实施例的特点在于:对于10ms帧长,其多个激发子帧数目中至少包含值4,而对于15ms帧长,其多个激发子帧数目中至少包含值6、8和10。利用上述参数,便有可能得到一个语音编码器,它的连续可变位速率能从13.6kbit/s变化到21.8kbit/s。
现在将参考附图解释本发明。这些附图是:
图1给出一个能使用本发明的传输系统;
图2是根据本发明的语音编码器的一个实施例;
图3是根据图2的位速率控制器30的第一实施例;
图4是根据图2的位速率控制器30的第二实施例;
图5是图1中的语音编码器18的一个实施例。
在根据图1的传输系统中,要被编码的语音信号被加到发射机2中的语音编码器4的输入端。语音编码器4的第一输出端载有代表分析系数的输出信号LPC,该第一输出端与多路调制器6的第一输入端相连。语音编码器4的第二输出端载有输出信号F,该第二输出端与多路调制器6的第二输入端相连。信号F代表一个标志,指出信号LPC是否得要被传送。语音编码器4的第三输出端载有信号EX,该第三输出端与多路调制器6的第三输入端相连。信号EX代表供语音解码器中的合成滤波器使用的激发信号。一个位速率控制信号R被加到语音编码器4的第二输入端。
多路调制器6的一个输出端与发送装置8的一个输入端相连。发射装置8的一个输出端通过传输介质10与接收机12相连。
在接收机12中,传输介质10的输出端与接收装置14的一个输入端相连。接收装置14的一个输出端与信号分离器(demultiplexer)16的一个输入端相连。信号分离器16的第一输出端载有信号LPC,该第一输出端与语音解码装置18的第一输入端相连;信号分离器16的第二输出端载有信号EX,该第二输出端与语音解码装置18的第二输入端相连。在语音解码装置18的输出端能得到被重建的语音信号。信号分离器16和语音解码装置18的组合构成了根据本发明概念的语音解码器。
对于根据本发明的传输系统的操作所做的解释是在假定使用CELP型语音编码器的情况下进行的,但应该看到,本发明的范围不限于此。
语音编码器4被安排成从语音信号样本帧中提取被编码的语音信号。语音编码器从语音信号样本帧中提取例如代表语音信号短时谱的分析系数。通常是使用LPC系数或它的变换后的表现形式。有用的表现形式是对数面积比(Log Area Ratios,LARs)、反射系数的反正弦或线性谱频率(Line Spectral Frequencies,LSPs),后者也称作线性谱对(Line Spectral Pairs,LSPs)。在语音编码器4的第一输出端能得到作为信号LPC的分析系统表现形式。
在语音编码器4中,其激发信号等于一个或多个固定代码本(codebook)和一个适应性代码本的输出信号的加权和。固定代码本的输出信号由固定代码本索引(index)指示,而固定代码本的加权因子由固定代码本增益指示。适应性代码本的输出信号由适应性代码本索引指示,而适应性代码本的加权因子由适应性代码本增益指示。
代码本索引和增益是通过以合成方法进行分析来确定的,即所确定的代码本索引和增益要使原始语音信号和基于激发系数和分析系数合成的语音信号之间的差值为一极小值。信号F指示是否要发送对应于语音信号样本当前帧的分析参数。这些系数能在当前数据帧中被发送,或者在较早的一个数据帧中被发送。
多路调制器6把帧头与代表语音信号的数据组合成数据帧。该帧头包含一个第一指示(标志F),指示当前数据帧是否为不完全数据帧。该帧头还可任选地包含第二指示,指示当前数据帧是否载有分析参数,该帧还包含多个子帧用的激发参数。子帧个数取决于在语音编码器4的控制输入端的信号R所选定的位速率。每帧的子帧个数和帧长度能被编码到该帧的帧头中,但也能在建立连接的过程中约定每帧的子帧数和帧长度。在多路调制器6的输出端能得到代表语音信号的完全的帧。
在发送装置8中,在多路调制器6输出端产生的帧被转换成能通过传输介质10发送出去的信号。在发送装置中完成的操作涉及纠错编码、交错组合(interleaving)和调制。
接收机12被安排成接收来自传输介质10的由发射机2发送的信号。接收装置14被安排成用于解调、去交错组合以及纠错解码。信号分离器从接收装置14的输出信号中提取信号LPC、F和EX。必要时由信号分离器16完成相继收到的两组系数之间的内差。完全的系数LPC和EX集合被提供给语音解码装置18。在语音解码装置18的输出端,能得到被重建的语音信号。
在根据图2的语音编码器中,输入信号被加到帧装置20的一个输入端。帧装置20的载有输出信号Sk+1的输出端与分析装置(这里是一个线性预测分析器22)的一个输入端相连,还和延时部件28的一个输入端相连。线性预测分析器22的载有信号αk+1的输出端与量子化装置(quantizer)24的一个输入端相连。量子化装置24的载有输出信号Ck-1的第一输出端与延时部件26的一个输入端相连,并与语音编码器6的第一输出端相连。延时部件26的载有输出信号Ck的一个输出端与语音编码器的第二输出端相连。
量化装置24的载有信号αk+1的第二输出端与控制装置30的一个输入端相连。代表位速率设置值的输入信号R被加到控制装置30的第二输入端。控制装置30的第一输出端载有输出信号F,该第一输出端与语音编码器4的一个输出端相连。
控制装置30的载有输出信号α′k的第三输出端与插补器(interpolator)32相连。内插器32的载有输出信号α′k[m]的一个输出端与感性(perceptual)加权滤波器34的控制输入相连。帧装置20的输出端还与延时部件28的一个输入端相连。延时部件28的载有信号Sk的输出端与感性加权滤波器34的第二输入端相连。感性加权滤波器34的载有信号rs[m]的输出端与激发查寻装置36的一个输入端相连。在激发查寻装置36的输出端处,能得到一个激发信号EX的代表信号,它包含固定代码本索引、固定代码本增益、适应性代码本索引和适应性代码本增益。
帧装置从来自语音编码器4的输入信号中得到包含多个输入样本的帧。在一帧中的样本个数能根据位速率设置R而改变。线性预测分析器22从输入样本帧中提取出包含预测系数αk+1[p]的多个分析系数。这些预测系数能由公知的Levinson-Durbin算法找出。量子化装置24把系数αk+1[p]变换成另一种表现形式,并把变换后的预测系数量子化为量子化系数Ck+1[p],这些量子化系数Ck+1[p]通过延时部件26后作为系数Ck[p]被送到输出端。该延时部件的目的是使对应于同一帧语音输入样本的系数Ck[p]和激发信号EX能同时出现在多路调制器6处。量子化装置24向控制装置30提供信号
信号
是通过对量子化系数Ck+1进行逆变换得到的。这种逆变换与接收机中的语音解码器中完成的变换相同。在语音编码器中完成量子化系数的逆变换,是为了把与接收机中解码器能得到的那些系数完全相同的系数提供给语音编码器用于本地合成。
安排控制装置30提取出一部分帧,使其中被传送的关于分析系数的信息多于其他帧中包含的信息。在根据本实施例的语音编码器4中,各帧中或者携带关于分析系数全部信息,或者根本不携带关于分析系数的任何信息,控制装置30提供一个输出信号F,它指示多路调制器6是否要在当前帧中引入信号LPC。然而,应该看到,每帧中所携带的分析参数的个数是能够改变的。
控制单元30向内插器32提供预测系数α′k。如果对于当前帧所述LPC系数被传送,则α′k之值等于最近确定的(量化的)预测系数。如果对于当前帧其LPC系数未被传送,则通过对α′k-1和α′k+1之值进行内插来找出α′k之值。
内插器32对当前帧中的每个子帧由α′k-1和α′k+1之值给出线性内插值α′k[m]。该α′k[m]之值被加到感性加权滤波器34,用于从输入信号Sk的当前子帧m中导出“残差(residual)信号”rs[m]。查寻装置36被安排成用于找出这样的固定代码本索引、固定代码本增益、适应性代码本索引和适应性代码本增益,它们所造成的激发信号能给出与“残差信号”rs[m]的当前子帧m的最佳匹配。对于每个子帧m,能在语音编码器4的输出端EX得到激发参数固定代码本索引、固定代码本增益、适应性代码本索引和适应性代码本增益。
根据图2的一个实例语音编码器是一个宽带语音编码器,用于以7kHz带宽和位速率变化范围从13.6kbit/s至24kbit/s对语音信号进行编码。语音编码器可被设定在4个所谓锚定位速率。这些锚定位速率是这样一些起始值,可以通过减少携带预测参数的帧数份额来使位速率从这些值起始下降。在下表中给出这4个锚定位速率和相应的帧持续时间值、一帧中的样本个数以及每帧的子帧个数。
位速率(kbit/s) | 帧的大小(ms) | 每帧样本数 | 每帧子帧数 |
15.8 | 15 | 240 | 6 |
18.2 | 10 | 160 | 4 |
20.1 | 15 | 240 | 8 |
24.0 | 15 | 240 | 10 |
通过减少存在LPC系数的帧的个数,便能以小步长控制位速率。如果携带LPC系数的帧所占份额在0.5至1之间变化,而且传送一帧LPC系数所需二进制位数为66,便能计算出最大能得到的位速率降低。对于10ms大小的帧,LPC系数所需的位速率可在3.3kbit/s至6.6kbit/s之间变化。对于15ms大小的帧,LPC系数所需的位速率可在2.2kbit/s至4.4kbit/s之间变化。在下表中对这4个锚定位速率给出位速率降低最大值和最小位速率。
锚定位速率(kbit/s) | 位速率降低最大值(kbit/s) | 最小位速率(kbit/s) |
15.8 | 2.2 | 13.6 |
18.2 | 3.3 | 14.9 |
20.1 | 2.2 | 17.9 |
24.0 | 2.2 | 21.8 |
在根据图3的控制装置中,载有信号
的第一输入端与延时部件40的一个输入端以及转换器44的一个输入端相连。延时部件40的载有信号
的一个输出端与延时部件42的一个输入端以及转换器50的一个输入端相连。延时部件42的载有输出信号
的一个输出端与转换器46的一个输入端相连。转换器44的载有输出信号ik+1的一个输出端与插补器48的第一输入端相连,转换器46的载有输出信号ik-1的一个输出端与插补器48的第二输入端相连。插补器48的载有输出信号
的输出端与选择器52的第一输入端相连。转换器50的载有输出信号ik的一个输出端与选择器52的第二输入端相连。在选择器52的输出端能得到信号
选择器52的输出端与转换器53的一个输入端相连。转换器53的载有信号α′k(该信号将被图2中的插补器32使用)的输出端与控制装置30的输出端相连。
控制装置30的载有信号R的第二输入端被连到计算装置54。计算装置54的输出端与加法器56的输入端相连。加法器56的输出端与累加器5 8的一个输入端相连。累加器58的载有累加值的第一输出端与加法器56的第二输入端相连。累加器58的载有溢出信号的第二输出端与多路调制器6的一个控制输入端相连。在控制装置30中,计算装置根据位速率设置信号R确定锚定位速率以及携带LPC信息的帧数所占份额。万一从两个不同的锚定位速率出发都能达到某一位速率R,则选择产生最佳语音质量的那个锚定位速率。把锚定位速率的值作为信号R的函数存储到一个表中会带来方便。如果已选定锚定位速率,便能确定携带LPC系数的所占的份额。
首先,根据公式:BMAX=bHEADER+bEXCITATION+bLPC (1)BMIN=bHEADER+bEXCITATION (2)确定代表每帧中二进制位个数最大值和最小值的BMAX和BMIN之值。在式(1)和(2)中,bHEADR是一帧中帧头位的个数,bEXCITATION是代表激发信号的位的个数,而bLPC是代表分析系数的位的个数。如果信号R代表所需位速率BREQ,则对于携带LPC参数的帧所占份额r有公式: 应该指出,在本实施例中r的最小值是0.5。
一个代表携带LPC参数的帧所占份额的数FR被提供给加法器56。加法器56被安排成用于对每个帧间隔把数FR添加到累加器58的内容中。对于数FR和累加器58中的最大内容A的选择是要使FR/A=r。于是,对于r份帧间隔将出现累加器溢出。通过利用累加器58的溢出信号来控制图2中的多路调节器6,便能得到在多路调制器6的输出端处有r份帧携带LPC系数。
延时部件40和42根据反射系数集合
提供被延时的反射系数集合
和
转换器44、50和56计算系数ik+1、ik和ik-1,这些系数比系数
和
更适合于内插。有用的系数是对数面积比、反射系数的反正弦、或线性谱对。插补器48根据表达式(ik+1[n]+ik-1[n])/2从ik+1[n]和ik-1[n]值导出插补值
如果累加器58溢出,则LPC系数被发送,而且选择器52将被安排成把反射系数集ik送到转换器53。如果没有LPC系数被发送,则选择器52将被安排成把插补值
送到转换器53。转换器53把预测系数集合
转换成适合于滤波器34的预测系数集α′k。如前面解释的那样,在语音编码器中完成本地内插是为了在编码器4和解码器6中对每个子帧得到完全相同的预测系数。
在根据图4的控制装置30中,载有信号
的第一输出端与延时部件60的一个输入端以及转换器64的一个输入端相连。延时部件60的载有信号
的一个输出端与延时部件62的一个输入端以及转换器70的一个输入端相连。转换器64的载有输出信号ik+1的一个输出端与插补器68的第一输入端相连。转换器66的载有输出信号ik-1的一个输出端与插补器68的第二输入端相连。插补器68的载有输出信号
的输出端与距离计算器72的第一输入端以及选择器80的第一输入端相连。转换器70的载有输出信号ik的一个输出端与差距计算器72的第二输入端以及选择器80的第二输入端相连。
控制装置30的一个输入信号R与计算装置74的一个输入端连接。计算装置74的第一输出与一控制单元76相连。在计算装置74的第一输出端的信号代表携带LPC参数的帧所占的份额r。计算装置的第二和第三输出端携带的信号代表根据信号R设定的锚定位速率。控制单元76的载有阈值信号t的一个输出端与比较器78的第二输入端相连。比较器78的一个输出端与选择器80的控制输入端、控制单元76的一个输入端以及控制装置30的一个输出端相连。
在根据图3的控制装置中,延时部件60和62提供从反射系数集合
得到的延时反射系数集合
和
转换器64、70和66计算系数ik+1、ik及ik-1,这些系数比系数
及
更适合于内插。插补器68从值ik+1和ik-1导出内插值
差距计算器72确定预测参数集合ik和从ik+1及ik-1内插得到的预测参数集合
之间的差距测量值d。一个适当的差距测量值d由下式给出: 在(4)式中,H(ω)是由系数ik描述的谱,
(ω)是由系数
描述的谱。测量值d是通常使用的,但实验表明,更容易计算的L1范数能给出可与之相比较的结果。为此,L1范数可写成:
在(5)式中,P是由分析装置22确定的预测系数的个数。由比较器78将差距测量值d与阈值t进行比较。如果差距d大于阈值t,则比较器78的输出信号c指示应发送当前帧的LPC系数。如果差距测量值d小于阈值t,则比较器78的输出信号c指示当前帧的LPC系数不必发送。通过在一预定时间段(例如在K帧上,而K的典型值为100)上对信号c指示要发送LPC系数的次数a进行计数,便能得到包含LPC参数的帧数所占实际份额的测量值a。如果给定了对应于所选锚定位速率的参数,该测量值a也是实际位速率的一种测量。
安排控制装置30用于对实际位速率的测量值和位速率设定值的比较,并在必要时调整实际位速率。计算装置74根据信号R确定锚定位速率和份额r。控制单元76确定份额r和携带LPC参数帧的实际份额a之间的差值。为了根据位速率设置和实际位速率之间的差值来调整位速率,可增大或减小阈值t。如果阈值t增大,则将有较少的帧数出现差距测量值d超过所述阈值的情况,于是实际位速率将会降低。如果阈值t减小,则将有较多的帧数出现差距测量值d超过所述阈值的情况,于是实际位速率将会提高。由控制单元76按照下式根据对位速率设定值得到的测量值r和对实际位速率得到的测量值b来完成对阈值t的更新:
在(6)式中t′是阈值和原来值,C1和C2是常数。
在根据图5的解码装置18中,载有信号LPC的一个输入端与子帧插补器89的一个输入端相连。子帧内插器87的输出端与合成滤波器88的一个输入端相连。
语音解码器18的载有输入信号EX的一个输入端与信号分离器89的一个输入端相连。信号分离器89的载有信号FI(代表固定代码本索引)的第一输出端与固定代码本90的一个输入端相连。固定代码本90的一个输出端与乘法器92的第一输入端相连。信号分离器的载有信号FCBG(固定代码本增益)的第二输出端与乘法器92的第二输入端相连。
信号分离器89的载有信号AI(它代表适应性代码本索引)的第三输出端与适应性代码本91的一个输入端相连。适应性代码本91的一个输出端与乘法器93的第一输入端相连。信号分离器89的载有信号ACBG(适应性代码本增益)的第二输出端与乘法器93的第二输入端相连。乘法器92的一个输出端与加法器94的第一输入端相连,而乘法器93的一个输出端与加法器94的第二输入端相连。加法器94的输出端与适应性代码本的一个输入端以及合成滤波器88的一个输入端相连。
在根据图5的语音解码装置18中,子帧插补器87提供每个子帧的插补预测系数,并把这些预测系数送到合成滤波器88。
用于合成滤波器的激发信号等于固定代码本90和适应性代码本91的输出信号的加权和。加权是由乘法器92和93完成的。由信号分离器89从信号EX中提取出代码本索引FI和AI。加权因子FCBG(固定代码本增益)和ACBG(适应性代码本增益)也是由信号分离器89从信号EX中提取出来的。加法器94的输出信号被转移到适应性代码本,以提供这种适应性。
Claims (10)
1.语音编码器,该语音编码器包含:
分析装置,用以根据输入的语音信号来确定分析系数;
产生装置,用于产生表示输入语音信号的数据帧;
其特征在于,该语音编码器包含控制装置,用于根据位速率设置计算数据帧中比其余数据帧携带更多的关于所述分析系数的信息的一部分数据帧所占的份额,并且用于控制所述份额的数据帧和所述其余数据帧的传输。
2.根据权利要求1的语音编码器,其特征在于,该控制装置包含比较装置,用于将实际位速率的测量值与位速率设置的测量值进行比较,将该控制装置安排成如果实际位速率的测量值小于位速率设置的测量值则增加其携带的关于所述分析系数的信息多于其余帧的那些帧所占的实际份额,如果实际位速率的测量值大于位速率设置的测量值则减少其携带的关于所述分析系数的信息多于其余帧的那些帧所占的实际份额。
3.根据权利要求2的语音编码器,其特征在于,将该控制装置安排成用于指出这样一些分析系数,它们与根据前后帧中传输的分析参数内插得到的值的差距测量值超过一个阈值,将该控制装置安排成如果实际位速率的测量值小于位速率设置的测量值则减小该阈值,如果实际位速率的测量值大于位速率设置的测量值则增大该阈值。
4.根据权利要求1的语音编码器,其特征在于,其携带的关于所述分析系数的信息多于其余帧的那些帧所占的份额大于或等于0.5而小于或等于1。
5.根据权利要求1的语音编码器,其特征在于,该语音编码器被安排成用于响应一个粗略的位速率设置从多个帧长度中选择一个帧长度和从多个每帧中激发子帧个数中选择一个每帧中激发子帧个数。
6.根据权利要求5的语音编码器,其特征在于这多个帧长度中至少包含10ms和15ms这两个值。
7.根据权利要求6的语音编码器,其特征在于:对于帧长度为10ms的情况其多个激发子帧个数中至少包含值4,而对于帧长度为15ms的情况其多个激发予帧个数中至少包含值6、8和10。
8.一种语音编码方法,包含:
根据输入的语音信号确定分析系数;
产生代表输入语音信号的数据帧;
根据位速率设置计算数据帧中比其余数据帧携带关于所述分析系数更多信息的那些数据帧所占的份额;和
控制所述份额的数据帧和所述其余数据帧的传输。
9.一种传输表示语音信号的数据帧的发射机,该发射机包括权利要求1-7之一的语音编码器,用于从输入语音信号提取数据帧。
10.一种传输系统,包括:
权利要求9所述的发射机;和
接收机,用于经传输媒介接收数据帧,所述接收机包含语音解码器用以从数据帧中提取出重建的语音信号。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP97200998.9 | 1997-04-07 | ||
EP97200998 | 1997-04-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1222993A CN1222993A (zh) | 1999-07-14 |
CN1140894C true CN1140894C (zh) | 2004-03-03 |
Family
ID=8228171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB988004313A Expired - Fee Related CN1140894C (zh) | 1997-04-07 | 1998-03-05 | 可变位速率语音传输系统 |
Country Status (9)
Country | Link |
---|---|
US (1) | US6012026A (zh) |
EP (1) | EP0922278B1 (zh) |
JP (1) | JP2000516356A (zh) |
CN (1) | CN1140894C (zh) |
BR (1) | BR9804811A (zh) |
DE (1) | DE69834093T2 (zh) |
ES (1) | ES2259453T3 (zh) |
PL (1) | PL193825B1 (zh) |
WO (1) | WO1998045833A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6330532B1 (en) * | 1999-07-19 | 2001-12-11 | Qualcomm Incorporated | Method and apparatus for maintaining a target bit rate in a speech coder |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
US6496798B1 (en) * | 1999-09-30 | 2002-12-17 | Motorola, Inc. | Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message |
US7127390B1 (en) | 2000-02-08 | 2006-10-24 | Mindspeed Technologies, Inc. | Rate determination coding |
US6862298B1 (en) | 2000-07-28 | 2005-03-01 | Crystalvoice Communications, Inc. | Adaptive jitter buffer for internet telephony |
US6947888B1 (en) * | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US7313520B2 (en) * | 2002-03-20 | 2007-12-25 | The Directv Group, Inc. | Adaptive variable bit rate audio compression encoding |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US8090573B2 (en) * | 2006-01-20 | 2012-01-03 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision |
US8346544B2 (en) * | 2006-01-20 | 2013-01-01 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision |
EP2036204B1 (en) * | 2006-06-29 | 2012-08-15 | LG Electronics Inc. | Method and apparatus for an audio signal processing |
US20080103765A1 (en) * | 2006-11-01 | 2008-05-01 | Nokia Corporation | Encoder Delay Adjustment |
US8553757B2 (en) * | 2007-02-14 | 2013-10-08 | Microsoft Corporation | Forward error correction for media transmission |
TWI536824B (zh) * | 2012-05-04 | 2016-06-01 | 奇揚網科股份有限公司 | 視訊編碼系統、方法以及電腦可讀取之媒體 |
US9263054B2 (en) * | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4379949A (en) * | 1981-08-10 | 1983-04-12 | Motorola, Inc. | Method of and means for variable-rate coding of LPC parameters |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
BR9206143A (pt) * | 1991-06-11 | 1995-01-03 | Qualcomm Inc | Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH07202820A (ja) * | 1993-12-28 | 1995-08-04 | Matsushita Electric Ind Co Ltd | ビットレート制御システム |
JPH08263099A (ja) * | 1995-03-23 | 1996-10-11 | Toshiba Corp | 符号化装置 |
-
1998
- 1998-03-05 DE DE69834093T patent/DE69834093T2/de not_active Expired - Lifetime
- 1998-03-05 BR BR9804811A patent/BR9804811A/pt not_active Application Discontinuation
- 1998-03-05 ES ES98904327T patent/ES2259453T3/es not_active Expired - Lifetime
- 1998-03-05 CN CNB988004313A patent/CN1140894C/zh not_active Expired - Fee Related
- 1998-03-05 EP EP98904327A patent/EP0922278B1/en not_active Expired - Lifetime
- 1998-03-05 WO PCT/IB1998/000293 patent/WO1998045833A1/en active IP Right Grant
- 1998-03-05 JP JP10529313A patent/JP2000516356A/ja not_active Withdrawn
- 1998-03-05 PL PL98330398A patent/PL193825B1/pl not_active IP Right Cessation
- 1998-03-31 US US09/052,293 patent/US6012026A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1222993A (zh) | 1999-07-14 |
PL193825B1 (pl) | 2007-03-30 |
EP0922278A1 (en) | 1999-06-16 |
EP0922278B1 (en) | 2006-04-05 |
US6012026A (en) | 2000-01-04 |
DE69834093D1 (de) | 2006-05-18 |
PL330398A1 (en) | 1999-05-10 |
DE69834093T2 (de) | 2006-12-14 |
JP2000516356A (ja) | 2000-12-05 |
BR9804811A (pt) | 1999-08-17 |
WO1998045833A1 (en) | 1998-10-15 |
ES2259453T3 (es) | 2006-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1140894C (zh) | 可变位速率语音传输系统 | |
KR100643116B1 (ko) | 개선된 음성 인코더를 구비한 전송 시스템 및 이 시스템의 운영 방법 | |
CN1235190C (zh) | 改善音频信号编码效率的方法 | |
US6928406B1 (en) | Excitation vector generating apparatus and speech coding/decoding apparatus | |
JPH0863200A (ja) | 線形予測係数信号生成方法 | |
JPH08263099A (ja) | 符号化装置 | |
US7634402B2 (en) | Apparatus for coding of variable bitrate wideband speech and audio signals, and a method thereof | |
US6192334B1 (en) | Audio encoding apparatus and audio decoding apparatus for encoding in multiple stages a multi-pulse signal | |
CN1318187A (zh) | 具备背景噪声再现的语音编码 | |
CN1104093C (zh) | 语音传输系统 | |
CN1078990C (zh) | 可再建丢失信号样本的传输系统 | |
CN1222996A (zh) | 用于传输语音信号的传输系统 | |
CN1256000A (zh) | 增强音调的方法和装置 | |
CN1202513C (zh) | 音频编码、译码方法和装置及其应用 | |
KR100563016B1 (ko) | 가변비트레이트음성전송시스템 | |
KR100587721B1 (ko) | 음성전송시스템 | |
CN1189665A (zh) | 改进的多模态编码激励线性预测编码器和方法 | |
CN1185849A (zh) | 减小复杂性的信号传输系统 | |
JPH05341800A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1027903 Country of ref document: HK |
|
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |