CN1174457A - 语音信号传输方法及语音编码和解码系统 - Google Patents
语音信号传输方法及语音编码和解码系统 Download PDFInfo
- Publication number
- CN1174457A CN1174457A CN97115023.0A CN97115023A CN1174457A CN 1174457 A CN1174457 A CN 1174457A CN 97115023 A CN97115023 A CN 97115023A CN 1174457 A CN1174457 A CN 1174457A
- Authority
- CN
- China
- Prior art keywords
- signal
- spectrum envelope
- spectral coefficient
- background noise
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000008054 signal transmission Effects 0.000 title claims description 7
- 238000001228 spectrum Methods 0.000 claims abstract description 252
- 238000012545 processing Methods 0.000 claims abstract description 23
- 230000003595 spectral effect Effects 0.000 claims description 217
- 238000013139 quantization Methods 0.000 claims description 153
- 230000000284 resting effect Effects 0.000 claims description 119
- 238000011002 quantification Methods 0.000 claims description 88
- 230000008859 change Effects 0.000 claims description 84
- 238000006467 substitution reaction Methods 0.000 claims description 50
- 239000003607 modifier Substances 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000000295 emission spectrum Methods 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 abstract description 9
- 238000003860 storage Methods 0.000 description 43
- 238000012360 testing method Methods 0.000 description 29
- 238000004458 analytical method Methods 0.000 description 24
- 239000002131 composite material Substances 0.000 description 24
- 238000001514 detection method Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 238000012546 transfer Methods 0.000 description 10
- 230000004069 differentiation Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000000717 retained effect Effects 0.000 description 4
- 230000002269 spontaneous effect Effects 0.000 description 4
- 230000035807 sensation Effects 0.000 description 3
- 238000010923 batch production Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种执行VOX(声音操作发射机)程序用于语音编码和解码系统的语音传送方法,该方法可减少在接收方被输出的背景噪声的不适感觉。该方法包括如下步骤,当被检测到为间歇周期时产生一背景噪声替代信号,并在发射方在间歇周期内从输入语音信号计算量化频谱、非量化频谱包络和量化频谱包络。当非量化频谱包络和量化频谱包络间的差别比一预定门限值大时,量化频谱被改变且根据改变的量化频谱来产生背景噪声替代信号。
Description
本发明涉及包括一语音编码设备及一语音解码设备的一种语音编码和解码系统,及使用该系统的语音信号传输方法。更具体地说,本发明涉及一种具有VOX(话音控制发射机)功能的语音编码和解码系统,其只有当说话者发出声时数据才会被发射。
在语音编码和解码系统中,讲话者的语音被一语音编码设备编码,且被编码的数据被发送到一语音解码设备,然后该数据被语音解码设备解码并由其输出,为了减少功率耗散或有效地使用电路频带常常设置话音控制发射机功能。这个音控发射机功能使由编码设备一方向解码设备一方的数据传输仅在一语音数据组周期内进行,也就是,在讲话者说话发声的一周期内。在一间歇周期内,也就是,在其中没有任何声音被输入编码装置的一周期内,编码设备停止它的传输。而在解码设备方面,一种背景噪声被产生并被输出以消除由于使用音控发射机功能产生的不自然的语音通信。
如刚描述的具有VOX功能的一种语音编码和解码系统,例如,在日本专利公开申请号5-122165(JP,A,5-122165)(文献1)公开的一种系统,其中,当检测到语音数据组周期时,先发送一前置信号,然后发送语音的编码数据,但是当检测到一间歇周期时,发送一后置信号,同时在解码设备端,根据后置所接收到的后置信号背景噪声的输出可切换地启动。
下面,描述使用数字无线传输的一种常规语音编码和解码系统。图1示出了语音编码设备的一种结构,也就是,常规语音编码和解码系统的发送方设备。在数字无线传输系统中,输入到编码设备的语音信号被阻断并被处理为称作帧的各数据序列。例如,帧的时间长度是40ms(毫秒)。
作为语音信号的输入端的一传声器与这个语音编码设备91连接。发射电路15与语音编码设备91的一输入端连接,且发射天线11与发射电路15连接。发射电路15设置用于将语音编码设备91的输出信号转换为一适当频率的无线电信号并由发射天线11向接收方发射该信号。
在语音编码设备91中,自传声器1输入的语音信号被输入至一频谱包络部分2用于分析语音信号的频谱包络,语音数据组周期检测部分3用于判别当时帧是否是一语音数据组周期或是一间歇周期,及执行高效率语音信号编码的高效编码部分14。频谱包络分析部分2的一输出与高效编码部分14的一输入连接,并且也与频谱系数量化部分6的一输入相连,且还有频谱系数量化部分6的一输出被输入到高效编码部分14。与发射电路15连接的数据切换部分10被设置在高效编码部分14的一输出端上。还有构成特定字产生部分35的前置产生部分8和后置产生部分9与数据切换部分10连接。数据切换部分10接通通过发射电路15将由发射天线11发射的信号或中止发射根据后面将描述的语音数据组周期检测部分3的检测结果。数据切换部分10的一个输出作为语音编码设备91的一输出馈送至发射电路15。
通过输入到语音编码装置91的一帧语音信号,该语音信号自身的频谱包络被频谱包络分析部分2分析并且被计算出一频谱系数。这里,频谱系数是表示语音信号频谱的一特征量。对于频谱系数,例如,在SadaodiFURUI“数字语音处理”(Digital Speach Processing)中第60-62页公开的线性预测系数(LPC),Tokai大学出版社,第一版,1985年9月25日(后面称为“文献2”),同样在文献2第73-78页中公开的PARCOR(部分自相关)系数,或同样在文献2第89-92页中公开的可使用的LSP(线性频谱对)。
由频谱包络分析部分2计算的频谱系数被输入到频谱系数量化部分6并被量化以计算一量化的频谱系数。更具体地说,频谱系数量化部分6保留预先产生的作为编码簿的数据,并从该编码簿中选择出最接近该频谱系数的数据。
由所选择的数据表示的该频谱系数被称作量化频谱系数。在下面的描述中,为了确保清楚地与量化频谱系数区别,由频谱包络分析部分2输出的不在量化状态的频谱系数在后面称为“非量化频谱系数”。此外,提供量化频谱系数的编码簿的一个码字被称作“量化频谱码字”。
非量化频谱系数和以这种方式计算出的量化频谱系数与语音信号一起被输入到高效编码部分14,通过高效编码部分14它们被高效编码,此后它们被输入到数据切换部分10。
如上面所描述的,自传声器1输入的一帧语音信号也被输入到语音数据组周期检测部分3,由其判别当时帧是否是在其中发布声音的语音数据组周期或是一在其中没有声音发出的间歇周期。由语音数据组周期检测部分3检测出的结果被输入到数据切换部分10。如果判定当时帧是一语音数据组周期,那么数据切换部分10选择由高效编码部分14输出的高效编码。其结果,高效编码通过发射电路15和发射天线11被朝向接收方发射,也就是,朝着解码设备方。在当时帧是语音数据周期而且高效编码继续从发射天线11发射的一种状态被称作“语音数据组处理状态,而在语音数据组周期产生的高效编码被称作“语音数据组编码信号”。
在另一方面,如果前面的帧是一语音数据组周期,并且由语音数据组周期检测部分3判定当时帧是一间歇周期,那么将执行下面的处理过程。首先,在当时帧中,后置产生部分9产生称为后置信号的一帧,并通过数据切换部分10由发射天线11发射该后置信号。在下一帧中,由传声器1输入的静默语音信号以与在语音数据组周期高频编码相似的方式被高效编码部分14高效编码,该码由发射天线11发射。在这个情况中发射的信号被称作“背景噪声替代信号”。在背景噪声替代码被发射之后,该编码设备方在一个T帧时间间隔周期内中断它的发射。在T帧后,后置信号和背景噪声替代信号被再一次发射,然后发射被中断T帧。这样一个操作顺序被重复。这里,T是预先确定的自然数。
其中后置信号和背景噪声替代信号被发射然后发射被中止T帧周期的操作顺序并以这种方式被重复的状态被称作“间歇处理状态”。然而,尽管在间歇处理状态中发射被中断,语音数据组周期检测部分3一直进行语音数据组周期的检测,且如果检测到语音数据组,那么由前置产生部分8产生称为前置信号的帧。然后,前置信号通过切换开关10从发射天线11发射,且在前置信号后面的帧中,由高效编码部分14产生的高效码被连续地发射。
后置信号和前置信号不是由高效编码部分14正常产生的信号,那些后置信号和前置信号总起来称作“特定字”。
图2是表示语音解码设备结构的一方框图,也就是,在接收方的一设备。所示语音解码设置92是与图1所示语音编码设备91成对使用的。
接收天线20通过接收电路33与语音解码设备92连接。接收天线20设置用于接收由语音编码设备91(图1)发射的信号。此外,为了输出解码的语音,一扬声器30与语音解码设备92连接。
在语音解码设备92中,由接收天线20输入的接收信号通过接收电路33被馈送至进行高效语音解码的高效语音解码部分22、检测特定字的特定字检测部分23、及为背景噪声的产生需要保留参数的背景噪声参数存储部分24。语音解码设备92还包括用于合成背景噪声的背景噪声合成部分29,及用于选择地向扬声器30输出由背景噪声合成部分29输出的背景噪声或输出由高效语音解码部分22解码的语音的开关21。语音解码设备92还包括量化频谱系数计算部分25和随机残留信号产生部分28。
特定字检测部分23分析接收信号并判别各当时帧和下一帧是否是一语音数据组周期或一间歇周期。如果当时帧是一间歇周期,那么特定字检测部分23检测后置信号、一前置信号或背景噪声替代信号。该特定字检测部分23的语音数据组周期/间歇周期检测方法描述如下:
(1)如果前面帧是一语音数据组周期而且在当时帧收到了后置信号之外的一个信号,那么当时帧是语音数据周期;
(2)如果前面帧是语音数据组周期而在当时帧接收到后置信号,那么当时帧是间歇周期;
(3)如果前面帧是间歇帧而且在当时帧接收到除了前置信号外的一信号,该当时帧是间歇周期;及
(4)不考虑上面所述三个准则(1)-(3),如果前面帧是一间歇帧而且在当时帧接收到报头信号,那么当时帧是一间歇周期,且下一帧必定变为语音数据组周期。
同时,当特定字检测部分23检测来自一接收信号内的一信号时的准则如下:
(a)如果接收到被认为是后置信号的一信号,那么一后置信号被检测当时帧是否是一语音数据组周期或一间歇周期;
(b)如果在间歇周期内接收到可能被认为是前置信号的信号,那么前置信号被检测;
(c)然而,如果在一语音数据组周期接收到一可能被认为是前置信号的信号,那么语音数据组码信号被检测;及
(d)如果在一间歇周期,在前面帧检测到一后置信号,且在当时周期没有接收到能被认为是报头信号的一信号,那么在当时帧背景噪声替代信号被检测。
特定字检测部分23的检测输出被提供给背景噪声参数存储部分24,并也被提供给开关24用于开关21的切换。如果特定字检测部分23判定当时帧是一语音数据组周期,那么语音数据组码信号被高效语音解码部分22解码。然后,开关21被切换接通致使来自高效语音解码部分22的解码语音可以自扬声器30输出。
下面,描述当特定字检测部分23判定当时帧是间歇周期时的操作。
在判定当时帧是间歇周期后,先从背景噪声参数存储器部分24读出参数。在读出的参数中,一量化频谱系数被输入至量化频谱系数计算部分25,通过它被转换为一量化频谱系数,在这之后它被输入到背景噪声合成部分29。除了对应于一残留信号外,其余参数被直接从背景噪声参数存储部分24输入到背景噪声合成部分29。对应于残留信号的参数没有自背景噪声参数存储部分24输入到背景噪声合成部分29,而化之以由随机残留信号产生部分28产生的随机残留信号被输入到背景噪声合成部分29。根据来自背景噪声参数存储部分24、量化频谱系数计算部分25和随机残留信号产生部分28的输入,背景噪声合成部分29产生一背景噪声信号。然后,当由特定字检测部分23判字当时帧是一间歇周期时,开关21被切换接通致使由背景噪声合成部分29产生的背景噪声由扬声器30输出。
背景噪声参数存储部分24是用于保存合成背景噪声所需参数的一存储器。如果特定字检测部分23判定当时帧的接收信号是一背景噪声替代信号,那么该背景噪声替代信号被输入至背景噪声参数存储部分24。接下来,背景噪声参数存储部分24的内容被替代为根据背景噪声替代信号确定的背景噪声参数。
下面结合流程图描述常规语音编码和解码系统的操作。图3图示出在发射方语音编码设备91的处理过程。
假设语音信号是一帧接一帧输入的,语音信号自身的频谱包络被频谱包络分析部分2分析并在步骤201先计算频谱系数。然后这个频谱系数(非量化频谱系数)在步骤202由频谱系数量化部分6量化,从而得到一量化频谱系数。
一帧语音信号也被输入到语音数据组周期检测部分3,且在步骤203,由语音数据组周期检测部分3判别当时帧是否是一语音数据组周期或一间歇周期。然后,根据非量化频谱系数、量化频谱系数和输入语音信号,在步骤204由高效编码部分14进行高效编码。
如果在步骤203判定当时帧是一语音数据组周期,那么控制顺序进入到步骤206,在步骤206中数据切换部分10选择由高效编码部分14输出的高效码,且这个高效码由发射天线11向解码设备方发射。
另一方面,如果在步骤203中确定当时帧是一间歇周期,那么通过特定字产生部分35也就是,通过前置产生部分8和后置产生部分9的处理过程在步骤205中完成。尤其是在当时帧中,由后置产生部分9产生一后置信号,而在步骤206中,该后置信号通过数据切换部分10被从发射天线11发射。在下一帧中,由传声器1输入的静默语音信号被高效编码部分14以与步骤204中语音数据组周期高效编码的相同方式高效编码,而产生的码在步骤206由发射天线11发射。
在背景噪声替代信号被发射之后,语音编码设备91在一预定的时间间隔的T帧周期内停止它的发射。在T帧周期过去后,语音编码设备91再一次发射后置信号和背景噪声替代信号,然后再将它的发射中断另一T帧周期,且重复这样一个操作顺序。
应注意到,同样当发射停止时,在步骤203中语音数据组周期的检测仍是连续进行的,且如果检测到从一间歇周期到一语音数据组周期的转变,那么在步骤205中,由包括在特定字产生部分35内的前置产生部分8产生一前置信号。然后,在当时帧中,该前置信号在步骤206中通过数据切换部分10被从发射天线11发射。接着,在下面的帧中,由高效编码部分14产生的高效编码在步骤204和206继续被发射。
下面,结合图4描述在接收方语音解码设备92的处理过程。
由编码设备发送并被接收天线20接收的一接收信号通过接收电路33被馈送至高效语音解码部分22和特定字检测部分23。在步骤251,首先,接收信号被特定字检测部分23分析以判字各当时帧和下一帧是否是一语音数据组周期或一间歇周期。如果判定当时帧和下一帧二者是间歇周期,那么在步骤253中判别接收信号是否是一特定字(即,后置信号或前置信号)。如果接收信号不是一特定字,那么在步骤254判别接收编码是否是一背景噪声替代信号(用于替代背景噪声的数据)。如果在步骤254判定接收信号是一背景噪声替代信号,那么在步骤255背景噪声参数存储部分24的内容被更新。
如果在步骤251判定当时帧是一语音数据组周期,在步骤252高效语音解码部分22对接收信号(在这个例子中是高效码)解码以产生一解码语音信号,且在步骤259开关21被切换接通致使解码的语音可以从扬声器30输出。然后,输出解码语音信号。
下面,描述在步骤251中当特定字检测部分23判字当时帧是间歇周期时的操作。
首先,执行前面描述的在步骤253、254和255中的处理过程。在步骤256中,量化频谱码字被从背景噪声参数存储部分24读出并输入到量化频谱系数计算部分25,通过它量化频谱码字被转化为量化频谱系数。然后在步骤257中,随机残留信号产生部分28产生一随机残留信号,且在步骤258中,背景噪声合成部分29从来自背景噪声参数存储部分24、量化频谱系数计算部分25和随机残留信号产生部分28的输入中产生一背景噪声信号。因为当时帧是间歇周期,开关21被切换到背景噪声合成部分29方,以便由背景噪声合成部分29产生的背景噪声信号从扬声器30输出。
然而,在上面描述的常规语音编码和解码系统中,在语音编码设备的频谱系数量化部分中设置的编码簿通常是被优化适合于在语音数据组周期中频谱包络的量化,而不考虑适合于间歇周期的量化。由于常规系统使用这样一个如前面所描述的语音数据周期优化的编码簿来量化在间歇周期的频谱包络,所以在间歇周期的背景噪声产生一不熟悉的感觉。最后,常规语音编码和解码系统有个问题,也就是在间歇期间由语音解码设备输出的背景噪声中产生有异常的声音。
本发明的目的是提供一种适用于执行话音控制发射的语音编码和解码系统的语音信号传输方法,通过该方法可产生背景噪声。并能减少将在接收方输出的背景噪声的不熟悉感觉。
本发明的另一目的是提供一种为产生背景噪声进行音控发射机(VOX)处理过程的语音编码和解码系统。其能减少在接收方输出的背景噪声的不熟悉感觉。
上述的本发明的第一目的是通过一语音信号传输方法获得的,在发射方,输入语音信号被编码并作为编码数据发送至接收方,且在接收方,该编码数据被解码并作为一输出语音信号输出,包括的步骤为:在发射方检测输入语音信号的间歇周期,在发射方间歇周期内通过编码语音输入信号产生一背景噪声替代信号,在发射方间歇周期内从输入语音信号中计算量化频谱、非量化频谱包络和量化频谱包络,在自发射方向接收方发射背景噪声替代信号之后在发射方中断一预定周期的发射,并在预定的周期内在接收方根据接收的背景噪声替代信号产生背景噪声作为输出作为输出语音信号的背景噪声,其中当非量化频谱包络和量化频谱包络间的差别大于预定门限值时,量化频谱被改变,并基于该改变的量化频谱产生背景噪声替代信号。
本发明的第二个目的是通过一种语音编码和解码系统获得的,该系统包括一语音编码设备和一语音解码设备,并执行产生背景噪声的VOX(音控发射机)处理过程,其中语音编码设备包括用于定量地计算语音编码设备一输入信号的非量化频谱包络和量化频谱包络之间差别的频谱包络比较装置,及用于与该差别相对应地改变量化频谱包络的频谱包络改变装置,并使用由频谱包络改变装置改变的量化频谱包络以便于进行背景噪声编码处理,然后根据量化频谱包络的改变向语音解码设备方发射频谱改变信息,而该语音解码设备包括用于存储接收的频谱改变信息的频谱改变信息存储装置和用于基于存储在频谱改变信息存储装置中的频谱改变信息改变接收的量化频谱包络的改变的频谱系数计算装置,且为了产生背景噪声,使用由改变的频谱系数计算装置输出的量化频谱。
语音编码和解码系统可以被设计为致使语音编码设备还包括一第一编码簿,具有与第一编码簿不同内容的一第二编码簿,用于在语音数据组周期使用第一编码簿量化输入信号的第一频谱系数量化装置,及用于在间歇期内使用第二编码簿本来量化输入信号的第二频谱系数量化装置。
这里,“量化频谱包络”表示由一量化频谱系数限定的语音频谱包络,且“非量化频谱包络”表示由一非量化频谱系数限定的语音频谱包络。还有在下面的描述中,这些术语以同样的意思被使用。
在本发明,频谱包络比较装置在间歇周期进行非量化频谱包络和量化频谱包络间的比较。频谱包络改变装置根据比较的结果改变量化频谱包络致使非量化频谱包络和量化频谱包络间的差别能够减小。在常规的系统中,由于间歇周期的量化频谱系数是由对语音数据组周期优化的量化器计算的,在间歇期间该量化频谱系数和非量化频谱系数之间存在较大差别。然而,按照本发明,由于量化频谱系数被频谱包络改变装置改变,所以量化频谱系数和非量化频谱系数间的差别被减小,且背景噪声的声音质量被改善。
此外,在本发明中,语音编码设备包括用于在语音数据组周期用第一编码簿量化—输入信号的第一频谱系数量化装置,及在间歇周期使用具有与第一编码簿不同内容的第二编码簿量化该输入信号的第二频谱系数量化装置,第二频谱系数量化装置(即,间歇周期频谱系数量化部分)使用用于间歇周期的小编码簿(即第二编码簿)进行频谱系数的量化。此后,由频谱包络改变装置进行滤波处理致使来自非量化频谱的差别可以被降低。因此,消除了通常在间歇周期进行量化使用如用于语音数据组周期频谱系数量化的编码簿(即,第一编码簿)的较大编码簿的必要性。
本发明上述和其它目的、特征和积极效果通过下面结合说明本发明最佳实施例的附图的描述将变得很清楚。
图1是表示一种常规语音编码和解码系统的语音编码设备的结构实例方框图;
图2是表示一种常规语音编码和解码系统的语音解码设备的结构实例方框图;
图3是说明图1所示语音编码设备的操作流程图;
图4是说明图2所示语音解码设备的操作流程图;
图5是表示本发明第一实施例的语音编码和解码系统结构的方框图;
图6是表示第一实施例语音编码和解码系统的语音编码设备结构的方框图;
图7是表示第一实施例语音编码和解码系统的语音解码设备结构的方框图;
图8是说明图6所示语音编码设备操作的流程图;
图9是说明图7所示语音解码设备操作的流程图;
图10是说明频谱包络改变部分处理过程的一实例的示意图;
图11是表示本发明第二实施例语音编码和解码系统结构的一方框图;
图12是表示第二实施例的语音编码和解码系统的语音编码设备结构的方框图;
图13是表示第二实施例的语音编码和解码系统的语音解码设备结构的方框图;
图14是说明图12中所示语音编码设备操作的流程图;
图15是说明图13中所示语音解码设备操作的流程图。
图15所示的本发明第一实施例的一种语音编码和解码系统,它被设置为设有语音编码设备51的发射台52和设有语音解码设备53的接收台54通过无线电信道相互连接,以便于通过数字无线传输发射编码语音信号。传声器1作为一语音信号输入端设置在发射台52。传声器1与语音编码设备51的输入端连接。在语音编码设备51的输出端上设有一发射电路15,来自语音编码设备51的编码信号被发射电路15转换成为一无线电信号并由发射天线11向接收台54发射。为了减少无线发射所需的功率,当没有任何信号从语音编码设备51输出时,发射电路15停止它的工作。
接收台54包括用于接收和检测被输入到接收天线20的一无线电信号的接收电路33,接收电路33的输出被输入到语音解码设备53。为了输出由语音解码设备53解码的一语音信号,语音解码设备53的输出端连接一扬声器30。
首先,参照图6描述设在发射台52的语音编码设备51的结构。
语音编码设备51不同于图1所示的常规系统的语音编码设备91,它包括代替该高效编码设备的不仅为语音数据组周期而且也为间歇周期高效编码的另一高效编码部分7,除了图1所示语音编码设备的部件之外,它包括用于计算依据非量化频谱系数的频谱包络和依据量化频谱系数的另一频谱包络间的差别的频谱包络比较部分4,及用于根据频谱包络比较部分4比较结果改变量化频谱包络的频谱包络改变部分5。由频谱包络改变部分5输出的改变量化频谱包络被输入到高效编码编部分7。在图6中,用与图1中同样标号表示的部件是与图1所示的那些相同的功能块。
在图6所示的语音编码设备51中,相同于图1所示的常规编码设备,被输入至传声器1的原始语音信号被每帧地输入到频谱包络分析部分2、语音数据组周期检测部分3和高效编码部分7。此如,该帧长度为40ms。频谱包络分析部分2分析一帧原始语音信号自身的频谱包络并计算频谱系数(非量化频谱系数)。这里,频谱系数可以是一线性预测系数、一PARCOR系数或一LSP。然后,由频谱系数量化部分6量化非量化频谱系数以获得一量化频谱系数。同时,语音数据组周期检测部分3判别当时帧是否是一在其中发声的语音数据周期或是在其中不发声的间歇周期。
上面所描述的传声器1、频谱包络分析部分2、频谱系数量化部分6和语音数据周期检测部分3的结构和操作是与图1所示的常规系统的语音编码设备的那些部分相同的。
在当时帧是语音数据周期的信息由语音数据组周期的信息由语音数据组周期检测部分3输入到其中时,该执行高效编码的高效编码部分7用由传声器1输入的原始语音信号,由频谱包络分析部分2产生的非量化频谱系数和由频谱系数量化部分6产生的量化频谱系数产生一高效编码。换句话说,来自此后将描述的频谱包络改变部分5的输入并不是用于语音数据组周期的高效编码。在语音数据组周期内,量化频谱码字和由原始语音信号、非量化频谱系数和量化频谱系数确定的高效码组合。作为语音数据组码信号自高效部分7输出。然后,在当时帧是一语音数据组周期时,数据切换部分10选择由高效编码部分7输出的语音数据组码信号。因此,这个语音数据组码信号由语音编码设备51输出并自发射天线11向接收台54发射。
在另一方面,如果判定前面帧是一语音数据组周期和当时帧时一间歇周期,那么就执行下面的处理。首先,在当时帧,后置产生部分9产生一后置信号,且这个后置信号通过数据切换部分10被输出。输出的后置信号通过发射电路15和发射天线11被发送至接收台54。后置产生部分9的结构和操作是与图1所示的常规语音编码设备的情况相同的。在下一帧中,由传声器1输入的静默语音信号以下面描述的一种方式由高效编码部分7高效编码,且该码作为背景噪声替代信号由语音编码设备51输出。这个背景噪声替代信号自发射天线11向接收台54发射。
同时,在图1所示的常规语音编码设备中,高效编码部分14为语音数据组周期产生高效码的方法和产生背景噪声替代信号的方法是相互相同的,图6所示实施例语音编码设备51的高效编码部分7按不同的产生方法产生语音数据组周期高效码和背景噪声替代信号。语音编码设备51包括频谱包络比较部分4和频谱包络改变部分5,并用它们的输出,用不同于语音数据组周期高效码的方法产生一背景噪声替代信号。首先,描述频谱包络比较部分4和频谱包络改变部分5。
频谱包络比较部分4将从由频谱包络分析部分2获得的非量化频谱系数中计算出的非量化频谱包络和从由频谱系数量化部分6得到的量化频谱系数中计算出的量化频谱包络相互比较以计算它们之间的差别。此外,频谱包络改变部分5接收由频谱比较部分4计算的差别,并将该差别与一门限值比较。如果频谱包络改变部分5判别量化频谱包络和非量化频谱包络相互差别很大,那么它改变由频谱系数量化部分6获得的量化频谱系数,以便于降低与非量化频谱包络完全一样的差别。然后,频谱包络改变部分5将至此改变的量化频谱系数和涉及改变方法的信息输入到高效编码部分7。在下面的描述中,改变的量化频谱系数被称为“改变的量化频谱系数”,而涉及改变方法的信息被称为“频谱改变信息”。
高效编码部分7用由传声器1输入的原始语音信号,由频谱包络分析部分2产生的非量化频谱系数和由频谱包络改变部分5产生的改变量化频谱系数产生一高效码。此外,由频谱系数量化部分6获得的量化频谱系数的码字和由频谱包络改变部分5产生的频谱改变信息的码字被加至高效码以产生一背景噪声替代信号,以这种方式由高效编码部分7产生的背景噪声替代信号被输入到数据切换部分10并通过发射电路15和发射天线11发射。
在背景噪声替代信号被发射以后,发射台52中断它的发射一预定的T帧周期。然后,T帧之后,该发射台52再一次发射后置信号和背景噪声替代信号,然后停止它的发射一T帧周期。重复这个顺序操作。
然而,当发射被中断时,语音编码部分51按语音数据组周期检测部分3的方式继续进行语音数据组周期的检测,而且当判定当时帧是语音数据组周期时,由前置信号产生部分8产生一前置信号。其结果,这个前置信号通过数据切换部分10由语音编码设备51输出并被发送到发射电路15和发射天线11。然后,在下面的帧中,由高效编码部分7产生的语音数据组码信号连续地由语音编码设备51输出。因此,语音数据组信号被发射电路15和发射天线11连续地发射。前置产生部分8的结构和操作是与图1所示常规语音编码设备相同的。
下面,参照图7描述语音解码设备53的结构。除了图2所示常规语音解码设备的部件之外,语音解码设备53还包括用于接收一接收信号和语音数据组周期检测部分3的检测结果,并存储频谱改变信息的频谱改变信息存储部分27,及一改变频谱系数计算部分26,它用于接收来自量化频谱系数计算部分25的量化频谱系数。并根据存储在频谱改变信息存储部分27内的频谱改变信息来改变输入的量化频谱系数。量化频谱系数计算部分25的输出不是直接地输入到背景噪声合成部分29,而代之以,改变频谱系数计算部分26的输出被输入到背景噪声合成部分29。在图7中,那些用与图2中相同标号表示的部件是与图2中那些相同的功能块。
输入到接收天线20并被接收电路33接收并检测的一信号被输入到高效语音解码部分22、特定字检测部分23、背景噪声参数存储部分24及频谱改变信息存储部分27。特定字检测部分23分析接收信号并判别各当时帧和下一帧是否是一语音数据组周期或是一间歇周期。在当时帧或下一帧是间歇周期时,一后置信号、一前置信号或一背景噪声替代信号被检测。特定字检测部分23的结构和操作是与图2中所示常规语音解码设备的情况相同的,而且还有语音数据组周期和间歇周期间的判别方法及后置信号、前置信号或背景噪声替代信号的检测方法是与前面所述的常规的情况相同的。
如果由特定字检测部分23判定当时帧是一语音数据组周期,那么语音数据组码信号被高效语音解码部分22解码。然后,开关21被切换接通以便于选择高效语音解码部分22,而由高效语音解码部分22解码的声音作为语音解码设备53的输出由扬声30输出,高效语音解码部分22和扬声器30的结构和操作是与图2所示的常规设备的情况相同的。
接下来,描述当由特定字检测部分23判定当时帧是一间歇周期时的操作。
在间歇周期,从两个存储器读出所需的信息,在该存储器中存有用于背景噪声合成的所需参数,也即频谱改变信息存储部分27和背景噪声参数存储部分24,并且使用所取出的信息由背景噪声合成部分29来对背景噪声进行合成。在间歇周期,首先从背景噪声参数存储部分24读出参数。通过所读出的参数,量化的频谱码字被输入量化频谱系数计算部分25,通过它将量化的频谱码字转换为量化的矢量系数,此后,其被输入改变频谱系数计算部分26。剩余的参数被从背景噪声参存储部分24直接输入到背景噪声合成部分29,而与残留信号相对应的部分除外。需注意的是与前面所述的常规的语音解码设备相类似,仅当其被特定字检测部分23判定当时帧的接收信号是背景噪声替代信号时,保留在背景噪声参数存储部分24中的内容被替代为根据背景噪声替代信号计算出的背景噪声参数。
频谱改变信息存储部分27被用来保留和输出用于背景噪声替代的频谱改变信息。保留在频谱改变信息存储部分27内的频谱改变信息仅当特定字检测部分23判定当时帧为背景噪声替代信号时才被替代,且在此情况下,频谱改变信息被从接收信号中取出而至此仍保留的旧的频谱改变信息被所取出的频谱改变信息替代。
谱变系数计算部分26被用于计算改变频谱系数。改变频谱系数计算部分26将由量化频谱系数计算部分25所计算出的量化的频谱系数与保留在频谱改变信息存储部分27中的频谱改变信息相结合以计算改变的量化频谱信息并将其输入到背景噪声合成部分29。
作为与残留信号相对应的参数,由随机残留信号产生部分28所产生的随机残留信号被输入。随机残留信号产生部分28的构成和操作与图2中所示的传统语音解码设备相同。
背景噪声合成部分29从来自背景噪声参数存储部分24、改变频谱系数计算部分26和随机残留信号产生部分28的输入中产生一背景噪声信号。如果特定字检测部分23判定当时帧为暂停周期,开关21被切换接通以便选择背景噪声合成部分29,随后,由背景噪声合成部分29所产生的背景噪声信号被从扬声器30输出。
下面将参考流程图对第一实施例的语音编码和解码系统的操作进行描述。图8描绘了发射台52的语音编码装置51的处理过程。
被输入到传声器1的一帧的原始语音信号在步骤101中被输入到频谱包络分析部分2,通过它对非量化的频谱包络和非量化的谱系统进行计算。在步骤102中,非量化的频谱系数被输入到频谱系数量化部分6,其随后参照频谱系数量化部分6中所提供的频谱系数量化编码簿,来确定一量化频谱包络、一量化频谱系数和与量化频谱系数相对应的码字。
在步骤103中语音数据组周期检测部分3分析所输入的原始语音信号并判别当时帧是否为一语音数据组周期或一间歇周期。如果其判定出当时帧为一语音数据组周期,则控制顺序进入到步骤106,并执行高效编码。随着原始语音信号、非量化频谱系数、量化频谱系数和量化频谱码字被输入到高效解码器7进行高效编码,在步骤108,所获得的高效编码被从语音编码装置51通过数据开关部分10输出并从发射天线11发射。
另一方面,当在步骤103中判定当时帧为间歇周期时程序以下述的方式进行。首先,在步骤104中,由频谱包络分析部分2计算出的非量化频谱包络和由频谱系数量化部分6计算出的量化频谱包络被频谱包络比较部分4彼此进行比较以判别它们之间的差别大小。此种判别是通过将它们之间的差别与预先设定的门限值进行比较来完成的。然后,如果判定差别很大,则在步骤105中,频谱包络改变部分5计算一已被改变的改变量化频谱系数,以便接近非量化频谱包络。此后,在步骤106中,当在步骤104中判定频谱包络间的差别很大时使用改变量化的频谱系数,而当在步骤104中判定频谱包络间的差别较小时,使用量化频谱系数,通过高效编码部分7来进行高效编码。然后,高效编码、量化频谱系数的码字和频谱改变信息被作为背景噪声替代信号汇集输出。
此外,当在步骤103中判定当时帧为一间歇周期时,在步骤107中由前置产生部分8产生一前置信号而由后置产生部分9生成一后置信号,其与上面描述的步骤104和105存在基本同步的平行关系。前置信号和后置信号被输入到数据切换部分10。然后,在当时帧为间歇周期时,在步骤108中,数据切换部分10选择出在当时帧要被输出的信号。尤其是,(1)在背景噪声替代码要被发出的帧内,选择通过高效编码部分7所获得的背景噪声替代信号,但(2)在前置信号要被发出的帧内,选择由前置产生部分8所产生的前置信号或(3)在后置信号要被发出的帧内,来选择由后置产生部分9所产生的后置信号。通过此方式所选择出的信号从语音编码设备51输出并自发射电路15和发射天线11向接收台54发射。
下一步,将参考图9描述接收台54的语音解码设备53的处理过程。
被输入到接收天线20并被接收电路33接收和检测的接收信号被输入到特定字检测部分23,在步骤121通它来判别当时帧是一语音数据组周期还是一间歇周期。如果当时帧为一语音数据组周期,则在步骤130中通过高效语音解码部分22对所接收的高效编码进行解码,且在步骤132中通过开关21对被解码的声音进行选择。其结果,被解码的声音从扬声器30输出。
另一方面,如果在步骤121中判定当时帧为间歇周期,则在步骤122中通过特定字检测部分23来判别所接收到的信号是否为一后置信号或一前置信号的特定字。如果所接收到的信号不是一特定字,则在步骤123中来判别所接收到的信号是否为一背景噪声替代信号(用于背景噪声替代的数据)。当在步骤122中判定所接收到的信号为一特定字或当在步骤123中判定所接收到的信号不是背景噪声替代数据时,控制顺序进入到步骤126。如果在步骤123中判定所接收的信号为一背景噪声替代信号时,在步骤124中,则保留在背景噪声参数存储部分24中的背景噪声参数被一背景噪声参数和从所接收到的背景噪声替代信号中获得的频谱改变信息所替代。然后,存储在频谱改变信息存储部分27内的频谱改变信息在步骤125被替代,此后控制程序进入到步骤126。
在步骤126中,量化频谱系数计算部分25使用存储在背景噪声参数存储部分24中数据来计算一量化频谱系数。将被算出的量化频谱系数与存储在频谱改变信息存储部分27内的频谱改变信息一起输入到改变频谱系数计算部分26。这里,根据频谱改变信息在步骤127中判别量化频谱系数是否应该被改变。如果需要改变量化频谱系数,在步骤128中,则根据频谱改变信息将其改变以计算一改变了的量化频谱系数。
然后,在步骤129中,将由随机残留信号产生部分28产生的随机残留信号、及在步骤131中存储在背景噪声参数存储部分24中的背景噪声参数和由改变频谱系数计算部分26计算出的改变的量化频谱系数或由量化频谱系数计算部分计算出的量化频谱系数以及以上提到的随机残留信号输入到背景噪声合成部分29,通过它产生背景噪声。这里,当在步骤128中量化频谱被改变时,使用改变的量化频谱系数,但是当在步骤127中判定量化频谱不应被改变时,则使用量化频谱系数。在当时帧为一间歇周期时,在步骤132中,由于通过开关21来选择背景噪声,则从扬声器130输出背景噪声。
下面参考图10对图6中所示的语音编码设备51的使用频谱包络改变部分5的处理过程实例进行描述。
在量化矢量包络存在的频率区以频率递增顺序划分为一低频区、一中频区和一高频区,频谱包络改变部分5具有滤波系数,其频率特性仅对不同频区以三个码簿的形式变化,也即,一低频区改变滤波系数码簿41、一中频区改变滤波系数码簿42和一高频区改变滤波系数码簿43。然后,频谱包络改变部分5叠加一复合滤波器的传递函数,该复合滤波器由量化频谱滤波器构成,是由从在不同频区内选出的滤波系数而产生的滤波器构成,以改变量化频谱包络。然后,通过改变所得到的量化频谱包络与非量化频谱包络进行比较,并选择出那些将差值减至最小的码制作。
下面用数学公式来对语音编码和解码系统的程序进行描述,该系统使用了上面描述的频谱包络改变部分5。
下面分别表示出在步骤101中通过频谱包络分析部分2计算出的用于一帧的原始语音信号的非量化频谱包络和非量化频谱系数:
非量化频谱系数:nqa(n)
(0≤n<Np) (1)
非量化频谱包络:nqsp(f)
(0≤f<fs) (2)其中fs为当对原始语音信号进行模拟-数字转换时的抽样频率,Np为非量化频谱系数的级数。需指出的是量化频谱系数的级数也为Np。这里作为非量化频谱系数的一个例子,使用了上面提到的线性预测系数。因此,由非量化频谱系数nqa(n)所提供的复合滤波的传递函数用下式表示:
其中非量化频谱包络nqsp(f)用下式表示:
其中e为对数的底,而j为虚部。
在步骤102中,非量化频谱系数nqa(n)被输入到频谱系数量化部分6并被其量化从而计算出量化频谱系数和量化频谱系数相对应的码簿的码字。此外,从量化频谱系数可获得量化频谱包络。然后用下面的方式来表示:
量化频谱系数:qa(n)
(0≤n<Np) (6)
量化频谱包络:qsp(f)
(0≤f<fs) (7)
量化频谱系数的码字:
qcode(i)
(0≤i<Ni) (8)
与非量化频谱系数相类似,同样对于量化频谱系数,例如,也使用了上面提到的线性预测系数。随后,由量化频谱系数nqa(n)表示的复合滤波器传递函数Hq(2)表示如下:
在此情况下,非量化频谱包络qsp(f)用下面形式表示:
如果在步骤103中判定当时帧为一语音数据组周期,则在步骤106中由高效编码部分7产生一高效编码,且此高效编码在步骤108中通过数据切换部分10从发射天线11输出。对于被间歇周期高效编码部分7所使用的高效编码方法,引用的VSELP(引发LPC的矢量和),例如在Kazunovi Ozawa的“用于数字无线移动通信的高效语音编码技术”,Triceps,1992.4.6(此后指“文献3”)PP99-103页中被使用。
如果在步骤103中判定当时帧为—间歇周期,则通过频谱包络比较部分4在步骤104中对非量化频谱包络和量化频谱包络进行彼此相互比较。在此情况下,作为比较方法的一个实例,其中系数LD和门限值LDTH由下式给出。
表1
条件 | 非量化频谱包络和量化频谱包络间的差别 |
当LD<LDTH | 确认差别较小 |
当LD≥LDTH | 确认差别较大 |
此后,如果识别出非量化频谱包络和量化频谱包络间的差别很大时,在步骤105中通过频谱包络改变部分5来计算已被改变以便接近以便接近非量化频谱包络的一改变的量化频谱系数。首先对图10中所使用的变量进行描述:LFi(z):用于码字i的低频区改变滤波器的传递函数;MFi(z):用于码字i的中频区改变滤波器的传递函数;HFi(z):用于码字i的高频区改变滤波器的传递函数;L:低频区码字的数目;M:中频区码字的数目;H:高频区码字的数目;M1:LFi(z)的分母值;N1:LFi(z)的分了值;Mm:MFi(z)的分母值;Nm:MFi(z)的分子值;Mh:HFi(z)的分母值;Nh:HFi(z)的分子值;α1(i,j):码字i的低频区改变滤波器的分母的第j级系数;β1(i,j):码字i的低频区改变滤波器的分子的第j级系数;βm(i,j):码字i的中频区改变滤波器的分母的第j级系数;βm(i,j):码字i的中频区改变滤波器的分子的第j级系数;αh(i,j):码字i的高频区改变滤波器的分母的第j级系数;及βh(i,j):码字i的高频区改变滤波器的分子的第j级系数.
从前面所述,与码字i对应的改变滤波器的传递函数可由下式给出:
在此情况下,如果假设具有Li作为低频区码字、Mi作为中频区码字和Hi为高频区码字的量化频谱,则改变量化频谱系数可以表示如下:
αc[LiMiHi](i)(0≤i<K) (15)
βc[LiMiHi](i)(0≤i<N) (16)其中
K=Ml×Mm×Mh (17)
N=Nl×Nm×Nh (18)
由此,根据改变量化频谱系数和频谱包络SP[LiMiHi](f)的复合滤波器的传递函数H[LiMiHi](Z)由下式给出: =HFi(z)×MFi(z)×LFi(z)×Hq(z) (20)
上面给出的频谱包络SP[LiMiHi](f)和由表达式(2)给出的非量化频谱包络nqsp(f)间的差别根据由表达式(11)给出的计算式进行计算以寻找出能将差别减至最小的码字Li、Mi和Hi的组合。那么码字Li、Mi和Hi为被选出的码字,而αc[LiMiHi](i)和βc[LiMiHi]为改变量化频谱系数。
通过频谱包络改变部分5的这种方式来确定改变量化频谱系数。
然后,当非量化频谱包络和量化频谱包络间的差别很大时,使用改变量化频谱系数通过高效编码部分7来进行高效编码,而当差别较小时,使用量化频谱系数。高效码、量化频谱系数的码字和频谱改变信息被一起作为背景噪声替代信号输出。此后,在当时帧内将被输出的信号通过以上所描述的方式被数据切换部分10选择。
下面描述接收台54的语音解码设备的操作,如果语音编码设备51的频谱包络改变部分5的结构与以上描述的一致,则使用上面给出的表达式(12)到(16)、(19)和(20)通过改改变频谱系数计算部分26可计算改变量化频谱系数。第二实施例
图11中示出了本发明的第二个实施例的语音编码和解码系统,其构成形式包括设置-语音编码设备61的发射台62和设置-语音解码设备63的接收台并通过一无线信道65将它们彼此相连,并通过数字无线传输发射编码的语音信号。与第一实施例相类似,发射台6包含传声器1、一发射电路15和一发射天线11,而接收台64包含一接收天线20、一接收电路33和一扬声器30。当从语音编码设备61无信号输出时发射电路15停止其操作,从而可节省无线发射所需的能源。
首先,对发射地62的语音编码设备61的结构参考图12进行描述。
语音编码设备61与图6中所示第一实施例的语音编码装置51的区别在于除了用另一个高效编码部分13来代替高效编码部分7外还包括一间歇周期频谱系数量化部分12。在图12中,与图6中所示的同一标号表示的那些元件与图6中所示的功能块相同。
当在间歇周期内要产生一背景噪声替代信号时,间歇周期频谱系数量化部分12将非量化频谱系数和由频谱包络分析部分2计算出的非量经频谱包络分别转换为量化频谱系数和频谱包络,并包括在间歇周期内将非量化频谱最佳量化的编码簿。在下面的描述中,由间歇周期频谱系数量化部分12计算出的量化频谱系数和量化频谱包络分别称为“间歇周期量化频谱系数”和“间歇周期量化频谱包络”。
在上面描述的第一实施例中,当要产生背景噪声替代信号时,被频谱包络比较部分4所输入和比较的是由频谱包络分析部分2计算出的非量化频谱包络和由频谱系数量化部分6计算出的量化频谱包络,同样被频谱包络可变部分5所改变的是由频谱系数量化部分6计算出的量化频谱包络。然而,在本发明第二实施例中,频谱包络比较部分4将由频谱包络分析部分2计算出的非量化频谱包络和由间歇周期频谱系数量化部分12计算出的间歇周期量化频谱包络进行比较,且同样由频谱包络可变部分5来对间歇周期量化频谱包络进行改变。
此外,在频谱系数量化部分6具有用于语音数据组周期的非量化频谱包络最优量化的一编码簿的同时,暂停时频谱系数量化部分12还具有另一用于如2所述的间歇周期内的非量化频谱包络最优量化的编码簿。这里,包含在间歇周期频谱系数量化部分12内的编码簿比频谱系数量化部分6的编码簿小。这是由于在间歇周期内,量化频谱系数被频谱包络改变部分5进一步改变以便接近一非量化频谱包络,对该编码簿来说不需使用大尺寸的编码簿。
在语音数据组周期内,高效编码部分13根据从传声器1输入的原始语音信号、由频谱包络分析部分2产生的非量化频谱系数和由频谱系数量化部分6产生的量化频谱系数与第一实施例的高效编码部分7类似的产生一高效码,高效码和与量化频谱系数相对应的码字的组合被作为语音猝发码信号输出。另一方面,在间歇周期内,间歇周期频谱高效编码部分13使用从传声器1输入的原始语音信号、由频谱包络分析部分2产生的非量化频谱系数和由频谱包络可变部分5产生的一改变量化频谱系数来产生一高效编码,并将由间歇周期频谱系数量化部分12计算出的间歇周期量化频谱系数的码字和由频谱包络改变部分5获得的频谱改变信息的码字合并入该高效编码以产生一背景噪声替代信号,然后将背景噪声替代码输出。
下面参考图13对语音解码设备63的结构进行描述。语音解码设备63除了包含图7中所示第一个实施例中的语音解码装置58的组件外还包含一间歇周期量化频谱系数计算部分31和间歇周期量化频谱存储部分32,但不包含量化频谱系数计算部分25。在图13中,与图7中所示标号相同的元件的功能也与其一样。
间歇周期量化频谱存储部分32为一存储器,其用于接收特定字检测部分23的检测结果和一接收信号,并在其内存储在产生背景噪声的过程中将被使用的间歇周期量化频谱系数的码字。间歇周期量化频谱系数计算部分31接收存储在间歇周期量化频谱存储部分32中的码字并计算出间歇周期量化频谱系数。尤其是,与由在编码设备中提供的间歇周期频谱系数数量化部分12计算出的量化频谱系数一样的量化频谱系数也是由间歇周期量化频谱系数计算部分31计算出的。从间歇周期量化频谱系数计算部分31输出的间歇周期量化频谱系数被输入到改改变频谱系数计算部分26。与频谱改变信息存储部分27和背景噪声参数存储部分24相类似,当接收到一背景噪声替代信号时,存储在间歇周期量化频谱存储部分32中的数据根据接收信号的内容被替代。
下面参考图14对在本发明第二实施例的语音编码和解码系统进行描述。
首先,参考图14对发射台62的语音编码设备61的处理过程进行描述。
与第一实施例相类似,在步骤151中,由频谱包络分析部分2计算原始语音信号的非量化频谱包络和非量化频谱系数。然后非量化频谱系数被输入到频谱系数量化部分6,并通过它在步骤152计算量化频谱包络、量化频谱系数和与量化频谱系数对应的码字。
此外,在步骤153中,语音数据组周期检测部分3分析被输入的原始语音信号并判别当时帧是否为一语音数据组周期或一间歇周期。如果识别出当时帧为一语音数据组周期,控制顺序进到步骤154并完成高效编码。在步骤159中,交由高效编码部分13获得的高效编码作为语音编码设备61的输出从数据切换部分10发出并从发射天线11发射。
另一方面,当在步骤153中判定出当时帧为一间歇周期时的处理过程序描述如下。首先,由频谱包络分析部分2计算出的非量化频谱系数被输入到间歇周期频谱系数量化部分12。在步骤155中,间歇周期频谱系数量化部分12使用暂停编码簿从输入的非量化频谱系数来确定一间歇周期量化频谱系数和一间歇周期量化频谱包络。然后,在步骤156中,频谱包络比较部分4将由频谱包络分析部分2计算出的非量化频谱包络与由间歇周期频谱系数量化部分12计算出的间歇周期量化频谱包络彼此进行比较以判定它们间的差别是否很大。如果判定差别很大,则在步骤157中,频谱包络改变部分5来计算通过改变间歇周期量化频谱系数获得的一改变的量化频谱系数,以便接近一非量化频谱包络。此后,在步骤154中,当在步骤156中判定频谱包络间的差别很大时,使用改变量化频谱系数,但当差别小时,使用间歇周期量化频谱系数,通过高效编码部分13来完成高效编码。此高效编码、量化频谱系数的码字和频谱改变信息被一同作为背景噪声替代信号输出。
此外,当在步骤153中判定当时帧为一间歇周期时,在步骤158中,以与上面描述的步骤156和157基本同步平行关系,由前置产生部分8产生一前置信号并由后置产生部分9产生一后置信号,且前置信号和后置信号被输入到数据工换部分10。然后,同样也是在间歇周期内,在步骤159中,在当时帧将被输出的信号被数据切换部分10选择。尤其是,(1)在背景噪声替代码将被发出的帧内,选择由高效编码部分13所产生的背景噪声替代信号,而(2)在前置信号将被发出的帧内,选择由前置产生部分8产生的前置信号,而在(3)后置信号将被发射的帧内,选择由后置产生部分9产生的后置信号。
下面参考图15来对接收台64的语音解码设备63的处理过程进行描述。
在步骤171中,接收信号被输入到特定字检测部分23,通过它来判别当时帧是否为一语音数据组周期或一间歇周期。如果当时帧为一语音数据组周期,则在步骤172中所接收的高效编码被高效语音解码部分22解码,在步骤183中,由开关21来选择被解码的声音并从扬声器30输出。
另一方面,如果在步骤171中,判定当时帧为一间歇周期,然后在步骤173中通过特定字检测部分23来判别所接收的信号是否为一特定字。这里,如果所接收的信号不是一特定了,则在步骤174中判别所接收到的信号是否为一背景噪声替代信号(用于背景噪声替代的数据)。当在步骤173中判定所接收的信号为一特定字或在步骤174中判定所接收的信号不是背景噪声替代数据时,控制顺序进到步骤178。如果在步骤174中判定所接收的信号为一背景噪声替代信号,则存储在背景噪声参数存储部分24中的背景噪声参数在步骤175中用背景噪声参数、频谱改变信息和从新接收的背景噪声替代信号中获得的间歇周期量化频谱来更新。然后,在步骤176中,存储在频谱改变信息存储部分27内的频谱改变信息被更新,及在步骤177中,存储在间歇周期量化频谱存储部分32内的码字被更新,此后,控制顺序进到步骤178。
在步骤178中,间歇周期量化频谱系数计算部分31使用存储在间歇周期量化频谱存储部分32内的数据(间歇周期量化频谱系数码字)来计算间歇周期量化频谱系数。被计算出的间歇周期量化频谱系数连同存储在频谱改变信息存储部分27内的频谱改变信息一起被输入到改改变频谱系数计算部分26。在步骤179中,改改变频谱系数计算部分6根据频谱改变信息来判定间歇周期量化频谱系数是否应该被替代。如果有必要替代间歇周期量化频谱系数,则在步骤180中根据频谱改变信息来改变间歇周期量化频谱系数并计算出变化的量化频谱系数。
然后,在步骤181中,由随机残留信号产生部分28来产生一随机残留信号。在随机残留信号产生后,存储在背景噪声参数存储部分24内的背景噪声参数、由可改变频谱系数计算部分26计算出的可变量化频谱系数、或由间歇周期量化频谱系数计算部分31计算出的间歇周期量化频谱系数、及前面提到的随机残留信号被一起输入到背景噪声合成部分29,通过它在步骤182中产生背景噪声。这里,当在步骤180中量化频谱被改变时,则使用改变的量化频谱系数,并且当在步骤179中判定量化频谱应该被改变时,将使用间歇周期量化频谱系数。在间歇周期内,由于在步骤183中由开关21来选择背景噪声,背景噪声从扬声器30输出。
如上所述,在本发明中,通过在间歇周期内对量化频谱系数进行滤波处理从而使量化频谱包络接近非量化频谱包络,在间歇周期内的声音质量也能得到提高,而不用象在语音数据组周期内那样,使用一个大的编码簿来计算量化频谱系数。此外同样由于通过在间歇周期使用小尺寸的编码簿计算量化频谱系数以及滤波处理过程,从而在间歇周期内在不使用大尺寸编码簿的情况下来使声音质量得到提高。
必须明确,虽然在前面的描述中已对本发明特征及优点进行了阐述,但仅为描述性的揭示,在所附权利要求的范围内可进行各种形式的改变。
Claims (6)
1.一种语音信号传输方法,其中,在发射方,输入的语音信号被编码并作为编码的数据向接收方发射,而在接收方,被编码的数据被解码并作为输出语音信号输出,包含步骤:
在发射方检测一输入语音信号的间歇周期,
在发射方通过将在间歇周期内的输入语音信号编码来产生一背景噪声替代信号,
在发射方,在间歇周期内从输入语音信号计算量化频谱、非量化频谱包络和量化频谱包络,
在背景噪声替代信号被从发射方向接收方发射后,发射方在一预定期间停止发射,及
接收方在预定期内,根据所接收的背景噪声替代信号来产生背景噪声并将其作为输出语音信号输出,其中
当非量化频谱包络和量化频谱包络间的差别比预定的门限值大时,量化频谱被改变且根据变化的量化频谱来产生背景噪声替代信号。
2.根据权利要求1所述的语音信号传输方法,其特征在于其中在语音数据组周期内的输入语音信号通过使用第一编码簿被编码,且在间歇周期内,输入语音信号通过使用不同于所述第一编码簿的第二编码簿被编码。
3.一种语音编码和解码系统,其执行产生背景噪声的VOX(音控发射器)处理过程,它包括:
一语音编码设备,及
一语音解码设备,
所述语音编码装置包括用于定量计算所述编码设备的一输入信号的非量化频谱包络和量化频谱包络之间差别的频谱包络比较装置,及用于与该差别相对应的改变量化频谱包络的频谱包络改变装置,并使用被所述频谱包络改变装置改变的量化频谱包络以便进行背景噪声编码处理,然后根据量化频谱包络的变化向所述语音解码装置发射频谱改变信息,及
所述语音解码装置包括用于存储所接收到的频谱改变信息的频谱改变信息存储装置及用于根据存储在所述频谱改变信息存储装置内的频谱改变信息改变接收的量化频谱包络的改变频谱系数计算装置,并为了产生背景噪声,使用从所述改变频谱系数计算装置输出的量化频谱。
4.根据权利要求3所述的语音编码和解码系统,其特征在于其中所述语音编码装置还包括一第一编码簿、一内容与所述第一编码簿不同的第二编码簿、用于将在语音数据组周期内的输入信号通过使用所述第一编码簿使其量化的第一频谱系数量化装置、及在所述间歇周期内使用所述第二编码簿使输入信号量化的第二频谱系数量化装置。
5.根据权利要求3所述的语音编码和解码系统,其特征在于其中所述频谱包络改变装置通过滤波处理过程改变量化的频谱包络。
6.根据权利要求4所述的语音编码和解码系统,其特征在于其中所述频谱包络改变装置通过滤波处理过程改变量化的频谱包络。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP191944/1996 | 1996-07-22 | ||
JP19194496A JP3259759B2 (ja) | 1996-07-22 | 1996-07-22 | 音声信号伝送方法及び音声符号復号化システム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1174457A true CN1174457A (zh) | 1998-02-25 |
Family
ID=16283064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97115023.0A Pending CN1174457A (zh) | 1996-07-22 | 1997-07-22 | 语音信号传输方法及语音编码和解码系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5953698A (zh) |
JP (1) | JP3259759B2 (zh) |
CN (1) | CN1174457A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1310526C (zh) * | 2000-12-23 | 2007-04-11 | Lg-北电株式会社 | 无线本地回路系统中的主叫方标识发射机及其发射方法 |
CN101662288B (zh) * | 2008-08-28 | 2012-07-04 | 华为技术有限公司 | 音频编码、解码方法及装置、系统 |
CN112820305A (zh) * | 2014-05-01 | 2021-05-18 | 日本电信电话株式会社 | 编码装置、编码方法、编码程序、记录介质 |
US11646044B2 (en) * | 2018-03-09 | 2023-05-09 | Yamaha Corporation | Sound processing method, sound processing apparatus, and recording medium |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
WO2000034944A1 (fr) * | 1998-12-07 | 2000-06-15 | Mitsubishi Denki Kabushiki Kaisha | Decodeur sonore et procede de decodage sonore |
WO2000046789A1 (fr) * | 1999-02-05 | 2000-08-10 | Fujitsu Limited | Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son |
JP3451998B2 (ja) | 1999-05-31 | 2003-09-29 | 日本電気株式会社 | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 |
JP4464484B2 (ja) * | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6708147B2 (en) * | 2001-02-28 | 2004-03-16 | Telefonaktiebolaget Lm Ericsson(Publ) | Method and apparatus for providing comfort noise in communication system with discontinuous transmission |
US7941313B2 (en) | 2001-05-17 | 2011-05-10 | Qualcomm Incorporated | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system |
US7203643B2 (en) | 2001-06-14 | 2007-04-10 | Qualcomm Incorporated | Method and apparatus for transmitting speech activity in distributed voice recognition systems |
US7486719B2 (en) * | 2002-10-31 | 2009-02-03 | Nec Corporation | Transcoder and code conversion method |
US6960002B2 (en) * | 2004-01-12 | 2005-11-01 | Au Optronics Corp. | Direct backlight module |
ES2634511T3 (es) | 2004-07-23 | 2017-09-28 | Iii Holdings 12, Llc | Aparato de codificación de audio y procedimiento de codificación de audio |
TWI393120B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式 |
EP2346032B1 (en) * | 2008-10-24 | 2014-05-07 | Mitsubishi Electric Corporation | Noise suppressor and voice decoder |
ES2534972T3 (es) | 2011-02-14 | 2015-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Predicción lineal basada en esquema de codificación utilizando conformación de ruido de dominio espectral |
CN102959620B (zh) | 2011-02-14 | 2015-05-13 | 弗兰霍菲尔运输应用研究公司 | 利用重迭变换的信息信号表示 |
AU2012217153B2 (en) | 2011-02-14 | 2015-07-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
PL3471092T3 (pl) | 2011-02-14 | 2020-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekodowanie pozycji impulsów ścieżek sygnału audio |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
SG192746A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for processing a decoded audio signal in a spectral domain |
CA2827000C (en) | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
CN103534754B (zh) * | 2011-02-14 | 2015-09-30 | 弗兰霍菲尔运输应用研究公司 | 在不活动阶段期间利用噪声合成的音频编解码器 |
JP2016010893A (ja) * | 2014-06-27 | 2016-01-21 | 大日本印刷株式会社 | プリンタ装置、その制御方法及び印画物の製造方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5042069A (en) * | 1989-04-18 | 1991-08-20 | Pacific Communications Sciences, Inc. | Methods and apparatus for reconstructing non-quantized adaptively transformed voice signals |
JP3167385B2 (ja) * | 1991-10-28 | 2001-05-21 | 日本電信電話株式会社 | 音声信号伝送方法 |
EP0577488B9 (en) * | 1992-06-29 | 2007-10-03 | Nippon Telegraph And Telephone Corporation | Speech coding method and apparatus for the same |
US5774846A (en) * | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
JP2728122B2 (ja) * | 1995-05-23 | 1998-03-18 | 日本電気株式会社 | 無音圧縮音声符号化復号化装置 |
JP2806308B2 (ja) * | 1995-06-30 | 1998-09-30 | 日本電気株式会社 | 音声復号化装置 |
US5802109A (en) * | 1996-03-28 | 1998-09-01 | Nec Corporation | Speech encoding communication system |
-
1996
- 1996-07-22 JP JP19194496A patent/JP3259759B2/ja not_active Expired - Fee Related
-
1997
- 1997-07-21 US US08/897,514 patent/US5953698A/en not_active Expired - Fee Related
- 1997-07-22 CN CN97115023.0A patent/CN1174457A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1310526C (zh) * | 2000-12-23 | 2007-04-11 | Lg-北电株式会社 | 无线本地回路系统中的主叫方标识发射机及其发射方法 |
CN101662288B (zh) * | 2008-08-28 | 2012-07-04 | 华为技术有限公司 | 音频编码、解码方法及装置、系统 |
CN112820305A (zh) * | 2014-05-01 | 2021-05-18 | 日本电信电话株式会社 | 编码装置、编码方法、编码程序、记录介质 |
CN112820305B (zh) * | 2014-05-01 | 2023-12-15 | 日本电信电话株式会社 | 编码装置、编码方法、编码程序、记录介质 |
US11646044B2 (en) * | 2018-03-09 | 2023-05-09 | Yamaha Corporation | Sound processing method, sound processing apparatus, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP3259759B2 (ja) | 2002-02-25 |
US5953698A (en) | 1999-09-14 |
JPH1039898A (ja) | 1998-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1174457A (zh) | 语音信号传输方法及语音编码和解码系统 | |
CN1264138C (zh) | 复制语音信号、解码语音、合成语音的方法和装置 | |
CN1104710C (zh) | 在语音数字传输系统中产生悦耳噪声的方法与装置 | |
CN1199151C (zh) | 语音编码器 | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN1969319A (zh) | 信号编码 | |
CN1158648C (zh) | 语音可变速率编码方法与设备 | |
CN1302459C (zh) | 用于编码和解码非话音语音的方法和设备 | |
US7613606B2 (en) | Speech codecs | |
CN1212606C (zh) | 处理丢失帧的语音通信系统及方法 | |
CN1202514C (zh) | 编码和解码语音及其参数的方法、编码器、解码器 | |
CN1172292C (zh) | 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备 | |
CN1241170C (zh) | 语音编解码器中用于线频谱频率矢量量化的方法和系统 | |
CN1468427A (zh) | 一种码激励线性预测语音编码器的增益量化 | |
CN1154283C (zh) | 编码方法和装置以及解码方法和装置 | |
CN1167048C (zh) | 语音编码设备和语音解码设备 | |
CN1265217A (zh) | 在语音通信系统中语音增强的方法和装置 | |
CN1692408A (zh) | 码分多址无线系统的可变比特率宽带语音编码中的有效带内半空白-突发序列信令及半速率最大操作的方法和装置 | |
CN1159691A (zh) | 用于声频信号线性预测分析的方法 | |
CN1795495A (zh) | 音频编码设备、音频解码设备、音频编码方法和音频解码方法 | |
CN1161750C (zh) | 语音编码译码方法和装置、电话装置、音调变换方法和介质 | |
CN1156872A (zh) | 语音编码的方法和装置 | |
CN1200000A (zh) | 在不连续传输期间产生安慰噪声的改进方法 | |
CN1151491C (zh) | 音频编码装置和音频编码译码装置 | |
CN1210685C (zh) | 语音编码中噪音鲁棒分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication |