CN1200173A - 使用可变速率后向搜寻内插处理的甚低(very low)位速率语音消息传输系统 - Google Patents
使用可变速率后向搜寻内插处理的甚低(very low)位速率语音消息传输系统 Download PDFInfo
- Publication number
- CN1200173A CN1200173A CN96196955A CN96196955A CN1200173A CN 1200173 A CN1200173 A CN 1200173A CN 96196955 A CN96196955 A CN 96196955A CN 96196955 A CN96196955 A CN 96196955A CN 1200173 A CN1200173 A CN 1200173A
- Authority
- CN
- China
- Prior art keywords
- voice
- speech
- spectrum parameter
- parameter vector
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title description 39
- 239000013598 vector Substances 0.000 claims abstract description 141
- 238000000034 method Methods 0.000 claims abstract description 67
- 230000005540 biological transmission Effects 0.000 claims abstract description 27
- 239000011159 matrix material Substances 0.000 claims abstract description 11
- 238000001228 spectrum Methods 0.000 claims description 150
- 238000004891 communication Methods 0.000 claims description 38
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 34
- 238000007906 compression Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 19
- 230000006835 compression Effects 0.000 description 14
- 238000004088 simulation Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000006837 decompression Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000008676 import Effects 0.000 description 4
- 238000012905 input function Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000411 transmission spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供低位速率话音传输的装置和方法,根据语音消息产生话音频谱参数向量并存储在话音频谱参数矩阵(602)中的一个序列内。发送一个第一索引,该索引标识一个对应于话音频谱参数向量序列中的一个第一话音频谱参数向量(604)的第一话音参数模板(614)。选择序列中的一个后续话音频谱参数向量(608)并且确定具有一个后续索引的一个后续话音参数模板。一或多个交错内插话音参数模板(620)被内插在第一话音参数模板(614)和后续话音参数模板(618)之间。把一或多个交错话音频谱参数向量(606)和对应的一或多个交错内插话音参数模板(620)相互比较以导出一个距离。当导出的距离小于或等于一个预定距离时发送后续索引。
Description
本发明涉及通信系统,更具体地讲,是涉及压缩语音数字通信系统,该系统利用可变速率后向搜寻内插处理来提供甚低的数据传输速率。
诸如寻呼系统的通信系统在过去不得不在消息长度,用户数和用户方便性之间进行折衷,以便有效地运作该系统。对用户数和消息长度加以限制以避免信道的过度拥挤,并且避免出现长的传输时间延迟。用户方便性直接受到信道容量,信道上的用户数,系统功能和消息传输类型的影响。在一个寻呼系统中,简单地提醒用户拨打预定电话号码的单音寻呼机提供了最高的信道容量,但对用户有些不方便。常规模拟语音寻呼机允许用户接收更详细的消息,但受到给定信道上用户数的极大限制。作为实时设备的模拟语音寻呼机还有不为用户提供存储和重复播放所接收消息的途径的缺点。具有数码字符显示器和存储器的数字寻呼机的出现克服了老式寻呼机的许多问题。这些数字寻呼机提高了寻呼信道的消息处理容量,并且为用户提供了存储消息以便以后浏览的途径。
尽管具有数码和字符显示器的数字寻呼机具有许多优点,但有些用户仍然喜欢具有语音播放功能的寻呼机。为了在容量有限的数字信道上提供这种服务,已经尝试过各种数字语音压缩技术和合成技术,这些技术均具有各自的成功和局限之处。双向无线通信使用的标准数字语音压缩方法也不能提供寻呼信道上需要的压缩度。提供高压缩比的其它技术倾向于把话音加以畸变,尤其是在快速变化的话音段内。使用本领域内的当前技术加以数字编码的语音消息会独占大部分信道容量或不可接受地畸变话音,使得系统无法取得商业成功。
相应地,对通信系统中的信道,如寻呼系统中的寻呼信道的利用的优化需要一个装置,该装置以这样的方式对语音消息进行数字编码,使得所得到的数据是经过高度压缩的,同时保持可以接受的话音质量,并且该数据能够方便地与通过通信信道发送的普通数据混合。另外还需要一个通信系统,该系统以这样的方式对语音消息进行数字编码,使得在诸如寻呼机的通信接收设备中的处理被最小化。
概括地,根据本发明的第一方面,提供了一种提供低位速率话音传输的方法。根据一个语音消息产生的话音频谱参数向量被存储在话音参数矩阵中的一个序列内,并且发送一个索引,该索引标识对应于序列中一个所选话音频谱参数向量的一个话音参数模板。该方法包括的步骤有:选择序列中的后续话音频谱参数向量以便建立一或多个针对所选话音频谱参数向量的交错(intervening)话音频谱参数向量;确定一个后续索引,该索引标识对应于序列中的后续话音频谱参数向量的一个后续话音频谱参数模板;在话音参数模板和后续话音参数模板之间进行内插以便导出一或多个交错内插话音参数模板;比较对应于一或多个交错内插话音参数模板的一或多个交错话音参数模板以便导出一个距离;并且在导出的距离小于或等于预定距离时发送后续的索引。
根据本发明的第二方面,一个语音压缩处理器对语音消息进行处理以便提供低位速率的话音传输。语音压缩处理器包括一个存储器,一个输入话音处理器,一个信号处理器和一个发送器。存储器存储话音参数模板和标识话音参数模板的索引。输入话音处理器处理语音消息以产生被存储在上述存储器中的话音频谱参数向量。对信号处理器进行编程,从而根据存储在存储器中的话音频谱参数向量选择一个话音频谱参数,确定标识出对应于所选择的话音频谱参数向量的一个话音参数模板的索引,根据存储在存储器中的话音频谱参数向量选择一个后续话音频谱参数向量,其中后续话音频谱参数向量针对所选择的话音频谱参数向量建立一或多个交错话音频谱参数向量,确定标识出对应于后续话音频谱参数向量的一个后续话音参数模板的后续索引,在话音参数模板和后续话音参数模板之间进行内插以便导出一或多个交错内插话音参数模板,并且比较对应于一或多个交错内插话音参数模板的一或多个交错话音参数模板以便导出一个距离。发送器负责为信号处理器发送索引,并且在所导出的距离小于或等于一个预定距离时发送后续索引。
根据本发明的第三方面,一个处理低位速率话音传输以提供语音消息的方法包括的步骤有:接收一个索引,至少一个后续索引和一个指示交错话音频谱参数向量数量的数值;从一组预定话音参数模板中选择对应于上述索引的一个话音参数模板和对应于上述至少一个后续索引的至少一个后续话音参数模板;在所选的话音参数模板和上述至少一个后续话音参数模板之间进行内插以导出一批对应于交错话音频谱参数向量的数量的交错话音参数模板;根据选择的话音参数模板,后续话音参数模板和交错话音参数模板合成话音数据;并且根据合成的话音数据产生出语音消息。
根据本发明的第四方面,一个通信设备接收低位速率话音传输以提供语音消息。该通信设备包括一个存储器,一个接收器,一个信号处理器,一个合成器和一个转换器。存储器存储一组话音参数模板。接收器接收一个索引,至少一个后续索引和一个指示交错话音频谱参数向量数量的数值。对信号处理器进行编程,从而根据预定话音参数模板组选择对应于上述索引的一个话音参数模板和对应于上述至少一个后续索引的至少一个后续话音参数模板,并且在话音参数模板和至少一个后续话音参数模板之间进行内插以导出一批对应于交错话音频谱参数向量的数量的交错话音参数模板。合成器根据话音参数模板,后续话音参数模板和交错话音参数模板合成话音数据。转换器根据合成的话音数据产生出语音消息。
图1是使用基于本发明的可变速率后向搜寻内插处理的通信系统的模块图。
图2是使用基于本发明的可变速率后向搜寻内插处理的一个寻呼终端和一个相关的寻呼发送器的电子模块图。
图3是说明图2的寻呼终端的操作的流图。
图4是说明在图2的寻呼终端中使用的数字信号处理器的操作的流图。
图5是说明在图4的数字信号处理器中使用的可变速率后向搜寻内插处理的流图。
图6是说明在图4的数字信号处理器中使用的一部分数字语音压缩处理的图例。
图7是在图2的寻呼终端中使用的数字信号处理器的电子模块图。
图8是使用基于本发明的数字语音压缩处理的接收器的电子模块图。
图9是说明图8的接收器的操作的流图。
图10是说明在图8的接收器中使用的可变速率内插处理的流图。
图11是在图8的寻呼接收器中使用的数字信号处理器的电子模块图。
图1说明了诸如寻呼系统的,使用基于本发明的可变速率后向搜寻内插处理进行甚低位速率话音传输的通信系统的模块图。如下所述,寻呼终端106分析话音数据并产生表示话音数据的激励数据和频谱参数。寻呼终端106产生码表索引,该码表索引对应于表示分段初始语音消息的频谱信息的线性预测编码(LPC)模板。接着,通过只发送一个话音参数模板的索引和一个指示通过内插产生的话音参数模板数量的数值,寻呼终端106减少了必须发送以便传输频谱信息的数据的数量。本发明使用一种连续调整通过内插产生的话音参数模板的数量的可变速率内插处理过程。如下所述,对通过内插产生的话音参数模板的数量进行连续调整使得能够减少在快速变化的话音段内被插入的话音参数模板的数量,并且能够增加在慢速变化的话音段内通过内插产生的话音参数模板的数量,同时在一个甚低位速率上保持低畸变话音传输。
数字语音压缩处理适应于寻呼和其它非实时通信系统的非实时特性,其中上述系统提供了在很长的语音段上进行计算量很大的处理所需的时间。在非实时通信过程中有足够的时间接收并处理整个语音消息。在寻呼系统中可以忍受多达两分钟的延迟,而在实时通信系统中两秒的延迟已经不可接受。这里所描述的数字语音压缩处理的非对称特性使需要在诸如寻呼机的便携通信设备114中进行的处理最小化,使得该处理过程对于寻呼应用和其它类似的非实时语音通信而言是理想的。如下所述,数字语音压缩处理中需要大量计算的部分在系统的非移动部分中进行,因而在系统的便携部分中只需要进行少量的计算。
通过举例的方式,一个寻呼系统被用来描述本发明,尽管可以理解任何非实时通信系统均可以因本发明而受益。一个寻呼系统被设计用来向需要不同服务的众多用户提供服务。某些用户需要数码消息传输服务,其它用户需要字符—数码消息传输服务,还有一些用户需要语音消息传输服务。在一个寻呼系统中,主叫主使用电话机102通过公共交换电话网(PSTN)104与寻呼终端106通信,从而产生一个寻呼。寻呼终端106提示主叫方输入接收方的标识和要发送的消息。当收到所需的信息时,寻呼终端106返回指示寻呼终端106已经接收到消息的提示信息。寻呼终端106对消息进行编码并且把经过编码的消息放到一个发送队列中。在一个合适的时间使用发送器108和发送天线110发送该消息。可以理解在一个多点同时广播发送系统中,可以使用覆盖不同地理区域的多个发送器。
从发送天线110发送的信号被一个接收天线112截获,并且被如图1中一个寻呼接收器所示的通信设备114加以处理。被寻呼的人得到提醒并且根据所使用的消息传输类型把消息显示或播放出来。
图2说明了使用基于本发明的数字语音压缩处理的寻呼终端106和发送器108的电子模块图。寻呼终端106是一种被用来为大量的同时通信用户,比如一个商用无线公用载波(RCC)系统中的用户服务的设备。寻呼终端106使用一些由控制器216控制的输入设备,信号处理设备和输出设备。控制器216和构成寻呼终端106的各种设备之间的通信由数字控制总线210完成。数字化语音和数据的传输由一个输入时分多路复用公用通路212和一个输出时分多路复用公用通路218来完成。可以理解数字控制总线210,输入时分多路复用公用通路212和输出时分多路复用公用通路218可以被加以扩展,以便为寻呼终端106提供扩充。
一个输入话音处理器205提供PSTN 104和寻呼终端106之间的接口。PSTN连接可以是多个如图2的数字PSTN连接202所示的单线多呼叫多路复用数字连接,也可以是多个单线单呼叫模拟连接208。
一个数字电话接口204为各个数字PSTN连接202提供服务。数字电话接口204提供进行基于本发明的数字语音压缩处理操作所必需的信号波形加工,同步,多路分解,信令,监控和稳压保护。数字电话接口204也可以提供对数字化语音帧的临时存储,从而允许进行接入输入时分多路复用公用通路212所必需的时隙互换和时隙对正。如下所述,由控制器216来控制请求服务和监控响应。通过数字控制总线210进行数字电话接口204和控制器216之间的通信。
各个模拟PSTN接口208均由一个模拟电话接口206提供服务。模拟电话接口206提供进行基于本发明的数字语音压缩处理操作所必需的信号波形加工,信令,监控,模数与数模转换,和稳压保护。来自模数转换器207的数字化语音消息帧被临时存储在模拟电话接口206中,从而允许进行接入输入时分多路复用公用通路212所必需的时隙互换和时隙对正。如下所述,由控制器216来控制请求服务和监控响应。通过数字控制总线210进行模拟电话接口206和控制器216之间的通信。
当检测到一个输入呼叫时,一个服务请求被从模拟电话接口206或数字电话接口204发送到控制器216。控制器216从多个数字信号处理器中选择出一个数字信号处理器214。控制器216通过输入时分多路复用公用通路212把请求服务的模拟电话接口206或数字电话接口204连接到选出的数字信号处理器214。
数字信号处理器214可以被编程以实现完成寻呼过程所需的所有信号处理功能。数字信号处理器214所实现的常见信号处理功能包含基于本发明的数字语音压缩,双音多频(DTMF)解码和生成,调制解调器音频生成和解码,和预录制的语音提示信号的生成。数字信号处理器214可以被编程以完成上述功能中的一种或多种功能。在数字信号处理器214被编程实现多于一个的任务的情况下,控制器216在选择出数字信号处理器214时指定需要完成的特定任务,或者在数字信号处理器214被编程只完成单独一个任务的情况下,控制器216选择一个被编程实现特定功能的数字信号处理器214,其中完成寻呼过程中的下一步骤需要这个特定功能。数字信号处理器214进行双音多频(DTMF)解码和生成,调制解调器音频生成和解码,和预录制的语音提示信号的生成的操作对于本领域的普通技术人员是众所周知的。下面详细描述基于本发明的甚低位速率可变速率后向搜寻内插处理功能。
在针对语音消息的情况下以下述方式对寻呼请求进行处理。被连接到一个模拟电话接口206或数字电话接口204的数字信号处理器214提示寻呼发起人提供一个语音消息。数字信号处理器214使用下述处理过程压缩所接收的语音消息。在控制器216的控制下,通过输出时分多路复用公用通路218把压缩处理过程所产生的压缩数字语音消息传递到一个寻呼协议编码器228。寻呼协议编码器228把数据编码成合适的寻呼协议数据。下面描述的这样一个协议是邮电委员会标准建议组(POCSAG)协议。应当理解也可以使用其它的协议。控制器216通过输出时分多路复用公用通路218控制寻呼协议编码器228把编码数据存储在一个数据存储设备226中。在适当的时间,编码数据在控制器216的控制下通过输出时分多路复用公用通路218被下载到发送器控制单元220,并且通过发送器108和发送天线110被发送出动。
在针对数码消息的情况下,除了由数字信号处理器214完成的处理过程之外,以类似于语音消息的方式对寻呼请求进行处理。数字信号处理器214提示寻呼发起人输入一个DTMF消息。数字信号处理器214对DTMF信号进行解码并产生一个数字消息。处理数字信号处理器214产生的数字消息的方式与语音消息的情况下处理数字信号处理器214产生的数字语音消息的方式相同。
除了由数字信号处理器214完成的处理过程之外,以类似于语音消息的方式对字符—数码寻呼进行处理。数字信号处理器214被编程以便解码和产生调制解调器音频信号。数字信号处理器214使用一种诸如寻呼入口终端(PETTM)协议的标准用户接口协议与寻呼发起人接口。应当理解也可以使用其它的协议。处理数字信号处理器214产生的数字消息的方式与语音消息的情况下处理数字信号处理器214产生的数字语音消息的方式相同。
图3是描述图2所示的寻呼终端106在处理一个语音消息时所进行的操作的流图。在流图300中示出了两个入口点。第一个入口点针对涉及数字PSTN连接202的处理过程,第二个入口点针对涉及模拟PSTN连接208的处理过程。在涉及数字PSTN连接202的情况下,过程从步骤302开始,通过数字PSTN连接202接收请求。来自数字PSTN连接202的服务请求由输入数据流中的一个位模式来指示。数字电话接口204接收服务请求并且把该请求传递到控制器216。
在步骤304,通过进行数字帧多路分解把从请求服务的数字信道接收的信息从输入数据流中分离出来。从数字PSTN连接202接收的数字信号通常包含多个被多路复用成一个输入数据流的数字信道。请求服务的数字信道被多路分解,并且数字化话音数据被临时存储,从而允许进行时隙对正并把数据多路复用到输入时分多路复用公用通路212上。控制器216指定输入时分多路复用公用通路212中用于传输数字化话音数据的时隙。反过来,数字信号处理器214产生的,发送到数字PSTN连接202的数字化话音数据被适当地加以格式化以便发送和多路复用到输出数据流上。
类似于模拟PSTN连接208,当从模拟PSTN线路接收到一个请求时过程从步骤306开始。在模拟PSTN连接208上,通过低频AC信号或DC信令对输入呼叫进行信号化处理。模拟电话接口206接收请求并且把请求传输到控制器216。
在步骤308,模拟语音消息被模数转换器207转换成数字数据流,该转换器充当产生语音消息的采样器和对语音消息样本进行数字化的数字转换器。在其整个时延上接收的模拟信号被称作模拟语音消息。模数转换器207对模拟信号进行采样以产生语音样本,并且对其进行数字转换以产生数字话音样本。模拟信号的样本被称作语音样本。数字化语音样本被称作数字话音数据。通过控制器216指定的时隙数字话音数据被多路复用到输入时分多路复用公用通路212上。反过来,在发送到模拟PSTN连接208之前,输入时分多路复用公用通路212上的从数字信号处理器214产生的任何语音数据均要经过数模转换处理。
如图3所示,当指定数字信号处理器处理输入呼叫时,针对模拟PSTN连接208或数字PSTN连接202的处理路径在步骤310会合。控制器216选择一个被编程实现数字语音压缩处理过程的数字信号处理器214。所指定的数字信号处理器214通过前面指定的时隙读取输入时分多路复用公用通路212上的数据。
数字信号处理器214读出的数据在步骤312被存储成非压缩话音数据以便进行处理。在步骤314处理所存储的非压缩话音数据,下面会详细地描述这种处理。在步骤316对从步骤314导出的压缩语音数据进行适当的编码以便通过一个寻呼信道进行发送。一种这样的编码方法是邮电委员会标准建议组(POCSAG)编码。可以理解还有许多其它合适的编码方法。在步骤318,编码数据被存储在一个寻呼队列中以便稍后进行发送。在合适的时间队列数据在步骤320被发送到发送器108,并且在步骤322被发送出动。
图4是详细说明基于本发明的,图3中的步骤314所示的语音压缩处理的流图。图4所示的步骤由充当语音压缩处理器的数字信号处理器214来实现。数字语音压缩处理过程分析话音数据分段以便利用话音段落之间可能存在的任何相关关系。本发明利用非实时应用的存储转发性质并且使用后向搜寻内插来提供可变的内插速率。后向搜寻内插方案利用了所有的段间相关关系,并且只发送那些快速变化的话音段的数据,同时在慢速变化的话音段或话音以线性方式变化的话音段内使用内插方法。在步骤404分析前面在数字信号处理器214中被存储成非压缩语音数据的数字化话音数据402,并且对增益进行校正。调整数字话音消息以便完全能够使用系统的动态范围并改进视在信噪性能。
在步骤406经过校正的非压缩话音数据被分成预定数量的,通常表示25毫秒话音数据的数字化话音样本。划分出表示短的话音时段的话音样本在这里被称作产生话音帧。在步骤408,在短话音时段上进行话音分析以便产生话音参数。已知有许多不同的话音分析处理方法。本领域的普通技术人员显然会知道那种话音分析方法最能满足要设计的系统的需求。话音分析处理过程分析短话音时段并且以本领域中所了解的方式计算出一些参数。这里描述的数字语音压缩处理过程最好是计算出13个参数。前三个参数对话音段中的总能量,特征音调值(pitch value)和声化(voicing)信息进行量化。其余10个参数被称作频谱参数并且基本上表示了一个数字滤波器的系数。用于产生10个频谱参数的话音分析过程通常是一个线性预测编码(LPC)过程。表示短话音时段的频谱内容的LPC参数在这里被称作LPC话音频谱参数向量和话音频谱参数向量。数字信号处理器214充当一个划分数字化话音样本的组帧器。
在步骤410,在步骤408计算出的10个话音频谱参数在一个话音频谱参数矩阵或一个参数栈中被堆叠到一个按时间排序的序列中,其中参数栈包含一个话音频谱参数向量序列。10个话音频谱参数占据了话音频谱参数矩阵中的一行并且被称作一个话音频谱参数向量。数字信号处理器214充当一个产生话音频谱参数向量的输入话音处理器,同时还按时间顺序存储话音频谱参数向量。在步骤412,根据本发明的最优实施例,在话音频谱参数矩阵上进行向量量化和后向搜寻内插,从而产生包含索引和内插长度420。下面参照图5描述向量量化和后向搜寻内插处理过程。
图5是详细说明在图4的步骤410由数字信号处理器214进行的,基于本发明最优实施例的向量量化和后向搜寻内插处理的流图。在下面的描述中,符号Xj表示在步骤408计算出来并且存储在话音频谱参数矩阵中的位置j上的一个话音频谱参数向量。符号Yj表示来自一个码表的,具有索引ij并且最佳表示对应的话音频谱参数Xj的一个话音参数模板。如下所述,通过只发送一个话音频谱参数模板的索引和一个指示通过内插产生的话音参数模板数量的数值n,寻呼终端106减少了必须发送的数据的数量。数值n表明内插要产生了n-1个话音参数模板。例如,当n=8时,后续话音频谱参数向量Xj+n,其中n=8,被量化。话音频谱参数向量Xj+n,其中n=0,的索引已经当作前面的内插组的端点被发送出去。7个对应于Xj+n,其中n=1至7,的交错话音参数模板被内插到话音参数模板Yj+n,其中n=0,和对应于一个后续索引的所选后续话音参数模板Yj+n,其中n=8,之间。进行一次检测以确定交错内插话音参数模板是否精确表示了初始话音频谱参数向量。当内插话音参数模板精确表示初始话音频谱参数向量时,对Yj+n的索引和n进行缓冲以便发送。当内插话音参数模板不能精确表示初始话音频谱参数向量时,把n的值减1并且反复进行内插和检测,直到发现一个可以接受的n值或n的值被减成n=2,其中在n=2时停止内插过程并且缓冲实际的索引值以便进行发送。
只发送内插过程的端点的索引和内插所要产生的话音参数模板的数量。连续调整内插所要产生的话音参数模板的数量,使得在快速变化的话音段内内插产生较少的话音参数模板,而在普通话音段内内插会产生较多的话音参数模板,从而减少了需要发送的数据量。通信设备114具有两套话音参数模板并且产生内插话音参数模板,其中内插话音参数模板是寻呼终端106上产生的内插话音参数模板的复本。由于通信设备114通过内插要产生的话音参数模板在前面已经由寻呼终端106产生和检测,并且被发现精确地表示了初始话音频谱参数向量,所以通信设备14也可以精确地再现初始的语音消息。尤其是非实时通信系统有时间在发送之前进行计算密集的后向搜寻内插处理,尽管随着处理速度的增加,也可以进行准实时的处理。
处理过程从步骤502开始,其中变量n和j分别被初始化成0和1。变量n被用来指示内插所要产生的话音参数模板的数量,而j被用来指示所选中的在步骤410产生的话音频谱参数向量在话音频谱参数矩阵中所处的位置。在步骤504,所选择的话音频谱参数向量被加以量化。通过比较话音频谱参数向量和一组预定话音参数模板来进行量化。量化也被称作选择具有到达话音频谱参数向量的最短距离的话音参数模板。存储在数字信号处理器214中的预定模板组在这里被称作码表。下面将通过本发明的不同实施例说明可以提供表示不同的方言或语言的两个或更多的码表。例如针对一个具有一套话音参数模板的寻呼应用的码表会有2048个模板,但是应当理解也可以使用不同数量的模板。码表的预定模板均由一个索引来标识。向量量化功能把话音频谱参数向量与码表中的每个话音参数模板相互比较,并且计算出话音频谱参数向量和各个话音参数模板之间的加权距离。结果被存储在一个索引数组中,该数组包含索引和加权距离。加权距离在这里也被称作距离值。搜寻索引数组并且选择具有到达话音频谱参数向量X的最短距离的话音参数模板Y的索引i来表示话音频谱参数向量X的量化值。数字信号处理器214在完成话音分析器的功能时充当一个信号处理器,并且还充当一个量化话音频谱参数向量的量化器。
通常使用加权平方和方法来计算一个话音频谱参数向量和一个话音参数模板之间的距离。通过从话音频谱参数向量中对应参数的值中减去一个给定话音参数模板中的一个参数的值,计算所得值的平方并且把平方结果与一个预定加权数组中的一个对应加权值相乘来计算出这个距离。针对话音频谱参数向量中的每个参数和话音参数模板中的对应参数重复进行这种计算。这些计算结果的累加和便是话音参数模板和话音频谱参数向量之间的距离。通过侦听检测以试验的方式确定预定加权数组的参数的值。
上述距离计算可以被说明成下面的方程:
其中:
di等于话音频谱参数向量和码表b的话音参数模板i之间的距离,
wh等于预定加权数组的参数h的加权值,
ah等于话音频谱参数向量的参数h的值,
b(i)h等于码表b的话音参数模板k中的参数h,并且
h是一个指向话音频谱参数向量中一个参数或话音参数模板中对应参数的索引。
在步骤506,索引i和变量n的值被存储在一个缓冲区中以便以后发送。根据本发明,第一个话音频谱参数向量(j=1,X1)总是得到量化。变量n被设成0并且n和i被缓冲以便发送。在步骤508,进行检测以确定所缓冲的话音频谱参数向量是否话音消息的最后一个话音频谱参数向量。当所缓冲的话音频谱参数向量是话音消息的最后一个话音频谱参数向量时,在步骤510完成处理过程。当仍有剩余的话音频谱参数向量时,处理过程继续进行到步骤512。
在步骤512,例如变量n被设成8,从而建立最大数量的,通过内插产生的交错话音参数模板,并且选择一个后续话音频谱参数向量。根据本发明的最优实施例,由于根据n的初始值来建立,内插所要产生的话音参数模板的最大数量为7,但是应当理解话音参数模板的最大数量也可以被设成其它的值(例如4或16)。在步骤514,使用上述步骤504的处理过程对输入话音频谱参数向量Xj+n进行量化,从而确定出一个具有后续索引ij+n的后续话音参数模板Yj+n。模板Yj+n和前面确定的Yj被用作内插过程所追随的端点。在步骤516变量m被设成1。变量m被用来指示内插所产生的话音参数模板。
在步骤518计算出内插话音参数模板。内插最好是一个按照逐个参数的方式来进行的线性内插过程。但是应当理解也可以使用其它的内插处理过程(例如正交内插过程)。通过求出话音参数模板Yj和话音参数模板Yj+n中对应参数的差值,把差值和比率m/n相乘并且把结果加到Yj上,可以计算出内插话音参数模板的内插参数。
上述内插计算可以被说明成下面的方程:
其中:
Y(j+m)h等于内插话音参数模板Yj的h参数的内插值,
Y(j+n)h等于话音参数模板Yj+n的h参数,并且,
Y(j)h等于话音参数模板Yj的h参数。
在步骤520,比较内插话音参数模板Y(j+m)和话音参数模板Y(j+m)以确定内插话音参数模板Y(j+m)是否精确表示了话音频谱参数向量X(j+m)。根据畸变计算来确定精确度。通常使用加权平方和的方法来计算畸变。这里畸变也被称作距离。通过从内插话音参数模板Y(j+m)中对应参数的值中减去话音频谱参数向量X(j+m)中的一个参数的值,计算所得值的平方并且把平方结果与一个预定加权数组中的一个对应加权值相乘来计算出畸变。针对话音频谱参数向量中的每个参数和内插话音参数模板中的对应参数重复进行这种计算。这些对应于各个参数的计算结果的累加和便是畸变。用于计算畸变的加权数组最好和向量量化中使用的加权数组相同,但是应当理解可以通过侦听检测以试验的方式确定另一个用于畸变计算的加权数组。
上述畸变计算可以被说明成下面的方程:
其中:
D等于话音频谱参数向量Xj(j+m)和内插话音参数模板Y(j+m)之间的畸变,
wh等于预定加权数组的参数h的加权值。
把畸变D和一个预定畸变界限值t进行比较。预定畸变界限值t在这里也被称作预定距离。当畸变等于或小于预定畸变界限值t时,进行检测以确定m的值是否等于n-1。当m的值等于n-1时,已经计算出所有内插模板的畸变,并且发现这些模板精确表示了初始的话音频谱参数向量,而在步骤532中,j的值被设成j+n,以便对应于内插过程中使用的话音参数模板Yj+n的索引。接着在步骤506,对应于话音参数模板Yj+n的索引i和变量n的值被存储在一个缓冲区中以便在以后进行发送。这样,用后续话音频谱参数向量替代了第一个话音频谱参数向量。过程继续进行,直到在步骤508检测到消息的结束。在步骤528,当m的值不等于n-1时,还没有计算和检测完所有的内插话音参数模板。那么在步骤526把m的值加1并且在步骤518计算下一个内插参数。
在步骤520当畸变大于预定畸变界限值t时,话音频谱参数向量的变化速率大于使用根据n的值确定的当前内插范围可以精确再现的速率。接着在步骤524进行检测以确定n的值是否等于2。当n的值不等于2时,在步骤522通过把n的值减1来减少内插范围的长度。在步骤524当n的值等于2时,进一步减少n的值是无效的。接着在步骤530把j的值加1并且不进行内插。在步骤504对话音频谱参数向量Xj进行量化和缓冲以便在步骤506进行发送。
图6是图5的步骤512至520中描述的内插和畸变检测的图示。话音频谱参数矩阵602是一个话音频谱参数向量数组,其中包括话音频谱参数向量604,Xj和后续话音频谱参数向量608,Xj+n。括号括起了交错话音频谱参数向量606,即内插要产生的n-1个话音参数模板。该图例描述了n=8时的情况,因而内插会产生7个话音参数模板。话音频谱参数向量604,Xj是一个在步骤514被量化的向量,因而产生一个对应于最隹表示后续话音频谱参数向量608,Xj+n的后续话音参数模板618,Yj+n的索引。在步骤518通过线性内插产生话音参数模板620,Yj+m的值。当计算出各个话音参数模板620,Yj+m时,把这些模板与话音频谱参数矩阵602中的对应的初始话音频谱参数向量Xj+m进行比较。当比较结果表明在步骤520的畸变计算所计算出的畸变超过了一个预定畸变界限值时,以上述方式减少n的值并且重复该过程。预定畸变界限值在这里也被称作预定距离界限值。
在本发明的一个可选实施例中,可以提供不止一组话音参数模板或码表以便更好地表示不同的发话人。例如,一个码表可以用来表示一个男性发话人的声音,第二个码表可以用来表示一个女性发话人的声音。应当理解还可以提供反映诸如西班牙语,日语等语言差别的附加码表。当使用多个码表时,可以使用不同的PSTN电话访问号码来区分不同的语言。各个唯一的电话访问号码与PSTN连接组有关,而各个PSTN连接组对应于一种特定的语言和对应的码表。当不使用唯一的PSTN访问号码时,可以提示用户在输入语音消息之前通过输入诸如DTMF数字的预定编码来提供有关信息,其中各个DTMF数字对应于一种特定的语言和对应的码表。一旦所使用的线路识别出呼叫人的语言或接收到DTMF数字,数字信号处理器214从存储在数字信号处理器214存储器中的一组预定码表中选择出一组预定模板,这组模板表示一个对应于预定语言的码表。此后可以用识别出的语言给出所有的语音提示。输入话音处理器205接收标识语言的信息并且把信息传送到数字信号处理器214。可选地,数字信号处理器214可以分析数字话音数据以便确定语言或方言并且选择一个合适的码表。
使用码表标识来标识被用来压缩语音消息的码表。码表标识和索引序列一起被加以编码并且被发送到通信设备114。一个可选的传递码表标识的方法是在包含索引数据的消息中增加一个标识码表的信息头。
图7给出了在图2所示的寻呼终端106中使用的数字信号处理器214的电子模块图。使用一个诸如几种专门设计用来完成涉及数字信号处理的计算的标准商品化数字信号处理器IC的处理器704。从几个不同的厂商那里可以得到诸如Motorola Inc.,Schaumburg,IL制造的DSP56100的数字信号处理器IC。处理器704通过处理器地址和数据总线708与一个ROM 706,一个RAM710,一个数字输入端口712,一个数字输出端口714和一个控制总线端口716相连。ROM 706存储处理器704使用的指令,处理器704使用这些指令完成所使用的消息类型和针对控制器216的控制接口所需要的信号处理功能。ROM706还包含用于完成涉及压缩语音消息传输的功能的指令。RAM 710提供数据和程序变量的临时存储,输入语音数据缓冲区和输出语音数据缓冲区。数字输入端口712在一个数据输入功能和一个数据输出功能的控制下提供处理器704和输入时分多路复用公用通路212之间的接口。数字输出端口在数据输出功能的控制下提供处理器704和输出时分多路复用公用通路218之间的接口。控制总线端口716提供处理器704和数字控制总线210之间的接口。一个时钟702为处理器704产生定时信号。
例如,ROM 706包含下面的指令:一个控制器接口功能指令,一个数据输入功能指令,一个增益校正功能指令,一个组帧功能指令,一个话音分析功能指令,一个向量量化功能指令,一个后向搜寻内插功能指令,一个数据输出功能指令,一或多个码表,和矩阵加权数组。RAM 710提供程序变量的临时存储,一个输入语音数据缓冲区和一个输出语音数据缓冲区。应当理解可以在分别的,诸如硬盘或其它类似的存储设备的块存储介质中存储诸如码表的ROM 706的元素。
图8是诸如寻呼机接收器的通信设备114的电子模块图。接收天线112截获发送天线110发送的信号。接收天线112与一个接收器804相连。接收器804处理接收天线112接收的信号并且产生一个接收器输出信号816,该信号是发送的编码数据的复本。使用诸如POCSAG协议的预定协议对编码数据进行编码。如下所述,数字信号处理器808处理接收器输出信号816并且产生一个解压缩数字话音数据818。一个数模转换器把解压缩数字话音数据818转换成模拟信号,该模拟信号被音频放大器812放大并且被扬声器814播放。
数字信号处理器808也提供对通信设备114的各种功能的基本控制。数字信号处理器808通过控制总线820与一个节电开关806,一个编码存储器822,一个用户接口824和一个消息存储器826相连。编码存储器822存储控制实现选择呼叫功能所必需的唯一标识信息或地址信息。用户接口824为用户提供指示接收消息的音频,视频或机械信号,并且也可以包括使用户输入控制接收器的命令的显示器和按键。消息存储器826提供存储消息以便以后浏览或允许用户用户重放消息的存储空间。节电开关806提供一种装置,该装置在系统正与其它寻呼机通信或不发送信号期间有选择地关闭对接收器的供电,从而以本领域普通技术人员所熟知的方式减少了耗电并增加了电池寿命。
图9是描述通信设备114的操作的流图。在步骤902,数字信号处理器808向节电开关806发送一个命令,使之向接收器804供电。数字信号处理器808监视接收器输出信号816以寻找一个指示寻呼终端正在发送使用POCSAG报头调制的信号的位模式。
在步骤904,判定是否出现POCSAG报头。当没有检测到报头时,数字信号处理器808向节电开关806发送一个命令,使之在长度预定的一段时间内禁止向接收器供电。正如本领域中所熟知的,当这段时间过去后,在步骤902再次监视报头。在步骤906,当检测到POCSAG报头时,数字信号处理器808会与接收器输出信号816同步。
当达到同步时,数字信号处理器808可以向节电开关806发送一个命令,使之禁止向接收器供电,直到收到指定给通信设备114的POCSAG帧。当收到指定的POCSAG帧时,数字信号处理器808向节电开关806发送一个命令,使之向接收器804供电。在步骤908,数字信号处理器808监视接收器输出信号816以寻找一个与指定给通信设备114的地址相匹配的地址。当没有发现匹配的地址时,数字信号处理器808向节电开关806发送一个命令,禁止其向接收器供电,直到下一次发送一个同步码字或下一个指定的POCSAG帧,此后重复步骤902。当发现一次地址匹配时,则在步骤910保持供电以便接收,并且接收到数据。
在步骤912,可以对在步骤910接收的数据进行纠错以便改进再现的语音质量。POCSAG编码帧提供9个用于纠错处理的校验位。POCSAG纠错技术是本领域普通技术人员所熟知的。在步骤914存储经过纠错的数据。数字语音数据的处理消除量化并内插频谱信息,把频谱信息与激励信息相互混合并且合成语音数据。
在步骤918,数字信号处理器808在消息存储器826中存储接收的语音数据,并且向用户接口发送一个命令以提醒用户。在步骤920,用户输入一个播放消息的命令。在步骤922,数字信号处理器808通过向数模转换器810传送存储在消息存储器中的解压缩语音数据来作出响应。数模转换器810把数字话音数据818转换成模拟信号,该模拟信号被音频放大器812放大并且由扬声器814来播放。
图10是说明数字信号处理器808在步骤916进行的可变速率内插处理的流图。过程从步骤1002开始并且直接到达步骤1006。在步骤1006,从存储器中检索出第一个索引i和内插范围n。在步骤1008,索引i被用来从数字信号处理器808存储的,所选择的码表中检索出话音参数模板Yi。在步骤1010进行检测以确定n的值是否等于或小于2。当n的值等于或小于2时,不进行内插并且在步骤1004存储话音参数模板。应当注意在发送第一个索引时,在步骤502寻呼终端106总是把n设成0。在步骤1004,话音参数模板Yi被临时存储在一个寄存器Y0中。存储在寄存器Y0中的话音参数模板以后被称作话音参数模板Y0。在步骤1004,话音参数模板Yi被存储在数字信号处理器808中的一个输出话音缓冲区中。接着在步骤1006中,从存储器中检索出下一个索引i和下一个内插范围n。接着在步骤1008中,索引i被用来从码表中检索出话音参数模板Yi。在步骤1010进行检测以确定n的值是否等于或小于2。当n的值大于2时,在步骤1012把变量j值设成1。接着在步骤1014话音参数模板Yj被内插和存储到输出话音缓冲区的下一个位置中。
内插处理过程基本上与在步骤518发送消息之前寻呼终端106中进行的内插处理过程相同。处理过程把话音参数模板Yj的参数线性内插到话音参数模板Y0和话音参数模板Yi之间。通过求出话音参数模板Y0中对应参数和话音参数模板Yi的差值,把差值和比率j/n相乘并且把结果加到Yj上,可以计算出内插话音参数模板的内插参数。
上述内插计算可以被说明成下面的方程:
其中:
Y(j)h等于内插话音参数模板Yj的h参数的内插值,
Y(i)h等于话音参数模板Yi的h参数,并且,
Y(0)h等于话音参数模板Y0的h参数。
下面,在步骤1016,j的值被加1以指示要内插下一个话音参数模板。在步骤1020进行检测以确定j是否小于n。当j小于n时,内插会产生更多的话音参数模板,并且过程在步骤1004继续进行。当j等于n时,已经计算出该内插组中的所有内插话音参数模板,并且接着执行步骤1020。
在步骤1020进行检测以确定消息的末端是否到达。当消息的末端没有到达时,过程在步骤1004继续。当消息的末端到达时,在步骤1022把最后解码的话音参数模板Yi存储在输出话音缓冲区中。接着在步骤1024把频谱信息与激励信息相互混合并且合成数字话音数据。
图11说明了在通信设备114中使用的数字信号处理器808的电子模块图。处理器1104类似于图7所示的处理器704。但是由于在对数字语音消息进行解压缩时所需的计算量大大小于压缩过程中需要的计算量,并且由于功耗在通信设备114中是关键的,所以处理器1104可以是一种速度较慢,功率较低的处理器。处理器1104通过处理器地址和数据总线1110与一个ROM 1106,一个RAM 1108,一个数字输入端口1112,一个数字输出端口1114和一个控制总线端口1116相连。ROM 1106存储处理器1104使用的指令,处理器1104使用这些指令完成解压缩消息并且与控制器1116接口所需要的信号处理功能。ROM 1106还包含用于完成涉及压缩语音消息传输的功能的指令。RAM1108提供数据和程序变量的临时存储。数字输入端口1112在数据输入功能的控制下提供处理器1104和接收器804之间的接口。数字输出端口1114在输出控制功能的控制下提供处理器1104和数模转换器之间的接口。控制总线端口1116提供处理器1104和控制总线820之间的接口。一个时钟1102为处理器1104产生定时信号。
例如,ROM 1106包含下面的指令:一个接收器控制功能指令,一个用户接口功能指令,一个数据输入功能指令,一个POCSAG解码功能指令,一个编码存储器接口功能指令,一个地址比较功能指令,一个消除量化功能指令,一个逆二维变换功能指令,一个消息存储器接口功能指令,一个话音合成器功能指令,一个输出控制功能指令和一或多个码表。对应于一或多种预定语言的一或多个码表被存储在ROM1106中。数字信号处理器808根据使用接收器输出信号816中的接收数据加以编码的标识来选择合适的码表。
概括地讲,以8KHz速率采样并且使用常规电话技术进行编码的话音需要64千位每秒的数据速率。但是根据本发明进行编码的话音只需要低得多的传输速率。例如,可以在400位每秒的平均数据速率上发送以8KHz速率采样并且根据本发明被组合成25毫秒话音的帧的话音。如上所述,本发明以这样的方式对语音消息进行数字编码,即使得结果数据被高度压缩并且可以容易地和通过寻呼信道发送的普通数据相互混合。另外,以这样的方式对语音消息进行数字编码,即使得寻呼机或类似便携设备中的处理最小化。这里已经说明和描述了本发明的特定实施例,可以理解本领域的技术人员可以进行进一步的修改和改进。
Claims (32)
1.提供低位速率话音传输的方法,其中根据语音消息产生话音频谱参数向量并且把向量存储在话音频谱参数矩阵中的一个序列内,并且发送标识一个对应于该序列中的一个被选择的话音频谱参数向量的话音参数模板的索引,上述方法包括的步骤有:
选择序列中的一个后续话音频谱参数向量以便建立一或多个针对所选话音频谱参数向量的交错话音频谱参数向量;
确定一个后续索引,该索引标识对应于序列中的后续话音频谱参数向量的一个后续话音频谱参数模板;
在话音参数模板和后续话音参数模板之间进行内插以便导出一或多个交错内插话音参数模板;
比较对应于一或多个交错内插话音参数模板的一或多个交错话音参数模板以便导出一个距离;
在导出的距离小于或等于预定距离时发送后续索引。
2.如权利要求1所述的方法,其中上述发送步骤还发送一个指示所建立的交错话音频谱参数向量的数量的数值。
3.如权利要求1所述的方法,其中还包括的步骤有:
用后续话音频谱参数向量替换所选择的话音频谱参数向量;
选择另一个替换后续话音频谱参数向量的后续话音频谱参数向量;
重复上述确定,内插,比较和发送的步骤。
4.如权利要求3所述的方法,其中重复进行上述替换,选择,确定,内插,比较和发送的步骤,直到语音消息被发送。
5.如权利要求1所述的方法,其中一或多个交错话音频谱参数向量对应于预定数量的交错话音频谱参数向量。
6.如权利要求1所述的方法,其中还包括的步骤有:
当在上述比较步骤导出的距离大于预定距离时,从一或多个交错话音频谱参数向量中重新选择一个后续话音频谱参数向量,从而重新建立一或多个针对所选话音频谱参数向量的交错话音频谱参数向量;
重复上述确定,内插,比较和发送的步骤。
7.如权利要求1所述的方法,其中话音频谱参数向量是LPC话音频谱参数向量。
8.如权利要求1所述的方法,其中从一组预定话音参数模板中选择出话音参数模板和后续话音参数模板。
9.如权利要求8所述的方法,其中预定话音参数模板组表示一个对应于一种预定语言的码表。
10.如权利要求2所述的方法,其中还包括的步骤有:
存储交错话音频谱参数向量的数量;
在一个索引数组中存储索引和后续索引;
发送交错话音频谱参数向量的数量和存储的索引数组。
11.一个处理语音消息从而提供低位速率话音传输的语音压缩处理器,上述语音压缩处理器包括:
一个存储器,该存储器存储话音参数模板和标识话音参数模板的索引;
一个输入话音处理器,该输入话音处理器处理语音消息以产生被存储在上述存储器中的话音频谱参数向量;
一个信号处理器,对信号处理器进行编程,从而
根据存储在上述存储器中的话音频谱参数向量序列选择一个话音频谱参数向量,
确定标识出对应于所选择的话音频谱参数向量的一个话音参数模板的索引,
根据存储在上述存储器中的话音频谱参数向量序列选择一个后续话音频谱参数向量,其中后续话音频谱参数向量针对所选择的话音频谱参数向量建立一或多个交错话音频谱参数向量,
确定标识出对应于后续话音频谱参数向量的一个后续话音参数模板的后续索引,
在话音参数模板和后续话音参数模板之间进行内插以便导出一或多个交错内插话音参数模板,并且
比较对应于一或多个交错内插话音参数模板的一或多个交错话音参数模板以便导出一个距离;和
一个发送器,该发送器负责为上述信号处理器发送索引,并且在所导出的距离小于或等于一个预定距离时发送后续索引。
12.如权利要求11所述的语音压缩处理器,其中上述发送器还发送一个指示所建立的交错话音频谱参数向量的数量的数值。
13.如权利要求11所述的语音压缩处理器,其中上述信号处理器被加以编程,从而
用后续话音频谱参数向量替换所选择的话音频谱参数向量,
选择另一个替换后续话音频谱参数向量的后续话音频谱参数向量,并且
还进行选择,确定,内插,和比较。
14.如权利要求11所述的语音压缩处理器,其中上述信号处理器还进行选择,确定,内插,比较和发送,直到语音消息被发送。
15.如权利要求11所述的语音压缩处理器,其中一或多个交错话音频谱参数向量对应于预定数量的交错话音频谱参数向量。
16.如权利要求11所述的语音压缩处理器,其中上述信号处理器被加以编程,从而
当导出的距离大于预定距离时,从一或多个交错话音频谱参数向量中重新选择一个后续话音频谱参数向量,从而重新建立一或多个针对所选话音频谱参数向量的交错话音频谱参数向量;
还进行确定,内插,比较和发送。
17.如权利要求11所述的语音压缩处理器,其中话音频谱参数向量是LPC话音频谱参数向量。
18.如权利要求11所述的语音压缩处理器,其中从一组存储在上述存储器中的预定话音参数模板中选择出话音参数模板和后续话音参数模板。
19.如权利要求11所述的语音压缩处理器,其中预定话音参数模板组表示一个对应于一种预定语言的码表。
20.如权利要求12所述的语音压缩处理器,其中上述存储器还存储交错话音频谱参数向量的数量,并且还在一个索引数组中存储索引和后续索引,上述发送器发送交错话音频谱参数向量的数量和存储的索引数组。
21.处理低位速率话音传输从而提供语音消息的方法,上述方法包括的步骤有:
接收一个索引,至少一个后续索引和一个指示交错话音频谱参数向量数量的数值;
从一组预定话音参数模板中选择对应于上述索引的一个话音参数模板和对应于上述至少一个后续索引的至少一个后续话音参数模板;
在所选的话音参数模板和后续话音参数模板之间进行内插以导出一批对应于交错话音频谱参数向量的数量的交错话音参数模板;
根据选择的话音参数模板,后续话音参数模板和交错话音参数模板合成话音数据;并且
根据合成的话音数据产生出语音消息。
22.如权利要求21所述的方法,其中还包括存储索引,后续索引和指示交错话音频谱参数向量数量的数值的步骤。
23.如权利要求21所述的方法,其中还包括存储所选择的话音参数模板,后续话音参数模板和交错话音参数模板的步骤。
24.如权利要求21所述的方法,其中预定话音参数模板组表示一个对应于一种预定语言的码表。
25.如权利要求21所述的方法,其中指示交错话音频谱参数向量数量的数值是可变的。
26.如权利要求21所述的方法,其中还包括的步骤有:
用一个后续话音参数模板替换所选择的话音参数模板;
接收另一个后续索引和一个指示另一个后续索引和后续索引之间的交错话音频谱参数向量数量的数值;
重复上述选择,内插,合成和产生的步骤,从而提交语音消息。
27.一个接收低位速率话音传输从而提供语音消息的通信设备,上述通信设备包括:
一个存储一组话音参数模板的存储器;
一个接收器,该接收器接收一个索引,一个后续索引和一个指示交错话音频谱参数向量数量的数值;
一个信号处理器,该信号处理器被加以编程,从而
根据预定话音参数模板组选择对应于索引的一个话音参数模板和对应于后续索引的一个后续话音参数模板,并且
在话音参数模板和后续话音参数模板之间进行内插以导出一批对应于交错话音频谱参数向量的数量的交错话音参数模板;
一个合成器,该合成器根据话音参数模板,后续话音参数模板和交错话音参数模板合成话音数据;
一个根据合成的话音数据产生出语音消息的转换器。
28.如权利要求27所述的通信设备,其中上述存储器还存储第一个索引,后续索引和指示交错话音频谱参数向量数量的数值。
29.如权利要求27所述的通信设备,其中上述存储器还存储话音参数模板,后续话音参数模板和交错话音参数模板。
30.如权利要求28所述的通信设备,其中存储在上述存储器中的预定话音参数模板组表示一个对应于一种预定语言的码表。
31.如权利要求27所述的通信设备,其中指示交错话音频谱参数向量数量的数值是可变的。
32.如权利要求27所述的通信设备,其中上述接收器接收另一个后续索引和一个指示另一个后续索引和后续索引之间的交错话音频谱参数向量数量的数值,其中上述信号处理器被加以编程,从而
用后续话音参数模板替换所选择的话音参数模板;
用另一个后续话音参数模板替换后续话音参数模板;
还进行选择,内插,合成和产生,从而提交语音消息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/528,033 US5682462A (en) | 1995-09-14 | 1995-09-14 | Very low bit rate voice messaging system using variable rate backward search interpolation processing |
US08/528,033 | 1995-09-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1200173A true CN1200173A (zh) | 1998-11-25 |
CN1139057C CN1139057C (zh) | 2004-02-18 |
Family
ID=24103987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB961969555A Expired - Fee Related CN1139057C (zh) | 1995-09-14 | 1996-07-08 | 用于传送低比特率语音的语音通信处理器及相关通信设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5682462A (zh) |
EP (1) | EP0850471B1 (zh) |
CN (1) | CN1139057C (zh) |
DE (1) | DE69623487T2 (zh) |
WO (1) | WO1997010585A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101859566A (zh) * | 2009-04-02 | 2010-10-13 | 索尼公司 | 信号处理设备、方法和程序 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5877768A (en) | 1996-06-19 | 1999-03-02 | Object Technology Licensing Corp. | Method and system using a sorting table to order 2D shapes and 2D projections of 3D shapes for rendering a composite drawing |
FR2780218B1 (fr) * | 1998-06-22 | 2000-09-22 | Canon Kk | Decodage d'un signal numerique quantifie |
US6185525B1 (en) | 1998-10-13 | 2001-02-06 | Motorola | Method and apparatus for digital signal compression without decoding |
US6418405B1 (en) | 1999-09-30 | 2002-07-09 | Motorola, Inc. | Method and apparatus for dynamic segmentation of a low bit rate digital voice message |
US6772126B1 (en) | 1999-09-30 | 2004-08-03 | Motorola, Inc. | Method and apparatus for transferring low bit rate digital voice messages using incremental messages |
KR101263663B1 (ko) * | 2011-02-09 | 2013-05-22 | 에스케이하이닉스 주식회사 | 반도체 장치 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4479124A (en) * | 1979-09-20 | 1984-10-23 | Texas Instruments Incorporated | Synthesized voice radio paging system |
US4701943A (en) * | 1985-12-31 | 1987-10-20 | Motorola, Inc. | Paging system using LPC speech encoding with an adaptive bit rate |
US4802221A (en) * | 1986-07-21 | 1989-01-31 | Ncr Corporation | Digital system and method for compressing speech signals for storage and transmission |
US4815134A (en) * | 1987-09-08 | 1989-03-21 | Texas Instruments Incorporated | Very low rate speech encoder and decoder |
FR2690551B1 (fr) * | 1991-10-15 | 1994-06-03 | Thomson Csf | Procede de quantification d'un filtre predicteur pour vocodeur a tres faible debit. |
US5388146A (en) * | 1991-11-12 | 1995-02-07 | Microlog Corporation | Automated telephone system using multiple languages |
US5357546A (en) * | 1992-07-31 | 1994-10-18 | International Business Machines Corporation | Multimode and multiple character string run length encoding method and apparatus |
CA2105269C (en) * | 1992-10-09 | 1998-08-25 | Yair Shoham | Time-frequency interpolation with application to low rate speech coding |
US5544277A (en) * | 1993-07-28 | 1996-08-06 | International Business Machines Corporation | Speech coding apparatus and method for generating acoustic feature vector component values by combining values of the same features for multiple time intervals |
-
1995
- 1995-09-14 US US08/528,033 patent/US5682462A/en not_active Expired - Fee Related
-
1996
- 1996-07-08 CN CNB961969555A patent/CN1139057C/zh not_active Expired - Fee Related
- 1996-07-08 EP EP96922667A patent/EP0850471B1/en not_active Expired - Lifetime
- 1996-07-08 DE DE69623487T patent/DE69623487T2/de not_active Expired - Fee Related
- 1996-07-08 WO PCT/US1996/011341 patent/WO1997010585A1/en active IP Right Grant
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101859566A (zh) * | 2009-04-02 | 2010-10-13 | 索尼公司 | 信号处理设备、方法和程序 |
CN101859566B (zh) * | 2009-04-02 | 2012-08-29 | 索尼公司 | 信号处理设备和方法 |
Also Published As
Publication number | Publication date |
---|---|
EP0850471B1 (en) | 2002-09-04 |
US5682462A (en) | 1997-10-28 |
EP0850471A1 (en) | 1998-07-01 |
WO1997010585A1 (en) | 1997-03-20 |
CN1139057C (zh) | 2004-02-18 |
DE69623487T2 (de) | 2003-05-22 |
EP0850471A4 (en) | 1998-12-30 |
DE69623487D1 (de) | 2002-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6018706A (en) | Pitch determiner for a speech analyzer | |
CA2213699C (en) | A communication system and method using a speaker dependent time-scaling technique | |
CN1326415C (zh) | 对音频信号进行代码变换的方法、码变换器、网元、无线通信网和通信系统 | |
US7069211B2 (en) | Method and apparatus for transferring data over a voice channel | |
CN1158644C (zh) | 无线通信系统中语音的可靠转换及其方法 | |
CN1079180C (zh) | 通信系统中的语音压缩方法及设备 | |
JP3094832B2 (ja) | 信号識別器 | |
US20070025546A1 (en) | Method and apparatus for DTMF detection and voice mixing in the CELP parameter domain | |
US6940967B2 (en) | Multirate speech codecs | |
KR20060053018A (ko) | 음성 디코딩 장치, 음성 디코딩 방법 및 음성 디코딩장치를 포함하는 전송 시스템 | |
US6073094A (en) | Voice compression by phoneme recognition and communication of phoneme indexes and voice features | |
US6691081B1 (en) | Digital signal processor for processing voice messages | |
CN1255788A (zh) | 改进无线通信设施上传送的语音信号质量的方法和装置 | |
US5781882A (en) | Very low bit rate voice messaging system using asymmetric voice compression processing | |
CN1139057C (zh) | 用于传送低比特率语音的语音通信处理器及相关通信设备 | |
US5666350A (en) | Apparatus and method for coding excitation parameters in a very low bit rate voice messaging system | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
FI118703B (fi) | Menetelmä ja laite äänenlaadun huononemisen lieventämiseksi viestintäjärjestelmässä | |
US5806038A (en) | MBE synthesizer utilizing a nonlinear voicing processor for very low bit rate voice messaging | |
CN1212604C (zh) | 基于可变速语音编码的语音合成器 | |
CN100349395C (zh) | 用于语音帧误差降低的语音通信单元和方法 | |
WO1997013242A1 (en) | Trifurcated channel encoding for compressed speech | |
KR20020012376A (ko) | 특정 주파수대의 에너지 비를 이용한 톤 신호 검출 방법 | |
CA2485547A1 (en) | Device, method, and program for encoding/decoding of speech with function of encoding silent period |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |