CN1112672C - 多脉冲分析语言处理系统及其方法 - Google Patents
多脉冲分析语言处理系统及其方法 Download PDFInfo
- Publication number
- CN1112672C CN1112672C CN95193454A CN95193454A CN1112672C CN 1112672 C CN1112672 C CN 1112672C CN 95193454 A CN95193454 A CN 95193454A CN 95193454 A CN95193454 A CN 95193454A CN 1112672 C CN1112672 C CN 1112672C
- Authority
- CN
- China
- Prior art keywords
- pulse
- amplitude
- target vector
- characteristic
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000007476 Maximum Likelihood Methods 0.000 claims abstract description 14
- 230000006978 adaptation Effects 0.000 claims description 24
- 238000005516 engineering process Methods 0.000 claims description 15
- 238000011002 quantification Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 abstract description 4
- 238000013139 quantization Methods 0.000 abstract 1
- 230000004044 response Effects 0.000 description 12
- 238000003860 storage Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 5
- 238000010168 coupling process Methods 0.000 description 5
- 238000005859 coupling reaction Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000036278 prepulse Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/113—Regular pulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
Abstract
本发明为语音处理系统和方法。本发明系统包括至少一个最大似然量化多脉冲分析单元,作用于一目标矢量。该单元通常是对多脉冲序列确定初始增益水平,并多次完成单增益多脉冲分析,每次分析针对不同的增益水平。提供最能代表目标矢量的脉冲序列作为输出信号。在另一实施例中,系统包括至少是一个脉冲系列多脉冲分析单元,这里的目标矢量被模拟为脉冲系列序列。每个脉冲系列由一组单增益脉冲组成。
Description
技术领域
一般地说,本发明涉及语音处理系统,具体地说,涉及多脉冲分析系统。
背景技术
语音信号处理是技术上公知的,常用于压缩输入的语音信号,以供存储或传输。语音信号处理通常涉及把输入的语音信号分成帧(frame),然后分析每一帧以确定其分量(component)。然后将各分量存储或传输。
典型情况是,帧分析器确定语音信号的短时和长时特性。帧分析器还能确定语音信号的短时和长时分量(或称“贡献(contribu-tion)”)之一或二者。例如,线性预测系数分析(LPC)提供短时特性和贡献,而音调(pitch)分析和预测提供长时的特性以及长时贡献。
典型情况是,从输入帧中减掉长时和短时预测器贡献中的任一个、或二者、或者都不减掉,从而留下要确定其形状特征的目标矢量。可以用多脉冲分析(MPA)来产生这种特征化。多脉冲分析(MPA)由S.古井.在“数字语音处理、合成与识别(Digital speechProcessing,Synthesis and Recognition)”一书(纽约Marcel Dekker公司出版,NY 1989)中的6.4.2节中进行了详细描述。这里把该书作为参考。
在MPA中,由多个样本构成的目标矢量用不同位置和不同符号(正或负)的多个等振幅脉冲(或尖峰)来构成模型。为选择每个脉冲,在每个样本位置放置一个脉冲,并确定该脉冲通过一个由LPC系数定义的滤波器时所确定的脉冲效应。能与目标矢量拟合得最好的脉冲被选择出来并从目标矢量中去掉该脉冲的效应,从而产生一个新的目标矢量。该过程要继续到找出预定的数目的脉冲为止。为了存储或传输的目的,MPA分析的结果是脉冲位置的集合以及一个定量化的增益值。
通常该增益是由所确定的第一脉冲确定的。然后这个增益被用于其余的脉冲。不幸的是,第一脉冲的增益值并不总成指示出目标矢量的总体增益值,所以对目标矢量的拟合并不总是很精确。
发明内容
所以,本发明的目的是提供一种语音处理系统,在本发明的一个实施例中,系统包括:
连到输入和输出线上的一个短时分析器,其中所述短时分析器响应所述输入线上的输入语音信号,产生所述输入语音信号的短时特性;
目标矢量发生器由至少是所述输入语音信号以及可选的所述短时特性来产生一个目标矢量;以及
与所述目标矢量发生器的输出线相连的多脉冲分析器,这里所述多脉冲分析器产生一组等振幅、可变符号、可变间距的脉冲序列,所述一组序列的每一个序列有与其他序列不同的振幅值,在每个序列中所述每个脉冲有相等的振幅但可变的符号,所述多脉冲分析器输出一个对应于一个等振幅、可变符号、可变间距脉冲序列的信号,该序列是根据最大似然判据最能代表所述目标矢量的序列。
在另一个实施例中,系统包括一个短时分析器,用于通过对输入语音信号进行线性预测系数分析来产生短时特性,该系统包括:
一个目标矢量发生器,用于至少由所述输入语音信号及可选的短时特性产生一个目标矢量;
一个初始脉冲位置确定器,用于根据多脉冲分析技术根据所述目标矢量和短时特性确定初始脉冲位置;
振幅区间确定器用于确定所述初始脉冲的振幅及在所述振幅绝对值周围集中的量化振幅水平的变化区间;
振幅水平选择器用于根据预定的步长大小移动以通过所述量化振幅水平区间,所述振幅水平选择器对每一步长输出一个选定的量化振幅;
脉冲序列确定器用于根据所述选定的量化振幅确定一个等振幅、可变符号、可变间距脉冲序列,该序列对应于所述目标矢量;以及
目标矢量匹配器用于确定一对应于所述等振幅、可变符号、可变间距脉冲序列和所述目标矢量之间匹配质量的误差矢量,用于对每个选定振幅确定所述误差矢量,以输出对应于最小误差矢量的所述等振幅、可变符号、可变间距脉冲序列。
在另一个实施例中,该系统包含一个短时分析器,用于通过对输入语音信号进行线性预测系数分析来产生短时特征,还包含一个长时分析器用于由输入语音信号确定长时特性及语音的音调值,该系统包括:
目标矢量发生器用于至少由所述输入语音信号以及可选的短时和长时特性来产生一个目标矢量;
初始脉冲系列位置确定器用于根据多脉冲分析技术以所述目标矢量、短时特征和音调值为基础确定初始脉冲系列的位置;
脉冲系列序列确定器用于产生一组与所述目标矢量对应的可变符号的等振幅、均匀分布的脉冲系列,所述脉冲系列的脉冲间距对应于音调值,所述每个系列中的各脉冲有相同符号,所述各系列的所述脉冲有相同的振幅水平。
在另一个实施例中,该系统包括:
与输入和输出线相连的一个长时分析器,这里所述长时分析器响应所述输入线上的输入语音信号,产生长时特性,所述长时特性至少包含所述输入语音信号的音调值;
与所述输入线和输出线相连的短时分析器,这里所述短时分析器产生所述输入语音信号的短时特性;
目标矢量发生器用于至少由所述输入语音信号以及可选的短时和长时特性产生目标矢量;以及
连于所述目标矢量发生器一输出线的脉冲系列多脉冲分析器,用于产生一组可变符号的等振幅、均匀分布脉冲系列的序列,在每个系列中的脉冲有相同符号,而所述脉冲系列序列中的每个序列有与其他序列不同的振幅值,所述脉冲系列多脉冲分析器输出的信号对应于一组等振幅、均匀分布脉冲系列,该脉冲系列根据最大似然判据最能代表所述目标矢量。
在另一个实施例中,该系统含有一个短时分析器,用于通过对输入语音信号进行线性预测系数分析来产生短时特性,还含有一个长时分析器用于由该输入语音信号确定长时特性,所述长时特性包括语音的音调值,该系统包括:
目标矢量发生器用于至少由所述输入语音信号及可选的短时和长时特性来产生一目标矢量;
初始脉冲系列位置确定器用于根据多脉冲分析技术,以所述目标矢量、短时特性和音调值来确定初始脉冲系列的位置;
振幅区间确定器用于确定所述初始脉冲系列的振幅以及在所述振幅绝对值周围集中的量化振幅水平的区间;
振幅水平选择器根据预定步长大小移动以通过所述量化振幅水平区间,所述振幅水平选择器输出在每一步长的选定量化振幅;
脉冲系列序列确定器用于对所述选定的每一个量化振幅,产生一组可变符号的等振幅、均匀分布脉冲系列,它对应于所述目标矢量,在所述系列中的脉冲的脉冲间距对应于音调值,每个系列中的脉冲具有相同符号,在每个脉冲系列中的所述脉冲具有相等振幅,所述相等振幅对应于所选定的量化振幅;以及
目标矢量匹配器用于确定一个误差矢量,该误差矢量对应于所述一组可变符号的等振幅、均匀分布脉冲系列序列与所述目标函数的匹配质量,所述目标矢量匹配器用于输出对应于最小误差矢量的等振幅、同符号、均匀间距的脉冲系列序列。
本发明的另一个目的是提供一种语音处理方法,在本发明的一个实施例中,该方法包括如下步骤:
确定一输入语音信号的短时特性;
至少由所述输入语音信号及可选的由所述短时特性产生一个目标矢量;
根据多脉冲分析技术,基于所述目标矢量和所述短时特性,确定一初始脉冲的位置;
确定所述初始脉冲的振幅及在所述振幅绝对值周围集中的量化振幅水平的区间;
根据预定步长大小移动以通过量化振幅水平区间并在每个步长输出一个选定的量化振幅;
根据所述选定的量化振幅,产生一个与所述目标矢量对应的一个等振幅、可变符号、可变间距的脉冲序列;
将每个所述等振幅、可变符号、可变间距的脉冲序列与所述目标矢量进行比较;以及
选择所述等振幅、可变符号、可变间距脉冲序列,它根据最大似然判据最能代表所述目标矢量。
在另一个实施例中,该方法包括如下步骤:
确定一输入语音信号的短时特性;
确定所述输入语音信号的长时特性,包括确定所述输入语音信号的一个音调值;
由至少是所述输入语音信号,以及可选地由所述短时和长时特性,产生一个目标矢量;
根据多脉冲分析技术,基于所述目标矢量、所述短时特性及所述音调值,确定初始脉冲系列的位置;以及
产生一组可变符号的等振幅、均匀间距的脉冲系列,它们对应于所述目标矢量,所述系列中的脉冲具有的脉冲间距对应于所述音调值,在所述系列中的脉冲有相同的振幅水平,在每个系列中的脉冲有相同符号。
在另一个实施例中,该方法包括如下步骤:
确定所述输入语音信号的短时特性;
确定所述输入语音信号的长时特性,所述长时特性至少包括所述语音信号的音调值;
至少由所述输入语音信号,以及可选地由所述短时和长时特性,产生一个目标矢量;
根据多脉冲分析技术基于所述目标矢量、短时特性及音调值,确定一初始脉冲序列的位置;
确定所述初始脉冲系列的振幅及在所述振幅绝对值周围集中的量化振幅水平的区间;
根据预定步长大小移动以通过所述量化振幅水平区间,并输出在每个步长处的选定量化振幅;
对每个选定的量化振幅,产生一个对应于所述目标矢量的一组可变符号的等振幅、均匀间距的脉冲系列,所述脉冲系列内的脉冲间距对应于所述音调值,每个所述系列中的脉冲有相同振幅,所述相同振幅对应于选定的量化振幅,在每个系列中的脉冲有相同符号;
将所述一组可变符号的等振幅、均匀间距的脉冲系列与所述目标矢量相比较;以及
选定所述一组可变符号的等振幅、均匀间距脉冲系列,它是根据最大似然判据最能代表所述目标矢量的系列。
附图说明
从下文中结合附图所作详细描述,将更充分地理解和认识本发明。这些附图是:
图1是本发明的语音处理系统的第一实施例的方框图;
图2是图1的多脉冲最大似然量化(MP-MLQ)块的流程图;
图3A和3B是用于理解图2操作的图示;
图4A和4B分别为描述脉冲系列和使用脉冲系列进行多脉冲分析的图示;
图5是本发明利用脉冲系列的语音处理系统的第二个实施例的方框图;
图6是图5的脉冲系列多脉冲分析单元的操作流程图;
图7是与图1和图5的系统输出相比较的第三个实施例的方框图。
具体实施方式
现在参考图1、2、3A和3B,这一些附图说明了本发明的第一个实施例。本发明的语音处理系统包括至少一个短时预测分析器10、一个长时预测分析器12、一个目标矢量发生器13和一个最大似然量化多脉冲分析(MP-MLQ)单元14。
短时预测分析器10在输入线16上接收由多个数字化语音样本构成的语音信号的一个输入帧。通常,每帧有240个语音样本,帧又往往分成多个子帧。通常,有4个子帧,每个子帧通常为60个样本长。输入帧可以是一个原始语音信号的一帧,也可以是原始语音信号被处理后的形态。
短时预测分析器10还在输入线16上接收输入帧,而在输出线17上产生该输入帧的短时特性。在一个实施例中,分析器10完成的线性预测分析,以产生表征输入帧的线性预测系数(LPC)。
为了本发明的目的,分析器10能完成任何类型的LPC分析。例如,LPC分析可以如“数字语音处理、合成与识别”一书中第6.4.2章所描述的那样按下述方式实现:将汉明窗加到以一个子帧为中心的180个样本构成的窗上。使用Durbin迭代方法产生第10阶LPC系数。对每个子帧重复这一过程。
长时预测分析器12可以是任何类型的长时预测器并对线16上的输入帧进行操作。长时分析器12分析输入帧的多个子帧,以确定每个子帧内的语音音调(pitch)值,这里的音调值定义为语音信号进似重复它本身的间隔样本数目。音调值通常介于20和146之间,这里20表明为高音调声音,而146表明为低音调声音。
例如,对每2个子帧,可以由二子帧S(n)的正规化互相关函数取最大值来确定一个音调的估计值,其表达式如下: 对于本例,长时分析器12选择使互相关C_i取极大值的指数i作为这2帧的音调值。
一旦长时分析器12确定了音调值,该音调值被用于确定在输入线18上提供的子帧的长时预测信息。
目标矢量发生器13接收长时分析器12和短时分析器10的输出信号以及在输入线16上的输入帧(通过延迟19)。目标矢量发生器响应这些信号,从输入信号的至少一个子帧产生一个目标矢量。如果希望的话,可以利用长时和短时信息,或者可以忽略这些信息。延迟19保证到达目标矢量的输入帧对应于分析器10和12的输出。
目标矢量发生器13的输出线26与MP-MLQ单元14相连,携带目标矢量输出信号。MP-MLQ单元14通常还与携带由分析器10产生的短时特性的输出线17相连。
可以理解,不失其一般性,可以以任何希望的方式产生向MP-MLQ单元提供的目标矢量。
根据本发明的第一最佳实施例。MP-MLQ单元14包括初始脉冲位置确定器(determiner)20、增益区间确定器22、增益水平选择器24、脉冲序列确定器25、目标矢量匹配器28和可选的编码器30。图2中显示出部件20-30所完成的具体操作,下文将予以详细描述。下面是单元14操作的一般描述:
初始脉冲位置确定器20沿输出线26和17分别接受目标矢量发生器13和短时分析器10的输出信号,它根据多脉冲分析技术确定第一脉冲的样本位置。
增益区间确定器22接收单元20的第一脉冲输出,并确定第一脉冲的振幅以及在所确定振幅绝对值周围的量化增益水平所在区间。标记为MLQ_STEPS的步长用于在量化增益水平区间内按步长移动,通常该步长值为3倍增益水平间隔。该步长MLQ_STEPS不是由MP-MLQ单元14确定的。
增益水平选择器24接收由增益区间确定器22产生的增益区间,并移动通过增益区间内的各增益值。它的输出在输出线32上,是一个要对其确定等振幅脉冲序列的当前增益水平。
脉冲序列确定器25在线26上接收目标矢量,在线32上接收当前增益水平,并利用下文描述的多脉冲分析技术由它们确定一个与目标矢量匹配的脉冲序列(有正负两类脉冲)。该脉冲序列是一系列具有当前增益水平的正负脉冲。
目标矢量匹配器28在输出线34上接收确定器25的脉冲序列输出,在输出线26上接收目标矢量。匹配器28利用最大似然型判据确定匹配质量。
由于存在一个增益水平区间,匹配器28反过来控制增益水平选择器24去选择下一个增益水平。这种反过来的控制由箭头36表明。
对于每个增益值,匹配器28确定匹配质量,并且只有当它对该判据提供比先前的匹配更小的值时才保留该匹配(增益指数和脉冲序列)。
一旦增益选择器24已经移动通过所有增益值,则存储在匹配28中的增益指数和脉冲序列是对目标矢量的最靠近的匹配。然后匹配器28沿输出线38向可选编码器30输出所存储的脉冲序列和增益指数。
可以理解,通过对少量增益水平中的每一个确定一个脉冲序列,MP-MLQ单元14能选定最靠近地匹配于目标矢量的那一个脉冲序列。
可选的编码器30对输出的脉冲序列和增益指数进行编码以供存储或传输。
图2中给出了MP-MLQ单元14的具体操作。在初始化步骤40,单元14产生如下信号:
a)由短时特性a_i得到的输入帧的脉冲响应h〔n〕定义为:
h〔n〕=∑a_i*h〔n-i〕+δ〔n〕,0≤n≤N-1,i≤i≤p (2)
h〔-n〕=0,n=1..P
这里P是短时特性的个数,N是在该子帧中的语音样本数。
b)对每个样本位置l,脉冲响应的自相关结果r_hh〔l〕为:
r_hh〔l〕=∑h〔n〕*h〔n-l〕,0≤l≤N-1,1≤n≤N-1 (3)
c)对每个样本位置l,脉冲响应h〔n〕与目标矢量t〔n〕之间的互相关结果r_th〔l〕为:
r_th〔l〕=∑t〔n〕*h〔n-l〕,0≤l≤N-1,1≤n≤N-1 (4)
将会理解,脉冲响应是沿线17由分析器10提供的短时特性a_i的函数。在初始化步骤40产生的脉冲响应对应于前文所述DurbinLPC分析。
MP-MLQ单元14利用一个局部(local)判据Lc_kj〔l〕对每个样本位置l、每个脉冲K、以及每个增益水平j确定一个定量值。如在下文中所见,该局部判据的水平依赖于K值(即依赖于已经确定的脉冲个数)。
在步骤42,用于确定第一脉冲的局部判据Lc_o,j〔l〕被初始化为互相关函数r_th〔l〕,如下式所示:
LC_O〔l〕=LC_O,j〔l〕=r_th〔l〕,
0≤l≤N-1,j_min≤j≤j_max (5)局部判据的最大局部值还设成某个负值。其位置指数l也初始化为0。
在步骤44-50,确定第一脉冲K=1的位置l。为此,将局部判据LC_O,j〔l〕的绝对值与最大局部值进行比较(步骤44)。如果LC_O,j〔l〕较大,则存储位置l,最大局部值被说成局部判据LC_O,j〔l〕的绝对值(步骤46)并对位置指数l增加1(步骤48)。重复进行这一操作,直到对所有位置l都已检查过一遍为止。在所有位置都已检查一遍之后所存储的样本位置l_cpt就是所选择的样本位置l_opt。步骤40-50是由脉冲位置确定器20完成的。
步骤52由增益区间确定器22完成。在步骤52,按下式生成一个产生最大局部判据LC_O,j〔l〕的位置l的最大振幅A_max:
A_max=A_max_j=|lC_O,j〔l_opt〕|/r_max,j_min≤j≤j_max (6)
这里l_opt是第一脉冲位置。然后对最大值A_max由预先确定的一组增益水平中的一个来近似。例如,如果预期振幅水平在区间0.1-2.0个单位内,则增益水平可能是每0.1个单位有一个值。这样,如果A_max为0.756,它的量化值即为0.8。
步骤54-58由增益选择器24完成。在步骤54,增益选择器24确定与所定增益水平对应的增益指数j以及在增益指数j周围的增益指数区间。增益水平区间能为任何大小,取决于预先确定的MLQ_STEPS值,在步骤54,增益选择器24把增益指数设为其极小值。对于前例,0.1可以有增益指数1,而MLQ_STEPS可以为3。这样,所确定的增益指数为8,而区间为指数5-11。步骤54还把一个极小全局值设成任一很大的值,如1013。
在本发明中,对于每个增益指数,第一脉冲是由脉冲位置确定器20确定的脉冲位置(在步骤44-50中)。而其余的脉冲可为子帧内的任何其他脉冲,而且可有正的或负的增益值。在步骤56,增益选择24存储第一脉冲位置及其振幅。在步骤58,通常根据等式5对当前脉冲指数K和增益指数j来初始化局部判据LC_K,j〔l〕。
脉冲序列确定器25完成步骤60-74。在步骤60,确定器25把最大局部值设成一个大值(这和以前一样),并设位置指数l为0。
在步骤62,确定器25更新与前一个脉冲相连系的局部判据,按下式进行:
LC_K,j〔l〕=LC_K-1,j〔l〕-A_K-1,j*r_hh〔l-l_opt_k-1,j〕,
j=增益指数
k=脉冲指数
l=位置指数
在步骤64-70的循环中,脉冲序列确定器25确定脉冲位置,其确定方式与步骤44-50中完成的方式相似,所以这里不再进一步描述。在步骤72,确定器25存储所选的脉冲,在步骤74中它更新脉冲值。对序列中的每个脉冲重复步骤62-74,其结果是脉冲序列确定器25的脉冲序列输出。需要说明的是,步骤62对所发现的每个脉冲更新其局部判据。
图3A和3B给出脉冲序列确定器25的不同脉冲序列输出的两个实例。因3A的序列有增益指数7,图3B的序列有增益指数8。这两个序列有相同的第一样本位置10,但其余脉冲位于其他位置。需要说明的是脉冲可为正或负脉冲。
在步骤76,目标矢量匹配28对每个增益水平j确定其全局判据GC_j的值。全局判据GC_j可以是任何适当的判据,但通常的最大似然型判据。例如,全局判据可以测量一个误差矢量中的能量,该误差矢量定义为目标矢量与通过一个感性加权滤波器对单增益脉冲序列进行滤波所产生的一个估计矢量之差,在本实施例中,该感性加权滤波器由短时特性确定。对这样一个判据,目标矢量匹配器28包括一个感性加权滤波器。
将会理解,脉冲序列本身并不与目标矢量匹配;脉冲序列代表一个与目标矢量匹配的函数。
如下面的8a-8e等式所给出的那样,全局判据GC_j由两部分组成,即p_j和d_j二者都是信号x_j〔n〕的函数,而信号x_j〔n〕是由短时脉冲响应h〔n〕滤波的增益水平为j的脉冲系列。p_j是目标矢量t〔n〕和x〔n〕之间的互相关,d_j是x_j〔n〕的能量。
GC_j=-2p_j+d_j (8a)
p_j=∑t〔n〕*x_j〔n〕,0≤n≤N-1 (8b)
d_j=∑x_j〔n〕*x_j〔n〕,0≤n≤N-1 (8c)
x_j〔n〕=∑v_j〔i〕*h〔i-n〕,0≤i≤n,0≤n≤N-1 (8d)
在步骤78,将当前增益指数j的全局判据GC_j与当前的最小全局值进行比较。如果它小于当前最小全局值(在步骤78进行这种检验),则目标矢量匹配器28存储(步骤80)该增益指数及其相应的脉冲序列。
在步骤82,增益水平选择器24更新其增益指数,并在步骤84由它检验是否已对全部增益水平确定了脉冲序列。如果是,则所存储的脉冲序列和增益指数是根据全局判据GC_j最好匹配于目标矢量的脉冲序列和增益指数。
在步骤86,可选编码器根据任何一个编码方法对脉冲序列及增益指数进行编码,以构成输出信号供存储或传输。如果愿意的话,目标矢量可用x_jopt〔n〕来重建,这里的jopt是由步骤84产生的增益指数。
将会理解,本发明的MP-MLQ单元14至少提供所选择的脉冲序列和增益水平作为输出信号。现在参考图4A、4B、5和6,它们给出本发明的利用脉冲系列的另一实施例。图4显示出一个脉冲系列83。它由脉冲系列81构成,各脉冲间距为Q,它就是音调。
在图5所示系统中找出一个脉冲系列序列,该序列与一目标矢量最匹配。图4B显示可能会找到的三个脉冲系列83a、83b和83c的实例序列。每个脉冲系列83从不同的样本位置开始。脉冲系列83a是第一个,由4个脉冲组成。脉冲系列83b在稍后的一个位置开始,由3个脉冲组成,而脉冲系列83c在其后很多的位置开始,且只由2个脉冲组成。
图5的系统与图1的系统相似,其差别只在于:a)图1中的脉冲位置确定器20和脉冲系列确定器25被脉冲系列确定器88和脉冲系列序列确定器89所替代;b)标号90的目标矢量匹配器作用于系列序列,而不是作用于脉冲序列;c)确定器88和89沿输出线18接收音调值Q。此外,输出线34和38被输出线92和94所取代,输出线92和94携带的信号代表脉冲系列序列而不是脉冲序列。
脉冲系列确定器88的操作与脉冲确定器20相似,只是确定器88利用脉冲系列的脉冲响应h_T〔n〕,而不是利用脉冲的脉冲响应h〔n〕。h_T〔n〕定义为:
h_T〔n〕=∑h〔n-k-Q〕,0≤n≤N-1,0≤n≤(N-1)/Q (9)这里Q是音调值。可以看出,在较后位置的脉冲系列通常有较少脉冲。
脉冲系列的等式3所示脉冲响应自相关变为
r_hh〔h〕=∑h_T〔n〕*h-T〔n-1〕,0≤l≤N-1,1≤n≤N-1
(10)对每个样本位置l,脉冲响应h_T〔n〕和目标矢量t〔n〕之间的互相关r_th〔l〕变为:
r_th〔l〕=∑t〔n〕*h_T〔n-1〕,0≤l≤N-1,l≤n≤N-1 (11)
脉冲系列序列确定器89的操作与脉冲序列确定器25相似,但确定器89产生的是脉冲系列序列。
目标矢量匹配器90的操作与目标矢量匹配器28相似,然而匹配器90利用的是脉冲系列的脉冲响应函数h_T〔n〕,而不是利用h〔n〕。这样,等式8d变为:
x_j〔n〕=∑v_j〔i〕*h_T〔i-n〕,0≤i≤n,0≤n≤N-1 (12)
图6中给出脉冲系列多脉冲分析单元86的具体操作,其步骤等同于图2所示步骤,然而各等式是作用于脉冲系列而不是单个脉冲。这样在等式9中定义脉冲系列的脉冲响应h_T〔n〕,它每间隔Q步有脉冲。在较后位置的脉冲系列通常有较少脉冲。
其余的等式也类似,只是它们作用于脉冲响应h_T〔n〕。
如果愿意的话,由增益区间确定器22确定的增益区间可以只有一个增益指数。在这个实施例中,脉冲系列多脉冲分析单元86确定的脉冲系列序列有第一脉冲系列序列的增益水平。在这个实施例中,目标矢量匹配器90不操作,也没有增益水平选择器24和脉冲系列序列确定器89的重复操作。
将会进一步理解,可以把目标矢量匹配器28和90的输出加以比较,这示于图7。现在参考图7。匹配器28和90沿着输出线38和94向比较器100提供代表序列和全局判据的输出信号。比较器100比较来自匹配器28和90的全局判据GC_jopt,并选择最低的一个。沿输出线102提供输出信号,该信号代表产出的脉冲序列或脉冲系列序列。
将会理解,图1、5、7的各系统能应用于数字信号处理芯片或软件中。在一个实施例中,软件是用程序语言C++写的,在另一个实施例中是用汇编语言写的。
精通本门技术的人们将会理解,本发明不限于上文已具体显示和描述的内容。本发明的范围将只由下文中的权利要求书所规定。
Claims (17)
1.一种语音处理系统,包括:
连到输入和输出线上的一个短时分析器,其中所述短时分析器响应所述输入线上的输入语音信号,产生所述输入语音信号的短时特性;
目标矢量发生器由至少是所述输入语音信号以及可选的所述短时特性来产生一个目标矢量;以及
与所述目标矢量发生器的输出线相连的多脉冲分析器,这里所述多脉冲分析器产生一组等振幅、可变符号、可变间距的脉冲序列,所述一组序列的每一个序列有与其他序列不同的振幅值,在每个序列中所述每个脉冲有相等的振幅但可变的符号,所述多脉冲分析器输出一个对应于一个等振幅、可变符号、可变间距脉冲序列的信号,该序列是根据最大似然判据最能代表所述目标矢量的序列。
2.一个语音处理系统,包含一个短时分析器,用于通过对输入语音信号进行线性预测系数分析来产生短时特性,该系统包括:
一个目标矢量发生器,用于至少由所述输入语音信号及可选的短时特性产生一个目标矢量;
一个初始脉冲位置确定器,用于根据多脉冲分析技术根据所述目标矢量和短时特性确定初始脉冲位置;
振幅区间确定器用于确定所述初始脉冲的振幅及在所述振幅绝对值周围集中的量化振幅水平的变化区间;
振幅水平选择器用于根据预定的步长大小移动以通过所述量化振幅水平区间,所述振幅水平选择器对每一步长输出一个选定的量化振幅;
脉冲序列确定器用于根据所述选定的量化振幅确定一个等振幅、可变符号、可变间距脉冲序列,该序列对应于所述目标矢量;以及
目标矢量匹配器用于确定一对应于所述等振幅、可变符号、可变间距脉冲序列和所述目标矢量之间匹配质量的误差矢量,用于对每个选定振幅确定所述误差矢量,以输出对应于最小误差矢量的所述等振幅、可变符号、可变间距脉冲序列。
3.根据权利要求2的系统,其中,每个所述等振幅、可变符号、可变间距脉冲序列的初始脉冲位于同一样本位置。
4.根据权利要求2的系统,其中所述目标矢量匹配器包括一全局判据确定器,所述全局判据确定器包括一个用于滤波所述等振幅、可变符号、可变间距脉冲序列的感性加权滤波器,以及一个用于对每个所述选定量化振幅确定所述误差矢量的能量的确定器,所述误差矢量定义为所述目标矢量和所述滤波器输出之差,所述感性加权滤波器的特性对应于短时特性。
5.一种语音处理系统,该系统包含一个短时分析器,用于通过对输入语音信号进行线性预测系数分析来产生短时特征,还包含一个长时分析器用于由输入语音信号确定长时特性及语音的音调值,该系统包括:
目标矢量发生器用于至少由所述输入语音信号以及可选的短时和长时特性来产生一个目标矢量;
初始脉冲系列位置确定器用于根据多脉冲分析技术以所述目标矢量、短时特征和音调值为基础确定初始脉冲系列的位置;
脉冲系列序列确定器用于产生一组与所述目标矢量对应的可变符号的等振幅、均匀分布的脉冲系列,所述脉冲系列的脉冲间距对应于音调值,所述每个系列中的各脉冲有相同符号,所述各系列的所述脉冲有相同的振幅水平。
6.一种语音处理系统,包括:
与输入和输出线相连的一个长时分析器,这里所述长时分析器响应所述输入线上的输入语音信号,产生长时特性,所述长时特性至少包含所述输入语音信号的音调值;
与所述输入线和输出线相连的短时分析器,这里所述短时分析器产生所述输入语音信号的短时特性;
目标矢量发生器用于至少由所述输入语音信号以及可选的短时和长时特性产生目标矢量;以及
连于所述目标矢量发生器一输出线的脉冲系列多脉冲分析器,用于产生一组可变符号的等振幅、均匀分布脉冲系列的序列,在每个系列中的脉冲有相同符号,而所述脉冲系列序列中的每个序列有与其他序列不同的振幅值,所述脉冲系列多脉冲分析器输出的信号对应于一组等振幅、均匀分布脉冲系列,该脉冲系列根据最大似然判据最能代表所述目标矢量。
7.根据权利要求6的系统,其中,在每个所述脉冲系列中的每个所述脉冲由所述音调值彼此分开。
8.根据权利要求6的系统,其中,每个所述脉冲系列序列中的初始系列的初始脉冲位于同一样本位置。
9.一种语音处理系统,该系统含有一个短时分析器,用于通过对输入语音信号进行线性预测系数分析来产生短时特性,还含有一个长时分析器用于由该输入语音信号确定长时特性,所述长时特性包括语音的音调值,该系统包括:
目标矢量发生器用于至少由所述输入语音信号及可选的短时和长时特性来产生一目标矢量;
初始脉冲系列位置确定器用于根据多脉冲分析技术,以所述目标矢量、短时特性和音调值来确定初始脉冲系列的位置;
振幅区间确定器用于确定所述初始脉冲系列的振幅以及在所述振幅绝对值周围集中的量化振幅水平的区间;
振幅水平选择器根据预定步长大小移动以通过所述量化振幅水平区间,所述振幅水平选择器输出在每一步长的选定量化振幅;
脉冲系列序列确定器用于对所述选定的每一个量化振幅,产生一组可变符号的等振幅、均匀分布脉冲系列,它对应于所述目标矢量,在所述系列中的脉冲的脉冲间距对应于音调值,每个系列中的脉冲具有相同符号,在每个脉冲系列中的所述脉冲具有相等振幅,所述相等振幅对应于所选定的量化振幅;以及
目标矢量匹配器用于确定一个误差矢量,该误差矢量对应于所述一组可变符号的等振幅、均匀分布脉冲系列序列与所述目标函数的匹配质量,所述目标矢量匹配器用于输出对应于最小误差矢量的等振幅、同符号、均匀间距的脉冲系列序列。
10.根据权利要求9的系统,其中所述目标矢量匹配器包括一全局判据确定器,所述全局判据确定器包括一个感性加权滤波器用于滤波所述一组可变符号的等振幅、均匀间距脉冲系列,还包括一个确定器用于对每个所选定的量化振幅确定所述误差矢量的能量,所述误差矢量定义为所述目标矢量和所述滤波器输出之差,所述感性加权滤波器的特性对应于短时特性。
11.如权利要求10所述的系统,还包括:
与所述目标矢量发生器的输出线相连的多脉冲分析器,这里所述多脉冲分析器产生一组等振幅、可变符号、可变间距的脉冲序列,每个序列有与其他序列不同的振幅值,在每个序列中的每个脉冲有相等振幅但符号可变,所述多脉冲分析器输出一个信号,该信号对应于等振幅、可变符号、可变间距脉冲序列,根据最大似然判据该序列最能代表所述目标矢量;以及
比较器,该比较器接收来自所述脉冲系列多脉冲分析器及所述多脉冲分析器的输出,以选择与所述目标矢量最匹配的输出。
12.一种语音处理方法,包括如下步骤:
确定一输入语音信号的短时特性;
至少由所述输入语音信号及可选的由所述短时特性产生一个目标矢量;
根据多脉冲分析技术,基于所述目标矢量和所述短时特性,确定一初始脉冲的位置;
确定所述初始脉冲的振幅及在所述振幅绝对值周围集中的量化振幅水平的区间;
根据预定步长大小移动以通过量化振幅水平区间并在每个步长输出一个选定的量化振幅;
根据所述选定的量化振幅,产生一个与所述目标矢量对应的一个等振幅、可变符号、可变间距的脉冲序列;
将每个所述等振幅、可变符号、可变间距的脉冲序列与所述目标矢量进行比较;以及
选择所述等振幅、可变符号、可变间距脉冲序列,它根据最大似然判据最能代表所述目标矢量。
13.根据权利要求12的方法,其中,每个所述等振幅、可变符号、可变间距脉冲序列的初始脉冲位于同一样本位置。
14.根据权利要求12的方法,其中所述的比较步骤包括下列步骤:
通过一感性加权滤波器滤波等振幅、可变符号、可变间距的脉冲序列,该滤波器的特性是所述短时的特性;以及
对每个量化振幅水平确定一误差矢量的能量,该误差矢量定义为所述目标矢量与所述滤波器输入之差。
15.一种语音处理方法,包括如下步骤:
确定一输入语音信号的短时特性;
确定所述输入语音信号的长时特性,包括确定所述输入语音信号的一个音调值;
由至少是所述输入语音信号,以及可选地由所述短时和长时特性,产生一个目标矢量;
根据多脉冲分析技术,基于所述目标矢量、所述短时特性及所述音调值,确定初始脉冲系列的位置;以及
产生一组可变符号的等振幅、均匀间距的脉冲系列,它们对应于所述目标矢量,所述系列中的脉冲具有的脉冲间距对应于所述音调值,在所述系列中的脉冲有相同的振幅水平,在每个系列中的脉冲有相同符号。
16.一种语音处理方法,包括如下步骤:
确定所述输入语音信号的短时特性;
确定所述输入语音信号的长时特性,所述长时特性至少包括所述语音信号的音调值;
至少由所述输入语音信号,以及可选地由所述短时和长时特性,产生一个目标矢量;
根据多脉冲分析技术基于所述目标矢量、短时特性及音调值,确定一初始脉冲序列的位置;
确定所述初始脉冲系列的振幅及在所述振幅绝对值周围集中的量化振幅水平的区间;
根据预定步长大小移动以通过所述量化振幅水平区间,并输出在每个步长处的选定量化振幅;
对每个选定的量化振幅,产生一个对应于所述目标矢量的一组可变符号的等振幅、均匀间距的脉冲系列,所述脉冲系列内的脉冲间距对应于所述音调值,每个所述系列中的脉冲有相同振幅,所述相同振幅对应于选定的量化振幅,在每个系列中的脉冲有相同符号;
将所述一组可变符号的等振幅、均匀间距的脉冲系列与所述目标矢量相比较;以及
选定所述一组可变符号的等振幅、均匀间距脉冲系列,它是根据最大似然判据最能代表所述目标矢量的系列。
17.根据权利要求16的方法,其中每个所述脉冲系列序列的初始脉冲位于同一样本位置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/236,764 US5568588A (en) | 1994-04-29 | 1994-04-29 | Multi-pulse analysis speech processing System and method |
US08/236,764 | 1994-04-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1153566A CN1153566A (zh) | 1997-07-02 |
CN1112672C true CN1112672C (zh) | 2003-06-25 |
Family
ID=22890857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95193454A Expired - Fee Related CN1112672C (zh) | 1994-04-29 | 1995-04-27 | 多脉冲分析语言处理系统及其方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US5568588A (zh) |
EP (1) | EP0784846B1 (zh) |
JP (1) | JP3068196B2 (zh) |
KR (1) | KR100257775B1 (zh) |
CN (1) | CN1112672C (zh) |
AU (1) | AU683750B2 (zh) |
BR (1) | BR9507571A (zh) |
CA (1) | CA2189142C (zh) |
DE (1) | DE69521622T2 (zh) |
RU (2) | RU2121172C1 (zh) |
WO (1) | WO1995030222A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3094908B2 (ja) * | 1996-04-17 | 2000-10-03 | 日本電気株式会社 | 音声符号化装置 |
CA2213909C (en) * | 1996-08-26 | 2002-01-22 | Nec Corporation | High quality speech coder at low bit rates |
JP3147807B2 (ja) * | 1997-03-21 | 2001-03-19 | 日本電気株式会社 | 信号符号化装置 |
US7272553B1 (en) | 1999-09-08 | 2007-09-18 | 8X8, Inc. | Varying pulse amplitude multi-pulse analysis speech processor and method |
SE0004818D0 (sv) * | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
US7493258B2 (en) * | 2001-07-03 | 2009-02-17 | Intel Corporation | Method and apparatus for dynamic beam control in Viterbi search |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
SG179433A1 (en) * | 2007-03-02 | 2012-04-27 | Panasonic Corp | Encoding device and encoding method |
CN102959620B (zh) | 2011-02-14 | 2015-05-13 | 弗兰霍菲尔运输应用研究公司 | 利用重迭变换的信息信号表示 |
AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
ES2534972T3 (es) | 2011-02-14 | 2015-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Predicción lineal basada en esquema de codificación utilizando conformación de ruido de dominio espectral |
SG192746A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for processing a decoded audio signal in a spectral domain |
PL3471092T3 (pl) * | 2011-02-14 | 2020-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekodowanie pozycji impulsów ścieżek sygnału audio |
CA2827000C (en) | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
CN110660396A (zh) * | 2018-06-13 | 2020-01-07 | 江苏德新科智能传感器研究院有限公司 | 一种基于mems的语言处理系统及其方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4932061A (en) * | 1985-03-22 | 1990-06-05 | U.S. Philips Corporation | Multi-pulse excitation linear-predictive speech coder |
EP0422232A1 (en) * | 1989-04-25 | 1991-04-17 | Kabushiki Kaisha Toshiba | Voice encoder |
EP0545403A2 (en) * | 1991-12-03 | 1993-06-09 | Nec Corporation | Speech signal encoding system capable of transmitting a speech signal at a low bit rate |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0107659A4 (en) * | 1982-04-29 | 1985-02-18 | Massachusetts Inst Technology | VOICE ENCODER AND SYNTHESIZER. |
US5007094A (en) * | 1989-04-07 | 1991-04-09 | Gte Products Corporation | Multipulse excited pole-zero filtering approach for noise reduction |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
-
1994
- 1994-04-29 US US08/236,764 patent/US5568588A/en not_active Expired - Lifetime
-
1995
- 1995-04-27 BR BR9507571A patent/BR9507571A/pt not_active IP Right Cessation
- 1995-04-27 JP JP7528321A patent/JP3068196B2/ja not_active Expired - Lifetime
- 1995-04-27 CA CA002189142A patent/CA2189142C/en not_active Expired - Fee Related
- 1995-04-27 RU RU96122986A patent/RU2121172C1/ru active
- 1995-04-27 DE DE69521622T patent/DE69521622T2/de not_active Expired - Lifetime
- 1995-04-27 WO PCT/US1995/005014 patent/WO1995030222A1/en active IP Right Grant
- 1995-04-27 KR KR1019960706061A patent/KR100257775B1/ko not_active IP Right Cessation
- 1995-04-27 RU RU96122985A patent/RU2121173C1/ru active
- 1995-04-27 EP EP95917134A patent/EP0784846B1/en not_active Expired - Lifetime
- 1995-04-27 AU AU23948/95A patent/AU683750B2/en not_active Ceased
- 1995-04-27 CN CN95193454A patent/CN1112672C/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4932061A (en) * | 1985-03-22 | 1990-06-05 | U.S. Philips Corporation | Multi-pulse excitation linear-predictive speech coder |
EP0422232A1 (en) * | 1989-04-25 | 1991-04-17 | Kabushiki Kaisha Toshiba | Voice encoder |
EP0545403A2 (en) * | 1991-12-03 | 1993-06-09 | Nec Corporation | Speech signal encoding system capable of transmitting a speech signal at a low bit rate |
Also Published As
Publication number | Publication date |
---|---|
MX9605179A (es) | 1998-06-30 |
AU2394895A (en) | 1995-11-29 |
CN1153566A (zh) | 1997-07-02 |
DE69521622D1 (de) | 2001-08-09 |
BR9507571A (pt) | 1997-08-05 |
CA2189142A1 (en) | 1995-11-09 |
KR100257775B1 (ko) | 2000-06-01 |
EP0784846B1 (en) | 2001-07-04 |
WO1995030222A1 (en) | 1995-11-09 |
EP0784846A4 (zh) | 1997-07-30 |
RU2121172C1 (ru) | 1998-10-27 |
AU683750B2 (en) | 1997-11-20 |
JPH09512645A (ja) | 1997-12-16 |
CA2189142C (en) | 2001-06-05 |
US5568588A (en) | 1996-10-22 |
EP0784846A1 (en) | 1997-07-23 |
RU2121173C1 (ru) | 1998-10-27 |
JP3068196B2 (ja) | 2000-07-24 |
DE69521622T2 (de) | 2003-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1112672C (zh) | 多脉冲分析语言处理系统及其方法 | |
CN1199151C (zh) | 语音编码器 | |
CN1252681C (zh) | 一种码激励线性预测语音编码器的增益量化 | |
CN1167048C (zh) | 语音编码设备和语音解码设备 | |
CN1158648C (zh) | 语音可变速率编码方法与设备 | |
CN1154086C (zh) | Celp转发 | |
CN1152365C (zh) | 音调跟踪装置和方法 | |
CN1126869A (zh) | 语音编码和解码设备及其方法 | |
CN1820306A (zh) | 可变比特率宽带语音编码中增益量化的方法和装置 | |
CN1174457A (zh) | 语音信号传输方法及语音编码和解码系统 | |
CN1252679C (zh) | 声音编码装置、声音编码译码装置、以及声音编码方法 | |
CN1591575A (zh) | 合成语音的方法和装置 | |
CN1885405A (zh) | 语音速度转换装置以及语音速度转换方法 | |
CN1141698C (zh) | 对输入语音进行语音识别的音程标准化装置 | |
CN1265217A (zh) | 在语音通信系统中语音增强的方法和装置 | |
CN1151491C (zh) | 音频编码装置和音频编码译码装置 | |
CN1977311A (zh) | 语音编码装置、语音解码装置及其方法 | |
CN1302460C (zh) | 语音编码中噪音鲁棒分类方法和装置 | |
CN1486486A (zh) | 用于编码和解码声学参数的方法、设备和程序及用于编码和解码语音的方法、设备和程序 | |
CN1083294A (zh) | 对语音编码的随时间变化的频谱按内插法进行分析的方法 | |
CN1787075A (zh) | 基于内嵌gmm核的支持向量机模型的说话人识别方法 | |
CN1264887A (zh) | 基于语音识别专用芯片的非特定人语音识别、语音提示方法 | |
CN1293535C (zh) | 声音编码设备和方法以及声音解码设备和方法 | |
CN1795491A (zh) | 分析基频信息的方法以及实现所述分析方法的话音转换方法和系统 | |
CN1787074A (zh) | 基于情感迁移规则及语音修正的说话人识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent for invention or patent application | ||
COR | Change of bibliographic data |
Free format text: CORRECT: APPLICANT; FROM: JONATHAN EDWARD SHERMAN TO: AUDICODT COMPANY |
|
CP03 | Change of name, title or address |
Address after: Israel Ooijer hada Applicant after: Audiocodes Ltd. Address before: Israel card Azerbaijan Applicant before: Jonathan Edward Sherman |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |