CN1352451A - 对背景噪音信号进行高质量解码的语音解码器 - Google Patents
对背景噪音信号进行高质量解码的语音解码器 Download PDFInfo
- Publication number
- CN1352451A CN1352451A CN01134499A CN01134499A CN1352451A CN 1352451 A CN1352451 A CN 1352451A CN 01134499 A CN01134499 A CN 01134499A CN 01134499 A CN01134499 A CN 01134499A CN 1352451 A CN1352451 A CN 1352451A
- Authority
- CN
- China
- Prior art keywords
- signal
- frequency spectrum
- spectrum parameter
- pumping signal
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 93
- 230000004044 response Effects 0.000 claims abstract description 9
- 238000005086 pumping Methods 0.000 claims description 94
- 238000009499 grossing Methods 0.000 claims description 30
- 238000001914 filtration Methods 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 20
- 239000002131 composite material Substances 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 5
- 230000005284 excitation Effects 0.000 abstract description 9
- 230000003595 spectral effect Effects 0.000 abstract description 5
- 230000015572 biosynthetic process Effects 0.000 abstract description 2
- 238000003786 synthesis reaction Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- JEIPFZHSYJVQDO-UHFFFAOYSA-N ferric oxide Chemical compound O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
响应于语音编码器输出的编码语音信号,语音解码器将该编码语音信号解码为再生语音信号。如果再生语音信号满足预定的条件,如“静默”、“清音”等,语音解码器还进行以下的工作。语音解码器根据再生语音信号计算频谱参数,并根据再生语音信号和频谱参数的计算激励信号。在计算中,还得到激励信号的电平。语音解码器在时间上平滑频谱参数和激励信号电平中的至少一个。语音解码器使用以频谱参数构成的合成滤波器合成激励信号,从而再现语音信号。即使比特率很低,语音信号也有非常好的质量。
Description
发明背景
本发明涉及对语音信号进行解码的语音解码器,具体地说,本发明涉及能高质量地对背景噪音信号进行解码的解码器,其中背景噪音信号包含在低比特率的语音信号之中。
作为一种对语音信号进行高效编码的方法,CELP(编码激励线性预测编码)是本领域所公知的,其在M.Schroeder和B.Atal的《编码激励线性预测:极低比特率的高质量语音》(ICASSP会议论文集,第937-940页,1985:下文中称为文献1)、Kleijn等人的《CELP中改善的语音质量和高效的向量量化》(ICASSP会议论文集,155-158页,1988:下文中称为文献2)等中有所记述。文献1、2在此引用作为参考。
在常规的方法中,在发送侧,通过线性预测(LPC)分析为每一帧(如20ms长)语音信号提取表示语音信号频谱特征的频谱参数。然后,将每一帧划分为子帧(如5ms长)。对于每一个子帧,根据先前的激励信号,从自适应编码本中提取参数(对应于音调周期的增益参数和延时参数)。通过使用自适应编码本,对子帧的语音信号进行音调预测。对于通过音调预测而得到的激励信号,从包含预定的各种噪音信号的激励编码本(向量量化编码本)中选取最优的激励编码向量,并计算最优的增益。由此,激励信号就被量化。
激励编码向量的选取使得由所选取的噪音信号和上述的残余信号合成的信号之间的偏差能量最小。
由多路复用器单元将表示所选取的编码向量类别的索引、增益、频谱参数、以及自适应编码本的参数加以组合,并发送出去。
另外,为了减少检索激励编码本所需的计算量,提出了各种方法。
例如,有一种ACELP法(代数编码激励线性预测)。这种方法在C.Laflamme等人的《基于代数CELP的16kbps宽带语音编码技术》(ICASSP会议论文集,第13-16页,1991:下文中称为文献3)。在此引用文献3加入到本说明书中。
根据文献3中记述的方法,激励信号由多个脉冲表示,而且每个脉冲的位置由预定数目的比特表示,并被发送。在此每个脉冲的幅度限制为+1.0或-1.0。因此对脉冲检索所需的计算量可以显著地减少。
但是,根据上述的常规方法和技术,存在一个问题,在比特率为8kb/s或更高时才能获得最好的声音质量,但是在较低的比特率下,特别是有背景噪音叠加在语音上时,编码语音的背景噪音部分的声音质量会恶化。例如在蜂窝式电话中进行语音编码的情况下,这个问题非常明显。
根据文献1和文献2中记述的编码方法,编码比特率的降低会导致包含在激励编码本中的比特数的减少,从而导致波形的再现精度降低。波形再现精度的降低在高波形相关性的信号如语音信号上并不明显,但在低波形相关性的信号如背景噪音信号上,却非常明显。
在文献3中记述的编码方法中,激励信号由脉冲的组合表示。脉冲组合适于模拟语音信号,从而得到优异的声音质量。但是在低的比特率下,编码语音的声音质量会显著地降低,因为单个子帧的脉冲数不足以高精度地表示激励信号。
原因如下:激励信号由多个脉冲的组合表示。因此,在语音的元音期,脉冲集中在音调起点的音调脉冲周围。这时,语音信号可以有效地由少量脉冲表示。另一方面,对于随机信号,如背景噪音,必然产生不集中的脉冲。这时就难以用少量的脉冲恰当地表示背景噪音。这样,如果比特率降低,脉冲数减少,背景噪音的声音质量就会显著地降低。
根据上述的常规方法和技术产生的问题,本发明的一个目的是消除上述的问题,并提供一种改进的语音解码器,用以对由上述方法和技术编码而叠加上了背景噪音信号的语音信号进行解码。该改进的语音解码器需要相对较少的计算量,即使比特率很低也可以对语音信号进行解码,而声音质量不会有严重的恶化。
发明概述
为了达到上述的目的,本发明的第一方面提供了一种语音解码器,用以根据再生语音信号的特定条件,将编码语音信号解码为再生语音信号,利用该再生语音信号再现语音信号。
根据本发明第一方面的语音解码器包括:频谱参数计算电路,其响应于再生语音信号,用于根据再生语音信号计算频谱参数;激励信号计算电路,用于根据再生语音信号和频谱参数计算电路计算得到的频谱参数计算激励信号,获取激励信号的电平;平滑电路,响应于频谱参数和激励信号,在时间上平滑频谱参数和激励信号电平中的至少一个,以输出其中至少有一个是经过了平滑的频谱参数和激励信号;合成滤波电路,其具有以平滑电路输出的频谱参数构成的合成滤波器,用于通过使用合成滤波器合成激励信号而再现语音信号;其中激励信号计算电路、平滑电路和合成滤波电路只按照预定的条件工作。
在上述的语音解码器中,激励信号计算电路可以使用频谱参数对再生语音信号进行逆滤波,以计算激励信号。另外,上述的语音解码器可以包括模式判断电路,用以通过从再生语音信号中提取特征量而判断再生语音信号的模式,其中的预定条件包括模式条件,即再生语音信号的模式由模式判断电路判断为预定的模式。在这种情况下,激励信号计算电路、平滑电路和合成滤波电路只在满足模式条件的情况下工作。在此,预定的模式是,例如,“静默”或“清音”。
本发明的第二个方面是提供另一种语音解码器,用于将编码语音信号解码为再生语音信号,并用于使用该再生语音信号再现语音信号。
根据本发明第二方面的语音解码器包括:频谱参数计算电路,其响应于再生语音信号,用于根据再生语音信号计算频谱参数;激励信号计算电路,用于根据再生语音信号和频谱参数计算电路计算得到的频谱参数计算激励信号,获取激励信号的电平;音调预测电路,其根据再生语音信号或激励信号计算音调周期,利用音调周期进行音调预测,从而生成音调预测信号,并通过从激励信号中减去音调预测信号而计算残余信号;增益计算电路,用于计算音调预测信号和残余信号中至少一个的增益,其中音调预测信号和残余信号都是从音调预测电路输出的;平滑电路,响应于频谱参数和增益,在时间上平滑频谱参数和增益中的至少一个,以输出其中至少有一个是经过平滑的频谱参数和激励信号;以及合成滤波电路,其具有以从平滑电路输出的频谱参数构成的合成滤波器,用于基于增益、音调预测信号和残余信号重新生成适当的激励信号,从而使用合成滤波器合成适当的激励信号,以再现语音信号。
在根据本发明第二个方面的语音解码器中,激励信号计算电路可以使用频谱参数对再生语音信号进行逆滤波,以计算激励信号。
本发明的第三个方面提供了一种再现语音信号的方法。包括:第一步,将语音编码器输出的编码语音信号解码,以生成再生语音信号;第二步,根据再生语音信号计算频谱参数;第三步,根据再生语音信号和频谱参数计算激励信号,获取激励信号的电平;第四步,在时间上平滑频谱参数和激励信号电平中的至少一个,以输出其中至少有一个是经过平滑的频谱参数和激励信号;第五步,使用构有频谱参数的合成滤波器合成激励信号,以再现语音信号;其中第二至第五步只在满足预定条件的情况下进行,在不满足预定条件的其它情况下,再生语音信号作为语音信号处理。
在根据本发明第三个方面的语音再现方法中,可以进行第三步,以使用频谱参数对再生语音信号进行逆滤波,从而计算激励信号。另外,上述的再现方法可以包括第六步,通过从再生语音信号中提取特征量而判断再生语音信号的模式,其中的预定条件包括模式条件,即再生语音信号的模式被判断为预定的模式。在此,预定的模式是,例如,“静默”或“清音”。
本发明的第四个方面提供了另一种再现语音信号的方法。包括:第一步,将语音编码器的编码语音信号输出解码,以生成再生语音信号;第二步,根据再生语音信号计算频谱参数;第三步,根据再生语音信号和频谱参数计算激励信号,获取激励信号的电平;第四步,根据再生语音信号或激励信号计算音调周期,利用音调周期进行音调预测,以生成音调预测信号,并从激励信号中减去音调预测信号而计算残余信号;第五步,计算音调预测信号和残余信号中至少一个的增益;第六步,在时间上平滑频谱参数和增益中的至少一个,以输出其中至少有一个是经过平滑的频谱参数和激励信号;第七步,基于增益、音调预测信号以及残余信号重新生成适当的激励信号,然后使用以频谱参数构成的合成滤波器合成适当的激励信号,从而再现语音信号。
在根据本发明第四个方面的语音再现方法中,可以进行第三步,以使用频谱参数对再生语音信号进行逆滤波,从而计算激励信号。
需要理解的是,前面的说明和接下来的详细说明都只是示例性的和解释性的,不对本发明的范围构成限制,本发明的范围由 所限定。
附图说明
在说明书中并作为说明书一部分的附图说明了本发明的实施例,并与说明书一起用于解释本发明的原理。附图中:
图1是根据本发明第一个实施例的语音解码器的示意框图;
图2是根据本发明第二个实施例的另一个语音解码器的示意框图;
图3是根据本发明第三个实施例的另一个语音解码器的示意框图;
优选实施例的详细说明
根据一个优选实施例的语音解码器包括:解码电路,用于将编码语音信号解码为再生语音信号;以及再现电路,用于使用再生语音信号再现语音信号。解码电路可以是根据文献1、2或3中公开的技术的常规的语音解码器。再现电路布置在解码电路的下一级。
图1是根据第一个实施例的语音解码器的再现电路的框图。
所示的再现电路包括:频谱参数计算电路10、逆滤波电路20、平滑电路30、以及合成滤波电路40。逆滤波电路20用作激励信号计算电路。
再生语音信号d(n)被供给频谱参数计算电路10,然后在线性预测分析的基础上,通过使用再生语音信号d(n),按照预定的次数计算频谱参数αi(i=1,…,P:例如P=10)。逆滤波电路20使用频谱参数αi对再生语音信号d(n)进行逆滤波。逆滤波生成激励信号x(n)。平滑电路30接收频谱参数αi和逆滤波电路20计算的激励信号x(n),然后在时间上对频谱参数αi和激励信号x(n)的RMS中的至少一个进行平滑,从而输出其中至少有一个是经过平滑的频谱参数αi和激励信号x(n)。合成滤波电路40具有以从平滑电路输出的频谱参数αi构成的合成滤波器,其使用合成滤波器合成激励信号x(n),从而再现语音信号。
详细地说,根据第一个实施例的语音解码器如下工作:
当被提供再生语音信号d(n)时,频谱参数计算电路10在线性预测分析的基础上,使用再生语音信号d(n),按照预定的次数计算频谱参数αi。为在频谱参数计算电路10中计算频谱参数,可以运用公知的LPC(线性预测编码)分析、Burg分析,等等。在这个实施例中,采用了Burg分析。关于Burg分析的详细情况,可以参考Nakamizo写的《信号分析和系统识别》(1998年出版,Corona),82-87页(下文中称为文献4)中的说明。将文献4通过引用结合于本说明中。
由频谱参数计算电路10计算的频谱参数αi送至逆滤波电路20和平滑电路30。
在逆滤波电路20中,按照下面的公式(1),根据频谱参数计算电路10计算的频谱参数αi,对再生语音信号d(n)进行逆滤波,从而计算激励信号x(n)。
在平滑电路30中,对频谱参数αi和激励信号x(n)的RMS中的至少一个在时间上进行平滑,然后都输出到合成滤波电路40。
按照下面的公式(2)对激励信号x(n)的RMS进行平滑。
RMS(m)=λ
RMS(m-1)-(1-λ)RMS(m) …(2)
另一方面,按照下面的公式(3)对频谱参数ai进行平滑。
在这个实施例中,是在线性频谱对(LSP)上对频谱参数αi进行平滑,然后逆变换成平滑的频谱参数ai。关于频谱参数αi和LSP参数之间的变换和逆变换,可以参考Sugamura等人的《使用线性频谱对(LSP)语音分析-合成技术的语音数据压缩》(日本电子通信学会期刊,J64-A,599-606页,1981:下文中称为文献5)。文献5通过引用结合于本说明中。
然后,在合成滤波电路40中,将利用平滑电路30输出的频谱参数αI来构造合成滤波器,使用合成滤波器合成激励信号x(n),从而再生语音信号。
图2是根据本发明第二个实施例的语音解码器的再现电路的方框图。
从图1和图2可见,第二个实施例是第一个实施例的改进,除了模式判断电路50之外,它们相互是类似的。因此,在语音解码器中各元件以相似的方式工作的情况下,图2所示的第二个实施例中的语音解码器的元件和图1所示的第一个实施例中的语音解码器的元件标有同样的数字标号。图2所示的逆滤波电路20、平滑电路30和合成滤波电路40在模式判断电路50判断的模式下被控制,从控制的角度讲,与第一个实施例中的这些电路不同。
接收到再生语音信号d(n)时,模式判断电路50按照下面的公式(4)从再生语音信号d(n)中提取特征量。
然后模式判断电路50把提取的特征量与预定的阈值相比较,从而判断再生语音信号d(n)的模式。
模式判断电路50的判断,即所判断的模式,被送至逆滤波电路20、平滑电路30和合成滤波电路40。在这个实施例中,逆滤波电路20、平滑电路30和合成滤波电路40只在满足预定条件的情况下工作。如果满足预定的条件,逆滤波电路20、平滑电路30和合成滤波电路40和第一个实施例一样地工作。如果不满足,逆滤波电路20、平滑电路30和合成滤波电路40不工作,从而再生语音信号作为语音信号输出。
在这个实施例中,预定的条件是再生语音信号d(n)的判断模式与预定的模式一致。预定的模式是,例如,“静默”或“清音”。如果再生语音信号d(n)的判断模式不符合预定的模式,则在这个实施例中,逆滤波电路20、平滑电路30和合成滤波电路40不工作。
图3是根据本发明第三个实施例的语音解码器中再现电路的方框图。
从图1和图3可见,第三实施例是第一个实施例的改进。这个实施例的再现电路除了频谱参数计算电路10、逆滤波电路20、平滑电路30和合成滤波电路40之外,还包括音调预测电路60、增益计算电路70。
在这个实施例中,频谱参数计算电路10和逆滤波电路20与第一个实施例同样地工作。
音调预测电路60由再生语音信号d(n)或激励信号x(n)计算音调周期T。然后音调预测电路60利用音调周期T进行音调预测,从而生成音调预测信号p(n),并通过从激励信号x(n)中减去音调预测信号p(n)而计算残余信号e(n)。增益计算电路70计算从音调预测电路输出的音调预测信号p(n)和残余信号e(n)中的至少一个的增益。增益计算电路70将计算的增益、音调预测信号p(n)和残余信号e(n)送至平滑电路30。
平滑电路30接收频谱参数αi、增益、音调预测信号p(n)和残余信号e(n),然后在时间上平滑频谱参数αi和增益中的至少一个。平滑电路30将频谱参数αi、增益、音调预测信号p(n)和残余信号e(n)送至合成滤波电路40,其中频谱参数αi和增益中至少有一个是经过了平滑处理的。
合成滤波电路40具有利用从平滑电路输出的频谱参数αi构造的合成滤波器,其基于增益、音调预测信号p(n)和残余信号e(n)重新生成另一个适当的激励信号。该适当的激励信号是使用合成滤波器合成的,并再现为语音信号。
以上结合优选实施例详细地说明了本发明,很容易理解,本发明不限于这些公开的实施例。本发明可以加以改进,并包括此前未说明、但等同于本发明的精神和范围的各种变化、变更、替换或等同配置。因此,本发明不限于以上的说明,本发明的范围只由所附的 所限定。
2000年11月6日提出的日本专利申请No.2000-337805的全部公开,包括说明书、权利要求书、附图和摘要,在此整体引用作为参考。
Claims (14)
1.一种用于将编码语音信号解码为再生语音信号,并利用再生语音信号再现语音信号的语音解码器,包括:
频谱参数计算电路,响应于再生语音信号,用于根据再生语音信号计算频谱参数;
激励信号计算电路,用于根据再生语音信号和频谱参数计算电路计算的频谱参数计算激励信号,获取激励信号的电平;
平滑电路,响应于频谱参数和激励信号,用于在时间上平滑频谱参数和激励信号电平中的至少一个,从而输出其中至少有一个是经过了平滑的频谱参数和激励信号;
合成滤波电路,具有以从平滑电路输出的频谱参数构成的合成滤波器,用于使用该合成滤波器合成激励信号,从而再现语音信号;其中
激励信号计算电路、平滑电路和合成滤波电路只在满足预定条件的情况下工作。
2.如权利要求1所述的语音解码器,其特征在于,所述激励信号计算电路利用频谱参数对再生语音信号进行逆滤波,从而计算激励信号。
3.如权利要求1所述的语音解码器,还包括模式判断电路,用于通过从再生语音信号中提取特征量从而判断再生语音信号的模式,其中预定的条件包括模式条件,即再生语音信号的模式被模式判断电路判断为预定的模式,从而激励信号计算电路,平滑电路和合成滤波电路只在满足模式条件的情况下工作。
4.如权利要求3所述的语音解码器,其中所述预定的模式是静默。
5.如权利要求3所述的语音解码器,其中所述预定的模式是“清音”。
6.一种用于将编码语音信号解码为再生语音信号,并利用再生语音信号再现语音信号的语音解码器,包括:
频谱参数计算电路,响应于再生语音信号,根据再生语音信号计算频谱参数;
激励信号计算电路,用于根据再生语音信号和频谱参数计算电路计算的频谱参数计算激励信号,获取激励信号的电平;
音调预测电路,由再生语音信号或激励信号计算音调周期,利用音调周期进行音调预测,以生成音调预测信号,并通过从激励信号中减去音调预测信号而计算残余信号;
增益计算电路,用于计算从所述音调预测电路输出的音调预测信号和残余信号中至少一个的增益;
平滑电路,响应于所述频谱参数和激励信号,在时间上平滑所述频谱参数和激励信号电平中的至少一个,从而输出其中至少有一个是经过了平滑的频谱参数和激励信号;
合成滤波电路,具有以从平滑电路输出的频谱参数构成的合成滤波器,用于重新生成基于增益、音调预测信号和残余信号的适当的激励信号,从而使用该合成滤波器合成适当的激励信号,以再现语音信号。
7.如权利要求6所述的语音解码器,其特征在于,激励信号计算电路利用频谱参数对再生语音信号进行逆滤波,从而计算激励信号。
8.一种再现语音信号的方法,包括:
第一步,将语音编码器输出的编码语音信号解码,从而生成再生语音信号;
第二步,根据再生语音信号计算频谱参数;
第三步,根据再生语音信号和频谱参数,计算激励信号,获取激励信号的电平;
第四步,在时间上平滑所述频谱参数和所述激励信号电平中的至少一个,以输出其中至少有一个是经过了平滑的频谱参数和激励信号;
第五步,使用以频谱参数构成的合成滤波器合成激励信号,以再现语音信号;其中
第二至第五步只在满足预定条件的情况下进行,在不满足预定条件的其它情况下,将再生语音信号作为语音信号处理。
9.如权利要求8所述的再现方法,其中进行第三步,以使用所述频谱参数对再生语音信号进行逆滤波,从而计算激励信号。
10.如权利要求8所述的再现方法,还包括第六步,通过从再生语音信号中提取特征量而判断再生语音信号的模式,其中所述预定条件包括模式条件,即再生语音信号的模式被判断为预定的模式。
11.如权利要求10所述的再现方法,其中所述预定的模式是“静默”。
12.如权利要求10所述的再现方法,其中所述预定的模式是“清音”。
13.一种再现语音信号的方法,包括:
第一步,将语音编码器输出的编码语音信号解码,从而生成再生语音信号;
第二步,根据再生语音信号计算频谱参数;
第三步,根据再生语音信号和频谱参数,计算激励信号,获取激励信号的电平;
第四步,由所述再生语音信号或激励信号计算音调周期,利用音调周期进行音调预测,以生成音调预测信号,并从所述激励信号中减去所述音调预测信号而计算残余信号;
第五步,计算音调预测信号和残余信号中至少一个的增益;
第六步,在时间上平滑所述频谱参数和所述激励信号电平中的至少一个,以输出其中至少有一个是经过了平滑的频谱参数和激励信号;以及
第七步,基于所述增益、音调预测信号以及残余信号,重新生成适当的激励信号,然后使用以频谱参数构成的合成滤波器合成适当的激励信号,从而再现语音信号。
14.如权利要求13所述的再现方法,其中执行所述第三步时,使用所述频谱参数对再生语音信号进行逆滤波,从而计算激励信号。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000337805A JP3558031B2 (ja) | 2000-11-06 | 2000-11-06 | 音声復号化装置 |
JP337805/2000 | 2000-11-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1352451A true CN1352451A (zh) | 2002-06-05 |
CN1145144C CN1145144C (zh) | 2004-04-07 |
Family
ID=18813128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB011344997A Expired - Fee Related CN1145144C (zh) | 2000-11-06 | 2001-11-06 | 对背景噪音信号进行高质量解码的语音解码器 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7024354B2 (zh) |
EP (1) | EP1204092B1 (zh) |
JP (1) | JP3558031B2 (zh) |
CN (1) | CN1145144C (zh) |
DE (1) | DE60109111T2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008110109A1 (fr) * | 2007-03-12 | 2008-09-18 | Huawei Technologies Co., Ltd. | Procédé et appareil pour le lissage de gains dans un décodeur vocal |
CN103929222A (zh) * | 2005-01-13 | 2014-07-16 | 英特尔公司 | 码书生成系统及相关方法 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
NZ562182A (en) * | 2005-04-01 | 2010-03-26 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
DK1875463T3 (en) * | 2005-04-22 | 2019-01-28 | Qualcomm Inc | SYSTEMS, PROCEDURES AND APPARATUS FOR AMPLIFIER FACTOR GLOSSARY |
EP2945158B1 (en) | 2007-03-05 | 2019-12-25 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for smoothing of stationary background noise |
US7822833B2 (en) * | 2008-04-30 | 2010-10-26 | Honeywell International Inc. | System for creating and validating configurations of offline field devices in a process control system |
US7983892B2 (en) * | 2008-05-20 | 2011-07-19 | Honeywell International Inc. | System and method for accessing and presenting health information for field devices in a process control system |
US8108200B2 (en) * | 2008-05-20 | 2012-01-31 | Honeywell International Inc. | System and method for accessing and configuring field devices in a process control system using distributed control components |
US8731895B2 (en) * | 2008-05-20 | 2014-05-20 | Honeywell International Inc. | System and method for accessing and configuring field devices in a process control system |
CN107369453B (zh) * | 2014-03-21 | 2021-04-20 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
US11714394B2 (en) * | 2018-09-28 | 2023-08-01 | Fisher-Rosemount Systems, Inc | Bulk commissioning of field devices within a process plant |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01267700A (ja) | 1988-04-20 | 1989-10-25 | Nec Corp | 音声処理装置 |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
JP2806308B2 (ja) * | 1995-06-30 | 1998-09-30 | 日本電気株式会社 | 音声復号化装置 |
JPH0954600A (ja) | 1995-08-14 | 1997-02-25 | Toshiba Corp | 音声符号化通信装置 |
JPH09244695A (ja) | 1996-03-04 | 1997-09-19 | Kobe Steel Ltd | 音声符号化装置及び復号化装置 |
GB2312360B (en) * | 1996-04-12 | 2001-01-24 | Olympus Optical Co | Voice signal coding apparatus |
JP3270922B2 (ja) | 1996-09-09 | 2002-04-02 | 富士通株式会社 | 符号化,復号化方法及び符号化,復号化装置 |
JPH10171497A (ja) | 1996-12-12 | 1998-06-26 | Oki Electric Ind Co Ltd | 背景雑音除去装置 |
JPH10247098A (ja) | 1997-03-04 | 1998-09-14 | Mitsubishi Electric Corp | 可変レート音声符号化方法、可変レート音声復号化方法 |
WO1999030315A1 (fr) * | 1997-12-08 | 1999-06-17 | Mitsubishi Denki Kabushiki Kaisha | Procede et dispositif de traitement du signal sonore |
JPH11175083A (ja) | 1997-12-16 | 1999-07-02 | Mitsubishi Electric Corp | 雑音らしさ算出方法および雑音らしさ算出装置 |
GB9811019D0 (en) * | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6556966B1 (en) * | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
JP4295372B2 (ja) | 1998-09-11 | 2009-07-15 | パナソニック株式会社 | 音声符号化装置 |
JP3490324B2 (ja) | 1999-02-15 | 2004-01-26 | 日本電信電話株式会社 | 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体 |
JP3478209B2 (ja) * | 1999-11-01 | 2003-12-15 | 日本電気株式会社 | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 |
-
2000
- 2000-11-06 JP JP2000337805A patent/JP3558031B2/ja not_active Expired - Fee Related
-
2001
- 2001-11-06 DE DE60109111T patent/DE60109111T2/de not_active Expired - Lifetime
- 2001-11-06 EP EP01125496A patent/EP1204092B1/en not_active Expired - Lifetime
- 2001-11-06 CN CNB011344997A patent/CN1145144C/zh not_active Expired - Fee Related
- 2001-11-06 US US09/985,853 patent/US7024354B2/en not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103929222A (zh) * | 2005-01-13 | 2014-07-16 | 英特尔公司 | 码书生成系统及相关方法 |
US10396868B2 (en) | 2005-01-13 | 2019-08-27 | Intel Corporation | Codebook generation system and associated methods |
WO2008110109A1 (fr) * | 2007-03-12 | 2008-09-18 | Huawei Technologies Co., Ltd. | Procédé et appareil pour le lissage de gains dans un décodeur vocal |
Also Published As
Publication number | Publication date |
---|---|
JP3558031B2 (ja) | 2004-08-25 |
CN1145144C (zh) | 2004-04-07 |
DE60109111T2 (de) | 2006-04-13 |
EP1204092A3 (en) | 2003-11-19 |
EP1204092A2 (en) | 2002-05-08 |
US20020087308A1 (en) | 2002-07-04 |
DE60109111D1 (de) | 2005-04-07 |
US7024354B2 (en) | 2006-04-04 |
JP2002140099A (ja) | 2002-05-17 |
EP1204092B1 (en) | 2005-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0926660B1 (en) | Speech encoding/decoding method | |
US7778827B2 (en) | Method and device for gain quantization in variable bit rate wideband speech coding | |
EP1982329B1 (en) | Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus | |
DK2102619T3 (en) | METHOD AND DEVICE FOR CODING TRANSITION FRAMEWORK IN SPEECH SIGNALS | |
US8185385B2 (en) | Method for searching fixed codebook based upon global pulse replacement | |
CN1922659B (zh) | 编码模式选择 | |
CN105825861B (zh) | 确定加权函数的设备和方法以及量化设备和方法 | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
CN1145144C (zh) | 对背景噪音信号进行高质量解码的语音解码器 | |
CN101494055A (zh) | 用于码分多址无线系统的方法和装置 | |
CN1437747A (zh) | 闭环多模混合域线性预测(mdlp)语音编解码器 | |
JP4008607B2 (ja) | 音声符号化/復号化方法 | |
CA2336360C (en) | Speech coder | |
WO1999022561A3 (en) | A method and apparatus for audio representation of speech that has been encoded according to the lpc principle, through adding noise to constituent signals therein | |
JP3199142B2 (ja) | 音声の励振信号符号化方法および装置 | |
CN101286321B (zh) | 双脉冲激励的线性测编码 | |
KR20120060033A (ko) | 분할된 음성 프레임의 디코딩을 위한 음성 디코더 및 그 방법 | |
CN1159044A (zh) | 声音编码装置 | |
JP3462958B2 (ja) | 音声符号化装置および記録媒体 | |
JP3006790B2 (ja) | 音声符号化復号化方法及びその装置 | |
JPH09179593A (ja) | 音声符号化装置 | |
JPH09146599A (ja) | 音声符号化装置 | |
KR100296409B1 (ko) | 다중펄스여기음성부호화방법 | |
JPH08185198A (ja) | 符号励振線形予測音声符号化方法及びその復号化方法 | |
Kim et al. | On a Reduction of Pitch Searching Time by Preliminary Pitch in the CELP Vocoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20040407 Termination date: 20181106 |