CN1126869A - 语音编码和解码设备及其方法 - Google Patents

语音编码和解码设备及其方法 Download PDF

Info

Publication number
CN1126869A
CN1126869A CN95117681A CN95117681A CN1126869A CN 1126869 A CN1126869 A CN 1126869A CN 95117681 A CN95117681 A CN 95117681A CN 95117681 A CN95117681 A CN 95117681A CN 1126869 A CN1126869 A CN 1126869A
Authority
CN
China
Prior art keywords
amplitude characteristic
phase amplitude
signal
code
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN95117681A
Other languages
English (en)
Inventor
山浦正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN1126869A publication Critical patent/CN1126869A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

用于改进合成语音质量的语音编码和解码设备。一个编码部分包括用于∴一短期相位幅度特性加到激励信号的滤波器。和一个用于量化和编码相位幅度特性的编码电路。一个解码部分包括用于解码已编码的相位幅度特性的解码电路和一个滤波器用于添加如编码部分中相同的相位幅度特性。这样,就能合成具有激励信号的相位幅度特性的良好再生性的高质量语音。

Description

语音编码和解码设备及其方法
本发明涉及用于将语音信号压缩和编码成数字信号的代码受激的线性予测语音编码设备,一种用于对压缩信号进行解码的代码驱动线性予测语音解码设备,一种语音编码和解码方法和该方法可用的相位幅度特性抽取设备。
图7示出一种传统代码受激线性予测语音编码和解码设备的一个实例的总体结构,该设备揭示于由W.B.Kleijn,D.J.Krashinski,R.H.Ketchum(ICASSP88,PP.155至158,1988)的“SELP中改进的语音质量和有效矢量量化”一文。
该设备包括编码部分1,解码部分2,多路转换装置3和隔离装置4。输入语音5被输入至这些元件并从那里作为输出语音6而输出。该设备还包括一线性予测参数分析装置7,一线性予测参数编码装置8和合成滤波器9,18。自适应电码本10,14,随机电码本11,15和一最佳代码检索装置12构成一激励信号发生装置。代码矢量的增益由激励增益编码装置13编码。解码部分2包括激励增益解码装置16和线性予测参数解码装置17。
现解释该传统代码受激线性予测语音编码和解码设备的操作。
在编码部分1中,线性予测参数分析装置7首先通过分析输入话音5提取线性予测参数。然后线性予测参数编码装置8量化该线性予测参数并将与该参数对应的代码输出至多路复用装置3和将量化后的线性予测参数输出至合成滤波器9。
自适应电码本10贮存已获得的激励信号并输出对应于来自最佳代码检索装置12的自适应代码L的自适应矢量。随机电码本11贮存例如从随机噪声产生的N个随机矢量并输出对应于从最佳代码检索装置12输入的随机代码I的随机矢量。该合成滤波器9通过利用量化线性予测参数和一激励信号产生合成的语音,该激励信号是通过将分别乘以激励增益β和γ的自适应矢量和随机矢量相加得到的。
最佳代码检索装置12评价构成合成语音和输入语音5之间的冗余信号(residual signal)的感觉加权失真,获得自适应代码L,随机代码I和使失真最小的激励增益β和γ并将自适应代码L和随机代码I输出至多路转换装置3和将激励增益β和γ输出至激励增益编码装置13。激励增益编码装置13量化激励增益β和γ并将这些代码输出到多路转换装置3。
自适应电码本10利用由对应于自适应代码L的自适应矢量对应于随机码I的随机矢量和失真最小的量化激励增益β和γ产生的激励信号更新电码本10的内容。
作为上述操作的一个结果,多路转换装置3将对应于量化线性予测参数的代码,和对应于自适应码L,随机代码I以及激励增益β和γ的代码供至传输路径。
现将解释解码部分2的操作。
接收从多路转换装置3输出的分离装置4分离这些输出并将自适应码L供至自适应电码本14,将随机码I供至随机电码本15,将激励增益β和γ的代码供至激励增益解码装置16,并将线性予测参数的代码供至线性予测参数解码装置17。
自适应电码本14输出对应于自适应码L的自适应矢量,和随机电码本15输出对应于随机码i的随机矢量。激励增益解码装置16解码激励增益β和γ以便将自适应矢量乘以β和随机矢量乘以增益γ。
线性予测参数解码装置17对相应于线性予测参数的代码的线性予测参数进行解码并将解码后的线性予测参数输出至合成滤波器18。合成滤波器18合成通过用线性予测参数将自适应矢量和随机矢量相加获得的激励信号,并输出该输出语音6。
自适应电码本14利用激励信号以如编码部分1的自适应电码本10相同方式更新电码本的内容。
另一编码和解码设备示于图8中。
图8表示在由IKeda,Nakamura和Asada所著“利用全通滤波器响应的语音编码”一文中(电子学,信息和通信工程师学会的技术报告SP91-72,PP45至52,1991),所示具有编码和解码激励信号的相位特性的编码和解码装置的设备。该设备的结构与图7所示设备结构不同点在于:前者还包括脉冲串产生装置19,25,相位特性电码本20,26,相位特性加法滤波器21,27,一个最佳激励相位特性检索装置22,脉冲位置编码装置23和脉冲位置解码装置24。
在编码部分1,脉冲串产生装置19输出对应于头(head)脉冲位置和脉冲间隔的脉冲串,这些脉冲从最佳激励相位特性检索装置22输入。相位特性加法滤波器21例如是一个N-阶全通滤波器——其传递函数H(Z)由下式(1)表示: H ( z ) = Σ k = 0 N a ( k ) z - ( N - k ) Σ k = 0 N a ( k ) z - k - - - ( 1 )
相位特性电码本20贮存多个在假设:相位特性加法滤波器21的脉冲响应,例如,给定为随机序数条件下产生的多个滤波器系数,并将对应于从最佳激励相位特性检索装置22输入代码的滤波器系数输出至相位特性加法滤波器21。相位特性加法滤波器21利用滤波器系统将相位特性加到将从脉冲串发生产19输出的脉冲串通过利用该滤波器系数将相位特性加到将从脉冲串发生装置19输出的脉冲串通过利用该滤波器系数乘以丢失的激励增益g所得到的激励信号,并将相位特性相加后激励信号输出至合成滤波器9。合成滤波器9利用从线性予测参数编码装置8输入的量化后线性予测参数和加有相位特性的激励信号产生合成语音。
最佳激励相位特性检索装置2 2获得头脉冲位置和脉冲串的脉冲间隔,将合成语音和输入语音5之间剩余信号的感觉加权失真降至最小的激励增益g和相位特性代码,并将头脉冲位置和脉冲串的脉冲间隔输出至脉冲位置编码装置23,将激励增益g输出至激励增益编码装置13,和将相位特性代码输出至多路复用装置3。
脉冲位置编码装置23量化头脉冲位置和脉冲串的脉冲间隔并将代码输出至多路复用装置3。
已接收这些代码的多路复用装置3将对应于线性予测参数的代码,相位特性的代码,对应于头脉冲的量化位置和脉冲串的脉冲间隔的代码和对应于量化激励增益g的代码传送至分离装置4。
现说明解码部分2的操作。
已接收多路复用装置3的输出的分离装置4将对应于头脉冲的量化位置和脉冲串的脉冲间隔的代码输出至脉冲位置解码装置24,将激励增益g的代码输出至相位特性电码本26,并将线性予测参数代码输出至线性予测参数解码装置17。
脉冲位置解码装置24对对应于头脉冲位置代码和脉冲串的脉冲间隔代码的头脉冲位置和脉冲间隔进行解码并将解码后脉冲串的位置和脉冲间隔输出至脉冲串产生装置25。脉冲串产生装置25将对应于头脉冲位置和脉冲间隔的脉冲串输出至相位特性加法滤波器27。
激励增益解码装置16对相应于激励增益代码的激励增益g进行解码。相位特性电码本26将对应于相位特性的代码的滤波器系数输出至相位特性加法滤波器27。
相位特性加法滤波器27将相位特性加到利用滤波器系数将脉冲串乘以激励增益g所得到的激励信号,并将所得到的激励信号输出至合成滤波器18。合成滤波器18输出利用从线性予测解码装置17输入的线性予测参数和加有相位特性的激励信号输出该输出语音6。
为获得语音的线性予测剩余信号的短期相位幅度特性的传统设备示于图9中。这是在由Honda和Moriya所著“基于相位均衡的语音编码”一文中所述设备(1984,日本声学学会有关语音研究委员会的论文集S84-05,pp33至40)。
图9中,语音作为输入语音101被输入并得到相位幅度特性102。该设备包括线性予测参数分析装置103,线性予测反向滤波器104,音调周期(pitch)提取装置105,音调周期位置提取装置106和相位幅度特性加法滤波器系数计算器107。
现将说明获得语音的线性予测剩余信号的短期相位幅度特性的过程。
当输入该输入语音101时,线性予测参数分析装置103分析语音101以提取线性予测参数并将所提取的线性予测参数输出至线性予测反向滤波器104。线性予测反向滤波器104利用线性予测参数从输入语音101产生线性予测剩余信号,并将线性予测剩余信号输出至音调周期位置提取装置106和相位幅度特性加法滤波器系数计算器107。
音调周期提取装置105通过某种已知方法提取输入语音101的音调周期并将提取的音调周期输出至音调周期位置提取装置106。音调周期位置提取装置106提取当线性予测剩余信号在一个音调周期内达到最大幅度位置时的每一音调周期的音调周期位置,并将该音调周期位置输出至相位幅度特性加法滤波器系数计算器107。
相位幅度特性加法滤波器系数计算器107获得一个具有一种脉冲响应(图10)的相位幅度特性加法滤波器函数——该滤波器在输入仅在音调周期位置存在脉冲的脉冲串时输出线性予测剩余信号,并输出作为相位幅度特性102的函数。相位幅度特性加法滤波器,例如是一个N一阶滤波器,其传递函数H(Z)由以下公式(2)表示。 H ( z ) = Σ k = 0 N a ( k ) z - k - - - ( 2 ) 另一方面,相位幅度特性加法滤波器,例如可为N-阶全通滤波器,其传递函数H(Z)由公式(1)表示。
上述先有技术有以下诸问题。
语言是由浊音(voiced speech)和非浊音(unvoiced speech)组成。浊音的再生性对合成语音的质量有巨大影响。以具有音调周期重现性和音调周期重现性中短期相位特性的信号形式去模仿浊音的激发是可能的。
在该传统代码激励线性予测语音编码设备中,该激发信号是自适应矢量和随机矢量之和表示。该方法不直接表示激发信号的相位特性。因此会有这样一种情况:激发信号的相位特性未被再生,这导致合成语音的质量下降。
例如在从非浊音到浊音的过渡部分或在音调周期发生大变化的浊音时这个问题是严重的。在这一部分,自适应矢量不适于如此工作以致必须仅用随机矢量去再生音调周期和相位特性。
在传统编码和解码设备中,为对激励信号的相位特性进行编码,尽管激励信号的相位特性被编码,但由于激励信号假定为一串简单脉冲,故当在相位特性电码本中未找到适宜相位特性时便不可能用激励信号去完成该相位特性,这导致合成语音的质量下降。
在采取传统方法获得语音的线性予测剩余信号的短期相位幅度特性的情况下,虽然有必要获得音调周期和音调周期位置,但由于不是总能获得正确音调周期和音调周期位置,从不精确音调周期和音调周期位置获得的相位幅度特性和由精确音调周期和音调周期位置获得的相位幅度特性之差会根据误差程度而增大。
因此,本发明的一个目的是消除先有技术中的上述问题并提供能避免合成语音质量下降并产生有良好质量的合成语音的代码激励线性予测语音编码和解码设备和语音编码和解码方法。
为达到此目的,在本发明第一方面所提供的语音编码设备包括:线性予测参数分析装置;线性予测参数编码装置;激励信号发生装置;用于合成线性予测参数编码装置的输出信号和从激励信号发生装置输出的激励信号的合成滤波器;用于量化和编码由分析输入语音信号的线性予测剩余信号所获得的相位幅度特性的相位幅度特性编码装置;和一相位幅度特性加法滤波器,用于将短期相位幅度特性加到激励信号。
根据这一结构,激励信号的短期相位幅度特性被量化和编码,以致相位幅度特性确实地加到激励信号。结果,合成具有对激励信号相位特性的良好再生性的高质量语音是可能的。
就本发明第二方面而言,所提供的语音解码设备包括:
线性予测参数解码装置;
激励信号发生装置;
合成滤波器,用于对线性予测参数解码装置的输出信号和从激励信号发生装置输出的激励信号进行合成;
相位幅度特性解码装置,用于对编码的短期相位幅度特性进行解码;以及
相位幅度特性加法滤波器,用以将解码的相位幅度特性加到激励信号。
根据这一结构,被编码短期相位幅度特性被解码,而相位幅度特性是确实地加到激励信号的。因此,合成具有良好的激励信号相位特性的再生性的高质量语音是可能的。
就本发明第三方面,提供一种包括如下编码过程和解码过程的语音编码和解码方法。
该编码过程包括以下步骤:
通过输入语音信号的线性予测分析对线性予测参数进行编码;
为产生最佳合成语音而从自适应电码本和随机电码本选择一代码矢量;和
对该激励信号进行编码和发送;以及
该解码过程包括以下步骤:
基于所接收信号产生激励信号和解码的线性予测参数信号;以及
由合成滤波器对激励信号和解码线性予测参数信号进行合成以产生输出语音信号。所述编码过程还包括以下步骤:
对由分析输入语音信号的线性予测剩余信号所得到的相位幅度特性进行量化和编码;和
将短期相位幅度特性加到激励信号,而所述解码过程还包括以下步骤:
对编码的相位幅度特性进行解码;和
将解码的相位幅度特性加到激励信号以产生输出语音信号。
根据该结构,激励信号的短期相位幅度特性是在编码过程中量化,而编码的相位幅度特性是在解码过程中被解码,致使该相位幅度特性被确实地加到激励信号。因此,使发送具有激励信号相位特性的良好再生性的高质量语音成为可能。
就本发明第四方面而言,提供一用于提取一信号的短期相位幅度特性的相位幅度特性提取设备,该设备包括:
存储诸信号的多个短期相位幅度特性的相位幅度特性电码本;
用于除去相位幅度特性的相位幅度特性消除滤波器;
剩余信号产生装置,用于通过从相位幅度特性消除滤波器的输入信号消除存入相位幅度特性电码本中的相位幅度特性,产生一剩余信号;
脉冲近似装置或脉冲信号表示装置,用于通过将剩余信号减为少量脉冲数产生一脉冲近似信号或脉冲信号表示信号;
试验信号产生装置,用于通过将每个消除的相位幅度特性加到脉冲近似信号产生一试验信号;及
选择和输出装置,用于从相位幅度特性电码本选择将试验信号和输入信号间的失真降至最小的相位幅度特性并输出该已选相位幅度特性。
按此结构,通过从一输入信号经反向滤波器除去存入相位幅度特性电码本的每个相位幅度特性所获得剩余信号,再将每个剩余信号减为少量脉冲数。每个消除的相位幅度特性被加到该近似信号,再从电码本选择将该信号和输入信号之间的失真降至最小的相位幅度特性。这样,获得该信号的短期相位幅度特性。结果,例如,当获得语音的线性予测剩余信号的短期相位幅度特性时,不必提取音调周期和音调周期位置,从而避免了对相位幅度特性提取中产生的误差。
从以下结合附图对本发明最佳实施例的描述将清楚看出本发明上述和其他目的、特性和优点。
图1是本发明第一实施例的总体结构方块图;
图2是本发明的第二实施例的总体结构方块图;
图3表示按照本发明构成具有音调周期的脉冲串的激励矢量的一实例;
图4表示按照本发明存入脉冲随机电码本的激励矢量的一实例;
图5是为获得本发明第三实施例中短期相位幅度特性的一个设备结构的方块图;
图6表示说明本发明一脉冲近似信号发生例子的波形图;
图7是一种传统代码激励线性予测语音编码和解码设备一例的总体结构;
图8是传统用于对激励信号相位特性进行编码的编码和解码设备一实例的总体结构方块图;
图9是为获得激励信号的短期相位幅度特性的传统设备的方块图;以及
图10是说明由于相位幅度特性加法滤波器引起波形变化的视图。
第一实施例
现参照诸附图说明根据本发明的语音编码和解码设备。
图1是根据本发明语音编码和解码设备的第一实施例的方块图。如图7所示相同元部件设置了相同标号并省略对其的说明。
本实施例的特点在于添加了以下新元件:
相位幅度特性分析装置28用于分析相位幅度特性,
相位幅度特性编码装置29,用于对相位幅度特性进行编码,
相位幅度特性加法滤波器30,32,用以附加一相位幅度特性,以及
相位幅度特性解码装置31,用以进行相位幅度特性的解码。
在编码部分1中,相位幅度特性分析装置28利用输入语音5和从线性予测参数编码装置8输入的线性予测参数产生线性予测剩余信号,用(例如)获得语音的线性予测剩余信号短期相位幅度特性的传统方法得到作为滤波器系数的语音的线性予测剩余信号的短期相位幅度特性,并将滤波器系数输出至相位幅度特性编码装置29。相位幅度特性编码装置29量化滤波器系数并将相应代码输出至多路复用装置3,和将量化的滤波器系数输出至相位幅度特性加法滤波器30。
相位幅度特性加法滤波器30利用量化滤波器系数将相位幅度特性加到激励信号——该信号由将自适应电码本10输出的自适应矢量乘以激励增益β和将从随机电码本11输出的随机矢量乘以激励增益γ的乘积相加得到并将如此得到的激励信号输出至合成滤波器9。合成滤波器9利用从线性予测参数编码装置8输入的量化线性予测参数和加有相位幅度特性的激励信号产生合成语音。
最佳代码检索装置12评价合成语音和输入语音5之间剩余信号的感觉加权失真,获得自适应代码L,随机代码I和将失真降至最小的激励增益β和γ,并将自适应代码L和随机代码I输出至多路复用装置3,并将激励增益β和γ输出至激励增益编码装置13。激励增益编码装置13量化激励增益β和γ并将这些代码输出至多路复用装置3。
在这些结果的基础上,多路复用装置3将对应于量化线性予测参数的代码,对应于相位幅度特性相加滤波器30的量化滤波器系数的代码,和对应于自适应代码,随机代码I和激励增益β和γ的代码供至一传输路径。
上述操作是本实施例的语音编码和解码设备的编码部分1的特点。
现将解释解码部分2的操作。
分离装置4接收来自多路复用装置3的输出,分离这些输出并将供给的自适应代码L发送至自适应电码本14,将随机代码I发送至随机电码本15。将激励增益β和γ的代码发送至激励增益解码装置16,将相位幅度特性相加滤波器30的滤波器系数代码发送至一相位幅度特性解码装置31,和将线性予测参数的代码发送至线性予测参数解码装置17。
相位幅度特性解码装置31对与相位幅度特性加法滤波器30的滤波器系数代码相对应的滤波器系数进行解码,并将该解码后滤波器系数输出至相位幅度特性加法滤波器32。
相位幅度特性加法滤波器32将用解码后量化滤波器系数得到的相位幅度特性加到激励信号,该激励信号是通过将从自适应电码本14输出的自适应矢量乘以从激励增益解码装置16输出的激励增益β和将从随机电码本15输出的随机矢量乘以从激励增益解码装置16输出的激励增益γ,并将两乘积相加而获得的,并将如此得到的激励信号输出至合成滤波器18。合成滤波器18用从线性予测参数解码装置17输入的线性予测参数和加有相位幅度特性的激励信号产生合成语音,并输出该合成语音。
上述操作是本实施例语音编码和解码设备的解码部分2的特点。
根据本实施例,通过对线性予测剩余信号的短期相位幅度特性进行编码并将其加到激励信号便能增强激励信号的再生性并改善合成语音的质量。第二实施例
现参照附图解释按本发明的语音编码和解码设备的另一实施例。
图2是根据本发明语音编码和解码设备的第二实施例的方块图。与图1所示相同元件标有相同标号并省略对其说明。
在本实施例中,新加到第一实施例的是以下元件;用以提取音调周期的音调周期提取装置33,用于对提取的音调周期进行编码的音调周期编码装置,脉冲随机电码本35,37,和音调周期解码装置36。
现将以优先说明新加元件的方式说明本实施例的操作。
在编码部分1中,音调周期提取装置33用某种已知方法提取输入语音5的音调周期,并将所提取的音调周期输出至音调周期编码装置34。音调周期编码装置34量化音调周期并将相应代码输出至多路复用装置3和将量化音调周期输出至脉冲随机电码本35。
脉冲随机电码本35产生由量化音调周期的脉冲串组成的多个激励矢量,其中例如头脉冲的位置不同,并将它们作为至少一部分随机矢量存入电码本35。图3表示由音调周期的脉冲串组成的激励矢量的一个实例,图4表示存入脉冲随机电码本35中的激励矢量的实例。同时脉冲随机电码本35输出对应于从最佳代码检索装置12输入的随机代码I的随机矢量。
相位幅度特性加法滤波器30把用从相位幅度特性编码装置29输入的量化滤波器系数获得的相位幅度特性加到激励信号,该激励信号是通过将从自适应电码本10输出的自适应矢量乘以激励增益β和将从脉冲随机电码本35输出的随机矢量乘以激励增益γ,并将此两乘积相加而获得的,并将如此得到的激励信号输出至合成滤波器9。合成滤波器9利用从线性予测参数编码装置8输入的量化线性予测参数和加有相位幅度特性的激励信号产生合成语音。
最佳代码检索装置12评价合成语音和输入语音5之间的剩余信号的感觉加权失真,得到使失真减至最小的自适应代码L,随机代码I和激励增益β和γ,并将自适应代码L和随机码I输出至多路复用装置3和将激励增益β和γ输出至激励增益编码装置13。。激励增益编码装置13量化激励增益β和γ并将这些代码输出至多路复用装置3。
在这些结果的基础上,多路复用装置3将对应于量化线性予测参数的代码,对应于相位幅度特性加法滤波器30的量化滤波器系数的代码,和对应于自适应代码L,量化音调周期,随机代码I和激励增益β和γ的代码供至一传输路径。
现已在以上描述了语音编码和解码设备的第二实施例的编码部分1的简要结构。
现将解释解码部分2的操作。
分离装置4接收来自多路复用装置3的输出,分离这些输出并将供给的自适应代码L发送至自适应电码本14,将音调周期代码发送至音调周期解码装置36,将随机代码I发送至随机电码本37,将激励增益β和γ的代码发送至激励增益解码装置16,将相位幅度特性加法滤波器的30的滤波器系数代码发送至一相位幅度特性解码装置31,和将线性予测参数的代码发送至线性予测参数解码装置17。
音调周期解码装置36对与音调周期代码相对应的音调周期解码并将解码后音调周期输出至脉冲随机电码本37。脉冲随机电码本37将由解码音调周期的脉冲串组成的激励矢量以与随机电码本35相同形式贮存在电码本37中。脉冲随机电码本37输出对应于随机代码I的随机矢量。
相位幅度特性加法滤波器32使用从相位幅度特性解码装置31输入的滤波器系数将相位幅度特性加到激励信号,该激励信号是通过将从自适应电码本14输出的自适应矢量乘以激励增益β和从脉冲随机电码本37输出的随机矢量乘以激励增益γ并将该两乘积相加获得的,并将如此得到的激励信号输出至合成滤波器18。合成滤波器18利用从线性予测参数解码装置17输入的线性予测参数和加有相位幅度特性的激励信号输出一输出语音6。
如以上已述,按该第二实施例音调周期的脉冲串用于一随机矢量,而一相位幅度特性被加到该随机矢量。照这样,仅从一随机矢量去产生一合适的激励信号是可能的。因此即使自适应矢量不起作用,也有可能产生一个有良好再生性的激励信号从而改善合成语音的质量。
在本实施例中,脉冲串可从一自适应代码获得。这样,便取消了图2中的音调周期提取装置33,音调周期编码装置34和音调周期解码装置36,而且用作随机矢量的脉冲串的脉冲间隔是从该自适应代码得到的。此时,由于没必要发送相对该脉冲间隔的音调周期信息,故可能减少发送信息量,此外,由于即使自适应矢量不起作用,激励信号的再生性也良好,故能改善合成语音的质量。第三实施例
现将参照附图说明按本发明用于提取一信号的短期相位幅度特性的相位幅度特性提取设备的一个实施例。
图5是用于获得一相位幅度特性的设备的结构方块图。该设备用于获得一线性予测剩余信号的短期相位幅度特性。
以下元部件是新加到图9所示传统设备的:相位幅度特性电码本108,相位幅度特性消除滤波器109,用以消除一相位幅度特性,脉冲近似装置110,用于用某些脉冲近似或代表一剩余信号,一个相位幅度特性加法滤波器111,用于添加相位幅度的特性,一个合成滤波器112用以从线性予测参数和激励信号合成语音,以及最佳相位幅度特性检索装置113,用于检索最佳相位幅度特性。
现将以优先给出其结构特点的形式说明该设备的操作。
线性予测参数分析装置103分析输入语音101以抽取线性予测参数,并将抽取的线性予测参数输出至线性予测反向滤波器104和合成滤波器112。线性予测反向滤波器104利用该线性予测参数从输入语音101产生线性予测剩余信号,并将线性予测剩余信号输出至相位幅度特性消除滤波器109。
例如滤波器系数等多个相位幅度特性被存入相位幅度特性电码本108,而相位幅度特性电码本108将对应于从最佳相位幅度特性检索装置113输入的代码的相位幅度特性的滤波器系数输出至相位幅度特性消除滤波器109和相位幅度特性加法滤波器111。相位幅度特性消除滤波器109利用滤波器系数通过从线性予测参数信号消除该相位幅度特性而产生一剩余信号,并将该剩余信号输出至脉冲近似装置110。脉冲近似装置110通过将除了例如具有最大幅度的N个取样以外的剩余信号降至零而产生脉冲信号表示的剩余信号并将该脉冲信号表示的剩余信号输出至相位幅度特性相加滤波器111。
图6示出一个表示实例。图6表示通过消除相位幅度特性,从一个线性予测剩余信号产生剩余信号,然后将剩余信号减少至一个脉冲以产生脉冲信号表示的剩余信号的过程。
然后相位幅度特性加法滤波器111利用滤波器系数将相位幅度特性加到脉冲信号表示的剩余信号以产生一激励信号并将该激励信号输出至合成滤波器112。合成滤波器112利用线性予测参数和激励信号产生合成语音。
最佳相位幅度特性检索装置113评价合成语音和输入语音101之间的剩余信号的感觉加权失真,从相位幅度特性电码本108选择对应于将失真降至最小的相位幅度特性的滤波器系数,并将所选滤波器系数作为相位幅度特性102输出。
根据本实施例,设有贮存信号的许多短期相位幅度特性的电码本,利用该电码本中每个相位幅度特性产生一试验信号,并从电码本中选择使输入信号与试验信号间失真为最小的相位幅度特性。照这样,就可能提取没有误差的相位幅度特性并当获得语音的一线性予测剩余信号的短期脉冲幅度特性时无需音调周期提取或音调周期位置提取。
尽管现已描述的实施例是当前认为的本发明较佳实施例,但应懂得可能对它们作出各种改型,所附权利要求书欲复盖所有这类落入本发明精神实质和范围内的改型。

Claims (8)

1.一种语音编码设备,包括:
线性予测参数分析装置;
线性予测参数编码装置;
激励信号发生装置;用于合成所述线性予测参数编码装置的输出信号和从所述激励信号发生装置输出的激励信号的合成滤波器;
用于量化和编码由分析输入语音信号的线性予测剩余信号所获得的相位幅度特性的相位幅度特性编码装置;和
相位幅度特性加法滤波器,用于将短期相位幅度特性加到所述激励信号。
2.根据权利要求1的语音编码设备,其中所述激励信号发生装置包括:
自适应电码本,用于输出一自适应矢量;
随机电码本,用于输出一随机矢量;以及
最佳代码检索装置,用于搜索一最佳激励;和
用一脉冲序列作为所述随机矢量。
3.根据权利要求2的语音编码设备,其特征在于:所述脉冲序列的脉冲间隔是由一自适应码获得的。
4.一种语音解码设备,包括:
线性予测参数解码装置;
激励信号发生装置;
合成滤波器,用于对所述线性予测参数解码装置的输出信号和从所述激励信号发生装置输出的激励信号进行合成;
相位幅度特性解码装置,用于对编码的短期相位幅度特性进行解码;以及
相位幅度特性加法滤波器,用以将解码的相位幅度特性加到所述激励信号。
5.根据权利要求4的语音解码设备,其中所述激励信号发生装置包括:
自适应电码本,用于输出一日适应矢量;
随机电码本,用于输出随机矢量;以及
激励增益解码装置;和
用脉冲序列作为所述随机矢量。
6.根据权利要求5的语音解码设备,其特征在于:所述脉冲序列的脉冲间隔是从一自适应码获得的。
7.一种包括编码过程和解码过程的语音编码和解码方法:
所述编码过程包括以下步骤:
通过输入语音信号的线性予测分析对线性予测参数进行编码;
对由分析输入语音信号的线性予测剩余信号所得到的相位幅度特性进行量化和编码;
为产生最佳合成语音从一激励电码本选择激励信号;
将一短期相位幅度特性加到所述激励信号;以及
对该激励信号进行编码和发送;以及所述解码过程包括以下步骤
基于所接收信号产生激励信号和解码的线性予测参数信号;
对编码的相位幅度特性进行解码;
将解码后相位幅度特性加到所述激励信号;以及
由合成滤波器对所述激励信号和所述解码线性予测参数信号进行合成以产生输出语音信号。
8.用于提取一信号的短期相位特性的相位幅度特性提取设备,该设备包括:
存储信号的多个短期相位幅度特性的相位幅度特性电码本;
用于除去相位幅度特性的相位幅度特性消除滤波器;
剩余信号产生装置,用于通过从所述相位幅度特性消除滤波器的输入信号消除存入所述相位幅度特性电码本中的相位幅度特性,产生一剩余信号;
脉冲近似信号发生装置,用于通过将所述剩余信号减为少量脉冲数产生一脉冲信号代表信号;
试验信号产生装置,用于通过将由所述脉冲幅度特性消除滤波器消除后的每个相位幅度特性加到所述脉冲信号代表信号产生一试验信号;及
选择和输出装置,用于从所述相位幅度特性电码本选择将所述试验信号和所述输入信号间的失真降至最小的相位幅度特性并输出该已选相位幅度特性。
CN95117681A 1994-10-28 1995-10-27 语音编码和解码设备及其方法 Pending CN1126869A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP6264832A JPH08123494A (ja) 1994-10-28 1994-10-28 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JP264832/94 1994-10-28

Publications (1)

Publication Number Publication Date
CN1126869A true CN1126869A (zh) 1996-07-17

Family

ID=17408833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95117681A Pending CN1126869A (zh) 1994-10-28 1995-10-27 语音编码和解码设备及其方法

Country Status (8)

Country Link
US (1) US5724480A (zh)
EP (1) EP0709827B1 (zh)
JP (1) JPH08123494A (zh)
KR (1) KR0169020B1 (zh)
CN (1) CN1126869A (zh)
CA (1) CA2160749C (zh)
DE (1) DE69526904D1 (zh)
TW (1) TW289885B (zh)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW317051B (zh) * 1996-02-15 1997-10-01 Philips Electronics Nv
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
DE69737012T2 (de) * 1996-08-02 2007-06-06 Matsushita Electric Industrial Co., Ltd., Kadoma Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür
CN1252679C (zh) * 1997-03-12 2006-04-19 三菱电机株式会社 声音编码装置、声音编码译码装置、以及声音编码方法
JP3206497B2 (ja) * 1997-06-16 2001-09-10 日本電気株式会社 インデックスによる信号生成型適応符号帳
DE69819460T2 (de) * 1997-07-11 2004-08-26 Koninklijke Philips Electronics N.V. Übertrager mit verbessertem sprachkodierer und dekodierer
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
EP1267330B1 (en) * 1997-09-02 2005-01-19 Telefonaktiebolaget LM Ericsson (publ) Reducing sparseness in coded speech signals
CA2249792C (en) 1997-10-03 2009-04-07 Matsushita Electric Industrial Co. Ltd. Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
JP3351746B2 (ja) * 1997-10-03 2002-12-03 松下電器産業株式会社 オーディオ信号圧縮方法、オーディオ信号圧縮装置、音声信号圧縮方法、音声信号圧縮装置,音声認識方法および音声認識装置
US6385576B2 (en) 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
JP3166697B2 (ja) * 1998-01-14 2001-05-14 日本電気株式会社 音声符号化・復号装置及びシステム
FR2796189B1 (fr) * 1999-07-05 2001-10-05 Matra Nortel Communications Procedes et dispositifs de codage et de decodage audio
US6397175B1 (en) * 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
KR100363259B1 (ko) 2000-05-16 2002-11-30 삼성전자 주식회사 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법
US7133823B2 (en) * 2000-09-15 2006-11-07 Mindspeed Technologies, Inc. System for an adaptive excitation pattern for speech coding
US7194141B1 (en) * 2002-03-20 2007-03-20 Ess Technology, Inc. Image resolution conversion using pixel dropping
KR20060067016A (ko) 2004-12-14 2006-06-19 엘지전자 주식회사 음성 부호화 장치 및 방법
WO2006126856A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
EP1946294A2 (en) 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
MX2008000122A (es) 2005-06-30 2008-03-18 Lg Electronics Inc Metodo y aparato para codificar y descodificar una senal de audio.
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR100880642B1 (ko) 2005-08-30 2009-01-30 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
JP5108768B2 (ja) 2005-08-30 2012-12-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
WO2007032648A1 (en) 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
WO2007040363A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100857111B1 (ko) 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7840401B2 (en) 2005-10-24 2010-11-23 Lg Electronics Inc. Removing time delays in signal paths
EP1974348B1 (en) 2006-01-19 2013-07-24 LG Electronics, Inc. Method and apparatus for processing a media signal
KR101366291B1 (ko) 2006-01-19 2014-02-21 엘지전자 주식회사 신호 디코딩 방법 및 장치
KR20080093024A (ko) 2006-02-07 2008-10-17 엘지전자 주식회사 부호화/복호화 장치 및 방법
ES2407820T3 (es) 2006-02-23 2013-06-14 Lg Electronics Inc. Método y aparato para procesar una señal de audio
JP5032463B2 (ja) * 2006-03-17 2012-09-26 パイオニア株式会社 立体音響再生装置及び立体音響再生用プログラム
JP2009532712A (ja) 2006-03-30 2009-09-10 エルジー エレクトロニクス インコーポレイティド メディア信号処理方法及び装置
US20080235006A1 (en) 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US8645129B2 (en) * 2008-05-12 2014-02-04 Broadcom Corporation Integrated speech intelligibility enhancement system and acoustic echo canceller
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
US4742550A (en) * 1984-09-17 1988-05-03 Motorola, Inc. 4800 BPS interoperable relp system
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
US5067158A (en) * 1985-06-11 1991-11-19 Texas Instruments Incorporated Linear predictive residual representation via non-iterative spectral reconstruction
DE3683767D1 (de) * 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
CA1328509C (en) * 1988-03-28 1994-04-12 Tetsu Taguchi Linear predictive speech analysis-synthesis apparatus
US5293448A (en) * 1989-10-02 1994-03-08 Nippon Telegraph And Telephone Corporation Speech analysis-synthesis method and apparatus therefor
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen

Also Published As

Publication number Publication date
JPH08123494A (ja) 1996-05-17
DE69526904D1 (de) 2002-07-11
EP0709827A3 (en) 1997-12-29
US5724480A (en) 1998-03-03
KR960015379A (ko) 1996-05-22
EP0709827A2 (en) 1996-05-01
CA2160749C (en) 2000-06-27
EP0709827B1 (en) 2002-06-05
CA2160749A1 (en) 1996-04-29
KR0169020B1 (ko) 1999-03-20
TW289885B (zh) 1996-11-01

Similar Documents

Publication Publication Date Title
CN1126869A (zh) 语音编码和解码设备及其方法
CN1154086C (zh) Celp转发
CN1121683C (zh) 语音编码
CN1199151C (zh) 语音编码器
CN1143268C (zh) 声音编码方法、声音译码方法、声音编码装置和声音译码装置
CN1241170C (zh) 语音编解码器中用于线频谱频率矢量量化的方法和系统
CN1302459C (zh) 用于编码和解码非话音语音的方法和设备
CN1410970A (zh) 用于语音快速编码的被选信号脉冲幅度的代数码本
CN1035379A (zh) 具有改进的矢量激发源的数字语音编码器
CN1655236A (zh) 用于预测量化有声语音的方法和设备
CN1151491C (zh) 音频编码装置和音频编码译码装置
CN1161750C (zh) 语音编码译码方法和装置、电话装置、音调变换方法和介质
CN1152164A (zh) 码激励线性预测编码装置
CN101044554A (zh) 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法
CN101030377A (zh) 提高声码器基音周期参数量化精度的方法
CN1977311A (zh) 语音编码装置、语音解码装置及其方法
CN1787383A (zh) 变换、编码、逆变换和解码音频信号的方法和设备
CN1026274C (zh) 采用长期预测器的语言合成方法及其装置
CN1167046C (zh) 矢量编码方法及其利用该方法的编码器和解码器
CN1615509A (zh) 低比特率的编解码器
CN1465044A (zh) 声信号编码方法和设备、解码方法和设备及记录介质
CN1112672C (zh) 多脉冲分析语言处理系统及其方法
CN1293535C (zh) 声音编码设备和方法以及声音解码设备和方法
CN1841499A (zh) 代码转换装置和方法
CN1218296C (zh) 音调周期搜索范围设置装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication