JP2001083996A - 音声信号復号方法及び音声信号符号化復号方法 - Google Patents

音声信号復号方法及び音声信号符号化復号方法

Info

Publication number
JP2001083996A
JP2001083996A JP25707599A JP25707599A JP2001083996A JP 2001083996 A JP2001083996 A JP 2001083996A JP 25707599 A JP25707599 A JP 25707599A JP 25707599 A JP25707599 A JP 25707599A JP 2001083996 A JP2001083996 A JP 2001083996A
Authority
JP
Japan
Prior art keywords
signal
excitation signal
norm
circuit
excitation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP25707599A
Other languages
English (en)
Other versions
JP3417362B2 (ja
Inventor
Atsushi Murashima
淳 村島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP25707599A priority Critical patent/JP3417362B2/ja
Priority to EP00119666A priority patent/EP1083548B1/en
Priority to US09/658,045 priority patent/US7031913B1/en
Priority to CA002317969A priority patent/CA2317969C/en
Priority to EP06112720A priority patent/EP1688918A1/en
Priority to DE60028310T priority patent/DE60028310T2/de
Publication of JP2001083996A publication Critical patent/JP2001083996A/ja
Application granted granted Critical
Publication of JP3417362B2 publication Critical patent/JP3417362B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 励振信号により線形予測係数で構成するフィ
ルタを駆動することによって音声信号を生成する音声信
号復号装置において、背景雑音音声に対する再生音声品
質を改善する。 【解決手段】 励振信号正規化回路2510は、励振ベ
クトルからノルムを計算し、前記励振ベクトルを前記ノ
ルムにより除算する。平滑化回路1320は、雑音区間
において前記ノルムを過去に得られた前記ノルムを用い
て平滑化する。励振信号復元回路2610は、前記ノル
ムにより除算された前記励振ベクトルと、平滑化された
前記ノルムと、を乗算し、短時間平均パワーが平滑化さ
れた励振ベクトルを生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を低ビッ
トレートでするための符号化および復号方法に関し、特
に、雑音区間での音質を改善する音声信号復号方法、音
声信号符号化復号方法に関する。
【0002】
【従来の技術】音声信号を中低ビットレートで高能率に
符号化する方法として、音声信号を線形予測フィルタと
その駆動励振信号(励振信号、励振ベクトル)に分離し
て符号化する方法が広く用いられている。その代表的な
方法の一つにCELP(Code Excited Linear Prediction)
がある。CELPでは、入力音声の周波数特性を表す線形予
測係数が設定された線形予測フィルタを、音声のピッチ
周期を表すピッチ信号(ピッチベクトル)と乱数やパル
スから成る音源信号(音源ベクトル)との和で表される
励振信号(励振ベクトル)により駆動することで、合成
音声信号(再生信号、再生ベクトル)が得られる。この
とき、前記ピッチ信号と前記音源信号には各々ゲイン
(ピッチゲインと音源ゲイン)を乗ずる。CELPに関して
はM. Schroederらによる「Code excited linear predic
tion: High quality speech at verylow bit rates」
(Proc. of IEEE Int. Conf. on Acoust., Speech and
SignalProcessing, pp.937-940, 1985)(文献1)を参
照できる。
【0003】携帯電話などの移動体通信技術では、繁華
街の雑踏や走行中の自動車内に代表される雑音環境下で
の良好な通話品質が要求される。しかしながら、CELPを
ベースとした音声符号化技術では、雑音が重畳した音声
(背景雑音音声)に対する音質が著しく劣化することが
問題となっている。
【0004】背景雑音音声の符号化音声品質改善に関し
ては、復号器において音源ゲインを平滑化する方法が提
案されている。この方法では、音源ゲインの平滑化によ
って、前記音源ゲインを乗じた音源信号の短時間平均パ
ワーの時間変化が滑らかになり、その結果、励振信号の
短時間平均パワーの時間変化も平滑化される。これによ
り、劣化要因のひとつである、復号された雑音における
短時間平均パワーの著しい変動が軽減され、音質の改善
がなされる。
【0005】音源信号のゲインを平滑化する方法に関し
ては、「Digital Cellular Telecommunication System;
Adaptive Multi-Rate Speech Transcoding」 (ETSI Te
chnical Report, GSM 06.90 version 2.0.0)(文献2)
の6.1節を参照できる。
【0006】図5は、従来の音声信号復号装置の一例を
示すブロック図であり、音源信号のゲインを平滑化する
ことで背景雑音音声の符号化品質を改善する技術を例示
している。ビット系列の入力は、Tfrmsec(例えば、20
msec)のフレーム周期で行われるものとし、再生ベク
トルの計算は、Nsfrを整数(例えば、4)として、(T
fr/Nsfr)msec(例えば、5 msec)のサブフレーム周
期で行われるものとする。フレーム長をサンプル(例え
ば、320サンプル)、サブフレーム長をサンプル(例え
ば、80サンプル)とする。これらのサンプル数は、入力
信号のサンプリング周波数16 kHzの場合である。以下、
図3を説明する。
【0007】入力端子10からは、符号化されたデータ
のビット系列が供給される。符号入力回路1010は、
入力端子10から入力されたビット系列を分割し、複数
の復号パラメータに対応するインデックスに変換する。
そして、符号入力回路は、入力信号の周波数特性を表す
線スペクトル対(Line Spectrum Pair, LSP)に対応す
るインデックスをLSP復号回路1020へ供給し、入力
信号のピッチ周期を表す遅延に対応するインデックスを
ピッチ信号復号回路1210へ供給し、乱数やパルスか
ら成る音源ベクトルに対応するインデックスを音源信号
復号回路1110に供給し、第1のゲインに対応するイ
ンデックスを第1のゲイン復号回路1220に供給し、
第2のゲインに対応するインデックスを第2のゲイン復
号回路1120に供給する。
【0008】LSP復号回路1020は、複数セットの
LSPが格納されたテーブルを内蔵している。LSP復号回路
1020は、符号入力回路1010から出力されたイン
デックスが入力され、このインデックスに対応するLSP
を内蔵されたテーブルより読み出し、現フレーム(第n
フレーム)の第NsfrサブフレームにおけるLSP
【0009】
【数1】 とする。ここで、Npは線形予測次数である。第1から
第(Nsfr−1)サブフレームのLSPは、
【0010】
【数2】
【0011】
【数3】 とを線形補間して求める。前記LSP
【0012】
【数4】 を線形予測係数変換回路1030および平滑化係数計算
回路1310へ出力する。
【0013】線形予測係数変換回路1030は、LSP復
号回路1020から出力されたLSP
【数5】 が入力され、入力されたLSPを線形予測係数
【0014】
【数6】 に変換し、合成フィルタ1040へ出力する。ここで、
LSPから線形予測係数への変換に関しては周知の方法、
例えば、文献2の5.2.4節に記述されている方法を使用
できる。
【0015】音源信号復号回路1110は、複数個の音
源ベクトルが格納されたテーブルを内蔵している。音源
信号復号回路1110は、符号入力回路1010から出
力されたインデックスを受け、このインデックスに対応
する音源ベクトルを、内蔵されたテーブルから読み出
し、第2のゲイン回路1130へ出力する。
【0016】第2のゲイン復号回路1120は、複数個
のゲインが格納されたテーブルを内蔵している。第2の
ゲイン復号回路1120は、符号入力回路1010から
インデックスが入力され、このインデックスに対応する
第2のゲインをテーブルより読み出し、平滑化回路13
20へ出力する。
【0017】第2のゲイン回路1130は、音源信号復
号回路1110からの第1の音源ベクトルと、平滑化回
路1320からの第2のゲインとを入力され、これら第
1の音源ベクトルと第2のゲインとを乗算して第2の音
源ベクトルを生成し、生成した前記第2の音源ベクトル
を加算器1050へ出力する。
【0018】記憶回路1240は、加算器1050から
励振ベクトルが入力されて、これを保持する。記憶回路
1240は、過去に入力され保持している励振ベクトル
を、ピッチ信号復号回路1210へ出力する。
【0019】ピッチ信号復号回路1210には、記憶回
路1240に保持されている過去の励振ベクトルと符号
入力回路1010からのインデックスが入力される。こ
のインデックスは、遅延Lpdを指定する。そして、過去
の励振ベクトルにおいて、現フレームの始点よりLpd
ンプル過去の点から、ベクトル長に相当するLsfrサン
プル分のベクトルを切り出し、第1のピッチ信号(ベク
トル)を生成する。ここで、Lpd<Lsfrの場合にはLpd
サンプル分のベクトルを切り出し、この切り出したLpd
サンプルを繰り返し接続して、ベクトル長がLsfrサン
プルである第1のピッチベクトルを生成する。ピッチ信
号復号回路1210は、前記第1のピッチベクトルを第
1のゲイン回路1230へ出力する。
【0020】第1のゲイン復号回路1220は、複数個
のゲインが格納されたテーブルを備えている。第1のゲ
イン復号回路1220は、符号入力回路1010から出
力されるインデックスを入力し、前記インデックスに対
応する第1のゲインを前記テーブルより読み出し、第1
のゲイン回路1230へ出力する。
【0021】第1のゲイン回路1230は、ピッチ信号
復号回路1210から出力される第1のピッチベクトル
と、第1のゲイン復号回路1220から出力される第1
のゲインとを入力とし、第1のピッチベクトルと第1の
ゲインとを乗算して第2のピッチベクトルを生成し、生
成した第2のピッチベクトルを加算器1050へ出力す
る。
【0022】加算器1050は、第1のゲイン回路12
30からの第2のピッチベクトルと、第2のゲイン回路
1130からの第2の音源ベクトルとの和を計算し、加
算結果を励振ベクトルとして、合成フィルタ1040へ
出力する。
【0023】平滑化係数計算回路1310は、LSP復号
回路1020から出力されるLSP
【0024】
【数7】 を入力し、第nフレームにおける平均LSP
【0025】
【数8】 を次式により計算する。
【0026】
【数9】
【0027】次に、各サブフレームmに対して、LSPの
変動量d0(m)を次式により計算する。
【0028】
【数10】 サブフレームmにおける平滑化係数k0(m)は、次式
で計算される。
【0029】k0(m)=min(0.25、max
(0,d0(m)−0.4)/0.25 ここで、min(x、y)はxとyとのうち小さい方
を、max(x、y)はxとyとのうち大きい方を値と
してとる関数である。最後に、前記平滑化係数k
0(m)を平滑化回路1320へ出力する。
【0030】平滑化回路1320には、平滑化係数計算
回路1310から平滑化係数k0(m)が、第2のゲイ
ン復号回路1120から第2のゲインが入力される。サ
ブフレームmにおける第2のゲイン
【0031】
【数11】 ら平均ゲイン
【0032】
【数12】 を次式により計算する。
【0033】
【数13】
【0034】次に、次式により第2のゲインは置き換え
られる。
【0035】
【数14】
【0036】最後に、前記第2のゲインを第2のゲイン
回路1130に出力する。
【0037】合成フィルタ1040へは、加算器105
0からの励振ベクトルと、線形予測係数変換回路103
0からの線形予測係数
【数15】 とが入力される。線形予測係数が設定された合成フィル
タ(1/A(z))を、励振ベクトルにより駆動するこ
とで、再生ベクトルを計算し、出力端子20から出力す
る。
【0038】ここで、合成フィルタの伝達関数は、線形
予測係数を
【数16】 とすると、
【0039】
【数17】 と表される。
【0040】図6は、従来例による音声信号符号化復号
装置における、音声信号符号化装置の構成を示すブロッ
ク図である。なお、第1のゲイン回路1230、第2の
ゲイン回路1130、加算器1050および記憶回路1
240の動作は、図5の従来例における音声信号復号装
置で説明した各ブロックと同じであるので、ここでは説
明を省略する。
【0041】図4において、音声信号をサンプリング
し、この複数サンプルを1フレームとして一つのベクト
ルにまとめることにより生成された入力信号(入力ベク
トル)が、入力端子30から入力される。
【0042】線形予測係数計算回路5510は、入力端
子30から供給された入力ベクトルに対して線形予測分
析を行い、線形予測係数を求める。線形予測分析に関し
ては、周知の方法、例えば、L. R. Rabinerらによる「D
igital Processing of Speech Signals」(Prentice-Ha
ll, 1978)(文献3)の第8章「Linear Predictive Cod
ing of Speech」を参照できる。線形予測係数計算回路
5510は、前記線形予測係数を、LSP変換/量子化回路
5520へ出力する。
【0043】LSP変換/量子化回路5520は、線形予測
係数計算回路5510から線形予測係数が入力され、こ
の前記線形予測係数をLSPへ変換し、このLSPを量子化し
て量子化LSPを得る。ここで、線形予測係数からLSPへの
変換に関しては、周知の方法、例えば、文献2の5.2.4
節に記述されている方法を参照できる。また、LSPの量
子化に関しては、文献2の5.2.5節に記述されている方
法を参照できる。
【0044】また、前記量子化LSPは、図3(従来例)
のLSP復号回路で説明したように、現フレーム(第nフ
レーム)の第Nsfrサブフレームにおける量子化LSP
【数18】 とする。
【0045】そして、第1から第(Nsfr−1)サブフ
レームの量子化LSPは、
【数19】
【0046】
【数20】 とを線形補間して求める。さらに、前記LSPは、現フレ
ーム(第nフレーム)の第(Nsfr−1)サブフレーム
におけるLSPとする。そして、第1から第(Nsfr−1)
サブフレームのLSPは、
【0047】
【数21】
【0048】
【数22】 とを線形補間して求める。
【0049】LSP変換/量子化回路5520は、前記LSP
【数23】 と、前記量子化LSP
【0050】
【数24】 と、を線形予測係数変換回路5030へ出力し、前記量
子化LSP
【0051】
【数25】 に対応するインデックスを符号出力回路6010へ出力
する。
【0052】線形予測係数変換回路5030は、LSP変
換/量子化回路5520からのLSP(q(m) j(n)、
j=1、…、Nsfr))と量子化LSP
【数26】 とが入力され、このLSP(q(m) j(n))を、線形予
測係数[α(m) j(n)、j=1,…、Np、m=1,
…、Nsfr]に変換し、
【0053】
【数27】 を量子化線形予測係数
【0054】
【数28】 に変換し、α(m) j(n)を重み付けフィルタ5050と
重み付け合成フィルタ5040とへ出力し、前記
【0055】
【数29】 を重み付け合成フィルタ5040へ出力する。ここで、
LSPから線形予測係数への変換および量子化LSPから量子
化線形予測係数への変換に関しては周知の方法、例え
ば、文献2の5.2.4節に記述されている方法を参照でき
る。
【0056】重み付けフィルタ5050は、入力端子3
0から入力ベクトルが、線形予測係数変換回路5030
から線形予測係数が入力され、この線形予測係数を用い
て、人間の聴覚特性に対応した重みづけフィルタの伝達
関数W(z)を生成し、この重みづけフィルタを入力ベ
クトルで駆動することで、重みづけ入力ベクトルが得ら
れる。そして重みづけフィルタは、重みづけ入力ベクト
ルを、差分器5060へと出力する。ここで、重みづけ
フィルタの伝達関数は、 W(z)=Q(z/γ1)/
Q(z/γ2)と表される。
【0057】ただし、
【数30】
【0058】
【数31】 である。γ1およびγ2は定数であり、例えば、γ1
0.9、γ2=0.6である。また、重みづけフィルタ
の詳細に関しては、(文献1)を参照できる。
【0059】重み付け合成フィルタ5040は、加算器
1050から出力される励振ベクトルと、線形予測係数
変換回路5030から出力される線形予測係数[α(m) j
(n)、j=1,…、Np、m=1,…、Nsfr]と、量
子化線形予測係数とを入力する。これらが設定された重
み付け合成フィルタH(z)W(z)=Q(z/γ1
/[A(z)Q(z/γ2)] を、励振ベクトルにより
駆動することで、重み付け再生ベクトルを得る。ここ
で、合成フィルタの伝達関数H(z)=1/A(z)
は、
【0060】
【数32】 と表される。
【0061】差分器5060は、重み付けフィルタ50
50から重み付け入力ベクトルが、重み付け合成フィル
タ5040から重み付け再生ベクトル入力されて、それ
らの差分を計算し、これを差分ベクトルとして、最小化
回路5070へ出力する。
【0062】最小化回路5070は、音源信号生成回路
5110に格納されている音源ベクトル全てに対応する
インデックスを、音源信号生成回路5110へ順次出力
し、ピッチ信号生成回路5210において規定された範
囲内の遅延Lpd全てに対応するインデックスを、前記ピ
ッチ信号生成回路5210へ順次出力し、第1のゲイン
生成回路6220に格納されている第1のゲイン全てに
対応するインデックスを、前記第1のゲイン生成回路6
220へ順次出力し、第2のゲイン生成回路6120に
格納されている第2のゲイン全てに対応するインデック
スを、前記第2のゲイン生成回路6120へ順次出力す
る。また、最小化回路5070は、差分器5060から
出力される差分ベクトルのノルムを計算し、ノルムが最
小となるような、前記音源ベクトル、前記遅延、前記第
1のゲインおよび前記第2のゲインを選択し、これらに
対応するインデックスを符号出力回路6010へ出力す
る。
【0063】ピッチ信号生成回路5210、音源信号生
成回路5110、第1のゲイン生成回路6220および
第2のゲイン生成回路6120は、各々、最小化回路5
070から出力されるインデックスを順次入力する。こ
れら、ピッチ信号生成回路5210、音源信号生成回路
5110、第1のゲイン生成回路6220および第2の
ゲイン生成回路6120は、各々、入出力に関する結線
を除けば、図3のピッチ信号復号回路1210、音源信
号復号回路1110、第1のゲイン復号回路1220お
よび第2のゲイン復号回路1120と同じであるので、
これら各ブロックの詳細な説明は省略する。
【0064】符号出力回路6010は、LSP変換/量子化
回路5520から出力される量子化LSPに対応するイン
デックスを入力し、最小化回路5070から出力され
る、音源ベクトル、遅延、第1のゲインおよび第2のゲ
インの各々に対応するインデックスを入力し、各インデ
ックスをビット系列の符号に変換し、出力端子40を介
して出力する。
【0065】
【発明が解決しようとする課題】問題点は、雑音区間に
おける音源ゲイン(第2のゲイン)の平滑化では、励振
ベクトルから計算される短時間平均パワーの時間変化が
十分滑らかではないため、雑音区間における復号音質の
劣化を十分には改善できないことである。その理由は、
音源ゲインのみを平滑化しているため、音源ベクトル
(ゲイン乗算後の第2の音源ベクトル)とピッチベクト
ル(ゲイン乗算後の第2のピッチベクトル)を加算して
得られる励振ベクトルの短時間平均パワーが十分に滑ら
かになるとは限らないからである。
【0066】雑音区間において従来例による音源ゲイン
平滑化を行った、励振信号(励振ベクトル)の短時間平
均パワーと、前記平滑化を行わない励振信号の短時間平
均パワーとを各々図7と図8に示す。ここで、横軸がフ
レーム番号を、縦軸がパワーを表す。ただし、短時間平
均パワーの計算は80 msec毎に行っている。図7と図8
とから、従来例による音源ゲイン平滑化後の励振信号に
おける短時間平均パワーが時間的に必ずしも十分に滑ら
かではないことがわかる。
【0067】
【課題を解決するための手段】本願の第1の発明は、受
信した信号から励振信号と線形予測係数の情報を復号
し、前記復号した情報から前記励振信号と前記線形予測
係数とを生成し、前記線形予測係数で構成するフィルタ
を前記励振信号により駆動することによって音声信号を
復号する音声信号復号方法において、前記励振信号のノ
ルムを一定区間毎に計算し、前記ノルムをそれ以前の区
間において得られた前記ノルムを用いて平滑化し、前記
ノルムと前記平滑化したノルムとを用いて該区間におけ
る前記励振信号の振幅を変更し、前記振幅を変更した励
振信号により前記フィルタを駆動することを特徴とす
る。
【0068】本願の第2の発明は、受信した信号から励
振信号と線形予測係数の情報を復号し、前記復号した情
報から前記励振信号と前記線形予測係数とを生成し、前
記線形予測係数で構成するフィルタを前記励振信号によ
り駆動することによって音声信号を復号する音声信号復
号方法において、前記復号した情報を用いて前記受信し
た信号について有音区間と雑音区間との識別を行ない、
前記雑音区間において、前記励振信号のノルムを一定区
間毎に計算し、前記ノルムをそれ以前の区間において得
られた前記ノルムを用いて平滑化し、前記ノルムと前記
平滑化したノルムとを用いて該区間における前記励振信
号の振幅を変更し、前記振幅を変更した励振信号により
前記フィルタを駆動することを特徴とする。
【0069】本願の第3の発明は、第1または第2の発
明において、該区間における前記励振信号を前記ノルム
で除算し、該区間における前記平滑化したノルムを乗算
することにより、前記励振信号の振幅を変更することを
特徴とする。
【0070】本願の第4の発明は、第1、第2または第
3の発明において、入力された切替制御信号に従って、
前記振幅を変更した励振信号と前記励振信号とを切り替
えることを特徴とする。
【0071】本願の第5の発明は、入力音声信号を励振
信号と線形予測係数とで表現することにより符号化を行
い、請求項1、2、3または4記載の音声信号復号方法
で復号を行うことを特徴とする。
【0072】本願の第6の発明は、受信した信号から励
振信号と線形予測係数の情報を復号し、前記復号した情
報から前記励振信号と前記線形予測係数を生成し、前記
線形予測係数で構成するフィルタを前記励振信号により
駆動することによって音声信号を復号する音声信号復号
装置において、前記励振信号のノルムを一定区間毎に計
算し、前記励振信号を前記ノルムで除算する励振信号正
規化回路と、前記ノルムをそれ以前の区間において得ら
れた前記ノルムを用いて平滑化する平滑化回路と、前記
平滑化したノルムを前記励振信号に乗算することによ
り、該区間における前記励振信号の振幅を変更する励振
信号復元回路とを含んで構成されることを特徴とする。
【0073】本願の第7の発明は、受信した信号から励
振信号と線形予測係数の情報を復号し、前記復号した情
報から前記励振信号と前記線形予測係数を生成し、前記
線形予測係数で構成するフィルタを前記励振信号により
駆動することによって音声信号を復号する音声信号復号
装置において、前記復号した情報を用いて前記受信した
信号について有音区間と雑音区間との識別を行なう有音
/無音識別回路と、前記雑音区間において、前記励振信
号のノルムを一定区間毎に計算し、前記励振信号を前記
ノルムで除算する励振信号正規化回路と、前記ノルムを
それ以前の区間において得られた前記ノルムを用いて平
滑化する平滑化回路と、前記平滑化したノルムを前記励
振信号に乗算することにより、該区間における前記励振
信号の振幅を変更する励振信号復元回路とを含んで構成
されることを特徴とする。
【0074】本願の第8の発明は、第6の発明または第
7の発明において、入力された切替信号に従って、前記
振幅を変更した励振信号と前記励振信号とを切り替える
ことを特徴とする。
【0075】本願の第9の発明は、入力音声信号を励振
信号と線形予測係数とで表現することにより符号化を行
う音声信号符号化装置と、請求項6、7または8記載の
音声信号復号装置を含んで構成されることを特徴とす
る。
【0076】
【作用】本発明では、音源ベクトル(ゲイン乗算後の第
2の音源ベクトル)とピッチベクトル(ゲイン乗算後の
第2のピッチベクトル)とを加算して得られる励振ベク
トルから計算されるノルムを雑音区間において平滑化す
るため、前記励振ベクトルにおける短時間平均パワーが
時間的に滑らかになる。したがって、雑音区間における
復号音質の劣化を改善できる。
【0077】次に、本発明では、励振ベクトルから求め
たノルムに対して、単一の処理ではなく、入力信号の特
性を考慮して複数個用意した処理方法を選択的に用いて
前記ノルムの平滑化を雑音区間において行う。例えば、
過去の限られた区間の復号パラメータから計算する移動
平均(Moving Average)処理、長い過去の影響を考慮可能
な自己回帰(Auto-Regressive)処理、あるいは、平均を
計算した後に予め設定した値を上限や下限で制限する非
線形処理等がある。
【0078】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。図1は、本発明の音
声信号復号装置の第1の実施の形態を示すブロック図で
ある。
【0079】なお、入力端子10、出力端子20、符号
入力回路1010、LSP復号回路1020、線形予測係
数変換回路1030、音源信号復号回路1110、記憶
回路1240、ピッチ信号復号回路1210、第1のゲ
イン復号回路1220、第2のゲイン復号回路112
0、第1のゲイン回路1230、第2のゲイン回路11
30、加算器1050、平滑化係数計算回路1310、
平滑化回路1320および合成フィルタ1040は、図
5の従来例で説明した各ブロックと同じであるので、こ
こでは説明を省略する。以下では、励振信号正規化回路
2510、励振信号復元回路2610について説明す
る。
【0080】ここで、従来例と同様に、ビット系列の入
力は、Tfrmsec(例えば、20 msec)のフレーム周期で
行われるものとし、再生ベクトルの計算は、Nsfrを整
数(例えば、4)として、Tfr/Nsfr msec(例えば、
5 msec)周期(サブフレーム)で行われるものとする。
フレーム長をLfrサンプル(例えば、320サンプル)、
サブフレーム長をLsfrサンプル(例えば、80サンプ
ル)とする。これは、入力信号のサンプリング周波数
が、16kHzの場合の例である。以下、各ブロックを
説明する。
【0081】励振信号正規化回路2510は、加算器1
050から第mサブフレームにおける励振ベクトル[x
(m) exc(i);i=0,…、Lsfr−1;m=0,…、
sfr−1]が入力され、サブフレーム毎に、あるいは
サブフレームを分割したサブサブフレーム毎に、励振ベ
クトル[x(m) exc(i)]からゲインと形状ベクトルと
を計算し、ゲインを平滑化回路1320へ出力し、形状
ベクトルを励振信号復元回路2610へ出力する。ここ
で、ゲインとしては、次式で表されるノルムを用いるこ
とにする。
【0082】
【数33】 ただし、Nssfrはサブフレームの分割数(サブフレーム
中のサブサブフレーム数)である(例えば、2)。この
とき、励振ベクトル[x(m) exc(i)]をゲイン[ge
xc(j);j=0、…、(Nsfr・Nssfr−1)]に
より除算して得られる形状ベクトルを次式により計算す
る。
【0083】
【数34】 励振信号復元回路2610は、平滑化回路からゲイン
[gexc(j);j=0、…、(Nsfr・Nssfr−1)]
が、励振信号正規化回路2510から形状ベクトル[e
(m) exc(i);i=0、…、(Lsfr/Nssfr―1);j
=0、…、(Nsfr・Nssfr−1)]とが入力され、次
式により(平滑化された)励振ベクトルを計算し、励振
ベクトルを記憶回路1240と合成フィルタ1040と
へ出力する。
【0084】
【数35】
【0085】図2は、本発明の音声信号復号装置の第2
の実施の形態を示すブロック図である。
【0086】なお、入力端子10、出力端子20、符号
入力回路1010、LSP復号回路1020、線形予測係
数変換回路1030、音源信号復号回路1110、記憶
回路1240、ピッチ信号復号回路1210、第1のゲ
イン復号回路1220、第2のゲイン復号回路112
0、第1のゲイン回路1230、第2のゲイン回路11
30、加算器1050、平滑化係数計算回路1310、
平滑化回路1320および合成フィルタ1040は、図
3の従来例で説明した各ブロックと同じであり、励振信
号正規化回路2510、励振信号復元回路2610は、
図1の第1の実施例で説明した各ブロックと同じである
ので、ここでは説明を省略する。以下では、パワー計算
回路3040、音声モード決定回路3050、有音/無
音識別回路2020、雑音分類回路2030、第1の切
替回路2110、第1のフィルタ2150、第2のフィ
ルタ2160および第3のフィルタ2170について説
明する。
【0087】パワー計算回路3040は、合成フィルタ
1040から再生ベクトルが供給され、再生ベクトルの
自乗和から、パワーを計算し、計算結果を、有音/無音
識別回路2020へ出力する。ここでは、サブフレーム
毎にパワーを計算するものとし、第mサブフレームにお
けるパワーの計算には、第(m−1)サブフレームにお
いて前記合成フィルタ1040から出力された前記再生
ベクトルを用いる。再生ベクトルを[Ssyn(i);i
=0、…、Lsfr]とすると、パワー(Epow)は、次式
で計算される。
【0088】
【数36】 ここで、前式の代りに、例えば、次式で表される再生ベ
クトルのノルムを用いることもできる。
【0089】
【数37】
【0090】音声モード決定回路3050には、記憶回
路1240に保持されている過去の励振ベクトル[e
mem(i);i=0、…、(Lmem―1)]が供給され、
また、符号入力回路1010からインデックスが供給さ
れる。このインデックスは、遅延Lpdを指定する。ここ
で、Lmemは、Lpdの最大値により決定される定数であ
る。第mサブフレームにおいて、過去の励振ベクトルe
mem(i)と、遅延Lpdとから、ピッチ予測ゲイン[G
emem(m);m=1、…、Nsfr]を計算する。
【0091】 Gemem(m)=10log10(gemem(m))
【0092】ここで、
【数38】
【0093】
【数39】
【0094】
【数40】
【0095】
【数41】 である。ピッチ予測ゲインGemem(m)あるいは、G
emem(m)の第nフレームにおけるフレーム内平均値
【0096】
【数42】 に対し次の閾値処理を行なうことにより、音声モードS
modeを設定する。
【0097】
【数43】 音声モード決定回路3050は、音声モードを、有音/
無音識別回路2020へ出力する。
【0098】有音/無音識別回路2020は、LSP復号回
路1020から出力されるLSP
【数44】 と、音声モード決定回路2050から出力される音声モ
ードと、パワー計算回路3040から出力されるパワー
とを入力する。スペクトルパラメータの変動量を求める
手順を以下に示す。スペクトルパラメータとしてLSP
【0099】
【数45】 を用いる。第フレームにおいて、LSPの長時間平均
【0100】
【数46】 を次式により計算する。
【0101】
【数47】
【0102】ここで、β0=0.9である。第フレーム
におけるLSPの変動量を次式により定義する。
【0103】
【数48】 ここで、D(m) q jは、
【0104】
【数49】
【0105】
【数50】 との距離に相当する。例えば、
【0106】
【数51】 または、
【0107】
【数52】 とできる。ここでは、後者とする。変動量dq(n)が
大きい区間を有音区間に、小さい区間を無音区間(雑音
区間)に概ね対応させることができる。しかし、この変
動量は、時間的な変動が大きく、有音区間におけるの変
動量の値域と、無音区間における変動量の値域は、互い
に重複するため、有音区間と無音区間とを識別するため
の閾値の設定が容易ではないという問題がある。そこ
で、変動量d q(n)の長時間平均を有音区間と無音区
間との識別に用いる。線形フィルタまたは非線型フィル
タを用いての長時間平均
【0108】
【数53】 を求める。これには、例えば、変動量dq(n)の平均
値、中央値、最頻値などが適用できる。ここでは、次式
を用いる。
【0109】
【数54】 ここで、β1=0.9である。
【0110】この平均値に対する閾値処理により、識別
フラグSvsを決定する。
【0111】
【数55】 ここで、Cth1はある定数(例えば、2.2)であり、Svs
=1は、有音区間に、S vs=0は、無音区間に対応す
る。有音区間でも定常性が高い区間では、が小さいた
め、無音区間と誤る場合がある。そのため、フレームの
パワーが大きく、かつピッチ予測ゲインが大きい場合に
は有音区間とみなすこととする。のとき、次の追加判定
により、Svsの修正を行う。
【0112】
【数56】 ここで、Crmsはある定数(例えば、10000)である。
は、ピッチ予測ゲインのフレーム内平均値
【0113】
【数57】 が3.5 dB以上であることに対応する。有音/無音識別回
路2020は、識別フラグSvsを、雑音分類回路203
0と第1の切替回路2110へ出力し、
【0114】
【数58】 を雑音分類回路2030へ出力する。
【0115】雑音分類回路2030には、有音/無音識
別回路2020から出力される
【数59】 と識別フラグSvsとが入力される。無音区間(雑音区
間)において、線形フィルタまたは非線型フィルタを用
いて
【0116】
【数60】 の平均的な挙動を反映した値
【0117】
【数61】 を求める。Svs=0のとき次式を計算する。
【0118】
【数62】 ここで、β2=0.94である。
【0119】
【数63】 に対する閾値処理により、雑音の分類を行い、分類フラ
グSvsを決定する。
【0120】
【数64】 ここで、Cth2はある定数(例えば、1.7)であり、Snz
=1は周波数特性の時間変化が非定常的である雑音に、
nz=0は周波数特性の時間変化が定常的である雑音に
対応する。雑音分類回路2030は、Snzを第1の切替
回路2110へ出力する。
【0121】第1の切替回路2110は、励振信号正規
化回路2510から出力されるゲイン[gexc(j);
j=0、…、(Nssfr・Nsfr−1)]と、有音
/無音識別回路2020からの識別フラグSvsと、雑音
分類回路2030からの分類フラグSnzとが入力され、
識別フラグの値とフラグの値とに応じてスイッチを切り
替えることで、ゲインgexc(j)を、Svs=Snz=0
のときは第1のフィルタ2150へ、Svs=0かつSnz
=1のときは第2のフィルタ2160へ、Svs=1のと
きは第3のフィルタ2170へ出力する。
【0122】第1のフィルタ2150は、第1の切替回
路2110からゲイン[gexc(j);j=0、…、
(Nssfr・Nsfr−1)]が入力され、線形フィ
ルタまたは非線型フィルタを用いて平滑化し、これを第
1の平滑化ゲイン
【0123】
【数65】 とし、励振信号復元回路2610へ出力する。ここで
は、次式で表されるフィルタを用いる。
【0124】
【数66】 ただし、
【0125】
【数67】 は、前フレームにおけるに
【0126】
【数68】 対応する。また、γ21=0.94とする。
【0127】第2のフィルタ2160は、第1の切替回
路2110から出力されるゲインを、線形フィルタまた
は非線型フィルタを用いて平滑化し、これを第2の平滑
化ゲイン
【0128】
【数69】 とし、励振信号復元回路2610へ出力する。ここで
は、次式で表されるフィルタを用いる。
【0129】
【数70】 ただし、
【0130】
【数71】 は、前フレームにおける
【0131】
【数72】 に対応する。また、γ22=0.9とする。
【0132】第3のフィルタ2170は、第1の切替回
路2110から出力されるゲインを入力し、線形フィル
タまたは非線型フィルタを用いて平滑化し、これを第3
の平滑化ゲイン
【0133】
【数73】 とし、励振信号復元回路2610へ出力する。ここで
は、
【0134】
【数74】 とする。
【0135】図3は、本発明の音声信号復号装置の第3
の実施の形態を示すブロック図である。図3は、図1に
入力端子50と第2の切替回路7110とを付加し、結
線を変更しただけであるので、入力端子50と第2の切
替回路7110についてのみ説明する。入力端子50か
らは、切替制御信号が供給される。切替回路7110
は、加算器1050から出力される励振ベクトルを入力
し、この切替制御信号に従って、励振ベクトルを、合成
フィルタ1040、あるいは、励振信号正規化回路25
10のいずれかへと出力する。
【0136】図4は、本発明の音声信号復号装置の第4
の実施の形態を示すブロック図である。図4は、図2に
入力端子50と第2の切替回路7110とを付加し、結
線を変更しただけであり、入力端子50と第2の切替回
路7110は、図3の第3の実施例で説明した各ブロッ
クと同じであるので、ここでは説明を省略する。
【0137】本発明の第5の実施例の音声信号符号化復
号装置における音声信号符号化装置の構成は、従来例に
よる、音声信号符号化復号装置における音声信号符号化
装置の構成と同じである。したがって、説明を省略す
る。
【0138】
【発明の効果】本発明による第1の効果は、雑音区間に
おいて、励振ベクトルにおける短時間平均パワーが時間
的に滑らかになることにより、雑音区間における復号音
質の劣化が改善されることである。その理由は、音源ベ
クトル(ゲイン乗算後の第2の音源ベクトル)とピッチ
ベクトル(ゲイン乗算後の第2のピッチベクトル)とを
加算して得られる励振ベクトルから計算されるノルムを
平滑化しているからである。
【0139】雑音区間において本実施例による励振信号
(励振ベクトル)から計算されるノルムに対する平滑化
を行った励振信号の短時間平均パワーを図9に示す。こ
こで、横軸がフレーム番号を、縦軸がパワーを表す。た
だし、短時間平均パワーの計算は80 msec毎に行ってい
る。図9から、本実施例による前記平滑化によって、励
振信号における短時間平均パワーが時間的に滑らかにな
っていることがわかる。
【0140】本発明による第2の効果は、背景雑音の種
類に応じて励振信号の平滑化処理を選択できることであ
り、その結果、復号音質を改善できることである。その
理由は、雑音区間において、複数個用意した処理方法を
入力信号の特性に合わせて選択し、励振信号の平滑化を
行うからである。
【図面の簡単な説明】
【図1】本発明の音声信号復号装置の第1の実施の形態
を示すブロック図である。
【図2】本発明の音声信号復号装置の第2の実施の形態
を示すブロック図である。
【図3】本発明の音声信号復号装置の第3の実施の形態
を示すブロック図である。
【図4】本発明の音声信号復号装置の第4の実施の形態
を示すブロック図である。
【図5】従来の音声信号復号装置を説明するブロック図
である。
【図6】従来の音声信号符号化装置を説明するブロック
図である。
【図7】従来例による音源ゲイン平滑化を行った励振信
号(励振ベクトル)の短時間平均パワーを表す図であ
る。
【図8】平滑化を行わない励振信号(励振ベクトル)の
短時間平均パワーを表す図である。
【図9】本発明による励振ベクトルから計算されるノル
ムに対する平滑化を行った励振信号(励振ベクトル)の
短時間平均パワーを表す図である。
【符号の説明】
10,30,50 入力端子 20,40 出力端子 1010 符号入力回路 1020 LSP復号回路 1030,5030 線形予測係数変換回路 1040 合成フィルタ 1050 加算器 1110 音源信号復号回路 1210 ピッチ信号復号回路 1120 第2のゲイン復号回路 1220 第1のゲイン復号回路 1130 第2のゲイン回路 1230 第1のゲイン回路 1240 記憶回路 1310 平滑化係数計算回路 1320 平滑化回路 2020 有音/無音識別回路 2030 雑音分類回路 2110 第1の切替回路 7110 第2の切替回路 2150 第1のフィルタ 2160 第2のフィルタ 2170 第3のフィルタ 3040 パワー計算回路 3050 音声モード決定回路 5510 線形予測係数計算回路 5520 LSP変換/量子化回路 5040 重み付け合成フィルタ 5050 重み付けフィルタ 5060 差分器 5070 最小化回路 5210 ピッチ信号生成回路 5110 音源信号生成回路 6220 第1のゲイン生成回路 6120 第2のゲイン生成回路 6010 符号出力回路

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】受信した信号から励振信号と線形予測係数
    の情報を復号し、前記復号した情報から前記励振信号と
    前記線形予測係数を生成し、前記線形予測係数で構成す
    るフィルタを前記励振信号により駆動することによって
    音声信号を復号する音声信号復号方法において、前記励
    振信号のノルムを一定区間毎に計算し、前記ノルムをそ
    れ以前の区間において得られた前記ノルムを用いて平滑
    化し、前記ノルムと前記平滑したノルムとを用いて該区
    間における前記励振信号の振幅を変更し、前記振幅を変
    更した励振信号により前記フィルタを駆動することを特
    徴とする音声信号復号方法。
  2. 【請求項2】受信した信号から励振信号と線形予測係数
    の情報を復号し、前記復号した情報から前記励振信号と
    前記線形予測係数を生成し、前記線形予測係数で構成す
    るフィルタを前記励振信号により駆動することによって
    音声信号を復号する音声信号復号方法において、前記復
    号した情報を用いて前記受信した信号について有音区間
    と雑音区間との識別を行ない、前記雑音区間において、
    前記励振信号のノルムを一定区間毎に計算し、前記ノル
    ムをそれ以前の区間において得られた前記ノルムを用い
    て平滑化し、前記ノルムと前記平滑化したノルムとを用
    いて該区間における前記励振信号の振幅を変更し、前記
    振幅を変更した励振信号により前記フィルタを駆動する
    ことを特徴とする音声信号復号方法。
  3. 【請求項3】該区間における前記励振信号を前記ノルム
    で除算し、該区間における前記平滑化したノルムを乗算
    することにより、前記励振信号の振幅を変更することを
    特徴とする請求項1または2記載の音声信号復号方法。
  4. 【請求項4】入力された切替信号に従って、前記振幅を
    変更した励振信号と前記励振信号とを切り替えることを
    特徴とする請求項1、2または3記載の音声信号復号方
    法。
  5. 【請求項5】入力音声信号を励振信号と線形予測係数と
    で表現することにより符号化を行い、請求項1、2、3
    または4記載の音声信号復号方法で復号を行う音声信号
    符号化復号方法。
  6. 【請求項6】受信した信号から励振信号と線形予測係数
    の情報を復号し、前記復号した情報から前記励振信号と
    前記線形予測係数を生成し、前記線形予測係数で構成す
    るフィルタを前記励振信号により駆動することによって
    音声信号を復号する音声信号復号装置において、前記励
    振信号のノルムを一定区間毎に計算し、前記励振信号を
    前記ノルムで除算する励振信号正規化回路と、前記ノル
    ムをそれ以前の区間において得られた前記ノルムを用い
    て平滑化する平滑化回路と、前記平滑化したノルムを前
    記励振信号に乗算することにより、該区間における前記
    励振信号の振幅を変更する励振信号復元回路とを含んで
    構成されることを特徴とする音声信号復号装置。
  7. 【請求項7】受信した信号から励振信号と線形予測係数
    の情報を復号し、前記復号した情報から前記励振信号と
    前記線形予測係数を生成し、前記線形予測係数で構成す
    るフィルタを前記励振信号により駆動することによって
    音声信号を復号する音声信号復号装置において、前記復
    号した情報を用いて前記受信した信号について有音区間
    と雑音区間との識別を行なう有音/無音識別回路と、前
    記雑音区間において、前記励振信号のノルムを一定区間
    毎に計算し、前記励振信号を前記ノルムで除算する励振
    信号正規化回路と、前記ノルムをそれ以前の区間におい
    て得られた前記ノルムを用いて平滑化する平滑化回路
    と、前記平滑化したノルムを前記励振信号に乗算するこ
    とにより、該区間における前記励振信号の振幅を変更す
    る励振信号復元回路とを含んで構成されることを特徴と
    する音声信号復号装置。
  8. 【請求項8】入力された切替信号に従って、前記振幅を
    変更した励振信号と前記励振信号とを切り替えることを
    特徴とする請求項6または7記載の音声信号復号装置。
  9. 【請求項9】入力音声信号を励振信号と線形予測係数と
    で表現することにより符号化を行う音声信号符号化装置
    と、請求項6、7または8記載の音声信号復号装置を含
    んで構成されることを特徴とする音声信号符号化復号装
    置。
JP25707599A 1999-09-10 1999-09-10 音声信号復号方法及び音声信号符号化復号方法 Expired - Fee Related JP3417362B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP25707599A JP3417362B2 (ja) 1999-09-10 1999-09-10 音声信号復号方法及び音声信号符号化復号方法
EP00119666A EP1083548B1 (en) 1999-09-10 2000-09-08 Speech signal decoding
US09/658,045 US7031913B1 (en) 1999-09-10 2000-09-08 Method and apparatus for decoding speech signal
CA002317969A CA2317969C (en) 1999-09-10 2000-09-08 Method and apparatus for decoding speech signal
EP06112720A EP1688918A1 (en) 1999-09-10 2000-09-08 Speech decoding
DE60028310T DE60028310T2 (de) 1999-09-10 2000-09-08 Sprachdekodierung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25707599A JP3417362B2 (ja) 1999-09-10 1999-09-10 音声信号復号方法及び音声信号符号化復号方法

Publications (2)

Publication Number Publication Date
JP2001083996A true JP2001083996A (ja) 2001-03-30
JP3417362B2 JP3417362B2 (ja) 2003-06-16

Family

ID=17301406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25707599A Expired - Fee Related JP3417362B2 (ja) 1999-09-10 1999-09-10 音声信号復号方法及び音声信号符号化復号方法

Country Status (5)

Country Link
US (1) US7031913B1 (ja)
EP (2) EP1083548B1 (ja)
JP (1) JP3417362B2 (ja)
CA (1) CA2317969C (ja)
DE (1) DE60028310T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2469419C2 (ru) * 2007-03-05 2012-12-10 Телефонактиеболагет Лм Эрикссон (Пабл) Способ и устройство для управления сглаживанием стационарного фонового шума

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3478209B2 (ja) 1999-11-01 2003-12-15 日本電気株式会社 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
EP3629328A1 (en) * 2007-03-05 2020-04-01 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for smoothing of stationary background noise
CN101266798B (zh) * 2007-03-12 2011-06-15 华为技术有限公司 一种在语音解码器中进行增益平滑的方法及装置
US9208796B2 (en) * 2011-08-22 2015-12-08 Genband Us Llc Estimation of speech energy based on code excited linear prediction (CELP) parameters extracted from a partially-decoded CELP-encoded bit stream and applications of same

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5267317A (en) * 1991-10-18 1993-11-30 At&T Bell Laboratories Method and apparatus for smoothing pitch-cycle waveforms
US5991725A (en) * 1995-03-07 1999-11-23 Advanced Micro Devices, Inc. System and method for enhanced speech quality in voice storage and retrieval systems
DE69712537T2 (de) * 1996-11-07 2002-08-29 Matsushita Electric Industrial Co., Ltd. Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2469419C2 (ru) * 2007-03-05 2012-12-10 Телефонактиеболагет Лм Эрикссон (Пабл) Способ и устройство для управления сглаживанием стационарного фонового шума
US9852739B2 (en) 2007-03-05 2017-12-26 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for controlling smoothing of stationary background noise
US10438601B2 (en) 2007-03-05 2019-10-08 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for controlling smoothing of stationary background noise

Also Published As

Publication number Publication date
CA2317969C (en) 2005-11-08
EP1083548A3 (en) 2003-12-10
CA2317969A1 (en) 2001-03-10
DE60028310D1 (de) 2006-07-06
JP3417362B2 (ja) 2003-06-16
US7031913B1 (en) 2006-04-18
EP1083548B1 (en) 2006-05-31
EP1688918A1 (en) 2006-08-09
DE60028310T2 (de) 2007-05-24
EP1083548A2 (en) 2001-03-14

Similar Documents

Publication Publication Date Title
US7693711B2 (en) Speech signal decoding method and apparatus
EP1096476B1 (en) Speech signal decoding
JPH10207498A (ja) マルチモード符号励振線形予測により音声入力を符号化する方法及びその符号器
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JP3616432B2 (ja) 音声符号化装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JPH09185397A (ja) 音声情報記録装置
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JPH09508479A (ja) バースト励起線形予測
JP3299099B2 (ja) 音声符号化装置
JP3607774B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JPH09146599A (ja) 音声符号化装置
JPH0786952A (ja) 音声の予測符号化方法
JPH10124097A (ja) 音声記録再生装置
JP3092654B2 (ja) 信号符号化装置
JPH08328596A (ja) 音声符号化装置
JPH06195098A (ja) 音声符号化方法
JPH09185396A (ja) 音声符号化装置
JPH09281997A (ja) 音声符号化装置
JPH09114498A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030311

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080411

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090411

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100411

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees