JP3102015B2

JP3102015B2 - 音声復号化方法

Info

Publication number: JP3102015B2
Application number: JP02135273A
Authority: JP
Inventors: 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1990-05-28
Filing date: 1990-05-28
Publication date: 2000-10-23
Anticipated expiration: 2015-10-23
Also published as: JPH0430200A; EP0459358B1; EP0459358A3; US5305332A; EP0459358A2; DE69113866T2; DE69113866D1

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、音声信号を無線伝送路などの誤りの多い伝
送路を通して良好に伝送，復号化するための音声復号化
方法に関する。

〔従来の技術〕

音声信号を８〜4.8kb/s程度の低いビットレートで符
号化する方式としては、例えば、M.Schroeder and B.At
al氏による“Code−excited linear prediction;High q
uality speech at very low bit rates"（Proc.ICASSP,
pp.937−940,1985年）と題した論文（文献１）等に記載
されているCELP（Code Excited LPC Coding）が知られ
ている。この方法では、送信側では、フレーム毎（例え
ば20ms）に音声信号から音声信号のスペクトル特性を表
すスペクトルパラメータを抽出し、フレームをさらに小
区間サブフレーム（例えば5ms）に分割し、サブフレー
ム毎に過去の音源信号をもとに長時間相関（ピッチ相
関）を表すピッチパラメータを抽出し、ピッチパラメー
タによりサブフレームの音声信号を長期予測し、長期予
測して求めた残差信号に対して、予め定められた種類の
雑音信号からなるコードブックから選択した信号により
合成した信号と、音声信号との誤差電力を最小化するよ
うに一種類の雑音信号を選択するとともに、最適なゲイ
ンを計算する。そして選択された雑音信号の種類を表す
インデクスとゲイン、ならびに、スペクトルパラメータ
とピッチパラメータを伝送する。

受信側では、受信したパラメータを用いて音声を再生
する。

〔発明が解決しようとする課題〕

上述した文献１の従来方式では、伝送路に誤りの無い
ときは良好な音声信号を再生できるが、無線伝送路など
のように頻繁に伝送路誤りが発生すると、再生音声の音
質は著しく劣化していた。一例として、自動車電話など
では、フェーデイングなどに起因してバースト誤りが発
生し、ビット誤り率は１％から３％と大きく、再生音声
の劣化は大きかった。このように誤りの多い伝送路で
は、通常、伝送パラメータを保護するために誤り訂正符
号（FEC）が用いられる。さらにバースト誤りにも対処
するために、FECの訂正能力を越えた誤りを受信側で検
出するための誤り検出符号（例えばCRC符号）が使用さ
れる。これらの誤り訂正符号についての詳細は、例え
ば、平田氏らによる“誤り訂正符号及び音声符号化技術
の衛生通信システムへの適用、その動向と今後の技術課
題”（電子情報通信学会情報理論研究会資料,IT84−30,
pp.1〜8,1984年）（文献２）と題した論文に説明されて
いる。

従来音声復号化方式では、誤り検出符号によりFECの
訂正能力を越えた誤りが受信側で検出されたときは、誤
りを検出したフレームの受信パラメータを、過去の正し
く受信したパラメータに置き換えていた。つまり、その
ようなフレームでは、過去の正しく受信したパラメータ
を繰り返して使用して音声を復号化していた。このよう
な復号化の具体的な方法は、例えば、R.V.COX氏らによ
る“Robust CELP Coders for Noisy Backgrounds and N
oisy Channels"と題した論文（Proc.ICASSP89,pp.739−
742,1989年）（文献３）に述べられている。文献３等に
述べられた音声復号化法は簡便であるが、過去のパラメ
ータを繰り返し使用するため、特に過渡部などで音声信
号の特徴が変化しているフレームでは繰り返しにより、
かえって音質が劣化したり、異音が発生するという問題
点があった。

本発明の目的は、このような問題点を解決した音声復
号化方法を提供することにある。

〔課題を解決するための手段〕

第１の発明は、フィルタ係数に関する符号系列とピッ
チに関するパラメータに関する符号系列と、音声の音源
信号を表すコードブックのインデクスとゲインに関する
パラメータの符号系列を受信して復号し音声信号を再生
する音声復号化方法において、受信した符号に訂正不可能な伝送路誤りを検出したと
きは、さらに前記誤りを検出したフレームから予め定め
られたフレーム数だけあるいは予め決められた条件を満
足するまでフィルタ係数に重み付けを施すか、あるいは
再生した信号の大きさが予め決められたしきい値を越え
ているときに音源信号あるいは前記再生信号のゲインを
前記誤りを検出したフレームから予め定められたフレー
ム数あるいは予め定められた条件を満足するまで調整す
ることを特徴とする。

さらに第２の発明は、受信した符号系列に訂正不可能
な伝送路誤りを検出したときは、さらに前記誤りを検出
したフレームから予め定められたフレーム数だけあるい
は予め定められた条件を満足するまでフィルタ係数に重
み付けを施すか、あるいは再生した信号の大きさが予め
定められたしきい値を越えているときに音源信号あるい
は前記再生信号のゲインを前記誤りを検出したフレーム
から予め定められたフレーム数あるいは予め定められた
条件を満足するまで調整することを特徴とする。

〔作用〕

本発明による音声復号化方法の作用を説明する。

第１の発明では、FECの訂正能力以上の誤りを検出し
たフレームにおいて、以下に示す方法により受信したパ
ラメータの補間を行う。ここで文献１のCELP方式を例に
とると、受信したパラメータは、音声信号のスペクトル
を表すフィルタパラメータ、音声のパワを表す情報、ピ
ッチ周期を表す遅延情報、ピッチゲイン、音源信号を表
すコードブックのインデクス、コードブックのゲインで
ある。これらのパラメータのうち、特に、フィルタパラ
メータ、遅延情報、音声のパワを表すパラメータは音質
に影響するため、補間により滑らかに変化させるように
する。

今、第Ｌフレームで誤りを検出したとする。Ｌフレー
ムの第ｉ番目のフィルタパラメータをA_iL、遅延情報をD
_Lとすると、Ｌフレームのパラメータを以下のように補
間する。

A_iL＝δA_i(L-1)＋（１−δ）A_i(L+1) （１） D_L＝δD_L-1＋（１−δ）D_L+1 （２）ここでδは１よりも小さい正の値をとる。また、音声
のパワP_Lは、（３）式に従い対数上で補間する。

logP_L＝δlogP_L-1＋（１−δ）logP_L+1 （３）以上により、重要なパラメータを過去，未来のフレー
ムの情報から補間して復元し、音声信号を再生する。

次に第２の発明では、第１の発明に加えて、誤りの影
響が誤りの発生したフレームよりも将来のフレームに伝
搬するのを防ぐために、フィルタパラメータの重み付け
と、ゲインの調整の少なくとも一つを、誤りを検出した
フレームから始めて予め定められたフレーム数だけ行う
かあるいは、予め定められた条件を満足するまで行う。

ここでフィルタパラメータの重み付けは下式に従い行
う。

α′_iL＝γ^ｉ・α_iL （４）ここで、０＜γ＜１であり、０に近いほど大きな重み
付けがかかる。また、αはＬフレームの線形予測係数で
ある。

次にゲイン調整は以下のように行う。第Ｍフレームで
の音源信号をｅ（ｎ）、再生した再生信号をｓ（ｎ）、
そのパワをＱとする。音源信号に対してゲイン調整を行
うときのゲインをＧとする。

ｅ′（ｎ）＝Ｇ・ｅ（ｎ）（５）ここでＧは以下のように求める。

また、再生信号に対してゲイン調整を行うときは、ｓ（ｎ）＝δｓ（ｎ−１）＋（１−δ）・Ｇ（７）とすればよい。

〔実施例〕

第１図は本発明による音声復号化方法の一実施例に用
いられる音声復号化装置を示すブロック図である。

第１図において、デマルチプレクサ100が、伝送路か
ら符号系列を受信すると、この符号系列を分離し、誤り
訂正復号化回路105に出力する。

誤り訂正復号化回路105は、受信符号系列に対して、
誤り訂正復号化を行い、誤りを検出したときは、補間回
路110に誤り検出情報を出力する。

補間回路110は、誤り訂正復号化回路105から誤り検出
情報を入力したときは、ピッチ周期を表す遅延情報、音
声のパワを表す情報、フィルタパラメータに対して、前
記作用の項に述べたように、（１）〜（３）式を用い
て、過去の正しいフレームのパラメータと未来の正しい
フレームのパラメータとの間で補間を行い、補間したパ
ラメータを出力する。

適応コードブック120は、遅延情報、ピッチゲインと
遅延回路165の出力信号を入力し、予測信号を計算す
る。詳細な計算法は、例えば、Kleijn氏による“Improv
ed speech quality and efficient vector quantizatio
n in SELP"（Proc.ICASSP,pp.155−158,1988年）と題し
た論文（文献４）等を参照できる。

音源コードブック130は、コードベクトルインデクス
を入力し、コードブック135から対応するコードベクト
ルを読みだし、コードベクトルゲインを乗じて音源信号
を出力する。音源コードブックの動作の詳細は前記文献
１等を参照できる。

加算器160は、適応コードブック120からの予測信号と
音源コードブック130からの音源信号とを加算して合成
フィルタ170に出力する。

合成フィルタ170は、補間回路110からフィルタパラメ
ータを入力し、加算器160から音源信号を入力して音声
を再生し、端子180から出力する。合成フィルタ170の動
作の詳細は、前記文献1,4等を参照できる。

第２図は、第２の発明の一実施例に用いられる音声復
号化装置を示すブロック図である。第２図において、第
１図と同一の番号を付した構成要素は、第１図と同一の
動作を行うので説明は省略する。

ゲイン調整回路168は、誤り訂正復号化回路105から誤
り検出情報を入力し、この情報が誤りを検出したことを
示すときは、誤りを検出したフレームから始めて予め定
められたフレーム数だけ合成フィルタ170の入力信号の
ゲイン調整を行う。ゲイン調整は、作用の項に示した
（５），（６）式に従って行う。

パワ計算回路185は、誤りを検出してから予め定めら
れたフレーム数だけ、合成フィルタ170の出力である再
生信号ｓ（ｎ）の１フレーム分のパワＱを計算して、ゲ
イン調整回路165へ出力する。

ここでＮは１フレームのサンプル数を示す。

重み付け回路175は、誤りを検出してから予め定めら
れたフレーム数だけ、合成フィルタ170の係数に対して
前記（４）式に従い重み付けを行い、重み付けた係数を
合成フィルタ170へ出力する。

本発明は、上記実施例に示したCELP方式以外にも他の
周知な方式に適用することができる。

また、伝送情報として、音声のパワ情報の代わりに、
音声信号線形予測残差信号のパワあるいはRMSが伝送さ
れたときは、補間回路110における音声のパワ情報の補
間は以下のように行うことができる。今、第（Ｌ−
１），（Ｌ＋１）フレームで受信した残差信号のパワを
それぞれPd_L-1,Pd_L+1とすると、第（Ｌ−１）フレーム
音声のパワP_L-1は下式により推定する。

ここでK_iはｉ次目のPARCOR係数であり、線形予測係数
α_ｉから周知の方法により求めることができる。（９）
式を用いて第（Ｌ＋１）フレームでも同様にして求め
る。P_L-1,P_L+1の値を前記（３）式に代入して、第Ｌフ
レームのパワの補間値を計算することができる。

また、補間回路110では、誤りを検出したフレームで
は、上記実施例に記した以外のパラメータ、例えば、ピ
ッチゲイン、音源コードブックのゲイン等についても補
間することができる。

また、第２図の実施例において、ゲイン調整回路168
におけるゲイン調整は、音源信号に対してではなく、合
成フィルタ170の出力である再生信号ｓ（ｎ）に対して
行うこともできる。このときはｓ（ｎ）のゲイン調整に
前記（７）式を用いる。

また、第２図の実施例において、重み付け回路175に
おけるフィルタ係数の重み付け、あるいはゲイン調整回
路168におけるゲイン調整は、誤りを検出してから、予
め定められた条件を満足するまで行うことができる。こ
の条件としては、例えば、適応コードブック120のゲイ
ンの値が予め定められたしきい値を下回るとき、あるい
は、音声パワやRMSの値が予め定められた値を下回った
ときなどを適用することができる。

さらにフィルタ係数の重み付けにおいては、誤りを検
出してから、予測ゲインの大きなフレームに対しての
み、重み付けを行うようにすることもできる。ここで予
測ゲインG_pは、で求められる。

〔発明の効果〕

以上述べたように、本発明によれば、受信側で誤りを
検出したフレームでは、重要な伝送パラメータについ
て、過去の正しいフレームのパラメータと、未来の正し
いフレームのパラメータを用いて補間によりパラメータ
を復元し音声を再生しているので、過去の正しいフレー
ムのパラメータを単純に繰り返す従来法と比べ、誤りに
よる音質劣化の少ない良好な再生音声を提供することが
できるという大きな効果がある。

【図面の簡単な説明】

第１図は第１の発明による音声復号化方法の一実施例を
実現する音声復号化装置のブロック図、第２図は第２の発明による音声復号化方法の一実施例を
実現する音声復号化装置のブロック図である。 100……デマルチプレクサ 105……誤り訂正復号化回路 110……補間回路 120……適応コードブック回路 130……音源コードブック回路 135……コードブック 160……加算器 165……遅延回路 168……ゲイン調整回路 170……合成フィルタ 180……出力端子 185……パワ計算回路

フロントページの続き (56)参考文献特開平１−165235（ＪＰ，Ａ) ＰｒｏｃｅｅｄｉｎｇｓｏｆＩＥＥＥ 1989 ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，Ｖｏｌ．２，”Ｓ14．２ＲｏｂｕｓｔＣＥＬＰＣｏｄｅｒｓｆｏｒＮｏｉｓｙＢａｃｋｇｒｏｕｎｄｓａｎｄＮｏｉｓｙＣｈａｎｎｅｌｓ”ｐ．739−742 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 11/00 - 13/08 G10L 19/00 - 21/06 ＩＮＳＰＥＣ（ＤＩＡＬＯＧ) ＪＩＣＳＴファイル（ＪＯＩＳ) ＷＰＩ（ＤＩＡＬＯＧ)

Claims

(57)【特許請求の範囲】

【請求項１】フィルタ係数に関する符号系列とピッチに
関するパラメータに関する符号系列と、音声の音源信号
を表すコードブックのインデクスとゲインに関するパラ
メータの符号系列を受信して復号し音声信号を再生する
音声復号化方法において、受信した符号系列に訂正不可能な伝送路誤りを検出した
ときは、さらに前記誤りを検出したフレームから予め定
められたフレーム数だけあるいは予め決められた条件を
満足するまでフィルタ係数に重み付けを施すか、あるい
は再生した信号の大きさが予め決められたしきい値を越
えているときに音源信号あるいは前記再生信号のゲイン
を前記誤りを検出したフレームから予め定められたフレ
ーム数あるいは予め定められた条件を満足するまで調整
することを特徴とする音声復号化方法。
【請求項２】フィルタ係数に関する符号系列とピッチに
関するパラメータに関する符号系列と、音声の音源信号
を表すインデクスとゲインに関するパラメータの符号系
列を受信して復号し音声信号を再生する音声復号化方法
において、受信した符号系列に訂正不可能な伝送路誤りを検出した
ときは、前記誤りを検出したフレームからあらかじめ定
められたフレーム数だけあるいはあらかじめ定められた
条件を満足するまでフィルタ係数に重み付けを施すか、
あるいは再生した信号の大きさが予め定められたしきい
値を越えているときに音源信号あるいは前記再生信号の
ゲインを前記誤りを検出したフレームからあらかじめ定
められたフレーム数あるいはあらかじめ定められた条件
を満足するまで調整することを特徴とする音声復号化方
法。