JP3102015B2 - 音声復号化方法 - Google Patents
音声復号化方法Info
- Publication number
- JP3102015B2 JP3102015B2 JP02135273A JP13527390A JP3102015B2 JP 3102015 B2 JP3102015 B2 JP 3102015B2 JP 02135273 A JP02135273 A JP 02135273A JP 13527390 A JP13527390 A JP 13527390A JP 3102015 B2 JP3102015 B2 JP 3102015B2
- Authority
- JP
- Japan
- Prior art keywords
- error
- signal
- frame
- code sequence
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号を無線伝送路などの誤りの多い伝
送路を通して良好に伝送,復号化するための音声復号化
方法に関する。
送路を通して良好に伝送,復号化するための音声復号化
方法に関する。
音声信号を8〜4.8kb/s程度の低いビットレートで符
号化する方式としては、例えば、M.Schroeder and B.At
al氏による“Code−excited linear prediction;High q
uality speech at very low bit rates"(Proc.ICASSP,
pp.937−940,1985年)と題した論文(文献1)等に記載
されているCELP(Code Excited LPC Coding)が知られ
ている。この方法では、送信側では、フレーム毎(例え
ば20ms)に音声信号から音声信号のスペクトル特性を表
すスペクトルパラメータを抽出し、フレームをさらに小
区間サブフレーム(例えば5ms)に分割し、サブフレー
ム毎に過去の音源信号をもとに長時間相関(ピッチ相
関)を表すピッチパラメータを抽出し、ピッチパラメー
タによりサブフレームの音声信号を長期予測し、長期予
測して求めた残差信号に対して、予め定められた種類の
雑音信号からなるコードブックから選択した信号により
合成した信号と、音声信号との誤差電力を最小化するよ
うに一種類の雑音信号を選択するとともに、最適なゲイ
ンを計算する。そして選択された雑音信号の種類を表す
インデクスとゲイン、ならびに、スペクトルパラメータ
とピッチパラメータを伝送する。
号化する方式としては、例えば、M.Schroeder and B.At
al氏による“Code−excited linear prediction;High q
uality speech at very low bit rates"(Proc.ICASSP,
pp.937−940,1985年)と題した論文(文献1)等に記載
されているCELP(Code Excited LPC Coding)が知られ
ている。この方法では、送信側では、フレーム毎(例え
ば20ms)に音声信号から音声信号のスペクトル特性を表
すスペクトルパラメータを抽出し、フレームをさらに小
区間サブフレーム(例えば5ms)に分割し、サブフレー
ム毎に過去の音源信号をもとに長時間相関(ピッチ相
関)を表すピッチパラメータを抽出し、ピッチパラメー
タによりサブフレームの音声信号を長期予測し、長期予
測して求めた残差信号に対して、予め定められた種類の
雑音信号からなるコードブックから選択した信号により
合成した信号と、音声信号との誤差電力を最小化するよ
うに一種類の雑音信号を選択するとともに、最適なゲイ
ンを計算する。そして選択された雑音信号の種類を表す
インデクスとゲイン、ならびに、スペクトルパラメータ
とピッチパラメータを伝送する。
受信側では、受信したパラメータを用いて音声を再生
する。
する。
上述した文献1の従来方式では、伝送路に誤りの無い
ときは良好な音声信号を再生できるが、無線伝送路など
のように頻繁に伝送路誤りが発生すると、再生音声の音
質は著しく劣化していた。一例として、自動車電話など
では、フェーデイングなどに起因してバースト誤りが発
生し、ビット誤り率は1%から3%と大きく、再生音声
の劣化は大きかった。このように誤りの多い伝送路で
は、通常、伝送パラメータを保護するために誤り訂正符
号(FEC)が用いられる。さらにバースト誤りにも対処
するために、FECの訂正能力を越えた誤りを受信側で検
出するための誤り検出符号(例えばCRC符号)が使用さ
れる。これらの誤り訂正符号についての詳細は、例え
ば、平田氏らによる“誤り訂正符号及び音声符号化技術
の衛生通信システムへの適用、その動向と今後の技術課
題”(電子情報通信学会情報理論研究会資料,IT84−30,
pp.1〜8,1984年)(文献2)と題した論文に説明されて
いる。
ときは良好な音声信号を再生できるが、無線伝送路など
のように頻繁に伝送路誤りが発生すると、再生音声の音
質は著しく劣化していた。一例として、自動車電話など
では、フェーデイングなどに起因してバースト誤りが発
生し、ビット誤り率は1%から3%と大きく、再生音声
の劣化は大きかった。このように誤りの多い伝送路で
は、通常、伝送パラメータを保護するために誤り訂正符
号(FEC)が用いられる。さらにバースト誤りにも対処
するために、FECの訂正能力を越えた誤りを受信側で検
出するための誤り検出符号(例えばCRC符号)が使用さ
れる。これらの誤り訂正符号についての詳細は、例え
ば、平田氏らによる“誤り訂正符号及び音声符号化技術
の衛生通信システムへの適用、その動向と今後の技術課
題”(電子情報通信学会情報理論研究会資料,IT84−30,
pp.1〜8,1984年)(文献2)と題した論文に説明されて
いる。
従来音声復号化方式では、誤り検出符号によりFECの
訂正能力を越えた誤りが受信側で検出されたときは、誤
りを検出したフレームの受信パラメータを、過去の正し
く受信したパラメータに置き換えていた。つまり、その
ようなフレームでは、過去の正しく受信したパラメータ
を繰り返して使用して音声を復号化していた。このよう
な復号化の具体的な方法は、例えば、R.V.COX氏らによ
る“Robust CELP Coders for Noisy Backgrounds and N
oisy Channels"と題した論文(Proc.ICASSP89,pp.739−
742,1989年)(文献3)に述べられている。文献3等に
述べられた音声復号化法は簡便であるが、過去のパラメ
ータを繰り返し使用するため、特に過渡部などで音声信
号の特徴が変化しているフレームでは繰り返しにより、
かえって音質が劣化したり、異音が発生するという問題
点があった。
訂正能力を越えた誤りが受信側で検出されたときは、誤
りを検出したフレームの受信パラメータを、過去の正し
く受信したパラメータに置き換えていた。つまり、その
ようなフレームでは、過去の正しく受信したパラメータ
を繰り返して使用して音声を復号化していた。このよう
な復号化の具体的な方法は、例えば、R.V.COX氏らによ
る“Robust CELP Coders for Noisy Backgrounds and N
oisy Channels"と題した論文(Proc.ICASSP89,pp.739−
742,1989年)(文献3)に述べられている。文献3等に
述べられた音声復号化法は簡便であるが、過去のパラメ
ータを繰り返し使用するため、特に過渡部などで音声信
号の特徴が変化しているフレームでは繰り返しにより、
かえって音質が劣化したり、異音が発生するという問題
点があった。
本発明の目的は、このような問題点を解決した音声復
号化方法を提供することにある。
号化方法を提供することにある。
第1の発明は、フィルタ係数に関する符号系列とピッ
チに関するパラメータに関する符号系列と、音声の音源
信号を表すコードブックのインデクスとゲインに関する
パラメータの符号系列を受信して復号し音声信号を再生
する音声復号化方法において、 受信した符号に訂正不可能な伝送路誤りを検出したと
きは、さらに前記誤りを検出したフレームから予め定め
られたフレーム数だけあるいは予め決められた条件を満
足するまでフィルタ係数に重み付けを施すか、あるいは
再生した信号の大きさが予め決められたしきい値を越え
ているときに音源信号あるいは前記再生信号のゲインを
前記誤りを検出したフレームから予め定められたフレー
ム数あるいは予め定められた条件を満足するまで調整す
ることを特徴とする。
チに関するパラメータに関する符号系列と、音声の音源
信号を表すコードブックのインデクスとゲインに関する
パラメータの符号系列を受信して復号し音声信号を再生
する音声復号化方法において、 受信した符号に訂正不可能な伝送路誤りを検出したと
きは、さらに前記誤りを検出したフレームから予め定め
られたフレーム数だけあるいは予め決められた条件を満
足するまでフィルタ係数に重み付けを施すか、あるいは
再生した信号の大きさが予め決められたしきい値を越え
ているときに音源信号あるいは前記再生信号のゲインを
前記誤りを検出したフレームから予め定められたフレー
ム数あるいは予め定められた条件を満足するまで調整す
ることを特徴とする。
さらに第2の発明は、受信した符号系列に訂正不可能
な伝送路誤りを検出したときは、さらに前記誤りを検出
したフレームから予め定められたフレーム数だけあるい
は予め定められた条件を満足するまでフィルタ係数に重
み付けを施すか、あるいは再生した信号の大きさが予め
定められたしきい値を越えているときに音源信号あるい
は前記再生信号のゲインを前記誤りを検出したフレーム
から予め定められたフレーム数あるいは予め定められた
条件を満足するまで調整することを特徴とする。
な伝送路誤りを検出したときは、さらに前記誤りを検出
したフレームから予め定められたフレーム数だけあるい
は予め定められた条件を満足するまでフィルタ係数に重
み付けを施すか、あるいは再生した信号の大きさが予め
定められたしきい値を越えているときに音源信号あるい
は前記再生信号のゲインを前記誤りを検出したフレーム
から予め定められたフレーム数あるいは予め定められた
条件を満足するまで調整することを特徴とする。
本発明による音声復号化方法の作用を説明する。
第1の発明では、FECの訂正能力以上の誤りを検出し
たフレームにおいて、以下に示す方法により受信したパ
ラメータの補間を行う。ここで文献1のCELP方式を例に
とると、受信したパラメータは、音声信号のスペクトル
を表すフィルタパラメータ、音声のパワを表す情報、ピ
ッチ周期を表す遅延情報、ピッチゲイン、音源信号を表
すコードブックのインデクス、コードブックのゲインで
ある。これらのパラメータのうち、特に、フィルタパラ
メータ、遅延情報、音声のパワを表すパラメータは音質
に影響するため、補間により滑らかに変化させるように
する。
たフレームにおいて、以下に示す方法により受信したパ
ラメータの補間を行う。ここで文献1のCELP方式を例に
とると、受信したパラメータは、音声信号のスペクトル
を表すフィルタパラメータ、音声のパワを表す情報、ピ
ッチ周期を表す遅延情報、ピッチゲイン、音源信号を表
すコードブックのインデクス、コードブックのゲインで
ある。これらのパラメータのうち、特に、フィルタパラ
メータ、遅延情報、音声のパワを表すパラメータは音質
に影響するため、補間により滑らかに変化させるように
する。
今、第Lフレームで誤りを検出したとする。Lフレー
ムの第i番目のフィルタパラメータをAiL、遅延情報をD
Lとすると、Lフレームのパラメータを以下のように補
間する。
ムの第i番目のフィルタパラメータをAiL、遅延情報をD
Lとすると、Lフレームのパラメータを以下のように補
間する。
AiL=δAi(L-1)+(1−δ)Ai(L+1) (1) DL=δDL-1+(1−δ)DL+1 (2) ここでδは1よりも小さい正の値をとる。また、音声
のパワPLは、(3)式に従い対数上で補間する。
のパワPLは、(3)式に従い対数上で補間する。
logPL=δlogPL-1+(1−δ)logPL+1 (3) 以上により、重要なパラメータを過去,未来のフレー
ムの情報から補間して復元し、音声信号を再生する。
ムの情報から補間して復元し、音声信号を再生する。
次に第2の発明では、第1の発明に加えて、誤りの影
響が誤りの発生したフレームよりも将来のフレームに伝
搬するのを防ぐために、フィルタパラメータの重み付け
と、ゲインの調整の少なくとも一つを、誤りを検出した
フレームから始めて予め定められたフレーム数だけ行う
かあるいは、予め定められた条件を満足するまで行う。
響が誤りの発生したフレームよりも将来のフレームに伝
搬するのを防ぐために、フィルタパラメータの重み付け
と、ゲインの調整の少なくとも一つを、誤りを検出した
フレームから始めて予め定められたフレーム数だけ行う
かあるいは、予め定められた条件を満足するまで行う。
ここでフィルタパラメータの重み付けは下式に従い行
う。
う。
α′iL=γi・αiL (4) ここで、0<γ<1であり、0に近いほど大きな重み
付けがかかる。また、αはLフレームの線形予測係数で
ある。
付けがかかる。また、αはLフレームの線形予測係数で
ある。
次にゲイン調整は以下のように行う。第Mフレームで
の音源信号をe(n)、再生した再生信号をs(n)、
そのパワをQとする。音源信号に対してゲイン調整を行
うときのゲインをGとする。
の音源信号をe(n)、再生した再生信号をs(n)、
そのパワをQとする。音源信号に対してゲイン調整を行
うときのゲインをGとする。
e′(n)=G・e(n) (5) ここでGは以下のように求める。
また、再生信号に対してゲイン調整を行うときは、 s(n)=δs(n−1)+(1−δ)・G (7) とすればよい。
第1図は本発明による音声復号化方法の一実施例に用
いられる音声復号化装置を示すブロック図である。
いられる音声復号化装置を示すブロック図である。
第1図において、デマルチプレクサ100が、伝送路か
ら符号系列を受信すると、この符号系列を分離し、誤り
訂正復号化回路105に出力する。
ら符号系列を受信すると、この符号系列を分離し、誤り
訂正復号化回路105に出力する。
誤り訂正復号化回路105は、受信符号系列に対して、
誤り訂正復号化を行い、誤りを検出したときは、補間回
路110に誤り検出情報を出力する。
誤り訂正復号化を行い、誤りを検出したときは、補間回
路110に誤り検出情報を出力する。
補間回路110は、誤り訂正復号化回路105から誤り検出
情報を入力したときは、ピッチ周期を表す遅延情報、音
声のパワを表す情報、フィルタパラメータに対して、前
記作用の項に述べたように、(1)〜(3)式を用い
て、過去の正しいフレームのパラメータと未来の正しい
フレームのパラメータとの間で補間を行い、補間したパ
ラメータを出力する。
情報を入力したときは、ピッチ周期を表す遅延情報、音
声のパワを表す情報、フィルタパラメータに対して、前
記作用の項に述べたように、(1)〜(3)式を用い
て、過去の正しいフレームのパラメータと未来の正しい
フレームのパラメータとの間で補間を行い、補間したパ
ラメータを出力する。
適応コードブック120は、遅延情報、ピッチゲインと
遅延回路165の出力信号を入力し、予測信号を計算す
る。詳細な計算法は、例えば、Kleijn氏による“Improv
ed speech quality and efficient vector quantizatio
n in SELP"(Proc.ICASSP,pp.155−158,1988年)と題し
た論文(文献4)等を参照できる。
遅延回路165の出力信号を入力し、予測信号を計算す
る。詳細な計算法は、例えば、Kleijn氏による“Improv
ed speech quality and efficient vector quantizatio
n in SELP"(Proc.ICASSP,pp.155−158,1988年)と題し
た論文(文献4)等を参照できる。
音源コードブック130は、コードベクトルインデクス
を入力し、コードブック135から対応するコードベクト
ルを読みだし、コードベクトルゲインを乗じて音源信号
を出力する。音源コードブックの動作の詳細は前記文献
1等を参照できる。
を入力し、コードブック135から対応するコードベクト
ルを読みだし、コードベクトルゲインを乗じて音源信号
を出力する。音源コードブックの動作の詳細は前記文献
1等を参照できる。
加算器160は、適応コードブック120からの予測信号と
音源コードブック130からの音源信号とを加算して合成
フィルタ170に出力する。
音源コードブック130からの音源信号とを加算して合成
フィルタ170に出力する。
合成フィルタ170は、補間回路110からフィルタパラメ
ータを入力し、加算器160から音源信号を入力して音声
を再生し、端子180から出力する。合成フィルタ170の動
作の詳細は、前記文献1,4等を参照できる。
ータを入力し、加算器160から音源信号を入力して音声
を再生し、端子180から出力する。合成フィルタ170の動
作の詳細は、前記文献1,4等を参照できる。
第2図は、第2の発明の一実施例に用いられる音声復
号化装置を示すブロック図である。第2図において、第
1図と同一の番号を付した構成要素は、第1図と同一の
動作を行うので説明は省略する。
号化装置を示すブロック図である。第2図において、第
1図と同一の番号を付した構成要素は、第1図と同一の
動作を行うので説明は省略する。
ゲイン調整回路168は、誤り訂正復号化回路105から誤
り検出情報を入力し、この情報が誤りを検出したことを
示すときは、誤りを検出したフレームから始めて予め定
められたフレーム数だけ合成フィルタ170の入力信号の
ゲイン調整を行う。ゲイン調整は、作用の項に示した
(5),(6)式に従って行う。
り検出情報を入力し、この情報が誤りを検出したことを
示すときは、誤りを検出したフレームから始めて予め定
められたフレーム数だけ合成フィルタ170の入力信号の
ゲイン調整を行う。ゲイン調整は、作用の項に示した
(5),(6)式に従って行う。
パワ計算回路185は、誤りを検出してから予め定めら
れたフレーム数だけ、合成フィルタ170の出力である再
生信号s(n)の1フレーム分のパワQを計算して、ゲ
イン調整回路165へ出力する。
れたフレーム数だけ、合成フィルタ170の出力である再
生信号s(n)の1フレーム分のパワQを計算して、ゲ
イン調整回路165へ出力する。
ここでNは1フレームのサンプル数を示す。
重み付け回路175は、誤りを検出してから予め定めら
れたフレーム数だけ、合成フィルタ170の係数に対して
前記(4)式に従い重み付けを行い、重み付けた係数を
合成フィルタ170へ出力する。
れたフレーム数だけ、合成フィルタ170の係数に対して
前記(4)式に従い重み付けを行い、重み付けた係数を
合成フィルタ170へ出力する。
本発明は、上記実施例に示したCELP方式以外にも他の
周知な方式に適用することができる。
周知な方式に適用することができる。
また、伝送情報として、音声のパワ情報の代わりに、
音声信号線形予測残差信号のパワあるいはRMSが伝送さ
れたときは、補間回路110における音声のパワ情報の補
間は以下のように行うことができる。今、第(L−
1),(L+1)フレームで受信した残差信号のパワを
それぞれPdL-1,PdL+1とすると、第(L−1)フレーム
音声のパワPL-1は下式により推定する。
音声信号線形予測残差信号のパワあるいはRMSが伝送さ
れたときは、補間回路110における音声のパワ情報の補
間は以下のように行うことができる。今、第(L−
1),(L+1)フレームで受信した残差信号のパワを
それぞれPdL-1,PdL+1とすると、第(L−1)フレーム
音声のパワPL-1は下式により推定する。
ここでKiはi次目のPARCOR係数であり、線形予測係数
αiから周知の方法により求めることができる。(9)
式を用いて第(L+1)フレームでも同様にして求め
る。PL-1,PL+1の値を前記(3)式に代入して、第Lフ
レームのパワの補間値を計算することができる。
αiから周知の方法により求めることができる。(9)
式を用いて第(L+1)フレームでも同様にして求め
る。PL-1,PL+1の値を前記(3)式に代入して、第Lフ
レームのパワの補間値を計算することができる。
また、補間回路110では、誤りを検出したフレームで
は、上記実施例に記した以外のパラメータ、例えば、ピ
ッチゲイン、音源コードブックのゲイン等についても補
間することができる。
は、上記実施例に記した以外のパラメータ、例えば、ピ
ッチゲイン、音源コードブックのゲイン等についても補
間することができる。
また、第2図の実施例において、ゲイン調整回路168
におけるゲイン調整は、音源信号に対してではなく、合
成フィルタ170の出力である再生信号s(n)に対して
行うこともできる。このときはs(n)のゲイン調整に
前記(7)式を用いる。
におけるゲイン調整は、音源信号に対してではなく、合
成フィルタ170の出力である再生信号s(n)に対して
行うこともできる。このときはs(n)のゲイン調整に
前記(7)式を用いる。
また、第2図の実施例において、重み付け回路175に
おけるフィルタ係数の重み付け、あるいはゲイン調整回
路168におけるゲイン調整は、誤りを検出してから、予
め定められた条件を満足するまで行うことができる。こ
の条件としては、例えば、適応コードブック120のゲイ
ンの値が予め定められたしきい値を下回るとき、あるい
は、音声パワやRMSの値が予め定められた値を下回った
ときなどを適用することができる。
おけるフィルタ係数の重み付け、あるいはゲイン調整回
路168におけるゲイン調整は、誤りを検出してから、予
め定められた条件を満足するまで行うことができる。こ
の条件としては、例えば、適応コードブック120のゲイ
ンの値が予め定められたしきい値を下回るとき、あるい
は、音声パワやRMSの値が予め定められた値を下回った
ときなどを適用することができる。
さらにフィルタ係数の重み付けにおいては、誤りを検
出してから、予測ゲインの大きなフレームに対しての
み、重み付けを行うようにすることもできる。ここで予
測ゲインGpは、 で求められる。
出してから、予測ゲインの大きなフレームに対しての
み、重み付けを行うようにすることもできる。ここで予
測ゲインGpは、 で求められる。
以上述べたように、本発明によれば、受信側で誤りを
検出したフレームでは、重要な伝送パラメータについ
て、過去の正しいフレームのパラメータと、未来の正し
いフレームのパラメータを用いて補間によりパラメータ
を復元し音声を再生しているので、過去の正しいフレー
ムのパラメータを単純に繰り返す従来法と比べ、誤りに
よる音質劣化の少ない良好な再生音声を提供することが
できるという大きな効果がある。
検出したフレームでは、重要な伝送パラメータについ
て、過去の正しいフレームのパラメータと、未来の正し
いフレームのパラメータを用いて補間によりパラメータ
を復元し音声を再生しているので、過去の正しいフレー
ムのパラメータを単純に繰り返す従来法と比べ、誤りに
よる音質劣化の少ない良好な再生音声を提供することが
できるという大きな効果がある。
第1図は第1の発明による音声復号化方法の一実施例を
実現する音声復号化装置のブロック図、 第2図は第2の発明による音声復号化方法の一実施例を
実現する音声復号化装置のブロック図である。 100……デマルチプレクサ 105……誤り訂正復号化回路 110……補間回路 120……適応コードブック回路 130……音源コードブック回路 135……コードブック 160……加算器 165……遅延回路 168……ゲイン調整回路 170……合成フィルタ 180……出力端子 185……パワ計算回路
実現する音声復号化装置のブロック図、 第2図は第2の発明による音声復号化方法の一実施例を
実現する音声復号化装置のブロック図である。 100……デマルチプレクサ 105……誤り訂正復号化回路 110……補間回路 120……適応コードブック回路 130……音源コードブック回路 135……コードブック 160……加算器 165……遅延回路 168……ゲイン調整回路 170……合成フィルタ 180……出力端子 185……パワ計算回路
フロントページの続き (56)参考文献 特開 平1−165235(JP,A) Proceedings of IE EE 1989 Internationa l Conference on Ac oustics,Speech and Signal Processin g,Vol.2,”S14.2 Robu st CELP Coders for Noisy Backgrounds and Noisy Channel s”p.739−742 (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 13/08 G10L 19/00 - 21/06 INSPEC(DIALOG) JICSTファイル(JOIS) WPI(DIALOG)
Claims (2)
- 【請求項1】フィルタ係数に関する符号系列とピッチに
関するパラメータに関する符号系列と、音声の音源信号
を表すコードブックのインデクスとゲインに関するパラ
メータの符号系列を受信して復号し音声信号を再生する
音声復号化方法において、 受信した符号系列に訂正不可能な伝送路誤りを検出した
ときは、さらに前記誤りを検出したフレームから予め定
められたフレーム数だけあるいは予め決められた条件を
満足するまでフィルタ係数に重み付けを施すか、あるい
は再生した信号の大きさが予め決められたしきい値を越
えているときに音源信号あるいは前記再生信号のゲイン
を前記誤りを検出したフレームから予め定められたフレ
ーム数あるいは予め定められた条件を満足するまで調整
することを特徴とする音声復号化方法。 - 【請求項2】フィルタ係数に関する符号系列とピッチに
関するパラメータに関する符号系列と、音声の音源信号
を表すインデクスとゲインに関するパラメータの符号系
列を受信して復号し音声信号を再生する音声復号化方法
において、 受信した符号系列に訂正不可能な伝送路誤りを検出した
ときは、前記誤りを検出したフレームからあらかじめ定
められたフレーム数だけあるいはあらかじめ定められた
条件を満足するまでフィルタ係数に重み付けを施すか、
あるいは再生した信号の大きさが予め定められたしきい
値を越えているときに音源信号あるいは前記再生信号の
ゲインを前記誤りを検出したフレームからあらかじめ定
められたフレーム数あるいはあらかじめ定められた条件
を満足するまで調整することを特徴とする音声復号化方
法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02135273A JP3102015B2 (ja) | 1990-05-28 | 1990-05-28 | 音声復号化方法 |
DE69113866T DE69113866T2 (de) | 1990-05-28 | 1991-05-27 | Sprachdecoder. |
EP91108594A EP0459358B1 (en) | 1990-05-28 | 1991-05-27 | Speech decoder |
US07/707,361 US5305332A (en) | 1990-05-28 | 1991-05-28 | Speech decoder for high quality reproduced speech through interpolation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02135273A JP3102015B2 (ja) | 1990-05-28 | 1990-05-28 | 音声復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0430200A JPH0430200A (ja) | 1992-02-03 |
JP3102015B2 true JP3102015B2 (ja) | 2000-10-23 |
Family
ID=15147851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02135273A Expired - Fee Related JP3102015B2 (ja) | 1990-05-28 | 1990-05-28 | 音声復号化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5305332A (ja) |
EP (1) | EP0459358B1 (ja) |
JP (1) | JP3102015B2 (ja) |
DE (1) | DE69113866T2 (ja) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04358486A (ja) * | 1991-06-04 | 1992-12-11 | Toshiba Corp | 高能率符号化信号処理装置 |
DE69233794D1 (de) * | 1991-06-11 | 2010-09-23 | Qualcomm Inc | Vocoder mit veränderlicher Bitrate |
CA2078927C (en) * | 1991-09-25 | 1997-01-28 | Katsushi Seza | Code-book driven vocoder device with voice source generator |
TW224191B (ja) * | 1992-01-28 | 1994-05-21 | Qualcomm Inc | |
FI90477C (fi) * | 1992-03-23 | 1994-02-10 | Nokia Mobile Phones Ltd | Puhesignaalin laadun parannusmenetelmä lineaarista ennustusta käyttävään koodausjärjestelmään |
FR2692091B1 (fr) * | 1992-06-03 | 1995-04-14 | France Telecom | Procédé et dispositif de dissimulation d'erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle. |
EP0577488B9 (en) * | 1992-06-29 | 2007-10-03 | Nippon Telegraph And Telephone Corporation | Speech coding method and apparatus for the same |
JPH0661950A (ja) * | 1992-08-13 | 1994-03-04 | Nec Corp | 音声符号復号装置 |
CA2105269C (en) * | 1992-10-09 | 1998-08-25 | Yair Shoham | Time-frequency interpolation with application to low rate speech coding |
DE4234015A1 (de) * | 1992-10-09 | 1994-04-14 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zur Wiedergabe eines Audiosignals |
JP2746033B2 (ja) * | 1992-12-24 | 1998-04-28 | 日本電気株式会社 | 音声復号化装置 |
US5535299A (en) * | 1993-11-02 | 1996-07-09 | Pacific Communication Sciences, Inc. | Adaptive error control for ADPCM speech coders |
US5502713A (en) * | 1993-12-07 | 1996-03-26 | Telefonaktiebolaget Lm Ericsson | Soft error concealment in a TDMA radio system |
DE69526926T2 (de) * | 1994-02-01 | 2003-01-02 | Qualcomm Inc | Lineare vorhersage durch impulsanregung |
US5574825A (en) * | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
CA2142391C (en) * | 1994-03-14 | 2001-05-29 | Juin-Hwey Chen | Computational complexity reduction during frame erasure or packet loss |
US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US5797118A (en) * | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
KR970011728B1 (ko) * | 1994-12-21 | 1997-07-14 | 김광호 | 음향신호의 에러은닉방법 및 그 장치 |
US5991725A (en) * | 1995-03-07 | 1999-11-23 | Advanced Micro Devices, Inc. | System and method for enhanced speech quality in voice storage and retrieval systems |
US5699478A (en) * | 1995-03-10 | 1997-12-16 | Lucent Technologies Inc. | Frame erasure compensation technique |
US5699481A (en) * | 1995-05-18 | 1997-12-16 | Rockwell International Corporation | Timing recovery scheme for packet speech in multiplexing environment of voice with data applications |
CN1100396C (zh) * | 1995-05-22 | 2003-01-29 | Ntt移动通信网株式会社 | 语音解码器 |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
CA2177413A1 (en) * | 1995-06-07 | 1996-12-08 | Yair Shoham | Codebook gain attenuation during frame erasures |
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
US5781882A (en) * | 1995-09-14 | 1998-07-14 | Motorola, Inc. | Very low bit rate voice messaging system using asymmetric voice compression processing |
US5960386A (en) * | 1996-05-17 | 1999-09-28 | Janiszewski; Thomas John | Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook |
FI963870A (fi) * | 1996-09-27 | 1998-03-28 | Nokia Oy Ab | Virheiden piilottaminen digitaalisessa audiovastaanottimessa |
JPH10247098A (ja) * | 1997-03-04 | 1998-09-14 | Mitsubishi Electric Corp | 可変レート音声符号化方法、可変レート音声復号化方法 |
US6272108B1 (en) * | 1997-03-05 | 2001-08-07 | Paradyne Corporation | Apparatus and method to allow a frame check sequence to determine the updating of adaptive receiver parameters of a high speed communication device |
JP3206497B2 (ja) * | 1997-06-16 | 2001-09-10 | 日本電気株式会社 | インデックスによる信号生成型適応符号帳 |
FR2774827B1 (fr) | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
CN1126076C (zh) * | 1998-05-27 | 2003-10-29 | Ntt移动通信网株式会社 | 语音译码器和语音译码方法 |
US6810377B1 (en) * | 1998-06-19 | 2004-10-26 | Comsat Corporation | Lost frame recovery techniques for parametric, LPC-based speech coding systems |
GB2343777B (en) * | 1998-11-13 | 2003-07-02 | Motorola Ltd | Mitigating errors in a distributed speech recognition process |
US6260017B1 (en) * | 1999-05-07 | 2001-07-10 | Qualcomm Inc. | Multipulse interpolative coding of transition speech frames |
JP3705994B2 (ja) | 1999-05-13 | 2005-10-12 | 株式会社日本自動車部品総合研究所 | 水素センサ、電池の過充電・過放電検出装置および燃料電池の水素漏れ検出装置 |
JP4464488B2 (ja) * | 1999-06-30 | 2010-05-19 | パナソニック株式会社 | 音声復号化装置及び符号誤り補償方法、音声復号化方法 |
US6549886B1 (en) * | 1999-11-03 | 2003-04-15 | Nokia Ip Inc. | System for lost packet recovery in voice over internet protocol based on time domain interpolation |
SE517156C2 (sv) | 1999-12-28 | 2002-04-23 | Global Ip Sound Ab | System för överföring av ljud över paketförmedlade nät |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP4857468B2 (ja) | 2001-01-25 | 2012-01-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
JP4857467B2 (ja) | 2001-01-25 | 2012-01-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
WO2002071389A1 (fr) * | 2001-03-06 | 2002-09-12 | Ntt Docomo, Inc. | Procede et dispositif d'interpolation de donnees sonores, procede et dispositif de creation d'informations relatives aux donnees sonores, procede et dispositif de transmission des informations d'interpolation des donnees sonores, et programme et support d'enregistrement correspondants |
DE10124421C1 (de) * | 2001-05-18 | 2002-10-17 | Siemens Ag | Verfahren zur Schätzung eines Codecparameters |
DE10124402A1 (de) * | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Schätzung eines Spektralkoeffizienten |
JP4532796B2 (ja) * | 2001-08-31 | 2010-08-25 | キヤノン株式会社 | シート収納装置及びこれを備えた給紙装置及び画像形成装置 |
FR2830970B1 (fr) * | 2001-10-12 | 2004-01-30 | France Telecom | Procede et dispositif de synthese de trames de substitution, dans une succession de trames representant un signal de parole |
KR100413039B1 (ko) * | 2002-01-16 | 2003-12-31 | 어뮤즈텍(주) | 피치보정방법 및 그 장치 |
CN101346759B (zh) * | 2005-12-21 | 2011-09-07 | 日本电气株式会社 | 代码转换装置、用于代码转换装置的代码转换方法及程序 |
US20080056206A1 (en) * | 2006-08-31 | 2008-03-06 | Motorola, Inc. | Power savings method and apparatus in a communication system |
EP2301015B1 (en) * | 2008-06-13 | 2019-09-04 | Nokia Technologies Oy | Method and apparatus for error concealment of encoded audio data |
US9020812B2 (en) * | 2009-11-24 | 2015-04-28 | Lg Electronics Inc. | Audio signal processing method and device |
US10026407B1 (en) * | 2010-12-17 | 2018-07-17 | Arrowhead Center, Inc. | Low bit-rate speech coding through quantization of mel-frequency cepstral coefficients |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE433998B (sv) * | 1977-10-11 | 1984-06-25 | Carl Erik Wilhelm Sundberg | Anordning vid signalmottagare for att kompensera digitala fel i overford digital signal |
US4375581A (en) * | 1980-06-30 | 1983-03-01 | Bell Telephone Laboratories, Incorporated | Digital transmission error reduction |
DE3028066A1 (de) * | 1980-07-24 | 1982-02-18 | Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt | Schaltungsanordnung zur korrektur gestoerter abtastwerte bei einer pcm-uebertragungseinrichtung, insbesondere einer digital-tonplatte |
JPS59157811A (ja) * | 1983-02-25 | 1984-09-07 | Nec Corp | デ−タ補間回路 |
IT1179803B (it) * | 1984-10-30 | 1987-09-16 | Cselt Centro Studi Lab Telecom | Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio |
US4831624A (en) * | 1987-06-04 | 1989-05-16 | Motorola, Inc. | Error detection method for sub-band coding |
JPH01177227A (ja) * | 1988-01-05 | 1989-07-13 | Toshiba Corp | 音声コーデック |
US5031218A (en) * | 1988-03-30 | 1991-07-09 | International Business Machines Corporation | Redundant message processing and storage |
EP0342687B1 (en) * | 1988-05-20 | 1995-04-12 | Nec Corporation | Coded speech communication system having code books for synthesizing small-amplitude components |
CA1333425C (en) * | 1988-09-21 | 1994-12-06 | Kazunori Ozawa | Communication system capable of improving a speech quality by classifying speech signals |
US5148487A (en) * | 1990-02-26 | 1992-09-15 | Matsushita Electric Industrial Co., Ltd. | Audio subband encoded signal decoder |
-
1990
- 1990-05-28 JP JP02135273A patent/JP3102015B2/ja not_active Expired - Fee Related
-
1991
- 1991-05-27 EP EP91108594A patent/EP0459358B1/en not_active Expired - Lifetime
- 1991-05-27 DE DE69113866T patent/DE69113866T2/de not_active Expired - Fee Related
- 1991-05-28 US US07/707,361 patent/US5305332A/en not_active Expired - Lifetime
Non-Patent Citations (1)
Title |
---|
Proceedings of IEEE 1989 International Conference on Acoustics,Speech and Signal Processing,Vol.2,"S14.2 Robust CELP Coders for Noisy Backgrounds and Noisy Channels"p.739−742 |
Also Published As
Publication number | Publication date |
---|---|
JPH0430200A (ja) | 1992-02-03 |
EP0459358B1 (en) | 1995-10-18 |
EP0459358A3 (en) | 1992-02-19 |
US5305332A (en) | 1994-04-19 |
EP0459358A2 (en) | 1991-12-04 |
DE69113866T2 (de) | 1996-04-18 |
DE69113866D1 (de) | 1995-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3102015B2 (ja) | 音声復号化方法 | |
JP3241978B2 (ja) | 符号化システムの性能を改善する方法 | |
US7636055B2 (en) | Signal decoding apparatus and signal decoding method | |
JP3522012B2 (ja) | コード励振線形予測符号化装置 | |
JP2746033B2 (ja) | 音声復号化装置 | |
US7852792B2 (en) | Packet based echo cancellation and suppression | |
US20070100614A1 (en) | Speech decoder and code error compensation method | |
JPH0736118B2 (ja) | セルプを使用した音声圧縮装置 | |
CA2408890C (en) | System and methods for concealing errors in data transmission | |
US6205423B1 (en) | Method for coding speech containing noise-like speech periods and/or having background noise | |
JP2002268696A (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JPH08130513A (ja) | 音声符号化及び復号化システム | |
EP0747884A2 (en) | Codebook gain attenuation during frame erasures | |
JP3219467B2 (ja) | 音声復号化方法 | |
JP4597360B2 (ja) | 音声復号装置及び音声復号方法 | |
JP3047761B2 (ja) | 音声符号化装置 | |
JP3212123B2 (ja) | 音声符号化装置 | |
JP3085347B2 (ja) | 音声の復号化方法およびその装置 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 | |
JP3342998B2 (ja) | 音声復号方法及び装置 | |
JP3519764B2 (ja) | 音声符号化通信方式及びその装置 | |
JP2817196B2 (ja) | 音声符号化方式 | |
JP2962623B2 (ja) | 音声符号の誤り検出方法 | |
JP2005534984A (ja) | 音声フレームのエラー軽減用の音声通信ユニットおよび方法 | |
JPH034300A (ja) | 音声符号化復号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070825 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080825 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080825 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090825 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |