JP3713288B2 - Speech decoder - Google Patents

Speech decoder Download PDF

Info

Publication number
JP3713288B2
JP3713288B2 JP06522794A JP6522794A JP3713288B2 JP 3713288 B2 JP3713288 B2 JP 3713288B2 JP 06522794 A JP06522794 A JP 06522794A JP 6522794 A JP6522794 A JP 6522794A JP 3713288 B2 JP3713288 B2 JP 3713288B2
Authority
JP
Japan
Prior art keywords
speech
error
speech coding
parameter
coding parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06522794A
Other languages
Japanese (ja)
Other versions
JPH07271391A (en
Inventor
政巳 赤嶺
公生 三関
進 神庭
皇 天田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP06522794A priority Critical patent/JP3713288B2/en
Publication of JPH07271391A publication Critical patent/JPH07271391A/en
Application granted granted Critical
Publication of JP3713288B2 publication Critical patent/JP3713288B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【産業上の利用分野】
本発明は、音声符号化パラメータを受けて元の音声を復号再生する音声復号装置に関する。
【0002】
【従来の技術】
自動車電話等の移動体通信システムに用いられる音声符号化/復号装置は、低ビットレート化のほかに、移動端末がビルの谷間等のような電界強度の低い場所を通ることによって符号誤りが生じた場合でも良好な音声を再生できることが要求される。特公昭58−49874号公報に記載された音声合成装置は、このような要求に応えるものとして提案された従来の音声復号装置の例である。
【0003】
図4は、この従来の音声復号装置のブロック図であり、1は入力端子、2は出力端子、3は再生中継復調回路、4は合成回路、5は瞬断時と瞬断回復時を検出する瞬断検出回路、6は分析パラメータの1組を遅延記憶する遅延記憶回路、7はスイッチである。
【0004】
この従来装置において、入力端子1から入力された受信信号は再生中継復調回路3によって再生中継復調され、ディジタル信号の分析パラメータに変換されて遅延記憶回路6とスイッチ7に出力される。瞬断時でない場合、瞬断検出回路5は瞬断でないことを検出し、これを遅延記憶回路6とスイッチ7に出力する。遅延記憶回路6は瞬断検出回路5からの信号に基づいて、再生中継復調回路3からの分析パラメータを入力して順次遅延記憶する。スイッチ7は、瞬断検出回路5からの信号に基づいて再生中継復調回路3と合成回路4とを接続する。合成回路4は、スイッチ7を介して再生中継復調回路3の出力信号に基づいて音声信号を復元し、出力端子2に出力する。
【0005】
入力端子1からの入力信号に瞬断が生じた場合は、瞬断検出回路5でそれを検出し、この情報を遅延記憶回路6とスイッチ7に出力する。遅延記憶回路6は、瞬断検出回路5からの瞬断情報により再生中継復調回路3からの入力信号を遅延記憶するのを止め、記憶内容を古い順に順次スイッチ7に繰り返し出力する。遅延記憶回路6は分析パラメータ1組の記憶容量を持っているので、ちょうど1組前の分析パラメータがスイッチ7に出力される。スイッチ7は、瞬断検出回路5からの瞬断情報に基づいて遅延記憶回路6と合成回路4を接続する。合成回路4は、この遅延記憶回路6からの入力信号に基づいて音声信号に復元し、出力端子2に出力する。瞬断が回復すると、瞬断検出回路5が瞬断回復時を検出し、瞬断回復情報を遅延記憶回路6とスイッチ7に出力する。このときは前述の瞬断でない場合の動作に戻る。
【0006】
このように従来の音声復号装置では、電波の瞬断によって音声符号化パラメータに誤りが生じた場合、正常時に入力した1組の音声符号化パラメータに基づいて音声を再生しているので、符号誤りが生じた場合でも音質の大きな劣化を防止することができる。しかしながら、瞬断検出回路5の検出能力には限界があり、どのような検出法を用いたとしても、誤検出を起こすことがあり得る。従って、瞬断検出回路5の検出能力以上の誤りが発生した場合、再生音声の音質が大きく劣化することがある。
【0007】
【発明が解決しようとする課題】
上述したように、従来の音声復号装置では瞬断検出回路の検出能力に限界があるため、瞬断を誤検出することがあり、瞬断によって符号誤りがあったフレームでも誤りなしと検出する可能性がある。このような場合、符号誤りがあるにも拘らず検出されなかったフレームの音声符号化パラメータを記憶してしまい、この音声符号化パラメータに基づいて音声を再生するため、復号音声の音質が劣化するという問題があった。
本発明は、音声符号化パラメータの誤りの誤検出による再生音声の音質劣化を防止できる音声復号装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明は、上記の課題を解決するため、単位区間毎に入力される音声符号化パラメータに基づいて復号を行って音声信号を再生する音声復号装置において、前記入力される音声符号化パラメータの誤りを検出する誤り検出手段と、前記入力される音声符号化パラメータの少なくとも1組を前記誤り検出手段により誤りが検出されない複数の単位区間にわたり記憶する記憶手段と、前記記憶手段から読み出された過去の複数の単位区間にわたる音声符号化パラメータに基づいて音声符号化パラメータを再生するパラメータ再生手段と、
前記誤り検出手段により誤りが検出されない単位区間については前記入力される音声符号化パラメータに基づいて音声信号を再生し、前記誤り検出手段により誤りが検出された単位区間については前記パラメータ再生手段により再生された音声符号化パラメータに基づいて音声信号を再生する再生手段とを備えたことを特徴とする。
【0009】
より具体的には、上記パラメータ再生手段として記憶手段から読み出された過去の複数の単位区間にわたる音声符号化パラメータの補間演算を行う補間手段を設け、誤り検出手段により誤りが検出された単位区間については補間手段により得られた音声符号化パラメータに基づいて音声信号を再生するようにしてもよい。
【0010】
さらに、本発明においては記憶手段から読み出された過去の複数の単位区間にわたる音声符号化パラメータのうち最も信頼性の高い音声符号化パラメータを選択する選択手段を設け、誤り検出手段により誤りが検出された単位区間については、再生手段において該選択手段により選択された音声符号化パラメータに基づいて音声信号を再生するようにしてもよい。
【0011】
【作用】
本発明に係る音声復号装置においては、誤り検出手段によって入力された音声符号化パラメータの符号誤りの有無が検出され、誤りが検出されない単位区間では、入力した音声符号化パラメータに基づいて再生手段で音声が再生されるとともに、記憶手段よって音声符号化パラメータの少なくとも1組が記憶される。このようにして、記憶手段では誤りが検出されない複数の単位区間の音声符号化パラメータが記憶され、さらにこの記憶手段から読み出された過去の複数の単位区間の符号化パラメータについて例えば補間演算が補間手段で行われる。そして、誤りが検出された単位区間では、この補間手段で得られた音声符号化パラメータに基づいて音声が再生される。
【0012】
ここで、入力した音声符号化パラメータに誤りが生じているにも拘らず、誤り検出手段の誤検出により誤りなしと検出された場合でも、そのような誤検出が2つ以上の単位区間にわたり連続して発生する確率は非常に少ない。従って、誤りなしと検出された複数の単位区間の音声符号化パラメータの補間演算を行うと、いずれかの単位区間の音声符号化パラメータが誤っていても、他の誤りの生じていない単位区間の音声符号化パラメータによって、その誤りの影響が緩和される結果、補間演算により得られた音声符号化パラメータの信頼性が向上するので、一つの単位区間のみの音声符号化パラメータに基づいて音声を再生する従来の方式に比較して、音質の劣化は著しく少なくなる。
【0013】
また、誤りなしと検出された複数の単位区間の音声符号化パラメータの信頼性を何らかの手段により判定し、その判定結果に基づいても最も信頼性の高い音声符号化パラメータを用いて音声の再生を行うようにしても、同様に再生音声の音質劣化は低減される。
【0014】
【実施例】
以下、図面を参照して本発明の実施例を説明する。
(実施例1)
図1は、本発明の一実施例に係る音声復号装置のブロック図である。この実施例の音声復号装置は、入力端子100に入力される音声符号化パラメータを復号する符号化パラメータ復号器101と、入力される音声符号化パラメータの誤りを検出する誤り検出回路102と、スイッチ103と、誤り検出回路102により“誤りなし”と検出されたフレーム(単位区間)の音声符号化パラメータを記憶する第1および第2の記憶回路104,105と、これらの記憶回路104,105から読み出された音声符号化パラメータの補間演算を行う補間回路106と、符号化パラメータ復号器101の出力と補間回路106の出力のいずれかを選択するスイッチ107と、このスイッチ107により選択された音声符号化パラメータから元の音声を合成して再生し、出力端子109に出力する音声合成器108により構成される。また、スイッチ103、補間回路106およびスイッチ107は、誤り検出回路102の出力によって制御される。
【0015】
次に、本実施例に係る音声復号装置の動作について説明する。
入力端子100には、図示しない送信側の音声符号化装置から送信された複数の音声符号化パラメータがフレーム単位で入力される。これらの音声符号化パラメータは、例えば音声符号化装置の符号化方式がCELP(Code Excited Linear Prediction)方式の場合を例にとると、LPC分析パラメータ、合成フィルタの駆動信号、音声信号のピッチおよびゲインといったパラメータである。また、これらの音声符号化パラメータは、誤り訂正符号化されて伝送される。
【0016】
入力端子100に入力されたこれらの音声符号化パラメータは、符号化パラメータ復号器101によって復号され、さらにスイッチ103,107に出力される。
【0017】
また、入力端子100に入力された音声符号化パラメータは誤り検出回路102にも入力され、ここで符号誤りがあるかどうかが検出される。スイッチ103,107は、誤り検出回路102の出力によって制御される。すなわち、誤り検出回路102の出力が“誤りなし”を示している場合、スイッチ107は符号化パラメータ復号器101によって復号された音声符号化パラメータを選択して音声合成器108へ送る。また、このときスイッチ103はオンとなって、符号化パラメータ復号器101により復号された音声符号化パラメータを第1の記憶回路104に送る。第1の記憶回路104は、それまで記憶保持していた内容を第2の記憶回路105に出力した後、スイッチ103を介して入力した新たな音声符号化パラメータを記憶すると同時に、それまで記憶保持していた内容を補間回路106へ出力する。一方、第2の記憶回路105はそれまで記憶保持していた内容をクリアした後、第1の記憶回路104から入力された内容を記憶する。
【0018】
このようにして、第1および第2の記憶回路104,105には、誤り検出回路102により符号誤りが検出されなかったフレームの音声符号化パラメータが新しい順に2フレーム分記憶保持される。
【0019】
次に、誤り検出回路102の出力が“誤りあり”を示している場合には、スイッチ103がオフとなって、誤りが検出された音声符号化パラメータの記憶回路104への入力が阻止されるとともに、補間回路106によって第1および第2の記憶回路104,105の内容に基づいて音声符号化パラメータの補間演算が行われる。具体的には、例えば音声符号化パラメータに一つであるLPC分析パラメータとしてLSPパラメータを用いた場合、補間回路106は次式に従ってLSPパラメータの補間を行う。
【0020】
ωi(n)=αωi(n−1)+(1−α)ωi(n−2) (1)
ここで、1≦i≦PでPは分析次数、ωi(n)は現在のフレームのLSPパラメータ、ωi(n−1),ωi(n−2)はそれぞれ記憶回路104,105に記憶保持されているLSPパラメータであり、“誤りなし”と検出されたフレームのLSPパラメータのうちで1番目と2番目に新しいパラメータである。
【0021】
また、αはωi(n−1)とωi(n−2)を加重平均するための0<α<1なる係数であり、より現実的には例えば0.8<α<1の範囲に設定される。このように、ωi(n−1)に対する加重係数αをωi(n−2)に対する加重係数(α−1)より大きくする理由は、ωi(n−1)の方が補間演算結果として実際に要求される音声符号化パラメータに時間的に近いためである。
【0022】
誤り検出回路102の出力が“誤りあり”を示した場合、補間回路106により上記のようにして補間演算された音声符号化パラメータがスイッチ107によって選択され、音声合成器108に入力される。音声合成器108は、入力された音声符号化パラメータに基づいて音声信号を再生し、出力端子102へ出力する。
【0023】
このように本実施例では、誤りが検出されたフレームの音声符号化パラメータの少なくとも1組(上記例ではLSPパラメータ)については、過去に誤りが検出されなかった2つのフレームのパラメータを加重平均して補間したパラメータで代用している。誤り検出回路102の検出能力には限界があるために、誤検出の可能性があることは前述した通りであるが、誤検出が重ねて発生する確率は非常に少ないため、本実施例のように2つのフレームの音声符号化パラメータを加重平均することにより補間したパラメータの信頼性は大きく向上し、これを音声信号の復号再生に用いることにより、符号誤りが生じたフレームでの再生音声の音質劣化を防ぐことができる。また、従来方式では音声符号化パラメータの補間をいわば1つのフレームのパラメータに基づいて行っていたのに対し、本実施例においては2つのフレームのパラメータに基づいて行っているため、補間精度が向上し、再生音声の品質がさらに向上する効果も期待できる。
【0024】
なお、上記実施例では2つのフレームの音声符号化パラメータを記憶保持し、その内容に基づいて、誤ったフレームのパラメータを2次の補間によって求める構成としたが、記憶回路の数を増やして、より高次の補間を行う構成としてもよい。この場合、誤りの誤検出による影響をより小さくすると共に、補間精度をより高くする効果がある。
【0025】
(実施例2)
図2は、本発明の他の実施例に係る復号装置の構成を示すブロック図である。図1に示した実施例と同一部分に同一符号を付して相違点を中心に説明すると、本実施例では音声符号化パラメータの補間を移動平均によって行っている点が図1の実施例と異なる。
【0026】
すなわち、図2においては誤り検出回路102の出力が“誤りなし”を示したときに符号化パラメータ復号器101により復号された音声符号化パラメータが第1の記憶回路104で記憶保持される。補間回路202は係数乗算器203,204と加算器205および第2の記憶回路206からなり、記憶回路206は誤り検出回路102の出力が“誤りなし”を示したフレーム単位で内容を記憶保持するように制御される。この実施例の場合、音声符号化パラメータの補間値は次式により計算される。
【0027】
Ωi=βΩi+(1−β)ωi(n−1) (2)
ここで、ΩiはLSPパラメータの補間値で、加算器205の出力、ωi(n−1)は誤り検出回路102の出力が“誤りなし”を示したフレームのLSPパラメータ、(1−β)は乗算器203の係数、βは乗算器204の係数(移動平均の係数)である。
【0028】
本実施例によれば、音声符号化パラメータの補間を過去の誤りなしの全フレームのパラメータを移動平均することにより行うため、補間パラメータの信頼性および補間精度が向上する。さらに、2個の係数乗算器203,204と加算器205および1個の記憶回路206で構成される補間回路202によって高次の補間を行うため、図1の実施例のような単純な加算平均により高次の補間を実現する場合に比較して回路規模を小さくできるという利点もある。
【0029】
なお、以上の各実施例では音声符号化パラメータの補間演算をフレーム単位で行ったが、サブフレーム単位で行ってもよい。その場合、補間に用いるパラメータの相関が強くなるため、補間精度が向上する効果がある。
【0030】
(実施例3)
図3は、本発明のさらに別の実施例に係る音声復号装置の構成を示すブロック図である。図1に示した実施例と同一部分に同一符号を付して相違点を中心に説明すると、本実施例では信頼性判定部301とスイッチ302を設け、音声符号化パラメータの補間を行う代わりに、第1および第2の記憶回路104,105に記憶保持された音声符号化パラメータを選択的に切り替えて音声信号の復号再生に用いる点が図1の実施例と異なっている。
【0031】
第1および第2の記憶回路104,105は、誤り検出回路102の出力が“誤りなし”を示したときに符号化パラメータ復号器101により復号された音声符号化パラメータをそれぞれ記憶している。信頼性判定部301は、これら記憶回路104,105に記憶保持されている音声符号化パラメータのうち、過去の音声符号化パラメータとの連続性が良くなる方を信頼性の高いものと判定し、その判定結果に基づいてスイッチ302を制御する。そして、誤り検出回路102が“誤りあり”と検出したときには、スイッチ302で選択された音声符号化パラメータがスイッチ107で選択され、これに基づいて音声合成器108で音声が復号再生される。
【0032】
なお、記憶回路104,105に記憶保持された音声符号化パラメータを選択する際には、上述した過去の音声符号化パラメータとの連続性を考慮する方法の他、音声符号化パラメータに含まれるフィルタ係数について、フィルタがより安定となるようなフィルタ係数を含む音声符号化パラメータをより信頼性が高いものとして判定してもよい。また、音声符号化パラメータに含まれる電力係数について、過去の音声符号化パラメータに含まれる電力係数からの変化がより滑らかに変化する電力係数を含む音声符号化パラメータをより信頼性が高いものとして判定してもよい。
【0033】
このように本実施例によれば、誤りが検出されたフレームの音声符号化パラメータについては、複数の記憶回路104,105に記憶保持されている誤りが検出されなかったときの音声符号化パラメータのうち信頼性の最も高いパラメータを選択して音声の再生に用いることにより、符号誤りが生じたフレームの再生音声の音質劣化を防止することができる。
【0034】
【発明の効果】
以上説明したように、本発明によれば音声符号化パラメータに誤りがあった場合には、過去の誤りなしと判定された複数の単位区間の音声符号化パラメータに基づいて音声を再生して出力するため、誤り検出の誤検出による音質劣化を防ぐとともに、符号誤り時の音声符号化パラメータの補間を精度よく行うことができるので、再生音質が向上するという効果が得られる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声復号装置の構成を示すブロック図
【図2】本発明の他の実施例に係る音声復号装置の構成を示すブロック図
【図3】本発明のさらに別の実施例に係る音声復号装置の構成を示すブロック図
【図4】従来の音声復号装置の構成を示すブロック図
【符号の説明】
100…入力端子
101…符号化パラメータ復号器
102…誤り検出回路
103…スイッチ
104…第1の記憶回路
105…第2の記憶回路
106…補間回路
107…スイッチ
108…音声合成器
109…出力端子
202…補間回路
203…係数乗算器
204…係数乗算器
205…加算器
206…記憶回路
301…信頼性判定部
302…スイッチ
[0001]
[Industrial application fields]
The present invention relates to a speech decoding apparatus that receives speech encoding parameters and decodes and reproduces original speech.
[0002]
[Prior art]
Speech coding / decoding devices used in mobile communication systems such as automobile telephones, in addition to lowering bit rates, cause code errors when mobile terminals pass through places with low electric field strength, such as valleys in buildings. It is required to be able to reproduce good audio even when The speech synthesizer described in Japanese Patent Publication No. 58-49874 is an example of a conventional speech decoding apparatus proposed as a response to such a demand.
[0003]
FIG. 4 is a block diagram of this conventional speech decoding apparatus, where 1 is an input terminal, 2 is an output terminal, 3 is a regenerative repeater demodulation circuit, 4 is a synthesis circuit, 5 is detected at the time of instantaneous interruption and recovery from instantaneous interruption. An instantaneous interruption detecting circuit 6 for delaying, a delay memory circuit 6 for delay storing one set of analysis parameters, and a switch 7.
[0004]
In this conventional apparatus, the received signal input from the input terminal 1 is regeneratively relay demodulated by the regenerative relay demodulation circuit 3, converted into a digital signal analysis parameter, and output to the delay storage circuit 6 and the switch 7. When it is not at the time of instantaneous interruption, the instantaneous interruption detection circuit 5 detects that it is not an instantaneous interruption, and outputs this to the delay memory circuit 6 and the switch 7. Based on the signal from the instantaneous interruption detection circuit 5, the delay storage circuit 6 inputs the analysis parameter from the regenerative repeater demodulation circuit 3 and sequentially stores the delay. The switch 7 connects the regenerative repeater demodulation circuit 3 and the synthesis circuit 4 based on the signal from the instantaneous interruption detection circuit 5. The synthesis circuit 4 restores the audio signal based on the output signal of the regenerative repeater demodulation circuit 3 via the switch 7 and outputs it to the output terminal 2.
[0005]
When a momentary interruption occurs in the input signal from the input terminal 1, the momentary interruption detection circuit 5 detects it and outputs this information to the delay storage circuit 6 and the switch 7. The delay storage circuit 6 stops delaying and storing the input signal from the regenerative repeater demodulation circuit 3 based on the instantaneous interruption information from the instantaneous interruption detection circuit 5, and repeatedly outputs the stored contents to the switch 7 in order from the oldest. Since the delay storage circuit 6 has a storage capacity of one set of analysis parameters, the analysis parameter of the previous set is output to the switch 7. The switch 7 connects the delay storage circuit 6 and the synthesis circuit 4 based on the instantaneous interruption information from the instantaneous interruption detection circuit 5. The synthesis circuit 4 restores an audio signal based on the input signal from the delay storage circuit 6 and outputs it to the output terminal 2. When the instantaneous interruption is recovered, the instantaneous interruption detection circuit 5 detects the instantaneous interruption recovery time and outputs instantaneous interruption recovery information to the delay storage circuit 6 and the switch 7. At this time, the operation returns to the case where the above-mentioned momentary interruption has not occurred.
[0006]
As described above, in the conventional speech decoding apparatus, when an error occurs in the speech coding parameter due to the instantaneous interruption of the radio wave, the speech is reproduced based on a set of speech coding parameters input at normal time. Even when this occurs, it is possible to prevent major deterioration in sound quality. However, the detection capability of the instantaneous interruption detection circuit 5 has a limit, and any detection method may be used to cause erroneous detection. Therefore, when an error exceeding the detection capability of the instantaneous interruption detection circuit 5 occurs, the sound quality of the reproduced sound may be greatly deteriorated.
[0007]
[Problems to be solved by the invention]
As described above, since the detection capability of the instantaneous interruption detection circuit is limited in the conventional speech decoding apparatus, the instantaneous interruption may be erroneously detected, and it is possible to detect that there is no error even in a frame in which there is a code error due to the instantaneous interruption. There is sex. In such a case, the speech coding parameters of the frames that have not been detected despite the presence of code errors are stored, and the speech is reproduced based on the speech coding parameters, so that the quality of the decoded speech deteriorates. There was a problem.
An object of the present invention is to provide a speech decoding apparatus capable of preventing deterioration in sound quality of reproduced speech due to erroneous detection of speech coding parameter errors.
[0008]
[Means for Solving the Problems]
In order to solve the above-described problem, the present invention provides an audio decoding apparatus that reproduces an audio signal by performing decoding based on an audio encoding parameter input for each unit interval , and an error in the input audio encoding parameter. an error detection means for detecting, storing means for storing across multiple unit sections in which no error is detected by the error detection means at least one set of speech coding parameters to be the input, past read from the storage means Parameter reproduction means for reproducing a speech coding parameter based on speech coding parameters over a plurality of unit intervals of
For a unit section in which no error is detected by the error detection means, a speech signal is reproduced based on the input speech coding parameter, and for a unit section in which an error is detected by the error detection means, reproduction is performed by the parameter reproduction means. And a reproducing means for reproducing the audio signal based on the audio encoding parameter.
[0009]
More specifically, an interpolating unit for interpolating speech coding parameters over a plurality of past unit intervals read from the storage unit as the parameter reproducing unit is provided, and the unit interval in which the error is detected by the error detecting unit For the above, the audio signal may be reproduced based on the audio encoding parameter obtained by the interpolation means.
[0010]
Furthermore, in the present invention, there is provided selection means for selecting the most reliable speech coding parameter among speech coding parameters over a plurality of past unit intervals read from the storage means, and an error is detected by the error detection means. With respect to the unit section, the reproduction unit may reproduce the audio signal based on the audio encoding parameter selected by the selection unit.
[0011]
[Action]
In the speech decoding apparatus according to the present invention, the presence / absence of a code error in the speech coding parameter input by the error detection unit is detected, and in the unit interval in which no error is detected, the playback unit performs the playback based on the input speech coding parameter. together with the audio are reproduced, at least one set of the storage unit thus speech coding parameters are stored. In this way, the speech coding parameters of a plurality of unit sections in which no error is detected are stored in the storage means, and further, for example, interpolation calculation is performed on the past plurality of unit section encoding parameters read from the storage means. Done by means. Then, in the unit section where the error is detected, the voice is reproduced based on the voice coding parameter obtained by this interpolation means.
[0012]
Here, even if an error has occurred in the input speech coding parameter, even if it is detected that there is no error due to an error detection by the error detection means, such error detection continues over two or more unit intervals. The probability of occurrence is very low. Therefore, when performing the interpolation calculation of the speech coding parameters of a plurality of unit sections detected as error-free, even if the speech coding parameter of any unit section is incorrect, other unit sections in which no error has occurred As a result of alleviating the influence of the error by the speech coding parameter, the reliability of the speech coding parameter obtained by the interpolation calculation is improved, so that the speech is reproduced based on the speech coding parameter of only one unit section. Compared with the conventional method, the deterioration of sound quality is remarkably reduced.
[0013]
Further, the reliability of the speech coding parameters of a plurality of unit sections detected as having no error is determined by some means, and the speech is reproduced using the speech coding parameter with the highest reliability based on the determination result. Even if it carries out, the sound quality degradation of reproduction | regeneration audio | voice is reduced similarly.
[0014]
【Example】
Embodiments of the present invention will be described below with reference to the drawings.
(Example 1)
FIG. 1 is a block diagram of a speech decoding apparatus according to an embodiment of the present invention. The speech decoding apparatus according to this embodiment includes a coding parameter decoder 101 that decodes a speech coding parameter input to an input terminal 100, an error detection circuit 102 that detects an error of a speech coding parameter that is input, and a switch 103, first and second storage circuits 104 and 105 for storing speech coding parameters of a frame (unit section) detected as “no error” by the error detection circuit 102, and the storage circuits 104 and 105 An interpolation circuit 106 that performs an interpolation operation on the read speech coding parameters, a switch 107 that selects either the output of the coding parameter decoder 101 or the output of the interpolation circuit 106, and the speech selected by the switch 107 A speech synthesizer 108 that synthesizes and reproduces the original speech from the encoding parameters and outputs it to the output terminal 109. Constructed. The switch 103, the interpolation circuit 106, and the switch 107 are controlled by the output of the error detection circuit 102.
[0015]
Next, the operation of the speech decoding apparatus according to this embodiment will be described.
A plurality of speech encoding parameters transmitted from a transmitting side speech encoding apparatus (not shown) are input to the input terminal 100 in units of frames. For example, when the encoding method of the speech encoding apparatus is a CELP (Code Excited Linear Prediction) method, these speech encoding parameters are LPC analysis parameters, synthesis filter drive signals, speech signal pitches and gains. It is a parameter. Also, these speech coding parameters are transmitted after being error correction coded.
[0016]
These speech encoding parameters input to the input terminal 100 are decoded by the encoding parameter decoder 101 and further output to the switches 103 and 107.
[0017]
The speech coding parameters input to the input terminal 100 are also input to the error detection circuit 102, where it is detected whether there is a code error. The switches 103 and 107 are controlled by the output of the error detection circuit 102. That is, when the output of the error detection circuit 102 indicates “no error”, the switch 107 selects the speech coding parameter decoded by the coding parameter decoder 101 and sends it to the speech synthesizer 108. At this time, the switch 103 is turned on, and the speech coding parameter decoded by the coding parameter decoder 101 is sent to the first storage circuit 104. The first storage circuit 104 outputs the content stored and held so far to the second storage circuit 105, and then stores the new speech coding parameter input through the switch 103, and at the same time stores and holds it. The contents thus output are output to the interpolation circuit 106. On the other hand, the second storage circuit 105 clears the contents stored and held so far, and then stores the contents input from the first storage circuit 104.
[0018]
In this way, the first and second storage circuits 104 and 105 store and hold the speech coding parameters of the frames in which the code error is not detected by the error detection circuit 102 for two frames in the newest order.
[0019]
Next, when the output of the error detection circuit 102 indicates “with error”, the switch 103 is turned off, and the input of the speech coding parameter in which the error is detected to the storage circuit 104 is blocked. At the same time, the interpolation circuit 106 performs an interpolation calculation of speech coding parameters based on the contents of the first and second storage circuits 104 and 105. Specifically, for example, when an LSP parameter is used as an LPC analysis parameter that is one of speech coding parameters, the interpolation circuit 106 performs interpolation of the LSP parameter according to the following equation.
[0020]
ωi (n) = αωi (n−1) + (1−α) ωi (n−2) (1)
Here, 1 ≦ i ≦ P, P is the analysis order, ωi (n) is the LSP parameter of the current frame, and ωi (n−1) and ωi (n−2) are stored and held in the storage circuits 104 and 105, respectively. This is the first and second newest parameter among the LSP parameters of the frame detected as “no error”.
[0021]
Α is a coefficient of 0 <α <1 for weighted averaging of ωi (n−1) and ωi (n−2), and more realistically, for example, set in a range of 0.8 <α <1. Is done. Thus, the reason why the weighting coefficient α for ωi (n−1) is made larger than the weighting coefficient (α−1) for ωi (n−2) is that ωi (n−1) is actually the interpolation calculation result. This is because it is close in time to the required speech coding parameters.
[0022]
When the output of the error detection circuit 102 indicates “There is an error”, the speech coding parameter interpolated by the interpolation circuit 106 as described above is selected by the switch 107 and input to the speech synthesizer 108. The voice synthesizer 108 reproduces a voice signal based on the inputted voice coding parameter and outputs it to the output terminal 102.
[0023]
As described above, in this embodiment, for at least one set of speech coding parameters of frames in which errors are detected (LSP parameters in the above example), the parameters of two frames in which no errors have been detected in the past are weighted averaged. The interpolated parameters are substituted. Since there is a limit to the detection capability of the error detection circuit 102, there is a possibility of erroneous detection as described above. However, since the probability of repeated erroneous detection is very small, as in this embodiment. The reliability of the interpolated parameters is greatly improved by performing weighted averaging of the speech coding parameters of two frames, and the sound quality of the reproduced speech in a frame in which a code error has occurred by using this for decoding and reproducing speech signals. Deterioration can be prevented. Also, in the conventional method, speech encoding parameters are interpolated based on parameters of one frame, so in this embodiment, interpolation accuracy is improved because it is performed based on parameters of two frames. In addition, the effect of further improving the quality of the reproduced sound can be expected.
[0024]
In the above embodiment, the speech coding parameters of two frames are stored and held, and based on the contents, the erroneous frame parameters are obtained by secondary interpolation, but the number of storage circuits is increased, It may be configured to perform higher-order interpolation. In this case, it is possible to reduce the influence of erroneous detection of errors and to increase the interpolation accuracy.
[0025]
(Example 2)
FIG. 2 is a block diagram showing a configuration of a decoding apparatus according to another embodiment of the present invention. The same parts as those in the embodiment shown in FIG. 1 are denoted by the same reference numerals, and the differences will be mainly described. In this embodiment, the speech coding parameters are interpolated by moving average, which is different from the embodiment of FIG. different.
[0026]
That is, in FIG. 2, the speech encoding parameter decoded by the encoding parameter decoder 101 when the output of the error detection circuit 102 indicates “no error” is stored and held in the first storage circuit 104 . The interpolation circuit 202 includes coefficient multipliers 203 and 204, an adder 205, and a second storage circuit 206. The storage circuit 206 stores and holds the contents in units of frames in which the output of the error detection circuit 102 indicates “no error”. To be controlled. In this embodiment, the interpolated value of the speech coding parameter is calculated by the following equation.
[0027]
Ωi = βΩi + (1-β) ωi (n−1) (2)
Here, Ωi is the interpolation value of the LSP parameter, the output of the adder 205, ωi (n−1) is the LSP parameter of the frame in which the output of the error detection circuit 102 indicates “no error”, and (1-β) is The coefficient of the multiplier 203, β is the coefficient of the multiplier 204 (moving average coefficient).
[0028]
According to this embodiment, since the more moving average parameters of all frames without previous error interpolation speech coding parameters, reliability is improved and the interpolation accuracy of the interpolation parameter. In addition, since high-order interpolation is performed by the interpolation circuit 202 including two coefficient multipliers 203 and 204, an adder 205, and one storage circuit 206, a simple addition average as in the embodiment of FIG. Therefore, there is an advantage that the circuit scale can be reduced as compared with the case where higher-order interpolation is realized.
[0029]
In each of the above embodiments, the speech coding parameter interpolation calculation is performed in units of frames, but may be performed in units of subframes. In that case, since the correlation of parameters used for interpolation becomes strong, there is an effect of improving the interpolation accuracy.
[0030]
(Example 3)
FIG. 3 is a block diagram showing a configuration of a speech decoding apparatus according to still another embodiment of the present invention. The same parts as those in the embodiment shown in FIG. 1 are denoted by the same reference numerals, and the differences will be mainly described. In this embodiment, a reliability determination unit 301 and a switch 302 are provided, instead of performing speech coding parameter interpolation. 1 is different from the embodiment of FIG. 1 in that the audio encoding parameters stored and held in the first and second storage circuits 104 and 105 are selectively switched and used for decoding and reproducing audio signals.
[0031]
The first and second storage circuits 104 and 105 respectively store the speech coding parameters decoded by the coding parameter decoder 101 when the output of the error detection circuit 102 indicates “no error”. The reliability determination unit 301 determines that the continuity with the past speech encoding parameter is higher among the speech encoding parameters stored and held in the storage circuits 104 and 105 as being highly reliable, The switch 302 is controlled based on the determination result. When the error detection circuit 102 detects that “there is an error”, the speech encoding parameter selected by the switch 302 is selected by the switch 107, and based on this, the speech synthesizer 108 decodes and reproduces the speech.
[0032]
Note that when selecting speech coding parameters stored and held in the storage circuits 104 and 105, a filter included in the speech coding parameters is used in addition to a method that considers continuity with the past speech coding parameters described above. As for the coefficient, a speech coding parameter including a filter coefficient that makes the filter more stable may be determined as having higher reliability. Also, regarding the power coefficient included in the speech coding parameter, the speech coding parameter including the power coefficient that changes more smoothly from the power coefficient included in the past speech coding parameter is determined as having higher reliability. May be.
[0033]
As described above, according to the present embodiment, the speech coding parameter of the frame in which the error is detected is the speech coding parameter when the error stored in the plurality of storage circuits 104 and 105 is not detected. By selecting the parameter with the highest reliability and using it for audio reproduction, it is possible to prevent deterioration of the sound quality of the reproduced audio of a frame in which a code error has occurred.
[0034]
【The invention's effect】
As described above, according to the present invention, when there is an error in the speech coding parameter, the speech is reproduced and output based on the speech coding parameters of a plurality of unit sections determined as having no past errors. Therefore, it is possible to prevent deterioration in sound quality due to erroneous detection of error detection and to accurately perform speech coding parameter interpolation at the time of a code error, so that the effect of improving the reproduction sound quality can be obtained.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a speech decoding apparatus according to an embodiment of the present invention. FIG. 2 is a block diagram showing a configuration of a speech decoding apparatus according to another embodiment of the present invention. FIG. 4 is a block diagram showing the configuration of a speech decoding apparatus according to another embodiment. FIG. 4 is a block diagram showing the configuration of a conventional speech decoding apparatus.
DESCRIPTION OF SYMBOLS 100 ... Input terminal 101 ... Coding parameter decoder 102 ... Error detection circuit 103 ... Switch 104 ... 1st memory circuit 105 ... 2nd memory circuit 106 ... Interpolation circuit 107 ... Switch 108 ... Speech synthesizer 109 ... Output terminal 202 ... Interpolation circuit 203 ... Coefficient multiplier 204 ... Coefficient multiplier 205 ... Adder 206 ... Storage circuit 301 ... Reliability determination unit 302 ... Switch

Claims (1)

単位区間毎に入力される音声符号化パラメータに基づいて復号を行って音声信号を再生する音声復号装置において、
前記入力される音声符号化パラメータの誤りを検出する誤り検出手段と、
前記入力される音声符号化パラメータの少なくとも1組を前記誤り検出手段により誤りが検出されない複数の単位区間にわたり記憶する記憶手段と、
前記記憶手段から読み出された過去の複数の単位区間にわたる音声符号化パラメータのうち、過去の音声符号化パラメータに含まれる電力係数からの変化がより滑らかに変化する電力係数を含む音声符号化パラメータほど信頼性が高いものとして判定して最も信頼性の高い音声符号化パラメータを選択する選択手段と、
前記誤り検出手段により誤りが検出されない単位区間については前記入力される音声符号化パラメータに基づいて音声信号を再生し、前記誤り検出手段により誤りが検出された単位区間については前記選択手段により選択された音声符号化パラメータに基づいて音声信号を再生する再生手段とを備えたことを特徴とする音声復号装置。
In a speech decoding device that reproduces a speech signal by performing decoding based on a speech coding parameter input for each unit section,
Error detection means for detecting an error in the input speech coding parameter;
Storage means for storing at least one set of the input speech coding parameters over a plurality of unit intervals in which no error is detected by the error detection means;
A speech coding parameter including a power coefficient in which a change from a power coefficient included in a past speech coding parameter changes more smoothly among speech coding parameters over a plurality of past unit intervals read from the storage unit. A selection means for selecting the most reliable speech coding parameter by determining that the reliability is high,
A unit section in which no error is detected by the error detection means is reproduced based on the input speech coding parameter, and a unit section in which an error is detected by the error detection means is selected by the selection means. A speech decoding apparatus comprising: reproduction means for reproducing an audio signal based on the audio encoding parameter.
JP06522794A 1994-04-01 1994-04-01 Speech decoder Expired - Fee Related JP3713288B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06522794A JP3713288B2 (en) 1994-04-01 1994-04-01 Speech decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06522794A JP3713288B2 (en) 1994-04-01 1994-04-01 Speech decoder

Publications (2)

Publication Number Publication Date
JPH07271391A JPH07271391A (en) 1995-10-20
JP3713288B2 true JP3713288B2 (en) 2005-11-09

Family

ID=13280829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06522794A Expired - Fee Related JP3713288B2 (en) 1994-04-01 1994-04-01 Speech decoder

Country Status (1)

Country Link
JP (1) JP3713288B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100630253B1 (en) * 1999-04-19 2006-10-02 에이티 앤드 티 코포레이션 Method and apparatus for performing packet loss or frame erasure concealment
US7117156B1 (en) 1999-04-19 2006-10-03 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US7047190B1 (en) 1999-04-19 2006-05-16 At&Tcorp. Method and apparatus for performing packet loss or frame erasure concealment
US7031926B2 (en) 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
JP4419748B2 (en) * 2004-08-12 2010-02-24 沖電気工業株式会社 Erasure compensation apparatus, erasure compensation method, and erasure compensation program
IN2015DN02595A (en) 2012-11-15 2015-09-11 Ntt Docomo Inc

Also Published As

Publication number Publication date
JPH07271391A (en) 1995-10-20

Similar Documents

Publication Publication Date Title
JP4199281B2 (en) Soft error correction in TDMA wireless systems
US7698135B2 (en) Voice detecting method and apparatus using a long-time average of the time variation of speech features, and medium thereof
EP0459358B1 (en) Speech decoder
EP0116975B1 (en) Speech-adaptive predictive coding system
EP1746581B1 (en) Sound packet transmitting method, sound packet transmitting apparatus, sound packet transmitting program, and recording medium in which that program has been recorded
JP3155952B2 (en) Voice decoding device
US5862518A (en) Speech decoder for decoding a speech signal using a bad frame masking unit for voiced frame and a bad frame masking unit for unvoiced frame
JP3713288B2 (en) Speech decoder
JPH0927757A (en) Method and device for reproducing sound in course of erasing
US8335579B2 (en) Restoring corrupted audio signals
EP1074975B1 (en) Method for decoding an audio signal with transmission error concealment
JP3583550B2 (en) Interpolator
JPH11261534A (en) Communications device, communications method and communications signal system
JPH08211898A (en) Sub-band audio signal synthesis device
JPH0612095A (en) Voice decoding method
JP3368443B2 (en) Voice coded transmission system and receiving device
JP2001339368A (en) Error compensation circuit and decoder provided with error compensation function
JPH0697846A (en) Radio communication equipment
CN100349395C (en) Speech communication unit and method for error mitigation of speech frames
JP3223943B2 (en) Vector code decoding method
JP2000196568A (en) Adpcm correction system
JPH0865275A (en) Receiving method for audio signal
KR20010113780A (en) Error correction method with pitch change detection
JPH0690207A (en) Adpcm receiver
JP2001177481A (en) Decoder

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040816

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041006

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20041119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050822

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090826

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees