JP2006350373A

JP2006350373A - 音声符号変換方法および装置

Info

Publication number: JP2006350373A
Application number: JP2006205814A
Authority: JP
Inventors: Masanao Suzuki; 政直鈴木; Takashi Ota; 恭士大田; Yoshiteru Tsuchinaga; 義照土永; Masakiyo Tanaka; 正清田中
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-07-28
Filing date: 2006-07-28
Publication date: 2006-12-28
Anticipated expiration: 2022-01-29
Also published as: JP4236675B2

Abstract

【目的】EVRCのレートに応じた符号変換を行なうことである。
【構成】第1音声符号のレートに対応させてフルレート用、ハーフレート用、1/8レート用の音声符号変換部を設け、第1音声符号のレートが1/8レートの場合、1/8レート用の音声符号変換部は、（1）第1音声符号化方式による音声符号に含まれるLSP符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号を求め、（2）ターゲット信号と代数合成信号を生成し、これらターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求め、(3)フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値や代数符号などを用いて第２音声符号化方式のゲイン符号を求めて出力する。
【選択図】図１３

Description

本発明は、第1の音声符号化方式により符号化して得られる音声符号を第２の音声符号化方式の音声符号に変換する音声符号変換方法及び装置に係わり、特に、インターネットや携帯電話システムなどで用いられる第1の音声符号化方式で音声を符号化して得られた音声符号を、異なる第2の音声符号化方式の音声符号に変換する音声符号変換方法および装置に関する。

近年、携帯電話の加入者が爆発的に増加しており、今後も利用者数が増加することが予想されている。また、インターネットを使った音声通信(Voice over IP; VoIP)は、企業内ネットワーク(イントラネット)や長距離電話サービスなどの分野で普及しつつある。携帯電話やVoIPなどの音声通信システムでは、通信回線を有効利用するために音声を圧縮する音声符号化技術が用いられている。携帯電話では国によってあるいはシステムによって異なる音声符号化技術が用いられているが、次世代携帯電話システムとして期待されているcdma2000では、音声符号化方式としてEVRC(Enhanced Variable Rate CODEC; エンハンスト可変レート音声符号化)方式が採用されている。一方、VoIPでは音声符号化方式としてITU-T勧告G.729Aが広く用いられている。以下では、まずG.729AとEVRCの概要について説明する。

(1) G.729Aの説明
・符号器の構成及び動作
図15はITU-T勧告G.729A方式の符号器の構成図である。図15において、１フレーム当り所定サンプル数（＝Ｎ）の入力信号（音声信号）Ｘがフレーム単位でLPC分析部１に入力する。サンプリング速度を8kHz、1フレーム期間を10msecとすれば、1フレームは80サンプルである。LPC分析部１は、人間の声道を次式
H(z)=１／［１＋Σαi・ｚ^-i］（ｉ＝１〜P） (1)
で表される全極型フィルタと見なし、このフィルタの係数αi(i=1,・・・,P)を求める。ここで、Pはフィルタ次数である。一般に、電話帯域音声の場合はPとして10〜12の値が用いられる。 LPC(線形予測)分析部１では、入力信号の80サンプルと先読み分の40サンプル及び過去の信号120サンプルの合計240サンプルを用いてLPC分析を行いLPC係数を求める。

パラメータ変換部２はLPC係数をLSP(線スペクトル対)パラメータに変換する。ここで、LSPパラメータは、LPC係数と相互に変換が可能な周波数領域のパラメータであり、量子化特性がLPC係数よりも優れていることから量子化はLSPの領域で行われる。LSP量子化部３は変換されたLSPパラメータを量子化してLSP符号とLSP逆量子化値を求める。LSP補間部４は、現フレームで求めたLSP逆量子化値と前フレームで求めたLSP逆量子化値によりLSP補間値を求める。すなわち、１フレームは5msecの第１、第２の２つのサブフレームに分割され、LPC分析部１は第２サブフレームのLPC係数を決定するが、第１サブフレームのLPC係数は決定しない。そこで、LSP補間部４は、現フレームで求めたLSP逆量子化値と前フレームで求めたLSP逆量子化値を用いて補間演算により第１サブフレームのLSP逆量子化値を予測する。

パラメータ逆変換部５はLSP逆量子化値とLSP補間値をそれぞれLPC係数に変換してLPC合成フィルタ６に設定する。この場合、LPC合成フィルタ６のフィルタ係数として、フレームの第１サブフレームではLSP補間値から変換されたLPC係数が用いられ、第２サブフレームではLSP逆量子化値から変換したLPC係数が用いられる。尚、以降において1に添字があるもの、例えばlspi, li（ｎ）,・・・における1はアルファベットのエルである。

LSPパラメータlspi(i=1,・・・,P)はLSP量子化部３でスカラー量子化やベクトル量子化などにより量子化された後、量子化インデックス（LSP符号)が復号器側へ伝送される。図1６は量子化方法説明図であり、量子化テーブル３ａにはインデックス番号１〜ｎに対応させて多数の量子化LSPパラメータの組が記憶されている。距離演算部３ｂは次式
ｄ＝Σｉ｛lspｑ(i)-lspi｝² (i=1〜P)
により距離を演算する。そして、ｑを１〜ｎまで変化させた時、最小距離インデックス検出部３ｃは距離ｄが最小となるｑを求め、インデックスｑをLSP符号として復号器側へ伝送する。

次に音源とゲインの探索処理を行なう。音源とゲインはサブフレーム単位で処理を行う。まず、音源信号をピッチ周期成分と雑音成分の２つに分け、ピッチ周期成分の量子化には過去の音源信号系列を格納した適応符号帳７を用い、雑音成分の量子化には代数符号帳や雑音符号帳などを用いる。以下では、音源符号帳として適応符号帳７と代数符号帳８の２つを使用する音声符号化方式について説明する。

適応符号帳７は、インデックス１〜Ｌに対応して順次１サンプル遅延したＮサンプル分の音源信号（周期性信号という）を出力するようになっている。図1７は1サブフレーム40サンプル(N=40)とした場合の適応符号帳７の構成図であり、最新の(L+39)サンプルのピッチ周期成分を記憶するバッファＢＦで構成され、インデックス１により1〜40サンプルよりなる周期性信号が特定され、インデックス２により2〜41サンプルよりなる周期性信号が特定され、・・・インデックスＬによりL〜L+39サンプルよりなる周期性信号が特定される。初期状態では適応符号帳７の中身は全ての振幅が0の信号が入っており、毎サブフレーム毎に時間的に一番古い信号をサブフレーム長だけ捨て、現サブフレームで求めた音源信号を適応符号帳７に格納するように動作する。

適応符号帳探索は、過去の音源信号を格納している適応符号帳７を用いて音源信号の周期性成分を同定する。すなわち、適応符号帳７から読み出す開始点を1サンプルづつ変えながら適応符号帳７内の過去の音源信号をサブフレーム長(=40サンプル)だけ取り出し、LPC合成フィルタ６に入力してピッチ合成信号β・A・PLの周期性信号(適応符号ベクトル)、AはLPC合成フィルタ６のインパルス応答、βは適応符号帳ゲインである。

演算部９は入力音声Ｘとβ・A・PLの誤差電力ELを次式
EL＝｜X−β・A・PL｜² (2)
により求める。
適応符号帳出力の重み付き合成出力をA・PLとし、A・PLの自己相関をＲpp、A・PLと入力信号Xの相互相関をＲxpとすると、式(2)の誤差電力が最小となるピッチラグＬoptにおける適応符号ベクトルPLは、次式
PL=argmax（Rxp²／Rpp） (3)
により表わされる。すなわち、ピッチ合成信号A・PLと入力信号Xとの相互相関Ｒxpをピッチ合成信号の自己相関Ｒppで正規化した値が最も大きくなる読み出し開始点を最適な開始点とする。以上より、誤差電力評価部１０は(3)式を満足するピッチラグＬoptを求める。このとき、最適ピッチゲインβoptは次式
βopt＝Ｒxp／Ｒpp (4)
で与えられる。

次に代数符号帳８を用いて音源信号に含まれる雑音成分を量子化する。代数符号帳８は、振幅が1又は−1の複数のパルスから構成される。例として、サブフレーム長が40サンプルの場合のパルス位置を図１８に示す。代数符号帳８は、１サブフレームを構成するＮ(=40)サンプル点を複数のパルス系統グループ１〜４に分割し、各パルス系統グループから１つのサンプル点を取り出してなる全組み合わせについて、各サンプル点で＋１あるいは−１のパルスを有するパルス性信号を雑音成分として順次出力する。この例では、基本的に1サブフレームあたり4本のパルスが配置される。図１９は各パルス系統グループ１〜４に割り当てたサンプル点の説明図であり、
(1) パルス系統グループ１には8個のサンプル点 0、5、10,15,20,25,30,35が割り当てられ、
(2) パルス系統グループ２には8個のサンプル点 1、6、11,16,21,26,31,36が割り当てられ、
(3) パルス系統グループ３には8個のサンプル点 2、7、12,17,22,27,32,37が割り当てられ、
(4) パルス系統グループ４には16個のサンプル点 3,4,8,9,13,14,18,19,23,
24,28,29,33,34,38,39が割り当てられている。

パルス系統グループ１〜３のサンプル点を表現するために３ビット、パルスの正負を表現するのに１ bit、トータル4 bit が必要であり、又、パルス系統グループ４のサンプル点を表現するために4 bit、パルスの正負を表現するのに1 bit、トータル5 bit 必要である。従って、図１８のパルス配置を有する雑音符号帳８から出力するパルス性信号を特定するために17bitが必要になり、パルス性信号の種類は２¹⁷（＝２⁴×２⁴×２⁴×２⁵）存在する。
図１８に示すように各パルス系統のパルス位置は限定されており、代数符号帳探索では各パルス系統のパルス位置の組み合わせの中から、再生領域で入力音声との誤差電力が最も小さくなるパルスの組み合わせを決定する。すなわち、適応符号帳探索で求めた最適ピッチゲインβoptとし、適応符号帳出力ＰＬに該ゲインβoptを乗算して加算器１１に入力する。これと同時に代数符号帳８より順次パルス性信号を加算器に１１に入力し、加算器出力をLPC合成フィルタ６に入力して得られる再生信号と入力信号Ｘとの差が最小となるパルス性信号を特定する。具体的には、まず入力信号Ｘから適応符号帳探索で求めた最適な適応符号帳出力ＰＬ、最適ピッチゲインβ_optから次式により代数符号帳探索のためのターゲットベクトルＸ′を生成する。

Ｘ′＝Ｘ−β_optAPＬ (5)
この例では、パルスの位置と振幅(正負)を前述のように17bitで表現するため、その組合わせは2の17乗通り存在する。ここで、k通り目の代数符号出力ベクトルをCｋとすると、代数符号帳探索では次式
Ｄ＝|Ｘ′−GC・A・Ck|² (6)
の評価関数誤差電力Ｄを最小とする符号ベクトルCｋを求める。GCは代数符号帳ゲインである。誤差電力評価部１０は代数符号帳の探索において、代数合成信号A・Ckと入力信号Ｘ′の相互相関値Rcxの２乗を代数合成信号の自己相関値Rccで正規化して得られる正規化相互相関値(Rcx*Rcx/Rcc)が最も大きくなるパルス位置と極性の組み合わせを探索する。尚、ピッチラグがサブフレーム長よりも短い場合には、音質を向上させるためにピッチ周期化部を設け、該ピッチ周期化部により代数符号帳出力に周期性を持たせるピッチ周期化処理を行わせることができる。代数符号帳探索の出力結果は、各パルスの位置と符号(正負)であり、これをまとめて代数符号と呼ぶ。

次にゲイン量子化について説明する。G.729A方式では代数符号帳ゲインは直接には量子化されず、適応符号帳ゲインＧa（＝βopt）と代数符号帳ゲインＧCの補正係数γをベクトル量子化する。ここで、代数符号帳ゲインGCと補正係数γとの間には
GC＝ｇ′×γ
なる関係がある。ｇ′は過去の4サブフレームの対数利得から予測される現フレームの利得である。ゲイン量子化器１２の図示しないゲイン量子化テーブル（ゲイン符号帳）には、適応符号帳ゲインＧaと代数符号帳ゲインに対する補正係数γの組み合わせが128通り(＝２７)用意されている。ゲイン符号帳の探索方法は、(1)適応符号帳出力ベクトルと代数符号帳出力ベクトルに対して、ゲイン量子化テーブルの中から1組のテーブル値を取り出してゲイン可変部１３、１４に設定し、(2)ゲイン可変部１３、１４でそれぞれのベクトルにゲインＧa、Ｇcを乗じてLPC合成フィルタ６に入力し、(3)誤差電力評価部１０において入力信号Ｘとの誤差電力が最も小さくなる組み合わせを選択する、ことにより行なう。

以上より、回線符号化部１５は、(1)LSPの量子化インデックスであるLSP符号、(2)ピッチラグ符号Ｌopt、(3) 代数符号帳インデックスである代数符号、(4) ゲインの量子化インデックスであるゲイン符号を多重して回線データを作成し、復号器に伝送する。以上説明した通り、G.729A方式の符号化方式は音声の生成過程をモデル化し、そのモデルの特徴パラメータを量子化して伝送することにより、音声を効率良く圧縮することができる。

・復号器の構成及び動作
図２０にG.729A方式の復号器のブロック図である。符号器側から送られてきた回線データが回線復号部２１へ入力されてLSP符号、ピッチラグ符号、代数符号、ゲイン符号が出力される。復号器ではこれらの符号に基づいて音声データを復号する。復号器の動作については、復号器の機能が符号器に含まれているため一部重複するが、以下で簡単に説明する。
LSP逆量子化部２２はLSP符号が入力すると逆量子化し、LSP逆量子化値を出力する。LSP補間部２３は現フレームの第２サブフレームにおけるLSP逆量子化値と前フレームの第２サブフレームのLSP逆量子化値から現フレームの第１サブフレームのLSP逆量子化値を補間演算する。次に、パラメータ逆変換部２４はLSP補間値とLSP逆量子化値をそれぞれLPC合成フィルタ係数へ変換する。G.729A方式のLPC合成フィルタ２５は、最初の第１サブフレームではLSP補間値から変換されたLPC係数を用い、次の第２サブフレームではLSP逆量子化値から変換されたLPC係数を用いる。

適応符号帳２６はピッチラグ符号が指示する読み出し開始位置からサブフレーム長(=40サンプル)のピッチ信号を出力し、雑音符号帳２７は代数符号に対応するの読出し位置からパルス位置とパルスの極性を出力する。また、ゲイン逆量子化部２８は入力されたゲイン符号より適応符号帳ゲイン逆量子化値と代数符号帳ゲイン逆量子化値を算出してゲイン可変部２９，３０に設定する。加算部３１は適応符号帳出力に適応符号帳ゲイン逆量子化値を乗じて得られる信号と、代数符号帳出力に代数符号帳ゲイン逆量子化値を乗じて得られる信号とを加え合わせて音源信号を作成し、この音源信号をLPC合成フィルタ２５に入力する。これにより、LPC合成フィルタ２５から再生音声を得ることができる。
尚、初期状態では復号器側の適応符号帳２６の内容は全て振幅0の信号が入っており、サブフレーム毎に時間的に一番古い信号をサブフレーム長だけ捨て、一方、現サブフレームで求めた音源信号を適応符号帳２６に格納するように動作する。つまり、符号器と復号器の適応符号帳２６は常に最新の同じ状態になるように維持される。

(2)EVRCの説明
EVRCは、入力信号の性質に応じて1フレーム当りの伝送ビット数を変化させる点に特徴がある。すなわち、母音などの定常部ではビットレートを高くし、無音部や過渡部などでは伝送ビット数を少なくして、時間平均のビットレートを少なくする。EVRCのビットレートを表１に示す。

EVRCでは現フレームの入力信号に対してレート判定を行う。レート判定は、入力音声信号の周波数領域を低域と高域に分け各帯域の電力を計算する。各帯域の電力とあらかじめ決められた2種類の閾値とを比較し、低域電力と高域電力が共に閾値よりも高い場合はフルレートを選択し、低域電力又は高域電力のいずれか一方のみが閾値よりも高い場合はハーフレートを選択する。また、低域電力と高域電力が共に閾値よりも低い場合には1/8レートを選択する。

図２１にEVRCの符号器の構成を示す。EVRCでは、20msec(160サンプル)のフレームに分割された入力信号を符号器に入力する。また、1フレームの入力信号は、表２に示すように3つのサブフレームに分割される。尚、フルレートとハーフレートでは符号器の構成はほぼ同一であり、各量子化器の量子化ビット数が異なるだけなので以下ではフルレートについて説明する。

LPC(線形予測)分析部41では、図２２に示すように現フレームの入力信号160サンプルと、先読み分80サンプルの合計240サンプルを用いたLPC分析によりLPC係数を求める。LSP量子化部42では、LPC係数をLSPパラメータに変換してから量子化してLSP符号を求め、LSP逆量子化部43はLSP符号よりＬSP逆量子化値を求める。また、LSP補間部44では、現フレームで求めたLSP逆量子化値(第3サブフレームのLSP逆量子化値)と前フレームで求めた第3サブフレームのLSP逆量子化値を用いて線形補間演算により現フレームの第1、第2、第3サブフレームにおけるLSP逆量子化値を求める。

次に、ピッチ分析部45で現フレームのピッチラグとピッチゲインを求める。EVRCでは、1フレームにつき2回のピッチ分析を行う。ピッチ分析の分析窓位置は図２２に示す通りである。ピッチ分析の手順は次の通りである。
(1)現フレームの入力信号と先読み信号を前記LPC係数で構成されるLPC逆フィルタに入力してLPC残差信号を求める。なお、LPC合成フィルタをH(z)とするとLPC逆フィルタは1/H(z)である。
(2)LPC残差信号の自己相関関数を求め、自己相関関数が最大となる時のピッチラグとゲインを求める。
(3)上記の処理を2つの分析窓位置で行う。1回目の分析で求めたピッチラグとピッチゲインを各々Lag1、Gain1とし、2回目の分析で求めたピッチラグとピッチゲインをLag2、Gain2とする。
(4)Gain1とGain2の差があらかじめ決められた閾値よりも大きい時は、Gain1とLag1を現フレームのピッチゲインとピッチラグとする。また、閾値以下の場合にはGain2とLag2を各々現フレームのピッチゲインとピッチラグとする。

上記の手順により現フレームのピッチラグとピッチゲインを求める。ピッチゲイン量子化部46は該ピッチゲインを量子化テーブルを用いて量子化してピッチゲイン符号を出力し、、ピッチゲイン逆量子化部47はピッチゲイン符号を逆量子化してゲイン可変部48に入力する。G.729Aではサブフレーム単位でピッチラグとピッチゲインを求めるのに対し、EVRCではフレーム単位でピッチラグとピッチゲインを求める点が異なっている。

又、EVRCでは、入力音声修正部4９がピッチラグ符号に応じて入力信号を修正する点が異なっている。つまり、G.729Aのように、入力信号との誤差が最も小さくなるようなピッチラグとピッチゲインを求めるのではなく、EVRCでは入力音声修正部46が、ピッチ分析によって求めたピッチラグとピッチゲインによって決まる適応符号帳出力に最も近くなるように入力信号を修正する。具体的に、入力音声修正部46は、LPC逆フィルタにより入力信号を残差信号に変換し、残差信号領域でのピッチピーク位置を適応符号帳47の出力のピッチピーク位置と同じ位置になるように時間シフトすることで実現する。

次に雑音性音源信号とゲインの決定をサブフレーム単位で行う。まず、適応符号帳出力をゲイン可変部48、LPC合成フィルタ51を通して得られる適応符号帳合成信号を、入力音声修正部46の修正入力信号から演算部５２で差し引いて代数符号帳探索のターゲット信号Ｘ′を生成する。EVRCの代数符号帳53は、G.729Aと同様に複数本のパルスから構成され、フルレートでは1サブフレーム当り35ビットを割り当てている。フルレートのパルス位置を表３に示す。

代数符号帳の探索方法はG.729Aと同様であるが、各パルス系統から選ぶパルスの本数が異なる。5つのパルス系統のうち3系統に2パルスを割り当て、2系統に1パルスを割り当てる。ただし、1パルスを割り当てる系統の組み合わせはT3-T4,T4-T0, T0-T1, T1-T2の４通りに限定されている。従って、パルス系統とパルス本数の組合わせは表4のようになる。

以上のように1パルスを割り当てる系統と2パルスを割り当てる系統があるため、パルス本数によって各パルス系統に割り当てるビット数が異なっている。表５にフルレートの代数符号帳のビット配分を示す。

1本のパルス系統の組み合わせは表4より4通りあるため、2ビット必要である。パルス数が1本である２つのパルス系統における11個のパルス位置をそれぞれX,Y方向に配列すると、１１×11の格子点が形成でき、1つの格子点により２つのパルス系統のパルス位置を特定することができる。従って、パルス数が1本である２つのパルス系統のパルス位置を特定するために7ビット必要であり、パルス数が1本である２つのパルス系統のパルスの極性を表現するのに2ビット必要である。また、パルス数が２本である２つのパルス系統のパルス位置を特定するために7×３ビット必要であり、パルス数が２本である３つのパルス系統のパルスの極性を表現するのに1×３ビット必要である。尚、1系統のパルスの極性は同じである。以上より、EVRCにおいて代数符号はトータル35ビットで表現される。

代数符号帳探索において、代数符号帳53は順次パルス性信号をゲイン乗算部54、LPC合成フィルタ55に入力して代数合成信号を発生し、演算部56は代数合成信号とターゲット信号X′との差を演算し、
Ｄ＝|Ｘ′−GC・A・Cｋ|²
の評価関数誤差電力Ｄを最小とする符号ベクトルCｋを求める。GCは代数符号帳ゲインである。誤差電力評価部59は代数符号帳の探索において、代数合成信号A・Ckとターゲット信号Ｘ′の相互相関値Rcxの２乗を代数合成信号の自己相関値Rccで正規化して得られる正規化相互相関値(Rcx*Rcx/Rcc)が最も大きくなるパルス位置と極性の組み合わせを探索する。

代数符号帳ゲインは直接には量子化されず、代数符号帳ゲインの補正係数γが１サブフレーム当たり５ビットでスカラー量子化される。補正係数γは、過去のサブフレームから予測されるゲインをg′で代数符号帳ゲインGcを正規化して得られる値(γ＝Gc／g′)である。以上より、多重化部６０は、(1)LSPの量子化インデックスであるLSP符号、(2)ピッチラグ符号、(3) 代数符号帳インデックスである代数符号、(4) ピッチゲインの量子化インデックスであるピッチゲイン符号、(5)代数符号帳ゲインの量子化インデックスである代数符号帳ゲイン符号を多重して回線データを作成し、復号器に伝送する。
尚、復号器は符号器側から送られてきたLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号を用いて音声データを復号するように構成される。EVRCの復号器は、G.729の復号器が符号器に対応して作成されるのと同様に作成できるためその説明は省略する。

(3)従来の音声符号の変換方式
インターネットと携帯電話の普及に伴い、インターネットのユーザと携帯電話網のユーザによる音声通話の通信量が今後ますます増えてくると考えられる。ところが、携帯電話網とインターネットとでは使用する音声符号化方式が異なるため、そのままでは通信することはできない。このため、従来は一方のネットワークで符号化された音声符号を音声符号変換部により他方のネットワークで用いられる符号化方式の音声符号に変換していた。
図２３に従来の典型的な音声符号変換方法の原理図を示す。以下ではこの方法を従来技術1と呼ぶ。図において、ユーザＡが端末71に対して入力した音声をユーザＢの端末7２に伝える場合のみを考える。ここで、ユーザＡの持つ端末71は符号化方式１の符号器71ａのみを持ち、ユーザＢの持つ端末72は符号化方式２の復号器72ａのみを持つこととする。

送信側のユーザＡが発した音声は、端末71に組み込まれた符号化方式71の符号器71ａへ入力する。符号器71ａは入力した音声信号を符号化方式１の音声符号に符号化して伝送路71ｂに送出する。音声符号変換部73の復号器73ａは、伝送路71ｂを介して音声符号が入力すると、符号化方式１の音声符号から一旦再生音声を復号する。続いて、音声符号変換部73の符号器73ｂは再生音声信号を符号化方式２の音声符号に変換して伝送路72ｂに送出する。この符号化方式２の音声符号は伝送路72ｂを通して端末72に入力する。復号器72ａは音声符号が入力すると、符号化方式２の音声符号から再生音声を復号する。これにより、受信側のユーザＢは再生音声を聞くことができる。以上のように一度符号化された音声を復号し、復号された音声を再度符号化する処理をタンデム接続と呼ぶ。

以上のように従来技術１の構成では、音声符号化方式1で符号化した音声符号を一旦符号化音声に復号し、再度、音声符号化方式2により符号化するタンデム接続を行うため、音声品質の著しい劣化や遅延の増加といった問題があった。すなわち、一度符号化処理され情報圧縮された音声(再生音声)は、元の音声(原音)に比べて音声の情報量が減っており、再生音声の音質は、厳密には原音よりも悪い。特に、G.729AやEVRCに代表される近年の低ビットレート音声符号化方式では、高圧縮率を実現するために入力音声に含まれる多くの情報を捨てて符号化しており、符号化と復号を繰り返すタンデム接続を行うと、再生音声の品質が著しく劣化するという問題があった

このようなタンデム接続の問題点を解決する方法として、音声符号を音声信号に戻すことなく、LSP符号、ピッチラグ符号等のパラメータ符号に分解し、各パラメータ符号を個別に別の音声符号化方式の符号に変換する手法が提案されている（特願2001-75427参照）。図２４にその原理図を示す。以下ではこれを従来技術２と呼ぶ。
端末71に組み込まれた符号化方式１の符号器71ａはユーザＡが発した音声信号を符号化方式１の音声符号に符号化して伝送路71ｂに送出する。音声符号変換部74は伝送路71ｂより入力した符号化方式１の音声符号を符号化方式２の音声符号に変換して伝送路72ｂに送出し、端末72の復号器72ａは、伝送路72ｂを介して入力する符号化方式２の音声符号から再生音声を復号し、ユーザＢはこの再生音声を聞くことができる。

符号化方式１は、(1)フレーム毎の線形予測分析により得られる線形予測係数(LPC係数)から求まるLSPパラメータを量子化することにより得られる第１のLＳＰ符号と、(2)周期性音源信号を出力するための適応符号帳の出力信号を特定する第１のピッチラグ符号と、(3)雑音性音源信号を出力するための代数符号帳(あるいは雑音符号帳)の出力信号を特定する第１の代数符号(雑音符号)と、(4)前記適応符号帳の出力信号の振幅を表すピッチゲインと前記代数符号帳の出力信号の振幅を表す代数符号帳ゲインとを量子化して得られる第１のゲイン符号とで音声信号を符号化する方式である。又、符号化方式２は、第１の音声符号化方式と異なる量子化方法により量子化して得られる(1)第２のLＳＰ符号、(2)第２のピッチラグ符号、(3)第２の代数符号（雑音符号）、(4)第２のゲイン符号とで音声信号を符号化する方式である。

音声符号変換部74は、符号分離部74ａ、LSP符号変換部74ｂ、ピッチラグ符号変換部74ｃ、代数符号変換部74ｄ、ゲイン符号変換部74ｅ、符号多重化部74ｆを有している。符号分離部74ａは、端末１の符号器71ａから伝送路71ｂを介して入力する符号化方式１の音声符号より、音声信号を再現するために必要な複数の成分の符号、すなわち、(1)LSP符号、(2)ピッチラグ符号、(3)代数符号、(4)ゲイン符号に分離し、それぞれを各符号変換部74ｂ〜74ｅに入力する。各符号変換部74ｂ〜74ｅは入力された音声符号化方式１によるLSP符号、ピッチラグ符号、代数符号、ゲイン符号をそれぞれ音声符号化方式２によるLSP符号、ピッチラグ符号、代数符号、ゲイン符号に変換し、符号多重化部74ｆは変換された音声符号化方式２の各符号を多重化して伝送路72ｂに送出する。

図２５は各符号変換部74ｂ〜74ｅの構成を明確にした音声符号変換部74の構成図であり、図２４と同一部分には同一符号を付している。符号分離部74ａは伝送路より入力端子＃１を介して入力する符号化方式１の音声符号より、LSP符号１、ピッチラグ符号１、代数符号１、ゲイン符号１を分離し、それぞれ符号変換部74ｂ〜74ｅに入力する。

LSP符号変換部74ｂのLSP逆量子化器74ｂ₁は、符号化方式１のLSP符号１を逆量子化してLSP逆量子化値を出力し、LSP量子化器74ｂ₂は該LSP逆量子化値を符号化方式２のLSP量子化テーブルを用いて量子化してLSP符号２を出力する。ピッチラグ符号変換部74ｃのピッチラグ逆量子化器74ｃ₁は、符号化方式１のピッチラグ符号１を逆量子化してピッチラグ逆量子化値を出力し、ピッチラグ量子化器74ｃ₂は該ピッチラグ逆量子化値を符号化方式２のピッチラグ量子化テーブルを用いて量子化してピッチラグ符号２を出力する。代数符号変換部74ｄの代数符号逆量子化器74ｄ₁は、符号化方式１の代数符号１を逆量子化して代数符号逆量子化値を出力し、代数符号量子化器74ｄ₂は該代数符号逆量子化値を符号化方式２の代数符号量子化テーブルを用いて量子化して代数符号２を出力する。ゲイン符号変換部74ｅのゲイン逆量子化器74ｅ₁は、符号化方式１のゲイン符号１を逆量子化してゲイン逆量子化値を出力し、ゲイン量子化器74ｅ₂は該ゲイン逆量子化値を符号化方式２のゲイン量子化テーブルを用いて量子化してゲイン符号２を出力する。
符号多重化部74ｆは、各量子化器74ｂ₂〜74ｅ₂から出力するLSP符号２、ピッチラグ符号２、代数符号２、ゲイン符号２を多重して符号化方式２による音声符号を作成して出力端子＃２より伝送路に送出する。

図２３のタンデム接続方式（従来技術１）は、符号化方式１で符号化された音声符号を一旦音声に復号して得られた再生音声を入力とし、再度符号化と復号を行っている。このため、再度の符号化(つまり音声情報圧縮)によって原音に比べて遥かに情報量が少なくなっている再生音声から音声のパラメータ抽出を行うため、それによって得られる音声符号は必ずしも最適なものではなかった。これに対し、図２４の従来技術２の音声符号化装置によれば、符号化方式１の音声符号を逆量子化及び量子化の過程を介して符号化方式２の音声符号に変換するため、従来技術１のタンデム接続に比べて格段に劣化の少ない音声符号変換が可能となる。また、音声符号変換のために一度も音声に復号する必要がないので、従来のタンデム接続で問題となっていた遅延も少なくて済むという利点がある。

VoIP網では音声符号化方式としてG.729Aが用いられている。一方、次世代携帯電話システムとして期待されるcdma2000網ではEVRCが採用されている。表６にG.729AとEVRCの主要諸元を比較した結果を示す。

G.729Aのフレーム長は10msecであり、サブフレーム長は5msecである。一方、EVRCのフレーム長は20msecであり、１フレームを3つのサブフレームに分割している。このため、EVRCのサブフレーム長は6.625msec(最終サブフレームのみ6.75msec)となり、G.729Aとはフレーム長だけでなく、サブフレーム長も異なっている。表７にG.729AとEVRCのビット割り当てを比較した結果を示す。

VoIP網とcdma2000網との間で音声通信をする場合には、一方の音声符号を他方の音声符号に変換するための音声符号変換技術が必要である。このような場合に用いられる技術として、前述した従来技術１と従来技術２が知られている。
ところが、従来技術１では符号化方式１の音声符号から一旦音声を再生し、再生された音声を入力として音声符号化方式２で再度符号化するため、符号化方式の違いに影響されずに符号変換が可能である。ところが、この方法では再符号化する際にLPC分析とピッチ分析のために信号の先読み（すなわち、遅延）が生じるという問題や、音質が大幅に劣化するという問題がある。

一方、従来技術２の音声符号変換方式では、符号化方式１と符号化方式２のサブフレーム長が等しいという前提で音声符号に変換するため、符号方式１と符号方式２のサブフレーム長が異なる場合の符号変換に問題があった。すなわち、代数符号帳はサブフレーム長に応じてパルス位置候補が決定されているため、サブフレーム長が異なる方式間（G.729AとEVRC）では、パルスの位置が全く異なることになり、パルスの位置を一対一で対応付けるのが難しいという問題があった。

以上より本発明の目的は、サブフレーム長の異なる音声符号化方式間であっても音声符号変換を行なえるようにすることである。
本発明の別の目的は、音質劣化を少なくでき、しかも、遅延時間を小さくできるようにすることである。
本発明の別の目的は、EVRCのレートに応じた符号変換を行なえるようにすることである。

本発明の第１の態様は、第1音声符号化方式に基いて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第２音声符号化方式に基づいた第２音声符号に変換する音声符号変換方法であり、第1音声符号のレートに対応させてフルレート用、ハーフレート用、1/8レート用の音声符号変換部を設け、第1音声符号のレートが1/8レートの場合、1/8レート用の音声符号変換部は、第1音声符号化方式による音声符号に含まれるLSP符号と代数符号帳ゲイン符号を分離してそれぞれを逆量子化して逆量子化値を出力するステップ、逆量子化値のうちLSP符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号を求めるステップ、音源発生部から出力するランダム信号に前記ゲイン符号の逆量子化値を乗算し、乗算結果をLSP符号の逆量子化値で構成されるLPC合成フィルタに入力してターゲット信号を発生するステップ、第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成するステップ、前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求め、
第2音声符号の前記LSP符号の逆量子化値、フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第２音声符号化方式のゲイン符号を求めるステップ、前記求めた第２音声符号化方式におけるLSP符号、代数符号、ゲイン符号及び前記ピッチラグ符号を出力するステップを有している。
上記本発明の音声符号変換方法において、第1音声符号のレートがフルレートの場合、フルレート用の音声符号変換部は、第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号、ピッチラグ符号を求めるステップ、第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求めるステップ、前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生するステップ、第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成するステップ、前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求めるステップ、第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第２音声符号化方式のゲイン符号を求めるステップ、前記求めた第２音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を出力するステップを有している。
本発明の第２の態様は、第1音声符号化方式に基づいて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第２音声符号化方式に基づいた第２音声符号に変換する音声符号変換装置であり、第1音声符号のレートに対応させてフルレート用、ハーフレート用、1/8レート用の音声符号変換部を備え、該1/8レート用の音声符号変換部は、第1音声符号化方式による音声符号に含まれるLSP符号と代数符号帳ゲイン符号を分離してそれぞれを逆量子化して逆量子化値を出力する逆量子化部、逆量子化値のうちLSP符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号を出力するLSP量子化部、音源発生部から出力するランダム信号に前記ゲイン符号の逆量子化値を乗算し、乗算結果をLSP符号の逆量子化値で構成されるLPC合成フィルタに入力してターゲット信号を発生するターゲット生成部、第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求める代数符号取得部、第2音声符号の前記LSP符号の逆量子化値、フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第２音声符号化方式のゲイン符号を求めるゲイン符号取得部、前記求めた第２音声符号化方式におけるLSP符号、代数符号、ゲイン符号及び前記ピッチラグ符号を多重して出力する符号多重部を有している。
上記本発明の音声符号変換装置において、前記フルレート用の音声符号変換部は、第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号、ピッチラグ符号を求める逆量子化部、第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求めるピッチゲイン補間部、前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生するターゲット生成部、第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求める代数符号取得部、第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第２音声符号化方式のゲイン符号を求めるゲイン符号取得部、前記求めた第２音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を多重して出力する符号多重部を有している。

本発明によれば、サブフレーム長の異なる音声符号化方式間であっても音声符号変換を行なうことができ、また、音質劣化を少なくでき、しかも、遅延時間を小さくできる。
また、本発明によれば、EVRCのレートに応じた符号変換を行なうことができる。

（A）本発明の概略
図１は本発明の音声符号変換装置の原理説明図であり、符号化方式１（G.729A）の音声符号CODE1を符号化方式２（EVRC）の音声符号CODE2に変換する場合の音声符号変換装置の原理構成を示している。
本発明は、LSP符号、ピッチラグ符号、ピッチゲイン符号を従来技術２と同様に量子化パラメータ領域において符号化方式1から符号化方式2に符号変換し、かつ、再生音声とピッチ周期性合成信号とからターゲット信号を作成し、該ターゲット信号と代数合成信号との誤差が最小になるように代数符号、代数符号帳ゲインを求める。これにより、符号化方式1から符号化方式2に変換する点に特徴がある。図に従って、変換手順の詳細を説明すると以下の通りである。

符号分離部101は符号化方式１（G.729A）の音声符号CODE１が入力すると該音声符号CODE1をLSP符号Lsp1、ピッチラグ符号Lag1、ピッチゲイン符号Gain1、代数符号Cb1の各パラメータ符号に分離し、LSP符号変換部102、ピッチラグ変換部103、ピッチゲイン変換部104、音声再生部105に入力する。
LSP符号変換部102はLSP符号Lsp1を符号化方式２のLSP符号Lsp2に変換する。ピッチラグ変換部103はピッチラグ符号Lag1を符号化方式2のピッチラグ符号Lag2に変換する。ピッチゲイン変換部104はピッチゲイン符号Gain1からピッチゲイン逆量子化値を求め、このピッチゲイン逆量子化値を符号化方式２のピッチゲイン符号Gp2に変換する。

音声再生部105は音声符号CODE1の符号成分であるLSP符号Lsp1、ピッチラグ符号Lag1、ピッチゲイン符号Gain1、代数符号Cb1を用いて音声信号Spを再生する。ターゲット作成部106は、音声符号化方式２のLSP符号Lsp2、ピッチラグ符号Lag2、ピッチゲイン符号Gp2から符号化方式２のピッチ周期性合成信号を作成する。しかる後、ターゲット作成部106は再生音声信号Spからピッチ周期性合成信号を差し引いてターゲット信号Targetを作成する。
代数符号変換部107は音声符号化方式２における任意の代数符号と音声符号化方式２のLSP符号Lsp2の逆量子化値を用いて代数合成信号を生成し、ターゲット信号Targetと該代数合成信号との差が最小となる音声符号化方式２の代数符号Cb2を決定する。

代数符号帳ゲイン変換部108は、音声符号化方式２の前記代数符号Cb2に応じた代数符号帳出力信号をLSP符号Lsp2の逆量子化値で構成されたLPC合成フィルタに入力して代数合成信号を作成し、該代数合成信号と前記ターゲット信号とから代数符号帳ゲインを決定し、該代数符号帳ゲインを符号化方式2の量子化テーブルを用いて代数符号帳ゲイン符号を発生する。
符号多重部109は以上により求まった符号化方式2のLSP符号Lsp2、ピッチラグ符号Lag2、ピッチゲイン符号Gp2、代数符号Cb2、代数符号帳ゲイン符号Gc2を多重化して符号化方式２の音声符号CODE2として出力する。

（B）第1実施例
図２は本発明の第1実施例の音声符号変換装置の構成図であり、図1の原理図と同一部分には同一符号を付している。本実施例では、音声符号化方式１としてG.729Aを用い、音声符号化方式２としてEVRCを用いる場合を示している。また、EVRCにはフルレート、ハーフレート、1/8レートの３種類のモードが存在するが、ここではフルレートのみを用いることとする。
G.729Aのフレーム長は10msecであり、EVRCのフレーム長が20msecであることから、G.729Aの２フレーム分の音声符号をEVRCの１フレーム分の音声符号に変換する。以下では、図３(a)に示すG.729Aの第nフレーム及び第n+1フレームの音声符号を、図3(b)に示すEVRCの第mフレームの音声符号に変換する場合について説明する。

図2において、G.729Aの符号器（図示せず）から伝送路を介して第nフレーム目の音声符号（回線データ）CODE1(n)が端子＃１に入力する。符号分離部101は、音声符号CODE1(n)からLSP符号Lsp1(n)、ピッチラグ符号Lag1(n, j)、ゲイン符号Gain1(n, j)、代数符号Cb1(n, j)を分離して各変換部102,103,104及び代数符号逆量子化部110に入力する。ここで、括弧内の添字jはサブフレームの番号を表し(図3(a)参照)、0または１の値を取る。
LSP符号変換部102はLSP逆器量子化部102aとLSP量子化部102bを有している。前述のようにG.729Aのフレーム長は10msecであり、G.729A符号器は10msecに1回だけ第１サブフレームの入力信号から求めたLSPパラメータを量子化する。これに対し、EVRCのフレーム長は20msecであり、EVRC符号器は20msecに1回だけ第２サブフレーム及び先読み部分の入力信号から求めたLSPパラメータを量子化する。つまり、同じ20msecを単位として考えると、G.729A符号器は２回のLSP量子化を行うのに対してEVRC符号器は１回しか量子化を行わない。このため、G.729の連続する２つのフレームのLSP符号をそのままではEVRCのLSP符号に変換することはできない。

そこで、第1実施例では、G.729Aの奇数フレーム(第(n+1)フレーム)におけるLSP符号のみをEVRCのLSP符号に変換し、偶数フレーム（第nフレーム）のLSP符号は変換しない構成とした。ただし、偶数フレームのLSP符号をEVRCのLSP符号に変換し、奇数フレームのLSP符号を変換しないようにすることもできる。
LSP逆量子化部102aは、LSP符号Lsp1(n)が入力されると該符号を逆量子化してLSP逆量子化値lsp1を出力する。ここで、lsp1は10個の係数からなるベクトルである。又、LSP逆量子化部102aはG.729Aの復号器において用いられる逆量子化器と同じ動作をする。

LSP量子化部102bに奇数フレームのLSP逆量子化値lsp1が入力されると、該LSP量子化部102bはEVRCのLSP量子化方法に従って量子化してLSP符号Lsp2(m)を出力する。ここで、LSP量子化部102bはEVRC符号器において用いられる量子化器と必ずしも全く同じものである必要はないが、少なくともLSP量子化テーブルはEVRCの量子化テーブルと同一のテーブルを用いるものとする。尚、偶数フレームのLSP逆量子化値はLSP符号変換には用いられない。また、LSP逆量子化値lsp1は後述する音声再生部105においてLPC合成フィルタの係数として用いられる。
ついで、LSP量子化部102bは変換されたLSP符号Lsp2(m)を復号して得られるLSP逆量子化値と、前フレームのLSP符号Lsp2(m-1)を復号して得られるLSP逆量子化値とから線形補間により現フレーム内の３つのサブフレームにおけるLSPパラメータlsp2(k)、(k=0,1,2)を求める。lsp2(k)は後述するターゲット生成部106等で用いられる。lsp2(k)は10次元のベクトルである。

ピッチラグ変換部103は、ピッチラグ逆器量子化部103aとピッチラグ量子化部103bを有している。G.729Aでは5msecのサブフレームごとにピッチラグを量子化する。一方、EVRCでは１フレームに1回だけピッチラグを量子化する。20msecを単位として考えるとG.729Aは４つのピッチラグを量子化するのに対して、EVRCは１つのピッチラグのみを量子化する。したがって、G.729Aの音声符号をEVRCの音声符号へ変換する場合には、G.729Aの全てのピッチラグをEVRCのピッチラグに変換することはできない。
そこで、第1実施例では、G.729Aの第n+1フレームの最終サブフレーム（第１サブレーム）におけるピッチラグ符号Lag1(n+1,1)をG.729Aのピッチラグ逆量子化部103aにより逆量子化してピッチラグlag1を求め、このlag1をEVRCのピッチラグ量子化部103bにより量子化して第mフレーム第2サブフレームにおけるピッチラグ符号Lag2(m)とする。また、ピッチラグ量子化部103bはEVRC符号器・復号器と同じ方法によりピッチラグの補間をする。すなわち、Lag2(m)を逆量子化して得られる第2サブフレームのピッチラグ逆量子化値と、前フレームの第2サブフレームのピッチラグ逆量子化値との線形補間により各サブフレームのピッチラグ補間値lag2(k), (k=0,1,2)を求める。ピッチラグ補間値は後述するターゲット生成部106で使用される。

ピッチゲイン変換部104は、ピッチゲイン逆器量子化部104aとピッチゲイン量子化部104bを有している。G.729Aでは5msecのサブフレーム毎にピッチゲインを量子化するから、20msecを単位として考えるとG.729Aは１フレームに４つのピッチゲインを量子化する。一方、EVRCは１フレームに3つのピッチゲインを量子化する。したがって、G.729Aの音声符号をEVRCの音声符号へ変換する場合には、G.729Aの全てのピッチゲインをEVRCのピッチゲインに変換することはできない。そこで、第1実施例では図４に示す方法によりゲインの変換を行う。すなわち、G.729Aの連続する２つのフレームのピッチゲインをgp1(0)、gp1(1)、gp1(2)、gp1(3)とし、次式
gp2(0) = gp1(0)
gp2(1) = (gp1(1) + gp1(2)) / 2
gp2(2) = gp1(3)
によりピッチゲインを合成する。合成されたピッチゲインgp2(k)(k=0,1,2)をそれぞれEVRCのピッチゲイン量子化テーブルを用いてスカラー量子化し、ピッチゲイン符号Gp2(m,k)を求める。ピッチゲインgp2(k)(k=0,1,2)は後述するターゲット生成部106で使用される。

代数符号逆量子化部110は代数符号Cb(n,j)を逆量子化し、得られた代数符号逆量子化値cb1(j)を音声再生部105に入力する。
音声再生部105は、第nフレームにおけるG.729Aの再生音声Sp(n，h)と、第n+1フレームにおけるG.729Aの再生音声Sp(n+1，h)を作成する。なお、再生音声の作成方法はG.729Aの復号器の動作と同じであり、従来技術の項で説明済みであり、ここでは説明を省略する。再生音声Sp(n，h)とSp(n+1，h)の次元数はG.729Aのフレーム長と同じ80サンプルであり（h＝１〜80）、合わせて160サンプルとなりEVRCの1フレーム当たりのサンプル数になる。音声再生部105は、作成した再生音声Sp(n，h)，Sp(n+1，h)を図５に示すようにSp (0，i)、Sp(1，i)、Sp(2，i)の３つのベクトルに分割して出力する。ｉはEVRCの第0、1サブフレームでは１〜53、第2サブフレームでは１〜54である。

ターゲット生成部106は、代数符号変換部107及び代数符号長ゲイン変換部108で参照信号として用いられるターゲット信号Target(k、I)を作成する。図６はターゲット生成部106の構成図である。適応符号帳106aは、ピッチラグ符号変換部103で求めたピッチラグlag2(k)に対応するN個のサンプル信号acb(k，i)(i=0〜N-1)を出力する。ここで、kはEVRCのサブフレーム番号、NはEVRCのサブフレーム長であり、第0、1サブフレームでは53、第2サブフレームでは54である。以下、特に断らない限り添字iは53又は54である。尚、106eは適応符号帳更新部である。

ゲイン乗算部106bは適応符号帳出力acb(k，i)にピッチゲインgp2(k)を乗算してLPC合成フィルタ106cに入力する。LPC合成フィルタ106cは、LSP符号の逆量子化値lsp2(k)で構成されており、適応符号帳合成信号syn(k，i)を出力する。演算部106dは、3分割された再生信号Sp(k，i)から適応符号帳合成信号syn(k，i)を差し引いてターゲット信号Target(k，i)を求める。Target(k，i)は後述する代数符号変換部107及び代数符号帳ゲイン変換部108で使用される。

代数符号変換部107は、EVRCの代数符号探索と全く同じ処理を行う。図7は代数符号変換部107の構成図である。代数符号帳107aは、表３に示したパルス位置・極性の組み合わせでできる任意のパルス性音源信号を出力する。すなわち、代数符号帳107aは誤差評価部107bから所定の代数符号に応じたパルス性音源信号の出力が指示されると、該指示された代数符号に応じたパルス性音源信号をLPC合成フィルタ107cに入力する。LSP符号の逆量子化値lsp2(k)で構成されるLPC合成フィルタ107cは、代数符号帳出力信号が入力すると代数合成信号alg(k，i)を作成して出力する。誤差評価部107bは、代数合成信号alg(k，i)とターゲット信号Target(k，i)の相互相関値Rcx、代数合成信号の自己相関値Rccを計算し、Rcxの２乗をRccで正規化して得られる正規化相互相関値Rcx・Rcx/Rccが最も大きくなる代数符号Cb2(m，k)を探索して出力する。

代数符号帳ゲイン変換部108は図8に示す構成を備えている。代数符号帳108aは代数符号変換部107で得られた代数符号Cb2(m, k)に対応するパルス性音源信号を発生してLPC合成フィルタ108bに入力する。LSP符号の逆量子化値lsp2(k)で構成されるLPC合成フィルタ108bは、代数符号帳出力信号が入力すると代数合成信号gan(k，i)を作成して出力する。代数符号帳ゲイン算出部108cは、代数合成信号gan(k，i)とターゲット信号Target(k，i)との相互相関値Rcx、代数合成信号の自己相関値Rccを求め、しかる後、RcxをRccで正規化して代数符号帳ゲインgc2(k)（=Rcx/Rcc）を求める。代数符号帳ゲイン量子化部108dは代数符号帳ゲインgc(k)2をEVRCの代数符号帳ゲイン量子化テーブル108eを使ってスカラー量子化する。EVRCでは代数符号帳ゲインの量子化ビットとして１サブフレーム当たり5bit（３２パタン）を割り当てている。したがって、この３２通りのテーブル値の中からgc2(k)に最も近いテーブル値を探し、その時のインデックス値を変換された代数符号帳ゲイン符号Gc2(m, k)とする。

EVRCの１つのサブフレームについてピッチラグ符号、ピッチゲイン符号、代数符号、代数符号帳ゲイン符号の変換が終った後に、適応符号帳106a(図6)の更新を行う。初期状態では適応符号帳106aには全て振幅０の信号が格納されている。サブフレームの変換処理が終ると、図6の適応符号帳更新部106eは適応符号帳内で時間的に最も古い信号をサブフレーム長さだけ捨て、残りの信号をサブフレーム長だけシフトし、変換直後の最新の音源信号を適応符号帳内に格納する。ここで最新の音源信号とは、変換後のピッチラグ符号lag2(k)、ピッチゲインgp2(k)に応じた周期性音源信号と、代数符号Cb2(m,k)、代数符号帳ゲインgc2(k)に応じた雑音性音源信号を合成した音源信号である。
以上により、EVRCのLSP符号Lsp2(m)、ピッチラグ符号Lag2(m)、ピッチゲイン符号Gp2(m,k)、代数符号Cb2(m，k)、代数符号帳ゲイン符号Gc2(m，k)が求まれば、符号多重部109はこれらの符号を多重して一つにまとめて符号化方式２の音声符号CODE2(m)として出力する。

第1実施例では、LSP符号、ピッチラグ符号、ピッチゲイン符号を量子化パラメータ領域で符号変換しているため、再生音声を再度LPC分析、ピッチ分析する場合に比べて分析誤差が小さく、音質劣化の少ないパラメータ変換が可能である。また、再生音声を再度LPC分析、ピッチ分析しないため、従来技術１で問題となっていた符号変換による遅延の問題を解決することができる。
一方、代数符号、代数符号帳ゲイン符号については、再生音声からターゲット信号を作成し、ターゲット信号との誤差が最小になるように変換することにより、従来技術２で問題となっていた符号化方式１と符号化方式２の代数符号帳の構成が大きく異なっている場合でも音質劣化の少ない符号変換が可能である。

（C）第2実施例
図９は本発明の第2実施例の音声符号変換装置の構成図であり、図2の第1実施例と同一部分には同一符号を付している。第2実施例において第1実施例と異なる点は、（1）第1実施例の代数符号帳ゲイン変換部108を除去し、替わって代数符号帳ゲイン量子化部１１０を設けた点、（2）LSP符号、ピッチラグ符号、ピッチゲイン符号に加えて、代数符号帳ゲイン符号も量子化パラメータ領域で符号変換する点である。

第2実施例において、代数符号帳ゲイン符号の変換方法だけが第1実施例と異なる。以下、第2実施例の代数符号帳ゲイン符号の変換方法を説明する。
G.729Aでは5msecのサブフレーム毎に代数符号帳ゲインを量子化するから、20msecを単位として考えるとG.729Aは１フレームに４つの代数符号帳ゲインを量子化する。一方、EVRCは１フレームに3つの代数符号帳ゲインを量子化する。したがって、G.729Aの音声符号をEVRCの音声符号へ変換する場合には、G.729Aの全ての代数符号帳ゲインをEVRCの代数符号帳ゲインに変換することはできない。そこで、第２実施例では図１０に示す方法によりゲインの変換を行う。すなわち、G.729Aの連続する２つのフレームの代数符号帳ゲインをgc1(0)、gc1(1)、gc1(2)、gc1(3)とし、次式
gc2(0) ＝ gc1(0)
gc2(1) ＝ (gc1(1) + gc1(2)) / 2
gc2(2) ＝ gc1(3)
により代数符号帳ゲインを合成する。合成された代数符号帳ゲインgc2(k)(k=0,1,2)をそれぞれEVRCの代数符号帳ゲイン量子化テーブルを用いてスカラー量子化し、代数符号帳ゲイン符号Gc2(m,k)を求める。

第2実施例では、LSP符号、ピッチラグ符号、ピッチゲイン符号、代数符号帳ゲイン符号を量子化パラメータ領域で符号変換しているため、再生音声を再度LPC分析、ピッチ分析する場合に比べて分析誤差が小さく、音質劣化の少ないパラメータ変換が可能である。また、再生音声を再度LPC分析、ピッチ分析しないため、従来技術１で問題となっていた符号変換による遅延の問題を解決することができる。
一方、代数符号については、再生音声からターゲット信号を作成し、ターゲット信号との誤差が最小になるように変換することにより、従来技術２で問題となっていた符号化方式１と符号化方式２の代数符号帳の構成が大きく異なっている場合でも音質劣化の少ない符号変換が可能である。

（D）第3実施例
図11は第3実施例の音声符号変換装置の全体構成図である。第3実施例はEVRCの音声符号をG.729Aの音声符号に変換する場合の例を示している。図11において、レート判定部201は、EVRC符号器より音声符号が入力すると、EVRCのレートを判別する。EVRC音声符号の中にフルレート、ハーフレート、1/8レートの何れであるかを示すレート情報が含まれているから、レート判定部201はこの情報を用いてEVRCのレートを判別する。そして、レート判定部201はレートに応じてスイッチS1、S2を切り替え、EVRC音声符号を選択的に所定のレート用音声符号変換部202,203,204に入力し、かつ、該レート用音声符号変換部から出力されるG.729Aの音声符号をG.729A復号器側に送出する。

・フルレート用音声符号変換部
図12はフルレート用音声符号変換部２０２の構成図である。EVRCのフレーム長は20msecであり、G.729Aのフレーム長は10msecであるため、EVRCの１フレーム（第mフレーム）の音声符号をG.729Aの２フレーム（第n, n+1フレーム）の音声符号に変換する。
EVRCの符号器（図示せず）から伝送路を介して第ｍフレーム目の音声符号（回線データ）CODE1(m)が端子＃１に入力する。符号分離部301は、音声符号CODE1(m)からLSP符号Lsp1(m)、ピッチラグ符号Lag1(m)、ピッチゲイン符号Gp1(m, k)、代数符号Cb1(m, k)、代数符号帳ゲイン符号Gc1(m, k)を分離して各逆量子化部302〜306に入力する。ここで、ｋはEVRCのサブフレーム番号であり、0、１，２の何れかの値を取る。

LSP逆量子化部302は、サブフレーム番号2のLSP符号Lsp1(m)の逆量子化値lsp1(m，2)を求める。なお、LSP逆量子化部302はEVRC復号器と同じ量子化テーブルを用いるものとする。次に、LSP逆量子化部302は、前フレーム（第m-1フレーム）で同様にして求めたサブフレーム番号2の逆量子化値lsp1(m-1，2)と前記逆量子化値lsp1(m，2)を用いて線形補間によりサブフレーム番号0,1の逆量子化値lsp1(m，0)とlsp1(m，1)を求め、サブフレーム番号1の逆量子化値lsp1(m, 1)をLSP量子化部307に入力する。LSP量子化部307は、符号化方式2(G.729A)の量子化テーブルを用いて逆量子化値lsp1(m，1)を量子化して符号化方式2のLSP符号Lsp2(n)を求めると共にそのLSP逆量子化値lsp2(n，1)を求める。同様にして、LSP逆量子化部302は、サブフレーム番号２の逆量子化値lsp1(m，2)をLSP量子化部307に入力し、符号化方式2のLSP符号Lsp2(n+1)とそのLSP逆量子化値lsp2(n+1，1)を求める。ここで、LSP量子化部302はG.729Aと同じ量子化テーブルを用いるものとする。
ついで、LSP量子化部307は前フレーム（第n-1フレーム）で求めた逆量子化値lsp2(n-1,1)と現フレームの逆量子化値lsp2(n，1)との線形補間によりサブフレーム番号0の逆量子化値lsp2(n，0)を求める。また、逆量子化値lsp2(n，1)と逆量子化値lsp2(n+1，1)との線形補間によりサブフレーム0の逆量子化値lsp2(n+1，0)を求める。これら逆量子化値lsp2(n，j)はターゲット信号の作成や代数符号、ゲイン符号の変換に使用される。

ピッチラグ逆量子化部303はサブフレーム番号２のピッチラグ符号Lag1(m)の逆量子化値lag1(m, 2)を求め、この逆量子化値lag1(m, 2)と第m-1フレームで求めたサブフレーム番号2の逆量子化値lag(m-1, 2)の線形補間によりサブフレーム番号0,1の逆量子化値lag1(m, 0)，lag1(m, 1)を求める。次に、ピッチラグ逆量子化部303は逆量子化値lag1(m, 1)をピッチラグ量子化部308に入力し、ピッチラグ量子化部308は符号化方式2(G.729A)の量子化テーブルを用いて逆量子化値lag1(m,1)に対応する符号化方式2のピッチラグ符号Lag2(n)を求めると共にその逆量子化値lag2(n,1)を求める。同様にして、ピッチラグ逆量子化部303は逆量子化値lag1(m, 2)をピッチラグ量子化部308に入力し、ピッチラグ量子化部308はピッチラグ符号Lag2(n+1)を求めると共にその逆量子化値lag2(n+1, 1)を求める。ここで、ピッチラグ量子化部308はG.729Aと同じ量子化テーブルを用いる。

ついで、ピッチラグ量子化部308は前フレーム（第n-1フレーム）で求めた逆量子化値lag2(n-1,1)と現フレームの逆量子化値lag2(n,1)との線形補間によりサブフレーム0の逆量子化値lag2(n, 0)を求める。また、逆量子化値lag2(n, 1)と逆量子化値lag2(n+1, 1)との線形補間によりサブフレーム0の逆量子化値lag2(n+1，0)を求める。これら逆量子化値lag2(n，j)はターゲット信号の作成やゲイン符号の変換に使用される。
ピッチゲイン逆量子化部304はEVRCの第mフレームの３つのピッチゲイン符号Gp1(m, k) (k=0,1,2)の逆量子化値gp1(m, k)を求め、ピッチゲイン補間部309に入力する。ピッチゲイン補間部309は逆量子化値gp1(m, k)を用いて、符号化方式2(G.729A)のピッチゲイン逆量子化値gp2(n, j)(j＝0,1)、gp2(n+1, j)(j＝0,1)を次式
(1) gp2(n, 0) ＝ gp1(m, 0)
(2) gp2(n, 1) ＝ (gp1(m, 0) + gp1(m,1)) / 2
(3) gp2(n+1, 0) ＝ (gp1(m, 1) + gp1(m, 2)) / 2
(4) gp2(n+1, 1) ＝ gp1(m, 2)
により補間して求める。尚、ゲイン符号変換の際にピッチゲイン逆量子化値gp2(n, j)は、直接必要でないが、ターゲット信号の生成に使用する。

音声再生部310はEVRCの各符号の逆量子化値lsp1(m, k)、lag1(m, k)、gp1(m,k)、cb1(m, k)、gc1(m, k)を入力されて、第ｍフレームにおけるトータル160サンプルのEVRCの再生音声SP(k,i)を作成し、これら再生信号を80サンプルづつの2つのG.729Aの再生信号Sp(n,h)，Sp(n+1,h)に分割して出力する。ここで、再生音声の作成方法はEVRCの復号器と同じで周知であるので説明を省略する。
ターゲット生成部311は第1実施例のターゲット生成部（図6参照）と同様な構成を備えており、代数符号変換部312と代数符号帳ゲイン変換部313で用いるターゲット信号Target(n,h)，Target(n+1,h)を作成する。すなわち、ターゲット生成部311は、まず、ピッチラグ量子化部308で求めたピッチラグlag2(n, j)に対応する適応符号帳出力を求め、これにピッチゲインgp2(n, j)を乗じて音源信号を作成する。次に、該音源信号をLSP逆量子化値lsp2(n, j)で構成されるLPC合成フィルタに入力して適応符号帳合成信号syn(n,h)を作成する。しかる後、音声再生部310で作成した再生音声Sp(n,h)から適応符号帳合成信号syn(n,h)を差し引いてターゲット信号Target(n,h)を求める。同様にして、第n+1フレーム目のターゲット信号Target(n+1,h)を作成する。

代数符号変換部312は第1実施例の代数符号変換部(図7参照)と同様の構成を備え、G.729Aの代数符号帳探索と全く同じ処理を行う。まず、図１８に示したパルス位置・極性の組合せでできる代数符号帳出信号をLSP逆量子化値lsp2(n, j)で構成されるLPC合成フィルタに入力して代数合成信号を作成する。次に、前記代数合成信号とターゲット信号の相互相関値Rcxと、代数合成信号の自己相関値Rccを計算し、Rcxの２乗をRccで正規化して得られる正規化相互相関値Rcx・Rcx/Rccが最も大きくなる代数符号Cb2(n, j)を探索する。同様にして代数符号Cb2(n+1,j)を求める。

ゲイン変換部313はターゲット信号Target(n,h)、ピッチラグlag2(n, j)、代数符号Cb2(n, j)、LSP逆量子化値lsp2(n, j)を用いてゲイン変換を行う。変換方法はG.729Aの符号器におけるゲイン量子化と同じである。手順を以下に示す。
(1) G.729のゲイン量子化テーブルの中から一組のテーブル値（ピッチゲイン、代数符号帳ゲインの補正係数γ）を取り出す。
(2) 適応符号帳出力に前記ピッチゲインのテーブル値を乗じて信号Xを作成する。
(3) 代数符号帳出力に、前記補正係数γとゲイン予測値g′を乗じて信号Yを作成する。
(4) 信号Xと信号Yを加算して得られる信号を、LSP逆量子化値lsp2(n, j)で構成されるLPC合成フィルタに入力して合成信号Zを作成する。
(5) ターゲット信号と合成信号Zの誤差電力Eを計算する。
(6) (1)〜(5)の処理をゲイン量子化テーブルの全てのテーブル値について行い、誤差電力Eが最小となるテーブル値を決定し、そのインデックスをゲイン符号Gain2(n, j)とする。同様にして、ターゲット信号Target(n+1,h)とピッチラグlag2(n+1, j)、代数符号Cb2(n+1, j)、LSP逆量子化値lsp2(n+1, j)からゲイン符号Gain2(n+1, j)を求める。

しかる後、符号多重部314はLSP符号Lsp2(n)、ピッチラグ符号Lag2(n)、代数符号Cb2(n, j)、ゲイン符号Gain2(n, j)を多重してG.729Aの第nフレームにおける音声符号CODE2(n)を出力する。また、符号多重部314は、LSP符号Lsp2(n+1)、ピッチラグ符号Lag2(n+1)、代数符号Cb2(n+1, j)、ゲイン符号Gain2(n+1, j)を多重してG.729Aの第n+1フレームにおける音声符号CODE2(n+1)を出力する。以上の説明の通り、第3実施例によれば、EVRC(フルレート)の音声符号をG.729Aの音声符号に変換することができる。

・ハーフレート用音声符号変換部
フルレートとハーフレートの符号器・復号器は、各量子化テーブルの大きさが異なるだけであり、その構成はほぼ同じである。したがって、ハーフレート用の音声符号変換部203も、前述したフルレート用の音声符号変換部202と同様に構成でき、同様にハーフレートの音声符号をG.729Aの音声符号に変換することができる。

・1/8レート用の音声符号変換部
図13は、1/8レート用の音声符号変換部204の構成図である。1/8レートは無音部や背景雑音部などの非音声区間に用いられる。又、1/8レートで伝送する情報はLSP符号(8bit/フレーム)とゲイン符号(8bit/フレーム)の計16bitであり、音源信号は符号器・復号器の内部でランダム発生させるため伝送しない。
図13において、符号分離部401はEVRC(1/8レート)の第ｍフレームにおける音声符号CODE1(m)が入力すると、LSP符号Lsp1(m)とゲイン符号Gc1(m)を分離する。LSP逆量子化部402及びLSP量子化部403は図12のフルレートの場合と同様にEVRCのLSP符号Lsp1(m)をG.729AのLSP符号Lsp2(n)に変換する。尚、LSP逆量子化部402はLSP符号逆量子化値lsp1(m, k)を求め、LSP量子化部403はG.729AのLSP符号Lsp2(n)を出力すると共にLSP符号逆量子化値lsp2(n, j)を求める。

ゲイン逆量子化部404はゲイン符号Gc1(m)のゲイン逆量子化値gc1(m, k)を求める。尚、1/8レートでは雑音性音源信号に対するゲインのみが使用され、周期性音源に対するゲイン（ピッチゲイン）は使用しない。
1/8レートでは音源信号を符号器・復号器の内部でランダム発生させて使用している。そこで、1/8レート用音声符号変換部においても、音源発生部405はEVRC符号器・復号器と同様にランダム信号を発生し、該ランダム信号の振幅がガウス分布になるように調節した信号を音源信号Cb1(m, k)として出力する。尚、ランダム信号の発生方法、ガウス分布への調節方法についてはEVRCと同様の方法を用いる。

ゲイン乗算部406は音源信号Cb1(m, k)にゲイン逆量子化値gc1(m, k)を乗算してLPC合成フィルタに入力してターゲット信号Target(n,h)，Target(n+1,h)を作成する。なお、LPC合成フィルタ407はLSP符号逆量子化値lsp1(m, k)で構成される。
代数符号変換部408は図12のフルレートの場合と同様にして代数符号変換を行い、G.729Aの代数符号Cb2(n, j)を出力する。
EVRCの1/8レートは、無音部や雑音部などの周期性のほとんどない非音声区間に対して用いられるためピッチラグ符号が存在しない。そこで、以下の方法によりG.729A用のピッチラグ符号を生成する。1/8レートの音声符号変換機204は、フルレートあるいはハーフレートの音声符号変換部202,203のピッチラグ変換部303,308で得られたG.729A用のピッチラグ符号を取り出し、ピッチラグバッファ409に格納する。そして、現フレーム（第nフレーム）で1/8レートが選択されると該ピッチラグバッファ409内のピッチラグ符号Lag2(n, j)を出力する。ただし、ピッチラグバッファの記憶内容は変更しない。一方、現フレームで1/8レートが選択されなかった場合は、選択されたレート（フルレート又はハーフレート）の音声符号変換部202,203のピッチラグ変換部303,308で得られたG.729A用のピッチラグ符号がバッファ409に格納される。

ゲイン変換部410は図12のフルレートの場合と同様にしてゲイン符号変換を行ってゲイン符号Gc2(n, j)を出力する。
しかる後、符号多重部411はLSP符号Lsp2(n)、ピッチラグ符号Lag2(n)、代数符号Cb2(n, j)、ゲイン符号Gain2(n, j)を多重してG.729Aの第nフレームにおける音声符号CODE2(n)を出力する。また、符号多重部411は、LSP符号Lsp2(n+1)、ピッチラグ符号Lag2(n+1)、代数符号Cb2(n+1, j)、ゲイン符号Gain2(n+1, j)を多重してG.729Aの第n+1フレームにおける音声符号CODE2(n+1)を出力する。以上の説明の通り、EVRC(1/8レート)の音声符号をG.729Aの音声符号に変換することができる。

（E）第4実施例
図14は第4実施例の音声符号変換装置の構成図であり、音声符号に回線誤りが発生しても対応できるようになっており、図2の第1実施例と同一符号を付している。異なる点は、（1）回線誤り検出部501が設けられている点、（2）LSP逆量子化部102a、ピッチラグ逆量子化部103a、ゲイン逆量子化部104a、代数符号逆量子化部110の替わりにLSP符号修正部511、ピッチラグ修正部512、ゲイン符号修正部513、代数符号修正部514が設けられている点である。

入力音声xinが符号化方式１(G.729A)の符号器500へ入力されると、符号器500は符号化方式１の音声符号sp1を発生する。音声符号sp1は、無線回線又は有線回線(インターネット等)の伝送路502を通って音声符号変換装置へ入力する。ここで、音声符号変換装置に入力される前に回線誤りERRが混入すると、音声符号sp1は回線誤りの入った音声符号sp′に変形される。回線誤りERRのパターンはシステムに依存し、ランダムビット誤り、バースト性誤りなどの様々なパターンを取りえる。尚、誤りが混入しない場合にはsp1′とsp1は全く同じ符号となる。音声符号sp1′は符号分離部101へ入力され、LSP符号Lsp1(n)、ピッチラグ符号Lag1(n,j)、代数符号Cbi(n,j)、ゲイン符号Gain1(n,j)に分離される。又、音声符号sp1′は回線誤り検出部501に入力し、周知の方法で回線誤りの有無が検出される。たとえば音声符号sp1にCRC符号を付加しておくことにより回線誤りを検出することができる。

LSP修正部511は誤りのないLSP符号Lsp1(n)が入力すると、第1実施例のLSP逆量子化部102aと同一の処理を行なってLSP逆量子化値lsp1を出力する。一方、回線誤りやフレーム消失により現フレームの正しいLsp符号を受信できない場合に最後に受信した良好な過去4フレームのLsp符号を用いてLSP逆量子化値lsp1を出力する。
ピッチラグ修正部512は、回線誤りやフレーム消失しなければ、受信した現フレームのピッチラグ符号の逆量子化値lag1を出力する。また、回線誤りやフレーム消失があれば、最後に受信した良好なフレームのピッチラグ符号の逆量子化値を出力する。一般的に、有声部ではピッチラグが滑らかに変化することが知られている。したがって、有声部では上記のように前フレームのピッチラグで代用させても音質上の劣化はほとんどない。また、無声部では、ピッチラグは大きく変化することが知られているが、無声部における適応符号帳の寄与率は小さい(ピッチゲインが小さい)ため、前述の方法による音質劣化はほとんどない。

ゲイン符号修正部513は、回線誤りやフレーム消失がない場合、第１実施例と同様に、受信した現フレームのゲイン符号Gain1(n,j)からピッチゲインgp1(j)と代数符号帳ゲインgc1(j)を求める。一方、回線誤りやフレーム消失がある場合には、現フレームのゲイン符号を用いることができないので、次式
gp1(n,0) =α・gp1(n-1,1)
gp1(n,1) =α・gp1(n-1,0)
gc1(n,0) =β・gc1(n-1,1)
gc1(n,1) =β・gc1(n-1,0)
により記憶してある1サブフレーム前のゲインを減衰してピッチゲインgp1(n,j)と代数符号帳ゲインgc1(n,j)を求めて出力する。ここでα、βは１以下の定数である。

代数符号修正部514は、回線誤りやフレーム消失がない場合、受信した現フレームの代数符号Cb1(n,j)の逆量子化値cbi(j)を出力する。また、回線誤りやフレーム消失があった場合には、記憶してある最後に受信した良好なフレームの代数符号の逆量子化値を出力する。

・付記
(付記１)第1音声符号化方式により符号化して得られる音声符号を第２音声符号化方式の音声符号に変換する音声符号変換方法において、
第1音声符号化方式による音声符号より、音声信号を再現するために必要な複数の符号成分を分離し、
各成分の符号をそれぞれ逆量子化して逆量子化値を出力し、
代数符号以外の符号成分の前記逆量子化値を量子化して第２音声符号化方式の音声符号の符号成分に変換し、
前記各逆量子化値から音声を再生し、
前記第２音声符号化方式の各符号成分を逆量子化して第２音声符号化方式の逆量子化値を求め、
前記再生音声と、前記第２音声符号化方式の各逆量子化値を用いてターゲット信号を生成し、
前記ターゲット信号を用いて第2音声符号化方式の代数符号を求め、
前記第２音声符号化方式の各符号成分を音声符号として出力する、
ことを特徴とする音声符号変換方法。
（付記２）伝送路誤り発生の有無を検出し、
伝送路誤りが発生していなければ前記分離された符号成分を使用し、伝送路誤りが発生していれば過去の正常な符号成分を用いて前記逆量子化値を出力する、ことを特徴とする付記1記載の音声符号変換方法。
(付記３）第1音声符号化方式に基いて音声信号をLSP符号、ピッチラグ符号、代数符号、ゲイン符号で符号化した第1音声符号を、第２音声符号化方式に基いた第２音声符号に変換する音声符号変換方法において、
第1音声符号のLSP符号、ピッチラグ符号、ゲイン符号を逆量子化し、これらの逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号、ピッチラグ符号、ゲイン符号を求め、
前記第２音声符号化方式のLSP符号、ピッチラグ符号、ゲイン符号の逆量子化値を用いてピッチ周期性合成信号を生成すると共に第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生し、
第２音声符号化方式における任意の代数符号と前記第2音声符号を構成するLSP符号の逆量子化値とを用いて代数合成信号を生成し、
前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求め、
第２音声符号化方式における前記LSP符号、ピッチラグ符号、代数符号、ゲイン符号を出力する、
ことを特徴とする音声符号変換方法。
（付記４）第2音声符号化方式の前記ピッチラグ符号の逆量子化値に応じた適応符号帳出力信号に、第2音声符号化方式の前記ゲイン符号に応じたゲインを掛けて得られた信号を、第2音声符号化方式の前記LSP符号の逆量子化値に基いたLPC合成フィルタに入力し、その出力信号を前記ピッチ周期性合成信号とする、
ことを特徴とする付記３記載の音声符号変換方法。
（付記５）第2音声符号化方式の前記任意の代数符号に応じた代数符号帳出力信号を第2音声符号化方式の前記LSP符号の逆量子化値に基いたLPC合成フィルタに入力し、その出力信号を前記代数合成信号とする、
ことを特徴とする付記３記載の音声符号変換方法。
（付記６）前記第1音声符号化方式のゲイン符号はピッチゲインと代数符号帳ゲインを組にして符号化したものであり、該ゲイン符号を逆量子化して得られた逆量子化値のうちピッチゲイン逆量子化値を第２音声符号化方式により量子化して第２音声符号のピッチゲイン符号を求める、
ことを特徴とする付記３記載の音声符号変換方法。
（付記７）第2音声符号化方式の前記求めた代数符号に応じた代数符号帳出力信号を第2音声符号化方式の前記LSP符号の逆量子化値に基いたLPC合成フィルタに入力し、
その出力信号と前記ターゲット信号とから代数符号帳ゲインを求め、
該代数符号帳ゲインを量子化して第2音声符号化方式に基いた代数符号帳ゲインを求める、
ことを特徴とする付記６記載の音声符号変換方法。
（付記８）前記第1音声符号化方式のゲイン符号はピッチゲインと代数符号帳ゲインを組にして符号化したものであり、該ゲイン符号を逆量子化して得られたピッチゲイン逆量子化値及び代数符号帳ゲイン逆量子化値をそれぞれ第２音声符号化方式により量子化して第２音声符号のピッチゲイン符号及び代数符号帳ゲイン符号を求める、
ことを特徴とする付記３記載の音声符号変換方法。
(付記９）第1音声符号化方式に基いて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第２音声符号化方式に基いた第２音声符号に変換する音声符号変換方法において、
第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号、ピッチラグ符号を求め、
第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求め、
前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生し、
第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、
前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求め、
第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第２音声符号化方式によりピッチゲインと代数符号帳ゲインを組み合せた第２音声符号のゲイン符号を求め、
前記求めた第２音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を出力する、
ことを特徴とする音声符号変換方法。
(付記１０) 第１音声符号化方式により符号化して得られる音声符号を第２音声符号化方式の音声符号に変換する音声符号変換装置において、
第１音声符号化方式による音声符号より音声信号を再現するために必要な複数の符号成分を分離する符号分離手段、
各成分の符号をそれぞれ逆量子化して逆量子化値を出力する逆量子化部、
前記各逆量子化部から出力する代数符号以外の符号成分の逆量子化値を量子化して第２音声符号化方式の音声符号の符号成分に変換する量子化部、
前記各逆量子化値から音声を再生する音声再生部、
前記第２音声符号化方式の各符号成分を逆量子化して第２音声符号化方式の逆量子化値を求める逆量子化手段、
前記音声再生部から出力される再生音声と、前記第２音声符号化方式の逆量子化手段から出力される各逆量子化値とを用いてターゲット信号を生成するターゲット生成手段、
前記ターゲット信号を用いて第2音声符号化方式の代数符号を求める代数符号取得部、
前記第２音声符号化方式の各符号成分を音声符号として出力する符号多重手段、
を備えたことを特徴とする音声符号変換装置。
(付記１１) 第1音声符号化方式に基いて音声信号をLSP符号、ピッチラグ符号、代数符号、ゲイン符号で符号化した第1音声符号を、第２音声符号化方式に基いた第２音声符号に変換する音声符号変換装置において、
第1音声符号のLSP符号、ピッチラグ符号、ゲイン符号を逆量子化し、これらの逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号、ピッチラグ符号、ゲイン符号に変換する変換部、
前記第1音声符号より音声信号を再生する音声再生部、
前記第２音声符号化方式のLSP符号、ピッチラグ符号、ゲイン符号の逆量子化値を用いてピッチ周期性合成信号を生成し、前記音声再生部で再生した音声信号と該ピッチ周期性合成信号の差信号をターゲット信号として発生するターゲット信号生成部、
第２音声符号化方式における任意の代数符号と、前記第2音声符号のLSP符号の逆量子化値とを用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求める代数符号取得部、
求めた第２音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を多重して出力する符号多重部、
を備えたことを特徴とする音声符号変換装置。
（付記１２）前記ターゲット信号生成部は、
第2音声符号化方式の前記ピッチラグ符号の逆量子化値に応じた周期性音源信号を発生する適応符号帳、
適応符号帳出力信号に、第2音声符号化方式の前記ゲイン符号に応じたゲインを掛けるゲイン乗算部、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成され、前記ゲイン乗算部の出力信号を入力されて前記ピッチ周期性合成信号を出力するLPC合成フィルタ、
前記音声再生部で再生した音声信号と該ピッチ周期性合成信号の差信号をターゲット信号として出力する手段、
を備えた付記1１記載の音声符号変換装置。
（付記１３）前記代数符号取得部は、
第2音声符号化方式の任意の代数符号に応じた雑音性音源信号を出力する代数符号帳、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成され、代数符号帳出力信号が入力されて前記代数合成信号を出力するLPC合成フィルタ、
前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求める手段、
を有することを特徴とする付記1１記載の音声符号変換装置。
（付記１４）前記第1音声符号化方式のゲイン符号がピッチゲインと代数符号帳ゲインを組にして符号化したものであれば、前記変換部は、
該ゲイン符号を逆量子化してピッチゲイン逆量子化値及び代数符号帳ゲイン逆量子化値を発生する逆量子化部、
逆量子化値のうちピッチゲイン逆量子化値を第２音声符号化方式により量子化して第２音声符号のピッチゲイン符号に変換する手段、
を有することを特徴とする請求項1１記載の音声符号変換装置。
（付記１５）前記音声符号変換装置は更に、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成されたLPC合成フィルタ、
前記求めた代数符号に応じた代数符号帳出力信号を前記LPC合成フィルタに入力したときの出力信号と前記ターゲット信号とから代数符号帳ゲインを決定する代数符号帳ゲイン決定部、該代数符号帳ゲインを量子化して第2音声符号化方式に基いた代数符号帳ゲイン符号を発生する代数符号帳ゲイン符号発生部、
を有することを特徴とする付記１４記載の音声符号変換装置。
（付記１６）前記第1音声符号化方式のゲイン符号がピッチゲインと代数符号帳ゲインを組にして符号化したものであれば、前記変換部は、
該ゲイン符号を逆量子化してピッチゲイン逆量子化値及び代数符号帳ゲイン逆量子化値を発生する逆量子化部、
逆量子化により得られたピッチゲイン逆量子化値及び代数符号帳ゲイン逆量子化値をそれぞれ第２音声符号化方式により量子化して第２音声符号のピッチゲイン符号及び代数符号帳ゲインに変換する手段、
を有することを特徴とする請求項１１記載の音声符号変換装置。
(付記１７）前記音声再生部は、前記変換部で逆量子化された第1音声符号のLSP符号、ピッチラグ符号、ゲイン符号の逆量子化値を用いて音声信号を再生することを特徴とする請求項１１記載の音声符号変換装置。
(付記１８）第1音声符号化方式に基いて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第２音声符号化方式に基いた第２音声符号に変換する音声符号変換装置において、
第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号、ピッチラグ符号に変換する変換部、
第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を発生するピッチゲイン補間部、
第1音声符号より音声信号を再生する音声信号再生部、
前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成し、前記音声信号再生部から出力する再生音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生するターゲット信号発生部、
第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求める代数符号取得部、
第2音声符号の前記LSP符号の逆量子化値、第2音声符号のピッチラグ符号及び代数符号、前記ターゲット信号を用いて第２音声符号化方式により、ピッチゲインと代数符号帳ゲインを組み合せた第２音声符号のゲイン符号を取得するゲイン符号取得部、
前記求めた第２音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を多重して出力する符号多重部、
を備えたことを特徴とする音声符号変換装置。
（付記１９）前記ターゲット信号生成部は、
第2音声符号化方式の前記ピッチラグ符号の逆量子化値に応じた周期性音源信号を発生する適応符号帳、
適応符号帳出力信号に、第2音声符号化方式の前記ピッチゲイン符号に応じたゲインを掛けるゲイン乗算部、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成され、前記ゲイン乗算部の出力信号を入力されて前記ピッチ周期性合成信号を出力するLPC合成フィルタ、
前記音声再生部で再生した音声信号と該ピッチ周期性合成信号の差信号をターゲット信号として出力する手段、
を備えた付記18記載の音声符号変換装置。
（付記２０）前記代数符号取得部は、
第2音声符号化方式の任意の代数符号に応じた雑音性音源信号を出力する代数符号帳、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成され、代数符号帳出力信号が入力されて前記代数合成信号を出力するLPC合成フィルタ、
前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を取得する手段、
を有することを特徴とする付記1８記載の音声符号変換装置。

以上、本発明によれば、LSP符号、ピッチラグ符号、ピッチゲイン符号を量子化パラメータ領域で符号変換しているため、あるいは、LSP符号、ピッチラグ符号、ピッチゲイン符号、代数符号帳ゲイン符号を量子化パラメータ領域で符号変換しているため、再生音声を再度LPC分析、ピッチ分析する場合に比べて分析誤差が小さく、音質劣化の少ないパラメータ変換が可能となる。
又、本発明によれば、再生音声を再度LPC分析、ピッチ分析しないため、従来技術１で問題となっていた符号変換による遅延の問題を解決することができる。

本発明によれば、代数符号、代数符号帳ゲイン符号については、再生音声からターゲット信号を作成し、ターゲット信号と代数合成信号との誤差が最小になるように変換するようにしたから、従来技術２で問題となっていた符号化方式１と符号化方式２の代数符号帳の構成が大きく異なっている場合でも音質劣化の少ない符号変換が可能となる。
又、本発明によれば、G.729Aの符号化方式とEVRC符号化方式との間で音声符号変換が可能となる。
更に、本発明によれば、EVRCのレートに応じた符号変換を行なうことができる。

本発明の音声符号変換装置の原理説明図である。本発明の第1実施例の音声符号変換装置の構成図である。 G.729AとEVRCのフレーム構成図である。ピッチゲイン符号変換説明図である。 G.729AとEVRCにおけるサブフレームのサンプル数の説明図である。ターゲット生成部の構成図である。代数符号変換部の構成図である。代数符号帳ゲイン変換部の構成図である。本発明の第2実施例の音声符号変換装置の構成図である。代数符号帳ゲイン符号の変換説明図である。第3実施例の音声符号変換装置の全体構成図である。フルレート用音声符号変換部の構成図である。 1/8レート用の音声符号変換部の構成図である。第4実施例の音声符号変換装置の構成図である。 ITU-T勧告G.729A方式の符号器の構成図である。量子化方法説明図である。適応符号帳の構成図である。 G.729Aの代数符号帳説明図である。各パルス系統グループに割り当てたサンプル点の説明図である。 G.729A方式の復号器のブロック図である。 EVRCの符号器の構成図である。 EVRCのフレームとLPC分析窓、ピッチ分析窓の関係説明図である。従来の典型的な音声符号変換方法の原理図である。従来技術２の音声符号化装置である。従来技術２の詳細な音声符号化装置である。

符号の説明

２０１レート判定部
２０２フルレート用音声符号変換部
２０３ハーフレート用音声符号変換部
２０４１/8レート用音声符号変換部
４０１符号分離部
４０２ LSP逆量子化部
４０３ LSP量子化部
４０４ゲイン逆量子化部
４０５音源発生部
４０６ゲイン乗算部
４０７ LPC合成フィルタ
４０８代数符号変換部
４０９ピッチラグバッファ
４１０ゲイン変換部
４１１符号多重部

Claims

第1音声符号化方式に基づいて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第２音声符号化方式に基づいた第２音声符号に変換する音声符号変換方法において、
第1音声符号のレートに対応させてフルレート用、ハーフレート用、1/8レート用の音声符号変換部を設け、
第1音声符号のレートが1/8レートの場合、1/8レート用の音声符号変換部は、
第1音声符号化方式による音声符号に含まれるLSP符号と代数符号帳ゲイン符号を分離してそれぞれを逆量子化して逆量子化値を出力し、
逆量子化値のうちLSP符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号を求め、
音源発生部から出力するランダム信号に前記ゲイン符号の逆量子化値を乗算し、乗算結果をLSP符号の逆量子化値で構成されるLPC合成フィルタに入力してターゲット信号を発生し、
第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、
前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求め、
第2音声符号の前記LSP符号の逆量子化値、フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第２音声符号化方式のゲイン符号を求め、
前記求めた第２音声符号化方式におけるLSP符号、代数符号、ゲイン符号及び前記ピッチラグ符号を出力する、
ことを特徴とする音声符号変換方法。
第1音声符号のレートがフルレートの場合、フルレート用の音声符号変換部は、
第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号、ピッチラグ符号を求め、
第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求め、
前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生し、
第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、
前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求め、
第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第２音声符号化方式のゲイン符号を求め、
前記求めた第２音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を出力する、
ことを特徴とする請求項１記載の音声符号変換方法。
第1音声符号化方式に基づいて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第２音声符号化方式に基づいた第２音声符号に変換する音声符号変換装置において、
第1音声符号のレートに対応させてフルレート用、ハーフレート用、1/8レート用の音声符号変換部を備え、該1/8レート用の音声符号変換部は、
第1音声符号化方式による音声符号に含まれるLSP符号と代数符号帳ゲイン符号を分離してそれぞれを逆量子化して逆量子化値を出力する逆量子化部、
逆量子化値のうちLSP符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号を出力するLSP量子化部、
音源発生部から出力するランダム信号に前記ゲイン符号の逆量子化値を乗算し、乗算結果をLSP符号の逆量子化値で構成されるLPC合成フィルタに入力してターゲット信号を発生するターゲット生成部、
第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求める代数符号取得部、
第2音声符号の前記LSP符号の逆量子化値、フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第２音声符号化方式のゲイン符号を求めるゲイン符号取得部、
前記求めた第２音声符号化方式におけるLSP符号、代数符号、ゲイン符号及び前記ピッチラグ符号を多重して出力する符号多重部、
を有することを特徴とする音声符号変換装置。
前記フルレート用の音声符号変換部は、
第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第２音声符号化方式により量子化して第２音声符号のLSP符号、ピッチラグ符号を求める逆量子化部、
第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求めるピッチゲイン補間部、
前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生するターゲット生成部、
第２音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第２音声符号化方式における代数符号を求める代数符号取得部、
第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第２音声符号化方式のゲイン符号を求めるゲイン符号取得部、
前記求めた第２音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を多重して出力する符号多重部、
を有することを特徴とする請求項３記載の音声符号変換装置。