JP2006350373A - 音声符号変換方法および装置 - Google Patents
音声符号変換方法および装置 Download PDFInfo
- Publication number
- JP2006350373A JP2006350373A JP2006205814A JP2006205814A JP2006350373A JP 2006350373 A JP2006350373 A JP 2006350373A JP 2006205814 A JP2006205814 A JP 2006205814A JP 2006205814 A JP2006205814 A JP 2006205814A JP 2006350373 A JP2006350373 A JP 2006350373A
- Authority
- JP
- Japan
- Prior art keywords
- code
- speech
- algebraic
- lsp
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【構成】第1音声符号のレートに対応させてフルレート用、ハーフレート用、1/8レート用の音声符号変換部を設け、第1音声符号のレートが1/8レートの場合、1/8レート用の音声符号変換部は、(1)第1音声符号化方式による音声符号に含まれるLSP符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号を求め、(2)ターゲット信号と代数合成信号を生成し、これらターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求め、(3)フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値や代数符号などを用いて第2音声符号化方式のゲイン符号を求めて出力する。
【選択図】図13
Description
・符号器の構成及び動作
図15はITU-T勧告G.729A方式の符号器の構成図である。図15において、1フレーム当り所定サンプル数(=N)の入力信号(音声信号)Xがフレーム単位でLPC分析部1に入力する。サンプリング速度を8kHz、1フレーム期間を10msecとすれば、1フレームは80サンプルである。LPC分析部1は、人間の声道を次式
H(z)=1/[1+Σαi・z-i] (i=1〜P) (1)
で表される全極型フィルタと見なし、このフィルタの係数αi(i=1,・・・,P)を求める。ここで、Pはフィルタ次数である。一般に、電話帯域音声の場合はPとして10〜12の値が用いられる。 LPC(線形予測)分析部1では、入力信号の80サンプルと先読み分の40サンプル及び過去の信号120サンプルの合計240サンプルを用いてLPC分析を行いLPC係数を求める。
d=Σi{lspq(i)-lspi}2 (i=1〜P)
により距離を演算する。そして、qを1〜nまで変化させた時、最小距離インデックス検出部3cは距離dが最小となるqを求め、インデックスqをLSP符号として復号器側へ伝送する。
EL=|X−β・A・PL|2 (2)
により求める。
適応符号帳出力の重み付き合成出力をA・PLとし、A・PLの自己相関をRpp、A・PLと入力信号Xの相互相関をRxpとすると、式(2)の誤差電力が最小となるピッチラグLoptにおける適応符号ベクトルPLは、次式
PL=argmax(Rxp2/Rpp) (3)
により表わされる。すなわち、ピッチ合成信号A・PLと入力信号Xとの相互相関Rxpをピッチ合成信号の自己相関Rppで正規化した値が最も大きくなる読み出し開始点を最適な開始点とする。以上より、誤差電力評価部10は(3)式を満足するピッチラグLoptを求める。このとき、最適ピッチゲインβoptは次式
βopt=Rxp/Rpp (4)
で与えられる。
(1) パルス系統グループ1には8個のサンプル点 0、5、10,15,20,25,30,35が割り当てられ、
(2) パルス系統グループ2には8個のサンプル点 1、6、11,16,21,26,31,36が割り当てられ、
(3) パルス系統グループ3には8個のサンプル点 2、7、12,17,22,27,32,37が割り当てられ、
(4) パルス系統グループ4には16個のサンプル点 3,4,8,9,13,14,18,19,23,
24,28,29,33,34,38,39が割り当てられている。
図18に示すように各パルス系統のパルス位置は限定されており、代数符号帳探索では各パルス系統のパルス位置の組み合わせの中から、再生領域で入力音声との誤差電力が最も小さくなるパルスの組み合わせを決定する。すなわち、適応符号帳探索で求めた最適ピッチゲインβoptとし、適応符号帳出力PLに該ゲインβoptを乗算して加算器11に入力する。これと同時に代数符号帳8より順次パルス性信号を加算器に11に入力し、加算器出力をLPC合成フィルタ6に入力して得られる再生信号と入力信号Xとの差が最小となるパルス性信号を特定する。具体的には、まず入力信号Xから適応符号帳探索で求めた最適な適応符号帳出力PL、最適ピッチゲインβoptから次式により代数符号帳探索のためのターゲットベクトルX′を生成する。
この例では、パルスの位置と振幅(正負)を前述のように17bitで表現するため、その組合わせは2の17乗通り存在する。ここで、k通り目の代数符号出力ベクトルをCkとすると、代数符号帳探索では次式
D=|X′−GC・A・Ck|2 (6)
の評価関数誤差電力Dを最小とする符号ベクトルCkを求める。GCは代数符号帳ゲインである。誤差電力評価部10は代数符号帳の探索において、代数合成信号A・Ckと入力信号X′の相互相関値Rcxの2乗を代数合成信号の自己相関値Rccで正規化して得られる正規化相互相関値(Rcx*Rcx/Rcc)が最も大きくなるパルス位置と極性の組み合わせを探索する。尚、ピッチラグがサブフレーム長よりも短い場合には、音質を向上させるためにピッチ周期化部を設け、該ピッチ周期化部により代数符号帳出力に周期性を持たせるピッチ周期化処理を行わせることができる。代数符号帳探索の出力結果は、各パルスの位置と符号(正負)であり、これをまとめて代数符号と呼ぶ。
GC=g′×γ
なる関係がある。g′は過去の4サブフレームの対数利得から予測される現フレームの利得である。ゲイン量子化器12の図示しないゲイン量子化テーブル(ゲイン符号帳)には、適応符号帳ゲインGaと代数符号帳ゲインに対する補正係数γの組み合わせが128通り(=27)用意されている。ゲイン符号帳の探索方法は、(1)適応符号帳出力ベクトルと代数符号帳出力ベクトルに対して、ゲイン量子化テーブルの中から1組のテーブル値を取り出してゲイン可変部13、14に設定し、(2)ゲイン可変部13、14でそれぞれのベクトルにゲインGa、Gcを乗じてLPC合成フィルタ6に入力し、(3)誤差電力評価部10において入力信号Xとの誤差電力が最も小さくなる組み合わせを選択する、ことにより行なう。
図20にG.729A方式の復号器のブロック図である。符号器側から送られてきた回線データが回線復号部21へ入力されてLSP符号、ピッチラグ符号、代数符号、ゲイン符号が出力される。復号器ではこれらの符号に基づいて音声データを復号する。復号器の動作については、復号器の機能が符号器に含まれているため一部重複するが、以下で簡単に説明する。
LSP逆量子化部22はLSP符号が入力すると逆量子化し、LSP逆量子化値を出力する。LSP補間部23は現フレームの第2サブフレームにおけるLSP逆量子化値と前フレームの第2サブフレームのLSP逆量子化値から現フレームの第1サブフレームのLSP逆量子化値を補間演算する。次に、パラメータ逆変換部24はLSP補間値とLSP逆量子化値をそれぞれLPC合成フィルタ係数へ変換する。G.729A方式のLPC合成フィルタ25は、最初の第1サブフレームではLSP補間値から変換されたLPC係数を用い、次の第2サブフレームではLSP逆量子化値から変換されたLPC係数を用いる。
尚、初期状態では復号器側の適応符号帳26の内容は全て振幅0の信号が入っており、サブフレーム毎に時間的に一番古い信号をサブフレーム長だけ捨て、一方、現サブフレームで求めた音源信号を適応符号帳26に格納するように動作する。つまり、符号器と復号器の適応符号帳26は常に最新の同じ状態になるように維持される。
EVRCは、入力信号の性質に応じて1フレーム当りの伝送ビット数を変化させる点に特徴がある。すなわち、母音などの定常部ではビットレートを高くし、無音部や過渡部などでは伝送ビット数を少なくして、時間平均のビットレートを少なくする。EVRCのビットレートを表1に示す。
(1)現フレームの入力信号と先読み信号を前記LPC係数で構成されるLPC逆フィルタに入力してLPC残差信号を求める。なお、LPC合成フィルタをH(z)とするとLPC逆フィルタは1/H(z)である。
(2)LPC残差信号の自己相関関数を求め、自己相関関数が最大となる時のピッチラグとゲインを求める。
(3)上記の処理を2つの分析窓位置で行う。1回目の分析で求めたピッチラグとピッチゲインを各々Lag1、Gain1とし、2回目の分析で求めたピッチラグとピッチゲインをLag2、Gain2とする。
(4)Gain1とGain2の差があらかじめ決められた閾値よりも大きい時は、Gain1とLag1を現フレームのピッチゲインとピッチラグとする。また、閾値以下の場合にはGain2とLag2を各々現フレームのピッチゲインとピッチラグとする。
D=|X′−GC・A・Ck|2
の評価関数誤差電力Dを最小とする符号ベクトルCkを求める。GCは代数符号帳ゲインである。誤差電力評価部59は代数符号帳の探索において、代数合成信号A・Ckとターゲット信号X′の相互相関値Rcxの2乗を代数合成信号の自己相関値Rccで正規化して得られる正規化相互相関値(Rcx*Rcx/Rcc)が最も大きくなるパルス位置と極性の組み合わせを探索する。
尚、復号器は符号器側から送られてきたLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号を用いて音声データを復号するように構成される。EVRCの復号器は、G.729の復号器が符号器に対応して作成されるのと同様に作成できるためその説明は省略する。
インターネットと携帯電話の普及に伴い、インターネットのユーザと携帯電話網のユーザによる音声通話の通信量が今後ますます増えてくると考えられる。ところが、携帯電話網とインターネットとでは使用する音声符号化方式が異なるため、そのままでは通信することはできない。このため、従来は一方のネットワークで符号化された音声符号を音声符号変換部により他方のネットワークで用いられる符号化方式の音声符号に変換していた。
図23に従来の典型的な音声符号変換方法の原理図を示す。以下ではこの方法を従来技術1と呼ぶ。図において、ユーザAが端末71に対して入力した音声をユーザBの端末72に伝える場合のみを考える。ここで、ユーザAの持つ端末71は符号化方式1の符号器71aのみを持ち、ユーザBの持つ端末72は符号化方式2の復号器72aのみを持つこととする。
端末71に組み込まれた符号化方式1の符号器71aはユーザAが発した音声信号を符号化方式1の音声符号に符号化して伝送路71bに送出する。音声符号変換部74は伝送路71bより入力した符号化方式1の音声符号を符号化方式2の音声符号に変換して伝送路72bに送出し、端末72の復号器72aは、伝送路72bを介して入力する符号化方式2の音声符号から再生音声を復号し、ユーザBはこの再生音声を聞くことができる。
符号多重化部74fは、各量子化器74b2〜74e2から出力するLSP符号2、ピッチラグ符号2、代数符号2、ゲイン符号2を多重して符号化方式2による音声符号を作成して出力端子#2より伝送路に送出する。
ところが、従来技術1では符号化方式1の音声符号から一旦音声を再生し、再生された音声を入力として音声符号化方式2で再度符号化するため、符号化方式の違いに影響されずに符号変換が可能である。ところが、この方法では再符号化する際にLPC分析とピッチ分析のために信号の先読み(すなわち、遅延)が生じるという問題や、音質が大幅に劣化するという問題がある。
本発明の別の目的は、音質劣化を少なくでき、しかも、遅延時間を小さくできるようにすることである。
本発明の別の目的は、EVRCのレートに応じた符号変換を行なえるようにすることである。
第2音声符号の前記LSP符号の逆量子化値、フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第2音声符号化方式のゲイン符号を求めるステップ、前記求めた第2音声符号化方式におけるLSP符号、代数符号、ゲイン符号及び前記ピッチラグ符号を出力するステップを有している。
上記本発明の音声符号変換方法において、第1音声符号のレートがフルレートの場合、フルレート用の音声符号変換部は、第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号、ピッチラグ符号を求めるステップ、第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求めるステップ、前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生するステップ、第2音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成するステップ、前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求めるステップ、第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第2音声符号化方式のゲイン符号を求めるステップ、前記求めた第2音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を出力するステップを有している。
本発明の第2の態様は、第1音声符号化方式に基づいて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第2音声符号化方式に基づいた第2音声符号に変換する音声符号変換装置であり、第1音声符号のレートに対応させてフルレート用、ハーフレート用、1/8レート用の音声符号変換部を備え、該1/8レート用の音声符号変換部は、第1音声符号化方式による音声符号に含まれるLSP符号と代数符号帳ゲイン符号を分離してそれぞれを逆量子化して逆量子化値を出力する逆量子化部、逆量子化値のうちLSP符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号を出力するLSP量子化部、音源発生部から出力するランダム信号に前記ゲイン符号の逆量子化値を乗算し、乗算結果をLSP符号の逆量子化値で構成されるLPC合成フィルタに入力してターゲット信号を発生するターゲット生成部、第2音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求める代数符号取得部、第2音声符号の前記LSP符号の逆量子化値、フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第2音声符号化方式のゲイン符号を求めるゲイン符号取得部、前記求めた第2音声符号化方式におけるLSP符号、代数符号、ゲイン符号及び前記ピッチラグ符号を多重して出力する符号多重部を有している。
上記本発明の音声符号変換装置において、前記フルレート用の音声符号変換部は、第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号、ピッチラグ符号を求める逆量子化部、第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求めるピッチゲイン補間部、前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生するターゲット生成部、第2音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求める代数符号取得部、第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第2音声符号化方式のゲイン符号を求めるゲイン符号取得部、前記求めた第2音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を多重して出力する符号多重部を有している。
また、本発明によれば、EVRCのレートに応じた符号変換を行なうことができる。
図1は本発明の音声符号変換装置の原理説明図であり、符号化方式1(G.729A)の音声符号CODE1を符号化方式2(EVRC)の音声符号CODE2に変換する場合の音声符号変換装置の原理構成を示している。
本発明は、LSP符号、ピッチラグ符号、ピッチゲイン符号を従来技術2と同様に量子化パラメータ領域において符号化方式1から符号化方式2に符号変換し、かつ、再生音声とピッチ周期性合成信号とからターゲット信号を作成し、該ターゲット信号と代数合成信号との誤差が最小になるように代数符号、代数符号帳ゲインを求める。これにより、符号化方式1から符号化方式2に変換する点に特徴がある。図に従って、変換手順の詳細を説明すると以下の通りである。
LSP符号変換部102はLSP符号Lsp1を符号化方式2のLSP符号Lsp2に変換する。ピッチラグ変換部103はピッチラグ符号Lag1を符号化方式2のピッチラグ符号Lag2に変換する。ピッチゲイン変換部104はピッチゲイン符号Gain1からピッチゲイン逆量子化値を求め、このピッチゲイン逆量子化値を符号化方式2のピッチゲイン符号Gp2に変換する。
代数符号変換部107は音声符号化方式2における任意の代数符号と音声符号化方式2のLSP符号Lsp2の逆量子化値を用いて代数合成信号を生成し、ターゲット信号Targetと該代数合成信号との差が最小となる音声符号化方式2の代数符号Cb2を決定する。
符号多重部109は以上により求まった符号化方式2のLSP符号Lsp2、ピッチラグ符号Lag2、ピッチゲイン符号Gp2、代数符号Cb2、代数符号帳ゲイン符号Gc2を多重化して符号化方式2の音声符号CODE2として出力する。
図2は本発明の第1実施例の音声符号変換装置の構成図であり、図1の原理図と同一部分には同一符号を付している。本実施例では、音声符号化方式1としてG.729Aを用い、音声符号化方式2としてEVRCを用いる場合を示している。また、EVRCにはフルレート、ハーフレート、1/8レートの3種類のモードが存在するが、ここではフルレートのみを用いることとする。
G.729Aのフレーム長は10msecであり、EVRCのフレーム長が20msecであることから、G.729Aの2フレーム分の音声符号をEVRCの1フレーム分の音声符号に変換する。以下では、図3(a)に示すG.729Aの第nフレーム及び第n+1フレームの音声符号を、図3(b)に示すEVRCの第mフレームの音声符号に変換する場合について説明する。
LSP符号変換部102はLSP逆器量子化部102aとLSP量子化部102bを有している。前述のようにG.729Aのフレーム長は10msecであり、G.729A符号器は10msecに1回だけ第1サブフレームの入力信号から求めたLSPパラメータを量子化する。これに対し、EVRCのフレーム長は20msecであり、EVRC符号器は20msecに1回だけ第2サブフレーム及び先読み部分の入力信号から求めたLSPパラメータを量子化する。つまり、同じ20msecを単位として考えると、G.729A符号器は2回のLSP量子化を行うのに対してEVRC符号器は1回しか量子化を行わない。このため、G.729の連続する2つのフレームのLSP符号をそのままではEVRCのLSP符号に変換することはできない。
LSP逆量子化部102aは、LSP符号Lsp1(n)が入力されると該符号を逆量子化してLSP逆量子化値lsp1を出力する。ここで、lsp1は10個の係数からなるベクトルである。又、LSP逆量子化部102aはG.729Aの復号器において用いられる逆量子化器と同じ動作をする。
ついで、LSP量子化部102bは変換されたLSP符号Lsp2(m)を復号して得られるLSP逆量子化値と、前フレームのLSP符号Lsp2(m-1)を復号して得られるLSP逆量子化値とから線形補間により現フレーム内の3つのサブフレームにおけるLSPパラメータlsp2(k)、(k=0,1,2)を求める。lsp2(k)は後述するターゲット生成部106等で用いられる。lsp2(k)は10次元のベクトルである。
そこで、第1実施例では、G.729Aの第n+1フレームの最終サブフレーム(第1サブレーム)におけるピッチラグ符号Lag1(n+1,1)をG.729Aのピッチラグ逆量子化部103aにより逆量子化してピッチラグlag1を求め、このlag1をEVRCのピッチラグ量子化部103bにより量子化して第mフレーム第2サブフレームにおけるピッチラグ符号Lag2(m)とする。また、ピッチラグ量子化部103bはEVRC符号器・復号器と同じ方法によりピッチラグの補間をする。すなわち、Lag2(m)を逆量子化して得られる第2サブフレームのピッチラグ逆量子化値と、前フレームの第2サブフレームのピッチラグ逆量子化値との線形補間により各サブフレームのピッチラグ補間値lag2(k), (k=0,1,2)を求める。ピッチラグ補間値は後述するターゲット生成部106で使用される。
gp2(0) = gp1(0)
gp2(1) = (gp1(1) + gp1(2)) / 2
gp2(2) = gp1(3)
によりピッチゲインを合成する。合成されたピッチゲインgp2(k)(k=0,1,2)をそれぞれEVRCのピッチゲイン量子化テーブルを用いてスカラー量子化し、ピッチゲイン符号Gp2(m,k)を求める。ピッチゲインgp2(k)(k=0,1,2)は後述するターゲット生成部106で使用される。
音声再生部105は、第nフレームにおけるG.729Aの再生音声Sp(n,h)と、第n+1フレームにおけるG.729Aの再生音声Sp(n+1,h)を作成する。なお、再生音声の作成方法はG.729Aの復号器の動作と同じであり、従来技術の項で説明済みであり、ここでは説明を省略する。再生音声Sp(n,h)とSp(n+1,h)の次元数はG.729Aのフレーム長と同じ80サンプルであり(h=1〜80)、合わせて160サンプルとなりEVRCの1フレーム当たりのサンプル数になる。音声再生部105は、作成した再生音声Sp(n,h),Sp(n+1,h)を図5に示すようにSp (0,i)、Sp(1,i)、Sp(2,i)の3つのベクトルに分割して出力する。iはEVRCの第0、1サブフレームでは1〜53、第2サブフレームでは1〜54である。
以上により、EVRCのLSP符号Lsp2(m)、ピッチラグ符号Lag2(m)、ピッチゲイン符号Gp2(m,k)、代数符号Cb2(m,k)、代数符号帳ゲイン符号Gc2(m,k)が求まれば、符号多重部109はこれらの符号を多重して一つにまとめて符号化方式2の音声符号CODE2(m)として出力する。
一方、代数符号、代数符号帳ゲイン符号については、再生音声からターゲット信号を作成し、ターゲット信号との誤差が最小になるように変換することにより、従来技術2で問題となっていた符号化方式1と符号化方式2の代数符号帳の構成が大きく異なっている場合でも音質劣化の少ない符号変換が可能である。
図9は本発明の第2実施例の音声符号変換装置の構成図であり、図2の第1実施例と同一部分には同一符号を付している。第2実施例において第1実施例と異なる点は、(1)第1実施例の代数符号帳ゲイン変換部108を除去し、替わって代数符号帳ゲイン量子化部110を設けた点、(2)LSP符号、ピッチラグ符号、ピッチゲイン符号に加えて、代数符号帳ゲイン符号も量子化パラメータ領域で符号変換する点である。
G.729Aでは5msecのサブフレーム毎に代数符号帳ゲインを量子化するから、20msecを単位として考えるとG.729Aは1フレームに4つの代数符号帳ゲインを量子化する。一方、EVRCは1フレームに3つの代数符号帳ゲインを量子化する。したがって、G.729Aの音声符号をEVRCの音声符号へ変換する場合には、G.729Aの全ての代数符号帳ゲインをEVRCの代数符号帳ゲインに変換することはできない。そこで、第2実施例では図10に示す方法によりゲインの変換を行う。すなわち、G.729Aの連続する2つのフレームの代数符号帳ゲインをgc1(0)、gc1(1)、gc1(2)、gc1(3)とし、次式
gc2(0) = gc1(0)
gc2(1) = (gc1(1) + gc1(2)) / 2
gc2(2) = gc1(3)
により代数符号帳ゲインを合成する。合成された代数符号帳ゲインgc2(k)(k=0,1,2)をそれぞれEVRCの代数符号帳ゲイン量子化テーブルを用いてスカラー量子化し、代数符号帳ゲイン符号Gc2(m,k)を求める。
一方、代数符号については、再生音声からターゲット信号を作成し、ターゲット信号との誤差が最小になるように変換することにより、従来技術2で問題となっていた符号化方式1と符号化方式2の代数符号帳の構成が大きく異なっている場合でも音質劣化の少ない符号変換が可能である。
図11は第3実施例の音声符号変換装置の全体構成図である。第3実施例はEVRCの音声符号をG.729Aの音声符号に変換する場合の例を示している。図11において、レート判定部201は、EVRC符号器より音声符号が入力すると、EVRCのレートを判別する。EVRC音声符号の中にフルレート、ハーフレート、1/8レートの何れであるかを示すレート情報が含まれているから、レート判定部201はこの情報を用いてEVRCのレートを判別する。そして、レート判定部201はレートに応じてスイッチS1、S2を切り替え、EVRC音声符号を選択的に所定のレート用音声符号変換部202,203,204に入力し、かつ、該レート用音声符号変換部から出力されるG.729Aの音声符号をG.729A復号器側に送出する。
図12はフルレート用音声符号変換部202の構成図である。EVRCのフレーム長は20msecであり、G.729Aのフレーム長は10msecであるため、EVRCの1フレーム(第mフレーム)の音声符号をG.729Aの2フレーム(第n, n+1フレーム)の音声符号に変換する。
EVRCの符号器(図示せず)から伝送路を介して第mフレーム目の音声符号(回線データ)CODE1(m)が端子#1に入力する。符号分離部301は、音声符号CODE1(m)からLSP符号Lsp1(m)、ピッチラグ符号Lag1(m)、ピッチゲイン符号Gp1(m, k)、代数符号Cb1(m, k)、代数符号帳ゲイン符号Gc1(m, k)を分離して各逆量子化部302〜306に入力する。ここで、kはEVRCのサブフレーム番号であり、0、1,2の何れかの値を取る。
ついで、LSP量子化部307は前フレーム(第n-1フレーム)で求めた逆量子化値lsp2(n-1,1)と現フレームの逆量子化値lsp2(n,1)との線形補間によりサブフレーム番号0の逆量子化値lsp2(n,0)を求める。また、逆量子化値lsp2(n,1)と逆量子化値lsp2(n+1,1)との線形補間によりサブフレーム0の逆量子化値lsp2(n+1,0)を求める。これら逆量子化値lsp2(n,j)はターゲット信号の作成や代数符号、ゲイン符号の変換に使用される。
ピッチゲイン逆量子化部304はEVRCの第mフレームの3つのピッチゲイン符号Gp1(m, k) (k=0,1,2)の逆量子化値gp1(m, k)を求め、ピッチゲイン補間部309に入力する。ピッチゲイン補間部309は逆量子化値gp1(m, k)を用いて、符号化方式2(G.729A)のピッチゲイン逆量子化値gp2(n, j)(j=0,1)、gp2(n+1, j)(j=0,1)を次式
(1) gp2(n, 0) = gp1(m, 0)
(2) gp2(n, 1) = (gp1(m, 0) + gp1(m,1)) / 2
(3) gp2(n+1, 0) = (gp1(m, 1) + gp1(m, 2)) / 2
(4) gp2(n+1, 1) = gp1(m, 2)
により補間して求める。尚、ゲイン符号変換の際にピッチゲイン逆量子化値gp2(n, j)は、直接必要でないが、ターゲット信号の生成に使用する。
ターゲット生成部311は第1実施例のターゲット生成部(図6参照)と同様な構成を備えており、代数符号変換部312と代数符号帳ゲイン変換部313で用いるターゲット信号Target(n,h),Target(n+1,h)を作成する。すなわち、ターゲット生成部311は、まず、ピッチラグ量子化部308で求めたピッチラグlag2(n, j)に対応する適応符号帳出力を求め、これにピッチゲインgp2(n, j)を乗じて音源信号を作成する。次に、該音源信号をLSP逆量子化値lsp2(n, j)で構成されるLPC合成フィルタに入力して適応符号帳合成信号syn(n,h)を作成する。しかる後、音声再生部310で作成した再生音声Sp(n,h)から適応符号帳合成信号syn(n,h)を差し引いてターゲット信号Target(n,h)を求める。同様にして、第n+1フレーム目のターゲット信号Target(n+1,h)を作成する。
(1) G.729のゲイン量子化テーブルの中から一組のテーブル値(ピッチゲイン、代数符号帳ゲインの補正係数γ)を取り出す。
(2) 適応符号帳出力に前記ピッチゲインのテーブル値を乗じて信号Xを作成する。
(3) 代数符号帳出力に、前記補正係数γとゲイン予測値g′を乗じて信号Yを作成する。
(4) 信号Xと信号Yを加算して得られる信号を、LSP逆量子化値lsp2(n, j)で構成されるLPC合成フィルタに入力して合成信号Zを作成する。
(5) ターゲット信号と合成信号Zの誤差電力Eを計算する。
(6) (1)〜(5)の処理をゲイン量子化テーブルの全てのテーブル値について行い、誤差電力Eが最小となるテーブル値を決定し、そのインデックスをゲイン符号Gain2(n, j)とする。同様にして、ターゲット信号Target(n+1,h)とピッチラグlag2(n+1, j)、代数符号Cb2(n+1, j)、LSP逆量子化値lsp2(n+1, j)からゲイン符号Gain2(n+1, j)を求める。
フルレートとハーフレートの符号器・復号器は、各量子化テーブルの大きさが異なるだけであり、その構成はほぼ同じである。したがって、ハーフレート用の音声符号変換部203も、前述したフルレート用の音声符号変換部202と同様に構成でき、同様にハーフレートの音声符号をG.729Aの音声符号に変換することができる。
図13は、1/8レート用の音声符号変換部204の構成図である。1/8レートは無音部や背景雑音部などの非音声区間に用いられる。又、1/8レートで伝送する情報はLSP符号(8bit/フレーム)とゲイン符号(8bit/フレーム)の計16bitであり、音源信号は符号器・復号器の内部でランダム発生させるため伝送しない。
図13において、符号分離部401はEVRC(1/8レート)の第mフレームにおける音声符号CODE1(m)が入力すると、LSP符号Lsp1(m)とゲイン符号Gc1(m)を分離する。LSP逆量子化部402及びLSP量子化部403は図12のフルレートの場合と同様にEVRCのLSP符号Lsp1(m)をG.729AのLSP符号Lsp2(n)に変換する。尚、LSP逆量子化部402はLSP符号逆量子化値lsp1(m, k)を求め、LSP量子化部403はG.729AのLSP符号Lsp2(n)を出力すると共にLSP符号逆量子化値lsp2(n, j)を求める。
1/8レートでは音源信号を符号器・復号器の内部でランダム発生させて使用している。そこで、1/8レート用音声符号変換部においても、音源発生部405はEVRC符号器・復号器と同様にランダム信号を発生し、該ランダム信号の振幅がガウス分布になるように調節した信号を音源信号Cb1(m, k)として出力する。尚、ランダム信号の発生方法、ガウス分布への調節方法についてはEVRCと同様の方法を用いる。
代数符号変換部408は図12のフルレートの場合と同様にして代数符号変換を行い、G.729Aの代数符号Cb2(n, j)を出力する。
EVRCの1/8レートは、無音部や雑音部などの周期性のほとんどない非音声区間に対して用いられるためピッチラグ符号が存在しない。そこで、以下の方法によりG.729A用のピッチラグ符号を生成する。1/8レートの音声符号変換機204は、フルレートあるいはハーフレートの音声符号変換部202,203のピッチラグ変換部303,308で得られたG.729A用のピッチラグ符号を取り出し、ピッチラグバッファ409に格納する。そして、現フレーム(第nフレーム)で1/8レートが選択されると該ピッチラグバッファ409内のピッチラグ符号Lag2(n, j)を出力する。ただし、ピッチラグバッファの記憶内容は変更しない。一方、現フレームで1/8レートが選択されなかった場合は、選択されたレート(フルレート又はハーフレート)の音声符号変換部202,203のピッチラグ変換部303,308で得られたG.729A用のピッチラグ符号がバッファ409に格納される。
しかる後、符号多重部411はLSP符号Lsp2(n)、ピッチラグ符号Lag2(n)、代数符号Cb2(n, j)、ゲイン符号Gain2(n, j)を多重してG.729Aの第nフレームにおける音声符号CODE2(n)を出力する。また、符号多重部411は、LSP符号Lsp2(n+1)、ピッチラグ符号Lag2(n+1)、代数符号Cb2(n+1, j)、ゲイン符号Gain2(n+1, j)を多重してG.729Aの第n+1フレームにおける音声符号CODE2(n+1)を出力する。以上の説明の通り、EVRC(1/8レート)の音声符号をG.729Aの音声符号に変換することができる。
図14は第4実施例の音声符号変換装置の構成図であり、音声符号に回線誤りが発生しても対応できるようになっており、図2の第1実施例と同一符号を付している。異なる点は、(1)回線誤り検出部501が設けられている点、(2)LSP逆量子化部102a、ピッチラグ逆量子化部103a、ゲイン逆量子化部104a、代数符号逆量子化部110の替わりにLSP符号修正部511、ピッチラグ修正部512、ゲイン符号修正部513、代数符号修正部514が設けられている点である。
ピッチラグ修正部512は、回線誤りやフレーム消失しなければ、受信した現フレームのピッチラグ符号の逆量子化値lag1を出力する。また、回線誤りやフレーム消失があれば、最後に受信した良好なフレームのピッチラグ符号の逆量子化値を出力する。一般的に、有声部ではピッチラグが滑らかに変化することが知られている。したがって、有声部では上記のように前フレームのピッチラグで代用させても音質上の劣化はほとんどない。また、無声部では、ピッチラグは大きく変化することが知られているが、無声部における適応符号帳の寄与率は小さい(ピッチゲインが小さい)ため、前述の方法による音質劣化はほとんどない。
gp1(n,0) =α・gp1(n-1,1)
gp1(n,1) =α・gp1(n-1,0)
gc1(n,0) =β・gc1(n-1,1)
gc1(n,1) =β・gc1(n-1,0)
により記憶してある1サブフレーム前のゲインを減衰してピッチゲインgp1(n,j)と代数符号帳ゲインgc1(n,j)を求めて出力する。ここでα、βは1以下の定数である。
(付記1)第1音声符号化方式により符号化して得られる音声符号を第2音声符号化方式の音声符号に変換する音声符号変換方法において、
第1音声符号化方式による音声符号より、音声信号を再現するために必要な複数の符号成分を分離し、
各成分の符号をそれぞれ逆量子化して逆量子化値を出力し、
代数符号以外の符号成分の前記逆量子化値を量子化して第2音声符号化方式の音声符号の符号成分に変換し、
前記各逆量子化値から音声を再生し、
前記第2音声符号化方式の各符号成分を逆量子化して第2音声符号化方式の逆量子化値を求め、
前記再生音声と、前記第2音声符号化方式の各逆量子化値を用いてターゲット信号を生成し、
前記ターゲット信号を用いて第2音声符号化方式の代数符号を求め、
前記第2音声符号化方式の各符号成分を音声符号として出力する、
ことを特徴とする音声符号変換方法。
(付記2)伝送路誤り発生の有無を検出し、
伝送路誤りが発生していなければ前記分離された符号成分を使用し、伝送路誤りが発生していれば過去の正常な符号成分を用いて前記逆量子化値を出力する、ことを特徴とする付記1記載の音声符号変換方法。
(付記3)第1音声符号化方式に基いて音声信号をLSP符号、ピッチラグ符号、代数符号、ゲイン符号で符号化した第1音声符号を、第2音声符号化方式に基いた第2音声符号に変換する音声符号変換方法において、
第1音声符号のLSP符号、ピッチラグ符号、ゲイン符号を逆量子化し、これらの逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号、ピッチラグ符号、ゲイン符号を求め、
前記第2音声符号化方式のLSP符号、ピッチラグ符号、ゲイン符号の逆量子化値を用いてピッチ周期性合成信号を生成すると共に第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生し、
第2音声符号化方式における任意の代数符号と前記第2音声符号を構成するLSP符号の逆量子化値とを用いて代数合成信号を生成し、
前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求め、
第2音声符号化方式における前記LSP符号、ピッチラグ符号、代数符号、ゲイン符号を出力する、
ことを特徴とする音声符号変換方法。
(付記4)第2音声符号化方式の前記ピッチラグ符号の逆量子化値に応じた適応符号帳出力信号に、第2音声符号化方式の前記ゲイン符号に応じたゲインを掛けて得られた信号を、第2音声符号化方式の前記LSP符号の逆量子化値に基いたLPC合成フィルタに入力し、その出力信号を前記ピッチ周期性合成信号とする、
ことを特徴とする付記3記載の音声符号変換方法。
(付記5)第2音声符号化方式の前記任意の代数符号に応じた代数符号帳出力信号を第2音声符号化方式の前記LSP符号の逆量子化値に基いたLPC合成フィルタに入力し、その出力信号を前記代数合成信号とする、
ことを特徴とする付記3記載の音声符号変換方法。
(付記6)前記第1音声符号化方式のゲイン符号はピッチゲインと代数符号帳ゲインを組にして符号化したものであり、該ゲイン符号を逆量子化して得られた逆量子化値のうちピッチゲイン逆量子化値を第2音声符号化方式により量子化して第2音声符号のピッチゲイン符号を求める、
ことを特徴とする付記3記載の音声符号変換方法。
(付記7)第2音声符号化方式の前記求めた代数符号に応じた代数符号帳出力信号を第2音声符号化方式の前記LSP符号の逆量子化値に基いたLPC合成フィルタに入力し、
その出力信号と前記ターゲット信号とから代数符号帳ゲインを求め、
該代数符号帳ゲインを量子化して第2音声符号化方式に基いた代数符号帳ゲインを求める、
ことを特徴とする付記6記載の音声符号変換方法。
(付記8)前記第1音声符号化方式のゲイン符号はピッチゲインと代数符号帳ゲインを組にして符号化したものであり、該ゲイン符号を逆量子化して得られたピッチゲイン逆量子化値及び代数符号帳ゲイン逆量子化値をそれぞれ第2音声符号化方式により量子化して第2音声符号のピッチゲイン符号及び代数符号帳ゲイン符号を求める、
ことを特徴とする付記3記載の音声符号変換方法。
(付記9)第1音声符号化方式に基いて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第2音声符号化方式に基いた第2音声符号に変換する音声符号変換方法において、
第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号、ピッチラグ符号を求め、
第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求め、
前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生し、
第2音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、
前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求め、
第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第2音声符号化方式によりピッチゲインと代数符号帳ゲインを組み合せた第2音声符号のゲイン符号を求め、
前記求めた第2音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を出力する、
ことを特徴とする音声符号変換方法。
(付記10) 第1音声符号化方式により符号化して得られる音声符号を第2音声符号化方式の音声符号に変換する音声符号変換装置において、
第1音声符号化方式による音声符号より音声信号を再現するために必要な複数の符号成分を分離する符号分離手段、
各成分の符号をそれぞれ逆量子化して逆量子化値を出力する逆量子化部、
前記各逆量子化部から出力する代数符号以外の符号成分の逆量子化値を量子化して第2音声符号化方式の音声符号の符号成分に変換する量子化部、
前記各逆量子化値から音声を再生する音声再生部、
前記第2音声符号化方式の各符号成分を逆量子化して第2音声符号化方式の逆量子化値を求める逆量子化手段、
前記音声再生部から出力される再生音声と、前記第2音声符号化方式の逆量子化手段から出力される各逆量子化値とを用いてターゲット信号を生成するターゲット生成手段、
前記ターゲット信号を用いて第2音声符号化方式の代数符号を求める代数符号取得部、
前記第2音声符号化方式の各符号成分を音声符号として出力する符号多重手段、
を備えたことを特徴とする音声符号変換装置。
(付記11) 第1音声符号化方式に基いて音声信号をLSP符号、ピッチラグ符号、代数符号、ゲイン符号で符号化した第1音声符号を、第2音声符号化方式に基いた第2音声符号に変換する音声符号変換装置において、
第1音声符号のLSP符号、ピッチラグ符号、ゲイン符号を逆量子化し、これらの逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号、ピッチラグ符号、ゲイン符号に変換する変換部、
前記第1音声符号より音声信号を再生する音声再生部、
前記第2音声符号化方式のLSP符号、ピッチラグ符号、ゲイン符号の逆量子化値を用いてピッチ周期性合成信号を生成し、前記音声再生部で再生した音声信号と該ピッチ周期性合成信号の差信号をターゲット信号として発生するターゲット信号生成部、
第2音声符号化方式における任意の代数符号と、前記第2音声符号のLSP符号の逆量子化値とを用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求める代数符号取得部、
求めた第2音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を多重して出力する符号多重部、
を備えたことを特徴とする音声符号変換装置。
(付記12)前記ターゲット信号生成部は、
第2音声符号化方式の前記ピッチラグ符号の逆量子化値に応じた周期性音源信号を発生する適応符号帳、
適応符号帳出力信号に、第2音声符号化方式の前記ゲイン符号に応じたゲインを掛けるゲイン乗算部、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成され、前記ゲイン乗算部の出力信号を入力されて前記ピッチ周期性合成信号を出力するLPC合成フィルタ、
前記音声再生部で再生した音声信号と該ピッチ周期性合成信号の差信号をターゲット信号として出力する手段、
を備えた付記11記載の音声符号変換装置。
(付記13)前記代数符号取得部は、
第2音声符号化方式の任意の代数符号に応じた雑音性音源信号を出力する代数符号帳、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成され、代数符号帳出力信号が入力されて前記代数合成信号を出力するLPC合成フィルタ、
前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求める手段、
を有することを特徴とする付記11記載の音声符号変換装置。
(付記14)前記第1音声符号化方式のゲイン符号がピッチゲインと代数符号帳ゲインを組にして符号化したものであれば、前記変換部は、
該ゲイン符号を逆量子化してピッチゲイン逆量子化値及び代数符号帳ゲイン逆量子化値を発生する逆量子化部、
逆量子化値のうちピッチゲイン逆量子化値を第2音声符号化方式により量子化して第2音声符号のピッチゲイン符号に変換する手段、
を有することを特徴とする請求項11記載の音声符号変換装置。
(付記15)前記音声符号変換装置は更に、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成されたLPC合成フィルタ、
前記求めた代数符号に応じた代数符号帳出力信号を前記LPC合成フィルタに入力したときの出力信号と前記ターゲット信号とから代数符号帳ゲインを決定する代数符号帳ゲイン決定部、該代数符号帳ゲインを量子化して第2音声符号化方式に基いた代数符号帳ゲイン符号を発生する代数符号帳ゲイン符号発生部、
を有することを特徴とする付記14記載の音声符号変換装置。
(付記16)前記第1音声符号化方式のゲイン符号がピッチゲインと代数符号帳ゲインを組にして符号化したものであれば、前記変換部は、
該ゲイン符号を逆量子化してピッチゲイン逆量子化値及び代数符号帳ゲイン逆量子化値を発生する逆量子化部、
逆量子化により得られたピッチゲイン逆量子化値及び代数符号帳ゲイン逆量子化値をそれぞれ第2音声符号化方式により量子化して第2音声符号のピッチゲイン符号及び代数符号帳ゲインに変換する手段、
を有することを特徴とする請求項11記載の音声符号変換装置。
(付記17)前記音声再生部は、前記変換部で逆量子化された第1音声符号のLSP符号、ピッチラグ符号、ゲイン符号の逆量子化値を用いて音声信号を再生することを特徴とする請求項11記載の音声符号変換装置。
(付記18)第1音声符号化方式に基いて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第2音声符号化方式に基いた第2音声符号に変換する音声符号変換装置において、
第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号、ピッチラグ符号に変換する変換部、
第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を発生するピッチゲイン補間部、
第1音声符号より音声信号を再生する音声信号再生部、
前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成し、前記音声信号再生部から出力する再生音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生するターゲット信号発生部、
第2音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求める代数符号取得部、
第2音声符号の前記LSP符号の逆量子化値、第2音声符号のピッチラグ符号及び代数符号、前記ターゲット信号を用いて第2音声符号化方式により、ピッチゲインと代数符号帳ゲインを組み合せた第2音声符号のゲイン符号を取得するゲイン符号取得部、
前記求めた第2音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を多重して出力する符号多重部、
を備えたことを特徴とする音声符号変換装置。
(付記19)前記ターゲット信号生成部は、
第2音声符号化方式の前記ピッチラグ符号の逆量子化値に応じた周期性音源信号を発生する適応符号帳、
適応符号帳出力信号に、第2音声符号化方式の前記ピッチゲイン符号に応じたゲインを掛けるゲイン乗算部、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成され、前記ゲイン乗算部の出力信号を入力されて前記ピッチ周期性合成信号を出力するLPC合成フィルタ、
前記音声再生部で再生した音声信号と該ピッチ周期性合成信号の差信号をターゲット信号として出力する手段、
を備えた付記18記載の音声符号変換装置。
(付記20)前記代数符号取得部は、
第2音声符号化方式の任意の代数符号に応じた雑音性音源信号を出力する代数符号帳、
第2音声符号化方式の前記LSP符号の逆量子化値に基いて作成され、代数符号帳出力信号が入力されて前記代数合成信号を出力するLPC合成フィルタ、
前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を取得する手段、
を有することを特徴とする付記18記載の音声符号変換装置。
又、本発明によれば、再生音声を再度LPC分析、ピッチ分析しないため、従来技術1で問題となっていた符号変換による遅延の問題を解決することができる。
又、本発明によれば、G.729Aの符号化方式とEVRC符号化方式との間で音声符号変換が可能となる。
更に、本発明によれば、EVRCのレートに応じた符号変換を行なうことができる。
202 フルレート用音声符号変換部
203 ハーフレート用音声符号変換部
204 1/8レート用音声符号変換部
401 符号分離部
402 LSP逆量子化部
403 LSP量子化部
404 ゲイン逆量子化部
405 音源発生部
406 ゲイン乗算部
407 LPC合成フィルタ
408 代数符号変換部
409 ピッチラグバッファ
410 ゲイン変換部
411 符号多重部
Claims (4)
- 第1音声符号化方式に基づいて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第2音声符号化方式に基づいた第2音声符号に変換する音声符号変換方法において、
第1音声符号のレートに対応させてフルレート用、ハーフレート用、1/8レート用の音声符号変換部を設け、
第1音声符号のレートが1/8レートの場合、1/8レート用の音声符号変換部は、
第1音声符号化方式による音声符号に含まれるLSP符号と代数符号帳ゲイン符号を分離してそれぞれを逆量子化して逆量子化値を出力し、
逆量子化値のうちLSP符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号を求め、
音源発生部から出力するランダム信号に前記ゲイン符号の逆量子化値を乗算し、乗算結果をLSP符号の逆量子化値で構成されるLPC合成フィルタに入力してターゲット信号を発生し、
第2音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、
前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求め、
第2音声符号の前記LSP符号の逆量子化値、フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第2音声符号化方式のゲイン符号を求め、
前記求めた第2音声符号化方式におけるLSP符号、代数符号、ゲイン符号及び前記ピッチラグ符号を出力する、
ことを特徴とする音声符号変換方法。 - 第1音声符号のレートがフルレートの場合、フルレート用の音声符号変換部は、
第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号、ピッチラグ符号を求め、
第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求め、
前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生し、
第2音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、
前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求め、
第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第2音声符号化方式のゲイン符号を求め、
前記求めた第2音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を出力する、
ことを特徴とする請求項1記載の音声符号変換方法。 - 第1音声符号化方式に基づいて音声信号をLSP符号、ピッチラグ符号、代数符号、ピッチゲイン符号、代数符号帳ゲイン符号で符号化した第1音声符号を、第2音声符号化方式に基づいた第2音声符号に変換する音声符号変換装置において、
第1音声符号のレートに対応させてフルレート用、ハーフレート用、1/8レート用の音声符号変換部を備え、該1/8レート用の音声符号変換部は、
第1音声符号化方式による音声符号に含まれるLSP符号と代数符号帳ゲイン符号を分離してそれぞれを逆量子化して逆量子化値を出力する逆量子化部、
逆量子化値のうちLSP符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号を出力するLSP量子化部、
音源発生部から出力するランダム信号に前記ゲイン符号の逆量子化値を乗算し、乗算結果をLSP符号の逆量子化値で構成されるLPC合成フィルタに入力してターゲット信号を発生するターゲット生成部、
第2音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求める代数符号取得部、
第2音声符号の前記LSP符号の逆量子化値、フルレートあるいはハーフレートの音声符号変換により得られたピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第2音声符号化方式のゲイン符号を求めるゲイン符号取得部、
前記求めた第2音声符号化方式におけるLSP符号、代数符号、ゲイン符号及び前記ピッチラグ符号を多重して出力する符号多重部、
を有することを特徴とする音声符号変換装置。 - 前記フルレート用の音声符号変換部は、
第1音声符号を構成する各符号を逆量子化し、逆量子化値のうちLSP符号、ピッチラグ符号の逆量子化値を第2音声符号化方式により量子化して第2音声符号のLSP符号、ピッチラグ符号を求める逆量子化部、
第1音声符号のピッチゲイン符号の逆量子化値を用いて補間処理により第2音声符号のピッチゲイン符号の逆量子化値を求めるピッチゲイン補間部、
前記第2音声符号のLSP符号、ピッチラグ符号、ピッチゲインの逆量子化値を用いてピッチ周期性合成信号を生成すると共に、第1音声符号より音声信号を再生し、該再生された音声信号と前記ピッチ周期性合成信号の差信号をターゲット信号として発生するターゲット生成部、
第2音声符号化方式における任意の代数符号と前記第2音声符号のLSP符号の逆量子化値を用いて代数合成信号を生成し、前記ターゲット信号と該代数合成信号との差が最小となる第2音声符号化方式における代数符号を求める代数符号取得部、
第2音声符号の前記LSP符号、ピッチラグ符号の逆量子化値、前記求めた代数符号及び前記ターゲット信号を用いて第2音声符号化方式のゲイン符号を求めるゲイン符号取得部、
前記求めた第2音声符号化方式におけるLSP符号、ピッチラグ符号、代数符号、ゲイン符号を多重して出力する符号多重部、
を有することを特徴とする請求項3記載の音声符号変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006205814A JP4236675B2 (ja) | 2006-07-28 | 2006-07-28 | 音声符号変換方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006205814A JP4236675B2 (ja) | 2006-07-28 | 2006-07-28 | 音声符号変換方法および装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002019454A Division JP4263412B2 (ja) | 2002-01-29 | 2002-01-29 | 音声符号変換方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006350373A true JP2006350373A (ja) | 2006-12-28 |
JP4236675B2 JP4236675B2 (ja) | 2009-03-11 |
Family
ID=37646186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006205814A Expired - Fee Related JP4236675B2 (ja) | 2006-07-28 | 2006-07-28 | 音声符号変換方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4236675B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009008220A1 (ja) * | 2007-07-09 | 2009-01-15 | Nec Corporation | 音声パケット受信装置、音声パケット受信方法、およびプログラム |
JP2010530989A (ja) * | 2007-06-22 | 2010-09-16 | ヴォイスエイジ・コーポレーション | 音声区間検出および音声信号分類ための方法および装置 |
CN113287167A (zh) * | 2019-01-03 | 2021-08-20 | 杜比国际公司 | 用于混合语音合成的方法、设备及系统 |
-
2006
- 2006-07-28 JP JP2006205814A patent/JP4236675B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010530989A (ja) * | 2007-06-22 | 2010-09-16 | ヴォイスエイジ・コーポレーション | 音声区間検出および音声信号分類ための方法および装置 |
US8990073B2 (en) | 2007-06-22 | 2015-03-24 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
WO2009008220A1 (ja) * | 2007-07-09 | 2009-01-15 | Nec Corporation | 音声パケット受信装置、音声パケット受信方法、およびプログラム |
JP5012897B2 (ja) * | 2007-07-09 | 2012-08-29 | 日本電気株式会社 | 音声パケット受信装置、音声パケット受信方法、およびプログラム |
CN113287167A (zh) * | 2019-01-03 | 2021-08-20 | 杜比国际公司 | 用于混合语音合成的方法、设备及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP4236675B2 (ja) | 2009-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4263412B2 (ja) | 音声符号変換方法 | |
JP4518714B2 (ja) | 音声符号変換方法 | |
KR101513184B1 (ko) | 계층적 디코딩 구조에서의 디지털 오디오 신호의 송신 에러에 대한 은닉 | |
EP1202251B1 (en) | Transcoder for prevention of tandem coding of speech | |
KR100391527B1 (ko) | 음성 부호화 장치, 기록 매체, 음성 복호화 장치, 신호 처리용 프로세서, 음성 부호화 복호화 시스템, 통신용 기지국, 통신용 단말 및 무선 통신 시스템 | |
KR20070028373A (ko) | 음성음악 복호화 장치 및 음성음악 복호화 방법 | |
JP7209032B2 (ja) | 音声符号化装置および音声符号化方法 | |
KR20070029754A (ko) | 음성 부호화 장치 및 그 방법과, 음성 복호화 장치 및 그방법 | |
JP4464707B2 (ja) | 通信装置 | |
JP2004138756A (ja) | 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム | |
JP4236675B2 (ja) | 音声符号変換方法および装置 | |
EP2009623A1 (en) | Speech coding | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JP4347323B2 (ja) | 音声符号変換方法及び装置 | |
JP4985743B2 (ja) | 音声符号変換方法 | |
JP2004020676A (ja) | 音声符号化/復号化方法及び音声符号化/復号化装置 | |
JP2001265390A (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JP4900402B2 (ja) | 音声符号変換方法及び装置 | |
JP2004020675A (ja) | 音声符号化/復号化方法及び音声符号化/復号化装置 | |
JP2004078235A (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置 | |
JP2003228388A (ja) | 音声符号変換方法及び装置 | |
JP2001100797A (ja) | 音声符号化復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081216 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4236675 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111226 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111226 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121226 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121226 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131226 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |