JP3653826B2

JP3653826B2 - 音声復号化方法及び装置

Info

Publication number: JP3653826B2
Application number: JP27948995A
Authority: JP
Inventors: 正之西口; 和幸飯島; 淳松本; 士郎大森
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1995-10-26
Filing date: 1995-10-26
Publication date: 2005-06-02
Anticipated expiration: 2015-10-26
Also published as: ES2165960T3; DE69618422D1; DE69618422T2; EP0770988A3; EP0770988B1; US5752222A; JPH09127996A; EP0770988A2

Description

【０００１】
【発明の属する技術分野】
本発明は、符号化された音声信号を復号化した後にポストフィルタ処理を施すような音声復号化方法及び装置に関する。
【０００２】
【従来の技術】
オーディオ信号（音声信号や音響信号を含む）の時間領域や周波数領域における統計的性質と人間の聴感上の特性を利用して信号圧縮を行うような符号化方法が種々知られている。この符号化方法としては、大別して時間領域での符号化、周波数領域での符号化、分析合成符号化等が挙げられる。
【０００３】
音声信号等の高能率符号化の例として、ハーモニック（Harmonic）符号化、ＭＢＥ（Multiband Excitation: マルチバンド励起）符号化等のサイン波分析符号化や、ＳＢＣ（Sub-band Coding:帯域分割符号化）、ＬＰＣ（Linear Predictive Coding: 線形予測符号化）、あるいはＤＣＴ（離散コサイン変換）、ＭＤＣＴ（モデファイドＤＣＴ）、ＦＦＴ（高速フーリエ変換）等が知られている。
【０００４】
このような符号化が施された信号を復号化した後に、スペクトル整形及び聴感上の品質向上のため等にポストフィルタが用いられることがある。
【０００５】
【発明が解決しようとする課題】
ところで、このようなポストフィルタにおいて、入力に応じて特性を更新する場合に、更新周期が長いと短時間の音声スペクトルの変化にポストフィルタ特性が追従できず、滑らかで良好な品質改善が行えない。また更新周期が短いとレベル変化が激しくなり、クリックノイズを発生する等の欠点がある。
【０００６】
本発明は、このような実情に鑑みてなされたものであり、少ないビット数の音声符号化復号化に用いた場合でも比較的良好な復号出力を得ることができ、高品質の再生音が得られるような音声復号化方法の提供を目的とする。
【０００７】
【課題を解決するための手段】
本発明は、符号化された音声信号が復号化されて供給されるスペクトル整形フィルタのフィルタ係数を第１の周期で更新するようにし、このスペクトル整形によるゲイン変化を補正するためのゲイン調整のゲインを第１の周期とは異なる第２の周期で更新することにより、上述した課題を解決する。
【０００８】
この場合、スペクトル整形フィルタのフィルタ係数の更新周期である第１の周期を短くし、ゲイン調整のゲイン更新周期である第２の周期を長くすることにより、追従速度が速く滑らかに変化してゆくフィルタ係数の切換を行うと共に、頻繁なゲイン切換によるレベル変動を抑えることができる。
【０００９】
【発明の実施の形態】
本発明に係る音声復号化方法は、音声コーデックのデコーダに用いられるポストフィルタのスペクトル整形フィルタのフィルタ係数の更新周期と、スペクトル整形によるゲイン変化を補正するためのゲイン調整用のゲイン値の更新周期とを異ならせ、特に、スペクトル整形フィルタ更新周期よりもゲイン調整用のゲイン値の更新周期を長くすることにより、より効果的なポストフィルタ処理を可能とするものである。
【００１０】
これは、ポストフィルタ内のスペクトル整形フィルタのフィルタ係数の更新周期が長いと短時間の音声スペクトルの変化にポストフィルタ特性が追従できずに出力音声が劣化することがある点を考慮し、フィルタ係数を短い周期で更新することが考えられるが、これに応じてゲイン調整用のゲイン値も短い周期で更新させると、ピッチ、ピークの位相の関係から１ピッチの期間内でゲイン値が大きく変動することがあり、クリックノイズを発生することがある。そこで、フィルタ係数の更新周期は短くし、ゲイン調整用のゲイン値の更新周期を長くすることにより、ゲイン変動を抑え、良好なポストフィルタ処理を実現するわけである。
【００１１】
ここで、本発明の実施の形態の説明に先立って、本発明が適用される音声コーデックの一例となる音声符号化装置及び復号化装置について、図面を参照しながら説明する。
【００１２】
先ず、図１は、音声符号化装置の基本構成を示している。
【００１３】
ここで、図１の音声符号化装置の基本的な考え方は、入力音声信号の短期予測残差例えばＬＰＣ（線形予測符号化）残差を求めてサイン波分析（sinusoidal analysis ）符号化、例えばハーモニックコーディング（harmonic coding ）を行う第１の符号化部１１０と、入力音声信号に対して位相伝送を行う波形符号化により符号化する第２の符号化部１２０とを有し、入力信号の有声音（Ｖ：Voiced）の部分の符号化に第１の符号化部１１０を用い、入力信号の無声音（ＵＶ：Unvoiced）の部分の符号化には第２の符号化部１２０を用いるようにすることである。
【００１４】
上記第１の符号化部１１０には、例えばＬＰＣ残差をハーモニック符号化やマルチバンド励起（ＭＢＥ）符号化のようなサイン波分析符号化を行う構成が用いられる。上記第２の符号化部１２０には、例えば合成による分析法を用いて最適ベクトルのクローズドループサーチによるベクトル量子化を用いた符号励起線形予測（ＣＥＬＰ）符号化の構成が用いられる。
【００１５】
図１の例では、入力端子１０１に供給された音声信号が、第１の符号化部１１０のＬＰＣ逆フィルタ１１１及びＬＰＣ分析・量子化部１１３に送られている。ＬＰＣ分析・量子化部１１３から得られたＬＰＣ係数あるいはいわゆるαパラメータは、ＬＰＣ逆フィルタ１１１に送られて、このＬＰＣ逆フィルタ１１１により入力音声信号の線形予測残差（ＬＰＣ残差）が取り出される。また、ＬＰＣ分析・量子化部１１３からは、後述するようにＬＳＰ（線スペクトル対）の量子化出力が取り出され、これが出力端子１０２に送られる。ＬＰＣ逆フィルタ１１１からのＬＰＣ残差は、サイン波分析符号化部１１４に送られる。サイン波分析符号化部１１４では、ピッチ検出やスペクトルエンベロープ振幅計算が行われると共に、Ｖ（有声音）／ＵＶ（無声音）判定部１１５によりＶ／ＵＶの判定が行われる。サイン波分析符号化部１１４からのスペクトルエンベロープ振幅データがベクトル量子化部１１６に送られる。スペクトルエンベロープのベクトル量子化出力としてのベクトル量子化部１１６からのコードブックインデクスは、スイッチ１１７を介して出力端子１０３に送られ、サイン波分析符号化部１１４からの出力は、スイッチ１１８を介して出力端子１０４に送られる。また、Ｖ／ＵＶ判定部１１５からのＶ／ＵＶ判定出力は、出力端子１０５に送られると共に、スイッチ１１７、１１８の制御信号として送られており、上述した有声音（Ｖ）のとき上記インデクス及びピッチが選択されて各出力端子１０３及び１０４からそれぞれ取り出される。
【００１６】
図１の第２の符号化部１２０は、この例ではＣＥＬＰ（符号励起線形予測）符号化構成を有しており、雑音符号帳１２１からの出力を、重み付きの合成フィルタ１２２により合成処理し、得られた重み付き音声を減算器１２３に送り、入力端子１０１に供給された音声信号を聴覚重み付けフィルタ１２５を介して得られた音声との誤差を取り出し、この誤差を距離計算回路１２４に送って距離計算を行い、誤差が最小となるようなベクトルを雑音符号帳１２１でサーチするような、合成による分析（Analysis by Synthesis ）法を用いたクローズドループサーチを用いた時間軸波形のベクトル量子化を行っている。このＣＥＬＰ符号化は、上述したように無声音部分の符号化に用いられており、雑音符号帳１２１からのＵＶデータとしてのコードブックインデクスは、上記Ｖ／ＵＶ判定部１１５からのＶ／ＵＶ判定結果が無声音（ＵＶ）のときオンとなるスイッチ１２７を介して、出力端子１０７より取り出される。
【００１７】
次に、図２は、本発明に係る音声復号化方法が適用される音声復号化装置として、上記図１の音声符号化装置に対応する音声復号化装置の基本構成を示すブロック図である。
【００１８】
この図２において、入力端子２０２には上記図１の出力端子１０２からの上記ＬＳＰ（線スペクトル対）の量子化出力としてのコードブックインデクスが入力される。入力端子２０３、２０４、及び２０５には、上記図１の各出力端子１０３、１０４、及び１０５からの各出力、すなわちエンベロープ量子化出力としてのインデクス、ピッチ、及びＶ／ＵＶ判定出力がそれぞれ入力される。また、入力端子２０７には、上記図１の出力端子１０７からのＵＶ（無声音）用のデータとしてのインデクスが入力される。
【００１９】
入力端子２０３からのエンベロープ量子化出力としてのインデクスは、逆ベクトル量子化器２１２に送られて逆ベクトル量子化され、ＬＰＣ残差のスペクトルエンベロープが求められて有声音合成部２１１に送られる。有声音合成部２１１は、サイン波合成により有声音部分のＬＰＣ（線形予測符号化）残差を合成するものであり、この有声音合成部２１１には入力端子２０４及び２０５からのピッチ及びＶ／ＵＶ判定出力も供給されている。有声音合成部２１１からの有声音のＬＰＣ残差は、ＬＰＣ合成フィルタ２１４に送られる。また、入力端子２０７からのＵＶデータのインデクスは、無声音合成部２２０に送られて、雑音符号帳を参照することにより無声音部分のＬＰＣ残差が取り出される。このＬＰＣ残差もＬＰＣ合成フィルタ２１４に送られる。ＬＰＣ合成フィルタ２１４では、上記有声音部分のＬＰＣ残差と無声音部分のＬＰＣ残差とがそれぞれ独立に、ＬＰＣ合成処理が施される。あるいは、有声音部分のＬＰＣ残差と無声音部分のＬＰＣ残差とが加算されたものに対してＬＰＣ合成処理を施すようにしてもよい。ここで入力端子２０２からのＬＳＰのインデクスは、ＬＰＣパラメータ再生部２１３に送られて、ＬＰＣのαパラメータが取り出され、これがＬＰＣ合成フィルタ２１４に送られる。ＬＰＣ合成フィルタ２１４によりＬＰＣ合成されて得られた音声信号は、出力端子２０１より取り出される。
【００２０】
次に、上記図１に示した音声信号符号化装置のより具体的な構成について、図３を参照しながら説明する。なお、図３において、上記図１の各部と対応する部分には同じ指示符号を付している。
【００２１】
この図３に示された音声信号符号化装置において、入力端子１０１に供給された音声信号は、ハイパスフィルタ（ＨＰＦ）１０９にて不要な帯域の信号を除去するフィルタ処理が施された後、ＬＰＣ（線形予測符号化）分析・量子化部１１３のＬＰＣ分析回路１３２と、ＬＰＣ逆フィルタ回路１１１とに送られる。
【００２２】
ＬＰＣ分析・量子化部１１３のＬＰＣ分析回路１３２は、入力信号波形の２５６サンプル程度の長さを１ブロックとしてハミング窓をかけて、自己相関法により線形予測係数、いわゆるαパラメータを求める。データ出力の単位となるフレーミングの間隔は、１６０サンプル程度とする。サンプリング周波数ｆｓが例えば８ｋHzのとき、１フレーム間隔は１６０サンプルで２０ｍsec となる。
【００２３】
ＬＰＣ分析回路１３２からのαパラメータは、α→ＬＳＰ変換回路１３３に送られて、線スペクトル対（ＬＳＰ）パラメータに変換される。これは、直接型のフィルタ係数として求まったαパラメータを、例えば１０個、すなわち５対のＬＳＰパラメータに変換する。変換は例えばニュートン−ラプソン法等を用いて行う。このＬＳＰパラメータに変換するのは、αパラメータよりも補間特性に優れているからである。
【００２４】
α→ＬＳＰ変換回路１３３からのＬＳＰパラメータは、ＬＳＰ量子化器１３４によりマトリクスあるいはベクトル量子化される。このとき、フレーム間差分をとってからベクトル量子化してもよく、複数フレーム分をまとめてマトリクス量子化してもよい。ここでは、２０ｍsec を１フレームとし、２０ｍsec 毎に算出されるＬＳＰパラメータを２フレーム分まとめて、マトリクス量子化及びベクトル量子化している。
【００２５】
このＬＳＰ量子化器１３４からの量子化出力、すなわちＬＳＰ量子化のインデクスは、端子１０２を介して取り出され、また量子化済みのＬＳＰベクトルは、ＬＳＰ補間回路１３６に送られる。
【００２６】
ＬＳＰ補間回路１３６は、上記２０ｍsec あるいは４０ｍsec 毎に量子化されたＬＳＰのベクトルを補間し、８倍のレートにする。すなわち、２．５ｍsec 毎にＬＳＰベクトルが更新されるようにする。これは、残差波形をハーモニック符号化復号化方法により分析合成すると、その合成波形のエンベロープは非常になだらかでスムーズな波形になるため、ＬＰＣ係数が２０ｍsec 毎に急激に変化すると異音を発生することがあるからである。すなわち、２．５ｍsec 毎にＬＰＣ係数が徐々に変化してゆくようにすれば、このような異音の発生を防ぐことができる。
【００２７】
このような補間が行われた２．５ｍsec 毎のＬＳＰベクトルを用いて入力音声の逆フィルタリングを実行するために、ＬＳＰ→α変換回路１３７により、ＬＳＰパラメータを例えば１０次程度の直接型フィルタの係数であるαパラメータに変換する。このＬＳＰ→α変換回路１３７からの出力は、上記ＬＰＣ逆フィルタ回路１１１に送られ、このＬＰＣ逆フィルタ１１１では、２．５ｍsec 毎に更新されるαパラメータにより逆フィルタリング処理を行って、滑らかな出力を得るようにしている。このＬＰＣ逆フィルタ１１１からの出力は、サイン波分析符号化部１１４、具体的には例えばハーモニック符号化回路、の直交変換回路１４５、例えばＤＦＴ（離散フーリエ変換）回路に送られる。
【００２８】
ＬＰＣ分析・量子化部１１３のＬＰＣ分析回路１３２からのαパラメータは、聴覚重み付けフィルタ算出回路１３９に送られて聴覚重み付けのためのデータが求められ、この重み付けデータが後述する聴覚重み付きのベクトル量子化器１１６と、第２の符号化部１２０の聴覚重み付けフィルタ１２５及び聴覚重み付きの合成フィルタ１２２とに送られる。
【００２９】
ハーモニック符号化回路等のサイン波分析符号化部１１４では、ＬＰＣ逆フィルタ１１１からの出力を、ハーモニック符号化の方法で分析する。すなわち、ピッチ検出、各ハーモニクスの振幅Ａｍの算出、有声音（Ｖ）／無声音（ＵＶ）の判別を行い、ピッチによって変化するハーモニクスのエンベロープあるいは振幅Ａｍの個数を次元変換して一定数にしている。
【００３０】
図３に示すサイン波分析符号化部１１４の具体例においては、一般のハーモニック符号化を想定しているが、特に、ＭＢＥ（Multiband Excitation: マルチバンド励起）符号化の場合には、同時刻（同じブロックあるいはフレーム内）の周波数軸領域いわゆるバンド毎に有声音（Voiced）部分と無声音（Unvoiced）部分とが存在するという仮定でモデル化することになる。それ以外のハーモニック符号化では、１ブロックあるいはフレーム内の音声が有声音か無声音かの択一的な判定がなされることになる。なお、以下の説明中のフレーム毎のＶ／ＵＶとは、ＭＢＥ符号化に適用した場合には全バンドがＵＶのときを当該フレームのＵＶとしている。
【００３１】
図３のサイン波分析符号化部１１４のオープンループピッチサーチ部１４１には、上記入力端子１０１からの入力音声信号が、またゼロクロスカウンタ１４２には、上記ＨＰＦ（ハイパスフィルタ）１０９からの信号がそれぞれ供給されている。サイン波分析符号化部１１４の直交変換回路１４５には、ＬＰＣ逆フィルタ１１１からのＬＰＣ残差あるいは線形予測残差が供給されている。オープンループピッチサーチ部１４１では、入力信号のＬＰＣ残差をとってオープンループによる比較的ラフなピッチのサーチが行われ、抽出された粗ピッチデータは高精度ピッチサーチ１４６に送られて、後述するようなクローズドループによる高精度のピッチサーチ（ピッチのファインサーチ）が行われる。また、オープンループピッチサーチ部１４１からは、上記粗ピッチデータと共にＬＰＣ残差の自己相関の最大値をパワーで正規化した正規化自己相関最大値ｒ(p) が取り出され、Ｖ／ＵＶ（有声音／無声音）判定部１１５に送られている。
【００３２】
直交変換回路１４５では例えばＤＦＴ（離散フーリエ変換）等の直交変換処理が施されて、時間軸上のＬＰＣ残差が周波数軸上のスペクトル振幅データに変換される。この直交変換回路１４５からの出力は、高精度ピッチサーチ部１４６及びスペクトル振幅あるいはエンベロープを評価するためのスペクトル評価部１４８に送られる。
【００３３】
高精度（ファイン）ピッチサーチ部１４６には、オープンループピッチサーチ部１４１で抽出された比較的ラフな粗ピッチデータと、直交変換部１４５により例えばＤＦＴされた周波数軸上のデータとが供給されている。この高精度ピッチサーチ部１４６では、上記粗ピッチデータ値を中心に、0.２〜0.５きざみで±数サンプルずつ振って、最適な小数点付き（フローティング）のファインピッチデータの値へ追い込む。このときのファインサーチの手法として、いわゆる合成による分析 (Analysis by Synthesis)法を用い、合成されたパワースペクトルが原音のパワースペクトルに最も近くなるようにピッチを選んでいる。このようなクローズドループによる高精度のピッチサーチ部１４６からのピッチデータについては、スイッチ１１８を介して出力端子１０４に送っている。
【００３４】
スペクトル評価部１４８では、ＬＰＣ残差の直交変換出力としてのスペクトル振幅及びピッチに基づいて各ハーモニクスの大きさ及びその集合であるスペクトルエンベロープが評価され、高精度ピッチサーチ部１４６、Ｖ／ＵＶ（有声音／無声音）判定部１１５及び聴覚重み付きのベクトル量子化器１１６に送られる。
【００３５】
Ｖ／ＵＶ（有声音／無声音）判定部１１５では、直交変換回路１４５からの出力と、高精度ピッチサーチ部１４６からの最適ピッチと、スペクトル評価部１４８からのスペクトル振幅データと、オープンループピッチサーチ部１４１からの正規化自己相関最大値ｒ(p) と、ゼロクロスカウンタ１４２からのゼロクロスカウント値とに基づいて、当該フレームのＶ／ＵＶ判定が行われる。さらに、ＭＢＥの場合の各バンド毎のＶ／ＵＶ判定結果の境界位置も当該フレームのＶ／ＵＶ判定の一条件としてもよい。このＶ／ＵＶ判定部１１５からの判定出力は、出力端子１０５を介して取り出される。
【００３６】
ところで、スペクトル評価部１４８の出力部あるいはベクトル量子化器１１６の入力部には、データ数変換（一種のサンプリングレート変換）部が設けられている。このデータ数変換部は、上記ピッチに応じて周波数軸上での分割帯域数が異なり、データ数が異なることを考慮して、エンベロープの振幅データ｜Ａ_m｜を一定の個数にするためのものである。すなわち、例えば有効帯域を３４００ｋHzまでとすると、この有効帯域が上記ピッチに応じて、８バンド〜６３バンドに分割されることになり、これらの各バンド毎に得られる上記振幅データ｜Ａ_m｜の個数ｍ_MX＋１も８〜６３と変化することになる。このためデータ数変換部１１９では、この可変個数ｍ_MX＋１の振幅データを一定個数Ｍ個、例えば４４個、のデータに変換している。
【００３７】
このスペクトル評価部１４８の出力部あるいはベクトル量子化器１１６の入力部に設けられたデータ数変換部からの上記一定個数Ｍ個（例えば４４個）の振幅データあるいはエンベロープデータが、ベクトル量子化器１１６により、所定個数、例えば４４個のデータ毎にまとめられてベクトルとされ、重み付きベクトル量子化が施される。この重みは、聴覚重み付けフィルタ算出回路１３９からの出力により与えられる。ベクトル量子化器１１６からの上記エンベロープのインデクスは、スイッチ１１７を介して出力端子１０３より取り出される。なお、上記重み付きベクトル量子化に先だって、所定個数のデータから成るベクトルについて適当なリーク係数を用いたフレーム間差分をとっておくようにしてもよい。
【００３８】
ここで、スペクトル評価部１４８の出力側あるいはベクトル量子化器１１６の入力側に設けられたスペクトルエンベロープの振幅のデータ数を一定個数にするデータ数変換の具体例について説明する。
【００３９】
このデータ数変換には種々の方法が考えられるが、本実施の形態においては、例えば、周波数軸上の有効帯域１ブロック分の振幅データに対して、ブロック内の最後のデータからブロック内の最初のデータまでの値を補間するようなダミーデータを付加してデータ個数をＮ_F個に拡大した後、帯域制限型のＯ_S倍（例えば８倍）のオーバーサンプリングを施すことによりＯ_S倍の個数の振幅データを求め、このＯ_S倍の個数（（ｍ_MX＋１）×Ｏ_S個）の振幅データを直線補間してさらに多くのＮ_M個（例えば２０４８個）に拡張し、このＮ_M個のデータを間引いて上記一定個数Ｍ（例えば４４個）のデータに変換している。
【００４０】
次に、第２の符号化部１２０について説明する。第２の符号化部１２０は、いわゆるＣＥＬＰ（符号励起線形予測）符号化構成を有しており、特に、入力音声信号の無声音部分の符号化のために用いられている。この無声音部分用のＣＥＬＰ符号化構成において、雑音符号帳、いわゆるストキャスティック・コードブック（stochastic code book）１２１からの代表値出力である無声音のＬＰＣ残差に相当するノイズ出力を、ゲイン回路１２６を介して、聴覚重み付きの合成フィルタ１２２に送っている。重み付きの合成フィルタ１２２では、入力されたノイズをＬＰＣ合成処理し、得られた重み付き無声音の信号を減算器１２３に送っている。減算器１２３には、上記入力端子１０１からＨＰＦ（ハイパスフィルタ）１０９を介して供給された音声信号を聴覚重み付けフィルタ１２５で聴覚重み付けした信号が入力されており、合成フィルタ１２２からの信号との差分あるいは誤差を取り出している。この誤差を距離計算回路１２４に送って距離計算を行い、誤差が最小となるような代表値ベクトルを雑音符号帳１２１でサーチする。このような合成による分析（Analysis by Synthesis ）法を用いたクローズドループサーチを用いた時間軸波形のベクトル量子化を行っている。
【００４１】
このＣＥＬＰ符号化構成を用いた第２の符号化部１２０からのＵＶ（無声音）部分用のデータとしては、雑音符号帳１２１からのコードブックのシェイプインデクスと、ゲイン回路１２６からのコードブックのゲインインデクスとが取り出される。雑音符号帳１２１からのＵＶデータであるシェイプインデクスは、スイッチ１２７ｓを介して出力端子１０７ｓに送られ、ゲイン回路１２６のＵＶデータであるゲインインデクスは、スイッチ１２７ｇを介して出力端子１０７ｇに送られている。
【００４２】
ここで、これらのスイッチ１２７ｓ、１２７ｇ及び上記スイッチ１１７、１１８は、上記Ｖ／ＵＶ判定部１１５からのＶ／ＵＶ判定結果によりオン／オフ制御され、スイッチ１１７、１１８は、現在伝送しようとするフレームの音声信号のＶ／ＵＶ判定結果が有声音（Ｖ）のときオンとなり、スイッチ１２７ｓ、１２７ｇは、現在伝送しようとするフレームの音声信号が無声音（ＵＶ）のときオンとなる。
【００４３】
次に、図４は、上記図２に示した本発明に係る実施の形態としての音声信号復号化装置のより具体的な構成を示している。この図４において、上記図２の各部と対応する部分には、同じ指示符号を付している。
【００４４】
この図４において、入力端子２０２には、上記図１、３の出力端子１０２からの出力に相当するＬＳＰのベクトル量子化出力、いわゆるコードブックのインデクスが供給されている。
【００４５】
このＬＳＰのインデクスは、ＬＰＣパラメータ再生部２１３のＬＳＰの逆ベクトル量子化器２３１に送られてＬＳＰ（線スペクトル対）データに逆ベクトル量子化され、ＬＳＰ補間回路２３２、２３３に送られてＬＳＰの補間処理が施された後、ＬＳＰ→α変換回路２３４、２３５でＬＰＣ（線形予測符号）のαパラメータに変換され、このαパラメータがＬＰＣ合成フィルタ２１４に送られる。ここで、ＬＳＰ補間回路２３２及びＬＳＰ→α変換回路２３４は有声音（Ｖ）用であり、ＬＳＰ補間回路２３３及びＬＳＰ→α変換回路２３５は無声音（ＵＶ）用である。またＬＰＣ合成フィルタ２１４は、有声音部分のＬＰＣ合成フィルタ２３６と、無声音部分のＬＰＣ合成フィルタ２３７とを分離している。すなわち、有声音部分と無声音部分とでＬＰＣの係数補間を独立に行うようにして、有声音から無声音への遷移部や、無声音から有声音への遷移部で、全く性質の異なるＬＳＰ同士を補間することによる悪影響を防止している。
【００４６】
また、図４の入力端子２０３には、上記図１、図３のエンコーダ側の端子１０３からの出力に対応するスペクトルエンベロープ（Ａｍ）の重み付けベクトル量子化されたコードインデクスデータが供給され、入力端子２０４には、上記図１、図３の端子１０４からのピッチのデータが供給され、入力端子２０５には、上記図１、図３の端子１０５からのＶ／ＵＶ判定データが供給されている。
【００４７】
入力端子２０３からのスペクトルエンベロープＡｍのベクトル量子化されたインデクスデータは、逆ベクトル量子化器２１２に送られて逆ベクトル量子化が施され、上記データ数変換に対応する逆変換が施されて、スペクトルエンベロープのデータとなって、有声音合成部２１１のサイン波合成回路２１５に送られている。
【００４８】
なお、エンコード時にスペクトルのベクトル量子化に先だってフレーム間差分をとっている場合には、ここでの逆ベクトル量子化後にフレーム間差分の復号を行ってからデータ数変換を行い、スペクトルエンベロープのデータを得る。
【００４９】
サイン波合成回路２１５には、入力端子２０４からのピッチ及び入力端子２０５からの上記Ｖ／ＵＶ判定データが供給されている。サイン波合成回路２１５からは、上述した図１、図３のＬＰＣ逆フィルタ１１１からの出力に相当するＬＰＣ残差データが取り出され、これが加算器２１８に送られている。
【００５０】
また、逆ベクトル量子化器２１２からのエンベロープのデータと、入力端子２０４、２０５からのピッチ、Ｖ／ＵＶ判定データとは、有声音（Ｖ）部分のノイズ加算のためのノイズ合成回路２１６に送られている。このノイズ合成回路２１６からの出力は、重み付き重畳加算回路２１７を介して加算器２１８に送っている。これは、サイン波合成によって有声音のＬＰＣ合成フィルタへの入力となるエクサイテイション（Excitation：励起、励振）を作ると、男声等の低いピッチの音で鼻づまり感がある点、及びＶ（有声音）とＵＶ（無声音）とで音質が急激に変化し不自然に感じる場合がある点を考慮し、有声音部分のＬＰＣ合成フィルタ入力すなわちエクサイテイションについて、音声符号化データに基づくパラメータ、例えばピッチ、スペクトルエンベロープ振幅、フレーム内の最大振幅、残差信号のレベル等を考慮したノイズをＬＰＣ残差信号の有声音部分に加えているものである。
【００５１】
加算器２１８からの加算出力は、ＬＰＣ合成フィルタ２１４の有声音用の合成フィルタ２３６に送られてＬＰＣの合成処理が施されることにより時間波形データとなり、さらに有声音用ポストフィルタ２３８ｖでフィルタ処理された後、加算器２３９に送られる。この有声音用ポストフィルタ２３８ｖは、後述するように、内部のスペクトル整形フィルタのフィルタ係数の更新周期を２０サンプル、２．５ｍsec と短くし、ゲイン調整回路のゲイン更新周期を１６０サンプル、２０ｍsec と長くしている。
【００５２】
次に、図４の入力端子２０７ｓ及び２０７ｇには、上記図３の出力端子１０７ｓ及び１０７ｇからのＵＶデータとしてのシェイプインデクス及びゲインインデクスがそれぞれ供給され、無声音合成部２２０に送られている。端子２０７ｓからのシェイプインデクスは、無声音合成部２２０の雑音符号帳２２１に、端子２０７ｇからのゲインインデクスはゲイン回路２２２にそれぞれ送られている。雑音符号帳２２１から読み出された代表値出力は、無声音のＬＰＣ残差に相当するノイズ信号成分であり、これがゲイン回路２２２で所定のゲインの振幅となり、窓かけ回路２２３に送られて、上記有声音部分とのつなぎを円滑化するための窓かけ処理が施される。
【００５３】
窓かけ回路２２３からの出力は、無声音合成部２２０からの出力として、ＬＰＣ合成フィルタ２１４のＵＶ（無声音）用の合成フィルタ２３７に送られる。合成フィルタ２３７では、ＬＰＣ合成処理が施されることにより無声音部分の時間波形データとなり、この無声音部分の時間波形データは無声音用ポストフィルタ２３８ｕでフィルタ処理された後、加算器２３９に送られる。この無声音用ポストフィルタ２３８ｕも、後述するように、内部のスペクトル整形フィルタのフィルタ係数の更新周期を２０サンプル、２．５ｍsec と短くし、ゲイン調整回路のゲイン更新周期を１６０サンプル、２０ｍsec と長くしている。
【００５４】
加算器２３９では、有声音用ポストフィルタ２３８ｖからの有声音部分の時間波形信号と、無声音用ポストフィルタ２３８ｕからの無声音部分の時間波形データとが加算され、出力端子２０１より取り出される。
【００５５】
次に、図４の音声信号復号化装置の要部のより具体的な構成及び動作についてさらに詳細に説明する。
【００５６】
ＬＰＣ合成フィルタ２１４は、上述したように、Ｖ（有声音）用の合成フィルタ２３６と、ＵＶ（無声音）用の合成フィルタ２３７とに分離されている。すなわち、合成フィルタを分離せずにＶ／ＵＶの区別なしに連続的にＬＳＰの補間を２０サンプルすなわち２．５ｍsec 毎に行う場合には、Ｖ→ＵＶ、ＵＶ→Ｖの遷移（トランジェント）部において、全く性質の異なるＬＳＰ同士を補間することになり、Ｖの残差にＵＶのＬＰＣが、ＵＶの残差にＶのＬＰＣが用いられることにより異音が発生するが、このような悪影響を防止するために、ＬＰＣ合成フィルタをＶ用とＵＶ用とで分離し、ＬＰＣの係数補間をＶとＵＶとで独立に行わせたものである。
【００５７】
この場合の、ＬＰＣ合成フィルタ２３６、２３７の係数補間方法について説明する。これは、次の表１に示すように、Ｖ／ＵＶの状態に応じてＬＳＰの補間を切り換えている。
【００５８】
【表１】

【００５９】
この表１において、均等間隔ＬＳＰとは、例えば１０次のＬＰＣ分析の例で述べると、フィルタの特性がフラットでゲインが１のときのαパラメータ、すなわち α₀＝１，α₁＝α₂＝・・・＝α₁₀＝０に対応するＬＳＰであり、
ＬＳＰ_i ＝（π／１１）×ｉ０≦ｉ≦１０
である。
【００６０】
このような１０次のＬＰＣ分析、すなわち１０次のＬＳＰの場合は、図５に示す通り、０〜πの間を１１等分した位置に均等間隔で配置されたＬＳＰで、完全にフラットなスペクトルに対応している。合成フィルタの全帯域ゲインはこのときが最小のスルー特性となる。
【００６１】
図６は、ゲイン変化の様子を概略的に示す図であり、ＵＶ（無声音）部分からＶ（有声音）部分への遷移時における１／Ｈ_UV(z) のゲイン及び１／Ｈ_V(z)のゲインの変化の様子を示している。
【００６２】
ここで、補間を行う単位は、フレーム間隔が１６０サンプル（２０ｍsec ）のとき、１／Ｈ_V(z)の係数は２．５ｍsec （２０サンプル）毎、また１／Ｈ_UV(z) の係数は、ビットレートが２ｋbps で１０ｍsec （８０サンプル）、６ｋbps で５ｍsec （４０サンプル）毎である。なお、ＵＶ時はエンコード側の第２の符号化部１２０で合成による分析法を用いた波形マッチングを行っているので、必ずしも均等間隔ＬＳＰと補間せずとも、隣接するＶ部分のＬＳＰとの補間を行ってもよい。ここで、第２の符号化部１２０におけるＵＶ部の符号化処理においては、Ｖ→ＵＶへの遷移部で１／Ａ(z) の重み付き合成フィルタ１２２の内部状態をクリアすることによりゼロインプットレスポンスを０にする。
【００６３】
これらのＬＰＣ合成フィルタ２３６、２３７からの出力は、それぞれ独立に設けられたポストフィルタ２３８ｖ、２３８ｕに送られており、ポストフィルタもＶとＵＶとで独立にかけることにより、ポストフィルタの強度、周波数特性をＶとＵＶとで異なる値に設定している。
【００６４】
次に、ＬＰＣ残差信号、すなわちＬＰＣ合成フィルタ入力であるエクサイテイションの、Ｖ部とＵＶ部のつなぎ部分の窓かけについて説明する。これは、図４の有声音合成部２１１のサイン波合成回路２１５と、無声音合成部２２０の窓かけ回路２２３とによりそれぞれ行われるものである。
【００６５】
Ｖ（有声音）部分では、隣接するフレームのスペクトルを用いてスペクトルを補間してサイン波合成するため、図７に示すように、第ｎフレームと第ｎ＋１フレームとの間にかかる全ての波形を作ることができる。しかし、図７の第ｎ＋１フレームと第ｎ＋２フレームとのように、ＶとＵＶ（無声音）に跨る部分、あるいはその逆の部分では、ＵＶ部分は、フレーム中に±８０サンプル（全１６０サンプル＝１フレーム間隔）のデータのみをエンコード及びデコードしている。このため、図８に示すように、Ｖ側ではフレームとフレームとの間の中心点ＣＮを越えて窓かけを行い、ＵＶ側では中心点ＣＮ以降の窓かけを行って、接続部分をオーバーラップさせている。ＵＶ→Ｖの遷移（トランジェント）部分では、その逆を行っている。なお、Ｖ側の窓かけは破線のようにしてもよい。
【００６６】
次に、Ｖ（有声音）部分でのノイズ合成及びノイズ加算について説明する。これは、図４のノイズ合成回路２１６、重み付き重畳回路２１７、及び加算器２１８を用いて、有声音部分のＬＰＣ合成フィルタ入力となるエクサイテイションについて、次のパラメータを考慮したノイズをＬＰＣ残差信号の有声音部分に加えることにより行われる。
【００６７】
すなわち、上記パラメータとしては、ピッチラグＰch、有声音のスペクトル振幅Ａm[i]、フレーム内の最大スペクトル振幅Ａmax 、及び残差信号のレベルＬevを挙げることができる。ここで、ピッチラグＰchは、所定のサンプリング周波数ｆs （例えばｆs＝８kHz）でのピッチ周期内のサンプル数であり、スペクトル振幅Ａm[i]のｉは、ｆs／２の帯域内でのハーモニックスの本数をＩ＝Ｐch／２とするとき、０＜ｉ＜Ｉの範囲内の整数である。
【００６８】
このノイズ合成回路２１６による処理は、例えばＭＢＥ（マルチバンド励起）符号化の無声音の合成と同様な方法で行われる。図９は、ノイズ合成回路２１６の具体例を示している。
【００６９】
すなわち図９において、ホワイトノイズ発生部４０１からは、時間軸上のホワイトノイズ信号波形に所定の長さ（例えば２５６サンプル）で適当な窓関数（例えばハミング窓）により窓かけされたガウシャンノイズが出力され、これがＳＴＦＴ処理部４０２によりＳＴＦＴ（ショートタームフーリエ変換）処理を施すことにより、ノイズの周波数軸上のパワースペクトルを得る。このＳＴＦＴ処理部４０２からのパワースペクトルを振幅処理のための乗算器４０３に送り、ノイズ振幅制御回路４１０からの出力を乗算している。乗算器４０３からの出力は、ＩＳＴＦＴ処理部４０４に送られ、位相は元のホワイトノイズの位相を用いて逆ＳＴＦＴ処理を施すことにより時間軸上の信号に変換する。ＩＳＴＦＴ処理部４０４からの出力は、上記図４の重み付き重畳加算回路２１７に送られる。
【００７０】
ノイズ振幅制御回路４１０は、例えば図１０のような基本構成を有し、上記図４のスペクトルエンベロープの逆量子化器２１２から端子４１１を介して与えられるＶ（有声音）についての上記スペクトル振幅Ａm[i]と、上記図４の入力端子２０４から端子４１２を介して与えられる上記ピッチラグＰchに基づいて、乗算器４０３での乗算係数を制御することにより、合成されるノイズ振幅Ａm_noise[i]を求めている。すなわち図１０において、スペクトル振幅Ａm[i]とピッチラグＰchとが入力される最適なnoise_mix 値の算出回路４１６からの出力をノイズの重み付け回路４１７で重み付けし、得られた出力を乗算器４１８に送ってスペクトル振幅Ａm[i]と乗算することにより、ノイズ振幅Ａm_noise[i]を得ている。
【００７１】
ここで、ノイズ合成加算の第１の具体例として、ノイズ振幅Ａm_noise[i]が、上記４つのパラメータの内の２つ、すなわちピッチラグＰch及びスペクトル振幅Ａm[i]の関数ｆ₁(Pch,Am[i])となる場合について説明する。
【００７２】
このような関数ｆ₁(Pch,Am[i])の具体例として、
ｆ₁(Pch,Am[i])＝０（０＜ｉ＜Noise_b×Ｉ）
ｆ₁(Pch,Am[i])＝Am[i]×noise_mix （Noise_b×Ｉ≦ｉ＜Ｉ）
noise_mix ＝Ｋ×Ｐch／２.0
とすることが挙げられる。
【００７３】
ただし、noise_mix の最大値は、noise_mix_max とし、その値でクリップする。一例として、Ｋ＝０.0２、noise_mix_max＝０.３、Noise_b＝０.７とすることが挙げられる。ここで、Noise_b は、全帯域の何割からこのノイズの付加を行うかを決める定数である。本例では、７割より高域側、すなわちｆs＝８kHzのとき、４０００×０．７＝２８００Hzから４０００Hzの間でノイズを付加するようにしている。
【００７４】
次に、ノイズ合成加算の第２の具体例として、上記ノイズ振幅Ａm_noise[i]を、上記４つのパラメータの内の３つ、すなわちピッチラグＰch、スペクトル振幅Ａm[i]及び最大スペクトル振幅Ａmax の関数ｆ₂(Pch,Am[i],Amax) とする場合について説明する。
【００７５】
このような関数ｆ₂(Pch,Am[i],Amax) の具体例として、
ｆ₂(Pch,Am[i],Amax)＝０（０＜ｉ＜Noise_b×Ｉ）
ｆ₂(Pch,Am[i],Amax)＝Am[i]×noise_mix （Noise_b×Ｉ≦ｉ＜Ｉ）
noise_mix ＝Ｋ×Ｐch／２.0
を挙げることができる。ただし、noise_mix の最大値は、noise_mix_max とし、一例として、Ｋ＝０.0２、noise_mix_max＝０.３、Noise_b＝０.７とすることが挙げられる。
【００７６】
さらに、
もしＡm[i]×noise_mix＞Ａmax×Ｃ×noise_mix ならば、
ｆ₂(Pch,Am[i],Amax)＝Ａmax×Ｃ×noise_mix
とする。ここで、定数Ｃは、Ｃ＝０.３としている。この条件式によりノイズレベルが大きくなり過ぎることを防止できるため、上記Ｋ、noise_mix_max をさらに大きくしてもよく、高域のレベルも比較的大きいときにノイズレベルを高めることができる。
【００７７】
次に、ノイズ合成加算の第３の具体例として、上記ノイズ振幅Ａm_noise[i]を、上記４つのパラメータの内の４つ全ての関数ｆ₃(Pch,Am[i],Amax,Lev) とすることもできる。
【００７８】
このような関数ｆ₃(Pch,Am[i],Amax,Lev) の具体例は、基本的には上記第２の具体例の関数ｆ₂(Pch,Am[i],Amax) と同様である。ただし、残差信号レベルLev は、スペクトル振幅Ａm[i]のｒｍｓ（root mean square）、あるいは時間軸上で測定した信号レベルである。上記第２の具体例との違いは、Ｋの値とnoise_mix_max の値とをLev の関数とする点である。すなわち、Lev が小さくなったときには、Ｋ、noise_mix_max の各値を大きめに設定し、Lev が大きいときは小さめに設定する。あるいは、連続的にLev の値を逆比例させてもよい。
【００７９】
次に、ポストフィルタ２３８ｖ、２３８ｕについて説明する。
【００８０】
図１１は、図４の例のポストフィルタ２３８ｖ、２３８ｕとして用いられるポストフィルタを示しており、ポストフィルタの要部となるスペクトル整形フィルタ４４０は、ホルマント強調フィルタ４４１と高域強調フィルタ４４２とから成っている。このスペクトル整形フィルタ４４０からの出力は、スペクトル整形によるゲイン制御を補正するためのゲイン調整回路４４３に送られており、このゲイン調整回路４４３のゲインＧは、ゲイン制御回路４４５により、スペクトル整形フィルタ４４０の入力ｘと出力ｙとを比較してゲイン変化を計算し、補正値を算出することで決定される。
【００８１】
スペクトル整形フィルタの４４０特性ＰＦ(z) は、ＬＰＣ合成フィルタの分母Ｈv(z)、Ｈuv(z) の係数、いわゆるαパラメータをα_iとすると、
【００８２】
【数１】

【００８３】
と表せる。この式の分数部分がホルマント強調フィルタ特性を、（１−ｋｚ^-1）の部分が高域強調フィルタ特性をそれぞれ表す。また、β、γ、ｋは定数であり、一例としてβ＝０．６、γ＝０．８、ｋ＝０．３を挙げることができる。
【００８４】
また、ゲイン調整回路４４３のゲインＧは、
【００８５】
【数２】

【００８６】
としている。この式中のｘ(i) はスペクトル整形フィルタ４４０の入力、ｙ(i) はスペクトル整形フィルタ４４０の出力である。
【００８７】
ここで、上記スペクトル整形フィルタ４４０の係数の更新周期は、図１２に示すように、ＬＰＣ合成フィルタの係数であるαパラメータの更新周期と同じく２０サンプル、２．５ｍsec であるのに対して、ゲイン調整回路４４３のゲインＧの更新周期は、１６０サンプル、２０ｍsec である。
【００８８】
このように、ポストフィルタのスペクトル整形フィルタ４４０の係数の更新周期に比較して、ゲイン調整回路４４３のゲインＧの更新周期を長くとることにより、ゲイン調整の変動による悪影響を防止している。
【００８９】
すなわち、一般のポストフィルタにおいては、スペクトル整形フィルタの係数の更新周期とゲインの更新周期とを同じにしており、このとき、ゲインの更新周期を２０サンプル、２．５ｍsec とすると、図１２からも明らかなように、１ピッチ周期の中で変動することになり、クリックノイズを生じる原因となる。そこで本例においては、ゲインの切換周期をより長く、例えば１フレーム分の１６０サンプル、２０ｍsec とすることにより、ゲインの変動を防止することができる。また逆に、スペクトル整形フィルタの係数の更新周期を１６０サンプル、２０ｍsec と長くするときには、短時間の音声スペクトルの変化にポストフィルタ特性が追従できず、良好な聴感上の品質改善が行えないが、このフィルタ係数の更新周期を２０サンプル、２．５ｍsec と短くすることにより、効果的なポストフィルタ処理が可能となる。
【００９０】
なお、隣接するフレーム間でのゲインのつなぎ処理は、図１３に示すように、前フレームのフィルタ係数及びゲインと、現フレームのフィルタ係数及びゲインとを用いて算出した結果に、次のような三角窓
Ｗ(i) ＝ｉ／２０（０≦ｉ≦２０）
と
１−Ｗ(i) （０≦ｉ≦２０）
をかけてフェードイン、フェードアウトを行って加算する。図１３では、前フレームのゲインＧ_１が現フレームのゲインＧ_２に変化する様子を示している。すなわち、オーバーラップ部分では、前フレームのゲイン、フィルタ係数を使用する割合が徐々に減衰し、現フレームのゲイン、フィルタ係数の使用が徐々に増大する。なお、図１３の時刻Ｔにおけるフィルタの内部状態は、現フレームのフィルタ、前フレームのフィルタ共に同じもの、すなわち前フレームの最終状態からスタートする。
【００９１】
以上説明したような信号符号化装置及び信号復号化装置は、例えば図１４及び図１５に示すような携帯通信端末あるいは携帯電話機等に使用される音声コーデックとして用いることができる。
【００９２】
すなわち、図１４は、上記図１、図３に示したような構成を有する音声符号化部１６０を用いて成る携帯端末の送信側構成を示している。この図１４のマイクロホン１６１で集音された音声信号は、アンプ１６２で増幅され、Ａ／Ｄ（アナログ／ディジタル）変換器１６３でディジタル信号に変換されて、音声符号化部１６０に送られる。この音声符号化部１６０は、上述した図１、図３に示すような構成を有しており、この入力端子１０１に上記Ａ／Ｄ変換器１６３からのディジタル信号が入力される。音声符号化部１６０では、上記図１、図３と共に説明したような符号化処理が行われ、図１、図２の各出力端子からの出力信号は、音声符号化部１６０の出力信号として、伝送路符号化部１６４に送られる。伝送路符号化部１６４では、いわゆるチャネルコーディング処理が施され、その出力信号が変調回路１６５に送られて変調され、Ｄ／Ａ（ディジタル／アナログ）変換器１６６、ＲＦアンプ１６７を介して、アンテナ１６８に送られる。
【００９３】
また、図１５は、上記図２、図４に示したような構成を有する音声復号化部２６０を用いて成る携帯端末の受信側構成を示している。この図１５のアンテナ２６１で受信された音声信号は、ＲＦアンプ２６２で増幅され、Ａ／Ｄ（アナログ／ディジタル）変換器２６３を介して、復調回路２６４に送られ、復調信号が伝送路復号化部２６５に送られる。２６４からの出力信号は、上記図２、図４に示すような構成を有する音声復号化部２６０に送られる。音声復号化部２６０では、上記図２、図４と共に説明したような復号化処理が施され、図２、図４の出力端子２０１からの出力信号が、音声復号化部２６０からの信号としてＤ／Ａ（ディジタル／アナログ）変換器２６６に送られる。このＤ／Ａ変換器２６６からのアナログ音声信号がスピーカ２６８に送られる。
【００９４】
なお、本発明は上記実施の形態のみに限定されるものではなく、例えば上記図１、図３の音声分析側（エンコード側）の構成や、図２、図４の音声合成側（デコード側）の構成については、各部をハードウェア的に記載しているが、いわゆるＤＳＰ（ディジタル信号プロセッサ）等を用いてソフトウェアプログラムにより実現することも可能である。また、デコーダ側の合成フィルタ２３６、２３７や、ポストフィルタ２３８ｖ、２３８ｕは、図４のように有声音用と無声音用とで分離しなくとも、有声音及び無声音の共用のＬＰＣ合成フィルタやポストフィルタを用いるようにしてもよい。さらに、本発明の適用範囲は、伝送や記録再生に限定されず、ピッチ変換やスピード変換、規則音声合成、あるいは雑音抑圧のような種々の用途に応用できることは勿論である。
【００９５】
【発明の効果】
以上の説明から明らかなように、本発明によれば、符号化された音声信号が復号化されて供給されるスペクトル整形フィルタのフィルタ係数を第１の周期で更新するようにし、このスペクトル整形によるゲイン変化を補正するためのゲイン調整のゲインを第１の周期とは異なる第２の周期で更新しており、それぞれの機能に応じた最適の周期を選ぶことで、ポストフィルタ全体としての特性を改善できる。
【００９６】
特に、スペクトル整形フィルタのフィルタ係数の更新周期である第１の周期を短くし、ゲイン調整のゲイン更新周期である第２の周期を長くすることにより、追従速度が速く滑らかに変化してゆくフィルタ係数の切換を行うと共に、頻繁なゲイン切換によるレベル変動を抑えることができ、より効果的なポストフィルタ処理が可能となって、聴感上の品質改善がより高められる。
【図面の簡単な説明】
【図１】本発明に係る音声復号化装置に入力される符号化音声を得るための音声符号化装置の一例の基本構成を示すブロック図である。
【図２】本発明に係る音声復号化方法の実施の形態が適用される音声信号復号化装置の基本構成を示すブロック図である。
【図３】図１の音声信号符号化装置のより具体的な構成を示すブロック図である。
【図４】本発明の実施の形態となる音声信号復号化装置のより具体的な構成を示すブロック図である。
【図５】１０次のＬＰＣ分析により得られたαパラメータに基づく１０次のＬＳＰ（線スペクトル対）を示す図である。
【図６】ＵＶ（無声音）フレームからＶ（有声音）フレームへのゲイン変化の様子を説明するための図である。
【図７】フレーム毎に合成されるスペクトルや波形の補間処理を説明するための図である。
【図８】Ｖ（有声音）フレームとＵＶ（無声音）フレームとの接続部でのオーバーラップを説明するための図である。
【図９】有声音合成の際のノイズ加算処理を説明するための図である。
【図１０】有声音合成の際に加算されるノイズの振幅計算の例を示す図である。
【図１１】ポストフィルタの構成例を示す図である。
【図１２】ポストフィルタのフィルタ係数更新周期とゲイン更新周期とを説明するための図である。
【図１３】ポストフィルタのゲイン、フィルタ係数のフレーム境界部分でのつなぎ処理を説明するための図である。
【図１４】本発明の実施の形態となる音声信号符号化装置が用いられる携帯端末の送信側構成を示すブロック図である。
【図１５】本発明の実施の形態となる音声信号復号化装置が用いられる携帯端末の受信側構成を示すブロック図である。
【符号の説明】
１１０第１の符号化部
１１１ＬＰＣ逆フィルタ
１１３ＬＰＣ分析・量子化部
１１４サイン波分析符号化部
１１５Ｖ／ＵＶ判定部
１２０第２の符号化部
１２１雑音符号帳
１２２重み付き合成フィルタ
１２３減算器
１２４距離計算回路
１２５聴覚重み付けフィルタ
２３８ポストフィルタ
２３８ｖ有声音用ポストフィルタ
２３８ｕ無声音用ポストフィルタ
４４０スペクトル整形フィルタ
４４１ホルマント強調フィルタ
４４２高域強調フィルタ
４４３ゲイン調整回路
４４５ゲイン制御回路

Claims

符号化された音声信号が入力され、復号化した後にポストフィルタ処理を施す音声復号化方法において、
復号化された信号が入力され、フィルタ係数が第１の周期で更新されるスペクトル整形フィルタ処理工程と、
このスペクトル整形フィルタ処理によるゲイン変化を補正するためのゲイン調整を行うと共に調整ゲインが上記第１の周期とは異なる第２の周期で更新されるゲイン調整工程とを有すること
を特徴とする音声復号化方法。
上記第２の周期を上記第１の周期よりも長くすること
を特徴とする請求項１記載の音声復号化方法。
上記ゲイン調整工程は、上記スペクトル整形フィルタ処理前のレベルと処理後のレベルとを比較することにより調整ゲインを決定すること
を特徴とする請求項１記載の音声復号化方法。
符号化された音声信号が入力され、復号化した後にポストフィルタ処理を施す音声復号化装置において、
復号化された信号が入力され、フィルタ係数が第１の周期で更新されるスペクトル整形フィルタ手段と、
このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第１の周期とは異なる第２の周期で更新されるゲイン調整手段とを有すること
を特徴とする音声復号化装置。
上記第２の周期を上記第１の周期よりも長くすること
を特徴とする請求項４記載の音声復号化装置。