JP4464488B2

JP4464488B2 - 音声復号化装置及び符号誤り補償方法、音声復号化方法

Info

Publication number: JP4464488B2
Application number: JP18571299A
Authority: JP
Inventors: 幸司吉田; 宏幸江原; 芹沢　　昌宏; 一範小澤
Original assignee: Panasonic Corp; NEC Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; NEC Corp; Panasonic Holdings Corp
Priority date: 1999-06-30
Filing date: 1999-06-30
Publication date: 2010-05-19
Anticipated expiration: 2019-06-30
Also published as: KR100439652B1; CA2377597A1; EP2276021A3; CN1359513A; EP2276021A2; KR20020027378A; CN1220177C; WO2001003115A1; US7499853B2; US20070100614A1; US7171354B1; EP1207519A4; EP2276021B1; CA2377597C; AU5706400A; JP2001013998A; EP1207519B1; EP1207519A1

Description

【０００１】
【発明の属する技術分野】
本発明は、音声信号を符号化して伝送する移動通信システムや音声録音装置などに用いられる音声復号化装置及び符号誤り補償方法、音声復号化方法に関する。
【０００２】
【従来の技術】
ディジタル移動通信や音声蓄積の分野においては、電波や記憶媒体の有効利用のために音声情報を圧縮し、低いビットレートで符号化する音声符号化装置が用いられている。その際、伝送路（又は記録媒体）に誤りが生じた際に、復号側において、その誤りを検出し、復号音声品質の劣化を抑えるための誤り補償方法が用いられる。
【０００３】
そのような従来の技術として、ＩＴＵ−Ｔ勧告Ｇ．７２９（"Coding of speech at 8kbit/s using conjugate-structure algebraic-code-excited linear-prediction(CS-ACELP)"）のＣＳ−ＡＣＥＬＰ符号化方式に記載された誤り補償方法がある。
【０００４】
図９は、ＣＳ−ＡＣＥＬＰ符号化方式の誤り補償を含んだ音声復号化装置の構成を示すブロック図である。図９において、音声復号は、１０ｍｓのフレーム単位（復号単位）で行われ、そのフレーム単位で伝送路の誤り検出の有無が音声復号化装置に通知されるものとする。
【０００５】
まず、伝送路誤りが検出されないフレームでの受信符号化データは、データ分離部９０１において、復号に必要な各パラメータに分離される。そして、ラグパラメータ復号部９０２により復号されたラグパラメータを用いて適応音源符号帳９０３により適応音源が生成され、また固定音源符号帳９０４により固定音源が生成される。また、ゲインパラメータ復号部９０５により復号されたゲインを用いて、乗算器９０６で乗算を行い、加算器９０７で加算することにより駆動音源が生成される。また、ＬＰＣパラメータ復号部９０８により復号されたＬＰＣパラメータを用いてＬＰＣ合成フィルタ９０９及びポストフィルタ９１０を経由して復号音声が生成される。
【０００６】
一方、伝送路誤りが検出されたフレームでの受信符号化データに対しては、ラグパラメータとして、誤りが検出されなかった前フレームのラグパラメータを用いて適応音源を生成し、また、固定音源符号帳９０４に対してランダムな固定音源符号を与えることで固定音源を生成し、ゲインパラメータとして、前フレームの適応音源ゲイン及び固定音源ゲインを減衰させた値を用いて駆動音源を生成し、ＬＰＣパラメータとして、前フレームＬＰＣパラメータを用いてＬＰＣ合成及びポストフィルタ処理を行って復号音声を得る。
【０００７】
このようにして、上記音声復号化装置において、伝送路誤り時に、誤り補償処理を行うことができる。
【０００８】
【発明が解決しようとする課題】
しかしながら、上記従来の音声符号化装置では、誤りが検出されたフレームにおける音声の特性（有声や無声など）に関わらず同様な補償処理を行っていると共に、主として過去のパラメータのみを用いて誤り補償を行っているため、誤り補償時の復号音声品質劣化の改善に限界がある。
【０００９】
本発明はかかる点に鑑みてなされたものであり、誤りが検出されたフレームにおいて、より改善された復号音声品質を実現することができる音声復号化装置及び誤り補償方法、音声復号化方法を提供することを目的とする。
【００１０】
【課題を解決するための手段】
本発明の骨子は、音声の短区間（フレーム）毎の特徴を表すモード情報を音声符号化パラメータに含み、音声復号化装置において、そのモード情報に応じて、音声復号に用いるラグパラメータ及びゲインパラメータを適応的に算出することである。
【００１１】
また、本発明の骨子は、音声復号化装置において、そのモード情報に応じて、適応音源ゲインと固定音源ゲインの比率を適応的に制御することである。
【００１２】
さらに、本発明の骨子は、符号化データに誤りが検出された復号単位の直後の、誤りが検出されない正常な復号単位において、復号ゲインパラメータの値に応じて音声復号に用いる適応音源ゲインパラメータ及び固定音源ゲインパラメータを適応的に制御することである。
【００１３】
【発明の実施の形態】
本発明の第１の態様に係る音声復号化装置は、モード情報、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記モード情報、ラグパラメータ、及びゲインパラメータを復号化する復号化手段と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する決定手段と、を具備する構成を採る。
【００１４】
この構成によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータ及びゲインパラメータを復号されたモード情報に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【００１５】
本発明の第２の態様に係る音声復号化装置は、第１の態様において、決定手段は、ラグパラメータの復号単位内及び／又は復号単位間の変動を検出する検出手段を具備し、前記検出手段の検出結果と前記モード情報に基づいて前記復号単位で用いるラグパラメータを決定する構成を採る。
【００１６】
この構成によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータを、復号されたモード情報、復号単位内及び／又は復号単位間の変動検出結果に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【００１７】
本発明の第３の態様に係る音声復号化装置は、第２の態様において、モード情報の示すモードが過渡モード又は無声モードであって、前記検出手段がラグパラメータの復号単位内及び／又は復号単位間の所定量以上の変動を検出しない場合に、復号単位についての前記ラグパラメータを用い、その他の場合に、過去の復号単位に対するラグパラメータを用いる構成を採る。
【００１８】
この構成によれば、特に誤り検出復号単位が音声の立ち上がりである場合における復号音声品質の改善を実現することができる。
【００１９】
本発明の第４の態様に係る音声復号化装置は、第１から第３のいずれかの態様において、決定手段が、モード情報の示すモードが過渡モード又は無声モードである場合に、過去の復号単位に対するゲインパラメータに基づいてゲインパラメータの範囲制限を行う制限制御手段を有し、範囲制限されたゲインパラメータをゲインパラメータとして決定する構成を採る。
【００２０】
この構成によれば、現復号単位の符号化データに誤りが検出され、かつモード情報が過渡又は無声を示す場合には、現復号単位の符号化データから復号したゲインパラメータに対して、過去のゲインパラメータからの増加の上限又は／及び減少の下限を規定して出力ゲインを制御するので、誤りを含む得る符号化データから復号したゲインパラメータが誤りによる異常な値となることを抑えることができ、より改善された復号音声品質を実現することができる。
【００２１】
本発明の第５の態様に係る音声復号化装置は、モード情報、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記モード情報、ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する復号化手段と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記適応音源ゲインと前記固定音源ゲインとの比率を制御する比率制御手段と、を具備する構成を採る。
【００２２】
本発明の第６の態様に係る音声復号化装置は、第５の態様において、前記比率制御手段は、前記モード情報が有声モードである場合に、適応音源ゲインの比率を高くし、前記モード情報が過渡モード又は無声モードである場合に、適応音源ゲインの比率を低くするようにゲイン比率を制御する構成を採る。
【００２３】
これらの構成によれば、符号化データに誤りが検出された復号単位でのゲインパラメータ復号の際に、適応音源ゲインと固定音源ゲインの比率を、モード情報に応じて適応的に制御するので、誤り検出復号単位の復号音声品質を聴感的により改善させることができる。
【００２４】
本発明の第７の態様に係る音声復号化装置は、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する復号化手段と、誤りが検出された復号単位直後の正常な復号単位において、ゲインパラメータの上限を規定する規定手段と、を具備する構成を採る。
【００２５】
この構成によれば、符号化データに誤りが検出された復号単位直後の、誤りが検出されない正常な復号単位において、復号された適応音源ゲインパラメータの上限値を規定するように制御するので、誤り検出直後の正常復号単位での復号音声信号の異常な振幅増大による復号音声品質の劣化を抑えることができる。
【００２６】
本発明の第８の態様に係る音声復号化装置は、第７の態様において、前記規定手段が、上限が規定された範囲における適応音源ゲインに対して所定の比率を保つように固定音源ゲインを制御する構成を採る。
【００２７】
この構成によれば、適応音源ゲインと固定音源ゲインとの間の比率を誤りのない本来の復号ゲインでの値になるように制御するので、誤り検出直後の正常復号単位での音源信号が誤りのない場合により類似することとなり、復号音声品質の改善を図ることができる。
【００２８】
本発明の第９の態様に係る音声復号化装置は、ラグパラメータ及びゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記ラグパラメータ及びゲインパラメータを復号化する復号化手段と、前記データを復号化して得られる復号化パラメータ又は復号化信号からモード情報を求めるモード算出手段と、前記データにおいて誤りが検出された復号単位について、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する決定手段と、を具備する構成を採る。
【００２９】
この構成によれば、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても、音声復号に用いるラグパラメータ及びゲインパラメータを、復号側で算出したモード情報に基づいて適応的に算出することができ、より改善された復号音声品質を実現することができる。
【００３０】
本発明の第１０の態様に係る音声復号化装置は、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する復号化手段と、前記データを復号化して得られる復号化パラメータ又は復号化信号からモード情報を求めるモード算出手段と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記適応音源用ゲインと前記固定音源用ゲインとの比率を制御する比率制御手段と、を具備する構成を採る。
【００３１】
この構成によれば、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても、符号化データに誤りが検出された復号単位でのゲインパラメータ復号の際に、適応音源ゲインと固定音源ゲインの比率を、復号側で算出したモード情報に応じて適応的に制御するので、誤り検出復号単位の復号音声品質を聴感的により改善させることができる。
【００３２】
本発明の第１１の態様に係る基地局装置は、第１から第１０のいずれかの態様の音声復号化装置を備えたことを特徴とする。本発明の第１２の態様に係る通信端末装置は、第１から第１０のいずれかの態様の音声復号化装置を備えたことを特徴とする。これらの構成によれば、これにより、伝送誤りに対する耐性のある無線通信を行うことができる。
【００３３】
本発明の第１３の態様に係る符号誤り補償方法は、モード情報、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータにおける前記モード情報、ラグパラメータ、及びゲインパラメータを復号化する工程と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する工程と、を具備する。
【００３４】
この方法によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータ及びゲインパラメータを復号されたモード情報に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【００３５】
本発明の第１４の態様に係る符号誤り補償方法は、第１３の態様において、ラグパラメータの復号単位内及び／又は復号単位間の変動を検出する工程を具備し、検出結果と前記モード情報に基づいて前記復号単位で用いるラグパラメータを決定する。
【００３６】
この方法によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータを、復号されたモード情報、復号単位内及び／又は復号単位間の変動検出結果に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【００３７】
本発明の第１５の態様に係る符号誤り補償方法は、第１４の態様において、モード情報の示すモードが過渡モード又は無声モードであって、ラグパラメータの復号単位内及び／又は復号単位間の所定量以上の変動を検出しない場合に、復号単位についての前記ラグパラメータを用い、その他の場合に、過去の復号単位に対するラグパラメータを用いる。
【００３８】
この方法によれば、特に誤り検出復号単位が音声の立ち上がりである場合における復号音声品質の改善を実現することができる。
【００３９】
本発明の第１６の態様に係る符号誤り補償方法は、第１３から第１５のいずれかの態様において、モード情報の示すモードが過渡モード又は無声モードである場合に、過去の復号単位に対するゲインパラメータに基づいてゲインパラメータの範囲制限を行い、範囲制限されたゲインパラメータをゲインパラメータとして決定する。
【００４０】
この方法によれば、現復号単位の符号化データに誤りが検出され、かつモード情報が過渡又は無声を示す場合には、現復号単位の符号化データから復号したゲインパラメータに対して、過去のゲインパラメータからの増加の上限又は／及び減少の下限を規定して出力ゲインを制御するので、誤りを含む得る符号化データから復号したゲインパラメータが誤りによる異常な値となることを抑えることができ、より改善された復号音声品質を実現することができる。
【００４１】
本発明の第１７の態様に係る符号誤り補償方法は、モード情報、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する工程と、前記モード情報、ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する工程と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記適応音源ゲインと前記固定音源ゲインとの比率を制御する工程と、を具備する。
【００４２】
本発明の第１８の態様に係る符号誤り補償方法は、第１７の態様において、モード情報の示すモードが有声モードである場合に、適応音源ゲインの比率を高くし、前記モード情報の示すモードが過渡モード又は無声モードである場合に、適応音源ゲインの比率を低くするように、適応音源ゲインと固定音源ゲインとの間のゲイン比率を制御する。
【００４３】
これらの方法によれば、符号化データに誤りが検出された復号単位でのゲインパラメータ復号の際に、適応音源ゲインと固定音源ゲインの比率を、モード情報に応じて適応的に制御するので、誤り検出復号単位の復号音声品質を聴感的により改善させることができる。
【００４４】
本発明の第１９の態様に係る符号誤り補償方法は、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する工程と、前記ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する工程と、誤りが検出された復号単位直後の正常な復号単位において、ゲインパラメータの上限を規定する工程と、を具備する。
【００４５】
この方法によれば、符号化データに誤りが検出された復号単位直後の、誤りが検出されない正常な復号単位において、復号された適応音源ゲインパラメータの上限値を規定するように制御するので、誤り検出直後の正常復号単位での復号音声信号の異常な振幅増大による復号音声品質の劣化を抑えることができる。
【００４６】
本発明の第２０の態様に係る符号誤り補償方法は、第１９の態様において、上限が規定された範囲における適応音源ゲインに対して所定の比率を保つように固定音源ゲインを制御する。
【００４７】
この方法によれば、適応音源ゲインと固定音源ゲインとの間の比率を誤りのない本来の復号ゲインでの値になるように制御するので、誤り検出直後の正常復号単位での音源信号がより誤りのない場合により類似することとなり、復号音声品質の改善を図ることができる。
【００４８】
本発明の第２１の態様に係る符号誤り補償方法は、ラグパラメータ及びゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する工程と、前記ラグパラメータ及びゲインパラメータを復号化する工程と、前記データを復号化して得られる復号化パラメータ又は復号化信号からモード情報を求める工程と、前記データにおいて誤りが検出された復号単位について、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する工程と、を具備する。
【００４９】
この方法によれば、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても、音声復号に用いるラグパラメータ及びゲインパラメータを、復号側で算出したモード情報に基づいて適応的に算出することができ、より改善された復号音声品質を実現することができる。
【００５０】
本発明の第２２の態様に係る記録媒体は、プログラムを格納し、コンピュータにより読み取り可能な記録媒体であって、前記プログラムは、モード情報、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータにおける前記モード情報、ラグパラメータ、及びゲインパラメータを復号化する手順と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する手順と、を含む。
【００５１】
この媒体によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータ及びゲインパラメータを復号されたモード情報に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【００５２】
本発明の第２３の態様に係る記録媒体は、プログラムを格納し、コンピュータにより読み取り可能な記録媒体であって、前記プログラムは、モード情報、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータにおける前記モード情報、ラグパラメータ、及びゲインパラメータを復号化する手順と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記モード情報の示すモードが有声モードである場合に、適応音源ゲインの比率を高くし、前記モード情報の示すモードが過渡モード又は無声モードである場合に、適応音源ゲインの比率を低くするように、適応音源ゲインと固定音源ゲインとの間のゲイン比率を制御する手順と、を含む。
【００５３】
この媒体によれば、符号化データに誤りが検出された復号単位でのゲインパラメータ復号の際に、適応音源ゲインと固定音源ゲインの比率を、モード情報に応じて適応的に制御するので、誤り検出復号単位の復号音声品質を聴感的により改善させることができる。
【００５４】
本発明の第２４の態様に係る記録媒体は、プログラムを格納し、コンピュータにより読み取り可能な記録媒体であって、前記プログラムは、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータにおける前記ラグパラメータ、及びゲインパラメータを復号化する手順と、誤りが検出された復号単位直後の正常な復号単位について、ゲインパラメータの上限を規定し、上限が規定された範囲における適応音源ゲインに対して所定の比率を保つように固定音源ゲインを制御する手順と、を含む。
【００５５】
この媒体によれば、誤り検出直後の正常復号単位での復号音声信号の異常な振幅増大による復号音声品質の劣化を抑えることができる。
【００５６】
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
（実施の形態１）
図１は、本発明の実施の形態１に係る音声復号化装置を備えた無線通信装置の構成を示すブロック図である。ここで、無線通信装置とは、ディジタル無線通信システムにおける基地局装置や移動局のような通信端末装置などをいう。
【００５７】
この無線通信装置において、送信側で音声がマイクなどの音声入力装置１０１によって電気的アナログ信号に変換され、Ａ／Ｄ変換器１０２に出力される。アナログ音声信号は、Ａ／Ｄ変換器１０２によってディジタル音声信号に変換され、音声符号化部１０３に出力される。音声符号化部１０３は、ディジタル音声信号に対して音声符号化処理を行い、符号化した情報を変復調部１０４に出力する。変復調部１０４は、符号化された音声信号をディジタル変調して、無線送信部１０５に送る。無線送信部１０５では、変調後の信号に所定の無線送信処理を施す。この信号は、アンテナ１０６を介して送信される。
【００５８】
一方、無線通信装置の受信側では、アンテナ１０７で受信した受信信号は、無線受信部１０８で所定の無線受信処理が施され、変復調部１０４に送られる。変復調部１０４では、受信信号に対して復調処理を行い、復調後の信号を音声復号化部１０９に出力する。音声復号化部１０９は、復調後の信号に復号処理を行ってディジタル復号音声信号を得て、そのディジタル復号音声信号をＤ／Ａ変換器１１０へ出力する。Ｄ／Ａ変換器１１０は、音声復号化部１０９から出力されたディジタル復号音声信号をアナログ復号音声信号に変換してスピーカなどの音声出力装置１１１に出力する。最後に音声出力装置１１１が電気的アナログ復号音声信号を復号音声に変換して出力する。
【００５９】
図２に本発明の実施の形態１に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置における誤り補償方法は、音声符号化部側で入力音声信号を符号化した符号化データに対して、音声復号化側で誤りが検出された場合に、音声復号化時に復号音声の品質劣化を抑えるように動作するものである。
【００６０】
ここで、音声復号は、１０〜５０ｍｓ程度の一定の短区間（フレームと呼ぶ）の単位で行われ、そのフレーム単位で受信データに誤りが生じているかどうかの検出結果が誤り検出フラグとして通知される。この誤り検出方法としては、通常、ＣＲＣ（Cyclic Redundancy Check）などが用いられる。誤り検出は、本音声復号化装置の外部で予め行われるものとし、誤り検出の対象データとして、フレーム毎の符号化データの全てを対象としても、あるいは聴感的に重要な符号化データのみを対象としても良い。
【００６１】
また、本発明の誤り補償方法を適用する音声符号化方式においては、その音声符号化パラメータ（伝送パラメータ）に、少なくとも、音声信号のフレーム毎の特徴を表すモード情報、音声信号のピッチ周期又は適応音源に関する情報を表すラグパラメータ、及び音源信号又は音声信号のゲイン情報を表すゲインパラメータを少なくとも含むものを対象とする。
【００６２】
まず、音声復号を行う現フレームの符号化データに誤りが検出されない場合について説明する。この場合は、誤り補償の動作は行われず、通常の音声復号が行われる。図２において、データ分離部２０１により符号化データから各音声符号化パラメータに分離される。そして、モード情報復号部２０２、ＬＰＣパラメータ復号部２０３、ラグパラメータ復号部２０４、及びゲインパラメータ復号部２０５により、それぞれモード情報、ＬＰＣパラメータ、ラグパラメータ、及びゲインパラメータが復号される。
【００６３】
ここで、モード情報とは、フレーム単位での音声信号の状態を表すもので、典型的には、有声、無声、過渡といったモードが存在し、符号化側でこれらの状態に応じた符号化が行われる。例えば、ＩＳＯ／ＩＥＣで標準化された規格ＩＳＯ／ＩＥＣ１４４９６−３(ＭＰＥＧ−４ Audio)のＭＰＥ(Multi Pulse Excitation)モードでのＣＥＬＰ符号化においては、符号化側でピッチ予測ゲインに基づいて無声、過渡、有声（弱い周期性）、有声（強い周期性）の４つのモードに分類され、モードに応じた符号化が行われている。
【００６４】
そして、適応音源符号帳２０６を用いてラグパラメータに基づいて適応音源信号を生成し、固定音源符号帳２０７を用いて固定音源符号に基づいて固定音源信号を生成する。生成された各音源信号に対して、復号されたゲインパラメータを用いてゲインが乗算器２０８で乗じられ、２つの音源信号が加算器２０９で加算された後、ＬＰＣ合成フィルタ２１０及びポストフィルタ２１１により復号音声が生成され出力される。
【００６５】
一方、現フレームの符号化データに誤りが検出された場合には、まず、データ分離部２０１により各符号化パラメータに分離する。次に、モード情報復号部２０２において、前フレームにおける復号モード情報を抽出し、これを現フレームのモード情報として用いる。
【００６６】
また、ラグパラメータ復号部２０４及びゲインパラメータ復号部２０５において、データ分離部２０１で得られた現フレームのラグパラメータ符号、ゲインパラメータ符号、及びモード情報を用いて、現フレームで用いるラグパラメータ及びゲインパラメータをモード情報に応じて適応的に算出する。この算出方法についての詳細は後述する。
【００６７】
また、ＬＰＣパラメータ及び固定音源パラメータの復号方法は任意であるが、従来技術と同様、ＬＰＣパラメータには前フレームのＬＰＣパラメータを用い、固定音源パラメータにはランダムな固定音源符号を与えて生成した固定音源信号を用いても良い。また、乱数発生器により発生させた任意の雑音信号を固定音源信号としてもよい。さらに、固定音源パラメータとして、現フレームの符号化データから分離され得られた固定音源符号をそのまま使用して復号してもよい。
【００６８】
このようにして得られた各パラメータから、誤りが検出されない場合と同様に、駆動音源信号の生成、ＬＰＣ合成、ポストフィルタを経由して、復号音声が生成される。
【００６９】
次に、図３を用いて、誤りが検出された場合の、現フレームで用いるラグパラメータの算出方法について説明する。図３は、図２に示す音声復号化装置におけるラグパラメータ復号部２０４の内部の構成を示すブロック図である。
【００７０】
図３において、まず、ラグ復号部３０１により現フレームのラグ符号を復号する。そして、フレーム内ラグ変化検出部３０２及びフレーム間ラグ変化検出部３０３により、フレーム内及びフレーム間の復号ラグパラメータの変化を測定する。
【００７１】
１フレーム分のラグパラメータは、１フレーム内の複数のサブフレームに対応した複数のラグパラメータからなり、フレーム内のラグ変化検出は、それら複数のラグパラメータ間で、ある閾値以上の差があるかどうかを検出することにより行う。また、フレーム間のラグ変化検出は、フレーム内の複数のラグパラメータを、前フレーム（最終サブフレーム）のラグパラメータと比較し、ある閾値以上の差があるかどうかを検出する。そして、ラグパラメータ決定部３０４において、最終的に現フレームで用いるラグパラメータを決定する。
【００７２】
次に、このラグパラメータの決定方法について説明する。
まず、モード情報が有声を示している場合には、無条件に、前フレームで用いられたラグパラメータを現フレームの値として用いる。次に、モード情報が無声又は過渡を示している場合には、フレーム内及びフレーム間のラグ変化に制限を加える条件で、現フレームの符号化データから復号されたパラメータを用いる。
【００７３】
具体的には、一例として式（１）に示すように、フレーム内復号ラグパラメータＬ(is)がすべて閾値内の変化に収まっている場合には、それらをそのまま現フレームラグパラメータＬ'(is)として用いる。
【００７４】
一方、フレーム内ラグが閾値を超えた変動をしている場合には、フレーム間ラグ変化を測定する。このフレーム間ラグ変化の検出結果に応じて、前フレーム（又は前サブフレーム）からの変動が大きい（差が閾値を超えた）サブフレームのラグパラメータには、前フレーム（又は前サブフレーム）のラグパラメータＬprevを用い、変動が少ないサブフレームのラグパラメータはそのまま使用する。
【００７５】

ここで、Ｌ(is)は復号ラグパラメータを示し、Ｌ'(is)は現フレームで用いるラグパラメータを示し、ＮＳはサブフレーム数を示し、Ｌprevは前フレーム（又は前サブフレーム）ラグパラメータを示し、Ｔｈa，ＴＨbは閾値を示す。
【００７６】
なお、フレーム内ラグ変化検出部３０２のみ、又はフレーム間ラグ変化検出部３０３のみを用いて、フレーム内変動のみの情報又はフレーム間変動のみの情報から、現フレームで用いるラグパラメータを決定しても良い。また、上記処理をモード情報が過渡を示す場合に対してのみ適用し、無声の場合には現フレームの符号化データから復号されたラグパラメータをそのまま使用するようにしても良い。
【００７７】
上記説明は、ラグ変化検出をラグ符号から復号したラグパラメータに対して行う場合ものであるが、ラグ変化検出をラグ符号値に対して直接行うこともできる。過渡フレームは、音声の立ち上がりとしてラグパラメータが重要な働きをするフレームである。このため、上記のように過渡フレームにおいて、現フレームの符号化データから得られた復号ラグパラメータを、符号化誤りによる劣化を避けるよう条件付きで積極的に使用することができる。その結果、従来技術のような無条件に前フレームラグパラメータを用いた方法に比べて、復号音声品質の改善を図ることができる。
【００７８】
次に、図４を用いて、誤りが検出された場合の、現フレームで用いるゲインパラメータの算出方法を説明する。図４は、図２に示す音声復号化装置におけるゲインパラメータ復号部２０５の内部の構成を示すブロック図である。図４において、まず、ゲイン復号部４０１において、現フレームの現パラメータ符号からゲインパラメータを復号する。
【００７９】
その場合、モード情報に応じてゲイン復号方法が異なる（例えば、復号に用いるテーブルが異なるなど）ときには、それに応じた復号を行う。なお、その際に用いるモード情報は、現フレームの符号化データから復号されたものを用いる。但し、ゲインパラメータの表現方法（符号化方法）として、フレーム（又はサブフレーム）のパワ情報を表すパラメータとそれに対する相対関係を表すパラメータとの組み合わせでゲイン値を表現する方式（例えば、ＭＰＥＧ−４ AudioのＭＰＥモードのＣＥＬＰ符号化）の場合には、パワ情報パラメータは前フレームの値（又はそれに減衰を加えた値）を用いる。
【００８０】
そして、切り替え部４０２により、誤り検出フラグ及びモード情報に応じて処理を切り替える。誤りが検出されないフレームに対しては、復号ゲインパラメータをそのまま出力する。一方、誤りが検出されたフレームに対しては、モード情報に応じて処理を切り替える。
【００８１】
まず、モード情報が有声を示す場合には、有声フレームゲイン補償部４０４により現フレームで用いるゲインパラメータが算出される。方法は任意であるが、従来例のように、ゲインバッファ４０３で保持されている前フレームのゲインパラメータ（適応音源ゲイン及び固定音源ゲイン）に対してある一定値で減衰させた値としてもよい。
【００８２】
次に、モード情報が過渡又は無声を示す場合には、無声・過渡フレームゲイン制御部４０５において、ゲイン復号部４０１で復号されたゲインパラメータを用いたゲイン値制御を行う。具体的には、ゲインバッファ４０３から得られる前フレームのゲインパラメータを基準に、その値からの相対的な変化の上限及び下限（又はそのいずれか）を設け、それらの上限値（及び下限値）で範囲制限した復号ゲインパラメータを現フレームのゲインパラメータとして用いる。下記式（２）に適応音源ゲイン及び固定音源ゲインに上限を設定する場合の制限方法の一例を示す。
【００８３】

ここで、
Ｇａ：適応音源ゲインパラメータ
Ｇｅ：固定音源ゲインパラメータ
Ｇe_prev: 前サブフレームの固定音源ゲインパラメータ
Ｔｈａ,Ｔｈe: 閾値
【００８４】
このように、誤りが検出されたフレームにおいて、前記ラグパラメータ復号部と組み合わせて、符号誤りを含み得る現フレームのゲインパラメータ符号を、符号化誤りによる劣化を避けるよう条件付きで積極的に使用する。これにより、従来技術のような無条件に前フレームゲインパラメータを用いた方法に比べて、復号音声品質の改善を図ることができる。
【００８５】
以上のように、符号化データに誤りが検出されたフレームでの音声復号の際に、ラグパラメータ復号部及びゲインパラメータ復号部において、音声復号に用いるラグパラメータ及びゲインパラメータを、復号されたモード情報に基づいて適応的に算出することで、より改善された復号音声品質を実現する誤り補償方法を提供できる。
【００８６】
より具体的には、符号化データに誤りが検出されたフレームでの音声復号に用いるラグパラメータとして、前記ラグパラメータ決定部において、現フレームのモード情報が過渡を示す場合、又は過渡若しくは無声を示す場合で、かつ、フレーム内又はフレーム間の復号ラグパラメータの変化が少ないときに、現フレームの符号化データから復号された復号ラグパラメータを現フレームラグパラメータとし、それ以外の条件では過去のラグパラメータを現フレームラグパラメータとすることで、特に誤り検出フレームが音声の立ち上がりである場合における復号音声品質の改善を実現できる誤り補償方法を提供できる。
【００８７】
また、現フレームの符号化データに誤りが検出され、かつモード情報が過渡又は無声を示す場合には、前記無声・過渡フレームゲイン制御部において、現フレームの符号化データから復号したゲインパラメータに対して、過去のゲインパラメータからの増加の上限又は／及び減少の下限を規定して出力するゲインを制御することにより、誤りを含む得る符号化データから復号したゲインパラメータが誤りによる異常な値となることを抑えることができ、より改善された復号音声品質を実現する誤り補償方法を提供できる。
【００８８】
なお、上記図２に示す音声復号化装置を用いた誤り補償方法では、音声信号の短区間毎の特徴を表すモード情報を符号化パラメータとして含む音声符号化方式を対象としているが、本誤り補償方法は、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても適用することができる。その場合には、復号側で復号パラメータ又は復号信号から、音声信号の短区間毎の特徴を表すモード情報を算出するモード算出部を備えるようにすればよい。
【００８９】
また、上記図２に示す音声復号化装置では、駆動音源が適応音源と固定音源の加算で表され、ＬＰＣ合成により復号音声を生成するいわゆるＣＥＬＰ(Code Excited Linear prediction)型について説明しているが、本発明の誤り補償方法は、ピッチ周期情報と、音源又は音声信号のゲイン情報とを符号化パラメータとする任意の音声符号化方式に対して広く適用できる。
【００９０】
（実施の形態２）
図５は、本発明の実施の形態２に係る音声復号化装置の構成を示すブロック図である。本実施の形態の音声復号化装置における誤り補償方法は、実施の形態１と同様、音声符号化側で入力音声信号を符号化した符号化データに対して、復号側で誤りが検出された場合に、音声復号化装置における音声復号時に、復号音声の品質劣化を抑えるように動作するものである。
【００９１】
ここで、音声復号は１０〜５０ｍｓ程度の一定の短区間（フレームと呼ぶ）の単位で行われ、そのフレーム単位で受信データに誤りが生じているかどうかの検出がなされ、その検出結果が誤り検出フラグとして通知される。
【００９２】
誤り検出は、本音声復号化装置の外部で予め行われるものとし、誤り検出の対象データとして、フレーム毎の符号化データの全てを対象としても、あるいは聴感的に重要な符号化データのみを対象としても良い。また、本実施の形態の誤り補償方法を適用する音声符号化方式として、その音声符号化パラメータ（伝送パラメータ）に、少なくとも、音声信号のフレーム毎の特徴を表すモード情報、適応音源信号及び固定音源信号のゲイン情報を表すゲインパラメータを含むものを対象とする。
【００９３】
音声復号を行うフレーム（現フレーム）の符号化データに誤りが検出されない場合については、上記実施の形態１と同様であるので説明を省略する。
【００９４】
現フレームの符号化データに誤りが検出された場合には、まず、データ分離部５０１により符号化データを各符号化パラメータに分離する。次いで、モード情報復号部５０２において、前フレームにおける復号モード情報を出力し、これを現フレームのモード情報として用いる。このモード情報は、ゲインパラメータ復号部５０５に送られる。
【００９５】
また、ラグパラメータ復号部５０４において、現フレームで用いるラグパラメータを復号する。その方法は任意であるが、従来と同様に、誤りが検出されなかった前フレームのラグパラメータを用いるようにしてもよい。次いで、ゲインパラメータ復号部５０５において、後述する方法により、モード情報を用いてゲインパラメータを算出する。
【００９６】
また、ＬＰＣパラメータ及び固定音源パラメータの復号方法は任意であるが、従来と同様に、ＬＰＣパラメータは前フレームのＬＰＣパラメータを用い、固定音源パラメータはランダムな固定音源符号を与えて生成した固定音源信号を用いても良い。また、乱数発生器により発生させた任意の雑音信号を固定音源信号としても良い。さらに、固定音源パラメータとして、現フレームの符号化データから分離され得られた固定音源符号をそのまま使用して復号しても良い。これにより得られた各パラメータから、誤りが検出されない場合と同様に、駆動音源信号の生成、ＬＰＣ合成、ポストフィルタを経由して、復号音声が生成される。
【００９７】
次に、図６を用いて、誤りが検出された場合の、現フレームで用いるゲインパラメータの算出方法を説明する。図６は、図５に示す音声復号化装置におけるゲインパラメータ復号部５０５の内部の構成を示すブロック図である。
【００９８】
図６において、まず、ゲイン復号部６０１において、現フレームの現パラメータ符号からゲインパラメータを復号する。その場合、モード情報に応じてゲイン復号方法が異なる（例えば、復号に用いるテーブルが異なるなど）場合には、それに応じた復号を行う。そして、切り替え部６０２により、誤り検出フラグに応じて処理を切り替える。誤りが検出されないフレームに対しては、復号ゲインパラメータをそのまま出力する。
【００９９】
一方、誤りが検出されたフレームに対しては、適応音源／固定音源ゲイン比率制御部６０４により、ゲインバッファ６０３で保持されている前フレームのゲインパラメータ（適応音源ゲイン及び固定音源ゲイン）に対して、モード情報に応じた適応音源／固定音源ゲイン比率制御を行い、ゲインパラメータを出力する。具体的には、現フレームのモード情報が有声を示す場合には、適応音源のゲインの比率を高く、過渡又は無声を示す場合には、適応音源のゲインの比率を低くするように制御する。
【０１００】
但し、比率制御にあたっては、適応音源及び固定音源を加算したＬＰＣ合成フィルタへ入力される駆動音源のパワーが比率制御前と同等になるようにする。なお、誤り検出フレームが連続する（１連続も含む）場合には、駆動音源のパワーを減衰させるような制御もあわせて行うことが好ましい。
【０１０１】
なお、ゲインバッファ６０３を設ける代わりに、過去のゲイン符号を保持するゲイン符号バッファを設けて、誤りが検出されたフレームでは前フレームのゲイン符号を用いてゲイン復号部６０１でゲインを復号し、それに対して適応音源／固定音源ゲイン比率制御を行うようにしても良い。
【０１０２】
このように、誤り補償される現フレームが有声の場合は、適応音源の成分を支配的にすることにより、より有声定常的にし、また、無声・過渡のモードでは、固定音源の成分を支配的にすることにより、適応音源による不適切な周期性成分による劣化を抑え、聴感的な品質の改善を図ることができる。
【０１０３】
以上のように、符号化データに誤りが検出されたフレームでの音声復号の際に、適応音源／固定音源ゲイン比率制御部により、前フレームのゲインパラメータ（適応音源ゲイン及び固定音源ゲイン）に対して、モード情報に応じた適応音源／固定音源ゲイン比率制御を行うことにより、より改善された復号音声品質を実現する誤り補償方法を提供できる。
【０１０４】
なお、上記図５に示す音声復号化装置では、音声信号の短区間毎の特徴を表すモード情報を符号化パラメータとして含む音声符号化方式を対象として説明したが、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても、本発明の誤り補償方法を適用できる。その場合には、復号側で復号パラメータ又は復号信号から、音声信号の短区間毎の特徴を表すモード情報を算出するモード算出部を備えるようにすれば良い。
【０１０５】
（実施の形態３）
図７は、本発明の実施の形態３に係る音声復号化装置の構成を示すブロック図である。本実施の形態に係る音声復号化装置における誤り補償方法は、実施の形態１，２と同様に、音声符号化側で入力音声信号を符号化した符号化データに対して、復号側で誤りが検出された場合に、音声復号器における音声復号時に、復号音声の品質劣化を抑えるように動作するものである。
【０１０６】
ここで、音声復号は、１０〜５０ｍｓ程度の一定の短区間（フレームと呼ぶ）の単位で行われ、そのフレーム単位で受信データに誤りが生じているかどうかの検出がなされ、その検出結果が誤り検出フラグとして通知される。誤り検出は、本音声復号化装置の外部で予め行われるものとし、誤り検出の対象データとして、フレーム毎の符号化データの全てを対象としても、あるいは聴感的に重要な符号化データのみを対象としても良い。
【０１０７】
また、本実施の形態の誤り補償方法を適用する音声符号化方式として、その音声符号化パラメータ（伝送パラメータ）に、少なくとも、適応音源信号及び固定音源信号のゲイン情報を表すゲインパラメータを含むものを対象とする。
【０１０８】
まず、伝送路誤りが検出されないフレームにおいては、符号化データは、データ分離部７０１で、復号に必要な各パラメータに分離される。そして、ラグパラメータ復号部７０２により復号されたラグパラメータを用いて適応音源符号帳７０３により適応音源が生成され、また固定音源符号帳７０４により固定音源が生成される。
【０１０９】
また、ゲインパラメータ復号部７０５により、後述するような方法で復号されたゲインを用いて、乗算器７０６によるゲインの乗算及び加算器７０７による加算により駆動音源が生成される。そして、これらの音源及びＬＰＣパラメータ復号部７０８により復号されたＬＰＣパラメータを用いてＬＰＣ合成フィルタ７０９及びポストフィルタ７１０を経由して復号音声が生成される。
【０１１０】
一方、伝送路誤りが検出されたフレームに対しては、各々の復号パラメータを生成した後、誤りが検出されないフレームと同様にして復号音声を生成する。ゲインパラメータを除く各々のパラメータの復号方法は任意であるが、ＬＰＣパラメータやラグパラメータは従来と同様に、前フレームのパラメータを用いても良い。
【０１１１】
また、固定音源パラメータは、ランダムな固定音源符号を与えて生成した固定音源信号を用いる、乱数発生器により発生させた任意の雑音信号を固定音源信号とする、固定音源パラメータとして現フレームの符号化データから分離され得られた固定音源符号をそのまま使用して復号する、などとしても良い。
【０１１２】
次に、ゲインパラメータ復号部におけるゲインパラメータの復号方法について、図８を用いて説明する。図８は、図７に示す音声復号化装置におけるゲインパラメータ復号部７０５の内部構成を示すブロック図である。図８において、まず、ゲイン復号部８０１で、現フレームの現パラメータ符号からゲインパラメータを復号する。また、誤り状態モニタ部８０２により、誤り検出の有無に基づいて、誤り検出の状態を判別する。この状態とは、現フレームが、
状態１）誤り検出フレーム、
状態２）誤り検出フレームの直後の、連続（１連続の場合も含む）する正常（誤りが検出されない）フレーム、
状態３）それ以外の誤りが検出されないフレーム
のいずれかの場合である。
【０１１３】
そして、上記状態に応じて、切り替え部８０３により処理を切り替える。まず、状態３）の場合には、ゲイン復号部８０１で復号されたゲインパラメータがそのまま出力される。
【０１１４】
次に、状態１）の場合には、誤り検出フレームにおけるゲインパラメータを算出する。その算出方法は任意であり、従来のような前フレームの適応音源ゲイン及び固定音源ゲインを減衰させた値を用いても良い。また、前フレームのゲイン符号を用いた復号を行い、現フレームのゲインパラメータとして用いても良い。さらに、実施の形態１又は２に示すような、モードに応じたラグ・ゲインパラメータ制御、及びモードに応じたゲインパラメータ比率制御を用いても良い。
【０１１５】
そして、状態２）においては、誤り検出後の正常フレームに対して、適応音源／固定音源ゲイン制御部８０６で下記に示すような処理を行う。まず、ゲイン復号部８０１で復号されたゲインパラメータのうち、適応音源ゲインの値（適応音源に乗ずる係数値）に対して上限値を規定した制御を行う。具体的には、上限値として固定値（例えば、１．０）を規定したり、復号適応音源ゲイン値に比例するような上限値を定めたり、それらを組み合わせたりしても良い。さらに、上記のような適応音源ゲインの上限値制御に伴って、固定音源ゲインも同時に、適応音源ゲインと固定音源ゲインの比率を正しく保つように制御する。具体的な実現方法の一例を下記式（３）に示す。
【０１１６】
状態２）における最初の一定数のサブフレームに対して、

状態2における上記を越えるサブフレームに対して、式（３）

ここで、
Ｇａ：適応音源ゲイン
Ｇｅ：固定音源ゲイン
【０１１７】
ゲインパラメータの表現方法（符号化方法）として、フレーム（又はサブフレーム）のパワ情報を表すパラメータとそれに対する相対関係を表すパラメータとの組み合わせでゲイン値を表現する方式（例えば、ＭＰＥＧ−４ AudioのＭＰＥモードのＣＥＬＰ符号化）を採用する場合においては、適応音源ゲインが前フレームの復号音源に依存して復号されるため、誤り検出後の正常フレームにおいては、前フレームの誤り補償処理により適応音源ゲインが本来の値とは異なり、場合によっては復号音声の異常な振幅増大による品質劣化を生じることがあるが、本実施の形態のように、ゲインの上限制限により、品質劣化を抑えることができる。
【０１１８】
また、適応音源ゲインと固定音源ゲインとの比率を、誤りのない本来の復号ゲインでの値になるように制御することにより、誤り検出後の正常フレームでの音源信号が、誤りのない場合により類似することとなり、復号音声品質の改善を図ることができる。
【０１１９】
なお、上記実施の形態１〜３に係る符号誤り補償方法は、この誤り補償方法をソフトウェアとして構成しても良い。例えば、上記誤り補償方法のプログラムをＲＯＭに格納し、そのプログラムにしたがってＣＰＵの指示により動作させるように構成しても良い。また、プログラム，適応音源符号帳，及び固定音源符号帳をコンピュータで読み取り可能な記憶媒体に格納し、この記憶媒体のプログラム，適応符号帳，及び固定音源符号帳をコンピュータのＲＡＭに記録して、プログラムにしたがって動作させるようにしても良い。このような場合においても、上記実施の形態１〜３と同様の作用、効果を呈する。
【０１２０】
【発明の効果】
以上説明したように、本発明によれば、符号化データに誤りが検出されたフレームでの音声復号の際に、ラグパラメータ復号部及びゲインパラメータ復号部において、音声復号に用いるラグパラメータ及びゲインパラメータを、復号されたモード情報に基づいて適応的に算出する。これにより、より改善された復号音声品質を実現することができる。
【０１２１】
また、本発明によれば、符号化データに誤りが検出されたフレームでのゲインパラメータ復号の際に、ゲインパラメータ復号部において、適応音源ゲインと固定音源ゲインの比率を、モード情報に応じて適応的に制御する、より具体的には、現フレームが有声を示す場合には、適応音源のゲインの比率を高く、過渡又は無声を示す場合には、適応音源のゲインの比率を低くするように制御することにより、誤り検出フレームの復号音声品質を聴感的により改善させることができる。
【０１２２】
さらに、本発明によれば、ゲインパラメータ復号部において、符号化データに誤りが検出されたフレームの直後の、誤りが検出されない正常なフレームについて、復号ゲインパラメータの値に応じて、音声復号に用いる適応音源ゲインパラメータ及び固定音源ゲインパラメータを適応的に制御する。より具体的には、復号された適応音源ゲインパラメータの上限値を規定するように制御する。これにより、誤り検出後の正常フレームでの復号音声信号の異常な振幅増大による復号音声品質の劣化を抑えることができる。さらに、適応音源ゲインと固定音源ゲインとの比率を誤りのない本来の復号ゲインでの値になるように制御することにより、誤り検出後の正常フレームでの音源信号が誤りのない場合により類似することとなり、復号音声品質の改善を図ることができる。
【図面の簡単な説明】
【図１】本発明の実施の形態に係る音声符号化装置及び音声復号化装置を備えた無線通信システムの構成を示すブロック図
【図２】本発明の実施の形態１に係る音声復号化装置の構成を示すブロック図
【図３】本発明の実施の形態１に係る音声復号化装置におけるラグパラメータ復号部の内部構成を示すブロック図
【図４】本発明の実施の形態１に係る音声復号化装置におけるゲインパラメータ復号部の内部構成を示すブロック図
【図５】本発明の実施の形態２に係る音声復号化装置の構成を示すブロック図
【図６】本発明の実施の形態２に係る音声復号化装置におけるゲインパラメータ復号部の内部構成を示すブロック図
【図７】本発明の実施の形態３に係る音声復号化装置の構成を示すブロック図
【図８】本発明の実施の形態３に係る音声復号化装置におけるゲインパラメータ復号部の内部構成を示すブロック図
【図９】従来の音声復号化装置の構成を示すブロック図
【符号の説明】
２０１，５０１，７０１データ分離部
２０２，５０２モード情報復号部
２０３，５０３，７０８ＬＰＣパラメータ復号部
２０４，５０４，７０２ラグパラメータ復号部
２０５，５０５，７０５ゲインパラメータ復号部
２０６，５０６，７０３適応音源符号帳
２０７，５０７，７０４固定音源符号帳
２０８，５０８，７０６乗算器
２０９，５０９，７０７加算器
２１０，５１０，７０９ＬＰＣ合成フィルタ
２１１，５１１，７１０ポストフィルタ
３０１ラグ復号部
３０２フレーム内ラグ変化検出部
３０３フレーム間ラグ変化検出部
３０４ラグパラメータ決定部
４０１，６０１，８０１ゲイン復号部
４０２，６０２，８０３切り替え部
４０３，６０３，８０４ゲインバッファ
４０４有声フレームゲイン補償部
４０５無声・過渡フレームゲイン制御部
６０４適応音源/固定音源ゲイン比率制御部
８０２誤り状態モニタ部
８０５誤り検出フレームゲイン補償部
８０６適応音源／固定音源ゲイン制御部

Claims

符号化データからラグパラメータを復号化する復号化手段と、
第１フレーム内における前記ラグパラメータの変動量を検出する第１検出手段と、
第１フレームおよび第２フレーム間における前記ラグパラメータの変動量を検出する第２検出手段と、
誤りが検出された第１フレームに対し、前記第１検出手段および前記第２検出手段の検出結果に基づいて、第１フレームの前記ラグパラメータまたは第１フレームより過去の第２フレームの前記ラグパラメータのいずれかを、出力ラグパラメータと決定する決定手段と、を具備し、
前記決定手段は、
前記第１検出手段によって検出された変動量が所定範囲内の場合、第１フレームの前記ラグパラメータを出力ラグパラメータと決定し、
前記第１検出手段によって検出された変動量が所定範囲外で、かつ前記第２検出手段によって検出された変動量が所定範囲内の場合、第１フレームの前記ラグパラメータを出力ラグパラメータと決定する、
音声復号化装置。
前記決定手段は、前記第１検出手段によって検出された変動量が所定範囲外で、かつ前記第２検出手段によって検出された変動量が所定範囲外の場合、第２フレームの前記ラグパラメータを出力ラグパラメータと決定する、請求項１記載の音声復号化装置。
前記決定手段は、第２フレームのモード情報が過渡モードまたは無声モードを示す場合に前記出力ラグパラメータの決定を行う、請求項１記載の音声復号化装置。
前記第１検出手段は、前記符号化データに含まれる復号化前のラグパラメータの変動量を用いて、フレーム内における前記ラグパラメータの変動量を検出する、請求項１から請求項３のいずれかに記載の音声復号化装置。
符号化データからゲインパラメータを復号化する復号化手段と、
誤りが検出された第１フレームの次の正常な第２フレームにおいて、前記復号化されたゲインパラメータの値を制御する制御手段と、を具備し、
前記ゲインパラメータは、適応音源ゲインパラメータおよび固定音源ゲインパラメータを含み、
前記制御手段は、
前記第２フレームにおいて前記適応音源ゲインパラメータに対し上限値を設定し、かつ、前記上限値を設定した後の前記適応音源ゲインパラメータと前記固定音源ゲインパラメータとの値の比率が、前記上限値を設定する前の復号された適応音源ゲインパラメータと復号された固定音源ゲインパラメータとの値の比率と同じ比率を維持するように前記固定音源ゲインパラメータを制御する、
音声復号化装置。
前記制御手段は、前記復号された適応音源ゲインパラメータが判定用閾値より大きいとき、前記上限値を前記復号された適応音源ゲインパラメータで除して前記復号された固定音源ゲインパラメータを乗算した値を新たな固定音源ゲインパラメータとし、前記上限値を新たな適応音源ゲインパラメータとする、請求項５記載の音声復号化装置。
前記判定用閾値および前記上限値はいずれも「１」である、請求項６記載の音声復号化装置。
符号化データからラグパラメータを復号化する復号化ステップと、
第１フレーム内における前記ラグパラメータの変動量を検出する第１検出ステップと、
第１フレームおよび第２フレーム間における前記ラグパラメータの変動量を検出する第２検出ステップと、
誤りが検出された第１フレームに対し、前記第１検出ステップおよび前記第２検出ステップの検出結果に基づいて、第１フレームの前記ラグパラメータまたは第１フレームより過去の第２フレームの前記ラグパラメータのいずれかを、出力ラグパラメータと決定する決定ステップと、を具備し、
前記決定ステップは、
前記第１検出ステップによって検出された変動量が所定範囲内の場合、第１フレームの前記ラグパラメータを出力ラグパラメータと決定し、
前記第１検出ステップによって検出された変動量が所定範囲外で、かつ前記第２検出ステップによって検出された変動量が所定範囲内の場合、第１フレームの前記ラグパラメータを出力ラグパラメータと決定する、
符号誤り補償方法。
符号化データからゲインパラメータを復号化する復号化工程と、
誤りが検出された第１フレームの次の正常な第２フレームにおいて、前記復号化されたゲインパラメータの値を制御する制御工程と、を具備し、
前記ゲインパラメータは、適応音源ゲインパラメータおよび固定音源ゲインパラメータを含み、
前記制御工程は、
前記第２フレームにおいて前記適応音源ゲインパラメータに対し上限値を設定し、かつ、前記上限値を設定した後の前記適応音源ゲインパラメータと前記固定音源ゲインパラメータとの値の比率が、前記上限値を設定する前の復号された適応音源ゲインパラメータと復号された固定音源ゲインパラメータとの値の比率と同じ比率を維持するように前記固定音源ゲインパラメータを制御する、
音声復号化方法。
前記制御工程は、前記復号された適応音源ゲインパラメータが判定用閾値より大きいとき、前記上限値を前記復号された適応音源ゲインパラメータで除して前記復号された固定音源ゲインパラメータを乗算した値を新たな固定音源ゲインパラメータとし、前記上限値を新たな適応音源ゲインパラメータとする、請求項９記載の音声復号化方法。
前記判定用閾値および前記上限値はいずれも「１」である、請求項１０記載の音声復号化方法。