JP4464488B2 - 音声復号化装置及び符号誤り補償方法、音声復号化方法 - Google Patents

音声復号化装置及び符号誤り補償方法、音声復号化方法 Download PDF

Info

Publication number
JP4464488B2
JP4464488B2 JP18571299A JP18571299A JP4464488B2 JP 4464488 B2 JP4464488 B2 JP 4464488B2 JP 18571299 A JP18571299 A JP 18571299A JP 18571299 A JP18571299 A JP 18571299A JP 4464488 B2 JP4464488 B2 JP 4464488B2
Authority
JP
Japan
Prior art keywords
parameter
frame
gain
decoding
lag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18571299A
Other languages
English (en)
Other versions
JP2001013998A (ja
Inventor
幸司 吉田
宏幸 江原
芹沢  昌宏
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
NEC Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
NEC Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP18571299A priority Critical patent/JP4464488B2/ja
Application filed by Panasonic Corp, NEC Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to EP10180814A priority patent/EP2276021B1/en
Priority to US10/018,317 priority patent/US7171354B1/en
Priority to CNB008097739A priority patent/CN1220177C/zh
Priority to CA2377597A priority patent/CA2377597C/en
Priority to PCT/JP2000/004323 priority patent/WO2001003115A1/ja
Priority to AU57064/00A priority patent/AU5706400A/en
Priority to EP00942405A priority patent/EP1207519B1/en
Priority to KR10-2001-7016812A priority patent/KR100439652B1/ko
Publication of JP2001013998A publication Critical patent/JP2001013998A/ja
Priority to US11/641,009 priority patent/US7499853B2/en
Application granted granted Critical
Publication of JP4464488B2 publication Critical patent/JP4464488B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号を符号化して伝送する移動通信システムや音声録音装置などに用いられる音声復号化装置及び符号誤り補償方法、音声復号化方法に関する。
【0002】
【従来の技術】
ディジタル移動通信や音声蓄積の分野においては、電波や記憶媒体の有効利用のために音声情報を圧縮し、低いビットレートで符号化する音声符号化装置が用いられている。その際、伝送路(又は記録媒体)に誤りが生じた際に、復号側において、その誤りを検出し、復号音声品質の劣化を抑えるための誤り補償方法が用いられる。
【0003】
そのような従来の技術として、ITU−T勧告G.729("Coding of speech at 8kbit/s using conjugate-structure algebraic-code-excited linear-prediction(CS-ACELP)")のCS−ACELP符号化方式に記載された誤り補償方法がある。
【0004】
図9は、CS−ACELP符号化方式の誤り補償を含んだ音声復号化装置の構成を示すブロック図である。図9において、音声復号は、10msのフレーム単位(復号単位)で行われ、そのフレーム単位で伝送路の誤り検出の有無が音声復号化装置に通知されるものとする。
【0005】
まず、伝送路誤りが検出されないフレームでの受信符号化データは、データ分離部901において、復号に必要な各パラメータに分離される。そして、ラグパラメータ復号部902により復号されたラグパラメータを用いて適応音源符号帳903により適応音源が生成され、また固定音源符号帳904により固定音源が生成される。また、ゲインパラメータ復号部905により復号されたゲインを用いて、乗算器906で乗算を行い、加算器907で加算することにより駆動音源が生成される。また、LPCパラメータ復号部908により復号されたLPCパラメータを用いてLPC合成フィルタ909及びポストフィルタ910を経由して復号音声が生成される。
【0006】
一方、伝送路誤りが検出されたフレームでの受信符号化データに対しては、ラグパラメータとして、誤りが検出されなかった前フレームのラグパラメータを用いて適応音源を生成し、また、固定音源符号帳904に対してランダムな固定音源符号を与えることで固定音源を生成し、ゲインパラメータとして、前フレームの適応音源ゲイン及び固定音源ゲインを減衰させた値を用いて駆動音源を生成し、LPCパラメータとして、前フレームLPCパラメータを用いてLPC合成及びポストフィルタ処理を行って復号音声を得る。
【0007】
このようにして、上記音声復号化装置において、伝送路誤り時に、誤り補償処理を行うことができる。
【0008】
【発明が解決しようとする課題】
しかしながら、上記従来の音声符号化装置では、誤りが検出されたフレームにおける音声の特性(有声や無声など)に関わらず同様な補償処理を行っていると共に、主として過去のパラメータのみを用いて誤り補償を行っているため、誤り補償時の復号音声品質劣化の改善に限界がある。
【0009】
本発明はかかる点に鑑みてなされたものであり、誤りが検出されたフレームにおいて、より改善された復号音声品質を実現することができる音声復号化装置及び誤り補償方法、音声復号化方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
本発明の骨子は、音声の短区間(フレーム)毎の特徴を表すモード情報を音声符号化パラメータに含み、音声復号化装置において、そのモード情報に応じて、音声復号に用いるラグパラメータ及びゲインパラメータを適応的に算出することである。
【0011】
また、本発明の骨子は、音声復号化装置において、そのモード情報に応じて、適応音源ゲインと固定音源ゲインの比率を適応的に制御することである。
【0012】
さらに、本発明の骨子は、符号化データに誤りが検出された復号単位の直後の、誤りが検出されない正常な復号単位において、復号ゲインパラメータの値に応じて音声復号に用いる適応音源ゲインパラメータ及び固定音源ゲインパラメータを適応的に制御することである。
【0013】
【発明の実施の形態】
本発明の第1の態様に係る音声復号化装置は、モード情報、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記モード情報、ラグパラメータ、及びゲインパラメータを復号化する復号化手段と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する決定手段と、を具備する構成を採る。
【0014】
この構成によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータ及びゲインパラメータを復号されたモード情報に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【0015】
本発明の第2の態様に係る音声復号化装置は、第1の態様において、決定手段は、ラグパラメータの復号単位内及び/又は復号単位間の変動を検出する検出手段を具備し、前記検出手段の検出結果と前記モード情報に基づいて前記復号単位で用いるラグパラメータを決定する構成を採る。
【0016】
この構成によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータを、復号されたモード情報、復号単位内及び/又は復号単位間の変動検出結果に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【0017】
本発明の第3の態様に係る音声復号化装置は、第2の態様において、モード情報の示すモードが過渡モード又は無声モードであって、前記検出手段がラグパラメータの復号単位内及び/又は復号単位間の所定量以上の変動を検出しない場合に、復号単位についての前記ラグパラメータを用い、その他の場合に、過去の復号単位に対するラグパラメータを用いる構成を採る。
【0018】
この構成によれば、特に誤り検出復号単位が音声の立ち上がりである場合における復号音声品質の改善を実現することができる。
【0019】
本発明の第4の態様に係る音声復号化装置は、第1から第3のいずれかの態様において、決定手段が、モード情報の示すモードが過渡モード又は無声モードである場合に、過去の復号単位に対するゲインパラメータに基づいてゲインパラメータの範囲制限を行う制限制御手段を有し、範囲制限されたゲインパラメータをゲインパラメータとして決定する構成を採る。
【0020】
この構成によれば、現復号単位の符号化データに誤りが検出され、かつモード情報が過渡又は無声を示す場合には、現復号単位の符号化データから復号したゲインパラメータに対して、過去のゲインパラメータからの増加の上限又は/及び減少の下限を規定して出力ゲインを制御するので、誤りを含む得る符号化データから復号したゲインパラメータが誤りによる異常な値となることを抑えることができ、より改善された復号音声品質を実現することができる。
【0021】
本発明の第5の態様に係る音声復号化装置は、モード情報、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記モード情報、ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する復号化手段と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記適応音源ゲインと前記固定音源ゲインとの比率を制御する比率制御手段と、を具備する構成を採る。
【0022】
本発明の第6の態様に係る音声復号化装置は、第5の態様において、前記比率制御手段は、前記モード情報が有声モードである場合に、適応音源ゲインの比率を高くし、前記モード情報が過渡モード又は無声モードである場合に、適応音源ゲインの比率を低くするようにゲイン比率を制御する構成を採る。
【0023】
これらの構成によれば、符号化データに誤りが検出された復号単位でのゲインパラメータ復号の際に、適応音源ゲインと固定音源ゲインの比率を、モード情報に応じて適応的に制御するので、誤り検出復号単位の復号音声品質を聴感的により改善させることができる。
【0024】
本発明の第7の態様に係る音声復号化装置は、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する復号化手段と、誤りが検出された復号単位直後の正常な復号単位において、ゲインパラメータの上限を規定する規定手段と、を具備する構成を採る。
【0025】
この構成によれば、符号化データに誤りが検出された復号単位直後の、誤りが検出されない正常な復号単位において、復号された適応音源ゲインパラメータの上限値を規定するように制御するので、誤り検出直後の正常復号単位での復号音声信号の異常な振幅増大による復号音声品質の劣化を抑えることができる。
【0026】
本発明の第8の態様に係る音声復号化装置は、第7の態様において、前記規定手段が、上限が規定された範囲における適応音源ゲインに対して所定の比率を保つように固定音源ゲインを制御する構成を採る。
【0027】
この構成によれば、適応音源ゲインと固定音源ゲインとの間の比率を誤りのない本来の復号ゲインでの値になるように制御するので、誤り検出直後の正常復号単位での音源信号が誤りのない場合により類似することとなり、復号音声品質の改善を図ることができる。
【0028】
本発明の第9の態様に係る音声復号化装置は、ラグパラメータ及びゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記ラグパラメータ及びゲインパラメータを復号化する復号化手段と、前記データを復号化して得られる復号化パラメータ又は復号化信号からモード情報を求めるモード算出手段と、前記データにおいて誤りが検出された復号単位について、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する決定手段と、を具備する構成を採る。
【0029】
この構成によれば、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても、音声復号に用いるラグパラメータ及びゲインパラメータを、復号側で算出したモード情報に基づいて適応的に算出することができ、より改善された復号音声品質を実現することができる。
【0030】
本発明の第10の態様に係る音声復号化装置は、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する受信手段と、前記ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する復号化手段と、前記データを復号化して得られる復号化パラメータ又は復号化信号からモード情報を求めるモード算出手段と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記適応音源用ゲインと前記固定音源用ゲインとの比率を制御する比率制御手段と、を具備する構成を採る。
【0031】
この構成によれば、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても、符号化データに誤りが検出された復号単位でのゲインパラメータ復号の際に、適応音源ゲインと固定音源ゲインの比率を、復号側で算出したモード情報に応じて適応的に制御するので、誤り検出復号単位の復号音声品質を聴感的により改善させることができる。
【0032】
本発明の第11の態様に係る基地局装置は、第1から第10のいずれかの態様の音声復号化装置を備えたことを特徴とする。本発明の第12の態様に係る通信端末装置は、第1から第10のいずれかの態様の音声復号化装置を備えたことを特徴とする。これらの構成によれば、これにより、伝送誤りに対する耐性のある無線通信を行うことができる。
【0033】
本発明の第13の態様に係る符号誤り補償方法は、モード情報、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータにおける前記モード情報、ラグパラメータ、及びゲインパラメータを復号化する工程と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する工程と、を具備する。
【0034】
この方法によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータ及びゲインパラメータを復号されたモード情報に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【0035】
本発明の第14の態様に係る符号誤り補償方法は、第13の態様において、ラグパラメータの復号単位内及び/又は復号単位間の変動を検出する工程を具備し、検出結果と前記モード情報に基づいて前記復号単位で用いるラグパラメータを決定する。
【0036】
この方法によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータを、復号されたモード情報、復号単位内及び/又は復号単位間の変動検出結果に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【0037】
本発明の第15の態様に係る符号誤り補償方法は、第14の態様において、モード情報の示すモードが過渡モード又は無声モードであって、ラグパラメータの復号単位内及び/又は復号単位間の所定量以上の変動を検出しない場合に、復号単位についての前記ラグパラメータを用い、その他の場合に、過去の復号単位に対するラグパラメータを用いる。
【0038】
この方法によれば、特に誤り検出復号単位が音声の立ち上がりである場合における復号音声品質の改善を実現することができる。
【0039】
本発明の第16の態様に係る符号誤り補償方法は、第13から第15のいずれかの態様において、モード情報の示すモードが過渡モード又は無声モードである場合に、過去の復号単位に対するゲインパラメータに基づいてゲインパラメータの範囲制限を行い、範囲制限されたゲインパラメータをゲインパラメータとして決定する。
【0040】
この方法によれば、現復号単位の符号化データに誤りが検出され、かつモード情報が過渡又は無声を示す場合には、現復号単位の符号化データから復号したゲインパラメータに対して、過去のゲインパラメータからの増加の上限又は/及び減少の下限を規定して出力ゲインを制御するので、誤りを含む得る符号化データから復号したゲインパラメータが誤りによる異常な値となることを抑えることができ、より改善された復号音声品質を実現することができる。
【0041】
本発明の第17の態様に係る符号誤り補償方法は、モード情報、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する工程と、前記モード情報、ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する工程と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記適応音源ゲインと前記固定音源ゲインとの比率を制御する工程と、を具備する。
【0042】
本発明の第18の態様に係る符号誤り補償方法は、第17の態様において、モード情報の示すモードが有声モードである場合に、適応音源ゲインの比率を高くし、前記モード情報の示すモードが過渡モード又は無声モードである場合に、適応音源ゲインの比率を低くするように、適応音源ゲインと固定音源ゲインとの間のゲイン比率を制御する。
【0043】
これらの方法によれば、符号化データに誤りが検出された復号単位でのゲインパラメータ復号の際に、適応音源ゲインと固定音源ゲインの比率を、モード情報に応じて適応的に制御するので、誤り検出復号単位の復号音声品質を聴感的により改善させることができる。
【0044】
本発明の第19の態様に係る符号誤り補償方法は、ラグパラメータ、固定音源パラメータ、並びに適応音源ゲインと固定音源ゲインとからなるゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する工程と、前記ラグパラメータ、固定音源パラメータ及びゲインパラメータを復号化する工程と、誤りが検出された復号単位直後の正常な復号単位において、ゲインパラメータの上限を規定する工程と、を具備する。
【0045】
この方法によれば、符号化データに誤りが検出された復号単位直後の、誤りが検出されない正常な復号単位において、復号された適応音源ゲインパラメータの上限値を規定するように制御するので、誤り検出直後の正常復号単位での復号音声信号の異常な振幅増大による復号音声品質の劣化を抑えることができる。
【0046】
本発明の第20の態様に係る符号誤り補償方法は、第19の態様において、上限が規定された範囲における適応音源ゲインに対して所定の比率を保つように固定音源ゲインを制御する。
【0047】
この方法によれば、適応音源ゲインと固定音源ゲインとの間の比率を誤りのない本来の復号ゲインでの値になるように制御するので、誤り検出直後の正常復号単位での音源信号がより誤りのない場合により類似することとなり、復号音声品質の改善を図ることができる。
【0048】
本発明の第21の態様に係る符号誤り補償方法は、ラグパラメータ及びゲインパラメータを含む符号化された伝送パラメータを有するデータを受信する工程と、前記ラグパラメータ及びゲインパラメータを復号化する工程と、前記データを復号化して得られる復号化パラメータ又は復号化信号からモード情報を求める工程と、前記データにおいて誤りが検出された復号単位について、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する工程と、を具備する。
【0049】
この方法によれば、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても、音声復号に用いるラグパラメータ及びゲインパラメータを、復号側で算出したモード情報に基づいて適応的に算出することができ、より改善された復号音声品質を実現することができる。
【0050】
本発明の第22の態様に係る記録媒体は、プログラムを格納し、コンピュータにより読み取り可能な記録媒体であって、前記プログラムは、モード情報、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータにおける前記モード情報、ラグパラメータ、及びゲインパラメータを復号化する手順と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記復号単位に用いるラグパラメータ及びゲインパラメータを適応的に決定する手順と、を含む。
【0051】
この媒体によれば、符号化データに誤りが検出された復号単位での音声復号の際に、音声復号に用いるラグパラメータ及びゲインパラメータを復号されたモード情報に基づいて適応的に算出するので、より改善された復号音声品質を実現することができる。
【0052】
本発明の第23の態様に係る記録媒体は、プログラムを格納し、コンピュータにより読み取り可能な記録媒体であって、前記プログラムは、モード情報、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータにおける前記モード情報、ラグパラメータ、及びゲインパラメータを復号化する手順と、前記データに対して誤りが検出された復号単位において、前記復号単位よりも過去の復号単位に対するモード情報を用い、前記モード情報の示すモードが有声モードである場合に、適応音源ゲインの比率を高くし、前記モード情報の示すモードが過渡モード又は無声モードである場合に、適応音源ゲインの比率を低くするように、適応音源ゲインと固定音源ゲインとの間のゲイン比率を制御する手順と、を含む。
【0053】
この媒体によれば、符号化データに誤りが検出された復号単位でのゲインパラメータ復号の際に、適応音源ゲインと固定音源ゲインの比率を、モード情報に応じて適応的に制御するので、誤り検出復号単位の復号音声品質を聴感的により改善させることができる。
【0054】
本発明の第24の態様に係る記録媒体は、プログラムを格納し、コンピュータにより読み取り可能な記録媒体であって、前記プログラムは、ラグパラメータ、及びゲインパラメータを含む符号化された伝送パラメータを有するデータにおける前記ラグパラメータ、及びゲインパラメータを復号化する手順と、誤りが検出された復号単位直後の正常な復号単位について、ゲインパラメータの上限を規定し、上限が規定された範囲における適応音源ゲインに対して所定の比率を保つように固定音源ゲインを制御する手順と、を含む。
【0055】
この媒体によれば、誤り検出直後の正常復号単位での復号音声信号の異常な振幅増大による復号音声品質の劣化を抑えることができる。
【0056】
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る音声復号化装置を備えた無線通信装置の構成を示すブロック図である。ここで、無線通信装置とは、ディジタル無線通信システムにおける基地局装置や移動局のような通信端末装置などをいう。
【0057】
この無線通信装置において、送信側で音声がマイクなどの音声入力装置101によって電気的アナログ信号に変換され、A/D変換器102に出力される。アナログ音声信号は、A/D変換器102によってディジタル音声信号に変換され、音声符号化部103に出力される。音声符号化部103は、ディジタル音声信号に対して音声符号化処理を行い、符号化した情報を変復調部104に出力する。変復調部104は、符号化された音声信号をディジタル変調して、無線送信部105に送る。無線送信部105では、変調後の信号に所定の無線送信処理を施す。この信号は、アンテナ106を介して送信される。
【0058】
一方、無線通信装置の受信側では、アンテナ107で受信した受信信号は、無線受信部108で所定の無線受信処理が施され、変復調部104に送られる。変復調部104では、受信信号に対して復調処理を行い、復調後の信号を音声復号化部109に出力する。音声復号化部109は、復調後の信号に復号処理を行ってディジタル復号音声信号を得て、そのディジタル復号音声信号をD/A変換器110へ出力する。D/A変換器110は、音声復号化部109から出力されたディジタル復号音声信号をアナログ復号音声信号に変換してスピーカなどの音声出力装置111に出力する。最後に音声出力装置111が電気的アナログ復号音声信号を復号音声に変換して出力する。
【0059】
図2に本発明の実施の形態1に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置における誤り補償方法は、音声符号化部側で入力音声信号を符号化した符号化データに対して、音声復号化側で誤りが検出された場合に、音声復号化時に復号音声の品質劣化を抑えるように動作するものである。
【0060】
ここで、音声復号は、10〜50ms程度の一定の短区間(フレームと呼ぶ)の単位で行われ、そのフレーム単位で受信データに誤りが生じているかどうかの検出結果が誤り検出フラグとして通知される。この誤り検出方法としては、通常、CRC(Cyclic Redundancy Check)などが用いられる。誤り検出は、本音声復号化装置の外部で予め行われるものとし、誤り検出の対象データとして、フレーム毎の符号化データの全てを対象としても、あるいは聴感的に重要な符号化データのみを対象としても良い。
【0061】
また、本発明の誤り補償方法を適用する音声符号化方式においては、その音声符号化パラメータ(伝送パラメータ)に、少なくとも、音声信号のフレーム毎の特徴を表すモード情報、音声信号のピッチ周期又は適応音源に関する情報を表すラグパラメータ、及び音源信号又は音声信号のゲイン情報を表すゲインパラメータを少なくとも含むものを対象とする。
【0062】
まず、音声復号を行う現フレームの符号化データに誤りが検出されない場合について説明する。この場合は、誤り補償の動作は行われず、通常の音声復号が行われる。図2において、データ分離部201により符号化データから各音声符号化パラメータに分離される。そして、モード情報復号部202、LPCパラメータ復号部203、ラグパラメータ復号部204、及びゲインパラメータ復号部205により、それぞれモード情報、LPCパラメータ、ラグパラメータ、及びゲインパラメータが復号される。
【0063】
ここで、モード情報とは、フレーム単位での音声信号の状態を表すもので、典型的には、有声、無声、過渡といったモードが存在し、符号化側でこれらの状態に応じた符号化が行われる。例えば、ISO/IECで標準化された規格ISO/IEC14496−3(MPEG−4 Audio)のMPE(Multi Pulse Excitation)モードでのCELP符号化においては、符号化側でピッチ予測ゲインに基づいて無声、過渡、有声(弱い周期性)、有声(強い周期性)の4つのモードに分類され、モードに応じた符号化が行われている。
【0064】
そして、適応音源符号帳206を用いてラグパラメータに基づいて適応音源信号を生成し、固定音源符号帳207を用いて固定音源符号に基づいて固定音源信号を生成する。生成された各音源信号に対して、復号されたゲインパラメータを用いてゲインが乗算器208で乗じられ、2つの音源信号が加算器209で加算された後、LPC合成フィルタ210及びポストフィルタ211により復号音声が生成され出力される。
【0065】
一方、現フレームの符号化データに誤りが検出された場合には、まず、データ分離部201により各符号化パラメータに分離する。次に、モード情報復号部202において、前フレームにおける復号モード情報を抽出し、これを現フレームのモード情報として用いる。
【0066】
また、ラグパラメータ復号部204及びゲインパラメータ復号部205において、データ分離部201で得られた現フレームのラグパラメータ符号、ゲインパラメータ符号、及びモード情報を用いて、現フレームで用いるラグパラメータ及びゲインパラメータをモード情報に応じて適応的に算出する。この算出方法についての詳細は後述する。
【0067】
また、LPCパラメータ及び固定音源パラメータの復号方法は任意であるが、従来技術と同様、LPCパラメータには前フレームのLPCパラメータを用い、固定音源パラメータにはランダムな固定音源符号を与えて生成した固定音源信号を用いても良い。また、乱数発生器により発生させた任意の雑音信号を固定音源信号としてもよい。さらに、固定音源パラメータとして、現フレームの符号化データから分離され得られた固定音源符号をそのまま使用して復号してもよい。
【0068】
このようにして得られた各パラメータから、誤りが検出されない場合と同様に、駆動音源信号の生成、LPC合成、ポストフィルタを経由して、復号音声が生成される。
【0069】
次に、図3を用いて、誤りが検出された場合の、現フレームで用いるラグパラメータの算出方法について説明する。図3は、図2に示す音声復号化装置におけるラグパラメータ復号部204の内部の構成を示すブロック図である。
【0070】
図3において、まず、ラグ復号部301により現フレームのラグ符号を復号する。そして、フレーム内ラグ変化検出部302及びフレーム間ラグ変化検出部303により、フレーム内及びフレーム間の復号ラグパラメータの変化を測定する。
【0071】
1フレーム分のラグパラメータは、1フレーム内の複数のサブフレームに対応した複数のラグパラメータからなり、フレーム内のラグ変化検出は、それら複数のラグパラメータ間で、ある閾値以上の差があるかどうかを検出することにより行う。また、フレーム間のラグ変化検出は、フレーム内の複数のラグパラメータを、前フレーム(最終サブフレーム)のラグパラメータと比較し、ある閾値以上の差があるかどうかを検出する。そして、ラグパラメータ決定部304において、最終的に現フレームで用いるラグパラメータを決定する。
【0072】
次に、このラグパラメータの決定方法について説明する。
まず、モード情報が有声を示している場合には、無条件に、前フレームで用いられたラグパラメータを現フレームの値として用いる。次に、モード情報が無声又は過渡を示している場合には、フレーム内及びフレーム間のラグ変化に制限を加える条件で、現フレームの符号化データから復号されたパラメータを用いる。
【0073】
具体的には、一例として式(1)に示すように、フレーム内復号ラグパラメータL(is)がすべて閾値内の変化に収まっている場合には、それらをそのまま現フレームラグパラメータL'(is)として用いる。
【0074】
一方、フレーム内ラグが閾値を超えた変動をしている場合には、フレーム間ラグ変化を測定する。このフレーム間ラグ変化の検出結果に応じて、前フレーム(又は前サブフレーム)からの変動が大きい(差が閾値を超えた)サブフレームのラグパラメータには、前フレーム(又は前サブフレーム)のラグパラメータLprevを用い、変動が少ないサブフレームのラグパラメータはそのまま使用する。
【0075】
Figure 0004464488
ここで、L(is)は復号ラグパラメータを示し、L'(is)は現フレームで用いるラグパラメータを示し、NSはサブフレーム数を示し、Lprevは前フレーム(又は前サブフレーム)ラグパラメータを示し、Tha,THbは閾値を示す。
【0076】
なお、フレーム内ラグ変化検出部302のみ、又はフレーム間ラグ変化検出部303のみを用いて、フレーム内変動のみの情報又はフレーム間変動のみの情報から、現フレームで用いるラグパラメータを決定しても良い。また、上記処理をモード情報が過渡を示す場合に対してのみ適用し、無声の場合には現フレームの符号化データから復号されたラグパラメータをそのまま使用するようにしても良い。
【0077】
上記説明は、ラグ変化検出をラグ符号から復号したラグパラメータに対して行う場合ものであるが、ラグ変化検出をラグ符号値に対して直接行うこともできる。過渡フレームは、音声の立ち上がりとしてラグパラメータが重要な働きをするフレームである。このため、上記のように過渡フレームにおいて、現フレームの符号化データから得られた復号ラグパラメータを、符号化誤りによる劣化を避けるよう条件付きで積極的に使用することができる。その結果、従来技術のような無条件に前フレームラグパラメータを用いた方法に比べて、復号音声品質の改善を図ることができる。
【0078】
次に、図4を用いて、誤りが検出された場合の、現フレームで用いるゲインパラメータの算出方法を説明する。図4は、図2に示す音声復号化装置におけるゲインパラメータ復号部205の内部の構成を示すブロック図である。図4において、まず、ゲイン復号部401において、現フレームの現パラメータ符号からゲインパラメータを復号する。
【0079】
その場合、モード情報に応じてゲイン復号方法が異なる(例えば、復号に用いるテーブルが異なるなど)ときには、それに応じた復号を行う。なお、その際に用いるモード情報は、現フレームの符号化データから復号されたものを用いる。但し、ゲインパラメータの表現方法(符号化方法)として、フレーム(又はサブフレーム)のパワ情報を表すパラメータとそれに対する相対関係を表すパラメータとの組み合わせでゲイン値を表現する方式(例えば、MPEG−4 AudioのMPEモードのCELP符号化)の場合には、パワ情報パラメータは前フレームの値(又はそれに減衰を加えた値)を用いる。
【0080】
そして、切り替え部402により、誤り検出フラグ及びモード情報に応じて処理を切り替える。誤りが検出されないフレームに対しては、復号ゲインパラメータをそのまま出力する。一方、誤りが検出されたフレームに対しては、モード情報に応じて処理を切り替える。
【0081】
まず、モード情報が有声を示す場合には、有声フレームゲイン補償部404により現フレームで用いるゲインパラメータが算出される。方法は任意であるが、従来例のように、ゲインバッファ403で保持されている前フレームのゲインパラメータ(適応音源ゲイン及び固定音源ゲイン)に対してある一定値で減衰させた値としてもよい。
【0082】
次に、モード情報が過渡又は無声を示す場合には、無声・過渡フレームゲイン制御部405において、ゲイン復号部401で復号されたゲインパラメータを用いたゲイン値制御を行う。具体的には、ゲインバッファ403から得られる前フレームのゲインパラメータを基準に、その値からの相対的な変化の上限及び下限(又はそのいずれか)を設け、それらの上限値(及び下限値)で範囲制限した復号ゲインパラメータを現フレームのゲインパラメータとして用いる。下記式(2)に適応音源ゲイン及び固定音源ゲインに上限を設定する場合の制限方法の一例を示す。
【0083】
Figure 0004464488
ここで、
Ga: 適応音源ゲインパラメータ
Ge: 固定音源ゲインパラメータ
Ge_prev: 前サブフレームの固定音源ゲインパラメータ
Tha,The: 閾値
【0084】
このように、誤りが検出されたフレームにおいて、前記ラグパラメータ復号部と組み合わせて、符号誤りを含み得る現フレームのゲインパラメータ符号を、符号化誤りによる劣化を避けるよう条件付きで積極的に使用する。これにより、従来技術のような無条件に前フレームゲインパラメータを用いた方法に比べて、復号音声品質の改善を図ることができる。
【0085】
以上のように、符号化データに誤りが検出されたフレームでの音声復号の際に、ラグパラメータ復号部及びゲインパラメータ復号部において、音声復号に用いるラグパラメータ及びゲインパラメータを、復号されたモード情報に基づいて適応的に算出することで、より改善された復号音声品質を実現する誤り補償方法を提供できる。
【0086】
より具体的には、符号化データに誤りが検出されたフレームでの音声復号に用いるラグパラメータとして、前記ラグパラメータ決定部において、現フレームのモード情報が過渡を示す場合、又は過渡若しくは無声を示す場合で、かつ、フレーム内又はフレーム間の復号ラグパラメータの変化が少ないときに、現フレームの符号化データから復号された復号ラグパラメータを現フレームラグパラメータとし、それ以外の条件では過去のラグパラメータを現フレームラグパラメータとすることで、特に誤り検出フレームが音声の立ち上がりである場合における復号音声品質の改善を実現できる誤り補償方法を提供できる。
【0087】
また、現フレームの符号化データに誤りが検出され、かつモード情報が過渡又は無声を示す場合には、前記無声・過渡フレームゲイン制御部において、現フレームの符号化データから復号したゲインパラメータに対して、過去のゲインパラメータからの増加の上限又は/及び減少の下限を規定して出力するゲインを制御することにより、誤りを含む得る符号化データから復号したゲインパラメータが誤りによる異常な値となることを抑えることができ、より改善された復号音声品質を実現する誤り補償方法を提供できる。
【0088】
なお、上記図2に示す音声復号化装置を用いた誤り補償方法では、音声信号の短区間毎の特徴を表すモード情報を符号化パラメータとして含む音声符号化方式を対象としているが、本誤り補償方法は、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても適用することができる。その場合には、復号側で復号パラメータ又は復号信号から、音声信号の短区間毎の特徴を表すモード情報を算出するモード算出部を備えるようにすればよい。
【0089】
また、上記図2に示す音声復号化装置では、駆動音源が適応音源と固定音源の加算で表され、LPC合成により復号音声を生成するいわゆるCELP(Code Excited Linear prediction)型について説明しているが、本発明の誤り補償方法は、ピッチ周期情報と、音源又は音声信号のゲイン情報とを符号化パラメータとする任意の音声符号化方式に対して広く適用できる。
【0090】
(実施の形態2)
図5は、本発明の実施の形態2に係る音声復号化装置の構成を示すブロック図である。本実施の形態の音声復号化装置における誤り補償方法は、実施の形態1と同様、音声符号化側で入力音声信号を符号化した符号化データに対して、復号側で誤りが検出された場合に、音声復号化装置における音声復号時に、復号音声の品質劣化を抑えるように動作するものである。
【0091】
ここで、音声復号は10〜50ms程度の一定の短区間(フレームと呼ぶ)の単位で行われ、そのフレーム単位で受信データに誤りが生じているかどうかの検出がなされ、その検出結果が誤り検出フラグとして通知される。
【0092】
誤り検出は、本音声復号化装置の外部で予め行われるものとし、誤り検出の対象データとして、フレーム毎の符号化データの全てを対象としても、あるいは聴感的に重要な符号化データのみを対象としても良い。また、本実施の形態の誤り補償方法を適用する音声符号化方式として、その音声符号化パラメータ(伝送パラメータ)に、少なくとも、音声信号のフレーム毎の特徴を表すモード情報、適応音源信号及び固定音源信号のゲイン情報を表すゲインパラメータを含むものを対象とする。
【0093】
音声復号を行うフレーム(現フレーム)の符号化データに誤りが検出されない場合については、上記実施の形態1と同様であるので説明を省略する。
【0094】
現フレームの符号化データに誤りが検出された場合には、まず、データ分離部501により符号化データを各符号化パラメータに分離する。次いで、モード情報復号部502において、前フレームにおける復号モード情報を出力し、これを現フレームのモード情報として用いる。このモード情報は、ゲインパラメータ復号部505に送られる。
【0095】
また、ラグパラメータ復号部504において、現フレームで用いるラグパラメータを復号する。その方法は任意であるが、従来と同様に、誤りが検出されなかった前フレームのラグパラメータを用いるようにしてもよい。次いで、ゲインパラメータ復号部505において、後述する方法により、モード情報を用いてゲインパラメータを算出する。
【0096】
また、LPCパラメータ及び固定音源パラメータの復号方法は任意であるが、従来と同様に、LPCパラメータは前フレームのLPCパラメータを用い、固定音源パラメータはランダムな固定音源符号を与えて生成した固定音源信号を用いても良い。また、乱数発生器により発生させた任意の雑音信号を固定音源信号としても良い。さらに、固定音源パラメータとして、現フレームの符号化データから分離され得られた固定音源符号をそのまま使用して復号しても良い。これにより得られた各パラメータから、誤りが検出されない場合と同様に、駆動音源信号の生成、LPC合成、ポストフィルタを経由して、復号音声が生成される。
【0097】
次に、図6を用いて、誤りが検出された場合の、現フレームで用いるゲインパラメータの算出方法を説明する。図6は、図5に示す音声復号化装置におけるゲインパラメータ復号部505の内部の構成を示すブロック図である。
【0098】
図6において、まず、ゲイン復号部601において、現フレームの現パラメータ符号からゲインパラメータを復号する。その場合、モード情報に応じてゲイン復号方法が異なる(例えば、復号に用いるテーブルが異なるなど)場合には、それに応じた復号を行う。そして、切り替え部602により、誤り検出フラグに応じて処理を切り替える。誤りが検出されないフレームに対しては、復号ゲインパラメータをそのまま出力する。
【0099】
一方、誤りが検出されたフレームに対しては、適応音源/固定音源ゲイン比率制御部604により、ゲインバッファ603で保持されている前フレームのゲインパラメータ(適応音源ゲイン及び固定音源ゲイン)に対して、モード情報に応じた適応音源/固定音源ゲイン比率制御を行い、ゲインパラメータを出力する。具体的には、現フレームのモード情報が有声を示す場合には、適応音源のゲインの比率を高く、過渡又は無声を示す場合には、適応音源のゲインの比率を低くするように制御する。
【0100】
但し、比率制御にあたっては、適応音源及び固定音源を加算したLPC合成フィルタへ入力される駆動音源のパワーが比率制御前と同等になるようにする。なお、誤り検出フレームが連続する(1連続も含む)場合には、駆動音源のパワーを減衰させるような制御もあわせて行うことが好ましい。
【0101】
なお、ゲインバッファ603を設ける代わりに、過去のゲイン符号を保持するゲイン符号バッファを設けて、誤りが検出されたフレームでは前フレームのゲイン符号を用いてゲイン復号部601でゲインを復号し、それに対して適応音源/固定音源ゲイン比率制御を行うようにしても良い。
【0102】
このように、誤り補償される現フレームが有声の場合は、適応音源の成分を支配的にすることにより、より有声定常的にし、また、無声・過渡のモードでは、固定音源の成分を支配的にすることにより、適応音源による不適切な周期性成分による劣化を抑え、聴感的な品質の改善を図ることができる。
【0103】
以上のように、符号化データに誤りが検出されたフレームでの音声復号の際に、適応音源/固定音源ゲイン比率制御部により、前フレームのゲインパラメータ(適応音源ゲイン及び固定音源ゲイン)に対して、モード情報に応じた適応音源/固定音源ゲイン比率制御を行うことにより、より改善された復号音声品質を実現する誤り補償方法を提供できる。
【0104】
なお、上記図5に示す音声復号化装置では、音声信号の短区間毎の特徴を表すモード情報を符号化パラメータとして含む音声符号化方式を対象として説明したが、音声のモード情報を符号化パラメータに含まない音声符号化方式に対しても、本発明の誤り補償方法を適用できる。その場合には、復号側で復号パラメータ又は復号信号から、音声信号の短区間毎の特徴を表すモード情報を算出するモード算出部を備えるようにすれば良い。
【0105】
(実施の形態3)
図7は、本発明の実施の形態3に係る音声復号化装置の構成を示すブロック図である。本実施の形態に係る音声復号化装置における誤り補償方法は、実施の形態1,2と同様に、音声符号化側で入力音声信号を符号化した符号化データに対して、復号側で誤りが検出された場合に、音声復号器における音声復号時に、復号音声の品質劣化を抑えるように動作するものである。
【0106】
ここで、音声復号は、10〜50ms程度の一定の短区間(フレームと呼ぶ)の単位で行われ、そのフレーム単位で受信データに誤りが生じているかどうかの検出がなされ、その検出結果が誤り検出フラグとして通知される。誤り検出は、本音声復号化装置の外部で予め行われるものとし、誤り検出の対象データとして、フレーム毎の符号化データの全てを対象としても、あるいは聴感的に重要な符号化データのみを対象としても良い。
【0107】
また、本実施の形態の誤り補償方法を適用する音声符号化方式として、その音声符号化パラメータ(伝送パラメータ)に、少なくとも、適応音源信号及び固定音源信号のゲイン情報を表すゲインパラメータを含むものを対象とする。
【0108】
まず、伝送路誤りが検出されないフレームにおいては、符号化データは、データ分離部701で、復号に必要な各パラメータに分離される。そして、ラグパラメータ復号部702により復号されたラグパラメータを用いて適応音源符号帳703により適応音源が生成され、また固定音源符号帳704により固定音源が生成される。
【0109】
また、ゲインパラメータ復号部705により、後述するような方法で復号されたゲインを用いて、乗算器706によるゲインの乗算及び加算器707による加算により駆動音源が生成される。そして、これらの音源及びLPCパラメータ復号部708により復号されたLPCパラメータを用いてLPC合成フィルタ709及びポストフィルタ710を経由して復号音声が生成される。
【0110】
一方、伝送路誤りが検出されたフレームに対しては、各々の復号パラメータを生成した後、誤りが検出されないフレームと同様にして復号音声を生成する。ゲインパラメータを除く各々のパラメータの復号方法は任意であるが、LPCパラメータやラグパラメータは従来と同様に、前フレームのパラメータを用いても良い。
【0111】
また、固定音源パラメータは、ランダムな固定音源符号を与えて生成した固定音源信号を用いる、乱数発生器により発生させた任意の雑音信号を固定音源信号とする、固定音源パラメータとして現フレームの符号化データから分離され得られた固定音源符号をそのまま使用して復号する、などとしても良い。
【0112】
次に、ゲインパラメータ復号部におけるゲインパラメータの復号方法について、図8を用いて説明する。図8は、図7に示す音声復号化装置におけるゲインパラメータ復号部705の内部構成を示すブロック図である。図8において、まず、ゲイン復号部801で、現フレームの現パラメータ符号からゲインパラメータを復号する。また、誤り状態モニタ部802により、誤り検出の有無に基づいて、誤り検出の状態を判別する。この状態とは、現フレームが、
状態1) 誤り検出フレーム、
状態2) 誤り検出フレームの直後の、連続(1連続の場合も含む)する正常(誤りが検出されない)フレーム、
状態3) それ以外の誤りが検出されないフレーム
のいずれかの場合である。
【0113】
そして、上記状態に応じて、切り替え部803により処理を切り替える。まず、状態3)の場合には、ゲイン復号部801で復号されたゲインパラメータがそのまま出力される。
【0114】
次に、状態1)の場合には、誤り検出フレームにおけるゲインパラメータを算出する。その算出方法は任意であり、従来のような前フレームの適応音源ゲイン及び固定音源ゲインを減衰させた値を用いても良い。また、前フレームのゲイン符号を用いた復号を行い、現フレームのゲインパラメータとして用いても良い。さらに、実施の形態1又は2に示すような、モードに応じたラグ・ゲインパラメータ制御、及びモードに応じたゲインパラメータ比率制御を用いても良い。
【0115】
そして、状態2)においては、誤り検出後の正常フレームに対して、適応音源/固定音源ゲイン制御部806で下記に示すような処理を行う。まず、ゲイン復号部801で復号されたゲインパラメータのうち、適応音源ゲインの値(適応音源に乗ずる係数値)に対して上限値を規定した制御を行う。具体的には、上限値として固定値(例えば、1.0)を規定したり、復号適応音源ゲイン値に比例するような上限値を定めたり、それらを組み合わせたりしても良い。さらに、上記のような適応音源ゲインの上限値制御に伴って、固定音源ゲインも同時に、適応音源ゲインと固定音源ゲインの比率を正しく保つように制御する。具体的な実現方法の一例を下記式(3)に示す。
【0116】
状態2)における最初の一定数のサブフレームに対して、
Figure 0004464488
状態2における上記を越えるサブフレームに対して、 式(3)
Figure 0004464488
ここで、
Ga: 適応音源ゲイン
Ge: 固定音源ゲイン
【0117】
ゲインパラメータの表現方法(符号化方法)として、フレーム(又はサブフレーム)のパワ情報を表すパラメータとそれに対する相対関係を表すパラメータとの組み合わせでゲイン値を表現する方式(例えば、MPEG−4 AudioのMPEモードのCELP符号化)を採用する場合においては、適応音源ゲインが前フレームの復号音源に依存して復号されるため、誤り検出後の正常フレームにおいては、前フレームの誤り補償処理により適応音源ゲインが本来の値とは異なり、場合によっては復号音声の異常な振幅増大による品質劣化を生じることがあるが、本実施の形態のように、ゲインの上限制限により、品質劣化を抑えることができる。
【0118】
また、適応音源ゲインと固定音源ゲインとの比率を、誤りのない本来の復号ゲインでの値になるように制御することにより、誤り検出後の正常フレームでの音源信号が、誤りのない場合により類似することとなり、復号音声品質の改善を図ることができる。
【0119】
なお、上記実施の形態1〜3に係る符号誤り補償方法は、この誤り補償方法をソフトウェアとして構成しても良い。例えば、上記誤り補償方法のプログラムをROMに格納し、そのプログラムにしたがってCPUの指示により動作させるように構成しても良い。また、プログラム,適応音源符号帳,及び固定音源符号帳をコンピュータで読み取り可能な記憶媒体に格納し、この記憶媒体のプログラム,適応符号帳,及び固定音源符号帳をコンピュータのRAMに記録して、プログラムにしたがって動作させるようにしても良い。このような場合においても、上記実施の形態1〜3と同様の作用、効果を呈する。
【0120】
【発明の効果】
以上説明したように、本発明によれば、符号化データに誤りが検出されたフレームでの音声復号の際に、ラグパラメータ復号部及びゲインパラメータ復号部において、音声復号に用いるラグパラメータ及びゲインパラメータを、復号されたモード情報に基づいて適応的に算出する。これにより、より改善された復号音声品質を実現することができる。
【0121】
また、本発明によれば、符号化データに誤りが検出されたフレームでのゲインパラメータ復号の際に、ゲインパラメータ復号部において、適応音源ゲインと固定音源ゲインの比率を、モード情報に応じて適応的に制御する、より具体的には、現フレームが有声を示す場合には、適応音源のゲインの比率を高く、過渡又は無声を示す場合には、適応音源のゲインの比率を低くするように制御することにより、誤り検出フレームの復号音声品質を聴感的により改善させることができる。
【0122】
さらに、本発明によれば、ゲインパラメータ復号部において、符号化データに誤りが検出されたフレームの直後の、誤りが検出されない正常なフレームについて、復号ゲインパラメータの値に応じて、音声復号に用いる適応音源ゲインパラメータ及び固定音源ゲインパラメータを適応的に制御する。より具体的には、復号された適応音源ゲインパラメータの上限値を規定するように制御する。これにより、誤り検出後の正常フレームでの復号音声信号の異常な振幅増大による復号音声品質の劣化を抑えることができる。さらに、適応音源ゲインと固定音源ゲインとの比率を誤りのない本来の復号ゲインでの値になるように制御することにより、誤り検出後の正常フレームでの音源信号が誤りのない場合により類似することとなり、復号音声品質の改善を図ることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る音声符号化装置及び音声復号化装置を備えた無線通信システムの構成を示すブロック図
【図2】本発明の実施の形態1に係る音声復号化装置の構成を示すブロック図
【図3】本発明の実施の形態1に係る音声復号化装置におけるラグパラメータ復号部の内部構成を示すブロック図
【図4】本発明の実施の形態1に係る音声復号化装置におけるゲインパラメータ復号部の内部構成を示すブロック図
【図5】本発明の実施の形態2に係る音声復号化装置の構成を示すブロック図
【図6】本発明の実施の形態2に係る音声復号化装置におけるゲインパラメータ復号部の内部構成を示すブロック図
【図7】本発明の実施の形態3に係る音声復号化装置の構成を示すブロック図
【図8】本発明の実施の形態3に係る音声復号化装置におけるゲインパラメータ復号部の内部構成を示すブロック図
【図9】従来の音声復号化装置の構成を示すブロック図
【符号の説明】
201,501,701 データ分離部
202,502 モード情報復号部
203,503,708 LPCパラメータ復号部
204,504,702 ラグパラメータ復号部
205,505,705 ゲインパラメータ復号部
206,506,703 適応音源符号帳
207,507,704 固定音源符号帳
208,508,706 乗算器
209,509,707 加算器
210,510,709 LPC合成フィルタ
211,511,710 ポストフィルタ
301 ラグ復号部
302 フレーム内ラグ変化検出部
303 フレーム間ラグ変化検出部
304 ラグパラメータ決定部
401,601,801 ゲイン復号部
402,602,803 切り替え部
403,603,804 ゲインバッファ
404 有声フレームゲイン補償部
405 無声・過渡フレームゲイン制御部
604 適応音源/固定音源ゲイン比率制御部
802 誤り状態モニタ部
805 誤り検出フレームゲイン補償部
806 適応音源/固定音源ゲイン制御部

Claims (11)

  1. 符号化データからラグパラメータを復号化する復号化手段と、
    第1フレーム内における前記ラグパラメータの変動量を検出する第1検出手段と、
    第1フレームおよび第2フレーム間における前記ラグパラメータの変動量を検出する第2検出手段と、
    誤りが検出された第1フレームに対し、前記第1検出手段および前記第2検出手段の検出結果に基づいて、第1フレームの前記ラグパラメータまたは第1フレームより過去の第2フレームの前記ラグパラメータのいずれかを、出力ラグパラメータと決定する決定手段と、を具備し、
    前記決定手段は、
    前記第1検出手段によって検出された変動量が所定範囲内の場合、第1フレームの前記ラグパラメータを出力ラグパラメータと決定し、
    前記第1検出手段によって検出された変動量が所定範囲外で、かつ前記第2検出手段によって検出された変動量が所定範囲内の場合、第1フレームの前記ラグパラメータを出力ラグパラメータと決定する、
    音声復号化装置。
  2. 前記決定手段は、前記第1検出手段によって検出された変動量が所定範囲外で、かつ前記第2検出手段によって検出された変動量が所定範囲外の場合、第2フレームの前記ラグパラメータを出力ラグパラメータと決定する請求項1記載の音声復号化装置。
  3. 前記決定手段は、第2フレームのモード情報が過渡モードまたは無声モードを示す場合に前記出力ラグパラメータの決定を行う、請求項1記載の音声復号化装置。
  4. 前記第1検出手段は、前記符号化データに含まれる復号化前のラグパラメータの変動量を用いて、フレーム内における前記ラグパラメータの変動量を検出する、請求項1から請求項3のいずれかに記載の音声復号化装置。
  5. 符号化データからゲインパラメータを復号化する復号化手段と、
    誤りが検出された第1フレームの次の正常な第2フレームにおいて、前記復号化されたゲインパラメータの値を制御する制御手段と、を具備し、
    前記ゲインパラメータは、適応音源ゲインパラメータおよび固定音源ゲインパラメータを含み、
    前記制御手段は、
    前記第2フレームにおいて前記適応音源ゲインパラメータに対し上限値を設定し、かつ、前記上限値を設定した後の前記適応音源ゲインパラメータと前記固定音源ゲインパラメータとの値の比率が、前記上限値を設定する前の復号された適応音源ゲインパラメータと復号された固定音源ゲインパラメータとの値の比率と同じ比率を維持するように前記固定音源ゲインパラメータを制御する、
    音声復号化装置。
  6. 前記制御手段は、前記復号された適応音源ゲインパラメータが判定用閾値より大きいとき、前記上限値を前記復号された適応音源ゲインパラメータで除して前記復号された固定音源ゲインパラメータを乗算した値を新たな固定音源ゲインパラメータとし、前記上限値を新たな適応音源ゲインパラメータとする、請求項5記載の音声復号化装置。
  7. 前記判定用閾値および前記上限値はいずれも「1」である、請求項6記載の音声復号化装置。
  8. 符号化データからラグパラメータを復号化する復号化ステップと、
    第1フレーム内における前記ラグパラメータの変動量を検出する第1検出ステップと、
    第1フレームおよび第2フレーム間における前記ラグパラメータの変動量を検出する第2検出ステップと、
    誤りが検出された第1フレームに対し、前記第1検出ステップおよび前記第2検出ステップの検出結果に基づいて、第1フレームの前記ラグパラメータまたは第1フレームより過去の第2フレームの前記ラグパラメータのいずれかを、出力ラグパラメータと決定する決定ステップと、を具備し、
    前記決定ステップは、
    前記第1検出ステップによって検出された変動量が所定範囲内の場合、第1フレームの前記ラグパラメータを出力ラグパラメータと決定し、
    前記第1検出ステップによって検出された変動量が所定範囲外で、かつ前記第2検出ステップによって検出された変動量が所定範囲内の場合、第1フレームの前記ラグパラメータを出力ラグパラメータと決定する、
    符号誤り補償方法。
  9. 符号化データからゲインパラメータを復号化する復号化工程と、
    誤りが検出された第1フレームの次の正常な第2フレームにおいて、前記復号化されたゲインパラメータの値を制御する制御工程と、を具備し、
    前記ゲインパラメータは、適応音源ゲインパラメータおよび固定音源ゲインパラメータを含み、
    前記制御工程は、
    前記第2フレームにおいて前記適応音源ゲインパラメータに対し上限値を設定し、かつ、前記上限値を設定した後の前記適応音源ゲインパラメータと前記固定音源ゲインパラメータとの値の比率が、前記上限値を設定する前の復号された適応音源ゲインパラメータと復号された固定音源ゲインパラメータとの値の比率と同じ比率を維持するように前記固定音源ゲインパラメータを制御する、
    音声復号化方法。
  10. 前記制御工程は、前記復号された適応音源ゲインパラメータが判定用閾値より大きいとき、前記上限値を前記復号された適応音源ゲインパラメータで除して前記復号された固定音源ゲインパラメータを乗算した値を新たな固定音源ゲインパラメータとし、前記上限値を新たな適応音源ゲインパラメータとする、請求項9記載の音声復号化方法。
  11. 前記判定用閾値および前記上限値はいずれも「1」である、請求項10記載の音声復号化方法。
JP18571299A 1999-06-30 1999-06-30 音声復号化装置及び符号誤り補償方法、音声復号化方法 Expired - Fee Related JP4464488B2 (ja)

Priority Applications (10)

Application Number Priority Date Filing Date Title
JP18571299A JP4464488B2 (ja) 1999-06-30 1999-06-30 音声復号化装置及び符号誤り補償方法、音声復号化方法
KR10-2001-7016812A KR100439652B1 (ko) 1999-06-30 2000-06-30 음성 복호화 장치, 부호 오류 보상 방법 및 기록 매체
CNB008097739A CN1220177C (zh) 1999-06-30 2000-06-30 话音解码装置和编码差错补偿方法
CA2377597A CA2377597C (en) 1999-06-30 2000-06-30 Speech decoder and code error compensation method
PCT/JP2000/004323 WO2001003115A1 (fr) 1999-06-30 2000-06-30 Decodeur audio et procede de compensation d'erreur de codage
AU57064/00A AU5706400A (en) 1999-06-30 2000-06-30 Audio decoder and coding error compensating method
EP10180814A EP2276021B1 (en) 1999-06-30 2000-06-30 Speech decoder and speech decoding method
US10/018,317 US7171354B1 (en) 1999-06-30 2000-06-30 Audio decoder and coding error compensating method
EP00942405A EP1207519B1 (en) 1999-06-30 2000-06-30 Audio decoder and coding error compensating method
US11/641,009 US7499853B2 (en) 1999-06-30 2006-12-19 Speech decoder and code error compensation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18571299A JP4464488B2 (ja) 1999-06-30 1999-06-30 音声復号化装置及び符号誤り補償方法、音声復号化方法

Publications (2)

Publication Number Publication Date
JP2001013998A JP2001013998A (ja) 2001-01-19
JP4464488B2 true JP4464488B2 (ja) 2010-05-19

Family

ID=16175542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18571299A Expired - Fee Related JP4464488B2 (ja) 1999-06-30 1999-06-30 音声復号化装置及び符号誤り補償方法、音声復号化方法

Country Status (8)

Country Link
US (2) US7171354B1 (ja)
EP (2) EP1207519B1 (ja)
JP (1) JP4464488B2 (ja)
KR (1) KR100439652B1 (ja)
CN (1) CN1220177C (ja)
AU (1) AU5706400A (ja)
CA (1) CA2377597C (ja)
WO (1) WO2001003115A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069208B2 (en) 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US7447639B2 (en) * 2001-01-24 2008-11-04 Nokia Corporation System and method for error concealment in digital audio transmission
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
US8725501B2 (en) 2004-07-20 2014-05-13 Panasonic Corporation Audio decoding device and compensation frame generation method
KR100686174B1 (ko) 2005-05-31 2007-02-26 엘지전자 주식회사 오디오 에러 은닉 방법
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
CN102682775B (zh) * 2006-11-10 2014-10-08 松下电器(美国)知识产权公司 参数解码方法及参数解码装置
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
CN103383846B (zh) * 2006-12-26 2016-08-10 华为技术有限公司 改进语音丢包修补质量的语音编码方法
CN101226744B (zh) * 2007-01-19 2011-04-13 华为技术有限公司 语音解码器中实现语音解码的方法及装置
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US8204753B2 (en) * 2007-08-23 2012-06-19 Texas Instruments Incorporated Stabilization and glitch minimization for CCITT recommendation G.726 speech CODEC during packet loss scenarios by regressor control and internal state updates of the decoding process
CN101552008B (zh) * 2008-04-01 2011-11-16 华为技术有限公司 语音编码方法及装置、语音解码方法及装置
US8645129B2 (en) * 2008-05-12 2014-02-04 Broadcom Corporation Integrated speech intelligibility enhancement system and acoustic echo canceller
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
KR20100006492A (ko) 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
CN102369569B (zh) * 2009-05-13 2013-04-24 华为技术有限公司 编码处理方法、编码处理装置与发射机
US8762136B2 (en) * 2011-05-03 2014-06-24 Lsi Corporation System and method of speech compression using an inter frame parameter correlation
MX338070B (es) 2011-10-21 2016-04-01 Samsung Electronics Co Ltd Metodo y aparato de ocultamiento de error de trama y metodo y aparato de decodificación de audio.
ES2805744T3 (es) 2013-10-31 2021-02-15 Fraunhofer Ges Forschung Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo
CN105793924B (zh) 2013-10-31 2019-11-22 弗朗霍夫应用科学研究促进协会 使用错误隐藏提供经解码的音频信息的音频解码器及方法
US9953660B2 (en) * 2014-08-19 2018-04-24 Nuance Communications, Inc. System and method for reducing tandeming effects in a communication system
JP6516099B2 (ja) * 2015-08-05 2019-05-22 パナソニックIpマネジメント株式会社 音声信号復号装置および音声信号復号方法
EP3948857A1 (en) * 2019-03-29 2022-02-09 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for error recovery in predictive coding in multichannel audio frames

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
JP3275248B2 (ja) * 1991-07-15 2002-04-15 日本電信電話株式会社 音声復号方法
US5657418A (en) * 1991-09-05 1997-08-12 Motorola, Inc. Provision of speech coder gain information using multiple coding modes
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
JP2746033B2 (ja) 1992-12-24 1998-04-28 日本電気株式会社 音声復号化装置
JP2624130B2 (ja) * 1993-07-29 1997-06-25 日本電気株式会社 音声符号化方式
JPH07239699A (ja) * 1994-02-28 1995-09-12 Hitachi Ltd 音声符号化方法およびこの方法を用いた音声符号化装置
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
JPH08211895A (ja) * 1994-11-21 1996-08-20 Rockwell Internatl Corp ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
JPH08320700A (ja) * 1995-05-26 1996-12-03 Nec Corp 音声符号化装置
JP3616432B2 (ja) * 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
JPH09134798A (ja) * 1995-11-08 1997-05-20 Jeol Ltd 高周波装置
JP3308783B2 (ja) 1995-11-10 2002-07-29 日本電気株式会社 音声復号化装置
JPH09185396A (ja) * 1995-12-28 1997-07-15 Olympus Optical Co Ltd 音声符号化装置
JP3092652B2 (ja) * 1996-06-10 2000-09-25 日本電気株式会社 音声再生装置

Also Published As

Publication number Publication date
KR100439652B1 (ko) 2004-07-12
CA2377597A1 (en) 2001-01-11
EP2276021A3 (en) 2011-01-26
CN1359513A (zh) 2002-07-17
EP2276021A2 (en) 2011-01-19
KR20020027378A (ko) 2002-04-13
CN1220177C (zh) 2005-09-21
WO2001003115A1 (fr) 2001-01-11
US7499853B2 (en) 2009-03-03
US20070100614A1 (en) 2007-05-03
US7171354B1 (en) 2007-01-30
EP1207519A4 (en) 2005-08-24
EP2276021B1 (en) 2012-10-24
CA2377597C (en) 2011-06-28
AU5706400A (en) 2001-01-22
JP2001013998A (ja) 2001-01-19
EP1207519B1 (en) 2013-02-27
EP1207519A1 (en) 2002-05-22

Similar Documents

Publication Publication Date Title
JP4464488B2 (ja) 音声復号化装置及び符号誤り補償方法、音声復号化方法
EP2102862B1 (en) Frame error concealment method and apparatus and decoding method and apparatus using the same
JP4313570B2 (ja) 音声復号における音声フレームのエラー隠蔽のためのシステム
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
US7426465B2 (en) Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality
EP1598811B1 (en) Decoding apparatus and method
KR20010024869A (ko) 적응 포스트필터를 포함하는 디코딩 방법 및 시스템
US10607624B2 (en) Signal codec device and method in communication system
JP3568255B2 (ja) 音声符号化装置及びその方法
US8195469B1 (en) Device, method, and program for encoding/decoding of speech with function of encoding silent period
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP3936370B2 (ja) 音声復号化装置及びその方法
JPH09172413A (ja) 可変レート音声符号化方式
JP3571709B2 (ja) 音声符号化装置及びその方法
JP3660676B2 (ja) 音声符号化装置及びその方法
JP3817562B2 (ja) 音声復号化装置及びその方法
JP3936369B2 (ja) 音声復号化装置及びその方法
JPH07334195A (ja) サブフレーム長可変音声符号化装置
JP2003216197A (ja) 音声復号化装置及びその方法
JPH09297600A (ja) 音声復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100126

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100219

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees