JPH06507252A

JPH06507252A - 音声の量子化とエラー訂正のための方法

Info

Publication number: JPH06507252A
Application number: JP4502957A
Authority: JP
Inventors: ハードウィック、ジョン　シー; リム、ジェイ　エス
Original assignee: ディジタル　ボイス　システムズ、インク
Priority date: 1990-12-05
Filing date: 1991-12-04
Publication date: 1994-08-11
Anticipated expiration: 2018-11-17
Also published as: EP0560931A1; CA2096425C; DE69133458T2; EP0893791A2; EP1211669A2; JP3467270B2; AU9147091A; US5226084A; EP0560931B1; AU657508B2; EP0893791B1; EP1211669B1; CA2096425A1; DE69133058T2; DE69132013D1; WO1992010830A1; DE69132013T2; EP1211669A3; EP0893791A3; DE69133458D1

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】発明の名称　音声の量子化とエラー訂正のための方法技術分野本発明は、音声の量子化方法及びビット・エラーの存在時において音声の品質を維持するための方法に関する。

本発明に関係した刊行物は以下を含む、ジェイ、エル、フラナガン（Ｊ、Ｌ、Ｆｌａｎａｇａｎ）、５ｐｅｅｃｈ　Ａｎａｌｙｓｉｓ。

５ｙｎｔｈｅｓｉｓ　ａｎｄ　Ｐｅｒｃｅｐｔｉｏｎ、　Ｓｌ）ｒｉｎｇｅｒ− Ｖｅｒｌａｇ、１９７２１ρρ、　３７８−３８６（位相ボコーダ、講波数に基づく音声分析−合成システム）；クアティエリ（Ｑｕａｔｌｅｒｌ）等、５ｐｅｅｃｈ　Ｔｒａｎｓｆｏｒｍａｔｉｏｎｓ　Ｂａ５ｅｄ　ｏｎ　ａ　５ｉｎｕｓｏｉｄａｌＲｅｐｒｅｓｅｎｔａｔｉｏｎ”　、　ＩＥＥＥ　ＴＡＳＳＰ、Ｖｏｌ、　Ａ３５Ｐ３４．　Ｎｏ、６゜Ｄｅｃ、　１９８６．　ｐｐ、１４４９−１９８６　（正弦波表現に基づく分析−合成技術）ニゲリフイン（Ｇｒｉｆｆｉｎ）、”　ＭｕｌｔｉｂａｎｄＥｘｃｌｔａｔｉｏｎ　Ｖｏｃｏｄｅｒ”　、Ｐｈ、Ｄ　Ｔｈｅｍ’ｓ、Ｍ、１．丁、１９８７（８０００ｂｐｓマルチバンド励起音声フーダ）；グリフィ　：ｙ　（Ｇｒｉｆｆｉｎ）ＩＦ　、　’　Ａ　Ｈｌｇｈ　Ｑｕａｌｉｔｙ　９．６ｋｂｐｓ　ＳｐｅｅｃｈＣｏｄｉｎｇ　ｓｙｓｔｅｍ”、　Ｐｒｏｃ、　ＩＣＡＳＳＰ　８６．　ｐｐ、　１２５−１２８゜Ｔｏｋｙｏ、　Ｊａｐａｎ、　Ａｐｒｉｌ　１３−２０．１９８６（マルチバンド励起身声コーダ）ｔグリフイン（Ｇｒｉｆｆｉｎ）等、”ＡＮｅｖＭｏｄｅｌ−Ｂａｓｅｄ　５ｐｅｅｃｈ　Ａｎａｌｙｓｉｓ／５ｙｎｔｈｅｓｉｓ　Ｓｙｓｔｅｍ ″　。

Ｐｒｏｃ、ＩＣＡＳＳＰ　８５．ｐｐ、５１３−５１６．Ｔａ＊ｐａ、ＦＬ、、Ｍａｒｃｈ２．６−２９．１９８５　（マルチバンド励起音声モデル）；ハードイック（Ｈａｒｄｗｌｃｋ）、”　Ａ　４．８ｋｂｐｓ、　Ｍｕｌｔｉ−ＢａｎｄＥｘｃｉｔａｔｉｏｎ　５ｐｅｅｃｈ　Ｃｏｄｅｒ”　、Ｓ、Ｍ、丁ｈｅｓｉｓ、Ｍ、１．Ｔ、Ｍａｙ。

１９８Ｂ（４８００ｂｐｓマルチバンド励起音声コーダ）；マッカレイ（ＭｃＡｕｌａｙ）等、”　Ｍｉｄ−Ｒａｔｅ　Ｃｏｄｉｎｇ　Ｂａ５ｅｄ　ｏｎ　ａ　５ｔｎｕｓｏｉｄａｌ　Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ　ｏｆ　５ｐｅｅｃｈ″ 、　Ｐｒｏｃ、　ＩＣＡＳＳＰ　８５．ｐｐ、　９４５−９４８．τａｓｐａ、ＦＬ、、　Ｍａｒｃｈ　２６−２９．１９８５゜（正弦波表現に基づく音声コーディング）；キャムベル（Ｃａ５ｐｂｅｌｌ）等、　”　Ｔｈｅ　Ｎｅｗ　４８００　ｂｐｉ　Ｖｏｉｃｅ　Ｃｏｄｉｎｇ！３ｔａｎｄａｒｄ”　、Ｎｉｌ　５ｐｅｅｃｈ　Ｔｅｃｈ　Ｃｏｎｆｅｒｅｎｃｅ、　ＮＯＶ、１９８９゜（ローレート音声コーグにおけるエラー訂正）；キャムペル（Ｃａ５ｐｂｅｌｌ）等、　 ”　ＣＥＬＰ　Ｃｏｄｉｎｇ　ｆｏｒ　ＬａｎｄＭｏｂｉｌｅ　Ｒａｄｉｏ　Ａｐｐｌｉｃａｔｉｏｎｓ″、Ｐｒｏｃ、　ＩＣＡＳＳＳＰ　９Ｇ−ｐｐ、４８５ −４６８．＾１ｂｅｑｕｅｒｑｕｅ、ＮＭ、Ａｐｒｉｌ　３−６．１９９０（ローレート音声コーグにおけるエラー訂正）；レベスタ（Ｌｅｖｅｓｑｕｅ）等、 ′　− ”　’　、ｖｉｌｅｙ、ＩＨ５，ｐｐ、１５７−１７０゜（エラー訂正一般）；ジェイヤント（Ｊａｙａｎｔ）等１、　Ｐｒｅｎｔｌｃｅ　−Ｈａｌｌ、１９１１４（量子化一般）、マクホウル（Ｍａｋｈｏｕｌ）等、’　ＶｅｃｔｏｒＱｕａｎｔｉｚａｔｉｏｎ　ｉｎ　５ｐｅｅｃｈ　Ｃｏｄｉｎｇ”　、Ｆｒｅｅ、　ＩＥＥＥ、１９８５゜ｐｐ、１５５１−１５８８（ベクトル量子化一般）；ジェイヤントＩ　Ｊａｙａｎｔ）等、”Ａｄａｐｔｉｖｅ　ＰｏｓＬｆｉｌｔｅｒｉｎｇ　ｏｆ　１６　ｋｂ／ｓ−ＡＤＰＣＭ　５ｐｅｅｃｈ″　、Ｐｒｏｃ、ＩＣＡＳＳＰ　８６．　ｐｐ、８２９−８３２゜丁ａｋｙｏ、　Ｊａｐａｎ、ＡＰｒｉｌ　１３−２０．１９８６（音声の適応ポストフィルタリング）。

これらの刊行物の内容は、引用によってこの明綱書の一部となる。

音声符号化（スピーチ・コーディング）、即ち音声を少ない数のビットに圧縮することの問題は多くの応用を有し、この結果、文献上も相当な注目を受けてきた。広範に研究され、実際に利用された音声コーグ（ボコーダ）の一つの部類は、棒形予測ボコーダ、ホモモルフイック（準同型）ボコーダ、及びチャンネル・ボコーダである。これらのボコーダにおいては、音声は有声音の周期的インパルス列あるいは無声音のランダム署音により励起される線形システムの応答として短時間（ショートタイム）ベースでモデル化されている。この部類のボコーダについて、音声はノ＼ミング（Ｈａ＊ｓｉｎｇ）ウィンドウのようなウィンドウを用１鬼て過初にセグメント化して解析される０次に、音声の各セグメントに対し、励起パラメータとシステムパラメータが推定及び量子化される。励起パラメータは、有声／無声の判定とピッチ周期から成る。システムパラメータは、スペクトル包絡またはシステムのインパルス応答から成る。Ｗ声を再構成するために、量子化されたパラメータが用いられ、有声領域においては周期的インパルス列から成る励起信号が合成され、無声領域においてはランダム電音から成る励起信号が合成される。この励起信号は、量子化されたシステムパラメータを用いて濾波される。

音声モデルに基づくボコーダは判別可能な音声の生成に極めて成功したが、高品質の音声を生成することには成功していない、その結果、このＩｌ＃Ｉのボコーダは、高品質音声コーディングには広く用いられていない、再構成された音声の貧弱な品質は、一部は、モデルパラメータの不正確な推定により、また一部は、音声モデルの限界による。

マルチバンド・エキサイチーシラン（即ち、多重帯域励起、ｒＭＢＥ、と略される）音声モデルとして参照される。新しい音声モデルがグリフイン（Ｇｒｉｆｆｌｎ）及びリム（Ｌｉｅ）によって１９８４年に開発された。この新しい音声モデルに基づく音声コーグは、グリフイン（Ｇｒｌｆｆｌｎ）及びリム（Ｌｉｍ）によって１９８６年に開発され、８０００ｂｐｓ（ビット／秒）のレートで高品質の音声を生成することができることを示した。ハードイック（ｌｌａｒｄｗｉｃｋ）及びリム（Ｌｉｅ）による後続する仕事は１００ｂｐｓ　Ｍ　Ｂ　Ｅ音声コーグを作製し、これは高品質の音声を生成することができた。この４８００ｂｐａ音声コーダはより洗練された量子化技術を用いて、それより前のＭＢＥ音声コーコー８０００ｂｐｌで達成していたと同様な品質を４８００ｂＰ１１で達成した。

４８００ｂｐｓ　Ｍ　Ｂ　Ｅ　Ｗ声コーダはＭＢＥ分析分析７シ成システムいてＭＢＥ音声モデルパラメータを推定し、推定されたＭＢＥｌｉ声モデルハモデルパラメータを合成する。５（ｎ）によって表わされる離敢會声儒号は。

アナログ音声信号の標本化（サンプリング）によって得られる。これは典型的には８　ｋＨｚの標本化速度（サンプリングレート）で行なわれる。もっとも他の標本化速度は、各種システム・パラメータの単純な変更によって容易に設定することができる。システムは、ハミング（Ｈａｎｇｉｎｇ）ウィンドウ又はカイザー（Ｋａｉｉｅｒ）ウィンドウ等のウィンドウｗ　（ｎ）をｓ　（ｎ）に乗算してウィンドウ化された信号Ｓユ（ｎ）を得ることにより、離散信号を小さな、互いに重畳する複数セグメント、あるいは複数セグメントに分割する。各々のセグメントは該セグメントを特徴付けるＭＢＥ音声モデルパラメータの紐を得るために解析される。ＭＢＥｆ声モデルパラメータは、ピッチ周期と等価な基本周波数、−組の有声音／無声音の判定、−組のスペクトルＩＬオプシツンとして、−組のスペクトル位相から成る。これらのモデルパラメータは、次に、各セグメントに対して固定数のビットを用いて量子化される。結果のビットは音声信号の再構成に用いることができ、該ビットからＭＢＥ音声モデルパラメータを再構成し、次に該モデルパラメータから音声が合成される。典型的なＭＢＥｌＩ声コーダのコーック１１図を図１に示す。

４８００　ｂｐ＠Ｍ　Ｂ　Ｅ音声コーグは、スペクトル振幅を量子化するために複雑な技術の使用を必要とした。各セグメントに対してスペクトル振幅の量子化のために用いられるビット数は５０から１２５ビツトの間で変化した。更に、各セグメントに対するスペクトル振幅の数は９と６０の間で変化した。各セグメントについて利用可能なビット数をもってスペクトル振幅の全てを効率的に表現することが可能な量子化方法が考案された。

このスペクトル振幅量子化方法は、ＭＢＥ音声コーコー使用するために設計されたが、量子化技術は、例えば、正弦波変換コーグ及びハーモニツクコーグ等の他の多数の音声コーディング方法においても同様に有用周波数ω０かも次式の関係に従って導出される。

ここに、０≦β＜　１．０　は標本化速度の半分に対する音声帯域幅を決定する０式（１）の関数り、ＪはＸよりもは１く１≦Ｌに対してＭ＋で示され、Ｍｌは晟も低い周波数のスペクトル振幅であり、ＭＬは最も高いスペクトル振幅である。

現在の音声セグメントのスペクトル振幅は、第一に、−組の予１ｌｌＩ残差を計算することによって量子化される。

予測残差は現在の音声セグメントと前の音声セグメン現在の音声セグメントにおけるスペクトル振幅の開数ル振輻の個数を示すとすると、予測残差は１≦１≦Ｌ０に対して、式（２）で与えられる。

捷暢を表わし、喜−１１は前の音声セグメントの量子化されたスペクトル振幅を表わす、定数ｙは典型的には、７とされるが０≦γ≦１の範囲の任意の値を用しすることが可能である。

予測残差は、要素数がＫの複数ブロックに分割されで正しく割り切れないとき、最高ｊｌｌｄＩ数ブロックｌよ、冨８について示す。

予測残差ブロックの各々は、式（３）で定義される離散コサイン変換（ＤＣＴ）を用いて変換される。

各ブロックに対する変換の長さＪは、ブロック内の要素の数に等しい、従って、最高ＪａＩｉＩＩ数ブロック以外のブロックは長さＫのＤＣＴで変換され、最高ｌｌ波数ブロックのＤＣ’Ｔの長さはＫまたはＫより小となる。

ＤＣＴは逆変換可能であるため、Ｌ個のＯＣＴ係数は現在のセグメントについてのスペクトル振幅予測残差を完全に規定する。

スペクトル振幅を量子化するために利用可能な全体のビット数は、ビット割り当て規則に従ってＤＣＴ係数内で分割される。この規則は、知覚的（聴覚的）にさほど重要でない高い周波数ブロックよりも知覚的により重要な低い周波数ブロックに対してより多くのビットを付与することを企てる。さらに、ビット割り当て規則は、ビットを一つのブロック内において、その比較的に長期の変動に従ってＤＣＴ係数に分割する。

この近接法は、ビット割り当てを音声の知覚特性及びＤＣＴの量子化特性とマツチさせる。

各ＤＣＴ係数はビット割り当て規則で規定されるビット数を用いて量子化される。典型的には、一様な量干出が用いられろが、しかし、非一様ベクトル量子化もまた用いることができる。各量子化器のステップサイズは、ＤＣＴ係数の長期分散及び各係数を量子化するために用いられるビット数から決定される９表１は長期分散がσ２に等しいものについて、ビット数の関数としてステップサイズにおける典型的な分散を示している。

各ＤＣＴ（１数がビット割り当て規則で規定されるビット数を用いて量子化されると、応用に依存して２道１１現の伝送、格納等が行なわれる。

１１１：　一様量干出器のステップサイズスペクトル振幅は、各ブロックに対して量子化されたＤＣＴ係数を再構成することによって再構成が行なわれ、これは各ブロックについて逆ＤＣＴを実行し、方程式（２）の逆変換を用いて前のセグメントの量子化されたスペクトル振幅を組み合わせることによって行なわれる。

逆ＤＣＴは式（４）にて与えられる。

ここに、各ブロックの長さＪは、該ブロックの要素の個数に選択され、α（ｊ）は式（５）にて与えられる。

４８００　ｂｐｓ　Ｍ　Ｂ　Ｅ　ｆ声コーダの一つの部属があるとしたら、それは、ＭＢＥモデルパラメータの２道表現にビット・エラーが加えられた場合に、再構成された音声の知覚品質が相当に低減されろことである。多くの音声コーグの応用においてビット・エラーが存在するため、ロバスト（頑１１）な音声コーグはビット・エラーの訂正し、検出しそして／又は許容することができなければならない、砥めて成功した一つの技術は、モデルパラメータの２道表現においてエラー訂正符号を用いることである。エラー訂正符号は、頻繁でなし１ビツト・エラーの修正を可能とし、システムがエラー率を推定することを可能とする。エラー率の推定は、モデルパラメータを適応的に処理して、残りのビット・エラーの効果を減少するために用いることができる。

典型的には、エラー率は、現在のセグメントにおいてエラー訂正符号によって訂正（又は検出）されたエラー数を計数することによって推定され、次にこの情報を用いて現在のエラー率の推定値を更新する０例えば、各セグメントが２３ビツトのうち３つのエラーが検出可能な（２：ｌ、１２）ゴレイ（Ｇｏｌａｙ）コードを含み、５丁が現在のセグメントにおいて訂正されたエラー（０−３）の数を表わすとき、エラー率ε−の現在の推定は式（６）に従って更新される。

ここに、βはξ靴の適応性を制御する、０≦β≦１の範囲の定数である。

エラー訂正符号又はエラー検出符号が用いられるとき、ａ声モデルパラメータを表示するビットはビット・エラーに対してよりロバストな別のビット組に変換される。エラー訂正符号又はエラー検出符号の使用は、伝送又は格納される必要があるビット数を増加させる。

伝送されるべき余分なビット数は、通常エラー訂正又は検出符号のロバストネスに関係している。大抵の応用において、伝送又は格納されるビットｍｌｉを最小化することが望ましい、この場合、エラー訂正又は検出はシステム全体の性能（パーフォーマンス）を最大とするように、選択されねばならない。

このＷＡ類の音声符号化システムの他の問題は、ａ声モデルパラメータの推定の限界が、合成された音声の品質劣化を招くことである。引き続いて行なわれるモデルパラメータの量子化は更なる劣化を含む、劣化として１合成された音声の反射又は渭Ｗ（マツフル）された品質の形式をとる。さらに５元の音声データには存在しなかった背景雑音又は他の人工介在物が存在することがある。この形式の劣化は、音声データの何もビット・エラーが存在しない場合にも生じる。しかしながら、ビット・エラーは、この問題をより悪化させる。典型的には、音声符号化システムは、この形式の劣化を最小化するようにパラメータ推定器とパラメータ量子化器を最適化することを企てる。ｆｌ！のシステムは該劣化をポストフィルタリング（渣瀘ｓｉ理）によって低減しようとする。ポストフィルタリングにおいては、出力音声は、時間傾城において適応蟹の全極形フィルタを用いて濾波されフォーマット・ピークを先鋭化する。

この方法は、スペクトル強調処理に対して精細な刺御を行なうことができず、計算上も高くつＩ３＜計算量が多い）、ｊＩＩ波ａｍ域コーコーとって効率が良くない。

ここに説明する本発明は、多くの異なる音声符号化方法に適用される。即ち、線形予測音声コーグ、チャンネル・ボコーダ、ホモモルフイック・ボコーダ、正弦変換コーグ、多重帯域励起（マルチバンドエキサイチーシラン）音声コーグ、改良された多重帯域（ＩＭＢＥ）ＩＩ起音声ココー等を含むがこれらに限定されない０本発明の詳細な説明するために、Ｉ　ＮＭＡＲＳ　Ａ　Ｔ　−Ｍ　（Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｍａｒｌｎｅ　ＳａｔｅｌｌｉｔｅＯｒｇａｎｌｚａＨｏｎ；ｌ！ｌＩＩ海洋衛星組織）Ｉｆ星通信システムの一部として轟近標準化された９、４　ｋｂｐｓＩ　Ｍ　Ｂ　Ｅ　１１声コーダを用いる。このコーグは、多重帯域励起（ＭＢＥ）ａ声モデルとして参照されるロバスト音声モデルを用いる。

ＭＢＥモデルパラメータを量子化するための効率的な複数の方法が開発された。

これらの方法は、実質的に２　ｋｂｐｓ以上のいかなるビット・レートでモデルパラメータを量子化することが可能である。ＩＮＭＡＲ５ＡＴ−Ｍ衛星通信システムで用いられる８、４　ｋｂｐｓ　ＩＭＢＥ音声コーダコー５０　Ｈｚフレーム・レートを用いる。従って、ｌフレーム当たり１２８ビツトが利用可能である。１２８ビツトのうち、４５ビツトは前方エラー訂正のために確保されている。

ｌフレーム当たり残りの８３ビツトがλ（ＢＥモデルパラメータを量子化するために用いられる０ＭＢＥモデルパラメータは、基本周波する。８コの利用可能なビットは、表２に示すモデルパラメータ間で分割される。

基本馬１１１１ｉは最初にこれを式（７）を用いて等価なピッチ周期に変換することによって量子化される。

ｋｂｐｓＩＭＢＥシステムにおいて、このパラメータは、８ビツトステツプサイズ、５を用いて一様に量子化される。これは半分のサンプルのピッチ精度に対応する。

Ｋ　Ｖ／ＵＶ（有声／無声〉の判定は２道端である。

このため、これらは判定当たり単一ビットを用いて符号化することが可能である。６．４　ｋｂｐｓシステムは、最大１２の判定を用い、各周波数帯域の幅は３ ω０である。最大周波数帯域の暢は３．８　ｋ）ｌｚまでの周波数を含むよう：こ調節される。

スペクトル振幅は、−組の予測残差を形成することによって量子化される。各予測残差は、現在のセグメントのスペクトル振幅！幅の対数と前の音声フレームの同一周波数を表わすスペクトル振幅の対数の差である。

スペクトル振幅予測残差は、各ブロックがほぼ同一個数の予測残差を含む６個のブロックに分割される。６個の７０ツクの各々は　Ｍ　ｌｌ＆コサイン変換ｆＤｃＴ）により変換され、６個のブロックのり、Ｃ，（直流）係数は、６要素の予測残差ブロック平均（ＰＲＢＡ；Ｐｒｅｄｉｃｔｉｏｎ　Ｒｅ５ｉｄｕａｌ　Ｂｌｏｃｋ　Ａｖｅｒａｇｅ）ベクトルに結合される。ＰＲＢＡベクトルから平均値が差し引かれ、６ビツト非一様量子化器を用いて量子化される。ゼロ平均ＰＲＢＡベクトルは１０ビツト・ベクトル量子化器を用いてベクトル量子化される。

１０ビツトＰＲＢＡコードブツクは、各種の音声材料から、ゼロ平均ＰＲＢ、ａ、ベクトルから成る大きなトレーニング・セットに基づきに一平均クラスターリング・アルゴリズムを用いて設計された。ＰＲＢＡベクトルに含まれない高次のＤＣＴ係数は５９−にの残りのビットを用いてスカラー一様量干出器で量子化される。ビット割り当て及びステップ・サイズは高次のＤＣＴ係数の長期変動に基づいている。

この量子化方法には、いくつかの利点がある。第１に、この量子化方法は小数ビットを用いて非常に良好な忠実性を提供し、Ｌがその範囲で変動するに障してこの忠実性を維持する。さらに、この近接法の計算要求は、ＡＴ＆τＤＳＰ３２Ｃ等単−のＤＳＰ　（ディジタル信号処理装置）を用いて、実時間実装に要求される限界の範囲内によく収まっている。最俺に、この量子化方法は、スペクトル振幅を、ビット・エラーに感応する、ＰＲＢＡベクトルの平均等の小数の要素と、ビット・エラーに余り感応しない多数の他の要素に分別する。

前方エラー訂正は、小数の感応要素について高いレベルの保護を、残りの要素については低い保護を提供し、効率的な仕方で用いることができる。これは次の章で説明する。

第１の視点において、本発明は予測されたスペクトル振幅の形成のための改良された方法を特徴とする。

これらは、現在のセグメントのＪ１１波数で前のセグメントのスペクトル振幅を推定するために前のセグメントのスペクトル振幅の補間に基づいている。この新しい方法は、予測残差が低い分散を有し、このため予測残差は所定のビット数に対して低い歪みで量子化可能であるという結果、セグメント間のスペクトル振幅の周波数におけるシフトを訂正する。好適な実施態様において、スペクトル振幅のａｍ数は基本ａｍ数とその倍数である。

本発明は、第２の視点において、予測残差のブロックへの分割のための改良された方法を特徴とする。各ブロックの長さを固定する代わりに、予Ｓテ１差を可変なブロック数に分割し、ブロックサイズはセグメント同士で異なる。好適なＸＩ［態様において、すべてのセグメントにおいて６ｍのブロックが用いられる。即ち、低Ｒ波数ブロックにおける予測残差の個数は高周波数ブロックにおける予ｙＩＡｎ差の個数よりも大きくなく、低Ｊ１１波数ブロックにおける要索数は１以下である。この新しい方法は、音声特性により密接にマツチし、所与のビット数について少ない歪みで予測残差の量子化を可能としている。さらに、この方法はスペクトル振幅の量子化を更に改善するベクトル量子化で容易に用いることができる。

本発明は第３の視点において、予測残差の量子化の改良された方法を特徴としている。予Ｓ残差はブロックにグループ化され、各ブロック内における予測残差の平均が決定され、ブロックのすべての平均は予測残差ブロック平均（ＰＲＢＡ）ベクトルにグループ化され、ＰＲＢＡベクトルが量子化される。好適なＸ施態様において、予測残差の平均は、ブロック内においてスペクトル振幅予測残差を加算し、該ブロック内において予測残差の個数で除するか、又はブロック内においてスペクトル握輻予濶ツ１差のＤＣＴを計算しＤＣＴの最初の係数を平均として用いることによって得られる。ＰＲＢＡベクトルは、好ましくは二つの方法の一つを用いて符号化される。即ち、（１）ＰＲＢＡベクトルについてＤＣＴ等の変換を行ない変換係数をスカラー量子化する；　（２）ＰＲＢＡベクトルをベクトル量子化する。ベクトル量子化は、好ましくは、ＰＲＢＡベクトルの平均を決定し、該平均をスカラー量子化を用いて量子化し、ゼロ平均コードブックでベクトル量子化を用いてゼロ平均ＰＲＢＡベクトルを量子化することによって行なわれる０本発明のこの視点の利点は４量子化される予測残差が所与のビット数に対して低い歪みで量子化９鑓であるということである。

本発明は、第４の視点において、高いビット・エラー率の存在のもと、有声／無声の判定を決めるための改良された方法を特徴とする。ビット・エラー率は現在の音声セグメントについて推定され、予め定められたエラー・レート閾値と比較され、予め定められたエネルギー閾値を超えたスペクトル振幅について有声／無声の判定は、推定されたビット・エラー率がエラー車間ｆ−を超えている時に、現在のセグメントについてすべて有声であると宣言される。これはビット・エラーの知覚的効果を低減する。有声音から無声音への切り佇えによって生じる歪みが低減される。

本発明は、第５の視点において、音声モデルパラメータのエラー訂正（又はエラー検出）コーディングの改良された方法を特徴とする。新しい方法は、量子化されたモデルパラメータを符号化するために少なくとも二つのタイプのエラー訂正コーディングを用いる。

訂正コーディングの第１のタイプは、第２のタイプのコーディングよりも多くの個数の追加ビットを加え。

ビット・エラーにより一層感応するパラメータ群について用いられる。別のタイプのエラー訂正コーディングは、第１のタイプのものよりもビット・エラーに対して少なく感応する第１のパラメータ群に用いられる。

既存の方法と比較して、この新しい方法は、ビット・エラーの存在のもと、合成された音声の品質を改良し、加えるべき追加的なエラー訂正又は検出ビットの量を削減する。好適な実ｌ１Ｆ１１様において、異なったタイプのエラー訂正は、ゴレイ（Ｇｏｌａｙ）コード及びハミング（Ｈａｎｇｉｎｇ）コードを含む。

本発明は、第６の視点において、ビット・エラーの存在のもと、合成された音声の品質を改良するための方法を特徴とする。エラー率は、エラー訂正コーディングから評価される。パラメータについてのエラー率が予め定めるレベルを超過した隙に、前のセグメントから−又はａｍのモデルパラメータが現在のセグメントにおいて反復される。好適な実施態様において、全てのモデルパラメータが反覆される。

本発明は、第７の視点において、モデルパラメータの推定と量子化によって生じる劣化を低減するための方法を特徴とする。この新しい方法は、スペクトル包絡のａｍｍ領領域表現篭用いて知覚的に重要である領域を強調し、知覚的に重要でない領域を減衰させる。

その結果合成されたＷ声における劣化は低減される。

セグメントの平滑化されたスペクトル包絡は、スペクトル包絡を平滑化する事によって生成される。そのスペクトル包格が平滑化された包絡よりも大きな振幅を有するスペクトル包絡の周波数領域を増やし、そのスペクトル包絡が平滑化された包絡よりも小さな振幅を有するスペクトル包絡の！Ｒ波数領域を減らすことによって、強調されたスペクトル包絡が生成される。好適な実ＩＮ息様において、平滑化されたスペクトル包絡はスペクトル包絡から低次のモデル（例えば、全極形モデル）を推定することによって生成される。既存の方法を比較して、この新しい方法は周波数領域コーグについて計算土より効率が良い、更にこの新しい方法は時間領域の方法によって課せられる周波数領域の制約を除去することによって音声品質を改曵する。

本発明の他の特徴と利点は好適な実施態様の以下の説明と請求の範囲から明白となろう。

図面の簡単な説明図１−２は、音声符号化方法の従来技術を示す線図である。

図３は、本発明の好適な実施態様を示すフローチャートを示し、スペクトル振幅の予測が基本Ｊ１１波数における変化を説明する。

図４は、本発明の好適な実施態様を示すフローチャートを示し、スペクトル振幅は固定数のブロックに分割される。

図５は、本発明の好適な実施態様を示すフローチャートを示し、予測残差ブロック平均ベクトルが形成される。

図６は、本発明の好適な実施７１様を示すフローチャートを示し、予測残差１０ツク平均ベクトルが量子化される。

図７は、本発明の好適な実施態様を示すフローチャートを示し、予測残差ブロック平均ベクトルがＤＣＴとスカラー量子化により量子化される。

図８は、本発明の符号化器の好適な実施態様を示すフローチャートを示し、異なったエラー訂正符号が異なったモデルパラメータビットに対して用いられる。

図９は１本発明の僅号化器の好適な実ＩＮ態様を示すフローチャートを示し、異なったエラー訂正符号が異なったモデルパラメータビットに対して用いられる・図１０は、本発明の好適な実！ｌ！雇様を示すフローチャートを示し、周波数領域スペクトル包絡パラメータ強調が描かれている。

本発明の好適な実施態様の説明従来の技術においては、スペクトル捩暢予測ｆｌ差は方程式（２）を用いて形成された。この方法は、前のセグメントと現在のセグメントの間の基本周波数における変化を説明しない、基本周波数における変化を説明するために、轟初に、前のセグメントのスペクトル振幅を補間する新しい方法が開発された。これは、典型的には線形補間を用いて行なわれる。しかしながら、様々な刑の形式の補間を用いることができる。前のセグメントの補間されたスペクトル振幅は、現在のセグメントの基本周波数の倍数に対応する周波数ポイントで再標本化（リサンプリング）される、補間と再標本化の組み合わせは、−組の予測スペクトル振幅を生成し、該予測スペクトル振幅は基本周波数のセグメント間の変化に対して訂正される。

典型的には、予測スペクトル振幅の二つの対数の分数が現在のセグメントのスペクトル振幅の基本の二つの対数から差し引かれる。線形補間が予測スペクトル振幅の計算に用いられる場合、これは数学的には次式％式％但し、δユは次式（９）で与えられる。

ここに、γはＯ≦γ≦１の定数である。典型的にはγは１．７であるが、他のγ の端をまた用いることができる。例えばγは性能を改善するためにセグメントからセグメントへと適応的に変更することができる０式（９）においてパラメータ ωＯ０とω　−ｉは現在と前のセグメントの基本周波数をれぞれ示している。二つの基本Ｒ波数が同一の場合、新しい方法は古い方法と同一となる。ｆｌ！！の場合、新しい方法は、古い方法よりも分散の小さな予測残差を生成する。このため所定のビット数について予測ｙＪ！を少ない歪みで量子化することが可能とされる。

本発明の別の視点において、新しい方法はスペクトル振幅予測残差をブロックに分割するために開発された。古い方法においては現在のセグメントからｉ予測残差はＫＮの！！素のブロックに分割された。定型的にはＫの値は８である。この方法を用いて、各ブロックの特性がＬの大さな値と小さな値について実質的に異なることが分かった。これは量子化の効率を低減し、このためスペクトル振幅における歪みを増大させる。

各ブロックの特性をより一様にするために、Ｌｌｌの予測残差を固定数ブロックに分割する新しい方法が考案された。各ブロックの長さは、一つのセグメント内の全てのブロックが同じ長さを有し、セグメント内の全てのブロックの長さの和がＬに等しいように選択されろ、典型的には予測残差の全数は６ブロツクに分割さり切れるとき、すべてのスペクトルマグニチュードが６個のブロックの一つに含まれるように、ｌ又は複数の高い周波数ブロックの長さを一つ増加することがで合について図４に示されている。この新しい方法においては、各ブロックに含まれるつ予測残差のおおよそのパーセントはＬに依存しない、このため、各ブロックの特性の分散が低減され、予測残差のより効率的な量子化が可能とされる。

予測夕１差の量子化は予測残差ブロック平均（ＰＲＢＡ　＋　Ｐｒｅｄｉｃｔｉｏｎ　Ｒｅ５ｉｄｕａｌ　Ｂｌｏｃｋ　Ａｖｅｒａｇｅ）ベクトルを形成することによって改良される。ＰＲＢＡベクトルの長さは現在のセグメントのブロック数に等しい。

このベクトルのｇ！素は各ブロック内の予測残差の平均に対応する。第１番目のＤＣＴ係数は平均（すなわち直流成分）に等しく、ＰＲＢＡベクトルは各ブロックから第１番目のＯＣＴ係数から構成することができる。

これを図５に、現在のセグメント内に６個のブロック各ブロックの第２番目（又は第３、第４醤目等）のＤＣＴ係数からさらにベクトルを構成することによって、一般化することが可能となる。

ＰＲＢＡベクトルの要素は極めて相関が高い、従って、スペクトル振幅の量子化を改善するために多数の方法を用いることができる。少ないビット数で低い歪みを達成するために用いることができる方法の一つはベクトル量子化である。この方法においては、典型的な多数のＰＲＢＡベクトルを含むコードブックが設計されている。現在のセグメントのＰＲＢＡベクトルがコードブックのベクトルの各々と比較され過も低い誤差のものが量子化されたＰＲＢＡベクトルとして１択される。１択されたフードブックのインデックスは、ＰＲＢＡベクトルの２道表現を構成するために用いられる。ベクトルの平均について６ビツトの非一様量子化器のカスケード縦続接続と、残りの情報については一つの１０ビツト・ベクトル量子化器を用いて、ＰＲＢＡベクトルのベクトル量子化を行なうための方法が開発された。この方法は、ＰＲＢＡベクトルが常に６儂の要素を含む場合について図６に示されている。

ＰＲＢＡベクトルを量子化する別の方法もまた開発された。この方法はベクトル量子化方法よりも計算量と記憶量が少なくて済む、この方法においては、ＰＲＢＡベクトルは、式（３）で定義されるＯＣＴでまず変換される。ＤＣＴの長さはＰＲＢＡベクトルにおける要素数に等しい、ＤＣＴ係数は、次に、従来の技術として説明したものと同様な住方で量子化される。ＰＲＢＡベクトルを量子化するために用いられるビット総数をＤＣＴ係数の間に分散させるためにビット割り当て規則が用いられる。スカラー量子化（一様又は非一様）が、次に、ビット割り当て規則で規定されるビット数を用いて各ＤＣＴ係数を量子化するために用い′ られる。これは、ＰＲＢＡベクトルが常に６個の要素を含む場合について１図７に示す。

ＰＲＢＡベクトルを効率的に量子化するために、離散フーリエ変換、高速フーリエ変換、カルーネン・レーベ変換（ＫＬｆ換；　Ｋａｒｈｕｎｅｎ−Ｌｏｅｖｅ）等各種変換がＤＣＴの代わりに用いることができる。さらに、ベクトル量子化は、ＤＣＴ又は他の変換と組み合わせることができる０本発明のこの観点から導かれる改良は広範な各種の量子化方法と共に用いることができる。

他の視点において、ビット・エラーの知覚的効果を低減するための新たな方法が開発された。エラー訂正符合は従来の技術と同様に頻繁でないビット・エラーを訂正し、エラー率ξ１の推定を提供するために用いられている。新しい方法は、残りのビット・エラーの知覚される効果を低減するために、有声／無声の判定を平滑化するためにエラー率の推定を用いる。これは。

有声／無声の判定における訂正されないビット・エラーからの歪みが重要となる車を示す閾値に対してエラー率を最初に比較することによって行なわれる。この閾値の正確な値は、有声／無声の判定に適用されるエラー訂正の量に依存するが、エラー訂正が僅かしか適用されない時には１．００３という閾値が典型的である。

推定されたエラー車ε寓がこの閾値より低い場合、有声無声の決定はじよう孔を受けない、ε１がこの閾値より高い場合、式（１０）が満たされる各スペクトル振幅は有声であると宣言される。

式（ｌＯ）は１．００３の閾値を仮定しているが、この方法は別の閾値に対応するために容易に修正可能である。

パラメータＳＷは、スペクトル振幅に含まれる局所的平均エネルギーの測度である。このパラメータは、典型的には、各セグメントについて、次式（１１）に従い更新される。

但し、Ｒｏは式（１２）で与えられる。

ＳＲの初期値は０≦Ｓ　ｗ４１００００．０の範囲における任意の初期値に設定される。このパラメータの目的は、式（ｌＯ）の平均信号レベルに対する依存性を低減させることである。このことは、新しい方法が高いレベルの信号のみならず低いレベルの信号に対しても有効に機能することを保証する。

式（ｔｏ）　、（１１）及び（１２）の特定の形式とこれらの式に含まれる定数は容易に修正することができる。

この新しい方法の主１！ｌ素は、有声／無声の判定が平滑化を要するか否かを決定するためにエラー率の推定を最初に用いるものである。もし平滑化が必要な場合に、有声／無声の判定はじよう乱を受け、すべての高いエネルギースペクトル俵輻は有声であると宣言される。これは、セグメントの間で高いエネルギーの有声から無声又は無声から有声への遷移を取り除き、その結果ビット・エラーの存在のもとにあって再構成された音声の知覚される品質を改善する。

本発明において、発明者らは、量子化された音声モデルパラメータ・ビットを、ビット・エラーの感度に従って３またはより多くの異なった群に分割し、各群に対して異なったエラー訂正又は検出符号を用いる。

典型的には、ビット・エラーに対してより感応すると決定されたデータビット群は極めて効率的なエラー訂正符号を用いて保護される。少数の追加ビットを必要とするより効率の低いエラー訂正又は検出符号は感度の低いデータビットを保護するために用いられる。この新しい方法は、各群に与えられるエラー訂正又は検出符号の量を、ビット・エラーに対する感度に合致することを可能ならしめる。

従来の技術と比較して、この方法は、ビット・エラーによって生じる劣化が減少され、前方エラー訂正に必要なビット数も削減されるという利点を有する。

用いられるエラー訂正又は検出符号の特定の選択は伝送又は記憶媒体のビット・エラー統計及び所望のビット・レートに依存する。最も感度の大きいビット群は、典型的には、ハミング（Ｈａ■鳳１ｎｓ）コード、ＢＣＨコード、プレイ（Ｇｏｌａｙ）コード、又はリードソロモン（Ｒｅｅｄ−Ｓｏｌｏ■ｏｎ）コード等の効率的なエラー訂正符号によって保護される。感度の低いデータビット群もこれらの符号又はエラー検出符号を用いても良い、最攪に、最も感度の低い群は、エラー訂正又は検出符号を用いるか、又はいかなる形式のエラー訂正又は検出符号も用いない、以下に、本発明を、衛星通信の６．４　ｋｂｐｇＩＭＢＥｉｉ声コーダに良く適合レコーダー訂正又は検出符号の特定の選択を用いて説明する。

ＩＮＭＡＲ９ＡＴ−Ｍ（ｌ！１通信システム用に標準化された６、４　ｋｂｐｓ音声コーダコーいては、前方エラー訂正のために優保されたｌフレーム当たり４５ビツトは３つのエラーまで訂正可能な［２３，１２１ゴレイ（Ｇｏｌａｙ）＝２−ドと、単一のエラーとパリティビットを訂正可能な［１５，Ｉｌｌハミング（Ｈａ−−ｉｎｇ）コードに分割され、基本周波数の６ｆｌの最も重要なビット（ＭＳＢ）とＰＲＢＡベクトルの平均値の３個の最も重要なビット＜ＭＳＢ）は、始めに３つのパリティチェック・ビットと結合され、【２コ、１２１ゴレイ（Ｇｏｌａｙ）コードに符号化される。第２のプレイ（Ｇｏｌａｙ）：＋−ドは、ＰＲＢＡベクトルから３つのＭＳＢ　（Ｍ重要ビット）と高次のＯＣＴ係数から９個の最も感度の高いビットを符号化する。７個の轟も感度の低いビットを除く夕１りのビットは５個の［１５，１１１ハミング（Ｈａ■５ｉｎｓ）コードに符号化される。７ｆｌの最も感度の低いビットはエラー訂正符号によって保護されない。

伝送に先立ち、特定の音声セグメントを表現１２８ビツトがインターリーブされ、少なくとも５ビツトが同一の符合ワードから２ビツトを分離する。この特徴は短いバースト・エラーの影響をいくつかの異なった符合ワードに拡散させ、これによって、エラーが訂正される可能性を増大させる。

復号化器（デコーダ）においては、受信されたビットは、データビットからビット・エラーを除去しようと試みるプレイ及びハミングデコーダに送られる。３つのパリティチェックビツトがチェックされ、訂正できないビットがなにも検出されない時には、受信されたビットは現在のフレームのＭ　Ｂ　Ｅモデルバラメ、 −タを再構成するために用いられる。他の場合、訂正できないビットが検出された時には、現在のフレームについて受信されたビットは無視され、前のフレームからのモデルパラメータが現在のフレームに対して繰り返される。

フレームの婦り遅しの使用は、ビット・エラーが存在する時に音声の品質を改善することが見出された。

本発明は、受信されたビットの各フレームを調べ、現在のフレームが多数の訂正できないビット・エラーを含むか否かを決定する。訂正できないビット・エラーを検出するための一つの方法はデータ内に挿入された余分なビットをチェックするものである０本発明は、また、訂正可能なビット・エラーをエラー率の局所的推定を比較することによって、多量のバーストビット・エラーに遭遇したか否かを決定する。訂正可能なビット・エラーの数がエラー率の局所的な推定値よりも実質的に大きい時にフレーム繰り返しが実行される。

更に１本発明は不正のビットシーケンス、即ち、エンコーダが決して送信しないビット群を各フレームについてチェックする。不正なピットシーケンスが検出された時に、フレーム縁り返しが実行される。

プレイ（Ｇｏｌａｙ）＋−ドとハミング（Ｈａ−ｇｉｎｇ）コードデコーダは、データ内における訂正可能なビット−・エラーの数についての情報をも提供する。この情報はデコーダによってビット・エラー率の推定に用いられる。

ビット・エラー率の推定値は、訂正不能なビット・エラーの存在のもとにおいて知覚された音声品ｔｉｖ向上させる適応型の平滑化器（スムーザ）として用いられる。更に、ビット・エラー率の推定値は、悪いエラー環境下において、フレーム繰り返しを実行するために用いられる。

本発明のこの視点は、性能を更に改善するソフト決定コーディングと共に用いることができる。ソフト決定デコーディングは、各ビットがエラー状態にある尤度に関する追加情報を用いて、多数の異なったコードのエラー訂正と検出能力を改善する。この追加情報は、ディジタル通信システムにおいて復調器から入手可能であるため、本発明は、エラー保護のために余分なビットを要する事無く、ビット・エラーに対して改善されたロバスト性を提供する。

本発明は１合成された音声の品質を改良する周波数傾城の新しいパラメータ強制油を用いる０本発明は。

最初に音声スペクトルのうち知覚的に重要な領域を位置付ける０本発明は次に他の周波数領域と比較して知覚的に重要な周波数領域の振幅を増大させる。ＪｉＩ波数傾城のパラメータ強調の好ましい方法は、スペクトルの一般的な形状を推定するためにスペクトル包絡を平滑化するものである。スペクトルは、スペクトル包絡に対する、全極形モデル、ケプストラムモデル、又は多項式モデル等の低次モデルを当てはめることによって平滑化される。平滑化されたスペクトル包絡は、平滑化されないスペクトル包絡と比較され、平滑化されないスペクトル包絡が平滑化されたスペクトル包絡傾城よりも大きなエネルギーを有する領域として、知覚的に重要なスペクトル領域が同定される。同様に、平滑化されないスペクトル包絡が平滑化されたスペクトル包絡領域よりも太き々エネルギーを有する領域は、知覚的に重要性の低いものとして同定される。知覚的に重要な周波数１１［ｔ４の振幅を増大させ、知覚的に重要性の低い周波数領域の振幅を減少させることによってパラメータ強調が行なわれる。この新しい強調方法は、音声パラメータの推定と量子化の隙に導入される多数の人工物を除去し減少することによって音声品質を向上させる。ｇｌに、この斬しい方法は知覚的に重要な音声フォーマットを先鋭化する事によって音声の分かり易さを向上させる。

ＩＭＢＥｆ声デコーダにおいては、−次の全極形モデルが各フレームのスペクトル包絡に当てはめられる。

これは相関パラメータを推定することによって行なわれる。即ち、デコードされたモデルパラメータから次式（１３）と（１４）に従い、相関パラメータＲｅとＲ１が推定される。

レームのデコードされた基本周波数である。相関パラメータＲａとＲ１は一次の全極形モデルを推定するために用いられる。このモデルは現在のフレーム＜ｍち、ｋ・ωＧ、但し、１≦１３Ｌ）のスペクトル振幅は対応する周１Ｎｉｌｉにおいて評価され、次式（１５）に従い一組の重みＷｌを生成するために用いられる。

これらの重みはＩ　Ｍ　Ｂ　Ｅスペクトル振幅に対する平滑化された全極スペクトルの比率を示している。これらは、次に、各スペクトル振幅に通用されるパラメータ強調の量を個別に制御するために用いられろ、この関係は次式（１６）で表わされる。

鰐されたスペクトル振幅である。

強調されたスペクトル振幅は次に音声合成を行なうために用いられる０強調されたモデルパラメータの使用は、ｗｉｇされないモデルパラメータから合成されたものと比較して、Ｗ声品質を改善している。

■ 不」電１！ ■ 電国際調査報告

Claims

【特許請求の範囲】

１．音声が複数セグメントに分割され各セグメントについてスベクトルガー組の周波数で標本化されて一組のスベクトル振幅を形成し、該スベクトルは一のセグメントと次のセグメントで一般に異なった周波数で標本化され、現在のセグメントのスベクトル振幅を予測するために少なくとも一の前のセグメントが用いられ、現在のセグメントの実際のスベクトル振幅と現在のセグメントの予測スベクトル振幅の間の差に基づく予測残差が引き続く符号化に用いられる、音声符号化の方法において、現在の予測スベクトル振幅が、少なくとも一部、前のセグメントのスベクトル振幅の補間に基づき、現在のセグメントの周波数で前のセグメントのスベクトル振幅を推定することを特徴とする音声符号化方法。
２．音声が複数セグメントに分割され各セグメントについてスベクトルが一組の周波数で標本化されて一組のスベクトル振幅を形成し、該スベクトルは一のセグメントと次のセグメントで一般に異なった周波数で標本化され、現在のセグメントのスベクトル振幅を予測するために少なくとも一の前のセグメントが用いられ、現在のセグメントの実際のスベクトル振幅と現在のセグメントの予測スベクトル振幅の間の差に基づく予測残差が引き続く符号化に用いられる、音声符号化の方法において、予測残差ガ予め定められた偶数のブロックに分割され、該ブロックの偶数は特定のブロックの残差の数に依存せず、ブロックが符号化されることを特徴とする音声符号化方法。
３．現在のセグメントの予測されるスベクトル振幅が、少なくとも一部、前のセグメントのスベクトル振幅を補間することに基づき、現在のセグメントの周波数で前のセグメントのスベクトル振幅を推定する請求の範囲第２項に記載の方法。
４．音声が複数セグメントに分割され各セグメントについてスベクトルが一組の周波数で標本化されて一組のスベクトル振幅を形成し、該スベクトルは一のセグメントと次のセグメントで一般に異なった周波数で標本化され、現在のセグメントのスベクトル振幅を予測するために少なくとも一の前のセグメントが用いられ、現在のセグメントの実際のスベクトル振幅と現在のセグメントの予測スベクトル振幅の間の基に基づく予測残差が引き続く符号化に用いられる音声符号化の方法において、予測残差が複数ブロックにグループ化され、各ブロック内の予測残差の平均が決定され、すべてのブロックの平均が予測残差ブロック平均（ＰＲＢＡ）ベクトルにグループ化され、ＰＲＢＡベクトルが量子化されることを特徴とする音声符号化方法。
５．予め定わられた個数ブロックがあり、該個数が予測セグメントの数に依存しない請求の範囲第４項記載の方法。
６．現在のセグメントの予測されるスベクトル振幅が少なくとも一部、前のセグメントのスベクトル振幅を補間することに基づき、現在のセグメントの周波数で前のセグメントのスベクトル振幅を推定する請求の範囲第５項に記載の方法。
７．現在のセグメントの実際のスベクトル振幅と現在のセグメントの予測されたスベクトル振幅の間の差が、実際のスベクトル振幅から予測されたスベクトル振幅の一部を差分することによって形成される請求の範囲第４項記載の方法。
８．スベクトル振幅が多重帯域励起音声モデルを用いて得られる請求の範囲第１、２又は４項のいずれか一に記載の方法。
９．現在のセグメントの予測スベクトル振幅の形成に際して最も最近の前のセグメントのスベクトル振幅のみが用いられる請求の範囲第１、２又は４項のいずれか一に記載の方法。
１０．所与のセグメントに対して周波数の組が該セグメントの基本周波数の倍数である請求の範囲第１、２又は４項のいずれか一に記載の方法。
１１．ブロックの偶数が６に等しい請求の範囲第２、５又は６項のいずれか一に記載の方法。
１２．低い周波数ブロックにおける予測残基の偶数が高い周波数ブロックにおける予測残差の個数よりも大きくない請求の範囲第２、５又は６項のいずれか一に記載の方法。
１３．低い周波数ブロックにおける予測残差の偶数が高い周波数ブロックにおける予測残差偶の数よりも大きくない請求の範囲第１１項記載の方法。
１４．高い周波数ブロックにおける要素の偶数と低い周波数ブロックにおける要素の偶数の差が１以下である請求の範囲第１３項記載の方法。
１５．前記平均が、ブロック内においてスベクトル振幅予測残差を加算し該ブロック内において予測残差の偶数で除する請求の範囲第４、５又は６項のいずれか一に記載の方法。
１６．前記平均が、ブロック内のスベクトル振幅予測残差の離散コサイン変換（ＤＣＴ）を計算し、且つ平均として該ＤＣＴの第１番目の係数を用いることによって得られる請求の範囲第１５項記載の方法。
１７．ＰＲＢＡ（予測残基ブロック平均）ベクトルが二つの方法、即ち、（１）ＰＲＢＡベクトルに離散コサイン変換（ＤＣＴ）などの変換を施し、変換係数をスカラー量子化する方法、（２）ＰＲＢＡベクトルをベクトル量子化する方法、の内の一を用いて符号化される請求の範囲第４、５又は６項のいずれか一に記載の方法。
１８．前記ベクトル量子化が、ＰＲＢＡベクトルの平均を決定し、該平均をスカラー量子化を用いて量子化し、前記平均をＰＲＢＡベクトルから差し引きゼロ平均ＰＲＢＡベクトルを形成し、及び、ゼロ平均コードブックによってベクトル量子化を用いて前記ゼロ平均ＰＲＢＡベクトルを量子化する、上記各工程から成る方法を用いて行なわれる請求の範囲第１７項記載の方法。
１９．音声が複数セグメントに分割され、セグメント内の各セグメントについて又はセグメント内の各帯域について有声／無声の判定が為され、各セグメントについてスベクトルが一組の周波数で標本化されて一組のスベクトル振幅を形成する、音声符号化の方法において、現在の音声セグメントに対してビット・エラー率が推定され、予め定められたエラー率閾値と比較され、現在のセグメントについて予め定めるエネルギー閾値よりも高いスベクトル振幅に対する有声／無声の判定が、推定されたビットエラー率が所定のエラー率閾値よりも高い時、全て有声であると宣言される音声符号化方法。
２０．予め定めるエネルギー閾値が現在のセグメントに対するビットエラー率に依存する請求の範囲第１９項記載の方法。
２１．モデルパラメータによって特徴付けられる音声モデルを用いて音声が符号化され、音声が時間セグメントに分割され、各セグメントについてモデルバラメータが推定され且つ量子化され、及び、量子化されたモデルパラメータの少なくともいずれかがエラー訂正コーディングを用いて符号化される、音声符号化の方法において、量子化されたモデルパラメータを符号化するたわに少なくとも二つの型式のエラー訂正コーディングが用いられ、第２の型式の符号化よりも多くの追加ビットを加える第１の型式の符号化が、第２群の量子化されたモデルパラメータよりもビットエラーに対して感度が高い第１群の量子化されたモデルパラメータに対して用いられることを特徴とする音声符号化方法。
２２．異なった型式のエラー訂正コーディングがゴレイ（Ｇｏｌａｙ）コードとハミング（Ｈａｍｍｉｎｇ）コードを含む請求の範囲第２１項記載の方法。
２３．モデルパラメータによって特徴付けられる音声モデルを用いて音声が符号化され、音声が時間セグメントに分割され、各セグメントについてモデルパラメータが推定され且つ量子化され、量子化されたモデルパラメータの少なくともいずれかがエラー訂正コーディングを用いて符号化され、及び、音声がデコードされたモデルパラメータから合成される音声符号化の方法において、エラー訂正コーディングが合成に際して、エラー率を推定するために用いられ、該パラメータについてのエラー率が予め定めるレベルを超えた時に、前のセグメントの１又は複数のモデルパラメータが現在のセグメントにおいて繰り返されることを特徴とする音声合成符号化方法。
２４．量子化されたパラメータが多帯域励起（ＭＢＥ）音声コーダ又は改良型多帯域励起（ＩＭＢＥ）音声コーダと関連したパラメータである請求の範囲第２１、２２、又は２３項のいずれか一に記載の方法。
２５．エラー率がエラー訂正符号を用いて推定される請求の範囲第２１又は２２項に記載の方法。
２６．１又は複数のモデルパラメータが推定されたエラー率に基づき複数のセグメントに渡って平滑化される請求の範囲第２５項記載の方法。
２７．平滑化されるモデルパラメータが、有声／無声の判定を含む請求の範囲第２６項記載の方法。
２８．平滑化されるパラメータが、多帯域励起（ＭＢＥ）音声コーダ又は改良型多帯域励起（ＩＭＢＥ）音声コーダに対するパラメータを含む請求の範囲第２６項記載の方法。
２９．パラメータに対して推定されたエラー率が予め定めるレベルを超えた時に、前のセグメントにおける１又は複数のモデルパラメータが現在のセグメントにおいて繰り返される請求の範囲第２８項記載の方法。
３０．音声信号が複数セグメントに分割され、セグメントの周波数領域の表現が決定されて該ヤグメントのスベクトル包絡を提供し、音声が強調されたスベクトル包絡から合成される、音声強調の方法において、セグメントの平滑化されたスベクトル包絡がスベクトル包絡を平滑化することによって生成され、平滑化されたスベクトル包絡よりも大きな振幅を有するスベクトル包絡についてスベクトル包絡の周波数領域のいくつかを増加させ、且つ平滑化されたスベクトル包絡よりも小さな振幅を有するスベクトル包絡についてスベクトル包絡の周波数領域のいくつかを減少させることにより、強調されたスベクトル包絡が生成される音声強調方法。
３１．スベクトル包絡の周波数領域表示が多帯域励起（ＭＢＥ）音声コーダ又は改良型多帯域励起（ＩＭＢＥ）音声コーダのスベクトル振幅パラメータの組である請求の範囲第３０項記載の方法。
３２．平滑化されたスベクトル包絡が、スベクトル包絡から低次モデルを推定することによって生成される請求の範囲第３０又は３１項記載の方法。
３３．低次モデルが全極形モデルである請求の範囲第３２項記載の方法。