JP2003504669A

JP2003504669A - 符号化領域雑音制御

Info

Publication number: JP2003504669A
Application number: JP2001508667A
Authority: JP
Inventors: チャンドラン，ラビ; ジェイ．マーコック，ダニエル
Original assignee: テラブスオペレーションズ，インコーポレイティド
Priority date: 1999-07-02
Filing date: 2000-06-30
Publication date: 2003-02-04
Also published as: AU6203300A; CA2378012A1; WO2001002929A3; CA2378035A1; AU6063600A; EP1190495A1; WO2001002929A2; EP1190494A1; JP2003533902A; JP2003503760A; CA2378062A1; WO2001003316A1; AU6067100A; EP1208413A2; WO2001003317A1

Abstract

(57)【要約】通信システム（８）は、第１のパラメータを含む複数のパラメータを備える圧縮符号を用いてディジタル信号を送信する。このパラメータは、雑音特性を含む複数のオーディオ特性を備えるオーディオ信号を表している。圧縮符号は複数の復号化ステップにより復号可能である。プロセッサ（１５０）が圧縮符号に応答して少なくとも第１のパラメータを読む。このような信号に基づいて、プロセッサは第１のパラメータを調整し、調整された第１のパラメータを圧縮符号に書き込む。この結果、雑音状況は効果的に管理できる。

Description

【発明の詳細な説明】

【０００１】［関連出願の相互参照］１９９９年７月２日出願された名称が「圧縮音声の符号化領域強化」である仮
出願番号 60/142,136 に対応する特許である。

【０００２】［発明の背景］本発明は、圧縮音声の符号化領域強化に関し、特に符号化領域の雑音制御に関
する。

【０００３】この明細書では次の参考文献を参照する。［１］ＧＳＭ０６．１０「デジタルセルラー電気通信システム（フェイズ２）
、フルレート音声、第２部、トランスコーディング」ＥＴＳ３００５８０−
２、１９９８年３月。［２］ＧＳＭ０６．６０「デジタルセルラー電気通信システム（フェイズ２）
、エンハンストフルレート（ＥＳＲ）、音声トランスコーディング」ＥＴＳ３
００５８０−２、１９９８年６月。［３］ＧＳＭ０８．６２「デジタルセルラー携帯電気通信システム（フェイズ
２＋）、音声コーデックのインバンドタンデムフリーオペレーション（ＴＦＯ）
」ＥＴＳＩ、２０００年３月。［４］Ｊ．Ｒ．デラー、Ｊ．Ｇ．プローキンス、Ｊ．Ｈ．Ｌ．ハンセン「音声信
号の離散時間処理」第７章、プリンストンホールＩｎｃ、１９８７年。［５］Ｓ．Ｖ．バッセイ「上級信号処理及びデジタル雑音低減」第９章、ワイリ
ー（ＩＳＢＮ０４７１９５８７５１）１９９６年。

【０００４】この明細書では、次の略語を参照する。

【表１】

【０００５】符号化音声のネットワーク強化は、通常復号化、線形処理及び処理された信号
の再符号化を要求する。このような方法は非常に高価である。さらに、符号化プ
ロセスはしばしば、音声強化方法よりもコンピュータ計算上大きなオーダーであ
る。

【０００６】音声圧縮は電気通信特に携帯電話技術及びパケットネットワーク上の音声にお
いてますます用いられている。線形領域で動作する過去のネットワーク技術はい
くつかの欠点を有する。たとえば、線形領域で動作する過去のネットワーク技術
は、圧縮音声の復号化、必要な強化の実行及び音声の再符号化を要求するもので
ある。この処理はコンピュータ計算上困難なもので、特に付加的な量子化雑音を
生む傾向があり、付加的な遅延を引き起こす可能性がある。

【０００７】最適レベルに音声レベルを維持することは、公衆電話交換網（ＰＳＴＮ）にお
ける重要な問題である。電話技術利用者は彼らの会話の理解を最大限にする心地
よい聴取レベルを期待している。電話装置から送信される音声レベルは話者の音
量と、マイクロホンに相対的な話者の位置とに依存する。音量調節が電話装置に
利用できれば、聴取者は手動で所望のレベルに調節することができるだろう。し
かしながら、歴史的な理由により、多くの電話装置は音量調節機能をもたない。
また、聴取者による直接の音量調節は、ネットワーク機器に対して適切なレベル
を維持するという要求に応えるものではない。さらに、特に自動車における移動
体電話の場合、技術がハンドフリー電話技術の段階に進歩しているので、手動調
節は運転者にとって、やっかいで危険なものと考えられる。

【０００８】音質を維持する責任は一般的に、電話装置製造業者が比較的マイナーな役割し
か果たしていないネットワークサービスプロバイダの役割である。伝統的に、ネ
ットワークサービスプロバイダは、音声レベルについて装置とネットワークに対
してきつい仕様を与えていた。しかしながら、増加する国際的な通話量、規制緩
和、激烈な競争そして増大する利用者の期待に起因して、ネットワークサービス
プロバイダは、他のネットワークで用いられる仕様及び装置に大きな影響を与え
ることなく、適切な音声レベルを確保しなければならない。

【０００９】デジタル携帯電話技術やパケットネットワーク上の音声のような新技術とプロ
トコルの広範な導入とともに、ネットワークにおける音声レベルの制御がより複
雑になっている。主要な理由の一つは、伝送路での音声コーデック（符号器−複
合器対）として知られている音声圧縮装置の存在である。音声コーデックが伝送
路に存在し、一方、線形領域では、デジタル音声サンプルが直接処理に利用可能
である場合、音声信号の自動レベル制御（ＡＬＣ）及び雑音低減はより困難なも
のとなる。

【００１０】計算コストを低減し、遅延を低減し、付加的な量子化雑音を低減する符号化領
域信号処理のアプローチに対する要求が、当該産業において古くから存在してい
た。

【００１１】［ＧＳＭデジタルセルラーネットワーク］ＧＳＭデジタルセルラーネットワークにおいては、移動体局（送受話器）と基
地局間の音声伝送は圧縮形式又は符号化形式で行われている。ＧＳＭＦＲ［１
］とＥＦＲ［２］のような音声符号化技術は音声を圧縮するために用いられてい
る。音声を圧縮するために用いられる装置はボコーダと呼ばれる。符号化音声は
サンプルあたり２ビット以下を要する。この状況を図１に示す。基地局間では、
音声は非符号化形式（サンプルあたり８ビットを要する圧伸ＰＣＭを用いる）で
送信される。

【００１２】符号化音声及び非符号化音声の用語は次のとおり定義されることに注意された
い。非符号化音声：代表的には電話技術に用いられるデジタル音声信号サンプルを
いう。これらのサンプルは、サンプルあたり線形１３ビットの形式か、又はサン
プルあたり８ビットのμ−則又はＡ−則ＰＣＭ形式かのいずれかであり、代表的
なビットレートは６４ｋｂｐｓである。

【００１３】符号化音声：代表的には、ＧＳＭＦＲの場合１３ｋｂｐｓ、ＧＳＭＥＦＲ
の場合１２．２ｋｂｐｓのような６４ｋｂｐｓよりかなり下のビットレートを使
用する圧縮音声信号パラメータ（符号化パラメータともいう）をいう。圧縮方法
は単純ＰＣＭ圧伸スキームより大規模であり、圧縮方法の例として、線形予測符
号化、符号励振線形予測そして多重バンド励振符号化がある。

【００１４】［タンデムフリーオペレーション（ＴＦＯ）］タンデムフリーオペレーション（ＴＦＯ）標準［３］は、近未来におけるＧＳ
Ｍデジタルセルラーネットワークにおいて備えられる予定である。ＴＦＯ標準は
移動体から移動体への呼に適用される。ＴＦＯの下では、音声信号は、短い交渉
期間後に圧縮形式で移動体間を伝わる。これにより、移動体から移動体への呼の
間にタンデム音声コーデックを除去する。原信号がクリーンであれば、タンデム
コーデックの除去によって音質を改善することが知られている。注目すべきキー
ポイントは、移動体送受話器間では音声送信は符号化されたままであることで、
これは図２に示されている。

【００１５】ＴＦＯの下では、送受話器と基地局間の送信は、音声サンプルごとに２ビット
以下で、符号化される。しかしながら、基地局間の送信には音声サンプルごとに
８ビットが利用される。基地局では、音声は復号化され、Ａ−則圧伸される。そ
こでサンプルあたり８ビットが必要となる。しかしながら、原符号化音声ビット
が、各８ビットＡ−則圧伸サンプルにおいて最下位の２ビット（ＬＳＢｓ）を置
き換えるために用いられる。いったんＴＦＯが送受話器間で確立すると、基地局
は、個々の送受話器に対して、各８ビットサンプル中の２ＬＳＢｓを送るだけで
、６ＭＳＢｓを捨てる。したがって、ボコーダタンデミングは避けられる。この
プロセスは、３図で説明されている。

【００１６】 [雑音問題の背景と従来の解決策] 周囲のバックグラウンド雑音は電話技術の応用に影響与える主要な障害である
。雑音の多い環境で動作する携帯電話の場合に、このような付加的な雑音が特に
きびしい。電話技術サービスプロバイダは、かれらのネットワークにおいて雑音
低減装置を用いて、音質の改良を行い、通話時間をより長くするように勧め、顧
客の満足度を増加させようとしている。雑音は、デジタル携帯送受話器の場合に
はその源で取り扱われるべきだが、送受話器モデルには費用とパワーの限界によ
って、そのような機能を提供するものはほとんどない。そのような機能が提供さ
れても、それらはサービスプロバイダの要求に合致するものではないであろう。
したがって、サービスプロバイダはネットワーク音声強化装置を、規制緩和とよ
り高まる顧客の期待に直面している彼らの競争にとって必須のものと考えている
。ひどいバックグラウンドの雑音状態の存在下でしばしば動作される携帯電話の
使用の爆発的増加は、またネットワークにおける雑音低減装置の使用を増加させ
てきた。

【００１７】従来の雑音の低減方法は図４に示されている。これはスペクトルサブトラクシ
ョンと呼ばれる周知の技術に基づく。

【００１８】スペクトルサブトラクション手法では、雑音の多い信号は、たとえば離散フー
リエ変換を用いて、異なる周波数帯域に分割される。無音検出器は音声のギャッ
プを分離するために用いられる。そのような無音セグメントの間、ノイズスペク
トル（すなわち各周波数帯のノイズパワー）が推定される。また、すべての時間
で各周波数帯のノイズ信号パワーが推定される。これらのパワー推定は、測定時
間中の各周波数帯における信号対雑音比のような情報を与える。これらのパワー
推定に基づいて、各周波数成分が減衰される。位相情報は変えない。結果の大きさと位相の情報は再度組み合わされる。逆離散フーリエ変換を用いて
、雑音低減信号が再構成される。

【００１９】前記のような技術は、雑音低減処理について非符号化音声信号を必要とする。
そのような雑音低減処理からの出力もまた非符号化信号となる。ＧＳＭネットワ
ークのＴＦＯの下で、ネットワークに雑音低減が実現されれば、従来の手法では
、符号化音声を復号化し、生じる非符号化音声を処理し、そしてそれを再符号化
することを要する。従来の技術は非符号化音声信号に関して実行することができ
るだけであるから、復号化と再符号化が必要となる。この手法を図５に示す。こ
の手法のいくつかの欠点は次のとおりである。

【００２０】この手法は２個の復号器と１個の符号器のために計算機処理上高価なものであ
る。代表的には、符号化器は復号器より計算機処理上少なくとも一桁以上複雑で
ある。このように、特に符号化器の存在が、主要な計算機処理上の重荷となる。

【００２１】復号化及び再符号化処理によりもたらされる遅延は望ましいものではない。

【００２２】ボコーダタンデム（すなわち、直列に配置された２個の符号器／復号器対）は
、この手法において導入される。これにより量子化効果に起因する音質の低下を
もたらすことが知られている。

【００２３】提案する技術は（たとえば符号化パラメータの直接的な修正による）符号化さ
れた音声に関し直接的に雑音低減を図ることを可能にする。タンデム効果は避け
られるか、最小限にされ、雑音低減後のよりよく聴取できる品質を達成する。

【００２４】 [音声符号化] [概観] 音声圧縮は、損失性のソース符号化のカテゴリーに入るが、一般に音声符号化
と呼ばれる。音声符号化は音声送信に必要な帯域幅を最小限にするように行われ
る。これは帯域幅が不足している無線電話技術においては特に重要である。比較
的豊富な帯域幅をもつパケットネットワークについても、音声符号化はネットワ
ーク遅延やジッタを最小限にするために重要である。音声通信にとっては、デー
タ通信と異なり、遅延は非常に耐えがたい。したがって、より小さなパケットサ
イズにより、パケットネットワークを通る送信を容易にする。関連する４つのＥ
ＴＳＩＧＳＭ標準を表１に掲載する。

【００２５】表１：ＧＳＭ音声コーデック

【表２】

【００２６】音声符号化では、連続するデジタル音声サンプルの１セットを音声フレームと
いう。ＧＳＭ符号化器は２０ｍｓ（８ｋＨｚサンプリングレートで１６０サンプ
ル）のフレームサイズで動作する。音声フレームが与えられると、音声符号化器
は音声合成モデルのためのパラメータの小セットを決定する。これらの音声パラ
メータと音声合成モデルとともに、音声フレームが、原音声フレームに非常によ
く似ているように思え、かつ聞こえるように、再構成される。この再構成は音声
復号器により行われる。前記表のＧＳＭボコーダにおいては、符号化処理が復号
化処理より計算機にとってきびしい処理である。

【００２７】音声符号化器によって決定される音声パラメータは、用いられる音声合成モデ
ルに依存する。表１におけるＧＳＭ符号化器は線形予測符号化（ＬＳＰ）モデル
を利用している。一般のＬＰＣ音声合成モデルの単純化した表示のブロック図が
図６に示されている。適切にモデルパラメータを特定することによって音声類似
信号を生成するために、このモデルが使用される。この例の音声合成モデルでは
、パラメータは、時変フィルタ係数、ピッチ周期、コードブックベクトルそして
ゲインファクタを含む。合成音声は以下のようにして生成される。適切なコード
ブックベクトルｃ（ｎ）が、まずコードブックゲインファクタｇｃによってスケ
ーリングされる。次に、スケーリングされたコードブックベクトルは、ピッチゲ
インｇｐ、ピッチ周期Ｔをパラメータとして含むピッチ合成フィルタによってフ
ィルタリングされる。この結果はときに全励振ベクトルｕ（ｎ）と呼ばれる。こ
の名前によって、ピッチ合成フィルタは発声された音声の高調波品質を与えるこ
とを暗に含んでいる。次に全励振ベクトルは、音声フレームの広いスペクトル形
状を特定するＬＰＣ合成フィルタによってフィルタリングされる。

【００２８】各音声フレームに対して、パラメータは普通１回以上更新される。たとえば、
ＧＳＭＦＲ及びＥＦＲ符号化器において、コードブックベクトル、コードブッ
クゲインそしてピッチ合成フィルタパラメータは、すべてのサブフレーム（５ｍ
ｓ）ごとに決定される。ＬＰＣ合成フィルタパラメータは、ＥＦＲにおいてはフ
レームごと（１０ｍｓごとに）に２回、ＦＲにおいてはフレームごとに１回、決
定される。

【００２９】［符号化ステップ］ここに音声符号化器に用いられる代表的なステップのシーケンスの要約を示す
。音声サンプルの１フレームを得る。サンプルのフレームに窓（たとえばハミング窓）をかけ、遅れｍで自己相関関
数を決定する。

【００３０】自己相関関数から反射係数及び／又はＬＰＣ係数を決定する。（反射係数がＬ
ＰＣ係数の代替表現であることに注意。）反射係数及び／又はＬＰＣ係数を量子化に適当な異なる形式（たとえば対数領
域における比又は線スペクトル周波数）に変換する。ベクトル量子化技術を用いて、変換されたＬＰＣ係数を量子化する。

【００３１】次の演算のシーケンスは各サブフレームで行われる代表的なものである。ピッチ周期を決定する。対応するピッチゲインを決定する。ピッチ周期及びピッチゲインを量子化する。

【００３２】ＬＰＣ残差信号を得るために、量子化されたＬＰＣ合成フィルタを通って原音
声信号を逆フィルタリングする。残差ピッチを得るために、ピッチ合成フィルタを通ってＬＰＣ残差信号を逆フ
ィルタリングする。最良のコードブックベクトルを決定する。最良のコードブックゲインを決定する。コードブックゲインとコードブックベクトルを量子化する。フィルタメモリを適切に更新する。付加的誤り訂正／検出、フレームビットその他を付加する。符号化パラメータを送信する。

【００３３】 [復号ステップ] ここに音声復号器における代表的なステップのシーケンスを示す。誤り訂正／検出およびフレーミングを実行する。各サブフレームについて、受信符号化パラメータ（ＬＰＣ係数、ピッチ周期、ピッチゲイン、コードブッ
クベクトル、コードブックゲイン）のすべてを非量子化する。

【００３４】ＬＰＣ励振信号を得るために、コードブックゲインによってコードブックベク
トルをスケーリングし、ピッチ合成フィルタを用いてそれをフィルタリングする
。予備的音声信号を得るために、ＬＰＣ合成フィルタを用いてＬＰＣ励振信号を
フィルタリングする。フィルタリング後（一般にＬＰＣ係数に基づく）を再構成する。最終的な合成音声を得るために、予備的音声信号をフィルタリングして量子化
雑音を低減させる。

【００３５】 [ビットストリームにおける符号化パラメータの配置] エンコーダにより送信されるビットストリームにおける符号化パラメータの配
置の一例として、ＧＳＭＦＲボコーダが考えられる。ＧＳＭＦＲボコーダに
とっては、１フレームは８ｋＨｚでサンプリングされる音声の１６０サンプルと
して定義されている。すなわち、１フレームは２０ｍｓの長さである。Ａ−則Ｐ
ＣＭ圧伸によると、１６０サンプルは、送信のために１２８０ビットを要する。
符号器は１６０サンプルを２６０ビットに圧縮する。各フレームの２６０ビット
種々の符号化パラメータの配置は、図７に示されている。各符号化フレームの先
頭３６ビットはＬＰＣ合成フィルタの対応する対数領域比を構成する。残りの２
２４ビットは、各５６ビットごとの４つのサブフレームに分けられる。各サブフ
レーム内では、符号化パラメータビットがパラメータに関連するピッチ合成フィ
ルタを含み、その後にパラメータに関連するコードブックベクトルとゲインが続
く。

【００３６】 [音声合成伝達関数と代表的な符号化パラメータ] 多くの非線形性や発見的技術が復号器での音声合成に含まれれるが、次の近似
伝達関数が音声合成過程によるものである。

【数１】

【００３７】コードブックベクトルｃ（ｎ）は、Ｈ（ｚ）によってフィルタリングされ、合
成音声に至る。音声復号化の一般的ＬＰＣモデルについて注意すべきキーポイン
トは、雑音の低減を行うために修正される必要がある利用可能な符号化パラメー
タは、次に示すものであるということである。ｃ（ｎ）：コードブックベクトルｇ_ｃ：コードブックゲインｇ_ｐ：ピッチゲインＴ：ピッチ周期｛ａ_ｋ，ｋ＝１，・・，Ｍ｝：ＬＰＣ係数

【００３８】多くのＬＰＣを基礎としたボコーダは、上記のセットの類似のパラメータ、上
記形式に変換可能なパラメータ、もしくは上記形式に関連するパラメータ、を用
いている。たとえば、ＬＰＣを基礎としたボコーダのＬＰＣ係数は、対数領域比
（たとえばＧＳＭＦＲ）を用いるか、又は線スペクトル周波数（たとえばＧＳ
ＭＥＦＲ）を用いて表現される。これらの形式の両方ともにＬＰＣ係数に変換
できる。上記形式に関連するパラメータがＧＳＭＦＲボコーダのブロック最
大パラメータである場合の１例、ブロック最大は式（１Ａ）に記述されたモデル
のコードブックゲインに直接に比例するとみなすことができる。

【００３９】このように、符号化パラメータ修正のこの論議は、おおよそ一般的な音声合成
復号器に限られているが、どのようなＬＰＣに基礎をおくボコーダに対しても、
そしておそらくその他のモデルに対しても、これらの方法を仕立てることは比較
的簡単である。

【００４０】［旧音声処理技術の符号化領域への適用］雑音低減のための非符号化音声に用いられるスペクトルサブトラクションのよ
うな技術は、符号化パラメータに用いられることができないことは明らかである
。なぜなら、音声信号の符号化パラメータ表現は著しく相違するものである。

【００４１】発明の要約本発明は第１のパラメータを含む所定の複数のパラメータを備えた前記圧縮符
合を用いてディジタル信号を送信するための通信システムにおいて有用である。
これらのパラメータは、雑音特性を含む複数のオーディオ特性を有するオーディ
オ信号である。圧縮符号は複数の復号化ステップにより復号化可能である。この
ような環境において、本発明の一つの実施例により、少なくとも第１のパラメー
タを読み出すことにより、また圧縮符号と第１のパラメータに応答して調整され
た第１のパラメータを生成することにより、雑音特性を管理できる。第１のパラ
メータを調整された第１のパラメータで置換される。読み出し、生成及び置換は
プロセッサにより好適に行われる。

【００４２】本発明はまた、符号サンプルを備えるディジタル信号を送信するための通信シ
ステムにおいて、さらに圧縮符号を用いる第１のビットと線形符号を用いる第２
のビットを備えるものに有用である。これらの符号サンプルは雑音特性を含む複
数のオーディオ特性を有するオーディオ信号を表している。このような環境にお
いて、本発明の第２の実施例により、第２のビットに応答して第１のビットと第
２のビットを調整することにより、圧縮符号を復号化することなしに雑音特性を
管理できる。

【００４３】 [好適な実施形態の詳細な説明] 本発明は１以上の実施形態について説明されるが、本発明はこれらの実施形態
に限定されないと理解されるべきである。それだけでなく、本発明は、特許請求
の範囲に含まれる、すべての代替のもの、変形したもの及び均等のものを含む。
例えば、本明細書に記載されたＡＬＣ技術は、更にＮＲ技術への応用ができる。

【００４４】現代のネットワークでは、音声信号は、送信の前にディジタルにサンプルされ
る。そのようなディジタル（即ち、離散時間、離散値）信号は、本明細書では、
線形領域にあると言う。そのような線形領域信号にある音声レベルの調整は、所
望の目標音声レベルに達するために、信号の各サンプルに適当なゲインファクタ
を乗じることにより達成される。

【００４５】通常は電話通信ネットワークで搬送されるディジタル音声信号は、通常、送信
の前に、パルスコード変調（ＰＣＭ）のような基本形の圧縮を受ける。そのよう
な圧縮方法は、計算及び遅延の点で非常に安価である。圧縮されたディジタルサ
ンプルを線形領域に変換し、その線形サンプルを処理し、そして送信の前に処理
されたサンプルを圧縮することは、ＡＬＣ又はＮＲ装置にとって比較的扱いやす
いことである。これらの信号は、事際上線形領域にあると考えることができる。
本明細書では、圧縮化又は符号化音声は、かなりの計算上の複雑さを要求する高
度な圧縮技術を使用して圧縮する音声といえる。

【００４６】特に、本明細書及びクレームでは、線形符号化及び圧縮符号化は、以下の意味
を持つ。線形符号：線形符号により、我々は、可聴周波信号の各サンプルに対する１つ
の符号化パラメータ又は符号化サンプルをもたらす圧縮技術を意味する。線形符
号の例は、ＰＣＭ（Ａ-則及びμ-則）ＡＤＰＣＭ（適応差分パルス符号変調）、
及びデルタ変調である。

【００４７】圧縮符号：圧縮符号により、我々は、可聴周波信号の各サンプルに対する１以
下の符号化パラメータをもたらす技術を意味する。通常は、圧縮符号は、可聴周
波信号の各サンプルの各ブロック又はフレームに対する少ないセットの符号化パ
ラメータをもたらす。圧縮符号の例は、線形予測符号化に基づくＧＳＭボコーダ
（ＨＲ，ＦＲ，ＥＦＲ）のようなボコーダである。

【００４８】音声圧縮（これは非可逆ソース符号化のカテゴリにあるものである）は、一般
的に、音声符号化といわれる。音声符号化は、音声送信に必要なバンド幅を小さ
くするために実行される。これは、バンド幅資源が不十分である無線電話通信で
は特に重要である。比較的バンド幅が豊富なパケットネットワークでは、音声符
号化は、ネットワーク遅延及びジッタを少なくするために、重要である。これは
、データとは違って音声通信は、遅延が極度に許されないことによる。それで、
より小さいパケットサイズは、パケットネットワークを介する伝達を容易にする
。いくつかの工業規格のコーデック（符号器−復号器の対）を、参照のためにテ
ーブル１に掲載する。

【００４９】音声符号化では、１セットの連続するディジタル音声サンプルは、音声フレー
ムと呼ばれる。音声フレームが与えられると、音声復号器は、音声合成モデルの
ために小さなセットのパラメータを決定する。音声パラメータ及び音声合成モデ
ルでもって、原音声フレームに酷似して現われ、聞こえる音声フレームが再構築
される。この再構築は、音声復号器により実行される。多くの音声符号器では、
符号化処理は、復号化処理より以上に計算上厳しいということに注意されるべき
である。更に、高品質の音声復号化を達成するために必要な秒当たり百万の命令
（ＭＩＰｓ）は、非常に高価である。ディジタル信号処理チップセットの処理能
力が、携帯電話機のようなアプリケーションでの音声符号化を広範囲に使用可能
とするのに十分進歩したのは近年になってからである。

【００５０】音声符号器により決定される音声パラメータは、使用した音声合成モデルに依
存する。例えば、テーブル１の符号器は、線形予測符号化（ＬＰＣ）モデルを利
用する。（より詳細には、これらの符号器は、符号化励振線形予測即ちＣＥＬＰ
符号器の部類に属する。）ＬＰＣ音声合成モデルを簡単化したブロック図が図６
に示されている。このモデルは、モデルパラメータを適切に指定することにより
、音声らしい信号を発生するために使用できる。この例の音声合成モデルでは、
パラメータは、時変フィルタ係数、ピッチ周期、励振ベクトル及びゲインファク
タを含む。基本的に、励振ベクトルｃ(n)は、最初にゲインファクタＧにより計
られる。その結果は、ピッチ合成フィルタにより濾波され、そのフィルタのパラ
メータは、すべての励振ベクトルｕ(n)を得るためのピッチゲインｇ_ｐ、ピッチ
周期Ｔを含む。これは、ＬＰＣ合成フィルタにより濾波される。マルチバンド励
振モデルのようなほかのモデルは、更に音声符号化で使用される。これに関して
、仮定モデルと共にある音声パラメータは、圧縮を達成するため、ディジタル音
声信号の冗長性を除去する手段を提供することに注意するとよい。

【００５１】図６に示すように、全体のＤＣゲインはＧにより与えられ、そして、ＡＬＣは
、本来的に修正Ｇを含む。更に、ゲインファクタｇ_ｐは、雑音のある音声の場合
に、もし必要ならば、雑音低減の所定の度合いを得るために修正される。

【００５２】通常の音声符号器により各フレームに生成される音声パラメータの間では、い
くつかのパラメータが、そのフレームにおける音声信号のスペクトル及び／又は
波形に関係する。これらのパラメータは、ＬＰＣ音声合成モデルの場合に、ＬＰ
Ｃ係数とピッチ情報とを通常は含む。スペクトル情報を与えるこれらのパラメー
タに加えて、通常は、音声フレームのパワー即ちエネルギに直接関係するパラメ
ータがある。音声レベルに関するパラメータ（ＳＬＲＰ）は、符号化音声のＡＬ
Ｃを実行するためのキーである。そのようなＳＬＲＰのいくつかの例が以下に示
される。

【００５３】今、テーブル１の最初の３つのＧＳＭコーデックについて論ずる。最初の３つ
の符号器のすべては、８kHzでサンプルされた音声を処理し、サンプルは、１３
ビット線形ＰＣＭ値で得られたと仮定する。フレーム長は１６０サンプル（２０
ｍｓ）である。更に、それらは、各フレームを、各４０サンプルの４つのサブフ
レームに分割する。これらのコーデックのためのＳＬＲＰがテーブル２に掲載さ
れている。

【００５４】テーブル２．ＧＳＭ音声コーデックの音声レベルに関するパラメータ（ＳＬＲＰ
）

【表３】符号器に応じて、ＳＬＲＰは、サブフレーム（例、ＧＳＭ・ＦＲ及びＥＦＲコ
ーデック）ごとに、又はフレーム（例、ＧＳＭ・ＨＲコーデック）ごとに１回指
定される。

【００５５】本明細書を通して、山形記号を上に付けた又は付けていない同一変数が、非量
子化及び量子化を表すために使用される。例えばγ_gc及びγ_gcは、ＧＳＭ・ＥＦ
Ｒ規格の非量子化及び量子化ゲイン修正係数である。量子化ＳＬＲＰγ_gcのみが
ＡＬＣ装置で有効であることに留意されたい。

【００５６】量子化及び対応の非量子化パラメータは、量子化関数Ｑ(.)と関係付けられる
（例、γ_gc＝Ｑ（γ_gc））。我々は、内容によっては、この変換だけでなく、参
照テーブル又は式を使用して量子化値のインデックスの定義を含めるように、比
較的自由に記号を使用する。（ｐ２５）

【００５７】量子化関数は、多対１変換であり、可逆ではない。しかしながら、我々は、適
当な参照テーブル又は式を使用して、所定のインデックスを対応する量子化値に
変換することを表すため、「逆」量子化関数Ｑ^-1(.)を使用する。

【００５８】図８は、線形領域から符号化領域を区別する。線形領域では、ディジタル音声
サンプルは、直接処理に適用される。符号化領域は、音声符号器の出力又は音声
復号器の入力をさし、これはチャネルエラーがなければ同一である。これに関し
て、符号化領域は、音声パラメータと、これらのパラメータの量子化又は逆量子
化を使用する方法との両方を含む。符号器により決定される音声パラメータは、
送信の前に量子化処理を受ける。この量子化は、原ディジタル音声信号により要
求されるより低いビットレートを達成するために重要である。量子化処理は、多
くの場合、参照テーブルの使用を含む。更に、異なる音声パラメータは、異なる
技術を使用して量子化されることができる。

【００５９】符号化領域の音声処理は、量子化音声パラメータを、各パラメータに対する量
子化器により許容される量子化値の異なるセットに直接修正することを含む。Ａ
ＬＣの場合、修正されたパラメータは、ＳＬＲＰである。雑音低減（ＮＲ）のよ
うなほかのアプリケーションに対しては、ほかのパラメータが使用できる。

【００６０】単一音声パラメータの量子化は、スカラー量子化と呼ばれる。１組のパラメー
タが一緒に量子化されるときは、その処理はベクトル量子化と呼ばれる。ベクト
ル量子化は、通常、ＬＰＣ係数のような相互に何らかの関係がある１組のパラメ
ータに適用される。スカラー量子化は、一般的に、ほかのパラメータと比較的無
関係なパラメータに適用される。両方の量子化方法を用いることもまた可能であ
る。ＳＬＲＰは通常はスカラー量子化であるので、ごく一般的に使用されるスカ
ラー量子化に焦点を合わせる。

【００６１】パラメータが瞬時量子化されるとき、量子化処理は、パラメータの過去及び将
来の値とは無関係である。パラメータの現在の値のみが量子化処理に使用される
。量子化されるパラメータは、１組の許可された量子化レベルと比較される。近
さ（closeness measure）に関して所定のパラメータにベストマッチする量子化
レベルが、そのパラメータを表すために選ばれる。通常、許可された量子化レベ
ルは、符号器及び復号器の両方の参照テーブルに格納される。選択された量子化
レベルのテーブルへのインデックスは、符号器から復号器へ送信される。あるい
は、インデックスが与えられたとすると、量子化レベルは数式を使用して定義さ
れてもよい。量子化レベルは、通常、ＳＬＲＰの場合は、不均一な間隔とされる
。例えば、［0,32767］の範囲を持つＧＳＭ・ＦＲコーデックにおけるブロック
最大値χ_maxは、図９に示す６４のレベルに量子化される。この量子化スキーム
において、χ_maxに近いがそれ以上のレベルが選択される。量子化レベルを表す
縦軸は、対数目盛りで描かれていることに注意されたい。

【００６２】瞬時量子化スキームは、固定ダイナミックレンジを使用することにより普通以
上の量子化エラーを招く。したがって、計算をより複雑にするという犠牲を払っ
ても量子化エラーを低減するために、多くの場合、音声復号化において適応量子
化器が使用される。適応量子化器はフォワード適応、バックワード適応に利用で
きる。フォワード適応スキームでは、ダイナミックレンジに関する特別なサイド
情報は、量子化テーブルインデックスに加えて復号器に周期的に送信されなけれ
ばならない。したがって、そのようなスキームは、通常は音声復号器には使用さ
れない。バックワード適応量子化器は、サイド情報の送信を要求しないので、好
適である。標準偏差及び差分の一般的な２種のバックワード適応量子化器が普通
に使用される。これらは図１０に描かれている。

【００６３】

【外１】

【００６４】図１０(b)のバックワード適応差分量子化スキームでは、現在及び以前のパラ
メータ値の間の相関が、好都合に使用される。相関が高い場合、量子化ダイナミ
ックレンジの大きな低減は、予測エラーｒ(n) の量子化により達成できる。予測
エラーは、実際のパラメータ及び予測パラメータ値の間の差分である。(n) に対
する同一予測器が、量子化器及び逆量子化器の両方で使用されなければならない
。以下の式を有する線形予測器Ｐ（ｚ）が使用される。

【数２】

【００６５】すでに示したように、差分量子化スキームは図１０のように表すことができ、
そこでは線形予測器Ｐ(z)が使用される。我々が伝達関数Ｐ(z)/[1-Ｐ(z)] を線
形予測器Ｐ₁(z)＝Σ^p _k=1b_kz^-kにより近似するならば、より簡単に実行できると
いうことに注意されたい。このより簡単な差分技術は、ゲイン修正係数γ_gcの関
数の量子化のためにＧＳＭ・ＥＦＲコーデックで使用される。このコーデックで
は、固定係数[b1,b2,b3,b4]=[0.68,0.58,0.34,0.19] を持つ４次の線形予測器が
符号器及び復号器の両方で使用される。

【００６６】ＥＦＲ符号器では、ｇ_c(n)は、サブフレームｎでの励振ベクトルをスケーリン
グするために使用されるゲインファクタを表す。このゲインファクタは、全体の
信号レベルを決める。このパラメータの量子化は、図１１に示すスキームを利用
するが、これはむしろ間接的である。送信される実際の「ゲイン」パラメータは
、実際にはｇ_c(n)と予測ゲインｇ_c'(n)の間の修正係数である。

【数３】として定義される修正係数γ_gc(n)は、符号化領域で直接アクセスできる全体の
音声レベルに関する唯一のパラメータであるので、実際のＳＬＲＰと考えられる
。

【００６７】

【外２】

【００６８】ＳＬＲＰγ_gcの量子化が図１２に示されている。この図では、Ｒ(n) は、

【数４】で与えられる予測誤差を表す。

【００６９】

【外３】

【００７０】符号器でのＳＬＲＰの量子化は、各サブフレームの平均除去励振ベクトルエネ
ルギを使用することによって、間接的に実行される。Ｅ(n) は、各サブフレーム
ｎの平均除去励振ベクトルエネルギ（ｄＢ）を表し、次式で与えられる。

【数５】

【００７１】

【外４】

【００７２】励振ベクトル{c(i)}は、ＳＬＲＰの決定に先立つ符号器において好適である。
励振ベクトルの復号化は、ＳＬＲＰの復号化に無関係であると注意されたい。Ｅ
(n) はゲインファクタｇ_c の関数であることが理解できる。γ_gc(n)のγ_gc(n)へ
の量子化は、間接的にｇ_c のｇ_c への量子化の原因となる。復号器における全体
的な信号合成のレベルのセッティングにより、量子化ゲインファクタは励振ベク
トルをスケーリングするために使用される。予測エネルギは次式で与えられる。

【数６】ここで、｛Ｒ(n-I)}は、以前の量子化値である。

【００７３】

【外５】

【００７４】通信の当業者なら、ＳＬＰＲに関連して説明される量子化技術はＮＲパラメー
タに等しく適用されることを知っている。

【００７５】大部分のコーデックに対して、符号化音声の部分復号化のみがＡＬＣを実行す
るのに必要である。十分に正確な音声レベル、ボイスアクティビティ及びダブル
トーク測定を基本的に得るために必須の他のパラメータと同様に、ＳＬＲＰの抽
出に必要な程度まで、音声が復号化される。単に部分符号化で足りる状況の例は
以下のものを含む。

【００７６】１）ＣＥＬＰ復号器では、ポストフィルタリング処理は、ＬＰＣベースモデル
を使用して復号化される信号に関して実行される。このポストフィルタリングは
、量子化雑音の低減を助けるが、信号の全体パワーレベルは変えない。したがっ
て、ＣＥＬＰ符号化音声の部分復号化では、ポストフィルタリング処理は経済性
のために省略することができる。

【００７７】２）無音抑制スキームのいくつかの形が、携帯電話通信及びボイスオーバパケ
ットネットワークで多用される。これらのスキームで、符号化音声フレームがボ
イスアクティビティの間のみ送信され、無音の間では非常にわずかの送信しか実
行されない。復号器は、他端からのバックグランド雑音に似せるため、無音期間
の間いくらかの安全な雑音を自動的に挿入する。ＧＳＭセルラネットワークで使
用されたそのようなスキームの１例は、不連続送信（ＤＴＸ）と呼ばれる。無音
抑制を示すサイド情報をモニタすることにより、ＡＬＣ装置の復号器は、無音の
間の信号復号化を完全に回避することができる。そのような場合、ボイス及びダ
ブルトークアクティビティの決定は、ＡＬＣ装置で更に単純化される。

【００７８】３）ＧＭＳネットワークの音声コーデックのための、提案されているタンデム
フリーオペレーション（ＴＦＯ）規格では、各チャネルの符号化音声ビットは、
６４kbit/secで基地局間の有線ネットワークを通して搬送される。このビットス
トリームは、８ビットサンプルに分割される。各サンプルの２つの最下位ビット
は符号化音声ビットを含み、上位の６ビットは、適当なＰＣＭサンプルに対応し
たビットを含む。ＰＣＭ情報の線形音声への変換は、非常に安価であるが、線形
音声信号の幾分かの雑音を含むある変形を与える。線形領域ＡＬＣアルゴリズム
で通常実行される、必要なボイスアクティビティ、ダブルトーク及び音声レベル
測定を実行するために、この雑音のある線形領域音声信号を使用することは、可
能である。したがって、この場合、最小量のＰＣＭサンプルの変換のみが必要で
ある。ＳＬＲＰの再量子化に要求されるＳＬＲＰ及びそのほかのパラメータは、
変換する必要がある。ほかのパラメータは、ＳＬＲＰの再量子化に必要な限度で
のみ符号化される。これは、後述の項に続く例から明らかになる。

【００７９】したがって、我々は、部分復号化及び再符号化を実行するだけで、複雑さを減
少し量子化雑音を低減するＡＬＣ装置を提供することが可能だと考える。しかし
ながら、図１４に示したＡＬＣ方法は改良することができる。サブ最適性（sub-
optimality）は、ゲイン決定の処理がＳＬＲＰ再量子化と無関係であるという暗
黙の前提による。普通、この仮定は有効ではない。

【００８０】図１４に示されたＡＬＣ方法もなおＮＲに適用可能だということは通信の当業
者なら理解できる。

【００８１】図１４の方法の改良するには３つの主要素がある。第１に、再量子化は、通常
は、所望の値と相違する実現されるＳＬＲＰをもたらすということに注意された
い。したがって、ゲイン決定ブロックにより利用される所望のゲインは、信号が
復号化されたとき実現されるゲインとは異なる。復号化時、音声信号はそれぞれ
過増幅又は過抑制されるため、この相違によりオーバフロー又はアンダフローの
問題が生じる。第２に、いくつかのＡＬＣアルゴリズムは、現在及び将来の所望
ゲイン値を決定するために、過去の所望ゲインを利用する。所望ゲイン値は、実
際の実現されたゲイン値を反映しないので、そのようなアルゴリズムは、図１４
に示されるとおり適用されると、誤る可能性がある。第３に、再量子化処理は、
ＳＬＲＰでの好ましくない残響を時々もたらす。これは、音声レベルを意図せず
に変調し、音声信号を歪ませることになる。そのようなＳＬＲＰ残響は、差分量
子化のようなフィードバック量子化スキームでみられる。

【００８２】図１５に転ずると、オーバフロー／アンダフローの問題を解決するために、図
１５の双方向技術をゲイン決定ブロックに組み込むことができる。基本的に、所
望のゲイン値を決定した後、ＳＬＲＰの再量子化後の実現されるゲイン値が計算
される。実現されるゲインは、オーバフロー又はアンダフロー問題が発生したか
否かを見分けるためにチェックされる。これは、例えば、実現されるゲインに原
音声レベルを乗じた新音声レベルを決定することにより達成できる。あるいは、
オーバフロー又はアンダフロー問題が実際に発生したか否かを見分けるため、音
声復号器がＡＬＣ装置で使用できる。いずれの方法でも、もし、実現されるゲイ
ン値が高すぎる又は低すぎると思われるならば、オーバフロー／アンダフローの
危機がなくなったと判断されるまで、新ＳＬＲＰは、それぞれ低減又は増加され
る。

【００８３】所望のゲイン値が現在及び将来のゲイン値を決めるためにアルゴリズムにフィ
ードバックされるＡＬＣアルゴリズムにおいて、以下の修正をすることができる
。基本的に、フィードバックされるゲインはＳＬＲＰ再量子化処理後の実現され
るゲインであって、所望のゲインではない。好ましいアプローチは図１６に示さ
れている。所望のゲインが実現されるゲインの代わりにフィードバックループに
用いられるなら、コントローラは実際の復号音声信号レベルをトラッキングせず
、誤ったレベルコントロールとなる。

【００８４】図１５のアンダーフロー／オーバーフロー防止のための反復スキームは図１６
のゲイン決定ブロックに組み込むことができることに注意されたい。

【００８５】最後に、フィードバックベース量子化スキームにおけるＳＬＲＰ反響音を避け
る方法を以下に詳細に検討する。一般に、これらの方法は、好ましくはゲイン決
定及び再量子化技術の集積を含んでいる。

【００８６】ゲイン決定ブロック及びＳＬＲＰ再量子化ブロックの結合設計と実施は、復号
化の間のオーバーフローとアンダーフロー問題を防止するために好ましく、フィ
ードバックベースのＡＬＣシステムによる適切なトラッキングを確実にし、フィ
ードバック量子化スキームにより生じる振動効果を回避する。図１７は、ゲイン
決定とＳＬＲＰ再量子化の結合を用いるＡＬＣ装置の一般的構成を示している。
詳細は個々のＡＬＣ装置に依存する。

【００８７】ＳＬＲＰの再量子化の技術を以下に述べる。ほとんどの音声符号器において、
ＳＬＲＰの量子化は瞬時スカラー量子化（instantaneous scalar quantization
）又は差分スカラー量子化のいずれかを用いて実行でき、それは上記に述べた。
これら個々のケースのＳＬＲＰの再量子化は、そのアプローチが他の量子化スキ
ームに容易に拡張できることを注記して記載する。図１７のＡＬＣ装置構成にお
けるゲインとＳＬＲＰ再量子化の結合の決定は、ここで述べる再量子化技術を利
用することができる。

【００８８】

【外６】

【００８９】オーバフロー及びアンダーフローの防止を望むなら、図１５に記載された反復ス
キームを用いることができる。オーバフロー及びアンダーフロー防止の別のアプ
ローチにおいて、再量子化ＳＬＲＰを用いた音声サンプルの部分復号を必要な範
囲で実行することができる。これはもちろん、余分なアルゴリズムの複雑さを伴
う。復号されたサンプルは、オーバフロー又はアンダーフローが生じていないこ
とを確認するため、直接点検することができる。

【００９０】

【外７】

【００９１】ＳＬＲＰ量子化テーブル値が一様に間隔が空けられていれば（線形に又は対数関
数的に）、スカラー再量子化プロセスを単純化することができる。この単純化は
、ＡＬＣ装置において別個のセットの所望のゲイン値のみを許容することによっ
て達成される。これらの所望のゲイン値は好ましくは、０ｄＢがゲインの１つで
ある、ＳＬＲＰ量子化値として同じ間隔を持っている。これは、所望のそして実
現されるゲイン値が、式（８）が各テーブル値について数値を求められないよう
にするため、常に調節されることを確実にする。そのため、再量子化は大きく単
純化される。ＳＬＲＰの当初の量子化インデックスは、ＳＬＲＰ量子化テーブル
間隔によって分割された所望のゲイン値に対応した値によって単純に増加し又は
減少する。例えば、ＳＬＲＰ量子化テーブル間隔がΔで表されるとする。すると
容認された所望のゲイン値の離散セットは、もしＳＬＲＰ量子化テーブル値が一
様に線形に間隔を有していれば、１＋｛.., −２，−，０，，２，..｝であり、
もしＳＬＲＰ量子化テーブル値が一様に対数関数的に間隔を有していれば、０＋
｛.., −２，−，０，，２，..｝である。もし所望のゲイン値が１＋ｋ_１Δ（線
形の場合）又はｋ_１Δ（対数的な場合）、再量子化されたＳＬＲＰのインデック
スは単にＳＬＲＰの原量子化インデックスにｋ_１を加えることにより得られる。

【００９２】この低複雑度の瞬時スカラー再量子化技術は、ＳＬＲＰ量子化テーブル値が一様
に間隔を有していなくとも適用できる。この場合、Δは隣接する量子化テーブル
値間の平均間隔であり、該平均はこれらの値間の線形又は対数関数的間隔のいず
れかを用いて適切に行うことができる。

【００９３】瞬時スカラー再量子化の例は、図１８にＧＳＭＦＲCODECについて示されてい
る。このCODECのＳＬＲＰはブロック最高ｘ_ｍａｘであり、すべてのサブフレー
ムに伝送される。Ｑ及びＱ^−１ブロックは、それぞれＳＬＲＰ再量子化及び逆量
子化を表している。ブロック最高のインデックスは、ｘ_ｍａｘを得るためルック
アップテーブルを用いて最初逆量子化される。それから、ｘ_ｍａｘはルックアッ
プテーブルを用いて再量子化されるｘ_{ｍａｘ,ＡＬＣ}を得るため、所望のゲイン
が乗ぜられる。再量子化されたｘ_ｍａｘのインデックスは、送られる前にビット
ストリームにおいて原の値に取って代わる。この再量子化技術は、ＧＳＭＦＲ
標準についての符号化領域ＡＬＣを実行するとき、図１４−１７において述べら
れたすべての技術の基本的要素を形成する。

【００９４】この技術がＮＲ関連パラメータのような他のパラメータに適用可能であるが、Ｓ
ＬＲＰに対する上記技術の適用を以下に記載する。ＧＳＭＥＦＲCODECは、再
量子化技術を用いて符号化領域ＡＬＣの実行を示すための例として用いられる。

【００９５】

【外８】

【００９６】

【外９】

【００９７】

【外１０】

【００９８】ＡＬＣ装置において実現されるゲイン、ΔＲ（ｎ）のフィードバックは、望ま
ない振動効果を引き起こすことができる。例として、ＧＳＭＥＦＲコーデック
が用いられるとき、これらの振動効果をデモンストレートする。このコーデック
について、Ｐ_１（ｚ）が４つの遅延素子を持っていることを思い出してほしい。
各素子は、３２の値の１つを含むことができる。そのため、ＡＬＣ装置における
非線形システムは、何時でも百万を超える状態のいずれの１つであることができ
る。このことは、この非線形システムの動作が初期条件によって重く影響される
ため述べられている。

【００９９】所望のゲイン、ΔＧ（ｎ）におけるステップに応答して実際に実現されるゲイン
の反響音が描かれる。単純化のため、原のＳＬＲＰ、Ｒ（ｎ）は１００を超える
サブフレームについて一定であり、Ｐ_１（ｚ）のメモリは当初０であると仮定す
る。図２０（ａ）は所望のゲインにおけるステップを示している。図２０（ｂ）
は所望のゲインに重ねられた実際に実現されるゲインを示している。初期条件及
び原ＳＬＲＰは正確な動作を決定するが、ここに示された実際の実現されるゲイ
ンにおける反響音は全く典型的なものである。

【０１００】図２０（ｂ）に示されたＳＬＲＰ実現されるゲインの反響音は音声信号の変調を
もたらし、聞こえる歪みとなる。そのため、ＡＬＣの仕様によっては、このよう
な反響音は望ましくないかもしれない。反響音は、図２０に示されているように
量子化器をフィードバックループの外側に動かすことによって取り除くことがで
きる。（この実施例において、計算は不要であるが、しかし図１９と比較のため
含まれている。）

【０１０１】量子化器をフィードバックループの外側に置くことは、所望のゲインに重ねら
れた、図２０（ｃ）に示された実際の実現されるゲインとなる。反響音は取り除
かれるが、平均エラー（即ち、所望のゲインと実現されるゲインの平均の差）は
図２０（ｂ）に示されたものより高いということが注記されるべきである。特に
この例では、フィードバックループに量子化器を有した及び有しない再量子化器
の安定状態の操作の間の平均エラーは、それぞれ０．３９ｄＢ及び１．０３ｄＢ
である。

【０１０２】計算を節約した結果、図２２に示すように図２１のＡＬＣ装置は単純化される。
これは線形システムＹ［１＋Ｐ_１（ｚ）］を定数、１／［１＋Ｐ_１（１）］で置
き換えることによってなされる。

【０１０３】ＡＬＣのために、このより単純な実行は、しばしば、特に所望のゲインが相対的
にめったに変化しないときに十分に見られる。めったに起こらない変化によって
、変化の間のサブフレームの平均数はＰ_１（ｚ）のオーダーより大きいことを意
味している。

【０１０４】いくつかのＡＬＣアルゴリズムは現在及び将来のゲイン値を決定するために過去
のゲイン値を利用することができる。このようなフィードバックに基づくＡＬＣ
アルゴリズムにおいて、フィードバックされるゲインは、ＳＬＲＰ再量子化処理
後に実際に実現されるゲインであり、所望のゲインではない。このことは図１６
と関連して上記に述べた。

【０１０５】このようなフィードバックに基づくＡＬＣアルゴリズムのための差分スカラー再
量子化は、図２３に示されているように実施できる。これらの実施において、Ａ
ＬＣ装置は実際に実現されるゲインを決めるために復号器の動作を真似ている。

【０１０６】もし図２１に似た単純化されたＡＬＣ装置の実施が図２３（ｂ）で望まれるなら
、線形システム１／［１＋Ｐ_１（ｚ）］は定乗数、１／［１＋Ｐ_１（１）］で置
き換えることができる。さらなる単純化が、実際に実現されるゲインの計算の正
確さはいくらか減少するが、線形システム、１＋Ｐ_１（ｚ）を定乗数、［１＋Ｐ _１（１）］で置き換えることにより達成できる。類似の方法で、図２３（ａ）に
示された実施は、線形システムを定乗数Ｐ_１（１）で置き換えることによって単
純化される。

【０１０７】反響音に寛容であるが、しかし所望のゲイン及び実際に実現されるゲインのマ
ッチングにおいてより高い正確さを求める応用において、フィードバックループ
内に量子化器を有する先に述べた方法のいずれも用いることができる。実際に実
現するゲインにおいて反響音を許容することができないが、しかし所望のゲイン
及び実際に実現されるゲインのマッチングにおいてより低い正確さを許容するこ
とができる応用のために、量子化器をフィードバックループの外側に有する先に
述べた方法のいずれも用いることができる。しかしながら、もし正確さと反響音
の回避の両者がＡＬＣの場合におけるように必要であれば、異なったアプローチ
が必要である。

【０１０８】現在の方法は、図２１，２２、又は２３（ｂ）のように量子化器をフィードバ
ックループの外側に置くことにより、実際に実現されるゲインの反響音を回避し
ている。加えて、所望のゲインと実際に実現されるゲインの間の平均エラーは、
所望のゲイン値を実際に実現される可能なゲイン値のセット、所与の現在の原Ｓ
ＬＲＰ値、Ｒ（ｎ）に属させて制限することによって最小化される。

【０１０９】

【外１１】

【０１１０】

【外１２】

【０１１１】

【外１３】

【０１１２】このように、一般に間隔Δを有したＳＬＲＰ値の各々一様に間隔を空けたサブ
セットについて、所望のゲイン値は、対応する現在の原ＳＬＲＰがそのサブセッ
トに属するなら、Δ［１＋Ｐ_１（１）］の倍数に選択される。

【０１１３】大きなバッファリング、処理、及び伝送遅延は、すでに音声符号器によって生
じている。音声強化のための符号化音声のさらなる処理は追加の遅延を加える。
このような追加の遅延は、電話の会話を潜在的に不自然なものとするので望まし
くない。さらに、追加の遅延は送受話器のエコーキャンセルの効率を減じ、又は
所与のレベルの実行についてエコーキャンセラーの必要な複雑さを増やす。線形
領域におけるＡＬＣの実施は、復号及び再復号のためのバッファリング及び処理
要件のために、常に少なくとも１つのフレームの遅延を加えることに注意される
べきである。テーブル１にリストされたコーデックについて、各フレームは２０
ｍｓの長さであることを注意されたい。しかしながら、符号化ＡＬＣは１フレー
ムより相当小さいバッファリング遅延で実行できる。通信の分野の者は同じ原理
をＮＲに適用できることを認識している。

【０１１４】ＥＦＲ符号器は２０ｍｓの音声フレームを２４４ビットに圧縮する。ＡＬＣ装
置の復号器において、最初のサンプルが復号化できる最も早い点は、図２５（ａ
）に示されているように、ビット９１を受けた後である。このことは、およそ７
．４６ｍｓのバッファリング遅延を表している。十分な情報が、最初のサンプル
でなくこの点における最初のサブフレーム全体を復号するために受けることがわ
かる。同様に、最初のサブフレーム全体がＦＲ復号器における約７．１１ｍｓの
バッファリング遅延の後に復号できる。

【０１１５】符号器と復号器の両者について、残りのサブフレームが復号の前により短い待
ち時間を要求する。各サブフレームはＥＦＲ及びＦＲ符号化スキームの両者にお
いて関連したＳＬＲＰを持っていることに注意されたい。このことは一般的に、
符号器がサブフレームレベルで操作する場合ほとんどの他のコーデックについて
事実である。

【０１１６】上記より、符号化領域におけるＡＬＣ及びＮＲは、フレーム毎よりむしろサブ
フレーム毎に行うことができることが理解できる。サブフレームが復号され、必
要なレベルの測定が更新されるやすぐ、ＡＬＣ装置によって計算された新しいＳ
ＬＲＰは、受信したビットストリームの原のＳＬＲＰを置き換えることができる
。

【０１１７】ＳＬＲＰで生じた遅延は、受信したビットストリームにおけるＳＬＲＰに対応
するビットの位置によって決定される。ＦＲ及びＥＦＲコーデックの場合、最初
のサブフレームについてのＳＬＲＰビットの位置はこの遅延を決める。

【０１１８】ほとんどのＡＬＣアルゴリズムは、サンプルを受信した後にのみ音声サンプル
のゲインを決める。このことはＡＬＣアルゴリズムが、あまりに大きなゲインの
ために音声信号がクリップされない、又は非常に低いゲインのためアンダーフロ
ーすることを確実にする。しかしながら、強いアルゴリズムにおいて、オーバー
フローとアンダーフローの両者は、低い可能性を持った事項である。このように
、先のサンプルからのみ得た情報に基づいてサンプルのゲインを実際に決めるこ
とができる。この概念は、いくつかの音声コーデックについてのコード化領域Ａ
ＬＣにおいて０に近いバッファリング遅延を達成するために用いられる。同じ原
理がＮＲアルゴリズムに適用できることは、通信分野の者であれば認識している
。

【０１１９】基本的に、ＡＬＣアルゴリズムは、先のサブフレームのみに基づいて現在のサ
ブフレームのゲインを決定するように設計されなければならない。このように、
ＳＬＲＰを修正するためにバッファリング遅延はほとんど必要ない。所与のサブ
フレームにおけるＳＬＲＰに対応するビットを受けるとすぐ、それらは最初に復
号される。新しいＳＬＲＰは、原のＳＬＲＰ及び先のサブフレームのみからの情
報に基づいて計算される。当初のＳＬＲＰビットは新しいＳＬＲＰビットに置き
換えられる。現在のサブフレームを復号するに必要なすべてのビットが受信され
るまで待つ必要はない。そのため、アルゴリズムによって生じるバッファリング
遅延は、小さな処理遅延に依存している。音声レベルについての情報は、現在の
サブフレームについてのＳＬＲＰの置き換えの後にのみ現在のサブフレームから
得られる。同じ原理がＮＲアルゴリズムに適用できることは、通信分野の者であ
れば認識している。

【０１２０】ほとんどのＡＬＣアルゴリズムは、この遅延方式で操作するため容易に変換で
きる。小さなリスクのオーバーフローとアンダーフローがあるが、このようなリ
スクは音声のサブフレーム（通常約５ｍｓ）のみに分離される。例えば、大きな
ゲインが適用されたことによるサブフレームにおけるオーバーフローの後、次の
サブフレームについて計算されたＳＬＲＰは、続くオーバーフローの可能性を最
小化するために適切に設定される。同じ原理がＮＲアルゴリズムに適用できるこ
とは、通信分野の者であれば認識している。

【０１２１】ゼロに近いバッファリング遅延方法は特にＦＲコーデックに適用可能である。
なぜなら、このCODECについてのＳＬＲＰの復号化は他のパラメータの復号化を
伴わないからである。ＥＦＲのCODECの場合、サブフレーム励振ベクトルは、Ｓ
ＬＲＰを復号するために必要であり、より複雑な差分再量子化技術はＳＬＲＰを
再量子化するために使用されなければならない。この場合でも、遅延の著しい減
少は、ＳＬＲＰが現在のサブフレームに置き換えられた後に現在のサブフレーム
に基づいて音声レベル更新を実行することによって達成される。同じ原理がＮＲ
アルゴリズムに適用できることは、通信分野の者であれば認識している。

【０１２２】ＧＳＭネットワークにおいて提案されたＴＦＯ標準と共に符号化領域ＡＬＣを
実行することは上記に述べた。この標準に従って、受信したビットストリームは
８ビットサンプルに分割できる。各サンプルの２つの少なくとも重要なビットは
、符号化音声を含み、一方上側６ビットは適当なＰＣＭサンプルに対応するビッ
トを含む。そのため、線形音声サンプルの雑音バージョンは、この場合のＡＬＣ
装置に利用可能である。線形領域ＡＬＣアルゴリズムにおいて通常なされている
必要なボイスアクティビティ、ダブルトーク、音声レベル測定を実行するため、
雑音線形領域音声信号を用いることは可能である。この場合、符号化音声パラメ
ータを復号化する最小の量のみ必要である。ＳＬＲＰの決定と再量子化のために
必要とされるパラメータのみ復号されなければならない。音声信号の部分復号は
、雑音線形領域音声サンプルが、音声レベルボイスアクティビティとダブルトー
ク検出を実行すると同様に音声レベルを測定することに依存できるので、不要で
ある。

【０１２３】本発明の目的は、処理された信号の再符号化を必要とする同様の質を有した線
形領域技術を用いるよりコンピュータへの依存がより少ない方法を介して、符号
化された領域の雑音低減を実行する方法を得ることである。信号特性における所
望の変化を有効にするパラメータを修正するために符号化領域で利用可能な柔軟
性は、量子化のために制限されるかもしれない。異なる音声パラメータ及び産業
標準音声符号器により用いられる対応する量子化方法の調査は行われた。異なる
音声パラメータの修正は順次検討され、雑音低減を達成するためそれらを利用す
る方法が検討される。

【０１２４】音声の変動的性格のため、「短時間」測定が所与の時間に音声についての情報
を得るために用いられることが好ましい。例えば、音声信号の短時間パワー又は
エネルギーは、信号の大きさの変化を推量する有用な手段である。好ましい方法
はリカーシブな平均化技術を利用することである。この技術において、離散時間
信号ｓ（ｎ）の短時間パワー、Ｐ（ｎ）は以下のように定義される。Ｐ（ｎ）＝ＢＰ（ｎ−１）＋α５^２（ｎ）（１１）

【０１２５】入力が５^２（ｎ）で出力がＰ（ｎ）であるリカーシブ平均化フィルターの伝達
関数、Ｈ_１（ｚ）は、

【数７】である。なお、このフィルタのＤＣゲインは、Ｈ_Ｐ（１）＝α／（１−Ｂ）であること
に注意されたい。このＩＩＲフィルタはフォゲッティングファクター(forgettin
g factor)として考えることができる極を有している。βが１(unity)に近づくほ
ど、短時間電力変化は遅くなる。このように、より新しいサンプルの電力が電力
量に組み込まれる速度はβを通して制御される。ＤＣゲインパラメータαは通常
、単一ゲインフィルタを得やすくするため、１−βにセットされる。

【０１２６】ある状況では、２乗平均（ＲＭＳ）短時間電力は、より望ましいかもしれない
。ディジタル信号処理器におけるコスト効果的実施のために、平方根操作は、そ
の平方よりむしろ以下のようにｓ（ｎ）の大きさを平均することによってＲＭＳ
電力に対する概算を用いることによって避けられる。Ｐ（ｎ）＝βＰ（ｎ−１）＋α｜ｓ（ｎ）｜（１３）

【０１２７】リカーシブな平均化の結果としての無限の長さのウインドウが望ましくなけれ
ば、サイズＮの分析ウインドウの電力は、例えば、以下のように平均化すること
ができる。

【数８】

【０１２８】ＶＡＤアルゴリズムは多くの音声処理アプリケーションにとって本質的なもの
である。ＶＡＤ方法の広い多様性が開発されてきた。背後の雑音から音声を区別
することは、音声についての基本的前提である。ほとんどのＶＡＤアルゴリズム
は、音声と無音又は背後の雑音を区別するための異なる方法において、これらの
前提のいくつか又は全部を利用している。

【０１２９】最初の前提は、音声レベルは通常背後の雑音レベルより大きいということであ
る。このことはしばしば、用いられる最も重要な基準であり、多くのＶＡＤアル
ゴリズムはこの前提にのみ基づいている。この前提を用いて、音声の存在を、閾
値に対して信号電力測定を比較することにより検出することができる。

【０１３０】第２の前提は、音声は変動するのに対して雑音は相対的に変動しないことであ
る。この前提を用いて、多くのスキームが信号ピッチ測定における信号スペクト
ラム又は変化の量の安定に基づいて工夫されている。

【０１３１】ＶＡＤアルゴリズムの開発はこの仕様の範囲外である。多くの複雑な強いアル
ゴリズムはすでに利用でき、復号された音声に直接適用できる。このように、必
要な場合、音声と背後の雑音を区別する良い知識が利用可能である。

【０１３２】単一帯域雑音低減システムは、考えられる最も基本的な雑音低減システムであ
る。図２６に示された方法において、２つの短時間電力測定、Ｐ_Ｔ（ｕ）とＰ_Ｎ（ｎ）が実行される。前者は全電力と呼ばれ、音声と背後の雑音の合計である。
後者は雑音電力である。両電力の大きさは、式（１１）で与えられたリカーシブ
な平均化フィルタを用いて達成することができる。全電力量は連続して更新され
る。雑音電力の大きさは、ＶＡＤによって決められたように音声の不在の間のみ
更新される。雑音のない音声電力、Ｐ_Ｓ（ｎ）は、どの時でも次のように推定さ
れる。Ｐ_Ｓ（ｎ）＝Ｐ_Ｔ（ｎ）−Ｐ_Ｎ（ｎ）（１５）

【０１３３】理論上、雑音抑制は以下で与えられるゲイン、ｇ^（ｎ）によってもたらされる
。

【数９】式（１６）を使用することによって、減衰後に保持される雑音信号ｙ(ｎ)の比率
は、雑音のない音声信号とほぼ同じ電力を有する。その信号がたまたま雑音だけ
を含んでいる場合には、そのゲインは、ゼロに減少される。他方の極端では、何
も雑音がない場合には、そのゲインは、１になる。この例では、雑音のない音声
信号の推定ｓ(ｎ)が得られる。

【０１３４】実際問題として、式（１５）は、現実には、推定エラーにより所望信号の電力
に関する値が負になり得ることに注意されたい。そのような結果を避けるために
、常に負にならないことを確実にするのに、追加の発見的方法が使われる。

【０１３５】信号帯域の雑音抑制技術に関連する重大な欠点は、音声信号による雑音変調の
問題である。音声がないときには、その雑音は、全体として抑制することができ
る。しかしながら、雑音は、音声が発せられるときはいつも聞こえる。ここで、
その効果は、その雑音が音声に従っているということと、雑音の量が音声の発生
（burst）の大きさに概ね比例しているということである。この迷惑なアーチフ
ァクトは、０．１のような小さいが０でない値へ、可能な最も低いゲインを制限
することによって、制限された程度までに（除去されていないが）弱くすること
ができる。雑音の変調は、この解決策によって迷惑でないものになる。

【０１３６】考慮された全てのパラメータの中で、ピッチゲインｇ_ｒとコードブックゲイン
ｇ_ｃは、おそらく、直接の修正を最も受けやすいものである。これらのゲインパ
ラメータは、その他のパラメータから相対的に独立しており、通常、個別に量子
化される。さらに、それらは、通常、（コードブック励振とは違って）量子化さ
れた値の好適な範囲を有している。好適な実施形態では、雑音の低減を達成する
ために、これらの２つのパラメータを使用している。

【０１３７】上で述べたように、符号化領域雑音の低減に必要な再符号化のコンピュータ処
理コストは、全符号化よりも数オーダー低い大きさである。これは、ピッチゲイ
ンとコードブックゲインのみが、再量子化されなければならない場合には、正し
い。再量子化プロセスは、しばしば、量子化されたゲイン値のテーブルをサーチ
することと、二乗距離を最小化する値を見出すことを含んでいる。ゲインパラメ
ータ（又は、修正されるべきいかなる他のパラメータ）が、差分スカラ量子化ス
キームを使用して量子化される場合には、僅かに多くの複雑な事態が起こる。こ
の場合でも、そのような再符号化のコストは、通常、まだ、数オーダーの大きさ
で低いものである。差分量子化パラメータに対する再量子化が、ここで、述べら
れる。

【０１３８】単一の信号音声パラメータの量子化は、スカラ量子化といわれる。一組のパラ
メータが一緒に量子化される場合に、そのプロセスは、ベクトル量子化と呼ばれ
る。ベクトル量子化は、通常、ＬＰＣ係数のような、何らかの方法で、互いに関
連付けられる一組のパラメータに適用される。スカラ量子化は、一般に、ｇ_ｒ、
ｇ_ｃ、そしてＴのように、他のパラメータと相対的に独立しているパラメータに
適用される。両方のタイプの量子化の混合も、可能である。

【０１３９】パラメータが、瞬時に量子化される場合には、その量子化プロセスは、パラメ
ータの過去と未来の値と独立している。パラメータの現在の値だけが、量子化プ
ロセスに使用される。量子化されるべきパラメータは、一組の許可された量子化
レベルと比較される。ある近さの尺度（closeness measure）に関して所定のパ
ラメータと最もよく一致する量子化レベルが、そのパラメータを代表するために
選択される。通常、許可された量子化レベルは、符号器と復号器の両方について
ルックアップテーブルに格納される。選択された量子化レベルのテーブルへのイ
ンデックスは、符合器によって復号器へ送られる。

【０１４０】

【外１４】

【０１４１】ベクトル量子化は、一組のパラメータの共同の量子化を含む。その最も簡単な
形式において、ベクトルは、テーブルからの一組の許容ベクトルと比較される。
スカラ量子化と同様に、通常、二乗平均誤差が、量子化テーブルから最も近いベ
クトルを選択するために使用される。重み付けされた二乗平均誤差は、しばしば
、知覚的にさらに重要であると知られているベクトル成分を強調するのに使用さ
れる。

【０１４２】ベクトル量子化は、通常、励振信号とＬＰＣパラメータに適用される。ＬＰＣ
係数の場合に、係数のレンジは、少なくとも理論的には制限されない。これは、
表現におけるわずかな誤差による安定化問題と同様に、量子化前よりさらに適切
なパラメータ領域へのＬＰＣ係数の最初の変換をもたらす。その変換によって、
既知の有限のレンジを有し、不安定性を防止し、又は、少なくともその可能性を
低減する一組のパラメータでＬＰＣ係数が表現されることが可能となる。利用で
きる方法は、対数領域比と逆正弦関数を含んでいる。ＬＰＣ係数の計算上より多
くの複雑さをもつ表現は、線スペクトル対（ＬＳＰ）表現である。ＬＳＰは、Ｌ
ＰＣ係数の擬似周波数表現を提供し、ＬＰ合成フィルタの安定性を保証する簡単
な方法のような他の望ましい特性を有するとともに、他の変換技術より以上に、
符号化効率を改善することができるが分かっている。

【０１４３】ゲインパラメータとピッチ周期は、この方法で時々量子化される。例えば、Ｇ
ＳＭＥＦＲ符号器は、コードブックゲインを差分的に量子化する。差分再量子
化に関する一般技術が、ここで述べられる。

【０１４４】Ｇ(ｎ)が、再量子化されるべきパラメータであり、量子化スキームで使用され
る線形予測器が、図２８に示されるＰ(ｚ)で表示されるものと仮定する。量子化
された差分Ｒ(ｎ)は、符号器から復号器へ正しく送信される実際の符号化領域パ
ラメータである。このパラメータは、好ましくは、ネットワーク音声強化装置に
よってインタセプトされ、そして、できる限り、新しい値Ｐ(ｚ)に修正される。
この方法の動作が、図２８を参照して説明される。

【０１４５】音声強化アルゴリズムが、量ΔＧ(ｎ)によって修正されるＧ(ｎ)を要求したと
仮定する。ネットワーク装置の差分再量子化スキームは、基本的に、符号器の動
作を模写しようとする。この技術の背景にある基本的考えが、異なるシステム間
の相互接続と同様に、フィギュアにおける全ての量子化器を最初に無視すること
によって理解される。そこで、符号器は、ネットワークにおけるシステムが、と
もに同一の線形システムであると見られる。符号器が、その入力としてＧ(ｎ)を
有する一方、ネットワーク装置がその入力としてΔＧ(ｎ)を有する。それらは、
好ましくは、同一の線形システムであるので、その２つのシステムは、概念的に
結合され、その入力として(Ｇ(ｎ)＋ΔＧ(ｎ))を有する単一のシステムを効果的
に生じる。そのように、一つのシステムは、好ましくは、出力Ｒ_new(ｎ)を含み
、それは、好ましくは、Ｒ_new(ｎ)＝Ｒ(ｎ)＋ΔＲ(ｎ) （１７）によって与えられる。しかしながら、これらのシステムを非線形にする量子化に
よると、この関係は、近似となるだけである。ここで、実際に復号化されたパラ
メータは、好ましくは、Ｇ_new(ｎ)＝Ｇ(ｎ)＋ΔＧ(ｎ)＋量子化誤差（１８）によって与えられ、ΔＧ(ｎ)＋量子化誤差は、ネットワーク音声強化装置によっ
て達成されたパラメータにおいて、実際に実現される変更である。

【０１４６】ネットワーク再量子化装置において、量ΔＲ(ｎ)のフィードバックは、Ｇ(ｎ)
が長時間変化しない場合には、望ましくない発振作用を起こすことになる。これ
は、特に、Ｇ(ｎ)がゲインパラメータである場合、音声信号に望ましくない結果
をもたらし得る。ＣＳＭＥＦＲコーデックの場合に、Ｇ(ｎ)は、コードブック
ゲインの対数に相当する。無音期間では、Ｇ(ｎ)は長期間同一の量子化レベルに
留まる。そのような無音の間、適当な量ΔＧ(ｎ)によってＧ(ｎ)を修正すること
により、ネットワーク装置で信号の減衰が試みられると、雑音の準周期変調が、
弱いものではあるが妨害となるバズを引き起こすことになるであろう。

【０１４７】例として、ＧＳＭＥＦＲコーデックが使用される場合の発振作用が説明され
る。この線形予測器Ｐ(ｚ)は、好ましくは、４つの遅延素子を有し、その各々は
、３２の可能値のうちの一つを引き受ける。ここで、ＡＬＣ装置における非線形
システムは、いかなる所定の時間においても百万以上の可能な状態のいずれか一
つにあることができる。これは、この非線形システムの動作がその初期条件によ
って重大に影響されるという理由から言及されている。

【０１４８】実際の実現されたゲインＧ_new(ｎ)における反響音が、ここで、所望のゲイン
における一つのステップΔＧ(ｎ)に対応して示される。簡単のために、送信され
た原パラメータＲ(ｎ)が、１００サブフレーム以上で一定であり、Ｐ(ｚ)のメモ
リは、初期にはゼロであるとする。図２９(ａ)は、所望のゲインにおけるステッ
プを示している。図２９(ｂ)は、所望のゲインに重ねられた実際の実現されたゲ
インを示している。初期条件とＧ(ｎ)の値は、正確な動作を決定するが、ここに
示された実際の実現されたゲインでの反響音は、代表的なものである。

【０１４９】反響音は、図３０に示されるように、フィードバックループ外で量子化器を「
動かす」ことによって、除去されることができる（図３０において、コンピュー
タ計算は、不必要であるが、図２８との比較のために含まれる。）。量子化器を
フィードバックループ外に配置することで、図２９(ｃ)に示されるように、所望
のゲインに重ねられ、実際の実現されたゲインになる。反響音が除去されるが、
平均誤差（即ち、所望のものと実際のもののゲインとの平均的差分）は、図２９
(ｂ)に示されるそれよりも高くなる。特に、この例に関して、フィードバックル
ープに量子化器を入れる場合と入れない場合における再量子化器の定常状態で動
作している間の平均誤差は、それぞれ、０．３９ｄＢと１．０３ｄＢである。

【０１５０】従って、差分量子化パラメータの正確な制御と発振作用の間には、トレードオ
フが存在する。しかしながら、ボイスアクティビティ検出器の使用を通して、正
確なスキームと、反響音はないが正確でないスキームとをスイッチすることがで
きる。無音期間には、反響音のないスキームが使用される一方、その間、フィー
ドバックループにある量子化器によるより正確なスキームが音声期間に使用され
る。それらのスキームをスイッチングするとき、予測器の状態は、同様に、適切
に更新される。

【０１５１】図３１に示されるように、反響音のない技術が簡単化され、コンピュータ計算
においていくらか節約されることになる点も示される。これは、線形システム１
／〔１＋Ｐ(ｚ)〕の代わりに、定数１／〔１＋Ｐ(１)〕と置き換えることによっ
てなされる。この実施例は、パラメータが比較的まれしか変更されない場合には
、特に十分であることがよく見出される。まれな変更ということは、それらの変
更間でのサブフレームの平均数が、Ｐ(ｚ)のオーダーよりもっと大きいことを意
味している。

【０１５２】さらにより精巧な量子化スキームが使用される場合でも、これらのパラメータ
を符号化するコストは、まだ、相対的に小さいものである。パラメータが差分量
子化されるときでも、パラメータ修正が実際的にどのように果たされるのかを理
解することによって、符号化領域雑音の低減と残響の抑制とに関連した問題が扱
われる。

【０１５３】複雑ではなく、遅延が小さい符号化領域雑音の低減方法が、ここで、述べられ
る。雑音低減を達成するために使用される種々の符号化領域パラメータが、上で
述べられた。これらのパラメータについて、２つのゲインパラメータ、ピッチゲ
インｇ_ｐとコードブックゲインｇ_ｃが、直接の修正を受け入れ易い。従って、好
適な実施形態は、これらのパラメータを含む。

【０１５４】単なる例として、従来使用されている５ｍｓの期間であるサブフレーム周期が
、仮定される。電話アプリケーションに使用されている８０００Ｈｚの代表的な
サンプリングレートでは、サブフレームは、４０サンプルからなる。サンプルイ
ンデックスは、ｎを使用して表示され、そのサブフレームのインデックスは、＿
＿を使用して表示される。符号化パラメータは、サブフレーム当たり高々一度更
新され、そのサブフレームにある全てのサンプルに適用するので、これらの符号
化パラメータが、ｍを使用して単純にインデックスされても、混同がない。更新
され、又はフレーム全体に適用する他の変数も、この仕方でインデックスされる
。フレーム内の個々のサンプルは、通常、ｎを使用してインデックスされる。し
かしながら、一つより多いサブフレームが一つの式によって圧伸されている（sp
anned）ならば、そのとき、音声サンプルｓ(ｎ，ｍ)として、一つのサンプルを
インデックスすることも意味のあることである。

【０１５５】ハイブリッドで、パラメトリックな時間領域符号化技術に使用される音声合成
モデルが、サブフレームｍでの次の式によって与えられる全伝達関数Ｈ_ｍ(ｚ)に
よる時変システムとして考えられる。

【数１０】ここでは、固定コードブック（ＦＣＢ）によって提供される励振源を用いている
。実際の具体例に近い他の観点が、図３２に示される。ＦＣＢ出力は、Ｃ’(ｎ)
として示される。図３２において、長周期予測器（ＬＴＰ）又はピッチ合成フィ
ルタのバッファが示される。ＬＴＰが伝達関数

【数１１】を有することを思い起こす。ここで、ｇ_ｐとＴの両方が、通常、サブフレーム毎
に更新される。この伝達関数に従って、ＬＰ励振が、サブフレーム毎に、

【数１２】として計算され、ここで、ｂ’(ｎ)は、ＬＴＰバッファから得られる。ＬＰ励振
サンプルｕ(ｎ)の直前に計算されたサブフレームは、好ましくは、ＬＴＰバッフ
ァの左端部にシフトされる。これらのサンプルも、符号化された音声を復元する
ために、ＬＰ合成フィルタを励振するのに使用される。

【０１５６】音声合成モデルのこの観点を使用すると、ＬＰ合成フィルタ励振ｕ(ｎ)の２つ
のソースは、はっきりと見分けられる。ｂ(ｎ)及びｃ(ｎ)として表示されるこれ
らの２つの励振ソースは、それぞれ、ピッチ励振、コードブック励振と呼ばれる
。この２つのソースの観点により、ＬＴＰも、しばしば、適応コードブックと呼
ばれ、その常に変化するバッファ内容によって、ＦＣＢと対照をなしている。明
らかに、ＬＴＰの出力は、ＦＣＢの出力から独立していない。ここで、スペクト
ル減算概念は、好ましくは、その２つのソースに直接適用されない。しかしなが
ら、符号化器が符号化領域パラメータを最適化する仕方により、２つのソースは
、異なる特性を有する。この特性における差異が、雑音低減技術を導き出すのに
利用される。

【０１５７】雑音を低減するために、符号化器から受信されるゲインファクタｇ_ｐとｇ_ｃが
修正される。この修正は、これらのゲインファクタに雑音低減ファクタγ_ｐとγ _ｃを乗算することによって達成され、それぞれ、調整ゲイン値が生成される。こ
れは、復号器で、次式によって与えられる修正時変フィルタとなる。

【数１３】

【０１５８】好適なネットワーク雑音低減装置が、図３３に示される。この実施形態では、
２つの復号器がある。一つの復号器２０は、基準復号器と呼ばれ、図１４に示さ
れた音声符号器のように、符合器から受信した符号化音声の復号を行う。復号器
２０によって達成される復号は、特定のコーデックによって完全であるか部分的
である。本実施形態に関しては、完全復号化を行い、雑音のある音声出力ｙ(ｎ)
を生成するものとする。しかしながら、上で述べたように、本実施形態は、部分
復号化でも動作する。本質的に、例えば、雑音特性の電力に実質上影響を及ぼす
復号化が避けられ、それによって、時間を節約することができる。

【０１５９】図３３の下半分は、送信先復号器１２０を示す。この復号器を使用して、符号
化されたパラメータが最適化される。この送信先復号器は、受信する送受話器の
ように、送信先にある実際の復号器を模倣している。それは、導電体１４８上に
、推定された雑音の無い音声出力を生成する。明瞭化するために分離して描かれ
ているが、基準復号器と送信先復号器のモデルにおけるいくつかの部分が、共有
される。例えば、固定コードブック（ＦＣＢ）信号は、両方の復号器について同
一となっている。

【０１６０】通信の当業者には、復号器２０と１２０が図１４の次のブロックを提示してい
ることが分かる。部分又は完全復号化ブロック、音声レベル測定ブロック、ゲイン決定ブロック、入力ＳＬＲＰとゲインを有する乗算関数、ＳＬＲＰ再量子化、そして、修正ＳＬＲＰ。

【０１６１】さらに、図１４で参照されるボイスアクティビティ関数が、図３３の実施形態
に組み込まれている。結果として、図３３に示された音声復号器１２は、図１４
に示された音声復号器と同じタイプである。

【０１６２】特に、図３３の復号器は、図７で述べられたパラメータのように、種々の圧縮
コードパラメータを使用する通信システム８において役に立ち、コードブックゲ
イン、ピッチゲイン、そして、コードブックＲＰＥパルスを含んでいる。そのよ
うなパラメータは、種々のオーディオ特性を有するオーディオ信号を表現し、雑
音特性と信号対雑音比（ＳＮＲ）の信号を含んでいる。図３３の装置は、雑音特
性を管理するための有効な技術を提供する。復号器２０と１２０は、全体的に１
５０で示されるプロセッサによって実行され、ＶＡＤ関数を有する雑音低減制御
器１６０を含んでいる。プロセッサ１５０は、論理的な、そして数学的な操作が
できる他の論理ユニットと同様に、マイクロプロセッサ、マイクロコントローラ
、又は、ディジタル信号処理装置からなる。復号器２０と１２０は、ソフトウエ
ア、ハードウエア、又はソフトウエアとハードウエアの組み合わせによって実行
される。

【０１６３】プロセッサ１５０は、符号器によってネットワーク１１上に送られたディジタ
ル信号の圧縮コードに応答する。復号器２０と１２０のそれぞれは、コードブッ
クゲインとピッチゲインのように、図７で記述されたタイプの所定の圧縮コード
パラメータを読み込む。プロセッサ１５０は、雑音特性の電力を測定する必要が
ある場合には、部分符号化を実行するために、その圧縮コードに応答する。その
復号化は、雑音電力を測定する仕事を簡単にする線形領域で復号化された信号を
生じる。

【０１６４】基準復号器２０は、端部１３で圧縮符号化ディジタル信号を受信する。復号器
２０は、乗算関数２４におけるコードブックゲインｇ_ｃによって乗算又はスケー
リングされるコードブックベクトルＣ’(ｎ)を発生する固定コードブック（ＦＣ
Ｂ）関数２２を含んでいる。コードブックゲインは、端部１３で受信した圧縮さ
れたコード信号からプロセッサ１５０によって読み込まれる。乗算関数は、ピッ
チ合成フィルタ２６に供給されるスケーリングされたコードブックベクトルｃ(
ｎ)を発生する。プロセッサ１５０は、式３１で示されたスケーリングされたコ
ードブックベクトルの電力Ｐ_ｃを計算する。その電力は、ピッチゲインを調整す
るのに使用される。プロセッサ１５０は、雑音特性へのスケーリングされたコー
ドブックベクトルの貢献を弱めるために、コードブックゲインを減少する。

【０１６５】フィルタ２６は、サンプルベクトルを発生するために、スケーリングされたコ
ードブックベクトルｃ(ｎ)に応答する長周期予測器（ＬＴＰ）バッファ２８を含
む。そのサンプルは、加算関数３２によって処理されるスケーリングされたサン
プルｂ_ref(ｎ)を発生するために、乗算関数３０でピッチゲインｇ_ｐによってス
ケーリングされる。プロセッサ１５０は、式３０−３３に示されるように、雑音
特性を管理するために、スケーリングされたサンプルの貢献を増加するようにピ
ッチゲインを増加する。プロセッサ１５０は、スケーリングされたサンプルＰ_br _ef の電力を決める。同様な電力Ｐ_ｂが、復号器１２０によって発生される。その
２つの電力が、式３０と３３によって示されるように、ピッチゲインを調整する
のに使用される。

【０１６６】フィルタ２６は、その出力に、全コードブック励振ベクトル又はＬＰＣ励振ベ
クトルｕ(ｎ)を発生する。プロセッサは、ベクトルｕ(ｎ)の電力Ｐ_ｕを計算し、
そして、式３２に示されるように、ピッチゲインを調整するのに使用する。

【０１６７】ベクトルｕ(ｎ)は、図６に示されたものの様なＬＰＣ合成フィルタを励振する
。フィルタ３６の出力は、制御器１６０に戻される。

【０１６８】復号器１２０は、復号器２０と関連して記述された関数と同じである多くの関
数を含んでいる。この様な関数は、１００によってインデックスされる番号をも
つ。例えば、コードブック２２は、コードブック１２２と同じである。符号器１
２０は、復号器２０には含まれていない乗算関数１４０と１４２を含む。乗算関
数１４０は、式３３に規定される入力として、γ_ｐを受信する。式３０に示され
るように、γ_ｐの値は、一部は前述した電力の比に依存している。乗算関数１４
２は、式２８に規定される入力として、γ_ｃを受信する。乗算関数１４０と１４
２の結果として、復号器１２０は、ピッチ合成フィルタ２６と異なるピッチ合成
フィルタ１４４を使用する。

【０１６９】一般的な式と、特定の式２１−３３によって説明されるように、プロセッサは
、端子１３で受信した信号の雑音特性を管理するために、コードブックゲイン及
び／又はピッチゲインを調整する。調整されたゲイン値は、前述した仕方で量子
化され、量子化されたパラメータは、端子１６を通して、出力ネットワーク１５
に送信される。

【０１７０】前述の基礎的な単一信号帯域の雑音低減器は、符号化領域で実行される。ｇ_ｃ (ｍ)は、式１９で与えられた時変フィルタのＤＣゲインであるので、このＤＣゲ
インは、次式のように、γ_ｃ(ｍ)を設定することによって修正される。

【数１４】ここで、Ｐ_ｗ(ｍ)とＰ_ｙ(ｍ)は、それぞれ、サブフレームｍでの雑音電力と全電
力の推定である。Ｅもまた、単一帯域の雑音低減器によって供給される最大損失
である。通常、それは、０．１のような小さい値に設定される。その様なＤＣゲ
イン制御システムは、雑音電力が音声信号に同調して変動するという理由で、厳
しい雑音変調に悩まされる。これは、知覚的に苦しませるものであり、これを補
償する一つの方法は、雑音変調量と雑音抑制量とを交換することになる。

【０１７１】式（２０）における方法より優れている符号化領域の雑音低減方法を得ること
ができる。２つのパラメータγ_ｐとγ_ｃが、時変フィルタＨ_ｍ(ｚ)において制御
される。復号器の再帰的性質によって、雑音低減を実現する両ゲインファクタの
結合最適化は、むしろ複雑である。これは、＿＿の現在値の修正が未来値ｇ_ｐに
密接に関係しているからである。ここで、そのような最適化では、好ましくは、
ｌが時変ピッチ周期Ｔ(ｍ)に依存するものとし、γ_ｃ(ｍ)とγ_ｐ(ｍ＋ｌ)が決め
られる。準（sub-optimal）最適化でも、未来における少なくともいくつかのサ
ブフレームについて符号化パラメータの知識が要求される。これは、フレームの
境界を交叉することを要求し、厳しい実際の影響を有している。第１に、より多
くのバッファリングが要求される。さらに重要なのは、セルラーやパケットネッ
トワークでは特に容認できない追加的遅延を受けることである。このようにして
、その問題は、好ましくは、未来フレームの知識を要求しない仕方でアプローチ
される。

【０１７２】技術の背後にある基礎的考え方が、最初に述べられる。ボイスアクティビティ
復号器によって示されるような無音期間では、γ_ｃを制御することによるＨ_ｍ(
ｚ)のＤＣゲインの制限によって、信号の最大減衰を行うのが安全である。音声
の開始端と下降端において、γ_ｃには、適切に上昇と下降が考慮される。しかし
ながら、発声された音声の区間では、ＬＴＰ励振出力が、生じる信号電力の大き
な量に寄与し、ＦＣＢ励振出力に関連するよりよいＳＮＲを有する。従って、発
声された音声の区間では、ＦＣＢ出力の減衰の限られた量を実行する。雑音低減
した復号化音声信号における電力の最終的な損失を補償するために、γ_ｐが注意
深く増強される。γ_ｐとγ_ｃは、２つ段階で最適化される。

【０１７３】最初に、γ_ｃの最適化が考慮される。効果的に雑音を低減するために、γ_ｃは
、好ましくは、０＜Ｅ＜／のように、ゼロ又はある最大損失近くまで作動される
。高損失を使用することによるトレードオフは、復号化された音声信号も、減衰
されることである。γ_ｃ＝１であることを要求する復号化音声レベルを維持する
ことと、γ_ｃ＝Ｅでることを要求する効果的な雑音低減を得ることとの間におけ
るこの綱引きを反映することが、次のようなコスト関数Ｆを用いて述べられる。

【数１５】ここで、λ_１とλ_２は、決められるべき適当な重みである。このコスト関数を最
小化することによって、ＤＣゲイン低減の最適量が達成される。ここで、一貫し
て良い結果を与えることが分かっている適当な一組の重みが考慮される。それで
もやはり、同様にうまく行える他の適当な重みが、定式化される。

【０１７４】無音の区間では、雑音抑制の最大量を実現したい。従って、λ_１は、好ましく
は、無音の区間では大きく、音声のある区間では小さくする。その様な重み付け
を実現する適当な連続的尺度は、基準復号器を使用するＳＮＲ尺度であり、ＳＮ
Ｒ_refとして示される。最初の重みは、次のように設定される。

【数１６】

【０１７５】ボイスアクティビティ復号器は、基準復号器の出力信号ｙ(ｎ)における音声区
間から無音区間を区分けするのに使用される。バックグランドの雑音電力Ｐ_ｗは
、復号化された音声信号ｙ(ｎ)における無音の区間で推定される。１５９９９／
１６０００における極と一様なＤＣゲインによる式（１１）の再帰的平均化は、
そのような無音の区間でのバックグランドの雑音電力を更新する適当な手段であ
ることが分かる。雑音が比較的に定常であると考えられるので、この大きな時定
数が適当である。信号ｙ(ｎ)の電力Ｐ_ｙは、同様の再帰的平均化又は他の手段を
使用して測定される。再帰的平均化が、利用される場合には、１２７／１２８で
の極と一様なＤＣゲインを用いた平均化が適当であることが分かった。そのとき
、ＳＮＲ_refは、次式として推定される。

【数１７】

【０１７６】ここで、最大関数は、生じ得るＳＮＲ_refに対する無意味な負の値を許可しな
い。雑音電力推定アルゴリズムは、絶えずＰ_wは０より大であることが保証され
ているものと仮定する。

【０１７７】 λ₁のみが使用され、λ₂が１ユニット（unit）に設定されるなら、γ_cはＳＮ
Ｒ_refとともに上昇し下降する。しかしながら、典型的にはより高いＳＮＲをま
た有する音声が発せられる間、γ_cは好ましくはある程度にまで減衰される。こ
れは、音声が発せられる間、ＦＣＢが大部分の雑音信号をモデル化するので、音
声が発せられる間、雑音の全体の量を減少させる。ゆえに、単一バンド雑音減少
システムにおいて生じる典型的な雑音変調が減少する。発生された音声の存在を
反映する適切なパラメータは必要である。図３３に示される、Ｐ_bとＰ_cが基準デ
コーダ信号ｂ_ref（ｎ）とｃ_ref（ｎ）の短時間電力である比率、Ｐ_b,ref／Ｐ_c,r _ef は、発生された音声の存在を反映する。代わりに、音声における相関量をまた
反映するピッチゲインｇ_p（ｍ）が、使用できる。ここでピッチゲインがピッチ
合成フィルタを決定するエンコーダでの最適化処理の結果であることを思い起こ
す。本質において、この処理は、実施されるシーケンスに最もよく相関するＬＴ
Ｐバッファからの過去のシーケンスを見つける。それゆえ、相関が高ければ、次
にピッチゲインもまた対応して高い。このように、残りの重みはピッチゲインに
反比例するよう特定される。

【数１８】 λ₂をこのように特定化することにより、発生された音声の強調を止めている
間、γ_cを１に接近させて維持する。

【０１７８】パラメータλは、好ましくは経験的に決定される。音声強化アルゴリズムにお
ける知覚テストに基づきチューニングされることが要求されるパラメータを有す
ることは極めて普通である。

【０１７９】このように、最小化されるべき結果としてのコスト関数は、下式で表される。

【数１９】 γ_cに関してＦの微分をとり、それを０に設定すると、γ_cの最適値は、下式で
決定される。

【数２０】ここで、λは経験的に最適化される。さて、γ_cはなお一般的にＳＮＲ_refに同
期して上昇し下降する。しかしながら、γ_cは、たとえＳＮＲ_refが大きくても、
さらにｇ_pもまた大きければ、より小さくなる。

【０１８０】

【外１５】

【０１８１】ピッチ合成フィルタは、基本的にくし形フィルタである。ピッチ期間がＴ＝４
０のときに得られるくし形フィルタの振幅周波数応答の１ｋＨｚレンジが、図３
４に示される。１つは０．１のピッチゲインに対応し、他の１つは０．９に対応
する２つの曲線が示されている。ピッチゲインおよびピッチ周期のみがピッチ合
成フィルタを特定化するために使用されるので、スペクトルの山や谷の両方でゲ
イン量を同時に制御するのに利用できるＤＣゲインファクタはないことを注意す
る。他の注意すべき点は、１より大なるピッチゲインを許す符合器があることで
ある。理論的には、この結果、不安定なくし形フィルタとなる。しかしながら、
最適化処理が合成信号を原音声信号に一致させようとする方式により、実際には
不安定にはならない。他の視点として、実際には不安定とはならないように設計
されたＦＣＢ出力を考慮するというものがある。

【０１８２】 γ_pに原ピッチゲインｇ_pを掛け算することにより、電力における不安定または
少なくとも好ましくない大きな変動を引き起こす。γ_pを適用することによるく
し形フィルタのスペクトルの山における振幅周波数応答の増加Ｉ_peakは、下式に
より与えられる。

【数２１】

【０１８３】Ｉ_peakの典型的な値は、雑音の多い音声信号において音声が発生されている間
共通であるｇ_pの２つの値に対し図３５に示されている。この図から、スペクト
ルの山で大ゲインが誘起できることが判る。スペクトルの谷が減衰されているこ
とも注意すべきことである。

【０１８４】雑音減衰のレベルが、スペクトルの谷の減衰により達成されるものもある。し
かしながら、同時に、ＬＴＰのスペクトルの山にある雑音は、増幅される。全体
として、このことは、結果的に、ハーモニック特性を有するように形成された雑
音を引き起こす。このようなハーモニック形成雑音は、かなりの量が存在するな
らば、特性上、話者の声を鼻声にし得る。したがって、γ_pを増加（ブースト）
するとき、多大な注意を払うべきである。電力損失を補償する増幅度は、ｇ_p＜
１のときにのみ達成されるべきであり、増幅されたピッチゲインはγ_pｇ_p＜１を
満たすべきである。

【０１８５】好ましくは、ＬＴＰ励振出力における電力損失を補償することができる。この
電力損失の補償を正確に達成するため、γ_pに対する第１の取り得る値は、下式
で計算される。

【数２２】

【０１８６】これは、ときには全ＬＰ励振において不安定を引き起こす。電力損失を補償し
、安定を確保するため、γ_p,1は、γ_p,2＝√(Ｐ_u,ref/Pu)で計算されるγ_p,2と
比較される。しかしながら、これは、Ｐ_uがγ_pに依存するので、試行錯誤処理を
含む。代替えとして、Ｐ_uをＰ_u＝γ_c ²Ｐ_c＋γp²Ｐ_bとして近似する。次に、安定
条件が下式で特定化でき、

【数２３】 γ_pの第２の取り得る値は、下式で与えられる。

【数２４】それから、γ_pは、式（３０）と（３２）における２つの量の最小として決定
されるべきである。結果としてのフィルタが安定であること保証する他のチェッ
クが実行できる。この場合、γ_pは、好ましくは次式として選択される。

【数２５】

【０１８７】しかしながら、不安定の危険性が小さいので、この最後のチェックは、避けて
もよい。さらに、式（３２）における基準は、結果としてのＬＴＰ出力が安定と
なることを保証する。

【０１８８】符号化された領域雑音減少（ＣＤＮＲ）に関する２つの他の実施例を図３６に
関連させて以下に説明する。２つの実施例のうちの１つにおいて、コードブック
ゲインパラメータ（ｇ_c）のみが修正される。第２の実施例において、コードブ
ックゲインおよびピッチゲイン（ｇ_ｐ）はともに修正される。第１実施例は雑音
の低レベルに対して適しており、一方第２実施例は高雑音条件に対して適してい
る。

【０１８９】 [コードブックゲイン減衰器によるＣＤＮＲ] 図３６は、ＣＮＤＲの新規な実施例を示す。音声の各フレームに対応する符号
化された音声パラメータを与えると、符号化されていない音声は、適切な複合器
を用いて再構成される。フレームが音声または無音に対応するか否かを決定する
ため、無音（silence）検出器（音声アクティビティ検出器とも称する）が使用
される。フレームが無音のとき、バックグラウンドの雑音電力が推定される。全
ての時間に対して、信号の全電力が推定される。信号対雑音比を計算する場合の
ように、全電力および雑音電力を用いて、信号における雑音の相対量を推定でき
る。これらの電力推定に基づき、逆量子化コードブックゲインパラメータは、減
衰され、次いで再び量子化される。この新しい量子化コードブックゲインパラメ
ータは、ビットストリームでオリジナルのものを置き換える。

【０１９０】コードブックゲインパラメータの注意深い減衰は、雑音の多い符号化音声の場
合、雑音の減衰をもたらす。多くの減衰方法論が公式化され得る。方法を説明す
る前に、使用される表記についてまず説明する。

【０１９１】雑音の多い非符号化音声、ｙ（ｎ）が下式で与えられるものと仮定する。ｙ（ｎ）＝ｓ（ｎ）＋ｗ（ｎ）（３４）ここで、ｓ（ｎ）はクリーンな非符号化音声であり、ｗ（ｎ）は付加雑音であ
る。電力推定、Ｐ_y（ｎ）およびＰ_w（ｎ）は、それぞれ雑音の多い非符号化音声
電力およびその雑音電力である。図３６において、Ｐ_y（ｎ）は、「全電力推定
」とラベル付けされたブロックで測定され、Ｐ_w（ｎ）は、「雑音電力推定」と
ラベル付けされたブロックで測定される。電力推定は、種々な方法で達成できる
。一例をあげれば、下式により与えられる再帰的アプローチがある。Ｐ_y（ｎ）＝βＰ_y（ｎ）＋（１−β）||ｙ（ｎ）|| ここで、β＝０．９９２そして、雑音に対する同様な式が下式により与えられる。Ｐ_w（ｎ）＝βＰ_w（ｎ）＋（１−β）||ｗ（ｎ）|| ここで、β＝０．９９９７５

【０１９２】コードブックファクタ、ｇ_cは、減衰コードブックゲインファクタを得るため
減衰ファクタγ_cにより掛け算される。γ_cを決定する２つの選択的な代替方法は
下式のようである。

【数２６】

【０１９３】たいていのボコーダにおいて、コードブックゲインパラメータは、すべてのサ
ブフレームで規定される。そのような場合、式は、対応するサブフレームの最後
のサンプル中に計算された電力推定を用いて評価される。上記アプローチの両方
において、減衰ファクタは、非符号化音声の信号対雑音比に依存する。式（３５
）において、μの適切な値は、約１〜１．５である。式（３６）において、μの
適切な値は、０．８である。

【０１９４】 [ゲインファクタの最適化によるＣＤＮＲ] [部分復号化] 信号の複号化は、符号化および複合化操作に使用されるボコーダに依存して全
体または部分に対する。部分復号が満たす状況の例を以下にリストする。

【０１９５】コード励起線形予測（ＣＥＬＰ）ボコーダにおいて、フィルタ後処理は、ＬＰ
Ｃベースモデルを用いて複号化された信号に対し実行される。このフィルタ後処
理は、量子化雑音を減少させる。しかしながら、この処理は電力推定に重大な影
響を及ぼさないのでフィルタ後段階は経済的な観点から避けることができる。

【０１９６】ＧＳＭネットワークにおけるＴＦＯ下で、ＣＤＮＲデバイスは、基地局とスイ
ッチ（Ａインタフェースとして知られる）との間または２つのスイッチ間に置か
れる。音声信号の各８ビットサンプルの６ＭＳＢが図３に示されるようなＰＣＭ
コードに対応するので、この状況下で符号化された音声を全部いっしょに復号化
することを避けることができる。簡単なルックアップテーブルは、Ａ則圧伸テー
ブルを用いて８ビット圧伸サンプルを１３ビット線形音声サンプルに変換するの
に十分である。これは、適切な復号器の助けを借りず音声信号の変形を得るため
の経済的な方法を与えてくれる。このように得られた音声信号は、幾分か雑音を
有するが、電力推定の測定には十分であることが判ってきたことは注意すべき点
である。

【０１９７】 [符号化パラメータ修正] [最小遅延技術] 大バッファリング、処理および転送の遅延は、ネットワーク音声品質強化処理
を持たないセルラネットワーク内にすでに存在する。音声強化目的のための符号
化音声の他のネットワーク処理は、さらなる遅延を加える。この遅延を最小にす
ることは、音声品質にとって重要である。このセクションにおいて、この遅延を
最小にする新規なアプローチが論じられる。例に用いたのはＧＳＭＦＲボコーダ
である。

【０１９８】図７は、ＧＳＭＦＲ復号器から符号化されたパラメータが受信される順を示す
。まっすぐなアプローチは、各フレームに対し全２６０ビットまでのバッファリ
ングと、それから、符号化された領域エコー制御の目的のためのこれらのバッフ
ァされたビットの処理と、を含む。しかしながら、これは、処理遅延に加えて、
約２０ｍｓのバッファリング遅延を引き起こす。

【０１９９】バッファリング遅延を以下のように最小化することができる。まず、ビット９
２が受信されるや否や第１サブフレームが全て復号化できることを注意する。そ
れゆえ、第１サブフレームは、バッファリングの遅延の約７．１ｍｓ（２０ｍｓ
×９２／２６０）後に処理できる。したがって、バッファリング遅延は、約１３
ｍｓだけ減少される。

【０２００】この新規な低遅延アプローチを用いるとき、符号化されたＬＰＣ合成フィルタ
パラメータはフレームの第１サブフレームの最後で利用可能な情報に基づき修正
される。換言すれば、全フレームは、第１サブフレームに基づき計算されたエコ
ーの可能性により影響される。試行された実験において、この「早い」決定によ
る顕著なアーチファクトは見つからなかった。

【０２０１】 [エラー修正／検出ビットおよびフレーミングビットの更新] この明細書に記載した雑音を除去または低減する新規な符号化領域処理技術を
適用するとき、符号化されたパラメータに対応するビットの全てがビットストリ
ームで修正されるものがある。これは、ビットストリームに埋め込まれ得る他の
誤り訂正または検出のビットに影響を及ぼす。例えば、音声符号器は、エラーの
ないフレームが受信されることの保証を確認するため復号器に対するビットスト
リーム内にチェックサムを埋込むことができる。このようなチェックサムは、何
等かのパリティチェックビット、誤り訂正または検出ビットおよびフレームビッ
ト同様、必要ならば、適切な標準にしたがって更新される。

【０２０２】図３８は、コードブックベクトルパラメータの修正による符号化領域雑音の低
減技術を示す。好ましいモードにおいて、雑音低減は、２つの段階で遂行される
。第１の段階は、先に説明したコードブックゲインの修正を含む。

【０２０３】第２段階において、コードブックベクトルは、雑音を最小にするため最適化さ
れる。本質において、各サブフレームに対し、原受信コードブックベクトルから
変化される数個のコードブックベクトルパターンが試行される。各コードブック
ベクトルパターンに対し部分復号化が遂行され、雑音電力が推定される。最善の
コードブックベクトルパターンは、雑音電力を最小化するものとして決定される
。実際上、一定回反復または試行が遂行される。

【０２０４】例えば、ＧＳＭＦＲボコーダ（参照［１］）において、各サブフレームに対す
るコードブックベクトルパターンは、４０の位置をもち、そのうち１３の位置は
零でないパルスを含む。好ましいモードにおいて、１３の零でないパルスの位置
は修正されない。これらの増幅度のみが各トライアルにおいて変化する。零でな
いパルスは、ｘ_M（ｉ），ｉ＝０，１，２，…，１２で表記される。各パルスが
次の増幅度：±２８６７２，±２０４８０，±１２２８８，±４０９６の１つの
みをもつことを注意する。コードベクトル最適化を以下のステップにより説明す
る。

【０２０５】原コードブックベクトル、修正されたコードブックゲインパラメータおよび原
パラメータの残りを用いて信号の部分復号化を行う。復号化された信号における雑音電力を推定し、この値を保存する。ｉ＝０，ｊ＝１を設定する。

【０２０６】原コードブックベクトルにおいて、修正されたコードブックベクトルを得るよ
うに、より小さいが同一サインの増幅度のｊレベルとなるように、第ｉ番目のパ
ルスｘ_M（ｉ）を修正する。所与のサインに対しすでに最低レベルであるなら、
そのサインを交換する。

【０２０７】修正されたコードブックベクトル、修正されたコードブックゲインパラメータ
および原パラメータの残りを用いて、その信号の部分符号化を行う。復号化された信号における雑音電力を推定し、その値を保存する。ｉ＝１，２，…，１２に対しステップ２〜４を繰返す。ｉ＝０，ｊ＝２を設定し、ｊのこの新しい値に対しステップ２〜５を繰返す。

【０２０８】この時点で、部分復号化は、２７回実行されたことになる。雑音量の最小化を
もたらしたコードブックベクトルを選ぶ。

【０２０９】コードブックベクトルの最適化のための上記サーチ技術を修正し、あるいはコ
ードブック励起線形予測（ＣＥＬＰ）ボコーダで使用されるような他のコードブ
ックベクトルサーチ技術を実施することは簡単なことである。

【０２１０】 [ＬＰＣパラメータの表現の修正によるＣＤＮＲ] ＬＰＣパラメータの表現のため一般的に使用される技術を一例として考慮する
。ラインスペクトル対（ＬＳＰs）または周波数（ＬＳＦs）と称するこの表現は
、量子化、安定性および解釈（interpretation）の点で良好な特性をもつので多
くのボコーダ、例えばＧＳＭＥＦＲにおいて広く使用されるようになった。ＬＳ
Ｆsは、ＬＰＣパラメータの擬似周波数表現である。これにより、量子化技術を
知覚的に重要であるものとして知られたスペクトル特性に関する情報と一体化で
きる。ＬＳＦsの他の利点は、ＬＰＣ合成フィルタの円滑なフレーム対フレーム
補間を促進することにある。

【０２１１】他の例として、ＬＰＣパラメータはまた、ＧＳＭＦＲボコーダにおける対数領
域比により表現される。

【０２１２】ＬＳＦsを、音声強化の目的のため直接修正できる。符号化された領域雑音低
減システムにおいて使用するため所望の周波数応答を達成すべく、直接ＬＳＦs
を適合させる技術を以下に説明する。この一般的な技術は、例えばＧＳＭＥＦＲ
符号器から受信したＬＳＦsを修正するために適用できる。

【０２１３】符号化された領域雑音低減技術において、適用技術は、スペクトルサブトラク
ション原理により所望のスペクトルを達成するため、ＬＳＦsのタームで表現さ
れる、ＬＰＣ合成フィルタのスペクトル形状（次式）を変更するために使用でき
る。

【数２７】

【０２１４】ＬＰＣ合成フィルタ伝達関数の分母の多項式、

【数２８】は係数ｐを有し、次に非対称および対称多項式が次式により導かれる。

【数２９】Ａ（ｚ）が、Ａ（ｚ）＝１／２［Ｐ（ｚ）＋Ｑ（ｚ）］で戻されることを注意
する。

【０２１５】これらの補助多項式の根は、ＬＳＰsであり、これらの角周波数はＬＳＦsと称
する。基本的に、各多項式は、格子構造から導かれる（ｐ＋１）番目の予測器の
伝達関数として考えることができる。これらの予測器の各々の第１のｐ段階は、
Ａ（ｚ）と同一応答を有する。Ｐ（ｚ）およびＱ（ｚ）は、それぞれが反射係数
−１および＋１を有するもう一つの段階を有する。

【０２１６】これらの補助多項式は、興味深い特性を有する。Ａ（ｚ）に最小位相を与える
と、Ｐ（ｚ）およびＱ（ｚ）の２つの重要な特性が証明される。第１に、これら
の両方の多項式の零点は単位円上にある。第２に、Ｐ（ｚ）およびＱ（ｚ）の零
点が交互に組合（interlace）される。さらに、量子化処理を介して零点が交互
に組合されたまま残されると、最小位相であることが保証されたＡ（ｚ）が得ら
れる。

【０２１７】これらの有用な特性に加えて、ＬＳＦsは量子化技術の設計にしばしば役立つ
擬似周波数変換（interpretation）を有する。図３９はランダムに発生されたＬ
ＳＦsの組および１０の係数を有する対応する線形予測器の周波数応答を示す。
実線の縦線は、Ｐ（ｚ）の根の角度を示し、一方破線はＱ（ｚ）の根の角度を示
す。これらの角度が、全てが単位円上にあるこれらの多項式のルートを完全に特
定することを注意する。

【０２１８】ＬＳＦsのゆるやかなスペクトル変換（interpretation）は、鋭い谷がＬＳＦs
により除外される傾向にあることを観察することから生じる。したがって、音声
において知覚的に需要である、ＬＰＣ合成フィルタ１／Ａ（ｚ）の各フォーマン
ト領域の鋭い山は、接近した間隔をもった一対のＬＳＦsに対応する傾向がある
。

【０２１９】さて、所望のスペクトル応答を達成するため、ＬＳＦsの直接適合のための新
規な技術を導く。ｐの偶数オーダのみに議論を留めておく。これは、音声符号器
が通常偶数オーダのＡ（ｚ）関数を用いるので、主な制限ではない。Ａ（ｚ）に
おける係数に奇数を使用することは、通常ＤＣ成分が音声処理および符号化の前
に取り除かれるので、無駄となる。

【０２２０】第１に、多項式、Ｐ（ｚ）およびＱ（ｚ）が下式のように因数分解される。

【数３０】ここで、ｃ_i＝−２ｃｏｓθ_c,iかつｄ_i＝−２ｃｏｓθ_d,iである。 {θ_c,i，θ_d,i}は、ラジアンにおいて特定化されたＬＳＦsである。{ｃ_i，ｄ_i}
は、コサイン領域におけるＬＳＦsと呼ばれる。Ａ（ｚ）が最小位相のとき、Ｌ
ＳＦsが適切にソートされ、ラベル付けされていれば、０≦θ_c,1＜θ_d,1＜θ_c,2＜θ_d,2＜…＜θ_c,p/2＜θ_d,p/2≦π が真であることを注意する。

【０２２１】Ａ（ｚ）の周波数応答を平方した電力または振幅は、下式で表される。｜Ａ（ω）｜²＝０．２５｜Ｐ（ω）｜²＋０．２５｜Ｑ（ω）｜² ここで、｜Ｐ（ω）｜²と｜Ｑ（ω）｜²は、下式で与えられる。

【数３１】

【０２２２】次に、コサイン領域、{ｃ_i，ｄ_i}におけるＬＳＦsに適合させるため、最も急
勾配の下降方法を用いて一組の周波数{ω_k}で特定される電力周波数応答を達成
する。特定電力周波数応答が、Ｎ個の異なる周波数で｛Ａ_k ²｝で与えられるもの
と仮定する。次に、｛Ａ_k ²｝と、{ｃ_i，ｄ_i}の関数としての周波数{ω_k}でのＡ
（ｚ）における実際の電力周波数応答｛｜Ａ（ω_k）｜²｝との間で二乗誤差につ
いて記す。この誤差関数は、下式で表される。

【数３２】

【０２２３】最も急勾配の下降方法によれば、下式の第ｎ番目の反復における値により、（
ｎ＋１）番目の反復におけるコサイン領域でのＬＳＦsを更新できる。

【数３３】ここで、μは適切なステップサイズパラメータである。好ましいモードにおいて、μの値は、０．００００２に設定される。

【０２２４】符号化パラメータを直接修正する方法、特にＬＰＣパラメータの表現であるラ
インスペクトル周波数を説明してきた。この方法を用いて、ＬＰＣ合成フィルタ
の周波数応答は、所望の周波数応答をもつように修正できる。雑音低減の目的の
ため、ＬＰＣ合成フィルタの所望の周波数応答は、例えばスペクトルサブトラク
ションのような標準の雑音低減技術に基づいて計算できる。要約すると、圧縮コ
ードパラメータは、雑音の影響を低減すべく修正される。より特定的には、ＬＰ
Ｃ係数またはこれらの表現（例えばラインスペクトル周波数または対数−弧（lo
g-arc）比の１つが、雑音により影響されるスペクトル領域における雑音を低減
すべく修正される。

【０２２５】通信分野における通常の知識を有する者が、上述した好ましい実施例が、特許
請求の範囲において規定した本発明の真の精神および範囲から逸脱することなく
、修正もしくは変更できることは認識すべきである。例えば、明細書に記載した
ＡＬＣ技術はまたＮＲ技術に応用される。

【図面の簡単な説明】

【図１】ＧＳＭディジタル・セルラ・ネットワーク内の音声伝送用システムの概略的ブ
ロック図である。

【図２】タンデム・フリー・オペレーション（ＴＦＯ）下でのＧＳＭネットワーク内の
音声伝送用システムの概略的ブロック図である。

【図３】タンデム・フリー・オペレーション（ＴＦＯ）下での音声伝送を示すグラフで
ある。

【図４】スペクトルサブトラクションを用いた従来の雑音低減アプローチの概略的ブロ
ック図である。

【図５】従来のアプローチを用いる符号化音声の雑音低減を示す概略的ブロック図であ
る。

【図６】包括的なＬＰＣ音声合成モデル又は音声復号化モデルの概略的ブロック図であ
る。

【図７】ＧＳＭＦＲのビットストリーム内の符号化されたパラメータの構成を示すブロ
ック図である。

【図８】符号化領域ディジタル音声パラメータを線形領域ディジタル音声サンプルから
区別する概略的ブロック図である。

【図９】ブロック最大のフルレートＣＯＤＥＣ量子化を示すグラフである。

【図１０ａ】後方適応標準偏差ベース量子化器の概略的ブロック図である。

【図１０ｂ】後方適応差分ベース量子化器の概略的ブロック図である。

【図１１】線形予測器を用いる適応差分量子化器の概略的ブロック図である。

【図１２】ＧＳＭ強化フルレートコードブックゲイン（パラメータに関係する音声レベル
）量子化器の概略的ブロック図である。

【図１３】ゲイン修正ファクタのＧＳＭ強化フルレート量子化レベルを示すグラフである
。

【図１４】符号化領域ＡＬＣの一つの技術の概略的ブロック図である。

【図１５】オーバフロー／アンダーフローの防止のための技術を示す流れ図である。

【図１６】過去のゲイン値を要求するＡＬＣアルゴリズムにおいて実現されたゲインのフ
ィードバックを用いるＡＬＣシステムの好ましい形態の概略的ブロック図である
。

【図１７】符号化領域のＡＬＣ装置の一つの形態の概略的ブロック図である。

【図１８】ＧＳＭＦＲコーデックの瞬時スカラー再量子化のためのシステムの概略的
ブロック図である。

【図１９】ＧＳＭＥＦＲコーデックのための差分スカラー再量子化システムの概略的
ブロック図である。

【図２０ａ】所望のゲインにおけるステップを示すグラフである。

【図２０ｂ】フィードバック・ループ内の量子化器で所望のゲインに重ね合わせられた実際
に実現されたゲインを示すグラフである。

【図２０ｃ】図１９に示したフィードバック・ループの外側に量子化器を配置することによ
り得られる、所望のゲインに重ね合わせられた実際に実現されたゲインを示すグ
ラフである。

【図２１】フィードバック・ループの外側に配置された量子化器を示すＡＬＣ装置の概略
的ブロック図である。

【図２２】図２１に示したＡＬＣ装置の簡素化されたバージョンの概略的ブロック図であ
る。

【図２３ａ】フィードバック・ループ内の量子化器で過去のゲイン値のフィードバックを用
いるＡＬＣアルゴリズムのための符号化領域ＡＬＣ実行の概略的ブロック図であ
る。

【図２３ｂ】フィードバック・ループの外側の量子化器で過去のゲイン値のフィードバック
を用いるＡＬＣアルゴリズムのための符号化領域ＡＬＣ実行の概略的ブロック図
である。

【図２４】ＥＦＲ符号内の隣接Ｒ_ｊ値の間の間隔を示し、特にｉに対するＥＦＲ符号ＳＬ
ＲＰｓ：（Ｒ_ｉ＋１−Ｒ_ｉ）を示すグラフである。

【図２５ａ】各種のビットが受信される時間と、バッファが左から右に満たされるときのサ
ンプルの最先の可能なデコーディングとを示すＥＦＲ符号器の圧縮音声フレーム
の図である。

【図２５ｂ】各種のビットが受信される時間と、バッファが左から右に満たされるときのサ
ンプルの最先の可能なデコーディングとを示すＥＦＲ符号器の圧縮音声フレーム
の図である。

【図２６】単一帯域線形領域雑音低減技術を示す概略的ブロック図である。

【図２７】差分スカラー量子化技術の概略的ブロック図である。

【図２８】差分量子化パラメータの差分最量子化のシステムの概略的ブロック図である。

【図２９】差分量子化によって起きる反響音を示すグラフである。

【図３０】反響音のない差分再量子化のシステムの概略的ブロック図である。

【図３１】反響音のない簡素化された差分再量子化の簡素化されたシステムの概略的ブロ
ック図である。

【図３２】音声合成の二重ソース図の概略的ブロック図である。

【図３３】ネットワーク雑音低減の好ましい形態の概略的ブロック図である。

【図３４】くし形フィルタの振幅周波数応答を示すグラフである。

【図３５】ピッチゲイン制御によるくし形フィルタにおけるスペクトルピーク応答の増大
を示すグラフである。

【図３６】コードブックゲイン減衰を用いる符号化領域の雑音低減システムの一つの好適
な形態の概略的ブロック図である。

【図３７】本発明による符号化領域の雑音低減方法の一つの好適な形態の概略的ブロック
図である。

【図３８】コードブックベクトルパラメータの変形による符号化領域雑音低減のシステム
の概略的ブロック図である。

【図３９】線スペクトル周波数のスペクトル判定を示すグラフである。

【手続補正書】

【提出日】平成１４年１月２３日（２００２．１．２３）

【手続補正２】

【補正対象書類名】図面

【補正対象項目名】図１

【補正方法】変更

【補正の内容】

【図１】

【手続補正３】

【補正対象書類名】図面

【補正対象項目名】図２

【補正方法】変更

【補正の内容】

【図２】

【手続補正４】

【補正対象書類名】図面

【補正対象項目名】図３

【補正方法】変更

【補正の内容】

【図３】

【手続補正５】

【補正対象書類名】図面

【補正対象項目名】図４

【補正方法】変更

【補正の内容】

【図４】

【手続補正６】

【補正対象書類名】図面

【補正対象項目名】図５

【補正方法】変更

【補正の内容】

【図５】

【手続補正７】

【補正対象書類名】図面

【補正対象項目名】図６

【補正方法】変更

【補正の内容】

【図６】

【手続補正８】

【補正対象書類名】図面

【補正対象項目名】図７

【補正方法】変更

【補正の内容】

【図７】

【手続補正９】

【補正対象書類名】図面

【補正対象項目名】図８

【補正方法】変更

【補正の内容】

【図８】

【手続補正１０】

【補正対象書類名】図面

【補正対象項目名】図９

【補正方法】変更

【補正の内容】

【図９】

【手続補正１１】

【補正対象書類名】図面

【補正対象項目名】図１０Ａ

【補正方法】変更

【補正の内容】

【図１０Ａ】

【手続補正１２】

【補正対象書類名】図面

【補正対象項目名】図１０Ｂ

【補正方法】変更

【補正の内容】

【図１０Ｂ】

【手続補正１３】

【補正対象書類名】図面

【補正対象項目名】図１１

【補正方法】変更

【補正の内容】

【図１１】

【手続補正１４】

【補正対象書類名】図面

【補正対象項目名】図１２

【補正方法】変更

【補正の内容】

【図１２】

【手続補正１５】

【補正対象書類名】図面

【補正対象項目名】図１３

【補正方法】変更

【補正の内容】

【図１３】

【手続補正１６】

【補正対象書類名】図面

【補正対象項目名】図１４

【補正方法】変更

【補正の内容】

【図１４】

【手続補正１７】

【補正対象書類名】図面

【補正対象項目名】図１５

【補正方法】変更

【補正の内容】

【図１５】

【手続補正１８】

【補正対象書類名】図面

【補正対象項目名】図１６

【補正方法】変更

【補正の内容】

【図１６】

【手続補正１９】

【補正対象書類名】図面

【補正対象項目名】図１７

【補正方法】変更

【補正の内容】

【図１７】

【手続補正２０】

【補正対象書類名】図面

【補正対象項目名】図１８

【補正方法】変更

【補正の内容】

【図１８】

【手続補正２１】

【補正対象書類名】図面

【補正対象項目名】図１９

【補正方法】変更

【補正の内容】

【図１９】

【手続補正２２】

【補正対象書類名】図面

【補正対象項目名】図２０ａ

【補正方法】変更

【補正の内容】

【図２０ａ】

【手続補正２３】

【補正対象書類名】図面

【補正対象項目名】図２０ｂ

【補正方法】変更

【補正の内容】

【図２０ｂ】

【手続補正２４】

【補正対象書類名】図面

【補正対象項目名】図２０ｃ

【補正方法】変更

【補正の内容】

【図２０ｃ】

【手続補正２５】

【補正対象書類名】図面

【補正対象項目名】図２１

【補正方法】変更

【補正の内容】

【図２１】

【手続補正２６】

【補正対象書類名】図面

【補正対象項目名】図２２

【補正方法】変更

【補正の内容】

【図２２】

【手続補正２７】

【補正対象書類名】図面

【補正対象項目名】図２３ａ

【補正方法】変更

【補正の内容】

【図２３ａ】

【手続補正２８】

【補正対象書類名】図面

【補正対象項目名】図２３ｂ

【補正方法】変更

【補正の内容】

【図２３ｂ】

【手続補正２９】

【補正対象書類名】図面

【補正対象項目名】図２５ａ

【補正方法】変更

【補正の内容】

【図２５ａ】

【手続補正３０】

【補正対象書類名】図面

【補正対象項目名】図２５ｂ

【補正方法】変更

【補正の内容】

【図２５ｂ】

【手続補正３１】

【補正対象書類名】図面

【補正対象項目名】図２６

【補正方法】変更

【補正の内容】

【図２６】

【手続補正３２】

【補正対象書類名】図面

【補正対象項目名】図２７

【補正方法】変更

【補正の内容】

【図２７】

【手続補正３３】

【補正対象書類名】図面

【補正対象項目名】図２８

【補正方法】変更

【補正の内容】

【図２８】

【手続補正３４】

【補正対象書類名】図面

【補正対象項目名】図２９ａ

【補正方法】変更

【補正の内容】

【図２９ａ】

【手続補正３５】

【補正対象書類名】図面

【補正対象項目名】図２９ｂ

【補正方法】変更

【補正の内容】

【図２９ｂ】

【手続補正３６】

【補正対象書類名】図面

【補正対象項目名】図２９ｃ

【補正方法】変更

【補正の内容】

【図２９ｃ】

【手続補正３７】

【補正対象書類名】図面

【補正対象項目名】図３０

【補正方法】変更

【補正の内容】

【図３０】

【手続補正３８】

【補正対象書類名】図面

【補正対象項目名】図３１

【補正方法】変更

【補正の内容】

【図３１】

【手続補正３９】

【補正対象書類名】図面

【補正対象項目名】図３２

【補正方法】変更

【補正の内容】

【図３２】

【手続補正４０】

【補正対象書類名】図面

【補正対象項目名】図３３

【補正方法】変更

【補正の内容】

【図３３】

【手続補正４１】

【補正対象書類名】図面

【補正対象項目名】図３４

【補正方法】変更

【補正の内容】

【図３４】

【手続補正４２】

【補正対象書類名】図面

【補正対象項目名】図３５

【補正方法】変更

【補正の内容】

【図３５】

【手続補正４３】

【補正対象書類名】図面

【補正対象項目名】図３６

【補正方法】変更

【補正の内容】

【図３６】

【手続補正４４】

【補正対象書類名】図面

【補正対象項目名】図３７

【補正方法】変更

【補正の内容】

【図３７】

【手続補正４５】

【補正対象書類名】図面

【補正対象項目名】図３８

【補正方法】変更

【補正の内容】

【図３８】

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｂ 14/04 Ｇ１０Ｌ 9/14 Ｊ (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＭＺ，ＳＤ，ＳＬ，ＳＺ，ＴＺ，ＵＧ，ＺＷ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＧ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＢＺ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＤＺ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＡ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＭＺ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＴＺ，ＵＡ，ＵＧ，ＵＳ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷＦターム(参考） 5D045 AB26 DA02 5J064 AA00 BA04 BA13 BB07 BC02 BC08 BC09 BC11 BC16 BC17 BC19 BC28 BD02 5K041 AA05 BB02 CC01 EE24 EE38 HH11 JJ38

Claims

【特許請求の範囲】

【請求項１】複数のパラメータはオーディオ信号であり、前記オーディオ
信号は雑音特性を含む複数のオーディオ特性を有しており、圧縮符号は複数の復
号化ステップにより復号化可能であり、第１のパラメータを含む所定の前記複数
のパラメータを備えた前記圧縮符号を用いてディジタル信号を送信するための通
信システムにおいて、前記ディジタル信号の圧縮符号に応答して少なくとも前記第１のパラメータを
読み出し、前記圧縮符号及び前記第１のパラメータに応答して調整された第１の
パラメータを生成し、前記第１のパラメータを前記調整された第１のパラメータ
で置き換える、プロセッサを備える、前記雑音を管理する装置。
【請求項２】前記プロセッサは、第１の復号化ステップを実行して第１の
デコーダ信号を生成してその結果雑音のある音声信号を得、第２の復号化ステッ
プを実行して第２のデコーダ信号を生成してその結果推定された雑音のない音声
信号を得ることにより、前記複数の復号化ステップを実行し、前記プロセッサは
、少なくとも前記第１のデコーダ信号と前記第２のデコーダ信号と前記第１のパ
ラメータとに応答して前記調整された第１のパラメータを生成する、請求項１記
載の装置。
【請求項３】前記第１のパラメータはコードブックゲインを備え、前記プ
ロセッサは前記コードブックゲインを修正して、前記雑音特性に対するコードブ
ックベクトルの寄与度を修正する、請求項１記載の装置。
【請求項４】前記第１のパラメータはコードブックゲインを備え、前記複
数のパラメータは更にピッチゲインを備え、前記複数の特性は更に信号対雑音比
を備え、前記プロセッサは前記コードブックゲイン、前記ピッチゲイン及び前記
信号対雑音比に応答して前記調整された第１のパラメータを生成し、前記調整さ
れた第１のパラメータは調整されたコードブックゲインを備える、請求項１記載
の装置。
【請求項５】前記信号対雑音比は雑音のある信号電力と前記オーディオ信
号の雑音電力とに関与している比を備えている、請求項４記載の装置。
【請求項６】前記第１のパラメータはピッチゲインを備え、前記複数のパ
ラメータは更にコードブックゲインを備え、前記プロセッサはコードブックベク
トルを生成することにより前記複数の復号化ステップを実行し、前記プロセッサ
は前記コードブックゲインによって前記コードブックベクトルをスケーリングし
てスケーリングされたコードブックベクトルを生成し、前記プロセッサは前記ス
ケーリングされたコードブックベクトルに応答してピッチ周期に基づく第１の複
数のサンプルを生成する少なくとも第１のバッファを備え、前記プロセッサは前
記ピッチゲインによって前記第１のサンプルをスケーリングして第１のスケーリ
ングされたサンプルを生成し、前記プロセッサは、前記雑音特性を管理するため
に、前記ピッチゲインを修正して前記第１のスケーリングされたサンプルの寄与
度を修正する、請求項１記載の装置。
【請求項７】前記第１のパラメータはピッチゲインを備え、前記複数の特
性は更に信号対雑音比を備え、前記プロセッサは前記ピッチゲイン及び前記信号
対雑音比に応答して前記調整された第１のパラメータを生成し、前記調整された
第１のパラメータは調整されたピッチゲインを備える、請求項１記載の装置。
【請求項８】前記信号対雑音比は、雑音のある信号電力と前記オーディオ
信号の雑音電力とに関与している比を備える、請求項７記載の装置。
【請求項９】前記第１のパラメータはピッチゲインを備え、前記複数のパ
ラメータは更にコードブックゲインを備え、前記プロセッサは、前記複数の復号
化ステップを実行してコードブックベクトルを生成し、前記プロセッサは前記コ
ードブックゲインによって前記コードブックベクトルをスケーリングしてスケー
リングされたコードブックベクトルを生成し、前記プロセッサは前記スケーリン
グされたコードブックベクトルの電力を表す電力信号を生成し、前記プロセッサ
は前記ピッチゲイン及び前記電力信号に応答して前記調整された第１のパラメー
タを生成し、前記調整された第１のパラメータは調整されたピッチゲインを備え
ている、請求項１記載の装置。
【請求項１０】前記第１のパラメータはピッチゲインを備え、前記プロセ
ッサはピッチ周期に基づいて少なくとも第１のサンプルを生成する少なくとも第
１のバッファを備え、前記プロセッサは前記ピッチゲインによって前記第１のサ
ンプルをスケーリングして少なくとも第１のスケーリングされたサンプルを生成
し、前記プロセッサは前記第１のスケーリングサンプルの電力を表す第１の電力
信号を生成し、前記プロセッサは少なくとも前記ピッチゲイン及び前記第１の電
力信号に応答して前記調整された第１のパラメータを生成し、前記調整された第
１のパラメータは調整されたピッチゲインを備える、請求項１記載の装置。
【請求項１１】前記プロセッサは前記第１の電力信号に部分的に応答して
ピッチ周期に基づいて第２のサンプルを生成する第２のバッファを備え、前記プ
ロセッサは前記ピッチゲインにより前記第２のサンプルをスケーリングして第２
のスケーリングされたサンプルを生成し、前記プロセッサは前記第２のスケーリ
ングされたサンプルの電力を表す第２の電力信号を生成し、前記プロセッサは前
記ピッチゲイン、前記第１の電力信号及び前記第２の電力信号に応答して前記調
整された第１のパラメータを生成する、請求項１０記載の装置。
【請求項１２】前記第１のバッファ及び前記第２のバッファはそれぞれ、
長時間予測バッファを備えている、請求項１１記載の装置。
【請求項１３】前記第１のパラメータはピッチゲインを備え、前記複数の
パラメータは更にコードブックゲインを備え、前記プロセッサはピッチ合成フィ
ルタを備え、前記プロセッサは前記複数の復号化ステップを実行して第１のベク
トルを生成し、前記プロセッサは前記コードブックゲインによって前記第１のベ
クトルをスケーリングしてスケーリングされたコードブックベクトルを生成し、
前記プロセッサは前記第１のベクトルの電力を表す電力信号を生成し、前記ピッ
チゲインおよび前記電力信号に応答して前記調整された第１のパラメータを生成
し、そして前記調整された第１のパラメータは調整されたピッチゲインを備える
、請求項１記載の装置。
【請求項１４】前記第１のベクトルはコードブック励振ベクトルを備え、
前記第２のベクトルはＬＰＣ励振ベクトルを備える、請求項１３記載の装置。
【請求項１５】前記第１のパラメータは振幅の可変セットを用いるパルス
を備えるコードブックベクトルを備え、前記プロセッサは前記セットを分析して
前記セットにより表される前記雑音特性の電力を識別し、前記プロセッサは第１
のセット以外の前記セットにより表される電力より少ない電力を表す前記第１の
セットを識別し、そして前記プロセッサは前記パルスを前記第１のセットにした
がって調整して前記調整されたパラメータを生成する、請求項１記載の装置。
【請求項１６】前記複数の復号化ステップは更に実質的に雑音特性の管理
に影響を与えない少なくとも一つの復号化ステップを備え、前記プロセッサは前
記少なくとも一つの復号化ステップの実行を避ける、請求項１記載の装置。
【請求項１７】前記少なくとも一つの復号化ステップはポスト・フィルタ
リングを備える、請求項１６記載の装置。
【請求項１８】前記圧縮符号は線形予測符号を備える、請求項１記載の装
置。
【請求項１９】前記圧縮符号は正規パルス励振−長時間予測符号を備える
、請求項１記載の装置。
【請求項２０】前記圧縮符号は符号励振線形予測符号を備える、請求項１
記載の装置。
【請求項２１】前記第１のパラメータは量子化された第１のパラメータで
あり、前記プロセッサは、前記第１のパラメータを前記調整された第１のパラメ
ータで置換する前に、部分的に前記調整された第１のパラメータを量子化するこ
とにより前記調整された第１のパラメータを生成する、請求項１記載の装置。
【請求項２２】前記圧縮符号は前記ディジタル信号のフレーム内に配置さ
れ、前記フレームは複数のサブフレームを備え、該サブフレームの各々は前記第
１のパラメータを備え、前記プロセッサは前記圧縮符号に応答して前記複数のサ
ブフレームの各々から少なくとも前記第１のパラメータを読み出し、そして前記
プロセッサは前記第１のパラメータを前記複数のサブフレームの各々の中の前記
調整された第１のパラメータで置換する、請求項１記載の装置。
【請求項２３】前記プロセッサは、第１のサブフレームに続くサブフレー
ムを処理する前に前記第１のパラメータを前記調整された第１のパラメータで置
換してより少ない遅延を達成する、請求項２２記載の装置。
【請求項２４】前記圧縮符号は前記ディジタル信号のフレーム内に配置さ
れ、前記フレームは複数のサブフレームを備え、該サブフレームの各々は前記第
１のパラメータを備え、前記プロセッサは前記サブフレームの最初の間に前記復
号化ステップを実行して複数の前記復号化信号を生成し、前記第１のサブフレー
ムに続いて生じる前記サブフレームの２番目から前記第１のパラメータを読み出
し、前記複合化信号および前記第１のパラメータに応答して前記調整された第１
のパラメータを生成し、そして前記第２のサブフレームの前記第１のパラメータ
を前記調整された第１のパラメータで置換する、請求項１記載の装置。
【請求項２５】前記プロセッサは前記圧縮符号に応答して複数の前記復号
化ステップの少なくとも一つを実行して復号化信号を生成し、前記プロセッサは
前記復号化信号及び前記第１のパラメータに応答して前記調整された第１のパラ
メータを生成する、請求項１記載の装置。
【請求項２６】前記第１のパラメータは、コードブックベクトル、コード
ブックゲイン、ピッチゲイン、及び線スペクトル周波数及び対数領域比を含むＬ
ＰＣ係数表示、から成るグループから選択される、請求項１記載の装置。
【請求項２７】前記オーディオ信号は前記雑音特性により影響されるスペ
クトル領域を有し、前記第１のパラメータはＬＰＣ係数の表示を備え、前記プロ
セッサは前記圧縮符号及び前記表示に応答して雑音に影響される前記スペクトル
領域を決定し、且つ、前記調整された第１のパラメータを生成して、前記領域内
の前記雑音特性を管理し、前記調整された第１のパラメータはＬＰＣ係数の調整
された表示を備える、請求項１記載の装置。
【請求項２８】前記ＬＰＣ係数の表示は線スペクトル周波数及びログエリ
ア比からなるグループから選択される、請求項２７記載の装置。
【請求項２９】符号サンプルは圧縮符号を用いる第１のビットと線形符号
を用いる第２のビットとを備え、前記符号サンプルはオーディオ信号を表し、前
記オーディオ信号は雑音特性を含む複数のオーディオ特性を有する、前記符号サ
ンプルを備えるディジタル信号を送信する通信システムにおいて、前記第２のビットに応答して前記第１のビット及び前記第２のビットを調整し
、それにより前記ディジタル信号内の雑音特性が制御される、前記圧縮符号の復
号化をしないで雑音特性を管理する装置。
【請求項３０】前記線形符号はパルス符号変調（ＰＣＭ）符号を備える、
請求項２９記載の装置。
【請求項３１】前記圧縮符号サンプルは、移動体通信標準のためのグロー
バルシステムのタンデムフリー動作に適合する、請求項２９記載の装置。
【請求項３２】前記第１のビットは前記サンプルの２つの最下位ビットを
備え、前記第２のビットは前記サンプルの６個の最上位ビットを備える、請求項
２９記載の装置。
【請求項３３】前記６個の最上位ビットはＰＣＭ符号を備える、請求項３
２記載の装置。
【請求項３４】複数のパラメータはオーディオ信号であり、前記オーディ
オ信号は雑音特性を含む複数のオーディオ特性を有しており、圧縮符号は複数の
復号化ステップにより復号化可能であり、第１のパラメータを含む所定の前記複
数のパラメータを備えた前記圧縮符号を用いてディジタル信号を送信するための
通信システムにおいて、少なくとも前記第１のパラメータを読み出すこと、前記圧縮符号及び前記第１のパラメータに応答して調整された第１のパラメー
タを生成すること、及び前記第１のパラメータを前記調整された第１のパラメータで置換すること、を備える、雑音特性を管理する方法。
【請求項３５】第１の復号化ステップを実行して第１のデコーダ信号を生
成してその結果雑音のある音声信号を得、第２の復号化ステップを実行して第２
のデコーダ信号を生成してその結果推定された雑音のない音声信号を得ることに
より、前記複数の復号化ステップを実行すること、及び少なくとも前記第１のデコーダ信号と前記第２のデコーダ信号と前記第１のパ
ラメータとに応答して前記調整された第１のパラメータを生成すること、をさらに備える、請求項３４記載の方法。
【請求項３６】前記第１のパラメータはコードブックゲインを備え、前記
方法は前記コードブックゲインを修正して、前記雑音特性に対するコードブック
ベクトルの寄与度を修正すること、をさらに備える請求項３４記載の方法。
【請求項３７】前記第１のパラメータはコードブックゲインを備え、前記
複数のパラメータは更にピッチゲインを備え、前記複数の特性は更に信号対雑音
比を備え、前記生成することは、前記コードブックゲイン、前記ピッチゲイン及
び前記信号対雑音比に応答して前記調整された第１のパラメータを生成すること
を備え、前記調整された第１のパラメータは調整されたコードブックゲインを備
える、請求項３４記載の方法。
【請求項３８】前記信号対雑音比は雑音のある信号電力と前記オーディオ
信号の雑音電力とに関与している比を備えている、請求項３７記載の方法。
【請求項３９】前記第１のパラメータはピッチゲインを備え、前記複数の
パラメータは更にコードブックゲインを備え、前記生成することは、コードブッ
クベクトルを生成することにより前記複数の復号化ステップを実行すること、前
記コードブックゲインによって前記コードブックベクトルをスケーリングしてス
ケーリングされたコードブックベクトルを生成すること、前記スケーリングされ
たコードブックベクトルに応答してピッチ周期に基づく第１の複数のサンプルを
生成すること、前記ピッチゲインによって前記第１のサンプルをスケーリングし
て第１のスケーリングされたサンプルを生成すること、及び前記雑音特性を管理
するために、前記ピッチゲインを修正して前記第１のスケーリングされたサンプ
ルの寄与度を修正すること、を備える請求項３４記載の方法。
【請求項４０】前記第１のパラメータはピッチゲインを備え、前記複数の
特性は更に信号対雑音比を備え、前記生成することは、前記ピッチゲイン及び前
記信号対雑音比に応答して前記調整された第１のパラメータを生成することを備
え、前記調整された第１のパラメータは調整されたピッチゲインを備える、請求
項３４記載の方法。
【請求項４１】前記信号対雑音比は、雑音のある信号電力と前記オーディ
オ信号の雑音電力とに関与している比を備える、請求項４０記載の方法。
【請求項４２】前記第１のパラメータはピッチゲインを備え、前記複数の
パラメータは更にコードブックゲインを備え、前記生成することは、前記複数の
復号化ステップを実行してコードブックベクトルを生成すること、前記コードブ
ックゲインによって前記コードブックベクトルをスケーリングしてスケーリング
されたコードブックベクトルを生成すること、前記スケーリングされたコードブ
ックベクトルの電力をあらわす電力信号を精製すること、及び前記ピッチゲイン
及び前記電力信号に応答して前記調整された第１のパラメータを生成すること、
を備え、前記調整された第１のパラメータは調整されたピッチゲインを備える、
請求項３４記載の方法。
【請求項４３】前記第１のパラメータはピッチゲインを備え、前記生成す
ることは、ピッチ周期に基づいて少なくとも第１のサンプルを生成すること、前
記ピッチゲインによって前記第１のサンプルをスケーリングして少なくとも第１
のスケーリングされたサンプルを生成すること、前記第１のスケーリングサンプ
ルの電力を表す第１の電力信号を生成すること、及び少なくとも前記ピッチゲイ
ン及び前記第１の電力信号に応答して前記調整された第１のパラメータを生成す
ることを備え、前記調整された第１のパラメータは調整されたピッチゲインを備
える、請求項３４記載の方法。
【請求項４４】前記生成することは更に、前記第１の電力信号に部分的に
応答してピッチ周期に基づいて第２のサンプルを生成すること、前記ピッチゲイ
ンにより前記第２のサンプルをスケーリングして第２のスケーリングされたサン
プルを生成すること、前記第２のスケーリングされたサンプルの電力を表す第２
の電力信号を生成すること、及び前記ピッチゲイン、前記第１の電力信号及び前
記第２の電力信号に応答して前記調整された第１のパラメータを生成すること、
を備える請求項４３記載の方法。
【請求項４５】前記システムは１つ以上の長時間予測バッファを備えてお
り、前記第１及び第２のサンプルを生成することは前記１つ以上のバッファを使
用することを含む、請求項４４記載の方法。
【請求項４６】前記第１のパラメータはピッチゲインを備え、前記複数の
パラメータは更にコードブックゲインを備え、前記プロセッサはピッチ合成フィ
ルタを備え、前記生成することは、前記複数の復号化ステップを実行して第１の
ベクトルを生成すること、前記コードブックゲインによって前記第１のベクトル
をスケーリングしてスケーリングされたコードブックベクトルを生成すること、
ピッチ合成フィルタリングによって前記スケーリングされたコードブックベクト
ルをフィルアリングして第２のベクトルを生成すること、前記第２のベクトルの
電力を表す電力信号を生成すること、及び前記ピッチゲインおよび前記電力信号
に応答して前記調整された第１のパラメータを生成すること、を備え、そして前
記調整された第１のパラメータは調整されたピッチゲインを備える、請求項３４
記載の方法。
【請求項４７】前記第１のベクトルはコードブック励振ベクトルを備え、
前記第２のベクトルはＬＰＣ励振ベクトルを備える、請求項４６記載の方法。
【請求項４８】前記第１のパラメータは振幅の可変セットを用いるパルス
を備えるコードブックベクトルを備え、前記生成することは、前記セットを分析
して前記セットにより表される前記雑音特性の電力を識別すること、前記プロセ
ッサは第１のセット以外の前記セットにより表される電力より少ない電力を表す
前記第１のセットを識別すること、及び前記パルスを前記第１のセットにしたが
って調整して前記調整されたパラメータを生成すること、を備える請求項３４記
載の方法。
【請求項４９】前記複数の復号化ステップは更に実質的に雑音特性の管理
に影響を与えない少なくとも一つの復号化ステップを備え、前記生成することは
、前記少なくとも一つの復号化ステップの実行を避ける、請求項３４記載の方法
。
【請求項５０】前記少なくとも一つの復号化ステップはポスト・フィルタ
リングを備える、請求項４９記載の方法。
【請求項５１】前記圧縮符号は線形予測符号を備える、請求項３４記載の
方法。
【請求項５２】前記圧縮符号は正規パルス励振−長時間予測符号を備える
、請求項３４記載の方法。
【請求項５３】前記圧縮符号は符号励振線形予測符号を備える、請求項３
４記載の方法。
【請求項５４】前記第１のパラメータは量子化された第１のパラメータで
あり、前記生成することは、前記第１のパラメータを前記調整された第１のパラ
メータで置換する前に、部分的に前記調整された第１のパラメータを量子化する
ことにより前記調整された第１のパラメータを生成することを備える、請求項３
４記載の方法。
【請求項５５】前記圧縮符号は前記ディジタル信号のフレーム内に配置さ
れ、前記フレームは複数のサブフレームを備え、該サブフレームの各々は前記第
１のパラメータを備え、前記読み出すことは、前記圧縮符号に応答して前記複数
のサブフレームの各々から少なくとも前記第１のパラメータを読み出ことを備え
、そして前記置換することは、前記第１のパラメータを前記複数のサブフレーム
の各々の中の前記調整された第１のパラメータで置換することを備える、請求項
３４記載の方法。
【請求項５６】前記置換することは、第１のサブフレームに続くサブフレ
ームを処理する前に前記第１のパラメータを前記調整された第１のパラメータで
置換してより少ない遅延を達成することを備える、請求項５５記載の方法。
【請求項５７】前記圧縮符号は前記ディジタル信号のフレーム内に配置さ
れ、前記フレームは複数のサブフレームを備え、該サブフレームの各々は前記第
１のパラメータを備え、前記生成することは、前記サブフレームの最初の間に前
記復号化ステップの実行を開始して複数の前記復号化信号を生成することを備え
、前記読み出すことは、前記第１のサブフレームに続いて生じる前記サブフレー
ムの２番目から前記第１のパラメータを読み出すことを備え、前記生成すること
は更に、前記複合化信号および前記第１のパラメータに応答して前記調整された
第１のパラメータを生成することを備え、そして前記置換することは、前記第２
のサブフレームの前記第１のパラメータを前記調整された第１のパラメータで置
換することを備える、請求項３４記載の方法。
【請求項５８】前記生成することは、複数の前記復号化ステップの少なく
とも一つを実行して前記圧縮符号に応答して復号化信号を生成すること、及び前
記復号化信号及び前記第１のパラメータに応答して前記調整された第１のパラメ
ータを生成すること、を備える請求項３４記載の方法。
【請求項５９】前記第１のパラメータは、コードブックベクトル、コード
ブックゲイン、ピッチゲイン、及び線スペクトル対及び線スペクトル周波数を含
むＬＰＣ係数表示、から成るグループから選択される、請求項３４記載の方法。
【請求項６０】前記オーディオ信号は前記雑音特性により影響されるスペ
クトル領域を有し、前記第１のパラメータはＬＰＣ係数の表示を備え、前記生成
することは、前記圧縮符号及び前記表示に応答して雑音に影響される前記スペク
トル領域を決定すること、及び、前記調整された第１のパラメータを生成して、
前記領域内の前記雑音特性を管理すること、を備え、前記調整された第１のパラ
メータはＬＰＣ係数の調整された表示を備える、請求項３４記載の方法。
【請求項６１】前記ＬＰＣ係数の表示は線スペクトル周波数及び対数領域
比からなるグループから選択される、請求項６０記載の方法。
【請求項６２】符号サンプルは圧縮符号を用いる第１のビットと線形符号
を用いる第２のビットとを備え、前記符号サンプルはオーディオ信号を表し、前
記オーディオ信号は雑音特性を含む複数のオーディオ特性を有する、前記符号サ
ンプルを備えるディジタル信号を送信する通信システムにおいて、前記第２のビットに応答して前記第１のビット及び前記第２のビットを調整し
、それにより前記ディジタル信号内の雑音特性が制御される、前記圧縮符号の復
号化をしないで雑音特性を管理する方法。
【請求項６３】前記線形符号はパルス符号変調（ＰＣＭ）符号を備える、
請求項２９記載の方法。
【請求項６４】前記符号サンプルは、移動体通信標準のためのグローバル
システムのタンデムフリー動作に適合する、請求項６２記載の方法。
【請求項６５】前記第１のビットは前記サンプルの２つの最下位ビットを
備え、前記第２のビットは前記サンプルの６個の最上位ビットを備える、請求項
６２記載の方法。
【請求項６６】前記６個の最上位ビットはＰＣＭ符号を備える、請求項６
５記載の方法。