JP3272953B2

JP3272953B2 - 適応コードブックに基づく音声圧縮システム

Info

Publication number: JP3272953B2
Application number: JP18261296A
Authority: JP
Inventors: クルーンピーター
Original assignee: エイ・ティ・アンド・ティ・アイピーエム・コーポレーション
Priority date: 1995-06-07
Filing date: 1996-06-07
Publication date: 2002-04-08
Anticipated expiration: 2016-06-07
Also published as: CA2177414C; KR970004369A; AU5462196A; US5664055A; JPH09120299A; AU700205B2; EP0749110A3; ES2163590T3; KR100433608B1; DE69613910T2; EP0749110B1; CA2177414A1; EP0749110A2; DE69613910D1; MX9602143A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、適応コードブック
に基づく音声圧縮システムに関し、特に、適応コードブ
ックベクトル（サブフレーム）長以下のピッチ周期を有
する音声を圧縮するように動作するそのようなシステム
に関する。

【０００２】

【従来の技術】多くの音声圧縮システムは、音声信号の
周期性をモデル化するためにサブシステムを使用する。
音声圧縮（あるいは符号化）において広く使用されてい
る二つのそのような周期性モデルとして、ピッチ予測フ
ィルタ（ＰＰＦ）および適応コードブック（ＡＣＢ）が
ある。

【０００３】ＡＣＢは、基本的には、過去の音声信号、
または、音声残差や励振信号のようなその派生物（以
下、音声信号という。）のサンプルを記憶するメモリで
ある。過去の（メモリに記憶されている）音声信号のサ
ンプルを現在にコピーすることによって周期性を導入
（あるいはモデル化）することにより、現在の音声信号
がどのようになるかを「予測」する。

【０００４】ＰＰＦは、代表的には次のような形の単純
なＩＩＲフィルタである。ｙ（ｎ）＝ｘ（ｎ）＋ｇ_pｙ（ｎ−Ｍ）（１）ただし、ｎはサンプルのインデックスであり、ｙは出力
であり、ｘは入力であり、ｍはフィルタの遅延値であ
り、ｇ_pはスケール因子（あるいは利得）である。ＰＰ
Ｆの現在の出力は過去の出力に依存するため、周期性が
ＰＰＦに導入される。

【０００５】ＡＣＢまたはＰＰＦを音声符号化で使用す
ることが可能であるが、これらの周期性モデルはすべて
の状況で同一には作用しない。例えば、有声音声のピッ
チ周期がサブフレーム（あるいはコードブックベクト
ル）のサイズ以上であるときにはＰＰＦおよびＡＣＢは
同じ結果を与えるが、ピッチ周期がサブフレームサイズ
より小さい場合にはそれは成り立たない。この差は図１
および図２に例示されている。これらの図において、ピ
ッチ周期（あるいは遅延）は２．５ｍｓであり、サブフ
レームサイズは５ｍｓであると仮定している。

【０００６】図１は、代表的なＣＥＬＰ音声圧縮方式で
使用されるような、固定コードブック（ＦＣＢ）とＡＣ
Ｂの従来の組合せ（この組合せは、ＣＥＬＰ方式の符号
器および復号器の両方で使用される）を表す。図示され
ているように、ＦＣＢ１はインデックス値Ｉを受信し、
それによりＦＣＢは所定期間の音声信号（励振）ベクト
ルを出力する。この期間をサブフレーム（ここでは５ｍ
ｓ）という。例えば、この音声励振信号は、サブフレー
ム内に位置する一つ以上の主パルスからなる。説明を明
確にするために、出力ベクトルは、単位大きさを有する
単一の大きいパルスを有すると仮定する。出力ベクトル
は、増幅器５によって加えられる利得g_cでスケールされ
る。

【０００７】ＦＣＢ１および利得５の作用と平行して、
ＡＣＢ１０は以前に合成した音声に基づいて音声信号を
生成する。従来技術では、ＡＣＢ１０は、符号化中のも
との音声に最もよく一致する音声のサンプルを、過去の
音声のメモリから探索する。このようなサンプルは、合
成しようとしている現在のサンプルから過去に１ピッチ
周期（Ｍ）の近傍にある。このような過去の音声サンプ
ルは、ピッチが分数である場合には存在しないこともあ
り、通常のように、周囲の音声サンプル値から線形補間
によりＡＣＢが合成しなければならないこともある。Ａ
ＣＢはこのようにして現在のサンプルとして識別（ある
いは合成）される過去のサンプルを使用する。説明を明
確にするため、以後の説明では、ピッチ周期はサンプル
周期の整数倍であり、過去のサンプルは、現在のサブフ
レームにコピーするためにＭだけ識別されると仮定す
る。ＡＣＢはこのようにして１サブフレーム（５ｍｓ）
に対する個々のサンプルを出力する。ＡＣＢによって生
成されるすべてのサンプルは、増幅器１５によって加え
られる利得g_pでスケールされる。

【０００８】サブフレームの後半における現在のサンプ
ルに対しては、「現在の」サンプルとして使用される
「過去の」サンプルはそのサブフレームの前半のサンプ
ルである。その理由は、サブフレームの期間は５ｍｓで
あるが、ピッチ周期Ｍ（過去のサンプルを現在のサンプ
ルとして使用するために識別するために用いられる時
間）は２．５ｍｓであるためである。従って、合成すべ
き現在のサンプルがサブフレーム内の４ｍｓの時点にあ
る場合、音声の過去のサンプルは同じサブフレーム内の
４ｍｓ−２．５ｍｓすなわち１．５ｍｓの時点にある。

【０００９】ＦＣＢおよびＡＣＢの増幅器５、１５の出
力信号は加算回路２０で加算され、従来の線形予測（Ｌ
ＰＣ）合成フィルタ（図示せず）への励振信号が生成さ
れる。回路２０によって生成されるこの励振信号の１サ
ブフレームの様式化した表現も図１に示されている。ス
ケーリング前にはパルスが単位大きさであると仮定する
と、コードブックのシステムは５ｍｓのサブフレーム内
にいくつかのパルスを生成する。第１のパルスの高さは
g_pであり、第２のパルスの高さはg_cであり、第３のパル
スの高さはg_pである。第３のパルスは単に、ＡＣＢによ
って生成された、第１パルスのコピーである。注意すべ
き点であるが、ＡＣＢメモリは第２のパルスを含まない
（そして固定コードブックはサブフレームごとにただ一
つのパルスしか有しない）ため、サブフレームの後半に
は第２のパルスのコピーはない。

【００１０】図２は、ＰＰＦ５０と直列のＦＣＢ２５か
らなる周期性モデルを表す。ＰＰＦ５０は、加算回路４
５、遅延メモリ３５、および増幅器４０からなる。上記
のシステムと同様に、ＦＣＢ２５に入力されるインデッ
クスＩによりＦＣＢはそのインデックスに対応する励振
ベクトルを出力する。このベクトルは一つの主パルスを
有する。このベクトルは、利得g_cを加える増幅器３０に
よってスケールされる。スケールされたベクトルはＰＰ
Ｆ５０に入力される。ＰＰＦ５０は上記の式（１）に従
って動作する。ＰＰＦ５０の出力信号の１サブフレーム
の様式化した表現も図２に示されている。ＰＰＦ出力サ
ブフレームの第１のパルスは、前サブフレーム（図示せ
ず）からの主パルス（単位大きさを有すると仮定）に加
えられた遅延Ｍの結果である。サブフレーム内の次のパ
ルスは、増幅器３０によってスケールされたＦＣＢ出力
ベクトルに含まれるパルスである。その後、２．５ｍｓ
の遅延３５により、これらの二つのパルスは、それぞれ
増幅器４０によってスケールされて、２．５ｍｓ後に反
復される。

【００１１】周期性モデルのＡＣＢおよびＰＰＦによる
実装の出力信号の間には大きな相違がある。それらの出
力信号は、図１および図２に図示したように、合成され
たサブフレームの後半に現れる。第１に、第３のパルス
の振幅が相違する（g_pに対してg_p ²）。第２に、ＡＣＢ
モデルの出力には第４のパルスはない。このパルスの欠
落に関して、ピッチ周期がフレームサイズより小さい場
合、ＡＣＢとＦＣＢの組合せは、サブフレームにおいて
第２の固定コードブックの寄与を導入しない。これは、
固定コードブックと直列のピッチ予測フィルタの動作と
は異なる。

【００１２】周期性のＡＣＢモデルを使用する音声符号
化方式では、ＦＣＢの出力においてＰＰＦを使用するこ
とが提案されている。このＰＰＦは、ピッチ周期の整数
成分に等しい遅延と、０．８という固定利得を有する。
このＰＰＦは、サブフレーム内に欠けているＦＣＢパル
スの挿入を行うが、利得値は不確実である。この利得が
不確実である理由は、ＡＣＢおよびＦＣＢの利得の結合
量子化は、ＡＣＢおよびＦＣＢの両方のベクトルが決定
されるまで、現在のサブフレームに対するＡＣＢ利得の
決定を妨げるためである。

【００１３】

【発明が解決しようとする課題】本発明の発明者が認識
したところによれば、ＡＣＢベースの合成器に付加され
るピッチループが固定利得であることにより、合成され
る音声の周期性が強くなりすぎることがあり、その場
合、合成される音声に不自然な「ブザー音」が生じるこ
とがある。

【００１４】

【課題を解決するための手段】本発明は、ＡＣＢを使用
するシステムにおいてＦＣＢの出力にＰＰＦを使用する
という提案の欠点を解決するものである。本発明によれ
ば、ＰＰＦの利得は固定ではなく、音声信号の周期性の
ある尺度に基づいて適応的である。この適応ＰＰＦ利得
は、音声信号があまり周期的ではないときに小さく、音
声信号が非常に周期的であるときに大きいという点で、
ＰＰＦのパフォーマンスを向上させる。この適応可能性
が、「ブザー音」問題を回避する。

【００１５】本発明の実施例によれば、適応コードブッ
クおよび対応する適応コードブック増幅器からなる第１
部分と、ピッチフィルタに接続された固定コードブック
からなる第２部分とを有する音声処理システムは、適応
コードブック利得を遅延させるように適応させられ、遅
延された適応コードブック利得に基づいてピッチフィル
タ利得を決定し、この決定されたピッチフィルタ利得に
基づいてピッチフィルタにおいて信号のサンプルを増幅
する。適応コードブック利得は１サブフレームだけ遅延
される。適応コードブックの量子化利得は固定コードブ
ック利得が決定されるまで使用することができないた
め、遅延された利得が使用される。ピッチフィルタ利得
は、適応コードブック利得が０．２より小さい場合また
は０．８より大きい場合にはそれぞれ０．２または０．
８に等しく設定され、これら以外の場合には遅延された
適応コードブック利得に等しい。これらの限界値は、励
振信号が実際にどのくらい周期的であるかを評価する際
の誤差による知覚的に好ましくない影響を制限するため
のものである。

【００１６】

【発明の実施の形態】

［Ｉ．実施例の序論］説明を明確にするため、本発明の
実施例は、個別の機能ブロック（「プロセッサ」とラベ
ルされた機能ブロックを含む）からなるものとして提示
される。これらのブロックが表している機能は、ソフト
ウェアを実行可能なハードウェアを含む共用または専用
のハードウェアの使用により提供可能である（しかし、
そのようなものに限定されるものではない）。例えば、
図３および図４に示されるプロセッサの機能は、単一の
共用プロセッサによって提供可能である。（「プロセッ
サ」という用語の使用は、ソフトウェアを実行可能なハ
ードウェアのみを指すものと解釈してはならない。）

【００１７】実施例は、ＡＴ＆ＴのＤＳＰ１６またはＤ
ＳＰ３２Ｃのようなディジタル信号プロセッサ（ＤＳ
Ｐ）ハードウェア、後述の動作を実行するソフトウェア
を記憶する読み出し専用メモリ（ＲＯＭ）、および、Ｄ
ＳＰの結果を記憶するランダムアクセスメモリ（ＲＡ
Ｍ）からなることが可能である。超大規模集積（ＶＬＳ
Ｉ）ハードウェアによる実施例や、カスタムＶＬＳＩ回
路を汎用ＤＳＰ回路と組み合わせた実施例も可能であ
る。

【００１８】以下で説明する実施例は、多くの音声圧縮
方式での使用に適している。そのような音声圧縮方式と
しては、例えば、ＩＴＵ標準化団体への勧告草案Ｇ．７
２９（Ｇ．７２９草案）に記載されているものがある。
この勧告草案は後述の［付録］と題する部分に記載し
た。この音声圧縮方式は、符号励振線形予測（ＣＥＬ
Ｐ）符号化に基づき、８ｋｂｉｔ／ｓで動作する（Ｇ．
７２９草案第２節参照）。この勧告草案は、本発明を使
用しているとともに、音声符号化方式の一般的記述も含
む（例えば、図６およびＧ．７２９草案の第２．１節の
記載参照）。本発明の実施例に関しては、Ｇ．７２９草
案の第３．８節および第４．１．２節を参照されたい。

【００１９】［ＩＩ．実施例］図３および図４は、Ｇ．
７２９草案の符号器および復号器で使用される、本発明
の実施例を示す。図３は、実施例の符号器の詳細を示す
ようにＧ．７２９草案の図６を補足した図である。図４
は、実施例の復号器の詳細を示すようにＧ．７２９草案
の図７を補足した図である。以下の説明において、必要
に応じてＧ．７２９草案の節を参照する。Ｇ．７２９草
案の符号器の一般的記述は第２．１節に記載されてお
り、復号器の一般的記述は第２．２節に記載されてい
る。

【００２０】［Ａ．符号器］実施例によれば、入力音声
信号（サンプリングレート８ｋＨｚの１６ビットＰＣ
Ｍ）がプリプロセッサ（前処理プロセッサ）１００に入
力される。プリプロセッサ１００は、好ましくない低周
波成分を除去し、処理オーバーフローを避けるために音
声信号をスケールように音声信号を高域フィルタリング
する（Ｇ．７２９草案第３．１節参照）。前処理された
音声信号ｓ（ｎ）は次に線形予測分析器１０５に入力さ
れる（Ｇ．７２９草案第３．２節参照）。線形予測（Ｌ
Ｐ）係数ａ＾_iはＬＰ合成フィルタ１５５に入力され
る。ＬＰ合成フィルタ１５５は、符号器のＦＣＢ部分お
よびＡＣＢ部分の出力の組合せから形成される励振信号
ｕ（ｎ）を受信する。励振信号は、「合成による分析」
探索手続きを使用することによって選択される。この手
続きでは、もとの音声と合成された音声の間の誤差が、
知覚重み付けフィルタ１６５によって、知覚的重み付け
歪み尺度に従って最小化される（Ｇ．７２９草案第３．
３節参照）。

【００２１】実施例のＡＣＢ部分１１２に関して、知覚
的重み付き歪み（誤差）を表す信号は、適応コードブッ
クシステム１１０によって使用される開ループピッチ周
期（遅延）を決定するために、ピッチ周期プロセッサ１
７０によって使用される。符号器は、閉ループピッチ探
索の基礎として、この決定される開ループピッチ周期を
使用する。ＡＣＢ１１０は、選択された分数ピッチにお
いて過去の励振を補間することによって、適応コードブ
ックベクトルｖ（ｎ）を計算する（Ｇ．７２９草案第
３．４〜３．７節参照）。適応コードブック利得増幅器
１１５は、ＡＣＢシステム１１０の出力にスケール因子
ｇ＾_pを乗じる（Ｇ．７２９草案第３．９．２節参
照）。

【００２２】実施例のＦＣＢ部分に関して、平均二乗誤
差（ＭＳＥ）探索プロセッサ１７５によって生成された
インデックスがＦＣＢシステム１２０によって受信さ
れ、それに応じてコードブックベクトルｃ（ｎ）が生成
される（Ｇ．７２９草案第３．８節参照）。このコード
ブックベクトルは、本発明によって動作するＰＰＦシス
テム１２８（後述）に入力される。ＰＰＦシステム１２
８の出力は、スケール因子ｇ＾_cを乗じるＦＣＢ増幅器
１４５によってスケールされる。スケール因子ｇ＾_cは
Ｇ．７２９草案第３．９節に従って決定される。

【００２３】符号器のＡＣＢ部分１１２およびＦＣＢ部
分１１８からのベクトル出力は加算器１５０で加算さ
れ、上記のＬＰ合成フィルタに入力される。

【００２４】［Ｂ．ＰＰＦシステム］上記のように、Ｐ
ＰＦシステムは、合成中の音声のピッチ周期がサブフレ
ームのサイズより小さいときおよびあまり周期的でない
音声に対して固定ＰＰＦ利得が大きくなりすぎるときに
示されるＡＣＢシステムの欠点を解決する。

【００２５】ＰＰＦシステム１２８は、ＰＰＦ１２８が
励振信号に寄与するかどうかを制御するスイッチ１２６
を有する。遅延ＭがサブフレームのサイズＬより小さい
場合、スイッチ１２６は閉じ、ＰＰＦ１２８は励振に寄
与する。Ｍ≧Ｌの場合、スイッチ１２６は開き、ＰＰＦ
１２８は励振に寄与しない。スイッチの制御信号Ｋは、
Ｍ＜Ｌの時にセットされる。注意すべき点であるが、ス
イッチ１２６は単に≧例示的なものである。例えば、Ｍ
≧Ｌのときには完全にＰＰＦ１２８を迂回するように使
用されるスイッチのような、多くの代替設計が可能であ
る。

【００２６】ＰＰＦシステムによって使用される遅延
は、ピッチ周期プロセッサ１７０によって計算されるピ
ッチ周期Ｍの整数部分である。遅延プロセッサ１３５の
メモリは、各サブフレームに対するＰＰＦ１２８の動作
の前に消去される。ＰＰＦシステムによって加えられる
利得は、遅延プロセッサ１２５に入力される。プロセッ
サ１２５はＡＣＢ利得ｇ＾_pを受信し、それを１サブフ
レームごとに記憶する（１サブフレーム遅延）。記憶さ
れた利得値は次に上限０．８および下限０．２とそれぞ
れ比較される。利得の記憶値が上限より大きいかまたは
下限より小さい場合、利得はそれぞれの限界値に設定さ
れる。換言すれば、ＰＰＦ利得は、０．２以上かつ０．
８以下の値の範囲に制限される。この範囲内では、利得
は、遅延された適応コードブック利得の値を取る。

【００２７】上限および下限は、合成される信号が過度
に周期的にも非周期的にもならないように、適応ＰＰＦ
利得の値に対して設定される。合成される信号が過度に
周期的になることあるいは非周期的になることはいずれ
も知覚的に好ましくない。従って、ＡＣＢ利得の極端に
小さいまたは大きい値は回避されるべきである。

【００２８】当業者には明らかなように、ＡＣＢ利得
は、サブフレームごとに記憶する前に、指定された範囲
に制限することも可能である。従って、プリプロセッサ
は、ＡＣＢ利得が、指定された範囲に前に制限されるか
後に制限されるかを反映する信号を記憶する。また、上
限および下限の正確な値は、本発明の特定の実施例にお
いて所望の結果を達成するために変更可能な設計的事項
である。

【００２９】［Ｃ．復号器］上記（およびＧ．７２９草
案の参照された節）の符号器は、１０ｍｓごとに圧縮さ
れた音声を表すデータのフレームを出力する。このフレ
ームは８０ビットからなり、Ｇ．７２９草案の表１〜表
９に詳細に記載されている。圧縮された音声の各８０ビ
ットフレームは通信チャネルを通じて復号器へ送信され
る。復号器は、符号器によって生成されたフレームに基
づいて音声信号（２サブフレームを表す）を合成する。
フレームが通信されるチャネル（図示せず）は任意の種
類（例えば通常の電話網、セルラあるいは無線網、ＡＴ
Ｍ網など）が可能であり、また、記憶媒体（例えば磁気
記憶装置、半導体ＲＡＭまたはＲＯＭ、ＣＤ−ＲＯＭの
ような光記憶装置など）からなることも可能である。

【００３０】本発明による復号器の実施例を図４に示
す。復号器は、適応コードブック部分２４０および２
００の両方を有するという点で図３の符号器と類似して
いる。復号器は、伝送されたパラメータ（Ｇ．７２９草
案第４．１節参照）を復号し、合成を実行して再構成さ
れた音声を取得する。

【００３１】ＦＣＢ部分は、符号器から復号器へ通信さ
れるＦＣＢインデックスＩに応答するＦＣＢ２０５を有
する。ＦＣＢ２０５は、サブフレームに等しい長さのベ
クトルｃ（ｎ）を生成する（Ｇ．７２９草案第４．１．
３節参照）。このベクトルは、復号器のＰＰＦ２１０に
入力される。ＰＰＦ２１０は上記のように（いずれもチ
ャネルを通じて符号器から受信される、遅延プロセッサ
２２５で遅延されたＡＣＢ利得ｇ＾_pの値と、ＡＣＢピ
ッチ周期Ｍの値に基づいて）動作し、ＦＣＢ利得増幅器
２３５に入力されるベクトルを生成する。この増幅器
は、チャネルからの利得ｇ＾_cを加え、ＰＰＦ２１０に
よって生成されたベクトルをスケールしたベクトルを生
成する（Ｇ．７２９草案第４．１．４節参照）。増幅器
２３５の出力信号は加算器２５５に供給され、加算器２
５５は励振信号ｕ（ｎ）を生成する。

【００３２】加算器２５５にはまた、復号器のＡＣＢ部
分２４０によって生成される出力信号も供給される。Ａ
ＣＢ部分２４０は、過去の励振信号と、チャネルを通じ
て符号器から受信されるＡＣＢピッチ周期Ｍの値に基づ
いてサブフレームに等しい長さの適応コードブック寄与
ｖ（ｎ）を生成するＡＣＢ２４５からなる（Ｇ．７２９
草案第４．１．２節参照）。このベクトルは、チャネル
を通じて受信される利得因子ｇ＾_pに基づいて増幅器２
５０によってスケールされる。このスケールされたベク
トルが、ＡＣＢ部分２４０の出力である。

【００３３】加算器２５５によって生成される励振信号
ｕ（ｎ）はＬＰＣ合成フィルタ２６０に入力される。Ｌ
ＰＣ合成フィルタ２６０は、チャネルから受信されるＬ
ＰＣ係数ａ＾_iに基づいて音声信号を合成する（Ｇ．７
２９草案第４．１．６節参照）。

【００３４】最後に、ＬＰＣ合成フィルタ２６０の出力
はポストプロセッサ２６５に供給される。ポストプロセ
ッサ２６５は、適応ポストフィルタリング（Ｇ．７２９
草案第４．２．１〜４．２．４節参照）、高域フィルタ
リング（Ｇ．７２９草案第４．２．５節参照）、および
アップスケーリング（Ｇ．７２９草案第４．２．５節参
照）を実行する。

【００３５】［ＩＩ．考察］以上、本発明の実施例につ
いて説明したが、さまざまな変形例が可能である。例え
ば、スカラ利得量子化を使用する場合、ＰＰＦ利得は、
前のＡＣＢ利得ではなく現在のＡＣＢ利得に基づいて適
応させることも可能である。また、ＰＰＦ利得の限界値
（０．２，０．８）は単なる例示である。他の限界（例
えば０．１および０．７）も可能である。

【００３６】さらに、本発明の実施例ではコードブック
「増幅器」という用語を用いたが、当業者には理解され
るように、この用語はディジタル信号のスケーリングを
包含する。さらに、このようなスケーリングとしては、
１より大きい値とともに、１以下（負の値を含む）のス
ケール因子（あるいは利得）で実行可能である。

【０１００】［付録］国際電気通信連合電気通信標準化部門勧告草案Ｇ．７２９共役構造代数的符号励振線形予測（ＣＳ−ＡＣＥＬＰ）
符号化を用いた８ｋｂｉｔ／ｓでの音声の符号化１９９５年６月７日バージョン４．０

【０１０１】目次１はじめに［０１０２］２符号器／復号器の一般的記述［０１０５］２．１符号器［０１０６］２．２復号器［０１０８］２．３遅延［０１０９］２．４音声符号器の記述［０１１０］２．５記法上の規約［０１１１］３符号器の機能的記述［０１１２］３．１前処理［０１１３］３．２線形予測分析および量子化［０１１５］３．２．１窓および自己相関の計算［０１１６］３．２．２レヴィンソン＝ダービンのアルゴリズム
［０１１８］３．２．３ＬＰからＬＳＰへの変換［０１１９］３．２．４ＬＳＰ係数の量子化［０１２１］３．２．５ＬＳＰ係数の補間［０１３０］３．２．６ＬＳＰからＬＰへの変換［０１３１］３．３知覚的重み付け［０１３３］３．４開ループピッチ分析［０１３５］３．５インパルス応答の計算［０１３７］３．６目標信号の計算［０１３８］３．７適応コードブック探索［０１４１］３．７．１適応コードブックベクトルの生成［０１
４６］３．７．２適応コードブック遅延に対する符号語計算
［０１４７］３．７．３適応コードブック利得の計算［０１５
０］３．８固定コードブック：構造および探索［０１５
１］３．８．１固定コードブック探索手続き［０１５
３］３．８．２固定コードブックの符号語計算［０１５
９］３．９利得の量子化［０１６０］３．９．１利得予測［０１６１］３．９．２利得量子化のためのコードブック探索
［０１６５］３．９．３利得量子化器に対する符号語計算［０１
６７］３．１０メモリ更新［０１６８］３．１１符号器および復号器の初期化［０１６９］４復号器の機能的記述［０１７０］４．１パラメータ復号手続き［０１７１］４．１．１ＬＰフィルタパラメータの復号［０１７
２］４．１．２適応コードブックベクトルの復号［０１
７４］４．１．３固定コードブックベクトルの復号［０１
７７］４．１．４適応コードブックおよび固定コードブック
の利得の復号［０１７８］４．１．５パリティビットの計算［０１７９］４．１．６再構成音声の計算［０１８０］４．２後処理［０１８２］４．２．１ピッチポストフィルタ［０１８３］４．２．２短期ポストフィルタ［０１８４］４．２．３傾斜補償［０１８５］４．２．４適応利得制御［０１８７］４．２．５高域フィルタリングおよびアップスケーリ
ング［０１８８］４．３フレーム消失およびパリティ誤りの隠蔽［０
１９０］４．３．１ＬＰフィルタパラメータの反復［０１９
４］４．３．２適応コードブックおよび固定コードブック
の利得の減衰［０１９５］４．３．３利得予測子のメモリの減衰［０１９６］４．３．４置換励振の生成［０１９７］５ＣＳ−ＡＣＥＬＰ符号器／復号器のビット精度での
記述［０１９９］５．１シミュレーションソフトウェアの使用法［０
２００］５．２シミュレーションソフトウェアの構成［０２
０１］

【０１０２】［１はじめに］この勧告は、共役構造代
数的符号励振線形予測（ＣＳ−ＡＣＥＬＰ）符号化を用
いた８ｋｂｉｔ／ｓでの音声の符号化のアルゴリズムの
記述を含む。

【０１０３】この符号器／復号器は、まずアナログ入力
信号の電話帯域フィルタリング（ＩＴＵ勧告Ｇ．７１
０）を実行し、８０００Ｈｚでサンプリングした後、符
号器への入力に対して１６ビット線形ＰＣＭへの変換を
実行することによって得られるディジタル信号に対して
動作するように設計されている。復号器の出力は、同様
の手段によってアナログ信号に変換されるべきものであ
る。他の入出力特性（例えば、６４ｋｂｉｔ／ｓのＰＣ
Ｍデータに対してＩＴＵ勧告Ｇ．７１１によって規定さ
れたもの）は、符号化前に１６ビット線形ＰＣＭに、あ
るいは、復号前に１６ビット線形ＰＣＭから適当なフォ
ーマットに、変換しなければならない。符号器から復号
器へのビットストリームは、この標準内で定義される。

【０１０４】この勧告は以下のように構成される。第２
節では、ＣＳ−ＡＣＥＬＰアルゴリズムの概略を説明す
る。第３節および第４節では、ＣＳ−ＡＣＥＬＰ符号器
およびＣＳ−ＡＣＥＬＰ復号器の原理をそれぞれ説明す
る。第５節では、１６ビット固定小数点計算でこの符号
器／復号器を定義するソフトウェアについて説明する。

【０１０５】［２符号器／復号器の一般的記述］ＣＳ
−ＡＣＥＬＰ符号器／復号器は、符号励振線形予測（Ｃ
ＥＬＰ）符号化モデルに基づく。この符号器／復号器
は、８０００サンプル／秒のサンプリングレートでの８
０サンプルに対応する１０ｍｓの音声フレームに作用す
る。１０ｍｓｅｃのフレームごとに、音声信号が分析さ
れ、ＣＥＬＰモデルのパラメータ（ＬＰフィルタ係数、
適応コードブックおよび固定コードブックのインデック
スおよび利得）が抽出される。これらのパラメータは符
号化され送信される。符号器パラメータのビット割当て
を表１に示す。復号器では、これらのパラメータは、励
振および合成フィルタパラメータを取得するために使用
される。音声は、図５に示されるようなＬＰ合成フィル
タによって、この励振をフィルタリングすることにより
再構成される。短期合成フィルタは、１０次線形予測
（ＬＰ）フィルタに基づく。長期すなわちピッチ合成フ
ィルタは、いわゆる適応コードブック法を使用して、サ
ブフレーム長より短い遅延に対して実装される。再構成
音声を計算した後、ポストフィルタによってさらに増強
される。

【表１】

【０１０６】［２．１符号器］符号器における信号フ
ローを図６に示す。入力信号は、前処理ブロックで高域
フィルタリングされ、スケールされる。前処理された信
号は、後続のすべての分析のための入力信号として使用
される。ＬＰ分析は、ＬＰフィルタ係数を計算するため
に１０ｍｓフレームあたり１回行われる。これらの係数
は、線スペクトル対（ＬＳＰ）に変換され、予測２段ベ
クトル量子化（ＶＱ）を使用して１８ビットで量子化さ
れる。励振シーケンスは、合成による分析探索手続きを
使用することによって選択される。この手続きでは、も
との音声と合成された音声の間の誤差が、知覚的重み付
き歪み尺度に従って最小化される。これは、知覚的重み
付けフィルタで誤差信号をフィルタリングすることによ
り行われる。このフィルタの係数は、量子化前のＬＰフ
ィルタから導出される。知覚的重み付けの量は、平坦周
波数応答を有する入力信号に対するパフォーマンスを改
善するように適応させられる。

【０１０７】励振パラメータ（固定コードブックおよび
適応コードブックのパラメータ）は、それぞれ５ｍｓ
（４０サンプル）のサブフレームごとに決定される。第
２サブフレームに対しては量子化後および量子化前のＬ
Ｐフィルタ係数が使用されるが、第１サブフレームで
は、保管されたＬＰフィルタ係数が使用される（量子化
前および量子化後の両方）。開ループピッチ遅延は、知
覚的重み付き音声信号に基づいて１０ｍｓフレームごと
に１回評価される。その後、以下の動作が各サブフレー
ムごとに反復される。目標信号ｘ（ｎ）は、ＬＰ残差を
重み付け合成フィルタＷ（ｚ）／Ａ＾（ｚ）でフィルタ
リングすることによって計算される。これらのフィルタ
の初期状態は、ＬＰ残差と励振の間の誤差をフィルタリ
ングすることにより更新される。これは、重み付き音声
信号から重み付き合成フィルタの０入力応答を減算する
という通常の方法と同等である。重み付き合成フィルタ
のインパルス応答ｈ（ｎ）が計算される。次に、目標ｘ
（ｎ）およびインパルス応答ｈ（ｎ）を使用して、開ル
ープピッチ遅延の値の付近を探索することによって、閉
ループピッチ分析が（適応コードブックの遅延および利
得を求めるために）行われる。１／３分解能の分数ピッ
チ遅延が使用される。このピッチ遅延は、第１サブフレ
ームでは８ビットで符号化され、第２サブフレームでは
５ビットで差分符号化される。目標信号ｘ（ｎ）は、適
応コードブック寄与（フィルタリングされた適応コード
ベクトル）を除去することにより更新され、この新しい
目標ｘ₂（ｎ）が、固定代数的コードブック探索で（最
適な励振を求めるために）使用される。固定コードブッ
ク励振には、１７ビットの代数的コードブックが使用さ
れる。適応コードブックおよび固定コードブックの利得
は７ビットで量子化されたベクトル（固定コードブック
利得にはＭＡ予測を適用）である。最後に、決定された
励振信号を使用して、フィルタメモリが更新される。

【０１０８】［２．２復号器］符号器における信号フ
ローを図７に示す。まず、パラメータインデックスが受
信ビットストリームから抽出される。これらのインデッ
クスは、１０ｍｓの音声フレームに対応する符号器パラ
メータを取得するために復号される。これらのパラメー
タは、ＬＳＰ係数、２個の分数ピッチ遅延、２個の固定
コードブックベクトル、ならびに２セットの適応コード
ブックおよび固定コードブックの利得である。ＬＳＰ係
数は補間され、各サブフレームごとにＬＰフィルタ係数
に変換される。その後、４０サンプルのサブフレームご
とに、以下のステップが実行される。・それぞれの利得でスケールされた適応コードブックお
よび固定コードブックのベクトルを加算することにより
励振が構成される。・ＬＰ合成フィルタで励振をフィルタリングすることに
より音声が再構成される。・再構成された音声信号は、後処理段を通る。この段
は、長期および短期の合成フィルタに基づく適応ポスト
フィルタと、それに続く高域フィルタおよびスケーリン
グ作用からなる。

【０１０９】［２．３遅延］この符号器は、音声やそ
の他のオーディオ信号を１０ｍｓのフレームで符号化す
る。さらに、５ｍｓのルックアヘッドがあり、その結
果、アルゴリズムの総遅延は１５ｍｓとなる。この符号
器の実装におけるすべての付加的遅延は以下の原因によ
る。・符号化および復号作用に要する処理時間・通信リンク上の伝送時間・オーディオデータを他のデータと組み合わせる際の多
重化遅延

【０１１０】［２．４音声符号器の記述］この勧告の
音声符号化アルゴリズムの記述は、ビット精度の固定小
数点数学演算を用いてなされる。第５節で示されるＡＮ
ＳＩＣコードは、この勧告の重要な一部を構成する
が、このビット精度の固定小数点記述法を反映する。符
号器（第３節）、および復号器（第４節）の数学的記述
は、他のいくつかの方法で実装することも可能である
が、この勧告に従わないコーデックの実装になる可能性
がある。従って、矛盾が発見された場合には、第５節の
Ｃコードのアルゴリズム記述のほうが、第３節および第
４節の数学的記述に優先する。Ｃコードとともに使用可
能な試験シーケンスの網羅的ではないセットが、ＩＴＵ
から入手可能である。

【０１１１】［２．５記法上の規約］この文書を通じ
て、以下の記法的規約を維持するようにする。・コードブックは草書体文字（例えば次の数１）で表
す。

【数１】・時間信号は、記号と、括弧内のサンプル時間インデッ
クスで表す（例えばｓ（ｎ））。記号ｎはサンプル時刻
インデックスとして使用される。・上付き添字の時間インデックス（例えばｇ^m）は、そ
の変数がサブフレームｍに対応することを表す。・上付き添字は、係数配列の特定の要素を指定する。・＾はパラメータの量子化バージョンを表す。・範囲記述は、角括弧を用いてなされ、境界は含まれる
（例えば［０．６，０．９］）。・ｌｏｇは１０を底とする対数を表す。表２に、この文書を通じて使用される最も重要な記号を
列挙する。最も重要な信号の用語集を表３に与える。表
４は、重要な変数およびその次元を要約している。定数
パラメータを表５に列挙する。この勧告で使用される頭
字語を表６に要約する。

【表２】

【表３】

【表４】

【表５】

【表６】

【０１１２】［３符号器の機能的記述］この節では、
図５のブロックに表された符号器のさまざまな機能につ
いて記述する。

【０１１３】［３．１前処理］第２節で述べたよう
に、音声符号器への入力は１６ビットＰＣＭであると仮
定される。符号化プロセスの前に二つの前処理機能
（１：信号スケーリング、２：高域フィルタリング）が
適用される。

【０１１４】スケーリングは、入力を因子２で除して、
固定小数点実装におけるオーバーフローの可能性を縮小
することからなる。高域フィルタは、好ましくない低周
波成分に対する予防措置として使用される。遮断周波数
１４０Ｈｚの２次極／零点フィルタが使用される。この
フィルタの分子の係数を２で除することによって、スケ
ーリングおよび高域フィルタリングの両方が組み合わさ
れる。結果として得られるフィルタは次式で与えられ
る。

【数２】Ｈ_h1（ｚ）でフィルタリングされた入力信号をｓ（ｎ）
で表す。この信号は後続のすべての符号器作用で使用さ
れる。

【０１１５】［３．２線形予測分析および量子化］短
期の分析フィルタおよび合成フィルタは、１０次線形予
測（ＬＰ）フィルタに基づく。ＬＰ合成フィルタは次式
で定義される。

【数３】ただし、ａ＾ⁱ（ｉ＝１，...，１０）は、（量子化され
た）線形予測（ＬＰ）係数である。短期予測あるいは線
形予測分析は、３０ｍｓの非対称窓による自己相関法を
用いて、音声フレームごとに１回実行される。８０サン
プル（１０ｍｓ）ごとに、窓をかけられた音声の自己相
関係数が計算され、レヴィンソンのアルゴリズムを用い
てＬＰ係数に変換される。その後、これらのＬＰ係数
は、量子化および補間のために、ＬＳＰ領域に変換され
る。補間された、量子化後および量子化前のフィルタは
（各サブフレームにおいて合成フィルタおよび重み付け
フィルタを構成するために）ＬＰフィルタ係数に再び変
換される。

【０１１６】［３．２．１窓および自己相関の計算］
ＬＰ分析窓は二つの部分からなる。第１の部分はハミン
グ窓の半分であり、第２の部分は余弦関数周期の４分の
１である。この窓は次式で与えられる。

【数４】ＬＰ分析には５ｍｓのルックアヘッド（先取り）があ
る。これは、未来の音声フレームから４０サンプルが必
要とされることを意味する。これは、符号器段における
５ｍｓの追加遅延となる。ＬＰ分析窓は、過去の音声フ
レームからの１２０サンプル、現在の音声フレームから
の８０サンプル、および未来のフレームからの４０サン
プルにかかる。ＬＰ分析における窓を図８に図示する。

【０１１７】窓音声の自己相関係数ｓ’（ｎ）＝ｗ_lp（ｎ）ｓ（ｎ），ｎ＝０，...，２３９（４）は、次式によって計算される。

【数５】低レベルの入力信号の算術的問題を回避するため、ｒ
（０）の値はｒ（０）＝１．０という下限を有する。６
０Ｈｚの帯域拡張が、自己相関係数を次式に乗じること
により適用される。

【数６】ただし、ｆ₀＝６０Ｈｚは帯域拡張であり、ｆ_s＝８００
０Ｈｚはサンプリング周波数である。さらに、ｒ（０）
は、白色補正因子１．０００１を乗じられる。これは、
−４０ｄＢにおけるノイズ下限を加えることに同等であ
る。

【０１１８】［３．２．２レヴィンソン＝ダービンの
アルゴリズム］変形自己相関係数ｒ’（０）＝１．０００１ｒ（０）ｒ’（ｋ）＝ｗ_lag（ｋ）ｒ（ｋ），ｋ＝１，...，１０（７）を使用して、次の方程式系を解くことにより、ＬＰフィ
ルタ係数ａ_i（ｉ＝１，...，１０）が得られる。

【数７】式（８）の方程式系は、レヴィンソン＝ダービンのアル
ゴリズムを用いて解かれる。このアルゴリズムは、以下
の反復を使用する。

【数８】最終解はａ_j＝ａ_j ⁽¹⁰⁾（ｊ＝１，...，１０）として与
えられる。

【０１１９】［３．２．３ＬＰからＬＳＰへの変換］
ＬＰフィルタ係数ａ_i（ｉ＝１，...，１０）は、量子化
および補間のために線スペクトル対（ＬＳＰ）表現に変
換される。１０次ＬＰフィルタの場合、ＬＳＰ係数は、
以下のような和および差の多項式の根として定義され
る。Ｆ₁’（ｚ）＝Ａ（ｚ）＋ｚ^-11Ａ（ｚ^-1）（９）Ｆ₂’（ｚ）＝Ａ（ｚ）−ｚ^-11Ａ（ｚ^-1）（１０）多項式Ｆ₁’（ｚ）は対称であり、Ｆ₂’（ｚ）は反対称
である。これらの多項式のすべての根は単位円上にあ
り、互いに交互に現れることを証明することができる。
Ｆ₁’（ｚ）は根ｚ＝−１（ω＝π）を有し、Ｆ₂’
（ｚ）はｚ＝１（ω＝０）を有する。これらの二つの根
を除くため、次のように新たな多項式を定義する。Ｆ₁（ｚ）＝Ｆ₁’（ｚ）／（１＋ｚ^-1）（１１）Ｆ₂（ｚ）＝Ｆ₂’（ｚ）／（１−ｚ^-1）（１２）各多項式は単位円上に５個の共役根（ｅｘｐ（±ｊ
ω_i））を有するため、これらの多項式は次のように書
くことができる。

【数９】ただし、ｑ_i＝ｃｏｓ（ω_i）であり、ω_iは、線スペク
トル周波数（ＬＳＦ）であって順序性０＜ω₁＜ω₂＜・
・・＜ω₁₀＜πを満たす。ｑ_iを余弦領域におけるＬＳ
Ｐ係数と呼ぶ。

【０１２０】多項式Ｆ₁（ｚ）およびＦ₂（ｚ）はいずれ
も対称であるため、各多項式の最初の５個の係数のみを
計算すればよい。これらの多項式の係数は、以下の再帰
的関係式によって求められる。ｆ₁（ｉ＋１）＝ａ_i+1＋ａ_10-i−ｆ₁（ｉ），ｉ＝０，...，４ｆ₂（ｉ＋１）＝ａ_i+1−ａ_10-i＋ｆ₂（ｉ），ｉ＝０，...，４（１５）ただし、ｆ₁（０）＝ｆ₂（０）＝１．０である。ＬＳＰ
係数は、０とπの間の等間隔の６０点で多項式Ｆ
₁（ｚ）およびＦ₂（ｚ）を評価し、符号変化をチェック
することによって求められる。符号変化は根の存在を意
味し、符号変化区間は、根をより良く追跡するために四
つに分割される。チェビシェフ多項式がＦ₁（ｚ）およ
びＦ₂（ｚ）を評価するために使用される。この方法で
は、根は余弦領域｛ｑ_i｝で直接求められる。ｚ＝ｅｘ
ｐ（ｊω）で評価した多項式Ｆ₁（ｚ）およびＦ₂（ｚ）
は次のように書くことができる。

【数１０】ただし、Ｃ（ｘ）＝Ｔ₅（ｘ）＋ｆ（１）Ｔ₄（ｘ）＋ｆ（２）Ｔ₃（ｘ）＋ｆ（３）Ｔ₂（ｘ）＋ｆ（４）Ｔ₁（ｘ）＋ｆ（５）／２（１７）であり、Ｔ_m（ｘ）＝ｃｏｓ（ｍω）は、ｍ次のチェビ
シェフ多項式であり、ｆ（ｉ）（ｉ＝１，...，５）
は、式（１５）を用いて計算したＦ₁（ｚ）またはＦ
₂（ｚ）のいずれかの係数である。多項式Ｃ（ｘ）は、
次の再帰的関係式を用いて、ｘ＝ｃｏｓ（ω）のある値
において評価される。

【数１１】ただし、初期値はｂ₅＝０およびｂ₆＝１である。

【０１２１】［３．２．４ＬＳＰ係数の量子化］ＬＰ
フィルタ係数は、周波数領域におけるＬＳＰ表現を用い
て量子化される。すなわち、 ω_i＝ａｒｃｃｏｓ（ｑ_i），ｉ＝１，...，１０（１８）であり、ただし、ω_iは、正規化された周波数領域
［０，π］における線スペクトル周波数（ＬＳＦ）であ
る。切替４次ＭＡ予測が、ＬＳＦ係数の現在のセットを
予測するために使用される。計算された係数セットと予
測された係数セットの間の差が、２段ベクトル量子化器
を用いて量子化される。第１段は１２８エントリ（７ビ
ット）を有するコードブックＬ１を用いた１０次元ＶＱ
である。第２段は、それぞれ３２エントリ（５ビット）
を含む２個の５次元コードブックＬ２およびＬ３を用い
た分割ＶＱとして実装された１０ビットＶＱである。

【０１２２】量子化プロセスを説明するため、まず復号
プロセスについて記述するのが好都合である。各係数
は、二つのコードブックの和から得られる。

【数１２】ただし、Ｌ１、Ｌ２、およびＬ３はコードブックインデ
ックスである。量子化されたＬＰ合成フィルタにおける
鋭い共鳴を避けるため、係数ｌ_iは、隣接する係数が最
小距離Ｊを有するように配置される。その再配置ルーチ
ンは以下のとおりである。

【数１３】この再配置プロセスは２回実行される。最初はＪ＝０．
００００１という値で実行され、次に、Ｊ＝０．０００
０９５という値で実行される。

【０１２３】この再配置プロセスの後、現在のフレーム
ｎに対する量子化されたＬＳＦ係数ω＾_i ^(m)が、前の量
子化器出力ｌ^(m-k)と、現在の量子化器出力ｌ^(m)の重み
付き和から得られる。

【数１４】ただし、ｍ_i ^kは、切替ＭＡ予測子の係数である。使用す
るＭＡ予測子は、別のビットＬ０によって定義される。
スタートアップ時に、ｌ_i ^(k)の初期値は、すべてのｋ＜
０に対してｌ_i＝ｉπ／１１によって定義される。

【０１２４】ω＾_iを計算した後、対応するフィルタの
安定性がチェックされる。これは以下のように行われ
る。１．係数ω＾_iを値の増大する順に整列する。２．ω＾₁＜０．００５の場合、ω＾₁＝０．００５とす
る。３．ω＾_i+1−ω＾_i＜０．０００１の場合、ω＾_i+1＝
ω＾_i＋０．０００１とする（ｉ＝１，...，９）。４．ω＾₁₀＞３．１３５の場合、ω＾₁₀＝３．１３５と
する。

【０１２５】ＬＳＦパラメータを符号化する手続きにつ
いては以下のようにまとめることができる。二つのＭＡ
予測子のそれぞれに対して、現在のＬＳＦベクトルの最
良近似を求めなければならない。その最良近似は、次の
重み付き平均二乗誤差を最小化するものとして定義され
る。

【数１５】

【０１２６】重みｗ_iは、非量子化ＬＳＦ係数の関数と
して適応化される。

【数１６】さらに、重みｗ₅およびｗ₆にはそれぞれ１．２が乗じら
れる。

【０１２７】現在のフレームに対して量子化されるべき
ベクトルは次式から得られる。

【数１７】

【０１２８】第１のコードブックＬ１が探索され、（重
みなし）平均二乗誤差を最小化するエントリＬ１が選択
される。この後、第２のコードブックＬ２の探索を行
う。これは、第２段の下位部を定義する。可能な各候補
ごとに、式（２０）を用いて部分ベクトルω＾_i（ｉ＝
１，...，５）が再構成され、最小距離０．０００１を
保証するように再配置される。第１段の候補に加算し再
配置した後に重み付きＭＳＥの意味で対応する目標の下
位部を最も良く近似するインデックスＬ２を有するベク
トルが選択される。選択された第１段ベクトルＬ１およ
び第２段の下位部（Ｌ２）を用いて、第２段の上位部が
コードブックＬ３から探索される。この場合も、最小距
離０．０００１を保証するために再配置手続きが用いら
れる。全体の重み付きＭＳＥを最小化するベクトルＬ３
が選択される。

【０１２９】このプロセスは、Ｌ０によって定義される
二つのＭＡ予測子のそれぞれについて行われ、最小の重
み付きＭＳＥを生成するＭＡ予測子Ｌ０が選択される。

【０１３０】［３．２．５ＬＳＰ係数の補間］量子化
された（および量子化されていない）ＬＰ係数が、第２
のサブフレームに対して使用される。第１のサブフレー
ムに対しては、量子化された（および量子化されていな
い）ＬＰ係数は、隣接するサブフレームにおける対応す
るパラメータの線形補間から得られる。この補間は、ｑ
領域におけるＬＳＰ係数に対して行われる。ｑ_i ^(m)を、
フレームｍの第２サブフレームでのＬＳＰ係数とし、ｑ
_i ⁽ ^m-1)を、過去のフレーム（ｍ−１）の第２サブフレー
ムでのＬＳＰ係数とする。これらの２個のサブフレーム
のそれぞれにおける（量子化されていない）補間ＬＳＰ
係数は次式で与えられる。サブフレーム１：ｑ１_i＝０．５ｑ_i ^(m-1)＋０．５ｑ_i ^(m)，ｉ＝１，...，１０サブフレーム２：ｑ２_i＝ｑ_i ^(m)，ｉ＝１，...，１０（２４）同じ補間手続きが、ｑ_iをｑ＾_iに置き換えることによっ
て、量子化されたＬＳＰ係数の補間に使用される。

【０１３１】［３．２．６ＬＳＰからＬＰへの変換］
ＬＳＰ係数は、量子化され補間された後、ＬＰ係数｛ａ
_i｝に変換される。ＬＰ領域への変換は以下のように行
われる。Ｆ₁（ｚ）およびＦ₂（ｚ）の係数は、量子化さ
れ補間されたＬＳＰ係数を既知として式（１３）および
式（１４）を展開することによって求められる。以下の
再帰的関係式が、ｑ_iからｆ_i（ｉ＝１，...，５）を計
算するために使用される。

【数１８】ここで、初期値はｆ₁（０）＝１およびｆ₁（−１）＝０
である。係数ｆ₂（ｉ）は、ｑ_2i-1をｑ_2iで置き換える
ことによって同様に計算される。

【０１３２】係数ｆ₁（ｉ）およびｆ₂（ｉ）が求められ
た後、Ｆ₁（ｚ）およびＦ₂（ｚ）にそれぞれ１＋ｚ^-1お
よび１−ｚ^-1を乗じることにより、Ｆ₁’（ｚ）および
Ｆ₂’（ｚ）が得られる。すなわち、次式のようにな
る。ｆ₁’（ｉ）＝ｆ₁（ｉ）＋ｆ₁（ｉ−１）ｉ＝１，...，５ｆ₂’（ｉ）＝ｆ₂（ｉ）−ｆ₂（ｉ−１）ｉ＝１，...，５（２５）最後に、ＬＰ係数は次式によって得られる。

【数１９】これは、直接関係式Ａ（ｚ）＝（Ｆ₁’（ｚ）＋Ｆ₂’
（ｚ））／２から導出される。Ｆ₁’（ｚ）およびＦ₂’
（ｚ）がそれぞれ対称および反対称の多項式であるため
である。

【０１３３】［３．３知覚的重み付け］知覚的重み付
けフィルタは、量子化前のＬＰフィルタ係数に基づいて
おり、次式で与えられる。

【数２０】 γ₁およびγ₂の値は、フィルタＷ（ｚ）の周波数応答を
決定する。これらの変数の適当な調節により、重み付け
をより効果的にすることが可能である。これは、γ₁お
よびγ₂を、入力信号のスペクトル形状の関数とするこ
とにより達成される。この適応は１０ｍｓフレームごと
に１回行われるが、各第１サブフレームごとに補間手続
きが、この適応プロセスを円滑にするために使用され
る。スペクトル形状は、レヴィンソン＝ダービン漸化式
（第３．２．２節）からの副産物として得られる２次線
形予測フィルタから得られる。反射係数ｋ_iは次式によ
り対数面積比（ＬＡＲ）ｏ_iに変換される。

【数２１】これらのＬＡＲ係数は第２サブフレームに使用される。
第１サブフレームに対するＬＡＲ係数は、前フレームか
らのＬＡＲパラメータとの線形補間により得られ、次式
で与えられる。サブフレーム１：ｏ１_i＝０．５ｏ_i ^(m-1)＋０．５ｏ_i ^(m)，ｉ＝１，２サブフレーム２：ｏ２_i＝ｏ_i ^(m)，ｉ＝１，２（２９）スペクトル包絡線は、平坦（ｆｌａｔ＝１）または傾斜
（ｆｌａｔ＝０）のいずれかとして特徴づけられる。各
サブフレームごとに、この特性は、ＬＡＲ係数にしきい
値関数を適用することによって得られる。急激な変化を
避けるため、前サブフレーム（ｍ−１）におけるｆｌａ
ｔの値を考慮することによるヒステリシスが用いられ
る。

【数２２】サブフレームに対する補間されたスペクトルが平坦であ
る（ｆｌａｔ^(m)＝１）として分類された場合、重み因
子はγ₁＝０．９４およびγ₂＝０．６に設定される。ス
ペクトルが傾斜している（ｆｌａｔ^(m)＝０）として分
類された場合、γ₁の値は０．９８に設定され、γ₂の値
はＬＰ合成フィルタにおける共鳴の強度に適応させられ
るが、０．４と０．７の間に制限される。強い共鳴が存
在する場合、γ₂の値は上限の近くに設定される。この
適応は、現在のサブフレームに対する２個の連続するＬ
ＳＰ係数の間の最小距離に基づく判断基準によって達成
される。この最小距離は次式で与えられる。ｄ_min＝ｍｉｎ［ω_i+1−ω_i］ｉ＝１，...，９（３１）以下の線形関係式が、γ₂を計算するために使用され
る。 γ₂＝−６．０＊ｄ_min＋１．０かつ０．４≦γ₂≦０．７（３２）

【０１３４】１サブフレーム内の重み付き音声信号は次
式で与えられる。

【数２３】重み付き音声信号ｓｗ（ｎ）は、音声フレーム内のピッ
チ遅延の評価を求めるために使用される。

【０１３５】［３．４開ループピッチ分析］最良の適
応コードブック遅延の探索の複雑さを縮小するため、探
索範囲は、開ループピッチ分析から得られる候補遅延Ｔ
_opの付近に制限される。この開ループピッチ分析はフレ
ーム（１０ｍｓ）ごとに１回行われる。開ループピッチ
評価は、式（３３）の重み付き音声信号ｓｗ（ｎ）を使
用し、以下のように行われる。第１ステップでは、相関

【数２４】の３個の極大が、次の三つの範囲から求められる。ｉ＝１：８０，...，１４３ｉ＝２：４０，...，７９ｉ＝３：２０，...，３９保持される極大Ｒ（ｔ_i）（ｉ＝１，...，３）は次式に
より正規化される。

【数２５】これらの３個の正規化された相関のうちの一つが、低い
ほうの範囲における値の遅延が大きくなるようにするこ
とにより選択される。これは、長いほうの遅延に対応す
る正規化相関に重みを付けることによってなされる。最
良の開ループ遅延Ｔ_opは以下のように決定される。

【数２６】

【０１３６】遅延範囲を３セクションに分割し低いほう
のセクションに有利になるようにするこの手続きは、ピ
ッチ倍音を選択することを避けるために用いられる。

【０１３７】［３．５インパルス応答の計算］重み付
き合成フィルタＷ（ｚ）／Ａ＾（ｚ）のインパルス応答
ｈ（ｎ）は、各サブフレームごとに計算される。このイ
ンパルス応答は、適応コードブックおよび固定コードブ
ックの探索のために必要とされる。インパルス応答ｈ
（ｎ）は、零点により延長されたフィルタＡ（ｚ／
γ₁）の係数のベクトルを、２個のフィルタ１／Ａ＾
（ｚ）および１／Ａ（ｚ／γ₂）によってフィルタリン
グすることにより計算される。

【０１３８】［３．６目標信号の計算］適応コードブ
ック探索のための目標信号ｘ（ｎ）は、通常、重み付き
合成フィルタＷ（ｚ）／Ａ＾（ｚ）＝Ａ（ｚ／γ₁）／
［Ａ＾（ｚ）Ａ（ｚ／γ₂）］の０入力応答を、式（３
３）の重み付き音声信号ｓｗ（ｎ）から減算することに
より計算される。これは、サブフレームごとに行われ
る。

【０１３９】この勧告で使用される、目標信号を計算す
る同等な手続きは、合成フィルタ１／Ａ＾（ｚ）と重み
付けフィルタＡ（ｚ／γ₁）／Ａ（ｚ／γ₂）の組合せに
より、ＬＰ残差信号ｒ（ｎ）をフィルタリングすること
である。サブフレームの励振を決定した後、これらのフ
ィルタの初期状態は、ＬＰ残差と励振の間の差をフィル
タリングすることにより更新される。これらのフィルタ
のメモリ更新については第３．１０節で説明する。

【０１４０】目標ベクトルを求めるために必要とされる
残差信号ｒ（ｎ）は、過去の励振のバッファを拡張する
ために適応コードブック探索においても使用される。こ
れは、次節で説明するように、サブフレームサイズであ
る４０より小さい遅延に対する適応コードブック探索手
続きを簡単化する。ＬＰ残差は次式で与えられる。

【数２７】

【０１４１】［３．７適応コードブック探索］適応コ
ードブックパラメータ（あるいはピッチパラメータ）は
遅延および利得である。ピッチフィルタを実装するため
の適応コードブック法では、励振は、サブフレーム長よ
り小さい遅延に対して反復される。探索段では、励振
は、閉ループ探索を簡単化するために、ＬＰ残差により
延長される。適応コードブック探索は（５ｍｓの）サブ
フレームごとに行われる。第１のサブフレームでは、分
解能１／３の分数ピッチ遅延Ｔ₁が範囲［１９（１／
３），８４（２／３）］の範囲で使用され、整数は範囲
［８５，１４３］のみで使用される。第２のサブフレー
ムでは、分解能１／３の遅延Ｔ₂が範囲［（ｉｎｔ）Ｔ₁
−５（２／３），（ｉｎｔ）Ｔ₁＋４（２／３）］の範
囲で常に使用される。ただし、（ｉｎｔ）Ｔ₁は、第１
サブフレームの分数ピッチ遅延Ｔ₁に最も近い整数であ
る。この範囲は、Ｔ₁が遅延範囲の境界にまたがるよう
な場合に適応している。

【０１４２】各サブフレームごとに、最適な遅延が、重
み付き平均二乗誤差を最小化する閉ループ分析を用いて
決定される。第１サブフレームにおいて、遅延Ｔ₁は、
開ループ遅延Ｔ_op（第３．４節参照）付近の遅延値の小
範囲（６サンプル）を探索することにより求められる。
探索境界ｔ_minおよびｔ_maxは次のように定義される。

【数２８】第２サブフレームでは、閉ループピッチ分析は、最適な
遅延Ｔ₂を見つけるために、第１サブフレームで選択さ
れたピッチの付近で行われる。探索境界は、ｔ_min−２
／３とｔ_max＋２／３の間である。ただし、ｔ_minおよび
ｔ_maxはＴ₁から以下のように導出される。

【数２９】

【０１４３】閉ループピッチ探索は、もとの音声と合成
された音声の間の平均二乗重み付き誤差を最小化する。
これは、次の項を最大化することによって達成される。

【数３０】ただし、ｘ（ｎ）は目標信号であり、ｙ_k（ｎ）は、遅
延ｋにおける過去のフィルタリングされた励振（ｈ
（ｎ）と畳込みをとった過去の励振）である。注意すべ
き点であるが、探索範囲はあらかじめ選択された値の付
近に制限されており、その値は、第１サブフレームでは
閉ループピッチＴ_opであり、第２サブフレームではＴ₁
である。

【０１４４】畳込みｙ_k（ｎ）は遅延ｔ_minに対して計算
され、探索範囲ｋ＝ｔ_min＋１，...，ｔ_maxではその他
の整数遅延に対して計算され、次の再帰的関係式を用い
て更新される。ｙ_k（ｎ）＝ｙ_k-1（ｎ−１）＋ｕ（−ｋ）ｈ（ｎ），ｎ＝３９，...，０（３８）ただし、ｕ（ｎ）（ｎ＝−１４３，...，３９）は励振
バッファであり、ｙ_k-1（−１）＝０である。注意すべ
き点であるが、探索段では、サンプルｕ（ｎ）（ｎ＝
０，...，３９）は未知であり、これらは４０より小さ
いピッチ遅延に対して必要とされる。探索を簡単化する
ため、式（３８）の関係がすべての遅延に対して妥当に
なるように、ＬＰ残差がｕ（ｎ）にコピーされる。

【０１４５】Ｔ₂の決定、および、最適整数閉ループ遅
延が８４より小さい場合にはＴ₁の決定のため、最適整
数遅延付近の分数をテストしなければならない。分数ピ
ッチ探索は、式（３７）における正規化相関を補間し、
その最大値を探索することによりなされる。補間は、ｓ
ｉｎｃ関数を±１１で切り落とし±１２で０を埋め合わ
せた（ｂ₁₂（１２）＝０）ハミング窓ｓｉｎｃ関数に基
づくＦＩＲフィルタｂ₁₂を用いてなされる。このフィル
タは、オーバーサンプリング領域内の３６００Ｈｚに遮
断周波数（−３ｄＢ）を有する。分数−２／３、−１／
３、０、１／３、および２／３に対して補間されたＲ
（ｋ）の値は、次の補間公式を用いて得られる。

【数３１】ただし、ｔ＝０、１、２はそれぞれ分数０、１／３、お
よび２／３に対応する。注意すべき点であるが、正しい
補間を行うためには、範囲ｔ_min−４，ｔ_max＋４を用い
て式（３７）における相関項を計算することが必要であ
る。

【０１４６】［３．７．１適応コードブックベクトル
の生成］非整数のピッチ遅延が決定された後、適応コー
ドブックベクトルｖ（ｎ）が、与えられた整数遅延ｋに
おける過去の励振信号ｕ（ｎ）と分数ｔを補間すること
によって次のように計算される。

【数３２】補間フィルタｂ₃₀は、ｓｉｎｃ関数を±２９で切り落と
し±３０で０を埋め合わせた（ｂ₃₀（３０）＝０）ハミ
ング窓ｓｉｎｃ関数に基づく。このフィルタは、オーバ
ーサンプリング領域において３６００Ｈｚに遮断周波数
（−３ｄＢ）を有する。

【０１４７】［３．７．２適応コードブック遅延に対
する符号語計算］ピッチ遅延Ｔ₁は第１サブフレームに
おいて８ビットで符号化され、第２サブフレームにおけ
る相対遅延は５ビットで符号化される。分数遅延Ｔは、
その整数部分（ｉｎｔ）Ｔと、分数部分ｆｒａｃ／３
（ｆｒａｃ＝−１，０，１）によって表現される。ピッ
チインデックスＰ１は次のように符号化される。

【数３３】

【０１４８】ピッチ遅延Ｔ₂の値は、Ｔ₁の値に対して相
対的に符号化される。前と同じ解釈を用いて、整数部分
（ｉｎｔ）Ｔ₂と、分数部分ｆｒａｃ／３（ｆｒａｃ＝
−１，０，１）によって表現される分数遅延Ｔ₂は、次
のように符号化される。Ｐ２＝（（ｉｎｔ）Ｔ₂−ｔ_min）＊３＋ｆｒａｃ＋２（４２）ただし、ｔ_minは前と同様にＴ₁から導出される。

【０１４９】ランダムビット誤りに対して符号器をより
強固にするため、第１サブフレームの遅延インデックス
に対してパリティビットＰ０が計算される。このパリテ
ィビットは、Ｐ１の６個の上位ビットに対するＸＯＲ演
算により生成される。復号器で、このパリティビットは
再計算され、再計算結果の値が送信された値と一致しな
い場合、誤り隠蔽手続きが適用される。

【０１５０】［３．７．３適応コードブック利得の計
算］適応コードブック遅延が決定された後、適応コード
ブック利得ｇ_pが次のように計算される。

【数３４】ただし、ｙ（ｎ）は、フィルタリングされた適応コード
ブックベクトル（ｖ（ｎ）に対するＷ（ｚ）／Ａ＾
（ｚ）の０状態応答）である。このベクトルは、ｖ
（ｎ）とｈ（ｎ）の畳込みをとることにより得られる。

【数３５】注意すべき点であるが、式（３７）内の項を最大化する
ことにより、ほとんどの場合ｇ_p＞０である。信号が負
の相関のみを含む場合、ｇ_pの値は０に設定される。

【０１５１】［３．８固定コードブック：構造および
探索］固定コードブックは、インタリーブされた単一パ
ルス置換（ＩＳＳＰ）設計を用いた代数的コードブック
構造に基づく。このコードブックでは、各コードブック
ベクトルは４個の非零パルスを含む。各パルスは＋１ま
たは−１のいずれかの振幅を有することが可能であり、
表７に与えられる位置をとることが可能である。

【表７】

【０１５２】コードブックベクトルｃ（ｎ）は、零ベク
トルをとり、求められた位置に４個の単位パルスを置
き、対応する符号を乗じることによって構成される。ｃ（ｎ）＝ｓ０δ（ｎ−ｉ０）＋ｓ１δ（ｎ−ｉ１）＋ｓ２δ（ｎ−ｉ２）＋ｓ３δ（ｎ−ｉ３），ｎ＝０，...，３９（４５）ただし、δ（０）は単位パルスである。このコードブッ
クに組み込まれた特徴は、選択されるコードブックベク
トルが、合成される音声の品質を改善するように倍音成
分を増強する適応前置フィルタＰ（ｚ）によりフィルタ
リングされることである。ここで、このフィルタとして
はＰ（ｚ）＝１／（１−βｚ^-T）（４６）が使用される。ただし、Ｔは現在のサブフレームのピッ
チ遅延の整数成分であり、βはピッチ利得である。βの
値は、０．２から０．８までに制限される前サブフレー
ムからの量子化された適応コードブック利得を用いるこ
とによって適応化される。 β＝ｇ＾_p ^(m-1) ０．２≦β≦０．８（４７）このフィルタは、サブフレームサイズ４０より小さい遅
延に対して倍音構造を増強する。この修正は、次式に従
ってインパルス応答ｈ（ｎ）を修正することにより固定
コードブック探索に組み込まれる。ｈ（ｎ）＝ｈ（ｎ）＋βｈ（ｎ−Ｔ），ｎ＝Ｔ，...，３９（４８）

【０１５３】［３．８．１固定コードブック探索手続
き］固定コードブックは、式（３３）の重み付き入力音
声ｓｗ（ｎ）と、重み付き再構成音声の間の平均二乗誤
差を最小化することによって探索される。閉ループピッ
チ探索で使用される目標信号は、適応コードブック寄与
を減算することによって更新される。すなわち次式のよ
うになる。ｘ₂（ｎ）＝ｘ（ｎ）−ｇ_pｙ（ｎ），ｎ＝０，...，３９（４９）ただし、ｙ（ｎ）は、式（４４）のフィルタリングされ
た適応コードブックベクトルである。

【０１５４】行列Ｈは、対角線にｈ（０）を有し下対角
線にｈ（１），...，ｈ（３９）を有する下三角テープ
リッツ畳込み行列として定義される。ｃ_kがインデック
スｋにおける代数的コードベクトルである場合、コード
ブックは、次の項を最大化することによって探索され
る。

【数３６】ただし、ｄ（ｎ）は、目標信号ｘ₂（ｎ）とインパルス
応答ｈ（ｎ）の間の相関であり、Φ＝Ｈ^tＨは、ｈ
（ｎ）の相関行列である。信号ｄ（ｎ）および行列Φは
コードブック探索の前に計算される。ｄ（ｎ）の要素は
次式から計算される。

【数３７】また、対称行列Φの要素は次式によって計算される。

【数３８】

【０１５５】注意すべき点であるが、探索手続きを高速
化するために、必要な要素のみが計算され、効率的な記
憶手続きが設計されている。

【０１５６】コードブックＣの代数的構造により、コー
ドブックベクトルｃ_kは非零パルスを４個だけ含むた
め、高速な探索手続きが可能となる。与えられたベクト
ルｃ_kに対して式（５０）の分子の相関は次式で与えら
れる。

【数３９】ただし、ｍ_iはｉ番目のパルスの位置であり、ａ_iはその
振幅である。式（５０）の分母のエネルギーは次式で与
えられる。

【数４０】

【０１５７】探索手続きを簡単化するため、パルス振幅
は、信号ｄ（ｎ）を量子化することによってあらかじめ
決定される。これは、ある位置におけるパルスの振幅を
その位置におけるｄ（ｎ）の符号に等しいと設定するこ
とによってなされる。コードブック探索の前に、以下の
ステップが実行される。第１に、信号ｄ（ｎ）が二つの
信号、すなわち、絶対値信号ｄ’（ｎ）＝｜ｄ（ｎ）｜
と、符号信号ｓｉｇｎ［ｄ（ｎ）］に分解される。第２
に、行列Φは、符号情報を含むように修正される。すな
わち、次式のようになる。 φ’（ｉ，ｊ）＝ｓｉｇｎ［ｄ（ｉ）］ｓｉｇｎ［ｄ（ｊ）］φ（ｉ，ｊ），ｉ＝０，...，３９，ｊ＝ｉ，...，３９（５５）式（５４）における因子２を除去するため次のように置
く。 φ’（ｉ，ｉ）＝０．５φ（ｉ，ｉ），ｉ＝０，...，３９（５６）すると、式（５３）の相関は次式で与えられる。Ｃ＝ｄ’（ｍ₀）＋ｄ’（ｍ₁）＋ｄ’（ｍ₂）＋ｄ’（ｍ₃）（５７）また、式（５４）のエネルギーは次式で与えられる。

【数４１】

【０１５８】探索手続きをさらに簡単化するために集中
探索法が用いられる。この方法では、最後のループには
入る前に、あらかじめ計算されたしきい値がテストさ
れ、このしきい値を越える場合に限りループに入る。コ
ードブックのうちの小さい割合を探索するように、ルー
プに入ることが可能な最大回数は固定される。しきい値
は、相関Ｃに基づいて計算される。コードブック探索の
前に、最初の３個のパルスの寄与による最大絶対相関お
よび平均相関（ｍａｘ₃およびａｖ₃）が求められる。し
きい値は次式で与えられる。ｔｈｒ₃＝ａｖ₃＋Ｋ₃（ｍａｘ₃−ａｖ₃）（５９）絶対相関（３個のパルスによる）がｔｈｒ₃を越えると
きに限り第４のループに入る。ただし０≦Ｋ₃＜１であ
る。Ｋ₃の値は、コードブック探索の割合を制御し、こ
こでは０．４に設定される。注意すべき点であるが、こ
の結果、探索時間は可変となり、探索をさらに制御する
には、最終ループに入る回数（２個のサブフレームに対
して）はある最大値を越えることはできない。この最大
値はここでは１８０（サブフレームあたり最悪の場合が
平均９０回）に設定される。

【０１５９】［３．８．２固定コードブックの符号語
計算］パルスｉ０、ｉ１、およびｉ２のパルス位置はそ
れぞれ３ビットで符号化され、ｉ３の位置は４ビットで
符号化される。各パルス振幅は１ビットで符号化され
る。これにより、４パルスに対して全部で１７ビットと
なる。符号が正の場合ｓ＝１、符号が負の場合ｓ＝０と
定義することにより、符号符号語は次式から得られる。Ｓ＝ｓ０＋２＊ｓ１＋４＊ｓ２＋８＊ｓ３（６０）また、固定コードブック符号語は次式から得られる。Ｃ＝（ｉ０／５）＋８＊（ｉ１／５）＋６４＊（ｉ２／５）＋５１２＊（２＊（ｉ３／５）＋ｊｘ）（６１）ただし、ｉ３＝３，８，...の場合ｊｘ＝０であり、ｉ
３＝４，９，...の場合ｊｘ＝１である。

【０１６０】［３．９利得の量子化］適応コードブッ
ク利得（ピッチ利得）および固定（代数的）コードブッ
ク利得は７ビットを用いてベクトル量子化される。利得
コードブック探索は、もとの音声と再構成音声の間の平
均二乗重み付き誤差を最小化することによってなされ
る。この誤差は次式で与えられる。Ｅ＝ｘ^tｘ＋ｇ_p ²ｙ^tｙ＋ｇ_c ²ｚ^tｚ−２ｇ_pｘ^tｙ−２ｇ_cｘ^tｚ＋２ｇ_pｇ_cｙ^t ｚ（６２）ただし、ｘは目標ベクトル（第３．６節参照）、ｙは式
（４４）のフィルタリングされた適応コードブックベク
トル、および、ｚは、次式のように、固定コードブック
ベクトルとｈ（ｎ）の畳込みである。

【数４２】

【０１６１】［３．９．１利得予測］固定コードブッ
ク利得ｇ_cは次のように表すことができる。ｇ_c＝γｇ_c’ （６４）ただし、ｇ_c’は、以前の固定コードブックエネルギー
に基づいて予測される利得であり、γは補正因子であ
る。

【０１６２】固定コードブック寄与の平均エネルギーは
次式で与えられる。

【数４３】固定コードブック利得ｇ_cでベクトルｃ_iをスケールした
後、スケールされた固定コードブックのエネルギーは２
０ｌｏｇ（ｇ_c）＋Ｅで与えられる。Ｅ^(m)を、次式で与
えられる、サブフレームｍにおける（スケールされた）
固定コードブック寄与の平均除去エネルギー（単位ｄ
Ｂ）とする。Ｅ^(m)＝２０ｌｏｇ（ｇ_c）＋Ｅ−Ｅただし、Ｅ＝３０ｄＢは、固定コードブック励振の平均
エネルギーである。利得ｇ_cは、Ｅ^(m)、Ｅ、およびＥの
関数として次のように表すことができる。

【数４４】

【０１６３】予測利得ｇ_c’は、以前の固定コードブッ
ク寄与の対数エネルギーから現在の固定コードブック寄
与の対数エネルギーを予測することによって求められ
る。４次ＭＡ予測は以下のように行われる。予測エネル
ギーは次式で与えられる。

【数４５】ただし、［ｂ₁ ｂ₂ ｂ₃ ｂ₄］＝［０．６８０．５
８０．３４０．１９］はＭＡ予測係数であり、Ｒ＾
^(m)は、サブフレームｍにおける予測誤差Ｒ^(m)の量子化
バージョンであって次式で定義される。Ｒ^(m)＝Ｅ^(m)−Ｒ＾^(m) （６９）

【０１６４】予測利得ｇ_c’は、式（６７）においてＥ
^(m)をその予測値で置き換えることによって求められ
る。

【数４６】補正因子γは、次式によって利得予測誤差と関係づけら
れる。Ｒ^(m)＝Ｅ^(m)−Ｅ ^(m)＝２０ｌｏｇ（γ）（７１）

【０１６５】［３．９．２利得量子化のためのコード
ブック探索］適応コードブック利得ｇ_pおよび補正因子
γは、２段共役構造化コードブックを用いてベクトル量
子化される。第１段は、３ビットの２次元コードブック
ＧＡからなり、第２段は、４ビットの２次元コードブッ
クＧＢからなる。各コードブックにおける第１の要素
は、量子化された適応コードブック利得ｇ＾_pを表し、
第２の要素は、量子化された固定コードブック利得補正
因子γ＾を表す。ＧＡおよびＧＢそれぞれに対するコー
ドブックインデックスｍおよびｎが与えられた場合、量
子化された適応コードブック利得は次式で与えられる。

【数４７】また、量子化された固定コードブック利得は次式で与え
られる。

【数４８】

【０１６６】この共役構造は、前選択プロセスを適用す
ることによって、コードブック探索を簡単化する。最適
なピッチ利得ｇ_pおよび固定コードブック利得ｇ_cは式
（６２）から導出され、前選択のために使用される。コ
ードブックＧＡは８個のエントリを含み、その第２の要
素（ｇ_cに対応する）は一般に第１の要素（ｇ_pに対応す
る）よりも大きい値を有する。このバイアスにより、ｇ
_cの値を用いた前選択が可能となる。この前選択プロセ
スでは、第２の要素がｇｘ_cに近いような４個のベクト
ルからなるクラスタがｇ_cおよびｇ_pから導出される。同
様に、コードブックＧＢは１６個のエントリを含み、そ
れらのエントリは第１の要素（ｇ_pに対応する）へ向か
うバイアスを有する。第１の要素がｇ_pに近いような８
個のベクトルからなるクラスタが選択される。こうし
て、各コードブックごとに、最良の５０％の候補ベクト
ルが選択される。この後、２個のインデックスの組合せ
が式（６２）の重み付き平均二乗誤差を最小化するよう
に、残りの４×８＝３２個の可能性にわたる全数探索が
行われる。

【０１６７】［３．９．３利得量子化器に対する符号
語計算］利得量子化器に対する符号語ＧＡおよびＧＢ
は、最良選択に対応するインデックスから得られる。単
一ビット誤りの影響を軽減するため、コードブックイン
デックスはマッピングされる。

【０１６８】［３．１０メモリ更新］合成フィルタお
よび重み付けフィルタの状態の更新が、次のサブフレー
ムにおける目標信号の計算のために必要である。二つの
利得が量子化された後、現在のサブフレームの励振信号
ｕ（ｎ）は次式により求められる。ｕ（ｎ）＝ｇ＾_pｖ（ｎ）＋ｇ＾_cｃ（ｎ），ｎ＝０，...，３９（７４）ただし、ｇ＾_pおよびｇ＾_cは、それぞれ、量子化された
適応コードブックおよび固定コードブックの利得であ
り、ｖ（ｎ）は適応コードブックベクトル（補間された
過去の励振）であり、ｃ（ｎ）は固定コードブックベク
トル（ピッチ先鋭化を含む代数的コードベクトル）であ
る。フィルタの状態は、４０サンプルのサブフレームに
対してフィルタ１／Ａ＾（ｚ）およびＡ（ｚ／γ₁）／
Ａ（ｚ／γ₂）により信号ｒ（ｎ）−ｕ（ｎ）（残差と
励振の差）をフィルタリングし、フィルタの状態を保存
することによって更新することができる。これは、三つ
のフィルタ動作を必要とする。１回のフィルタリングし
か必要としないさらに簡単な方法は以下のとおりであ
る。局所合成音声ｓ＾（ｎ）が、１／Ａ＾（ｚ）により
励振信号をフィルタリングすることによって計算され
る。入力ｒ（ｎ）−ｕ（ｎ）によるこのフィルタの出力
は、ｅ（ｎ）＝ｓ（ｎ）−ｓ＾（ｎ）と等価である。従
って、合成フィルタ１／Ａ＾（ｚ）の状態はｅ（ｎ）
（ｎ＝３０，...，３９）によって与えられる。フィル
タＡ（ｚ／γ₁）／Ａ（ｚ／γ₂）の状態の更新は、誤差
信号ｅ（ｎ）をこのフィルタによりフィルタリングして
知覚的重み付き誤差ｅｗ（ｎ）を求めることにより行う
ことができる。しかし、信号ｅｗ（ｎ）は、次式によっ
ても求めることができる。ｅｗ（ｎ）＝ｘ（ｎ）−ｇ＾_pｙ（ｎ）＋ｇ＾_cｚ（ｎ）（７５）信号ｘ（ｎ）、ｙ（ｎ）、およびｚ（ｎ）は利用可能で
あるため、重み付けフィルタの状態は、ｎ＝３
０，...，３９に対して式（７５）のようにしてｅｗ
（ｎ）を計算することにより更新される。これにより、
２回のフィルタ動作が節約される。

【０１６９】［３．１１符号器および復号器の初期
化］すべての静的な符号器変数は、表８に列挙した変数
を除いては０に初期化される。これらの変数は復号器に
対しても同様に初期化する必要がある。

【表８】

【０１７０】［４復号器の機能的記述］復号器におけ
る信号フローを図７に示した。まず、パラメータ（ＬＰ
係数、適応コードブックベクトル、固定コードブックベ
クトル、および利得）が復号される。これらの復号され
たパラメータは、再構成音声信号を計算するために使用
される。このプロセスを第４．１節で説明する。この再
構成信号は、ポストフィルタおよび高域フィルタからな
る後処理動作によって増強される（第４．２節）。第
４．３節では、パリティ誤りが起きたとき、または、フ
レーム消失フラグがセットされたときに使用される誤り
隠蔽手続きについて説明する。

【０１７１】［４．１パラメータ復号手続き］送信さ
れるパラメータを図９に列挙する。起動時には、すべて
の静的符号器変数は、表８に列挙した変数を除いては０
に初期化される。復号プロセスは、以下の順序で行われ
る。

【表９】

【０１７２】［４．１．１ＬＰフィルタパラメータの
復号］受信したＬＳＰ量子化器のインデックスＬ０、Ｌ
１、Ｌ２、およびＬ３は、第３．２．４節で説明した手
続きで用いられる量子化ＬＳＰ係数を再構成するために
使用される。第３．２．５節で説明した補間手続きを用
いて、２個の補間ＬＳＰベクトル（２このサブフレーム
に対応する）を得る。各サブフレームごとに、補間ＬＳ
ＰベクトルはＬＰフィルタ係数ａ_iに変換され、これら
は、そのサブフレームにおける再構成音声を合成するた
めに使用される。

【０１７３】以下のステップが、各サブフレームごとに
反復される。１．適応コードブックベクトルの復号。２．固定コードブックベクトルの復号。３．適応コードブックおよび固定コードブックの利得の
復号。４．再構成音声の計算。

【０１７４】［４．１．２適応コードブックベクトル
の復号］受信した適応コードブックインデックスは、ピ
ッチ遅延の整数部分および小数部分を求めるために使用
される。Ｔ₁の整数部分（ｉｎｔ）Ｔ₁および小数部分ｆ
ｒａｃはＰ１から以下のようにして得られる。

【数４９】

【０１７５】Ｔ₂の整数部分および小数部分はＰ２およ
びｔ_minから以下のようにして得られる。ｔ_minはＰ１か
ら導出される。

【数５０】ここでＴ₂は次のようにして得られる。

【数５１】

【０１７６】適応コードブックベクトルｖ（ｎ）は、式
（４０）を用いて（ピッチ遅延における）過去の励振ｕ
（ｎ）を補間することにより求められる。

【０１７７】［４．１．３固定コードブックベクトル
の復号］受信した固定コードブックインデックスＣは、
励振パルスの位置を抽出するために使用される。パルス
の符号はＳから得られる。パルスの位置および符号が復
号されると、固定コードブックベクトルｃ（ｎ）を構成
することができる。ピッチ遅延Ｔの整数部分がサブフレ
ームサイズ４０より小さい場合、ピッチ増強手続きが適
用され、式（４８）に従ってｃ（ｎ）を修正する。

【０１７８】［４．１．４適応コードブックおよび固
定コードブックの利得の復号］受信した利得コードブッ
クインデックスは、適応コードブック利得ｇ＾_pおよび
固定コードブック利得補正因子γ＾を与える。この手続
きは第３．９節に詳細に説明した。推定される固定コー
ドブック利得ｇ_c’は式（７０）を用いて求められる。
固定コードブックベクトルは、量子化された利得補正因
子と、この予測利得との積から得られる（式（６
４））。適応コードブック利得は式（７２）を用いて再
構成される。

【０１７９】［４．１．５パリティビットの計算］音
声を再構成する前に、パリティビットが、適応コードブ
ック遅延から再計算される（第３．７．２節）。このビ
ットが送信されたパリティビットＰ０と同一でない場
合、送信中にビット誤りが生じた可能性があり、第４．
３節の誤り隠蔽手続きが使用される。

【０１８０】［４．１．６再構成音声の計算］合成フ
ィルタの入力における励振ｕ（ｎ）（式（７４）参照）
は、ＬＰ合成フィルタへの入力である。サブフレームに
対する再構成音声は次式で与えられる。

【数５２】ただし、ａ＾_iは、補間されたＬＰフィルタ係数であ
る。

【０１８１】その後、再構成音声ｓ＾（ｎ）は、時節で
説明するポストプロセッサによって処理される。

【０１８２】［４．２後処理］後処理は三つの機能、
すなわち、適応ポストフィルタリング、高域フィルタリ
ング、および信号アップスケーリングからなる。適応ポ
ストフィルタは、３個のフィルタ、すなわち、ピッチポ
ストフィルタＨ_p（ｚ）、短期ポストフィルタＨ
_f（ｚ）、および傾斜補償フィルタＨ_t（ｚ）のカスケー
ドである。ポストフィルタは、５ｍｓのサブフレームご
とに更新される。ポストフィルタリングプロセスは以下
のように編成される。最初に、合成音声ｓ＾（ｎ）は、
Ａ＾（ｚ／γ_n）により逆フィルタリングされ、残差信
号ｒ＾（ｎ）を生成する。信号ｒ＾（ｎ）は、ピッチ遅
延Ｔおよび利得ｇ_pitを計算するために用いられる。信
号ｒ＾（ｎ）は、ピッチポストフィルタＨ_p（ｚ）によ
りフィルタリングされて信号ｒ’（ｎ）が生成される。
続いて信号ｒ’（ｎ）は、合成フィルタ１／［ｇ_fＡ＾
（ｚ／γ_d）］によりフィルタリングされる。最後に、
合成フィルタ１／［ｇ_fＡ＾（ｚ／γ_d）］の出力信号
は、傾斜補償フィルタＨ_t（ｚ）を通り、ポストフィル
タリングされた合成音声信号ｓｆ（ｎ）が生成される。
その後、適応利得制御がｓｆ（ｎ）とｓ＾（ｎ）の間に
適用され、信号ｓｆ’（ｎ）が生成される。その後、高
域フィルタリングおよびスケーリング操作が、ポストフ
ィルタリングされた信号ｓｆ’（ｎ）に作用する。

【０１８３】［４．２．１ピッチポストフィルタ］ピ
ッチ（倍音）ポストフィルタは次式で与えられる。

【数５３】ただし、Ｔはピッチ遅延である。また、ｇ₀は次式で与
えられる利得因子である。ｇ₀＝γ_pｇ_pit （７８）ただし、ｇ_pitはピッチ利得である。ピッチ遅延および
ピッチ利得はいずれも、復号器出力信号から決定され
る。注意すべき点であるが、ｇ_pitは１を限界とし、ピ
ッチ予測利得が３ｄＢより小さい場合には０に設定され
る。因子γ_pは、倍音ポストフィルタリングの量を制御
し、γ_p＝０．５という値を有する。ピッチ遅延および
ピッチ利得は、音声ｓ＾（ｎ）をＡ＾（ｚ／γ_n）でフ
ィルタリングすることによって得られる残差信号ｒ＾
（ｎ）から計算される。残差信号ｒ＾（ｎ）は、次式の
ように、短期ポストフィルタの分子である（第４．２．
２節参照）。

【数５４】ピッチ遅延は、２パス手続きを用いて計算される。第１
パスは、範囲［Ｔ₁−１，Ｔ₁＋１］において最良の整数
Ｔ₀を選択する。ただし、Ｔ₁は第１サブフレームにおけ
る（送信された）ピッチ遅延の整数部分である。最良の
整数遅延は、次式の相関を最大化するものである。

【数５５】第２パスは、Ｔ₀の周りで分解能１／８で最良の分数遅
延Ｔを選択する。これは、次式の正規化相関を最大にす
る遅延を求めることによりなされる。

【数５６】ただし、ｒ＾_k（ｎ）は、遅延ｋにおける残差信号であ
る。最適遅延Ｔが求められた後、対応する相関値がしき
い値と比較される。Ｒ’（Ｔ）＜０．５の場合、倍音ポ
ストフィルタは、ｇ_pit＝０と設定することによって無
効化される。そうでない場合、ｇ_pitの値は次式から計
算される。

【数５７】非整数遅延信号ｒ＾_k（ｎ）は、まず、長さ３３の補間
フィルタを用いて計算される。Ｔの選択後、ｒ＾
_k（ｎ）は、より長い長さ１２９の補間フィルタで再計
算される。この新しい信号は、長いほうのフィルタが
Ｒ’（Ｔ）の値を増加させた場合に限り前の値を置き換
える。

【０１８４】［４．２．２短期ポストフィルタ］短期
ポストフィルタは次式で与えられる。

【数５８】ただし、Ａ＾（ｚ）は受信された量子化ＬＰ逆フィルタ
（ＬＰ分析は復号器では行われない）であり、因子γ_n
およびγ_dは短期ポストフィルタリングの量を制御し、
γ_n＝０．５５およびγ_d＝０．７に設定される。利得項
ｇ_fは、フィルタＡ＾（ｚ／γ_n）／Ａ＾（ｚ／γ_d）の
打切りインパルス応答ｈ_f（ｎ）に対して計算され、次
式で与えられる。

【数５９】

【０１８５】［４．２．３傾斜補償］最後に、フィル
タＨ_t（ｚ）は、短期ポストフィルタＨ_f（ｚ）における
傾斜を補償し、次式で与えられる。

【数６０】ただし、γ_tｋ₁は傾斜因子であり、ｋ₁はｈ_f（ｎ）に対
して計算された第１反射係数であり、次式で与えられ
る。

【数６１】利得項ｇ_t＝１−｜γ_tｋ₁｜は、Ｈ_f（ｚ）におけるｇ_f
の減少効果を補償する。さらに、積フィルタＨ_f（ｚ）
Ｈ_t（ｚ）は一般に利得がないことが示されている。

【０１８６】γ_tに対する二つの値が、ｋ₁の符号に応じ
て用いられる。ｋ₁が負の場合、γ_t＝０．９であり、ｋ
₁が正の場合、γ_t＝０．２である。

【０１８７】［４．２．４適応利得制御］適応利得制
御は、再構成音声信号ｓ＾（ｎ）とポストフィルタリン
グされた信号ｓｆ（ｎ）の間の利得差を補償するために
用いられる。現在のサブフレームに対する利得スケール
因子Ｇは次式により計算される。

【数６２】ポストフィルタリングされ利得スケーリングされた信号
ｓｆ’（ｎ）は次式で与えられる。ｓｆ’（ｎ）＝ｇ（ｎ）ｓｆ（ｎ），ｎ＝０，...，３９（８８）ただし、ｇ（ｎ）は、サンプルごとに更新され、次式で
与えられる。ｇ（ｎ）＝０．８５ｇ（ｎ−１）＋０．１５Ｇ，ｎ＝０，...，３９（８９）ｇ（−１）の初期値は１．０である。

【０１８８】［４．２．５高域フィルタリングおよび
アップスケーリング］遮断周波数１００Ｈｚにおける高
域フィルタが、再構成されポストフィルタリングされた
音声ｓｆ’（ｎ）に適用される。このフィルタは次式で
与えられる。

【数６３】

【０１８９】アップスケーリングは、高域フィルタリン
グされた出力に因子２を乗じて入力信号レベルを取得す
ることからなる。

【０１９０】［４．３フレーム消失およびパリティ誤
りの隠蔽］ビットストリームにおけるフレーム消失また
はランダム誤りによる再構成音声の劣化を縮小するた
め、復号器に誤り隠蔽手続きが組み込まれている。この
誤り隠蔽手続きは、（ｉ）符号器パラメータのフレーム
（１０ｍｓフレームに対応する）が消失していると識別
されたとき、または（ｉｉ）ピッチ遅延インデックスＰ
１に対するパリティビットにチェックサム誤りが生じた
ときに機能する。後者は、ビットストリームがランダム
ビット誤りによって破損したときにも起こりうる。

【０１９１】パリティ誤りがＰ１に生じた場合、遅延値
Ｔ₁は前フレームの遅延の値に設定される。Ｔ₂の値は、
この新しいＴ₁の値を用いて、第４．１．２節で概説し
た手続きで導出される。連続してパリティ誤りが生じた
場合、Ｔ₁の前の値を１だけインクリメントして使用す
る。

【０１９２】フレーム消失を検出する機構はこの勧告で
は定義されず、アプリケーションに依存することにな
る。隠蔽ストラテジは、前に受信した情報に基づいて現
在のフレームを再構成しなければならない。使用される
方法は、欠けている励振信号を、類似の特性のうちの一
つにより、そのエネルギーを徐々に減衰させながら置換
する。これは、長期予測利得に基づく有声分類子を使用
することによってなされる。長期予測利得は、長期ポス
トフィルタ分析の一部として計算される。ピッチポスト
フィルタ（第４．２．１節参照）は、予測利得が３ｄＢ
より大きい長期予測子を求める。これは、正規化相関
Ｒ’（ｋ）（式（８１））に対するしきい値を０．５に
設定することによってなされる。誤り隠蔽プロセスに対
して、これらのフレームは周期的と分類される。それ以
外の場合、フレームは非周期的であると宣言される。消
失したフレームは、先行する（再構成された）音声フレ
ームからそのクラスを継承する。注意すべき点である
が、有声分類は、この再構成音声信号に基づいて絶えず
更新される。従って、多くの連続する消失フレームに対
しては分類は変わることがある。一般に、これは、もと
の分類が周期的であった場合にのみ起こる。

【０１９３】消失フレームに対してとられる具体的ステ
ップは以下の通りである。１．ＬＰフィルタパラメータの反復。２．適応コードブックおよび固定コードブックの利得の
減衰。３．利得予測子のメモリの減衰。４．置換励振の生成。

【０１９４】［４．３．１ＬＰフィルタパラメータの
反復］最後の良好なフレームのＬＰパラメータが使用さ
れる。ＬＳＦ予測子の状態は、受信符号語ｌ_iの値を含
む。現在の符号語が利用可能でないため、これは、反復
されたＬＳＦパラメータω＾_iおよび予測子メモリから
次式により計算される。

【数６４】

【０１９５】［４．３．２適応コードブックおよび固
定コードブックの利得の減衰］前の固定コードブック利
得の減衰バージョンが使用される。ｇ_c ^(m)＝０．９８ｇ_c ^(m-1) （９２）適応コードブック利得に対しても同じことが行われる。
さらに、クリッピング作用を用いてその値を０．９未満
に保つ。ｇ_p ^(m)＝０．９０ｇ_p ^(m-1)かつｇ_p ^(m)＜０．９（９３）

【０１９６】［４．３．３利得予測子のメモリの減
衰］利得予測子は、以前に選択されたコードブックのエ
ネルギーを用いる。良好なフレームを受信した後の符号
器の滑らかな連続性を可能にするため、利得予測子のメ
モリは、コードブックエネルギーの減衰バージョンで更
新される。現在のサブフレームｎに対するＲ＾^(m)の値
は、平均した量子化利得予測誤りを４ｄＢだけ減衰させ
たものに設定される。

【数６５】

【０１９７】［４．３．４置換励振の生成］使用され
る励振は、周期性分類に依存する。最後に正しく受信し
たフレームが周期的であると分類された場合、現在のフ
レームも同様に周期的であるとみなされる。その場合、
適応コードブックのみが使用され、固定コードブック寄
与は０に設定される。ピッチ遅延は最後に正しく受信し
たピッチ遅延に基づき、後続の各フレームに対して反復
される。過度の周期性を回避するため、遅延は、次のサ
ブフレームごとに１だけ増加されるが、１４３を限度と
する。適応コードブック利得は、式（９３）に滴って減
衰した値に基づく。

【０１９８】最後に正しく受信したフレームが非周期的
であると分類された場合、現在のフレームも同様に非周
期的であるとみなされ、適応コードブック寄与は０に設
定される。固定コードブック寄与は、コードブックイン
デックスおよび符号インデックスをランダムに選択する
ことによって生成される。乱数発生器は次の関数に基づ
く。ｓｅｅｄ＝ｓｅｅｄ＊３１８２１＋１３８４９（９５）ｓｅｅｄの初期値は２１８４５である。ランダムなコー
ドブックインデックスは、次の乱数の１３個の下位ビッ
トから導出される。ランダムな符号は、次の乱数の４個
の下位ビットから導出される。固定コードブック利得は
式（９２）に従って減衰される。

【０１９９】［５ＣＳ−ＡＣＥＬＰ符号器／復号器の
ビット精度での記述］１６ビット固定小数点でのＣＳ−
ＡＣＥＬＰ符号器／復号器をシミュレートするＡＮＳＩ
ＣコードがＩＴＵ−Ｔから利用可能である。以下の節
では、このシミュレーションコードの使用法、および、
そのソフトウェアがどのように編成されているかについ
て概説する。

【０２００】［５．１シミュレーションソフトウェア
の使用法］Ｃコードは二つのメインプログラムからな
る。ｃｏｄｅｒ．ｃは符号器をシミュレートし、ｄｅｃ
ｏｄｅｒ．ｃは復号器をシミュレートする。符号器は次
のように実行される。ｃｏｄｅｒｉｎｐｕｔｆｉｌｅｂｓｔｒｅａｍｆｉ
ｌｅｉｎｐｕｔｆｉｌｅ（入力ファイル）およびｏｕｔｐｕ
ｔｆｉｌｅ（出力ファイル）は、１６ビットＰＣＭ信号
を含むサンプリングされたデータファイルである。ｂｓ
ｔｒｅａｍｆｉｌｅ（ビットストリームファイル）は８
１個の１６ビットワードを含む。第１ワードはフレーム
消失を示すために使用可能であり、残りの８０ワードは
それぞれ１ビットを含む。復号器はこのビットストリー
ムファイルを受け取り、１６ビットＰＣＭ信号を含むポ
ストフィルタリングされた出力ファイルを生成する。ｄｅｃｏｄｅｒｂｓｔｒｅａｍｆｉｌｅｏｕｔｐｕ
ｔｆｉｌｅ

【０２０１】［５．２シミュレーションソフトウェア
の構成］固定小数点ＡＮＳＩＣシミュレーションで
は、表１０に示すように２種類の固定小数点データのみ
が使用される。シミュレーションコードの実装を容易に
するため、ループインデックス、ブール値およびフラグ
は型Ｆｌａｇを使用する。これは、ターゲットプラット
フォームに応じて１６ビットまたは３２ビットのいずれ
かとなる。

【表１０】

【０２０２】すべての計算は、あらかじめ定義された基
本演算子のセットを用いてなされる。これらの演算子の
記述を表１１に示す。シミュレーション符号器によって
使用されるテーブルを表１２に要約する。これらのメイ
ンプログラムは、表１３、表１４、および表１５に要約
されるライブラリルーチンを使用する。

【表１１】

【表１２】

【表１３】

【表１４】

【表１５】

【図面の簡単な説明】

【図１】代表的なＣＥＬＰ音声圧縮システムで使用され
るＦＣＢシステムとＡＣＢシステムの従来の組合せと、
この組合せによって生成される励振信号の１サブフレー
ムの模式的表現の図である。

【図２】ＰＣＢおよびＰＰＦからなる周期性モデルと、
ＰＰＦ出力信号の１サブフレームの模式的表現の図であ
る。

【図３】本発明による音声符号器の実施例の図である。

【図４】本発明による復号器の実施例の図である。

【図５】ＣＥＬＰ合成モデルの概略ブロック図である。

【図６】ＣＳ−ＡＣＥＬＰ符号器における信号フローの
図である。

【図７】ＣＳ−ＡＣＥＬＰ復号器における信号フローの
図である。

【図８】ＬＰ分析における窓の図である。異なる陰影パ
ターンは対応する励振およびＬＰ分析フレームを識別す
る。

【符号の説明】

１固定コードブック（ＦＣＢ）５増幅器１０適応コードブック（ＡＣＢ）１５増幅器２０加算回路２５ＦＣＢ３５遅延メモリ４０増幅器４５加算回路５０ＰＰＦ１００プリプロセッサ１０５線形予測（ＬＰ）分析器１１０適応コードブック（ＡＣＢ）システム１１２ＡＣＢ部分１２０ＦＣＢシステム１２５遅延プロセッサ１２６スイッチ１２８ＰＰＦシステム１４５ＦＣＢ増幅器１５０加算器１５５ＬＰ合成フィルタ１６５知覚重みづけフィルタ１７０ピッチ周期プロセッサ１７５平均二乗誤差（ＭＳＥ）探索プロセッサ２００固定コードブック（ＦＣＢ）部分２０５ＦＣＢ２１０ＰＰＦ２２５遅延プロセッサ２３５ＦＣＢ利得増幅器２４０適応コードブック（ＡＣＢ）部分２４５ＡＣＢ２５０増幅器２６０ＬＰＣ合成フィルタ２６５ポストプロセッサ

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平６−120908（ＪＰ，Ａ) 特開平５−346798（ＪＰ，Ａ) 特開平５−19795（ＪＰ，Ａ) 特開平５−289700（ＪＰ，Ａ) 特開平５−113800（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/12

Claims

(57)【特許請求の範囲】

【請求項１】適応コードブックおよび対応する適応コ
ードブック増幅器からなる第１部分と、ピッチフィルタ
増幅器に接続された遅延メモリを含むピッチフィルタに
接続された固定コードブックからなる第２部分とを有す
る音声処理システムで使用する音声処理方法において、音声信号の周期性の尺度に基づいてピッチフィルタ利得
を決定するステップと、決定されたピッチフィルタ利得に基づいて前記ピッチフ
ィルタにおいて信号のサンプルを増幅するステップとか
らなることを特徴とする音声処理方法。
【請求項２】適応コードブック利得が１サブフレーム
だけ遅延されることを特徴とする請求項１の方法。
【請求項３】適応コードブック利得を反映する信号が
時間的に遅延されることを特徴とする請求項１の方法。
【請求項４】適応コードブック利得を反映する信号
は、下限以上上限以下の値を有することを特徴とする請
求項１の方法。
【請求項５】音声信号は符号化された音声信号からな
ることを特徴とする請求項１の方法。
【請求項６】音声信号は合成された音声信号からなる
ことを特徴とする請求項１の方法。
【請求項７】適応コードブックと、適応コードブック
利得を加える手段とを含む第１部分と、固定コードブックと、ピッチフィルタ利得を加える手段
を有するピッチフィルタとを含む第２部分と、音声信号の周期性の尺度に基づいて前記ピッチフィルタ
利得を決定する決定手段とからなることを特徴とする音
声処理装置。
【請求項８】適応コードブック利得を反映する信号が
１サブフレームだけ遅延されることを特徴とする請求項
７の装置。
【請求項９】前記ピッチフィルタ利得は、遅延された
適応コードブック利得に等しいことを特徴とする請求項
７の装置。
【請求項１０】前記ピッチフィルタ利得は０．２以上
０．８以下の値の範囲に制限され、当該範囲内で、遅延
された適応コードブック利得からなることを特徴とする
請求項７の装置。
【請求項１１】適応コードブック利得を反映する信号
は０．２以上０．８以下の値の範囲に制限され、当該範
囲内で、適応コードブック利得からなることを特徴とす
る請求項７の装置。
【請求項１２】前記第１部分によって出力される第１
出力信号と前記第２部分によって出力される第２出力信
号を加算する加算手段と、前記加算手段に接続され、第１出力信号と第２出力信号
の和に応答して音声信号を生成する線形予測フィルタと
をさらに有することを特徴とする請求項７の装置。
【請求項１３】前記線形予測フィルタによって生成さ
れる音声信号をフィルタリングするポストフィルタをさ
らに有することを特徴とする請求項１２の装置。
【請求項１４】音声符号器において使用されることを
特徴とする請求項７の装置。
【請求項１５】音声復号器において使用されることを
特徴とする請求項７の装置。
【請求項１６】前記決定手段は、前記第１部分におい
て使用される適応コードブック利得を反映する信号を遅
延させる手段を有することを特徴とする請求項７の装
置。
【請求項１７】適応コードブックおよび対応する適応
コードブック増幅器からなる第１部分と、決定された利
得を加えるピッチフィルタ増幅器に接続された遅延メモ
リを含むピッチフィルタに接続された固定コードブック
からなる第２部分とを有する音声信号処理システムで使
用される、ピッチフィルタの利得を決定する方法におい
て、音声信号の周期性に基づいてピッチフィルタ利得を決定
するステップからなることを特徴とする、ピッチフィル
タの利得を決定する方法。
【請求項１８】適応コードブックおよび対応する適応
コードブック増幅器からなる第１部分と、ピッチフィル
タ増幅器に接続された遅延メモリを含むピッチフィルタ
に接続された固定コードブックからなる第２部分とを有
する音声処理システムで使用する音声処理方法におい
て、適応コードブック利得を遅延させるステップと、適応コードブック利得が０．２より小さい場合にはピッ
チフィルタ利得を０．２に設定し、適応コードブック利
得が０．８より大きい場合にはピッチフィルタ利得を
０．８に設定し、これら二つの場合以外の場合にはピッ
チフィルタ利得を遅延された適応コードブック利得に等
しく設定するステップと、設定されたピッチフィルタ利得に基づいて前記ピッチフ
ィルタにおいて信号のサンプルを増幅するステップとか
らなることを特徴とする音声処理方法。
【請求項１９】適応コードブックと、適応コードブッ
ク利得を加える手段とを含む第１部分と、固定コードブックと、ピッチフィルタ利得を加える手段
を有するピッチフィルタと、第２利得を加える手段とを
含む第２部分と、適応コードブック利得が０．２より小さい場合にはピッ
チフィルタ利得を０．２に設定し、適応コードブック利
得が０．８より大きい場合にはピッチフィルタ利得を
０．８に設定し、これら二つの場合以外の場合にはピッ
チフィルタ利得を遅延された適応コードブック利得に等
しく設定する手段とからなることを特徴とする音声処理
装置。