JP3425423B2

JP3425423B2 - 固定コードブックにおける最適のベクトルの高速決定のための方法および装置

Info

Publication number: JP3425423B2
Application number: JP2000531839A
Authority: JP
Inventors: ロズデスツベンスキー・ジュリー; ディアチェンコ・ジュリー
Original assignee: Motorola Solutions Inc; Motorola Inc
Current assignee: Motorola Solutions Inc
Priority date: 1998-02-17
Filing date: 1998-02-17
Publication date: 2003-07-14
Anticipated expiration: 2018-02-17
Also published as: WO1999041737A8; KR20010024943A; WO1999041737A1; JP2002503835A; KR100510399B1; US6807527B1

Description

【発明の詳細な説明】

【０００１】

【発明の分野】本発明は音声符号化アルゴリズムのため
の方法および装置に関し、特に符号励振線形予測（ｃｏ
ｄｅｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔ
ｉｖｅ：ＣＥＬＰ）符号化アルゴリズムのための方法お
よび装置に関する。ＣＥＬＰアルゴリズムは、例えば、
セルラシステムにおけるベースステーションと移動ステ
ーションとの間の、２方向音声通信において使用され
る。ＣＥＬＰアルゴリズムのための方法は信号プリプロ
セッサにおいてサンプルされた音声ｓ｛ｎ｝を前処理し
て（ｐｒｅ−ｐｒｏｃｅｓｓｉｎｇ）少なくともノイズ
ろ波された音声出力ベクトルおよびチャネルノイズ推定
を出力する段階、予測誤差または残余（ｒｅｓｉｄｕａ
ｌ）および長時間（ｌｏｎｇｔｅｒｍ）予測利得を出
力するように前記ノイズろ波された音声出力ベクトルの
モデルパラメータ推定を行う段階、予測誤差を符号化し
てフィルタのインパルス応答関数の指数およびベクトル
利得を含む適応コードブックベクトルを出力する段階、
および前記符号化された音声パケットをフォーマットま
たは形成する段階を含む。

【０００２】ＣＥＬＰアルゴリズムは中間のビットレー
ト、すなわち、４８００または９６００ｂｐｓ、におい
て良好な音声品質を提供することが見出されている。し
かしながら、励振信号のベクトル量子化は極めて高い計
算機的な努力を必要とする。重複（ｏｖｅｒｌａｐｐｉ
ｎｇ）コードブックベクトルの使用を含むベクトル量子
化をスピードアップするためのいくつかの提案が行なわ
れてきている。

【０００３】

【発明の背景】符号励振リニア予測（ＣＥＬＰ）アルゴ
リズムはエス・シンハルおよびビー・エス・アタルによ
る、「低ビットレートにおける多パルスＬＰＣ符号器の
性能改善（Ｉｍｐｒｏｖｉｎｇｐｅｒｆｏｒｍａｎｃ
ｅｏｆｍｕｌｔｉ−ｐｕｌｓｅＬＰＣｃｏｄｅ
ｒｓａｔｌｏｗｂｉｔｒａｔｅｓ）」、Ｐｒｏ
ｃ．Ｉｎｔ．Ｃｏｎｆ．、音響、音声および信号処理、
（サン・ディエゴ）、１９８４年、ｐｐ．１．３．１−
１．３．４；およびダブリュー・ビー・クライジン、デ
ィー・ジェイ・クラシンスキイおよびアール・エイチ・
ケッチャムによる、「ＣＥＬＰ音声符号化アルゴリズム
のための高速の方法（Ｆａｓｔｍｅｔｈｏｄｓｆｏ
ｒｔｈｅＣＥＬＰｓｐｅｅｃｈｃｏｄｉｎｇ
ａｌｇｏｒｉｔｈｍ）」、ＩＥＥＥＴｒａｎｓ．、音
響、音声および信号処理、Ｖｏｌ．３８，Ｎｏ．８，Ｐ
Ｐ．１３３０−１３４２、１９９０年、に述べられてい
る。ＣＥＬＰ符号化アルゴリズムはサブフレームごとの
ベースでサンプルされた音声を処理するために使用され
る。該音声信号のスペクトルエンベロープは線形予測技
術を使用してその係数が得られるフィルタによって記述
される。前記係数は量子化され、それによって前記フィ
ルタが送信機側および受信機側の双方に関して構築でき
る。前記フィルタ係数は合成による分析（ａｎａｌｙｓ
ｉｓ−ｂｙ−ｓｙｎｔｈｅｓｉｓ）手順によって決定さ
れる。一組のそのような候補の励振シーケンスまたはベ
クトルはコードブックに格納される。最も正確な音声を
生成するベクトルの指数（ｉｎｄｅｘ）はチャネルの受
信端に送信される。送信側の入力音声は受信側において
その指数が送信されたベクトルを使用して発生される合
成音声によって回復される。

【０００４】主なタスクは入力音声を最も正確に記述す
るコードブックにおける最適のベクトルを見つけること
である。高速のベクトル量子化および卓越した合成音声
品質はＣＥＬＰアルゴリズムを音声符号化の用途にとっ
て魅力的なものにする。スペクトル拡散デジタルシステ
ムにおけるＣＥＬＰアルゴリズムの実施についてはＩＳ
−１２７標準「強化された可変レートコーデック、広帯
域スペクトル拡散デジタルシステムのための音声サービ
スオプション３（ＥｎｈａｎｃｅｄＶａｒｉａｂｌｅ
ＲａｔｅＣｏｄｅｃ，ＳｐｅｅｃｈＳｅｒｖｉｃ
ｅＯｐｔｉｏｎ３ｆｏｒＷｉｄｅｂａｎｄＳ
ｐｒｅａｄＳｐｅｃｔｒｕｍＤｉｇｉｔａｌＳｙ
ｓｔｅｍｓ）」、１９９６年４月１９日、セクション
４．５．７「代数的ＣＥＬＰ固定コードブック寄与の計
算（Ｃｏｍｐｕｔａｔｉｏｎｏｆｔｈｅａｌｇｅｂ
ｒａｉｃＣＥＬＰＦｉｘｅｄＣｏｄｅｂｏｏｋ
Ｃｏｎｔｒｉｂｕｔｉｏｎ）」に記載されている。この
標準において使用されるコードブックは代数的コードブ
ック（ＡＣＥＬＰ）構造を備えた固定コードブックであ
る。

【０００５】前記代数的コードブックにおける最適のコ
ードベクトルを見つけるために、ＡＣＥＬＰコードブッ
クが重み付けされた入力音声と重み付けされた合成音声
との間の平均２乗誤差（ＭＳＥ）を最小にすることによ
りサーチされる。言い換えれば、前記コードブックは次
の項、

【数１】Ｔ_ｋ＝Ｃ_ｋ ^２／Ｅ_ｋを最大にすることによってサーチされ、この場合Ｃ_ｋは
インパルス応答および知覚領域ターゲット信号（ｐｅｒ
ｃｅｐｔｕａｌｄｏｍａｉｎｔａｒｇｅｔｓｉｇｎ
ａｌ）の相関であり、かつＥ_ｋはコードブックベクトル
のインパルス応答のエネルギまたは共分散（ｃｏｖａｒ
ｉａｎｃｅ）であり、これらはともに位置ｋにおけるも
のである。前記コードブックベクトルは一連の単位パル
スであり、各パルスは前記コードブックにおいて適切な
位置にありかつ適切に選択された符号を有している。

【０００６】最適の代数的コードブックベクトルを決定
するために、前記相関およびエネルギ項はパルス位置お
よび符号のすべての可能な組合わせに対して計算される
べきである。しかしながら、これは禁止されるべきまた
は非常に高価なタスクである。サーチを単純化するため
に、以下に説明されるようにパルス符号および位置をサ
ーチするための二つの戦略が使用される。

【０００７】前記パルス符号は適切な基準信号の符号を
考慮することにより（閉ループサーチの外部で）プリセ
ットされる。振幅が、ある位置でのパルスの振幅をその
位置における前記基準信号の符号に等しく設定すること
によりプリセットされる。この「新しい」構成要素によ
り、修正された相関Ｃ_ｋ′および修正されたエネルギＥ
_ｋ′が計算される。

【０００８】上に説明したようにパルス振幅をプリセッ
トすると、最適のパルス位置が効率的な非網羅的な（ｎ
ｏｎ−ｅｘｈａｕｓｔｉｖｅ）合成による分析サーチ技
術を使用して決定される。この技術においては、項Ｔ_ｋ
が反復的な「深さ優先（ｄｅｐｔｈ−ｆｉｒｓｔ）」ツ
リーサーチ戦略を使用して少しの割合の位置の組合わせ
に対してテストされる。

【０００９】いったん励振パルスの位置および符号が決
定されると、前記「新しい」コードブックベクトルは一
連の単位パルスとして構築され、各パルスはコードブッ
クにおける「新しい」位置にある。

【００１０】固定コードブックベクトルの利得はその後
次の式によって決定される。

【数２】ｇ_ｃ＝Ｃ_ｋ／Ｅ_ｋＩＳ−１２７標準において提案されたこの固定コードブ
ックサーチアルゴリズムは次のような不都合を有する。

【００１１】前記項Ｔ_ｋ＝Ｃ_ｋ ^２／Ｅ_ｋは非線形多次元
多極値関数（ｎｏｎ−ｌｉｎｅａｒｍｕｌｔｉｄｉｍｅ
ｎｓｉｏｎａｌｍｕｌｔｉ−ｅｘｔｒｅｍｕｍｆｕ
ｎｃｔｉｏｎ）である。この非線形多次元多極値関数の
ある極値をサーチするタスクは、利用可能な計算機的な
性能が限られている場合に、組合わせのまたは組合わせ
的な方法（ｃｏｍｂｉｎａｔｏｒｉａｌｗａｙ）で解
かれ、これは大域的なもの（ｇｌｏｂａｌｏｎｅ）よ
りはむしろローカルな極値（ｌｏｃａｌｅｘｔｒｅｍ
ｕｍ）を見つける結果となる。

【００１２】最小化関数（ｍｉｎｉｍｉｓｉｎｇｆｕ
ｎｃｔｉｏｎ）の計算は非常に時間を消費しかつ多数の
計算サイクルを必要とする。すなわち、ＩＳ−１２７標
準において提案された固定コードブックサーチ方法は各
々のトラックにおいてパルス位置のための線形サーチを
想定しかつ１１４４の計算を必要とする。さらに、Ｔ_ｋ
の評価は前記アルゴリズムの複雑さを大幅に増大する除
算操作を含む。

【００１３】従って、従来技術の構成よりも高速であり
かつ計算サイクルに関して高価でなく、それでも最大の
達成可能な精度を維持するＣＥＬＰアルゴリズムのため
の方法および装置が必要とされる。

【００１４】

【発明の概要】本発明の基礎をなす問題は基本的に独立
請求項に記載された特徴的事項を適用することにより解
決される。好ましい実施形態は従属請求項に与えられて
いる。

【００１５】一定の長さを有するフレームに関して音声
誤差または残差に対する高速の多パルス符号化アルゴリ
ズムの効率改善の必要性は本発明によって満たされる。
請求項１および請求項８にそれぞれ記載された本発明に
係わる方法および装置は前記アルゴリズムの高速の収斂
を与え、それによって最適のベクトルが従来技術よりも
効率的にサーチできる。

【００１６】本発明の基礎をなす基本的なアイデアは最
適のコードブックベクトルを見つけるタスクを以下の二
つのサブタスクに分解することである。符号化パルスに
対する振幅利得の計算（第１ステージ）、および符号化
パルスに対する最適のサンプル位置の計算（第２ステー
ジ）。

【００１７】本発明に係わる計算シーケンスは前記ＩＳ
−１２７標準による従来技術に記載されたものと逆であ
ることに注目すべきである。

【００１８】本発明による方法は離散的ソース信号の最
適の符号化パルス位置のサーチの多次元多極値非線形タ
スクをそれぞれのパルスに対して順次最小化される多次
元２乗形式を有する最適の極値サーチタスクへと低減す
る。これは本質的に計算時間を低下させかつより高い符
号化精度を提供する。

【００１９】前記第１ステージにおいて、最適のコード
ベクトル利得“ｇ_ｃ”が次の式によって決定される。

【数３】この場合、ｘはソース離散信号（知覚領域ターゲット信
号ベクトル）であり、ｈは特別関数（フィルタのインパ
ルス応答）であり、ａは実験的に決定された重み係数で
あり、そしてＮはサブフレーム長さである。

【００２０】前記重み係数“ａ”に対する最適の値は適
切な関数“ｈ”および非ゼロコードベクトル成分のある
与えられた数“ｎ”に対して実験的に決定される。ｎ＝
８および重み合成フィルタ“ｈ_ｗｑ”のインパルス応答
に対して、値ａ＝２が得られた。

【００２１】前記第２ステージにおいては、符号化パル
スの最適位置の順次的なサーチが行なわれる。位置ｐ
（ｊ）∈｛１，…，Ｎ｝，ｊ＝１，…，ｎにおける符号
ベクトル成分は評価または推定関数（ｅｓｔｉｍａｔｅ
ｆｕｎｃｔｉｏｎ）Ｆ（ｐ（ｊ））を最大にすること
により順次サーチされ、これはｊ番目のパルスの音声信
号残差（レシデュアル：ｒｅｓｉｄｕａｌ）への寄与分
を決定する。

【数４】この場合、ｐ（ｊ）＝１，…，Ｎであり、ｊ＝１，…，
ｎであり、かつ

【数５】であり、これは前記フィルタのすべてのインパルス応答
関数ｈの共分散アレイである。この場合、

【数６】ｄ_ｊ＋１（ｉ）＝ｄ_ｊ（ｉ） −ｓｉｇｎ（ｄ_ｊ（ｐ（ｊ））ｇ_ｃφ（ｉ，ｐ（ｊ））

【数７】この場合ｄ_１は前記インパルス応答関数およびｊ＝１に
対する前記ソース離散信号の元の相互相関ベクトルであ
る。

【００２２】

【発明を実施するための最前の態様】本発明に係わる実
施形態の詳細な説明のために、ＩＳ−１２７標準（編集
バージョン６、ＴＲ−４５）における名称を参照する。
すなわち、ＭＳＥはあるサブフレームにおける固定コー
ドブック寄与分からの固定コードブックサーチターゲッ
トベクトルの偏差またはずれの平均２乗誤差である。Ｓ
ＮＲは、ｄＢでの、信号対雑音比であり、変更された
（シフトされた）もとの音声信号Ｓ_Ｗが処理された信号
として使用されかつそれと適応および固定コードブック
の助けにより再構成された信号がノイズとして考えられ
る。平均ＳＮＲは音声フラグメントに関して平均されか
つ９６００ｂｐｓのレートおよび４８００ｂｐｓのレー
ト、すなわちそれぞれレート１およびレート１／２で送
信されるすべてのフレームに対する平均ＳＮＲ値として
計算される。すべてのｐ（ｊ）は５つのトラックＴ０，
…，Ｔ４にわたり分配または分布される。前記トラック
の内の３つは各々８つの非ゼロパルスの内の２つが割当
てられ、前記トラックの内の２つは各々８つのパルスの
内の１つが割当てられる。各々１つのパルスを備えた２
つのトラックは互いにサイクリックまたは循環的に隣接
し、すなわち、トラック３およびトラック４は各々１つ
のパルスを含み、トラック４およびトラック０は各々１
つのパルスを含み、以下同様である。

【００２３】前記ＩＳ−１２７標準に従って固定コード
ブック構造により決定される一般的なタスクはレート１
に対して次のように公式化される。すなわち、次の数
式、

【数８】を満たすベクトルｐ（ｊ），ｊ＝１，…，８、および利
得ｇ_ｃが、固定コードブック構造ならびに以下の条件、

【数９】ｇ_ｃ＞０，０≦ｐ（ｊ）≦５４，ｊ＝１，…，８，ｐ（ｊ）≠ｐ（ｋ），ｊ，ｋ＝１，…，８，ｈ_ｗｑ（ｊ−ｐ（ｊ））＝０，ｊ−ｐ（ｊ）＜０．により規定される制約のもとで見つけ出され、この場合
Ｎはサブフレームのサイズである。なお、→ｐなる表記
において、記号→は文字ｐの上に配置されるべきである
が、文字コードの制限のため文字ｐの前に配置してい
る。

【００２４】これは許容できる解の領域の複素境界を備
えた多次元関数のための極値のサーチの典型的なタスク
である。最小化される前記関数は一般に１つより多くの
極値を有する非線形９次関数である。前記制約は前記許
容できる解の領域の非線形の境界を形成し、従ってロー
カルまたは局所的極値（ｌｏｃａｌｅｘｔｒｅｍａ）
の数はさらに増大しかつ大域的極値（ｇｌｏｂａｌｅ
ｘｔｒｅｍｕｍ）のサーチは一層複雑になる。変更され
た（前記ＲＣＥＬＰアルゴリズムに関してシフトされ
た）もとの残余（ｒｅｓｉｄｕａｌ）から適応コードブ
ック出力を減算することにより得られる離散信号の符号
化のＭＳＥの真のまたは実数の最小のサーチは従って不
成功に終るであろう。

【００２５】本発明による方法における前記第１のステ
ップは利得の計算である。本発明の第１の実施形態にお
いては、前記利得は、

【数１０】ｇ_ｃ〜Ｘとみなされ、この場合、

【数１１】はソース離散信号のエネルギである。言い換えれば、ｇ
_ｃの最適の値はサブフレームにおける信号ｘ_Ｗの平均２
乗振幅に比例するとみなすことができる。前記ソース離
散信号のエネルギはフィルタのインパルス応答関数の共
分散マトリクスのトレース（ｔｒａｃｅ）と比較され
る。言い換えれば、すべての対角共分散項の合計が行な
われ、それによって利得ｇ_ｃを次のように得る。

【数１２】

【００２６】この利得計算は図１に示されている。ステ
ップ１０１における信号ｓ｛ｎ｝の前処理およびステッ
プ１０２におけるモデルパラメータの推定の後に、前処
理された音声信号のエネルギＸがステップ１０３におい
て計算される。ループ１０４〜１０９において、共分散
マトリクスの対角要素が決定される。ステップ１０４に
おいて、第１の対角要素φ（ｉ，ｉ）、すなわち、φ
（１，１）、が計算される。ステップ１０５において、
それは後に使用する目的でメモリに格納される。さら
に、ステップ１０６において、前記値φ（ｉ，ｉ）が値
Ａに加えられ、それによって最終的に共分散マトリクス
のトレースを得る。

【数１３】Ａ＝Ａ＋φ（ｉ，ｉ）

【００２７】この反復はｉ＝Ｎまで繰り返される。言い
換えれば、処理はｉ＜Ｎである限り次のφ（ｉ，ｉ）を
計算するためにステップ１０４に戻るよう分岐し、かつ
ｉ＝Ｎの場合にステップ１０７においてループを退出し
かつトレースの計算が完了する。

【００２８】ステップ１０３からのＸの値およびステッ
プ１０６からのＡの値により、前記コードベクトルの利
得は次の式によって計算される。

【数１４】この場合、αは音声の残差（ｒｅｓｉｄｕａｌ）に適用
されるべき係数であり、かつＡは考慮中のサブフレーム
の共分散マトリクスのトレースに対する単なるかつ一時
的な置換（ｓｕｂｓｔｉｔｕｔｅ）である。

【００２９】上の実施例の特定の利点はその比較的低い
計算機的な努力である。前記共分散項φ（ｉ，ｉ）はサ
ブフレームにおける全てのパルス位置（前記ＩＳ−１２
７標準においてはＮ＝５３または５４）に対して計算さ
れなければならないが、これは全体の計算機的な努力を
増大するものではなく、その理由は前記対角項（ｄｉａ
ｇｏｎａｌｔｅｒｍｓ）は以下に説明するさらなる計
算のために利用可能であるからである。

【００３０】上に述べた実施形態よりも高速とすること
ができるが、利得計算の精度を犠牲にする、他の実施形
態が本発明の発明者によって考案されかつ本発明のさら
に他の実施形態（示されていない）において実施されて
いる。

【００３１】本発明の発明者によって、本発明に係わる
方法の第１の構成の特定の簡単な変更がｇ_ｃの決定のた
めに実現できるという近似により満足すべき結果が達成
できることが見出され、すなわち、前記第１の実施形態
は、離散的ソース信号およびサブフレーム長さを除き、
前記共分散マトリクスにおける第１の対角項の共分散、
すなわち、φ（ｉ，ｉ）に排他的に依存する。共分散マ
トリクスのこの第１の項はＮ、サブフレーム長さ、によ
り乗算することにより「拡張され（ｅｘｐａｎｄｅ
ｄ）」、かつ次に平均２乗されたソース信号Ｘと比較さ
れる。前記利得は従って次のように書くことができる。

【数１５】ｇ_ｃ＝α・Ｘ／｛Ｎ・φ（ｉ；ｉ）｝^１／２この場合、αは比例係数である。この構成により、対角
要素の計算は１つに低減される。この実施形態の利点は
サブフレームにおける全ての他の共分散項の計算が時代
遅れになる（ｏｂｓｏｌｅｔｅ）ことである。

【００３２】本発明のこれらの実施形態の内のさらに他
のもの（図示せず）においては、利得は次のような簡単
な式で表される。

【数１６】ｇ_ｃ＝α・（Ｘ^２／Ｎ）^１／２この場合、αは定数係数でありかつＮはサブフレーム長
さである。しかしながら、この手法はＸ^２＞＞Ｆ_ｍｉｎ
（ｇ_ｃ；→Ｐ_ｏｐｔ）に対してのみ許容できるものであ
る。ただし、この前提条件は大部分のサンプルされた音
声の残差において当てはまる。この手法により評価され
る利得の分析は高い精度の近似が達成可能であることを
示している。

【００３３】本発明の他の構成（図示せず）において
は、第１のパルスは７０パーセントまでの情報を含むと
仮定される。従って、前記第１のパルスはｇ_ｃの計算の
ための主な候補である。しかしながら、もしそれが第１
のパルスのみに関して決定されれば、ｇ_ｃの値は前記最
適値を超えるため、より多くのパルスが考慮される。こ
の利得計算の構成に対応する関係は次の式で与えられ
る。

【数１７】この場合、ｇ_ｃｉはｉ番目のパルスに対する利得ｇ_ｃで
あり、ｋはｇ_ｃの決定のためのパルスの数または番号で
あり、ａは第１のパルスの重み係数である。

【００３４】前記第１のパルスのＳＮＲに対する影響は
異なる音声信号およびパルスの数によって実験的に調べ
られた。発明者によってｋ＝８のパルスの数が最もよい
結果を与えることが見出された。ＭＳＥは３０パーセン
トに低減できた。

【００３５】最後の実施形態による前記利得ｇ_ｃの決定
の精度を改善するために、インパルス応答関数の共分散
の影響が考慮される。対応する構成は重み付けられた第
１のパルスおよびサブフレームにおける信号の平均２乗
された振幅Ｘ^２に依存する。

【数１８】ｇ_ｃ＝ａ・ｇ_ｃ１＋ｂ・（Ｘ^２／Ｎ）^１／２この場合、ａ，ｂは重み係数であり、かつｇ_ｃ１は第１
のパルスの振幅である。この実施形態の利点はその低い
計算機的な複雑さであり、利得の高い精度を有し、それ
はインパルス応答関数の共分散の考慮が多様な音声フラ
グメントに対する異なる最適化された組の係数ａおよび
ｂにつながるからである。

【００３６】これらのアルゴリズムの比較分析は上記ア
ルゴリズムの全てに対して卓越した結果を示している。
しかしながら、前記第１のアルゴリズムは最も大きな計
算機的な努力を必要とする。一般に、インパルス応答関
数の共分散を考慮に入れる、上記アルゴリズムは余分の
計算機的な努力を必要とする。しかしながら、これは計
算された項の一部がやはりベクトルサーチのために必要
とされるという事実により補償され、これについては後
に説明する。従って、計算機的な努力はベクトルサーチ
から利得計算へとシフトされるのみであり、かつ前記利
得計算の結果の一部がベクトルサーチのためにも利用で
きるという事実により、劇的に増大することはない。

【００３７】前記利得の評価が完了すると、本方法は図
１の“Ａ”において最適のベクトル｛ｐ（ｊ），ｊ＝
１，…，８｝を見つけるよう進行し、この場合８は前記
ＩＳ−１２７システムにおけるベクトル成分の最大数で
ある。

【００３８】このサーチは本方法の特定の実施形態にお
いては励振残余に対する多パルス符号化方法の順次の変
量または変形（ｖａｒｉａｎｔ）によって達成される。
共分散マトリクスにおける対角項のみの考慮において最
小にされるべき関数が次の形式で書かれる。

【数１９】この場合、

【数２０】はパルス位置ｐ（ｊ）に対する相関であり、かつ

【数２１】はパルス位置ｐ（ｊ）の共分散（ｃｏｖａｒｉａｎｃ
ｅ）である。

【００３９】前記パルスｐ（ｊ）の符号は次の式で規定
される。

【数２２】Ｓｉｇｎ（ｐ（ｊ））＝Ｓｉｇｎ（ｄ_ｊ（ｐ（ｊ）））

【００４０】次のステップにおいて、相互相関ベクトル
ｄ_ｊがｐ（ｊ−１）に基づき修正され、これは前に次の
式によって計算されている。

【数２３】ｄ_ｊ［ｉ］＝ｄ_ｊ［ｉ］−ｇ_ｃ・Ｓｉｇｎ（ｐ（ｊ−１））・φ［ｉ；ｐ（ｊ−１）］，ｉ＝１，…，Ｎこの場合、ｇ_ｃは前に述べた利得計算シーケンスにおい
て決定された利得である。最後の３つの式の計算手順を
順次反復することにより、前記パルス位置ｐ（ｊ）がパ
ルス位置ｐ（ｊ＋１）に進む前に最適化される。

【００４１】この手順の構成は図２に示されている。上
記タスク、

【数２４】は次の関数の最大値を見出すのと等価である。

【数２５】この場合、ｐ（ｊ）∈｛１，…，Ｎ｝であり、かつｊ＝
１，…，ｋであり、前記ＩＳ−１２７標準においてはｋ
＝８である。

【００４２】前記ベクトル検出手順の最初のステップに
おいて、音声残余または残差ならびにインパルス応答関
数ｄ_ｊ（ｉ）の相関が計算され（ステップ１１０）、か
つ前記最大化基準Ｆの現在の最善の値を一時的に記憶す
るための変数Ｆ′がリセットされる。図２には明白に述
べられていないが、非対角項φ（ｉ，ｊ）もステップ１
１０において決定されこれらはｊ＝２，…，８に対する
相関ベクトルの修正のために必要とされる。次のステッ
プ１１１において、固定コードブック構造の制約がチェ
ックされ、かつもしそれらが違反しておれば、手順はス
テップ１１７へと分岐する。ステップ１１２において、
前述の利得計算の際に計算された共分散項φ（ｉ，ｉ）
がメモリから取り出される。

【００４３】前記利得ｇ_ｃ、相関ベクトルｄ_ｊ（ｉ）お
よび共分散ベクトルφ（ｉ，ｉ）の値により、ステップ
１１３において推定または評価関数Ｆが計算される。Ｆ
の値は、前に決定された、値Ｆ′と比較される。Ｆの最
後に評価された値が前のＦ′より大きい場合は、ステッ
プ１１５において新しい値がメモリに格納され、ｐ
（ｊ）＝ｉの値がステップ１１６においてメモリに格納
されかつ処理はステップ１１７に進む。ステップ１１７
において、１つのサブフレームにおける全てのサンプル
位置が推定または評価されたか否かがチェックされる。
もし全てのサンプル位置がチェックされていなければ、
処理はステップ１１７の問合わせの後にステップ１１８
において増分されたｉと共にステップ１１１に進む。も
し全てのサンプル位置が評価または推定されておれば、
サーチ手順はステップ１２０において全てのベクトル成
分の評価が完了したか否かをチェックする。もし完了し
ておれば、最適のコードベクトルを見出す手順は考慮中
のサブフレームに対して終了しかつ、ステップ１２１に
おいて、パケットがチャネルの受信機側への送信のため
に形成またはフォーマットされる。もしベクトル成分の
評価または推定がまだ完了していなければ、処理はステ
ップ１２０における問合わせの後にステップ１１９にお
いてｊを増分した後ステップ１１０に進む。

【００４４】本発明による方法は従来技術に対していく
つかの利点を有する。すなわち、ベクトル１／φ（ｉ，
ｉ）はサブフレームごとに一回だけ計算されればよい。
これにより、最適のベクトルに対するサーチ手順の計算
機的努力が大幅に低減される。計算されるべき共分散ア
レイにおける非対角要素φ（ｉ，ｊ）の数が共分散アレ
イの（５４から）７行に低減され、従来技術のように共
分散アレイの全ての非対角行（５４）を計算する必要が
なくなる。基準計算のサイクル数がパルス数をサブフレ
ーム長さで乗算したものに限定され（例えば、８＊５４
＝４３２）、一方従来技術（ＩＳ−１２７標準）による
必要なサイクル数は１１４４（固定コードブック構造に
わたり４つの反復を必要する組合わせ逐次サーチに対し
て）である。しかしながら、実際には、本発明の方法に
よるサーチは本質的に少ないサイクル数の後に切り詰め
る（ｔｒｕｎｃａｔｅｄ）ことができる。パルスに対す
る固定コードブック構造の制約は４つのパルスが見出さ
れた後にのみチェックされる。パルスの符号は自動的に
決定され従って音声残余信号ｘ_Ｗの余分のろ波および各
サブフレームに対する基準ベクトルの計算を避けること
ができる。最大のＭＳＥ偏差またはずれを連続的に修正
することにより、本発明に係わる方法は非常に高速で収
斂する。従って、大域的および局所的極値が大域的なも
のに近い境界で見つけられる。

【００４５】本発明の発明者は試験音声フラグメントの
大部分に対して本発明に係わる方法により０．７ｄＢま
での平均ＳＮＲ値の増大を見出した。さらに、計算機的
な複雑さは従来技術のアルゴリズムの構成の場合よりも
２〜３の係数でより小さくなることが見出された。これ
は各々の成分をサーチする前に、ベクトルｄ_ｊ（ｉ），
ｉ＝１，…，Ｎの再帰的な計算（修正）を伴ったコード
ベクトル成分の連続的なサーチによる。

【００４６】見出されたコードベクトルに対応する真の
または実利得（ｒｅａｌｇａｉｎ）は計算されたｇ_ｃ
を使用する代わりに（ＩＳ−１２７のように）計算でき
る。これは合成された音声の品質をやや改善するが、い
くらかの余分の計算機的な努力を必要とする。

【００４７】図２は、本発明のハードウエア構成を示
す。本発明の実施のためのコンピュータプログラムはプ
ログラムメモリ２０２に格納することができ、該プログ
ラムメモリ２０２は好ましくはＲＯＭである。他のメモ
リ２１１（ＲＡＭ）が相関項（ｄ_ｊ（ｉ））、共分散項
（φ（ｉ，ｉ）およびφ（ｐ（ｉ）；ｐ（ｊ）））、ソ
ース離散信号エネルギ（Ｘ）および利得（ｇ_ｃ）の値を
一時的に格納するために必要とされる。ＡＬＵ２０３
においては、上述の種々の数式の計算が行われ、ステー
タスレジスタ２０４がＡＬＵ２０３のステータスを他
の構成要素に指示する。このハードウエア構成の全ての
要素はデータバス２１０を介して結合されている。最適
のベクトルのサーチの結果もまたデータバス２１０を介
して出力される。

【００４８】この明細書においては、レート（ｒａｔ
ｅ）は考慮されなかったが、その理由はそれが本発明に
係わる利得および最適のコードブックベクトルの計算に
影響を与えないからである。しかしながら、当業者には
レートはチャネルにおけるノイズおよび信号エネルギ推
定または評価に従って決定されることは明らかであろ
う。［図面の簡単な説明］

【図１】利得評価のための近似戦略の特定の応用を導入
した本発明の一実施形態を示すフローチャートである。

【図２】図１に示される実施形態の処理を図１に続いて
示すフローチャートである。

【図３】本発明を実施するためのコンピュータハードウ
エアの構成を示すブロック図である。

【符号の説明】

２０１プログラム制御ユニット２０２プログラムメモリ２０３ＡＬＵ２０４ステータスレジスタ２１０データバス２１１メモリ

───────────────────────────────────────────────────── フロントページの続き (72)発明者ディアチェンコ・ジュリーロシアモスコウ・アールイージー 140200 ボスクレセンスクソベツカヤ・ストリート16エイ−６ (56)参考文献特開平６−348300（ＪＰ，Ａ) 特開平６−131000（ＪＰ，Ａ) 特開平８−202396（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/12

Claims

(57)【特許請求の範囲】

【請求項１】ＣＥＬＰアルゴリズムのための方法であ
って、信号プリプロセッサにおいてサンプルされた音声ｓ
｛ｎ｝を前処理し（１０１）ノイズろ波された音声出力
ベクトルおよびチャネルノイズ推定を出力する段階、前記ノイズろ波された音声出力ベクトルのモデルパラメ
ータ推定（１０２）を行い予測残余および長時間予測利
得を出力する段階、前記予測残余を符号化して（１０４〜１２０）フィルタ
のインパルス応答関数の指数およびベクトル利得を含む
適応コードブックベクトルを出力する段階、符号化された音声パケットをフォーマットする段階（１
２１）、を含み、前記符号化する段階（１０４〜１２０）は以下
の順序で、理論的な最適値に近いスタート値を選択することにより
前記利得を決定する段階（１０４〜１０９）、そして再帰的に修正された相関ベクトルに基づき推定関数の極
値を逐次的にサーチすることによりベクトルの最適化を
行う段階（１１０〜１２０）、を具備することを特徴とするＣＥＬＰアルゴリズムのた
めの方法。
【請求項２】前記利得は前記サンプルされた音声フレ
ームのエネルギおよび一組のインパルス応答関数の共分
散マトリクスのトレースに基づき決定されることを特徴
とする請求項１に記載の方法。
【請求項３】前記利得は前記サンプルされた音声フレ
ームのエネルギおよび第１のインパルス応答関数の共分
散項に基づき決定されることを特徴とする請求項１に記
載の方法。
【請求項４】前記利得は前記サンプルされた音声フレ
ームのエネルギおよびフレーム長さに基づき決定される
ことを特徴とする請求項１に記載の方法。
【請求項５】前記最適のベクトルは、前記サンプルされた音声信号およびインパルス応答関数
の相関項を前に見出されたベクトル成分に適合させ、そ
して前記適合された相関項を前記推定関数に再挿入する、ことにより決定されることを特徴とする請求項２に記載
の方法。
【請求項６】前記最適のベクトルは、前記サンプルされた音声信号およびインパルス応答関数
の相関項を前に見出されたベクトル成分に適合させ、そ
して前記適合された相関項を前記推定関数に再挿入する、ことにより決定されることを特徴とする請求項３に記載
の方法。
【請求項７】前記最適のベクトルは、前記サンプルされた音声信号およびインパルス応答関数
の相関項を前に見出されたベクトル成分に適合させ、そ
して前記適合された相関項を前記推定関数に再挿入する、ことにより決定されることを特徴とする請求項４に記載
の方法。
【請求項８】コードブックベクトルおよび該コードブ
ックベクトルの利得を決定するために電気信号を処理す
るためのデジタル信号プロセッサであって、信号プリプロセッサにおいてサンプルされた音声ｓ
｛ｎ｝を前処理して（１０１）少なくともノイズろ波さ
れた音声出力ベクトルおよびチャネルノイズ推定を出力
するための手段、前記ノイズろ波された音声出力ベクトルのモデルパラメ
ータ推定を行い（１０２）予測残余および長時間予測利
得を出力するための手段、前記残余を符号化して（１０４〜１１８）フィルタのイ
ンパルス応答関数の指数およびベクトル利得を含む適応
コードブックベクトルを出力するための手段、前記符号化された音声パケットをフォーマットする（１
１６）ための手段、を具備し、前記符号化（１０４〜１０９）は次の順序
で、理論値に近いスタート値を選択することにより前記利得
の決定を行う（１０４〜１０９）ための手段、そして再帰的に修正された相関ベクトルに基づき推定関数の極
値を逐次的にサーチすることによりベクトルの最適化を
行う（１１０〜１２０）ための手段、によって行なわれることを特徴とするデジタル信号プロ
セッサ。
【請求項９】コードブックベクトルおよび該コードブ
ックベクトルの利得を決定するために電気信号を処理す
るためのデジタル信号プロセッサを具備する電子装置で
あって、前記デジタル信号プロセッサは、信号プリプロセッサにおいてサンプルされた音声ｓ
｛ｎ｝を前処理して（１０１）少なくともノイズろ波さ
れた音声出力ベクトルおよびチャネルノイズ推定を出力
するための手段、前記ノイズろ波された音声出力ベクトルのモデルパラメ
ータ推定を行い（１０２）予測残余および長時間予測利
得を出力するための手段、前記残余を符号化して（１０４〜１１８）フィルタのイ
ンパルス応答関数の指数およびベクトル利得を含む適応
コードブックベクトルを出力するための手段、前記符号化された音声パケットをフォーマットする（１
１６）ための手段、を具備し、前記符号化（１０４〜１０９）は次の順序
で、理論値に近いスタート値を選択することにより前記利得
の決定を行う（１０４〜１０９）ための手段、そして再帰的に修正された相関ベクトルに基づき推定関数の極
値を逐次的にサーチすることによりベクトルの最適化を
行う（１１０〜１２０）ための手段、によって行なわれることを特徴とする電子装置。