JP2002503835A

JP2002503835A - 固定コードブックにおける最適のベクトルの高速決定のための方法および装置

Info

Publication number: JP2002503835A
Application number: JP2000531839A
Authority: JP
Inventors: ロズデスツベンスキー・ジュリー; ディアチェンコ・ジュリー
Original assignee: Motorola Inc
Current assignee: Motorola Solutions Inc
Priority date: 1998-02-17
Filing date: 1998-02-17
Publication date: 2002-02-05
Anticipated expiration: 2018-02-17
Also published as: KR100510399B1; WO1999041737A8; US6807527B1; WO1999041737A1; KR20010024943A; JP3425423B2

Abstract

(57)【要約】【課題】計算機サイクルが少なく高い精度を維持できかつ高速のＣＥＬＰアルゴリズムを実現する。【解決手段】ＣＥＬＰアルゴリズムのための方法は、信号プリプロセッサにおいてサンプル音声ｓ｛ｎ｝を前処理して（１０１）少なくともノイズろ波された音声出力ベクトルおよびチャネルノイズ推定を出力する段階、前記ノイズろ波された音声出力ベクトルのモデルパラメータ推定を行い（１０２）予測残余および長時間予測利得を出力する段階、前記予測残余を符号化して（１０４〜１２０）フィルタのインパルス応答関数の指数およびベクトル利得を含む適応コードブックベクトルを出力する段階、符号化された音声パケットをフォーマットする段階（１２１）を含む。前記符号化する段階（１０４〜１２０）は以下の順序で、理論的な最適値に近いスタート値を選択することにより前記利得を決定する段階（１０４〜１０９）、および再帰的修正相関ベクトルに基づき推定関数の極値を連続的にサーチすることによるベクトル最適化（１１０〜１２０）の段階を具備する。

Description

【発明の詳細な説明】

【０００１】

【発明の分野】

本発明は音声符号化アルゴリズムのための方法および装置に関し、特に符号励
振線形予測（ｃｏｄｅｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｖｅ
：ＣＥＬＰ）符号化アルゴリズムのための方法および装置に関する。ＣＥＬＰア
ルゴリズムは、例えば、セルラシステムにおけるベースステーションと移動ステ
ーションとの間の、２方向音声通信において使用される。ＣＥＬＰアルゴリズム
のための方法は信号プリプロセッサにおいてサンプルされた音声ｓ｛ｎ｝を前処
理して（ｐｒｅ−ｐｒｏｃｅｓｓｉｎｇ）少なくともノイズろ波された音声出力
ベクトルおよびチャネルノイズ推定を出力する段階、予測誤差または残余（ｒｅ
ｓｉｄｕａｌ）および長時間（ｌｏｎｇｔｅｒｍ）予測利得を出力するように
前記ノイズろ波された音声出力ベクトルのモデルパラメータ推定を行う段階、予
測誤差を符号化してフィルタのインパルス応答関数の指数およびベクトル利得を
含む適応コードブックベクトルを出力する段階、および前記符号化された音声パ
ケットをフォーマットまたは形成する段階を含む。

【０００２】ＣＥＬＰアルゴリズムは中間のビットレート、すなわち、４８００または９６
００ｂｐｓ、において良好な音声品質を提供することが見出されている。しかし
ながら、励振信号のベクトル量子化は極めて高い計算機的な努力を必要とする。
重複（ｏｖｅｒｌａｐｐｉｎｇ）コードブックベクトルの使用を含むベクトル量
子化をスピードアップするためのいくつかの提案が行なわれてきている。

【０００３】

【発明の背景】

符号励振リニア予測（ＣＥＬＰ）アルゴリズムはエス・シンハルおよびビー・
エス・アタルによる、「低ビットレートにおける多パルスＬＰＣ符号器の性能改
善（Ｉｍｐｒｏｖｉｎｇｐｅｒｆｏｒｍａｎｃｅｏｆｍｕｌｔｉ−ｐｕｌ
ｓｅＬＰＣｃｏｄｅｒｓａｔｌｏｗｂｉｔｒａｔｅｓ）」、Ｐｒｏ
ｃ．Ｉｎｔ．Ｃｏｎｆ．、音響、音声および信号処理、（サン・ディエゴ）、１
９８４年、ｐｐ．１．３．１−１．３．４；およびダブリュー・ビー・クライジ
ン、ディー・ジェイ・クラシンスキイおよびアール・エイチ・ケッチャムによる、「ＣＥＬＰ音声符号化アルゴリズムのための高速の方法（Ｆａｓｔｍｅｔｈ
ｏｄｓｆｏｒｔｈｅＣＥＬＰｓｐｅｅｃｈｃｏｄｉｎｇａｌｇｏｒ
ｉｔｈｍ）」、ＩＥＥＥＴｒａｎｓ．、音響、音声および信号処理、Ｖｏｌ．
３８，Ｎｏ．８，ＰＰ．１３３０−１３４２、１９９０年、に述べられている。
ＣＥＬＰ符号化アルゴリズムはサブフレームごとのベースでサンプルされた音声
を処理するために使用される。該音声信号のスペクトルエンベロープは線形予測
技術を使用してその係数が得られるフィルタによって記述される。前記係数は量
子化され、それによって前記フィルタが送信機側および受信機側の双方に関して
構築できる。前記フィルタ係数は合成による分析（ａｎａｌｙｓｉｓ−ｂｙ−ｓ
ｙｎｔｈｅｓｉｓ）手順によって決定される。一組のそのような候補の励振シー
ケンスまたはベクトルはコードブックに格納される。最も正確な音声を生成する
ベクトルの指数（ｉｎｄｅｘ）はチャネルの受信端に送信される。送信側の入力
音声は受信側においてその指数が送信されたベクトルを使用して発生される合成
音声によって回復される。

【０００４】主なタスクは入力音声を最も正確に記述するコードブックにおける最適のベク
トルを見つけることである。高速のベクトル量子化および卓越した合成音声品質
はＣＥＬＰアルゴリズムを音声符号化の用途にとって魅力的なものにする。スペ
クトル拡散デジタルシステムにおけるＣＥＬＰアルゴリズムの実施についてはＩ
Ｓ−１２７標準「強化された可変レートコーデック、広帯域スペクトル拡散デジ
タルシステムのための音声サービスオプション３（ＥｎｈａｎｃｅｄＶａｒｉ
ａｂｌｅＲａｔｅＣｏｄｅｃ，ＳｐｅｅｃｈＳｅｒｖｉｃｅＯｐｔｉｏ
ｎ３ｆｏｒＷｉｄｅｂａｎｄＳｐｒｅａｄＳｐｅｃｔｒｕｍＤｉｇ
ｉｔａｌＳｙｓｔｅｍｓ）」、１９９６年４月１９日、セクション４．５．７
「代数的ＣＥＬＰ固定コードブック寄与の計算（Ｃｏｍｐｕｔａｔｉｏｎｏｆ
ｔｈｅａｌｇｅｂｒａｉｃＣＥＬＰＦｉｘｅｄＣｏｄｅｂｏｏｋＣ
ｏｎｔｒｉｂｕｔｉｏｎ）」に記載されている。この標準において使用されるコ
ードブックは代数的コードブック（ＡＣＥＬＰ）構造を備えた固定コードブック
である。

【０００５】前記代数的コードブックにおける最適のコードベクトルを見つけるために、Ａ
ＣＥＬＰコードブックが重み付けされた入力音声と重み付けされた合成音声との
間の平均２乗誤差（ＭＳＥ）を最小にすることによりサーチされる。言い換えれ
ば、前記コードブックは次の項、

【数１】Ｔ_ｋ＝Ｃ_ｋ ^２／Ｅ_ｋを最大にすることによってサーチされ、この場合Ｃ_ｋはインパルス応答および
知覚領域ターゲット信号（ｐｅｒｃｅｐｔｕａｌｄｏｍａｉｎｔａｒｇｅｔ
ｓｉｇｎａｌ）の相関であり、かつＥ_ｋはコードブックベクトルのインパルス
応答のエネルギまたは共分散（ｃｏｖａｒｉａｎｃｅ）であり、これらはともに
位置ｋにおけるものである。前記コードブックベクトルは一連の単位パルスであ
り、各パルスは前記コードブックにおいて適切な位置にありかつ適切に選択され
た符号を有している。

【０００６】最適の代数的コードブックベクトルを決定するために、前記相関およびエネル
ギ項はパルス位置および符号のすべての可能な組合わせに対して計算されるべき
である。しかしながら、これは禁止されるべきまたは非常に高価なタスクである
。サーチを単純化するために、以下に説明されるようにパルス符号および位置を
サーチするための二つの戦略が使用される。

【０００７】前記パルス符号は適切な基準信号の符号を考慮することにより（閉ループサー
チの外部で）プリセットされる。振幅が、ある位置でのパルスの振幅をその位置
における前記基準信号の符号に等しく設定することによりプリセットされる。こ
の「新しい」構成要素により、修正された相関Ｃ_ｋ′および修正されたエネルギ
Ｅ_ｋ′が計算される。

【０００８】上に説明したようにパルス振幅をプリセットすると、最適のパルス位置が効率
的な非網羅的な（ｎｏｎ−ｅｘｈａｕｓｔｉｖｅ）合成による分析サーチ技術を
使用して決定される。この技術においては、項Ｔ_ｋが反復的な「深さ優先（ｄｅ
ｐｔｈ−ｆｉｒｓｔ）」ツリーサーチ戦略を使用して少しの割合の位置の組合わ
せに対してテストされる。

【０００９】いったん励振パルスの位置および符号が決定されると、前記「新しい」コード
ブックベクトルは一連の単位パルスとして構築され、各パルスはコードブックに
おける「新しい」位置にある。

【００１０】固定コードブックベクトルの利得はその後次の式によって決定される。

【数２】ｇ_ｃ＝Ｃ_ｋ／Ｅ_ｋＩＳ−１２７標準において提案されたこの固定コードブックサーチアルゴリズ
ムは次のような不都合を有する。

【００１１】前記項Ｔ_ｋ＝Ｃ_ｋ ^２／Ｅ_ｋは非線形多次元多極値関数（ｎｏｎ−ｌｉｎｅａｒ
ｍｕｌｔｉｄｉｍｅｎｓｉｏｎａｌｍｕｌｔｉ−ｅｘｔｒｅｍｕｍｆｕｎ
ｃｔｉｏｎ）である。この非線形多次元多極値関数のある極値をサーチするタス
クは、利用可能な計算機的な性能が限られている場合に、組合わせのまたは組合
わせ的な方法（ｃｏｍｂｉｎａｔｏｒｉａｌｗａｙ）で解かれ、これは大域的
なもの（ｇｌｏｂａｌｏｎｅ）よりはむしろローカルな極値（ｌｏｃａｌｅ
ｘｔｒｅｍｕｍ）を見つける結果となる。

【００１２】最小化関数（ｍｉｎｉｍｉｓｉｎｇｆｕｎｃｔｉｏｎ）の計算は非常に時間
を消費しかつ多数の計算サイクルを必要とする。すなわち、ＩＳ−１２７標準に
おいて提案された固定コードブックサーチ方法は各々のトラックにおいてパルス
位置のための線形サーチを想定しかつ１１４４の計算を必要とする。さらに、Ｔ _ｋの評価は前記アルゴリズムの複雑さを大幅に増大する除算操作を含む。

【００１３】従って、従来技術の構成よりも高速でありかつ計算サイクルに関して高価でな
く、それでも最大の達成可能な精度を維持するＣＥＬＰアルゴリズムのための方
法および装置が必要とされる。

【００１４】

【発明の概要】

本発明の基礎をなす問題は基本的に独立請求項に記載された特徴的事項を適用
することにより解決される。好ましい実施形態は従属請求項に与えられている。

【００１５】一定の長さを有するフレームに関して音声誤差または残差に対する高速の多パ
ルス符号化アルゴリズムの効率改善の必要性は本発明によって満たされる。請求
項１および請求項８にそれぞれ記載された本発明に係わる方法および装置は前記
アルゴリズムの高速の収斂を与え、それによって最適のベクトルが従来技術より
も効率的にサーチできる。

【００１６】本発明の基礎をなす基本的なアイデアは最適のコードブックベクトルを見つけ
るタスクを以下の二つのサブタスクに分解することである。符号化パルスに対する振幅利得の計算（第１ステージ）、および符号化パルスに対する最適のサンプル位置の計算（第２ステージ）。

【００１７】本発明に係わる計算シーケンスは前記ＩＳ−１２７標準による従来技術に記載
されたものと逆であることに注目すべきである。

【００１８】本発明による方法は離散的ソース信号の最適の符号化パルス位置のサーチの多
次元多極値非線形タスクをそれぞれのパルスに対して順次最小化される多次元２
乗形式を有する最適の極値サーチタスクへと低減する。これは本質的に計算時間
を低下させかつより高い符号化精度を提供する。

【００１９】前記第１ステージにおいて、最適のコードベクトル利得“ｇ_ｃ”が次の式によ
って決定される。

【数３】Ｎｇ_ｃ＝ａ｛Σ［ｘ（ｉ）］^２ｉ＝１Ｎ／Σｉ・［ｈ（Ｎ−ｉ＋１）］^２｝^１／２ｉ＝１この場合、ｘはソース離散信号（知覚領域ターゲット信号ベクトル）であり、ｈは特別関数（フィルタのインパルス応答）であり、ａは実験的に決定された重み係数であり、そしてＮはサブフレーム長さである。

【００２０】前記重み係数“ａ”に対する最適の値は適切な関数“ｈ”および非ゼロコード
ベクトル成分のある与えられた数“ｎ”に対して実験的に決定される。ｎ＝８お
よび重み合成フィルタ“ｈ_ｗｑ”のインパルス応答に対して、値ａ＝２が得られ
た。

【００２１】前記第２ステージにおいては、符号化パルスの最適位置の順次的なサーチが行
なわれる。位置ｐ（ｊ）∈｛１，…，Ｎ｝，ｊ＝１，…，ｎにおける符号ベクト
ル成分は評価または推定関数（ｅｓｔｉｍａｔｅｆｕｎｃｔｉｏｎ）Ｆ（ｐ（
ｊ））を最大にすることにより順次サーチされ、これはｊ番目のパルスの音声信
号残差（レシデュアル：ｒｅｓｉｄｕａｌ）への寄与分を決定する。

【数４】Ｆ（ｐ（ｊ））＝ｍａｘ｛２｜ｄ_ｊ（ｐ（ｊ））｜ｐ（ｊ） −ｇ_ｃφ（ｐ（ｊ）），（ｐ（ｊ））｝この場合、ｐ（ｊ）＝１，…，Ｎであり、ｊ＝１，…，ｎであり、かつ

【数５】Ｎ φ（１，ｍ）＝ Σｈ（ｋ−ｌ）・ｈ（ｋ−ｍ）ｋ＝ｍａｘ（ｌ，ｍ）であり、これは前記フィルタのすべてのインパルス応答関数ｈの共分散アレイ
である。この場合、

【数６】ｄ_ｊ＋１（ｉ）＝ｄ_ｊ（ｉ） −ｓｉｇｎ（ｄ_ｊ（ｐ（ｊ））ｇ_ｃφ（ｉ，ｐ（ｊ））

【数７】Ｎｄ_１＝Σｘ（ｋ）・ｈ（ｋ−ｉ）ｋ＝ｉこの場合ｄ_１は前記インパルス応答関数およびｊ＝１に対する前記ソース離散
信号の元の相互相関ベクトルである。

【００２２】

【発明を実施するための最前の態様】

本発明に係わる実施形態の詳細な説明のために、ＩＳ−１２７標準（編集バー
ジョン６、ＴＲ−４５）における名称を参照する。すなわち、ＭＳＥはあるサブ
フレームにおける固定コードブック寄与分からの固定コードブックサーチターゲ
ットベクトルの偏差またはずれの平均２乗誤差である。ＳＮＲは、ｄＢでの、信
号対雑音比であり、変更された（シフトされた）もとの音声信号Ｓ_Ｗが処理され
た信号として使用されかつそれと適応および固定コードブックの助けにより再構
成された信号がノイズとして考えられる。平均ＳＮＲは音声フラグメントに関し
て平均されかつ９６００ｂｐｓのレートおよび４８００ｂｐｓのレート、すなわ
ちそれぞれレート１およびレート１／２で送信されるすべてのフレームに対する
平均ＳＮＲ値として計算される。すべてのｐ（ｊ）は５つのトラックＴ０，…，
Ｔ４にわたり分配または分布される。前記トラックの内の３つは各々８つの非ゼ
ロパルスの内の２つが割当てられ、前記トラックの内の２つは各々８つのパルス
の内の１つが割当てられる。各々１つのパルスを備えた２つのトラックは互いに
サイクリックまたは循環的に隣接し、すなわち、トラック３およびトラック４は
各々１つのパルスを含み、トラック４およびトラック０は各々１つのパルスを含
み、以下同様である。

【００２３】前記ＩＳ−１２７標準に従って固定コードブック構造により決定される一般的
なタスクはレート１に対して次のように公式化される。すなわち、次の数式、

【数８】ＮＦ（ｇ_ｃ；→ｐ）＝ｍｉｎΣ［ｘ_ｗ（ｉ）ｉ＝１８ −ｇ_ｃΣｈ_ｗｑ（ｉ−ｐ（ｊ））］^２ｊ＝１を満たすベクトルｐ（ｊ），ｊ＝１，…，８、および利得ｇ_ｃが、固定コード
ブック構造ならびに以下の条件、

【数９】ｇ_ｃ＞０，０≦ｐ（ｊ）≦５４，ｊ＝１，…，８，ｐ（ｊ）≠ｐ（ｋ），ｊ，ｋ＝１，…，８，ｈ_ｗｑ（ｊ−ｐ（ｊ））＝０，ｊ−ｐ（ｊ）＜０．により規定される制約のもとで見つけ出され、この場合Ｎはサブフレームのサ
イズである。なお、→ｐなる表記において、記号→は文字ｐの上に配置されるべ
きであるが、文字コードの制限のため文字ｐの前に配置している。

【００２４】これは許容できる解の領域の複素境界を備えた多次元関数のための極値のサー
チの典型的なタスクである。最小化される前記関数は一般に１つより多くの極値
を有する非線形９次関数である。前記制約は前記許容できる解の領域の非線形の
境界を形成し、従ってローカルまたは局所的極値（ｌｏｃａｌｅｘｔｒｅｍａ
）の数はさらに増大しかつ大域的極値（ｇｌｏｂａｌｅｘｔｒｅｍｕｍ）のサ
ーチは一層複雑になる。変更された（前記ＲＣＥＬＰアルゴリズムに関してシフ
トされた）もとの残余（ｒｅｓｉｄｕａｌ）から適応コードブック出力を減算す
ることにより得られる離散信号の符号化のＭＳＥの真のまたは実数の最小のサー
チは従って不成功に終るであろう。

【００２５】本発明による方法における前記第１のステップは利得の計算である。本発明の第１の実施形態においては、前記利得は、

【数１０】ｇ_ｃ〜Ｘとみなされ、この場合、

【数１１】ＮＸ^２＝Σｘ_ｗ ^２（ｉ）ｉ＝１はソース離散信号のエネルギである。言い換えれば、ｇ_ｃの最適の値はサブフ
レームにおける信号ｘ_Ｗの平均２乗振幅に比例するとみなすことができる。前記
ソース離散信号のエネルギはフィルタのインパルス応答関数の共分散マトリクス
のトレース（ｔｒａｃｅ）と比較される。言い換えれば、すべての対角共分散項
の合計が行なわれ、それによって利得ｇ_ｃを次のように得る。

【数１２】Ｎｇ_ｃ＝α・Ｘ／｛Σφ（ｉ；ｉ）｝^１／２ｉ＝１

【００２６】この利得計算は図１に示されている。ステップ１０１における信号ｓ｛ｎ｝の
前処理およびステップ１０２におけるモデルパラメータの推定の後に、前処理さ
れた音声信号のエネルギＸがステップ１０３において計算される。ループ１０４
〜１０９において、共分散マトリクスの対角要素が決定される。ステップ１０４
において、第１の対角要素φ（ｉ，ｉ）、すなわち、φ（１，１）、が計算され
る。ステップ１０５において、それは後に使用する目的でメモリに格納される。
さらに、ステップ１０６において、前記値φ（ｉ，ｉ）が値Ａに加えられ、それ
によって最終的に共分散マトリクスのトレースを得る。

【数１３】Ａ＝Ａ＋φ（ｉ，ｉ）

【００２７】この反復はｉ＝Ｎまで繰り返される。言い換えれば、処理はｉ＜Ｎである限り
次のφ（ｉ，ｉ）を計算するためにステップ１０４に戻るよう分岐し、かつｉ＝
Ｎの場合にステップ１０７においてループを退出しかつトレースの計算が完了す
る。

【００２８】ステップ１０３からのＸの値およびステップ１０６からのＡの値により、前記
コードベクトルの利得は次の式によって計算される。

【数１４】Ｎｇ_ｃ＝α・Ｘ／｛Σφ（ｉ；ｉ）｝^１／２ｉ＝１＝α・Ｘ／Ａ^１／２この場合、αは音声の残差（ｒｅｓｉｄｕａｌ）に適用されるべき係数であり
、かつＡは考慮中のサブフレームの共分散マトリクスのトレースに対する単なる
かつ一時的な置換（ｓｕｂｓｔｉｔｕｔｅ）である。

【００２９】上の実施例の特定の利点はその比較的低い計算機的な努力である。前記共分散
項φ（ｉ，ｉ）はサブフレームにおける全てのパルス位置（前記ＩＳ−１２７標
準においてはＮ＝５３または５４）に対して計算されなければならないが、これ
は全体の計算機的な努力を増大するものではなく、その理由は前記対角項（ｄｉ
ａｇｏｎａｌｔｅｒｍｓ）は以下に説明するさらなる計算のために利用可能で
あるからである。

【００３０】上に述べた実施形態よりも高速とすることができるが、利得計算の精度を犠牲
にする、他の実施形態が本発明の発明者によって考案されかつ本発明のさらに他
の実施形態（示されていない）において実施されている。

【００３１】本発明の発明者によって、本発明に係わる方法の第１の構成の特定の簡単な変
更がｇ_ｃの決定のために実現できるという近似により満足すべき結果が達成でき
ることが見出され、すなわち、前記第１の実施形態は、離散的ソース信号および
サブフレーム長さを除き、前記共分散マトリクスにおける第１の対角項の共分散
、すなわち、φ（ｉ，ｉ）に排他的に依存する。共分散マトリクスのこの第１の
項はＮ、サブフレーム長さ、により乗算することにより「拡張され（ｅｘｐａｎ
ｄｅｄ）」、かつ次に平均２乗されたソース信号Ｘと比較される。前記利得は従
って次のように書くことができる。

【数１５】ｇ_ｃ＝α・Ｘ／｛Ｎ・φ（ｉ；ｉ）｝^１／２この場合、αは比例係数である。この構成により、対角要素の計算は１つに低
減される。この実施形態の利点はサブフレームにおける全ての他の共分散項の計
算が時代遅れになる（ｏｂｓｏｌｅｔｅ）ことである。

【００３２】本発明のこれらの実施形態の内のさらに他のもの（図示せず）においては、利
得は次のような簡単な式で表される。

【数１６】ｇ_ｃ＝α・（Ｘ^２／Ｎ）^１／２この場合、αは定数係数でありかつＮはサブフレーム長さである。しかしなが
ら、この手法はＸ^２＞＞Ｆ_ｍｉｎ（ｇ_ｃ；→Ｐ_ｏｐｔ）に対してのみ許容できる
ものである。ただし、この前提条件は大部分のサンプルされた音声の残差におい
て当てはまる。この手法により評価される利得の分析は高い精度の近似が達成可
能であることを示している。

【００３３】本発明の他の構成（図示せず）においては、第１のパルスは７０パーセントま
での情報を含むと仮定される。従って、前記第１のパルスはｇ_ｃの計算のための
主な候補である。しかしながら、もしそれが第１のパルスのみに関して決定され
れば、ｇ_ｃの値は前記最適値を超えるため、より多くのパルスが考慮される。こ
の利得計算の構成に対応する関係は次の式で与えられる。

【数１７】ｋｇ_ｃ＝ａ・ｇ_ｃ１＋Σｇ_ｃｉｉ＝２この場合、ｇ_ｃｉはｉ番目のパルスに対する利得ｇ_ｃであり、ｋはｇ_ｃの決定
のためのパルスの数または番号であり、ａは第１のパルスの重み係数である。

【００３４】前記第１のパルスのＳＮＲに対する影響は異なる音声信号およびパルスの数に
よって実験的に調べられた。発明者によってｋ＝８のパルスの数が最もよい結果
を与えることが見出された。ＭＳＥは３０パーセントに低減できた。

【００３５】最後の実施形態による前記利得ｇ_ｃの決定の精度を改善するために、インパル
ス応答関数の共分散の影響が考慮される。対応する構成は重み付けられた第１の
パルスおよびサブフレームにおける信号の平均２乗された振幅Ｘ^２に依存する。

【数１８】ｇ_ｃ＝ａ・ｇ_ｃ１＋ｂ・（Ｘ^２／Ｎ）^１／２この場合、ａ，ｂは重み係数であり、かつｇ_ｃ１は第１のパルスの振幅である
。この実施形態の利点はその低い計算機的な複雑さであり、利得の高い精度を有
し、それはインパルス応答関数の共分散の考慮が多様な音声フラグメントに対す
る異なる最適化された組の係数ａおよびｂにつながるからである。

【００３６】これらのアルゴリズムの比較分析は上記アルゴリズムの全てに対して卓越した
結果を示している。しかしながら、前記第１のアルゴリズムは最も大きな計算機
的な努力を必要とする。一般に、インパルス応答関数の共分散を考慮に入れる、
上記アルゴリズムは余分の計算機的な努力を必要とする。しかしながら、これは
計算された項の一部がやはりベクトルサーチのために必要とされるという事実に
より補償され、これについては後に説明する。従って、計算機的な努力はベクト
ルサーチから利得計算へとシフトされるのみであり、かつ前記利得計算の結果の
一部がベクトルサーチのためにも利用できるという事実により、劇的に増大する
ことはない。

【００３７】前記利得の評価が完了すると、本方法は図１の“Ａ”において最適のベクトル
｛ｐ（ｊ），ｊ＝１，…，８｝を見つけるよう進行し、この場合８は前記ＩＳ−
１２７システムにおけるベクトル成分の最大数である。

【００３８】このサーチは本方法の特定の実施形態においては励振残余に対する多パルス符
号化方法の順次の変量または変形（ｖａｒｉａｎｔ）によって達成される。共分
散マトリクスにおける対角項のみの考慮において最小にされるべき関数が次の形
式で書かれる。

【数１９】ＮＦ（ｇ_ｃ；ｐ（ｊ））＝ｍｉｎ［Σｘ_ｗ ^２（ｉ）ｐ（ｊ）ｉ＝１ −ｄ_ｊ ^２（ｐ（ｊ））／｛φ［ｐ（ｊ）；ｐ（ｊ）］｝］，ｊ＝１，…，８この場合、

【数２０】Ｎｄ_ｊ（ｐ（ｊ））＝Σｘ_ｗ（ｋ）・ｈ（ｋ−ｐ（ｊ））ｋ＝ｐ（ｊ）はパルス位置ｐ（ｊ）に対する相関であり、かつ

【数２１】 φ（（ｐ（ｊ）；ｐ（ｊ））Ｎ＝Σｈ（ｋ−ｐ（ｊ））・ｈ（ｋ−ｐ（ｊ））ｋ＝ｐ（ｊ）はパルス位置ｐ（ｊ）の共分散（ｃｏｖａｒｉａｎｃｅ）である。

【００３９】前記パルスｐ（ｊ）の符号は次の式で規定される。

【数２２】Ｓｉｇｎ（ｐ（ｊ））＝Ｓｉｇｎ（ｄ_ｊ（ｐ（ｊ）））

【００４０】次のステップにおいて、相互相関ベクトルｄ_ｊがｐ（ｊ−１）に基づき修正さ
れ、これは前に次の式によって計算されている。

【数２３】ｄ_ｊ［ｉ］＝ｄ_ｊ［ｉ］−ｇ_ｃ・Ｓｉｇｎ（ｐ（ｊ−１））・φ［ｉ；ｐ（ｊ−１）］，ｉ＝１，…，Ｎこの場合、ｇ_ｃは前に述べた利得計算シーケンスにおいて決定された利得であ
る。最後の３つの式の計算手順を順次反復することにより、前記パルス位置ｐ（
ｊ）がパルス位置ｐ（ｊ＋１）に進む前に最適化される。

【００４１】この手順の構成は図２に示されている。上記タスク、

【数２４】ＮＦ（ｇ_ｃ；ｐ（ｊ））＝ｍｉｎ［Σｘ_ｗ ^２（ｉ）ｐ（ｊ）ｉ＝１ −ｄ_ｊ ^２（ｐ（ｊ））／｛φ［ｐ（ｊ）；ｐ（ｊ）］｝］，ｊ＝１，…，８は次の関数の最大値を見出すのと等価である。

【数２５】Ｆ（ｐ（ｊ））＝ｍａｘ｛２｜ｄ_ｊ（ｐ（ｊ））｜ｐ（ｊ） −ｇ_ｃφ（ｐ（ｊ），ｐ（ｊ））｝この場合、ｐ（ｊ）∈｛１，…，Ｎ｝であり、かつｊ＝１，…，ｋであり、前
記ＩＳ−１２７標準においてはｋ＝８である。

【００４２】前記ベクトル検出手順の最初のステップにおいて、音声残余または残差ならび
にインパルス応答関数ｄ_ｊ（ｉ）の相関が計算され（ステップ１１０）、かつ前
記最大化基準Ｆの現在の最善の値を一時的に記憶するための変数Ｆ′がリセット
される。図２には明白に述べられていないが、非対角項φ（ｉ，ｊ）もステップ
１１０において決定されこれらはｊ＝２，…，８に対する相関ベクトルの修正の
ために必要とされる。次のステップ１１１において、固定コードブック構造の制
約がチェックされ、かつもしそれらが違反しておれば、手順はステップ１１７へ
と分岐する。ステップ１１２において、前述の利得計算の際に計算された共分散
項φ（ｉ，ｉ）がメモリから取り出される。

【００４３】前記利得ｇ_ｃ、相関ベクトルｄ_ｊ（ｉ）および共分散ベクトルφ（ｉ，ｉ）の
値により、ステップ１１３において推定または評価関数Ｆが計算される。Ｆの値
は、前に決定された、値Ｆ′と比較される。Ｆの最後に評価された値が前のＦ′
より大きい場合は、ステップ１１５において新しい値がメモリに格納され、ｐ（
ｊ）＝ｉの値がステップ１１６においてメモリに格納されかつ処理はステップ１
１７に進む。ステップ１１７において、１つのサブフレームにおける全てのサン
プル位置が推定または評価されたか否かがチェックされる。もし全てのサンプル
位置がチェックされていなければ、処理はステップ１１７の問合わせの後にステ
ップ１１８において増分されたｉと共にステップ１１１に進む。もし全てのサン
プル位置が評価または推定されておれば、サーチ手順はステップ１２０において
全てのベクトル成分の評価が完了したか否かをチェックする。もし完了しておれ
ば、最適のコードベクトルを見出す手順は考慮中のサブフレームに対して終了し
かつ、ステップ１２１において、パケットがチャネルの受信機側への送信のため
に形成またはフォーマットされる。もしベクトル成分の評価または推定がまだ完
了していなければ、処理はステップ１２０における問合わせの後にステップ１１
９においてｊを増分した後ステップ１１０に進む。

【００４４】本発明による方法は従来技術に対していくつかの利点を有する。すなわち、ベ
クトル１／φ（ｉ，ｉ）はサブフレームごとに一回だけ計算されればよい。これ
により、最適のベクトルに対するサーチ手順の計算機的努力が大幅に低減される
。計算されるべき共分散アレイにおける非対角要素φ（ｉ，ｊ）の数が共分散ア
レイの（５４から）７行に低減され、従来技術のように共分散アレイの全ての非
対角行（５４）を計算する必要がなくなる。基準計算のサイクル数がパルス数を
サブフレーム長さで乗算したものに限定され（例えば、８＊５４＝４３２）、一
方従来技術（ＩＳ−１２７標準）による必要なサイクル数は１１４４（固定コー
ドブック構造にわたり４つの反復を必要する組合わせ逐次サーチに対して）であ
る。しかしながら、実際には、本発明の方法によるサーチは本質的に少ないサイ
クル数の後に切り詰める（ｔｒｕｎｃａｔｅｄ）ことができる。パルスに対する
固定コードブック構造の制約は４つのパルスが見出された後にのみチェックされ
る。パルスの符号は自動的に決定され従って音声残余信号ｘ_Ｗの余分のろ波およ
び各サブフレームに対する基準ベクトルの計算を避けることができる。最大のＭ
ＳＥ偏差またはずれを連続的に修正することにより、本発明に係わる方法は非常
に高速で収斂する。従って、大域的および局所的極値が大域的なものに近い境界
で見つけられる。

【００４５】本発明の発明者は試験音声フラグメントの大部分に対して本発明に係わる方法
により０．７ｄＢまでの平均ＳＮＲ値の増大を見出した。さらに、計算機的な複
雑さは従来技術のアルゴリズムの構成の場合よりも２〜３の係数でより小さくな
ることが見出された。これは各々の成分をサーチする前に、ベクトルｄ_ｊ（ｉ）
，ｉ＝１，…，Ｎの再帰的な計算（修正）を伴ったコードベクトル成分の連続的
なサーチによる。

【００４６】見出されたコードベクトルに対応する真のまたは実利得（ｒｅａｌｇａｉｎ
）は計算されたｇ_ｃを使用する代わりに（ＩＳ−１２７のように）計算できる。
これは合成された音声の品質をやや改善するが、いくらかの余分の計算機的な努
力を必要とする。

【００４７】図２は、本発明のハードウエア構成を示す。本発明の実施のためのコンピュー
タプログラムはプログラムメモリ２０２に格納することができ、該プログラムメ
モリ２０２は好ましくはＲＯＭである。他のメモリ２１１（ＲＡＭ）が相関項（
ｄ_ｊ（ｉ））、共分散項（φ（ｉ，ｉ）およびφ（ｐ（ｉ）；ｐ（ｊ）））、ソ
ース離散信号エネルギ（Ｘ）および利得（ｇ_ｃ）の値を一時的に格納するために
必要とされる。ＡＬＵ２０３においては、上述の種々の数式の計算が行われ、
ステータスレジスタ２０４がＡＬＵ２０３のステータスを他の構成要素に指示
する。このハードウエア構成の全ての要素はデータバス２１０を介して結合され
ている。最適のベクトルのサーチの結果もまたデータバス２１０を介して出力さ
れる。

【００４８】この明細書においては、レート（ｒａｔｅ）は考慮されなかったが、その理由
はそれが本発明に係わる利得および最適のコードブックベクトルの計算に影響を
与えないからである。しかしながら、当業者にはレートはチャネルにおけるノイ
ズおよび信号エネルギ推定または評価に従って決定されることは明らかであろう
。

【図面の簡単な説明】

【図１】利得評価のための近似戦略の特定の応用を導入した本発明の一実施形態を示す
フローチャートである。

【図２】図１に示される実施形態の処理を図１に続いて示すフローチャートである。

【図３】本発明を実施するためのコンピュータハードウエアの構成を示すブロック図で
ある。

【符号の説明】

２０１プログラム制御ユニット２０２プログラムメモリ２０３ＡＬＵ２０４ステータスレジスタ２１０データバス２１１メモリ

───────────────────────────────────────────────────── フロントページの続きＦターム(参考） 5D045 CA03 CC01 5J064 AA01 AA03 BA13 BB07 BB12 BC02 BC12 BC25 BC27 【要約の続き】

Claims

【特許請求の範囲】

【請求項１】ＣＥＬＰアルゴリズムのための方法であって、信号プリプロセッサにおいてサンプルされた音声ｓ｛ｎ｝を前処理し（１０１
）ノイズろ波された音声出力ベクトルおよびチャネルノイズ推定を出力する段階
、前記ノイズろ波された音声出力ベクトルのモデルパラメータ推定（１０２）を
行い予測残余および長時間予測利得を出力する段階、前記予測残余を符号化して（１０４〜１２０）フィルタのインパルス応答関数
の指数およびベクトル利得を含む適応コードブックベクトルを出力する段階、符号化された音声パケットをフォーマットする段階（１２１）、を含み、前記符号化する段階（１０４〜１２０）は以下の順序で、理論的な最適値に近いスタート値を選択することにより前記利得を決定する段
階（１０４〜１０９）、そして再帰的に修正された相関ベクトルに基づき推定関数の極値を逐次的にサーチす
ることによりベクトルの最適化を行う段階（１１０〜１２０）、を具備することを特徴とするＣＥＬＰアルゴリズムのための方法。
【請求項２】前記利得は前記サンプルされた音声フレームのエネルギおよ
び一組のインパルス応答関数の共分散マトリクスのトレースに基づき決定される
ことを特徴とする請求項１に記載の方法。
【請求項３】前記利得は前記サンプルされた音声フレームのエネルギおよ
び第１のインパルス応答関数の共分散項に基づき決定されることを特徴とする請
求項１に記載の方法。
【請求項４】前記利得は前記サンプルされた音声フレームのエネルギおよ
びフレーム長さに基づき決定されることを特徴とする請求項１に記載の方法。
【請求項５】前記最適のベクトルは、前記サンプルされた音声信号およびインパルス応答関数の相関項を前に見出さ
れたベクトル成分に適合させ、そして前記適合された相関項を前記推定関数に再挿入する、ことにより決定されることを特徴とする請求項２に記載の方法。
【請求項６】前記最適のベクトルは、前記サンプルされた音声信号およびインパルス応答関数の相関項を前に見出さ
れたベクトル成分に適合させ、そして前記適合された相関項を前記推定関数に再挿入する、ことにより決定されることを特徴とする請求項３に記載の方法。
【請求項７】前記最適のベクトルは、前記サンプルされた音声信号およびインパルス応答関数の相関項を前に見出さ
れたベクトル成分に適合させ、そして前記適合された相関項を前記推定関数に再挿入する、ことにより決定されることを特徴とする請求項４に記載の方法。
【請求項８】コードブックベクトルおよび該コードブックベクトルの利得
を決定するために電気信号を処理するためのデジタル信号プロセッサであって、信号プリプロセッサにおいてサンプルされた音声ｓ｛ｎ｝を前処理して（１０
１）少なくともノイズろ波された音声出力ベクトルおよびチャネルノイズ推定を
出力するための手段、前記ノイズろ波された音声出力ベクトルのモデルパラメータ推定を行い（１０
２）予測残余および長時間予測利得を出力するための手段、前記残余を符号化して（１０４〜１１８）フィルタのインパルス応答関数の指
数およびベクトル利得を含む適応コードブックベクトルを出力するための手段、前記符号化された音声パケットをフォーマットする（１１６）ための手段、を具備し、前記符号化（１０４〜１０９）は次の順序で、理論値に近いスタート値を選択することにより前記利得の決定を行う（１０４
〜１０９）ための手段、そして再帰的に修正された相関ベクトルに基づき推定関数の極値を逐次的にサーチす
ることによりベクトルの最適化を行う（１１０〜１２０）ための手段、によって行なわれることを特徴とするデジタル信号プロセッサ。
【請求項９】コードブックベクトルおよび該コードブックベクトルの利得
を決定するために電気信号を処理するためのデジタル信号プロセッサを具備する
電子装置であって、前記デジタル信号プロセッサは、信号プリプロセッサにおいてサンプルされた音声ｓ｛ｎ｝を前処理して（１０
１）少なくともノイズろ波された音声出力ベクトルおよびチャネルノイズ推定を
出力するための手段、前記ノイズろ波された音声出力ベクトルのモデルパラメータ推定を行い（１０
２）予測残余および長時間予測利得を出力するための手段、前記残余を符号化して（１０４〜１１８）フィルタのインパルス応答関数の指
数およびベクトル利得を含む適応コードブックベクトルを出力するための手段、前記符号化された音声パケットをフォーマットする（１１６）ための手段、を具備し、前記符号化（１０４〜１０９）は次の順序で、理論値に近いスタート値を選択することにより前記利得の決定を行う（１０４
〜１０９）ための手段、そして再帰的に修正された相関ベクトルに基づき推定関数の極値を逐次的にサーチす
ることによりベクトルの最適化を行う（１１０〜１２０）ための手段、によって行なわれることを特徴とする電子装置。