JP2002524760A

JP2002524760A - スピーチコーディングのための適用基準

Info

Publication number: JP2002524760A
Application number: JP2000568079A
Authority: JP
Inventors: エリックエクデン，; ロアールハーゲン，
Original assignee: テレフォンアクチーボラゲットエルエムエリクソン（パブル）
Priority date: 1998-09-01
Filing date: 1999-08-06
Publication date: 2002-08-06
Anticipated expiration: 2019-08-06
Also published as: AU774998B2; BR9913292B1; BR9913292A; TW440812B; US6192335B1; RU2223555C2; JP3483853B2; DE69906330D1; CN1325529A; MY123316A; EP1114414B1; CN1192357C; AR027812A1; KR20010073069A; CA2342353C; WO2000013174A1; DE69906330T2; AU5888799A; EP1114414A1; CA2342353A1

Abstract

(57)【要約】元のスピーチ信号から、元のスピーチ信号の近似値を再構成することができる複数のパラメータ（ｇａ_Q、ｇｆ_Q）を作成するに際して、元のスピーチ信号に基づいて元の信号を表現することを意図した別の信号を作成する。元のスピーチ信号と別の信号との間の第１と第２の相違に基づいて少なくとも１つのパラメータを決定する（６９，７１）。第１の相違は元のスピーチ信号に対応する波形と前記別の信号に対応する波形の相違であり、前記第２の相違は前記元のスピーチ信号から得られたエネルギーパラメータと前記別の信号に対応するエネルギーパラメータとの相違である。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】

本発明は一般的にはスピーチコーディングに関するものであり、より具体的に
は、ノイズ状の、低ビットレート信号を取り込むための改善されたコーディング
基準に関するものである。

【０００２】

【発明の技術背景】

最も新しいスピーチコーダは、何らかの形のモデルに基づいて符号化されたス
ピーチ信号を作成するものである。モデルのパラメータと信号は量子化されて、
それらを記述する情報はチャネルを介して送信される。セルラー電話への適用に
おいて支配的なコーダのモデルは符号励起線形予測手法（ＣＥＬＰ）である。

【０００３】図１に従来のＣＥＬＰデコーダを示す。符号化されたスピーチが典型的には１
０のオーダである全ポール合成フィルタを通して供給される励起信号によって作
成される。励起信号は、対応するコード表から取り出される２つの信号ｃａとｃ
ｆの合計として得られ（一方は固定、他方は適用型である）、次に適当なゲイン
係数ｇａとｇｆを掛ける。コードブック信号は典型的には５ｍｓの長さで（サブ
フレーム１つ）、合成フィルターは典型的には２０ｍｓごとに（１フレームで）
更新される。ＣＥＬＰモデルに関連するパラメータは、合成フィルタ係数、コー
ドブックの内容及びゲイン係数である。

【０００４】図２には、従来のＣＥＬＰエンコーダが示されている。ＣＥＬＰデコーダ（図
１）のレプリカを用いてサブフレーム毎のコード信号候補を作成する。２１で符
号化された信号は符号化されていない（デジタル化された）信号と比較されて、
符号化プロセスを制御するために重み付けられた誤差信号が使用される。合成フ
ィルタは線形予測（ＬＰ）を使用して決定される。この従来の符号化手順は合成
による線形予測分析（ＬＰＡＳ）とよばれる。

【０００５】上の記載からわかるように、ＬＰＡＳコーダは重み付けられたスピーチ領域で
波形マッチングを使用する。つまり、誤差信号は重み付けフィルタによってフィ
ルタ処理される。このことは以下に示す２乗誤差基準を最小化するものとして表
現される：

【数１】ここで、Ｓは符号化されていないスピーチサンプルのサブフレームを有するベク
トル、Ｓ_WはＳに重み付けフィルタＷを掛けたもの、ｃａとｃｆはそれぞれ適用
及び固定コードブックからの符号ベクトル、Ｗは重み付けフィルタ処理を行うマ
トリックス、Ｈは合成フィルタ処理を行うマトリックス、ＣＳ_Wは符号化された
信号に重み付けフィルタＷを掛けたものである。従来は、式１に記載された基準
を最小化する符号化処理は以下のステップに従って行われている：

【表１】

【０００６】上記の波形マッチング手順は、少なくとも８ｋｂ／ｓ程度以上のビットレート
であれば良く機能することが知られている。しかし、ビットレートを下げると、
音声のないスピーチや背景ノイズのような非周期的なノイズ状の信号については
波形マッチングの能力に問題がある。音声を有するスピーチ部分については、波
形マッチング基準はそれでもよく機能するが、ノイズ状の信号に対する波形マッ
チング能力が劣るために、符号化された信号のレベルが低くなりすぎ（スワーリ
ングとして知られている）不愉快な変化を伴うものになることが多い。

【０００７】ノイズ状の信号に関しては、関連技術の分野では、信号のスペクトル特性をマ
ッチさせることで良好な信号レベル（ゲイン）の一致が得られることが知られて
いる。線形予測合成フィルタは信号のスペクトル特性を与えるので、式１に代え
て用いることができる基準は以下のようになる：

【数２】ここで、Ｅ_Sは符号化されていないスピーチ信号のエネルギー、Ｅ_CSは符号化信
号ＣＳ＝Ｈ・（ｇａ・ｃａ＋ｇｆ・ｃｆ）のエネルギーである。式１が波形マッ
チングを表すのに対して、式２は、エネルギーマッチングを表すものである。こ
の基準もまた重み付けフィルタＷを導入して重み付けスピーチに使用することが
できる。式２では、基準を式１と同じ領域にするだけのために平方根を求める処
理が含まれていることに注意されたい；このことは必須ではなく要件ではない。
これ以外にも、Ｄ_E＝｜Ｅ_S−Ｅ_CS｜のような別のエネルギーマッチング基準も考
えられる。

【０００８】上記の基準は残余に関して以下のように表現することもできる：

【数３】ここで、Ｅrは、合成フィルタの逆（Ｈ^-1）によってフィルタ処理Ｓして得られ
る残余信号ｒのエネルギーであり、Ｅxは、ｘ＝ｇａ・ｃａ＋ｇｆ・ｃｆで表さ
れる励起信号のエネルギーである。

【０００９】上記の異なる基準は、音声のないスピーチと背景ノイズとに異なる符号化モー
ド（例えばエネルギーマッチング）を使用する従来のマルチモード符号化で使用
されている。これらのモードでは、式２と３に示したエネルギーマッチング基準
を使用している。この方法の欠点は、例えば、音声のあるスピーチには波形マッ
チングモード（式１）を選択し、音声のないスピーチと背景ノイズのようなノイ
ズ状信号に対してはエネルギーマッチングモード（式２と３）を選択するように
モードを決定しなければならないことである。モードの決定はデリケートであり
、間違えると耳障りなアーチファクトが発生する。また、モード間の符号化手法
の激しい変化によって望ましくない音が発生する。

【００１０】従って、低いビットレートにおいて、上述のようなマルチモード符号化の欠点
を解決することができる、ノイズ状信号の改善された符号化手法を提供すること
が望まれる。本発明は、波形マッチングとエネルギーマッチング基準を好ましい形で組み合
わせて、マルチモード符号化の欠点を排除して、低ビットレートのノイズ状信号
を符号化することができる。

【００１１】［発明の詳細な説明］本発明は波形マッチング基準とエネルギーマッチング基準を１つの基準Ｄ_WEに
統合したものである。波形マッチングとエネルギーマッチングのバランスは重み
付け係数を用いて穏やかかつ適用的に調整する：

【数４】ここで、ＫとＬは波形マッチング変形Ｄ_Wとエネルギーマッチング変形Ｄ_Eとの間
の相対的な重み付けを決定する重み付け係数である。重み付け係数ＫとＬは、以
下のように、それぞれ１−αとαで表現することができる：

【数５】ここで、αは０と１の間の値をとる、当該基準において波形マッチング部分Ｄ_W
とエネルギーマッチング部分Ｄ_Eとの間のバランス係数である。αの値は、好ま
しくは、その時点のスピーチセグメントα＝α（ν）、νは音声標識、における
音声レベルまたは周期性の関数である。α（ｖ）関数の例の基本的なスケッチを
図３に示す。低い音声レベルａではα＝ｄ、ｂより上の音声レベルではα＝ｃで
あり、αは音声レベルａとｂとの間では、αはｄからｃに漸減する。

【００１２】１つの特定の形式においては、式５の基準は以下のように表すことができる：

【数６】ここで、Ｅ_SWは信号Ｓ_Wのエネルギー、Ｅ_CSWは信号ＣＳ_Wのエネルギーである。

【００１３】上記の式６またはその変形がＣＥＬＰコーダの全符号化プロセスに好適に使用
可能であるが、上記の式をゲイン量子化の部分（上述のエンコードにおけるステ
ップ４）のみに使用したときに顕著な効果が見られる。ここでの記載は式６で表
される基準のゲイン量子化への適用について詳述するが、同様にｃａとｃｆコー
ドブックの検索にも使用することができる。

【００１４】式６のＥ_CSWは以下のように表すこともできることに留意すれば、

【数７】式６を以下のように表現することができる：

【数８】式１を用いて以下のように変形することができる。

【数９】

【００１５】例えば上述の式１とステップ１−３によって符号ベクトルｃａとｃｆを決定し
たら、次には対応する量子化ゲインの値を見つけなければならない。ベクトル量
子化のためには、これらの量子化ゲインの値は、ベクトル量子化装置のコードブ
ックの値によって与えられる。コードブックは複数のエントリーを含んでおり、
各エントリーは一組の量子化ゲインの値ｇａ_Qとｇｆ_Qを有する。

【００１６】ベクトル量子化コードブックからすべての量子化されたゲインの値ｇａ_Qとｇ
ｆ_Qを式９に代入して、結果として得られるＣＳ_Wの値を式８に代入し、式８にお
いてＤ_WEが取ることのできる値をすべて算出する。最も小さなＤ_WEの値を与える
ベクトル量子化器のコードブックのゲインの値の組を、量子化されたゲインの値
として選択する。

【００１７】新しい符号化器では、ゲインの値または少なくとも固定コードブックのゲイン
の値を得るために予測的量子化が行われる。検索の前に予測を行うので、この結
果は式９に直接組み込まれる。コードブックのゲインの値を式９に代入する代わ
りに、予測されたゲインの値を掛けたコードブックのゲイン値を式９に代入する
。こうして得られたそれぞれのＣＳ_Wを次に、上述の式８に代入する。

【００１８】ゲイン係数の量子化のためには、最適ゲインを直接量子化する単純な基準がし
ばしば使用される。当該基準とは：

【数１０】であり、ここでＤ_SGQはスカラーゲイン量子化基準、ｇ_OPTは従来はステップ２ま
たは３によって定める（ｇａ_OPTまたはｇｆ_OPT）最適ゲイン、ｇはｇａまたはｇ
ｆスカラー量子化器のコードブックから得られる量子化されたゲイン値である。
Ｄ_SGQの値を最小にする量子化ゲインの値を選択する。

【００１９】ゲイン係数を量子化する際には、ノイズ状のスピーチセグメントでは適用コー
ドブックは通常大きな役割を果たさないので、必要ならエネルギーマッチングの
項は固定コードブックゲインのためだけに使用するのが好ましい。従って、新し
い基準Ｄ_g/Qを固定コードブックゲインに使用するのに対して、式１０の基準を
適用コードブックゲインの量子化に使用することができる：

【数１１】ここで、ｇｆ_OPTは上述のステップ３によって定めた最適ｇｆの値、ｇａQは式１
０によって定めた量子化適用コードブックゲインの値である。ｇｆスカラー量子
化器のコードブックからのすべての量子化ゲイン値を式１１にｇｆとして代入し
、Ｄ_g/Qの値を最小にする量子化ゲイン値を選択する。

【００２０】新しい基準の下で良好な性能を得るためにはバランス係数αの使用が肝要であ
る。既に述べたように、αは好ましくは音声レベルの関数である。適用コードブ
ックの符号化ゲインは音声レベルの良い指標の例である。音声レベルを決定する
例には以下のものが含まれる：

【数１２】

【数１３】ここで、ｖ_vはベクトル量子化の音声レベル測定値、ｖ_sはスカラー量子化のため
の音声レベル測定値、ｒは上述のように規定された残余信号である。

【００２１】音声レベルは式１２と１３を使用して残余領域で決定されるので、音声レベル
は例えば式１２と１３のｒにＳ_Wを代入して式１２と１３のｇａ・ｃａにＷ・Ｈ
を掛けて、重み付けスピーチ領域で決定することができる。

【００２２】 νの値がローカルに変動することを避けるために、νの値にはα領域でマッピ
ングする前にフィルタ処理しても良い。例えば、その時点での値とその前のサブ
フレーム４つ分の値に対するメジアンフィルタは以下のようになる：

【数１４】ここで、ν_-1、ν_-2、ν_-3、ν_-4は直前の４つのフレームのνの値である。

【００２３】図４に示した関数は、音声インディケータｖ_mからバランス係数αのマッピン
グの例を示すものである。この関数は数学的には以下のように表すことができる
。

【数１５】 αの最大値は１よりも小さいことは、完全なエネルギーマッチングは決して発生
せず、基準には常に波形マッチングの部分がいくらか含まれることを意味するこ
とに留意する必要がある（式５参照）。

【００２４】スピーチの開始において、信号のエネルギーが急激に大きくなると、適用コー
ドブックは関連する信号を有していないことに起因して、適用コードブック符号
化のゲインが小さすぎることがしばしば起きる。しかし、開始時には波形マッチ
ングは重要であり、従ってオンセットが検出されたらαの値は強制的にゼロにさ
れる。最適固定コードブックゲインに基づく簡単な開始検出は以下のようなもの
である：

【数１６】ここで、ｇｆ_OPT-1は、直前のサブフレームに対して上記のステップ３によって
決定された最適固定コードブックのゲイン値である。

【００２５】直前のサブフレームにおいてαの値がゼロであった場合には、αの値の増加に
制限を加えることが望ましい場合がある。これは、前の値がゼロであればαの値
を適当な数、例えば２．０、で単に割ることによって実現できる。この手法によ
って、純粋な波形マッチングからよりエネルギーマッチングを取り込んだものへ
の移行に伴うアーチファクツを排除することができる。

【００２６】同様に、式１５と１６を使用してバランス係数αを決定したら、例えば、前の
サブフレームのαの値と平均することによって、フィルタ処理することが望まし
い。

【００２７】上述のように、式６は（従って式８と９も）、適用及び固定コードブックベク
トルｃａとｃｆを選択するために使用することができる。適用コードブックベク
トルｃａはまだわかっていないので、式１２と１３の音声測定を行うことができ
ず、従って式１５のバランスファクタαを計算することもできない。従って、式
８と９を固定及び適用コードブック検索に使用するために、経験的手法またはく
り返し演算によってバランス係数αは所望のノイズ状信号が得られるような値に
決定するのが望ましい。バランス係数αを経験的手法によって決定したら、上述
のステップ１−４に従って、ただし、式８と９の基準を使用して、固定及び適用
コードブック検索を行うことができる。別な方法としては、経験的な手法で決定
したαの値を用いてステップ２でｃａとｇａの値を決定した後、ステップ３の固
定コードブック検索で使用すべき式８におけるαの値を決定するために適宜式１
２−１５を使用することができる。

【００２８】図５は、本発明に基づくＣＥＬＰスピーチエンコーダの一部を例示した模式図
である。図５に示したエンコーダ部分には、符号化されていないスピーチ信号を
受信するための、固定及び適用コードブック６１と６２と接続された入力部を有
する基準制御器５１と、ゲイン量子化コードブック５０，５４および６０が含ま
れる。基準制御器５１は、図２に示したＣＥＬＰエンコーダデザインに関連する
すべての従来の処理を行うことができ、これには上述の式１−３と１０で表され
る従来の基準を実施すること、および、上述のステップ１−４で表される従来の
処理を行うことが含まれる。

【００２９】上述のような従来の処理に加えて、基準制御器５１はさらに上述の式４−９と
１１−１６で表される処理を行うことが可能である。基準制御器５１は音声決定
装置５３に上述のステップ２で決定されたｃａの値とステップ１−４を実行して
得られたｇａ_OPTの値（またはスカラー量子化を行った場合にはｇａ_Q）を与える
。基準制御器はさらに符号化されていないスピーチ信号に対して逆合成フィルタ
Ｈ^-1を適用して残余信号ｒを決定し、これもまた音声決定装置５３に入力する。

【００３０】音声決定装置５３は上述の入力を受けて式１２（ベクトル量子化の場合）また
は式１３（スカラー量子化の場合）に従って音声レベルインディケータｖを決定
する。音声レベルインディケータｖをフィルタ５５の入力部に与えられ、そこで
音声レベルインディケータｖに対して（たとえば前述のメジアンフィルタ処理の
ような）フィルタ処理を行い、フィルタ処理された音声レベルインディケータｖ _f を出力する。メジアンフィルタの場合には、フィルタ５５は、図示したように
、直前のサブフレームの音声レベルインディケータを記憶するための記憶部５６
を有する。

【００３１】フィルタ５５からのフィルタ処理された音声レベルインディケータｖ_fは、バ
ランス係数決定装置５７に入力される。バランス係数決定装置５７は、バランス
ファクタαを決定するために、例えば上述の式１５（ｖ_mは図５に示したｖ_fの具
体的な例である）と図４に示したような方法でフィルタ処理された音声レベルイ
ンディケータｖ_fを使用する。基準制御器５１は、バランス係数決定装置５７に
その時点のサブフレームに関するｇｆ_OPTの値を入力して、この値は、式１６で
使用するためにバランス係数決定装置５７の記憶手段５８に記憶される。バラン
ス係数決定装置はまた、サブフレームごと（あるいは少なくともαの値がゼロで
あるとき）のαの値を記憶する記憶手段５９を具備して、前のサブフレームでの
αの値がゼロであったら、バランス係数決定装置５７がαの値の増大を制限する
ことができるようにする。

【００３２】基準制御装置５１が合成フィルタ係数を求め、コードブックベクトルと関連す
る量子化ゲイン値を決定するために所望の基準を適用すると、これらのパラメー
タを表す情報が基準制御装置の５２の位置から出力されて通信チャネルを介して
送信される。

【００３３】図５はまた、適用コードブックゲイン値ｇａと固定コードブックゲイン値ｇｆ
のためのベクトル量子化器のコードブック５０と対応するスカラー量子化器のコ
ードブック５４と６０を示す。上述のように、ベクトルコードブック５０は複数
のエントリーを有しており、各エントリーは一組の量子化ゲイン値ｇａ_Qとｇｆ_Q を含む。スカラー量子化コードブック５４と６０はそれぞれ１つのエントリーご
とに１つの量子化ゲイン値を有する。

【００３４】図６は、図５に示したエンコーダ部分の例の（上で詳細に述べた）処理をフロ
ー図で示すものである。６３で符号化されていないスピーチの新しいサブフレー
ムを受信すると、６４で所望の基準の下で上記のステップ１−４を実施して、ｃ
ａ、ｇａとｇｆを決定する。次に６５で、音声測定値ｖが決定され、６６でバラ
ンス係数αが決定される。次に、６７で、波形マッチングとエネルギーマッチン
グに基づいてゲイン係数量子化Ｄ_WEを定義するためにバランス係数が使用される
。６８でベクトル量子化を行う場合には、波形マッチング／エネルギーマッチン
グ組み合わせ基準Ｄ_WEを使用して６９で両方のゲイン係数を量子化するために使
用される。スカラー量子化を使用する場合には、７０で式１０のＤ_SGQを使用し
て適用コードブックゲインｇａを量子化し、７１で式１１の波形マッチング／エ
ネルギーマッチング基準Ｄ_g/Qを使って固定コードブックゲインｇｆを量子化す
る。ゲイン係数を量子化した後、次のサブフレームが６３で待機している。

【００３５】図７は、本発明に基づくスピーチエンコーダを具備する通信システムの例を示
すブロック図である。図７では、本発明に基づくエンコーダ７２が、通信チャネ
ル７５を介して無線装置７４と通信する無線装置７３に設けられている。エンコ
ーダ７２は符号化されていないスピーチ信号を受信し、チャネル７５に、無線装
置７４に具備された従来型のデコーダ７６（例えば、図１において示したもの）
が元のスピーチ信号を再生することができる情報を送信する。一例として、図７
に示した無線装置７３と７４は、セルラー電話機であり、チャネル７５はセルラ
ー電話ネットワークの通信チャネルで有っても良い。本発明に係るスピーチエン
コーダ７２の他の適用例は非常に多く、明らかなものである。

【００３６】当業者には、本発明に基づくスピーチエンコーダが、例えば、適切にプログラ
ムされたデジタル信号処理装置（ＤＳＰ）やその他の処理装置に単独であるいは
外部のサポートロジックと組み合わせて取り入れることができることは明らかで
ある。

【００３７】本発明に係る新しいスピーチコーディング基準は波形マッチングとエネルギー
マッチングを柔軟に組み合わせる。従って、一つ以上のものを使用する必要はな
く、適切に組み合わせられた基準を適用することができる。基準となるモードの
選択を誤る問題は回避される。基準の適用的な性質によって波形マッチングとエ
ネルギーマッチングのバランスを円滑に調整することが可能になる。従って、基
準を急激に変更することによるアーチファクツが抑制される。

【００３８】新しい基準においてもある種の波形マッチングは常に維持することができる。
ノイズバーストのような音圧レベルの大きな完全に不適当な信号が発生する問題
は従って回避される。

【００３９】本発明の実施例について詳細に述べたが、これらは発明の範囲を制限するもの
ではなく、本発明は多くの実施形態で実現することができる。

【図面の簡単な説明】

【図１】従来のＣＥＬＰデコーダを示す概念図である。

【図２】従来のＣＥＬＰエンコーダを示す概念図である。

【図３】本発明に基づくバランス係数を示すグラフである。

【図４】図３に示したバランス係数の特定の例を示したグラフである。

【図５】本発明に基づくＣＥＬＰエンコーダの一例の関連部分を示す概念
図である。

【図６】図５に示したＣＥＬＰエンコーダの作動の一例を示す流れ図であ
る。

【図７】本発明に基づく通信システムを示す概念図である。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＬ，ＳＺ，ＵＧ，ＺＷ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＵＡ，ＵＧ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷＦターム(参考） 5D045 CA01 5J064 AA01 BA13 BB01 BB03 BC01 BC08 BC12 BC16 BC25 BD00

Claims

【特許請求の範囲】

【請求項１】元のスピーチ信号から、元のスピーチ信号を再構成すること
ができる複数のパラメータを作成する方法であって、元のスピーチ信号に応じて元のスピーチ信号を表すことを意図した別の信号を
作成し、元のスピーチ信号に関連した波形と前記別の信号に関連した波形との第１の相
違を決定し、元のスピーチ信号から得られたエネルギーパラメータと前記別の信号から得ら
れたエネルギーパラメータとの第２の相違を決定し、前記第１と第２の相違を使用して、元のスピーチ信号の近似値を再構成するこ
とができるパラメータを少なくとも１つ決定することを含む方法。
【請求項２】前記使用するステップは第１と第２の相違に対して少なくと
も１つのパラメータの決定に関する相対的な重要性を対応付ける請求項１に記載
の方法。
【請求項３】前記対応付けるステップは第１と第２の相違の相対的な重要
度を示すバランス係数を算出することを含む請求項２に記載の方法。
【請求項４】第１と第２の相違にそれぞれ対応する第１と第２の重み付け
係数を決定するためにバランス係数を使用し、前記第１と第２の相違を使用する
ステップは第１と第２の相違に第１と第２の重み付け係数をそれぞれ掛けること
を含む請求項３に記載の方法。
【請求項５】前記バランス係数を使用して第１と第２の重み付け係数を決
定するステップが、重み付け係数の一方を選択的にゼロにすることを含む請求項
４に記載された方法。
【請求項６】前記重み付け係数の一方を選択的にゼロにするステップは、
元のスピーチ信号におけるスピーチの開始を検出し、スピーチの開始に対応して
第２の重み付け係数をゼロにすることを含む請求項５に記載の方法。
【請求項７】前記バランス係数を算出するステップは、既に算出されたバ
ランス係数を少なくとも１つ使用してバランス係数を算出する請求項３に記載の
方法。
【請求項８】前記予め算出されたバランス係数に基づいてバランス係数を
算出するステップは、所定の大きさの既に算出されたバランス係数に応じてバラ
ンス係数の大きさを制限することを含む請求項７に記載の方法。
【請求項９】前記バランス係数を算出するステップは、元のスピーチ信号
に対応する音声レベルを決定し、当該音声レベルの関数としてバランス係数を算
出する請求項３に記載の方法。
【請求項１０】前記音声レベルを決定するステップは、音声レベルにフィ
ルタ処理を行ってフィルタ処理された音声レベルを求め、前記算出するステップ
はフィルタ処理された音声レベルの関数としてバランス係数を算出する請求項９
に記載の方法。
【請求項１１】前記フィルタ処理を行うステップは、メジアンフィルタ処
理を行うことを含み、フィルタ処理を行った音声レベルと元のスピーチ信号に関
連する既に決定済みの音声レベルとを含む音声レベルのグループからメジアンフ
ィルタ処理を行うことを含む請求項１０に記載の方法。
【請求項１２】前記対応付けるステップは、それぞれ第１及び第２の相違
に対応する第１と第２の重み付け係数を決定し、元のスピーチに対応する音声レ
ベルを決定し、音声レベルの関数として重み付け係数を決定することを含む請求
項２に記載の方法。
【請求項１３】音声レベルの関数として第１と第２の重み付け係数を決定
する前記ステップは、第１の音声レベルに対応して第１の重み付け係数を第２の
重み付け係数よりも大きくし、第１の音声レベルよりも低い第２音声レベルに対
応して第２の重み付け係数を第１の重み付け係数よりも大きくする請求項１２に
記載の方法。
【請求項１４】前記使用するステップは符号励起線形予測スピーチ符号化
方法に基づいて元のスピーチ信号を再構成する量子化されたゲイン値を決定する
ために第１と第２の相違を使用する請求項１に記載の方法。
【請求項１５】元のスピーチ信号を受信するための入力部と、元のスピーチ信号の近似値を再構成することができるパラメータをあらわす情
報を提供するための出力部と、前記入力部と出力部の間に設けられて、元のスピーチ信号に応じて元のスピー
チ信号を表現することを意図した別のスピーチ信号を作成する制御装置であって
、前記制御装置はさらに元のスピーチ信号と別の信号との間の第１と第２の相違
に基づいて少なくとも１つのパラメータを決定し、前記第１の相違は元のスピー
チ信号に対応する波形と別の信号に対応する波形との相違であり、第２の相違は
元のスピーチ信号と別の信号のエネルギーパラメータの相違であるスピーチエン
コード装置。
【請求項１６】前記少なくとも１つのパラメータの決定における第１と第
２の相違の相対的な重要性を示すバランス係数を算出するバランス係数決定装置
を具備し、当該バランス係数決定装置は、前記制御装置に接続された出力部を有
して、当該制御装置が前記少なくとも１つのパラメータを決定するために使用す
るように制御装置にバランス係数を供給する請求項１５に記載の装置。
【請求項１７】元のスピーチ信号の音声レベルを決定するために前記入力
部に接続された音声レベル決定装置を具備し、当該音声レベル決定装置は前記バ
ランス係数決定装置の入力部に接続された出力部を有してバランス係数決定装置
に対して音声レベルを供給し、前記バランス係数決定装置は当該音声レベル情報
に基づいてバランス係数を決定することができる請求項１６に記載の装置。
【請求項１８】前記音声レベル決定装置の出力部と前記バランス係数決定
装置の入力部に接続されたフィルタを具備して、前記音声レベル決定装置から音
声レベルを受信して当該バランス係数決定装置にフィルタ処理された音声レベル
を提供する請求項１７に記載の装置。
【請求項１９】前記フィルタはメジアンフィルタである請求項１８に記載
の装置。
【請求項２０】前記制御装置は前記バランス係数に対応して第１と第２の
相違に関する第１と第２の重み付け係数を決定する請求項１６に記載の装置。
【請求項２１】前記制御装置は、前記少なくとも１つのパラメータを決定
するに際して、第１と第２の相違にそれぞれ第１と第２の重み付け係数を掛ける
請求項２０に記載の装置。
【請求項２２】前記制御装置は元のスピーチ信号でスピーチが開始された
ときは第２の相違をゼロとする請求項２１に記載の方法。
【請求項２３】前記バランス係数決定装置がすでに算出されたバランス係
数を少なくとも１つ使用してバランス係数を算出するものである請求項１６に記
載の装置。
【請求項２４】前記バランス係数決定装置が既に計算したバランス係数が
所定の値であったときはバランス係数の値を制限する請求項２３に記載の装置。
【請求項２５】前記スピーチエンコード装置が符号励起線形予測スピーチ
エンコーダを有し、前記少なくとも１つのパラメータが量子化されたゲイン値で
ある請求項１５に記載の装置。
【請求項２６】使用者の入力刺激を受ける入力部と、通信チャネルに出力信号を送出して、通信チャネルを介して受信機に送信させ
る出力部と、入力部が前記無線装置の入力と接続され出力部が前記無線装置の出力と接続さ
れ、スピーチエンコード装置の入力部は該無線装置の入力部から元のスピーチ信
号を受け、該スピーチエンコード装置の出力部は前記無線装置の出力部に受信機
において元のスピーチ信号の近似値を再構成することができるパラメータを示す
情報を供給し、該スピーチエンコード装置はその入力部と出力部とに接続されて
元のスピーチ信号に対応して元のスピーチ信号を表すことを意図した別の信号を
与える制御装置を具備し、該制御装置はさらにパラメータのうちの少なくとも１
つを元のスピーチ信号と別の信号との差に基づいて第１と第２の相違を決定し、
前記第１の相違は元のスピーチ信号波形と別の信号波形との相違であり、第２の
相違は元のスピーチ信号から得られたエネルギーパラメータと別の信号から得ら
れたエネルギーパラメータの相違である通信システムで使用する無線装置。
【請求項２７】前記無線装置はセルラー電話の一部を構成する請求項２６
に記載の装置。