JP3378238B2

JP3378238B2 - ソフト適応性特性を含む音声コーディング

Info

Publication number: JP3378238B2
Application number: JP2000534999A
Authority: JP
Inventors: エクデン、エリク; ハーゲン、ロアル
Original assignee: テレフオンアクチーボラゲツトエルエムエリクソン（パブル）
Priority date: 1998-03-04
Filing date: 1999-03-02
Publication date: 2003-02-17
Anticipated expiration: 2019-03-02
Also published as: EP1058927B1; EP1058927A1; EP1267329B1; US6564183B1; DE69925515D1; CN1262992C; CN1555047A; EP1267329A1; WO1999045532A1; CN1183513C; RU2239239C2; DE69925515T2; CN1292913A; DE69902233D1; AU2756299A; US6058359A; JP2002506242A; DE69902233T2

Description

【発明の詳細な説明】

【０００１】（技術分野）本発明は、広く、音声（スピーチ）コーディングに関
し、特に、音声信号コーディングを音声信号の局所的特
性に適応させることに関する。

【０００２】（背景技術）殆どの従来の音声コーダは、エンコードされるべき音声
文節の局所的特性とは無関係に同じコーディング方法を
適用する。しかしながら、音声の局所的特性に従ってコ
ーディング方法を変更あるいは適用すれば、品質向上を
得ることができる。そのような適応方法は、一般に、所
与の音声文節の何らかの形式の分類に基づき、その分類
を使用して、いくつかのコーディングモード（マルチモ
ードコーディング）の中から１つを選択する。そのよう
な技術が特に役立つのは、背景ノイズがある場合で、そ
の自然な音再生を得るためには、音声信号に一般に適用
されるコーディングとは違ったコーディングアプローチ
が要求される。

【０００３】前記分類を利用した方法の１つの欠点は、
それが柔軟でないことである。所与の音声文節の分類が
間違って、その結果として、その文節に不適切なコーデ
ィングモードを選択する危険がある。不適切なコーディ
ングモードは、典型的には、コード化して得られた音声
信号が非常に劣化される。このような分類を行うアプロ
ーチは、音声コーダの性能を制限するという不利があ
る。

【０００４】マルチモードコーディングにおけるよく知
られた技術は、閉ループモード判定を行う方法で、コー
ダはすべてのモードを試みて、何らかの基準によって、
その中から最適なものを判定する。これは、分類間違え
の問題をある程度軽減するが、そのようなやり方に対し
て、適切な基準を見つけるのが問題である。前記分類を
伴う方法においてもそうであるが、どのモードが選択さ
れたかを示す情報を送信することが必要になる（即ち、
送信側エンコーダから通信チャンネルを介して受信側デ
コーダへオーバヘッドビットを送る必要がある）。これ
は、実際には、コーディングモードの数を制限する。

【０００５】従って、音声コーディング（エンコーディ
ング又はデコーディング）を音声の局所的特性によって
変更又は適応化することができることが必要であり、そ
の際、前記従来の分類による劣化を伴ってはならず、ま
た選択された適用を記述するオーバヘッドビットの送信
を必要としてはならない。

【０００６】本発明によれば、音声コーディング（エン
コーディング又はデコーディング）は、柔軟性のない分
類やコード化された音声信号のひどい劣化なしに、ま
た、選択された適応化を記載するオーバヘッドビットの
送信を必要とせずに適応化が可能である。適応化（適
応）は、コーダ（エンコーダ又はデコーダ）にすでに存
在しているパラメータに基づくものであるので、適応を
記載する余分な情報を送信する必要がない。これによ
り、コーディング（エンコーディング又はデコーディン
グ）方法の無限の変更が可能となる完全にソフト的な適
応方式が可能となる。更に、適応は、信号のコーダ特性
に基づき、適応は、ある音声文節によってどれくらいう
まく基本コーディングアプローチが働くかによって行わ
れる。

【０００７】（詳細な説明）図１の例は、本発明の音声エンコーディングへの適用を
示す。図１の装置は、例えば、セルラー電話のような無
線音声通信デバイスにおいて利用することができる。音
声エンコーディンング部１１はその入力において非コー
ド化信号を受信し、その出力においてコード化された信
号を提供する。非コード化信号は、元の音声信号であ
る。音声エンコーディング部１１は、ソフト的適応コン
トローラ１９からの制御信号を受信する制御入力１７を
備える。コントローラ１９からの制御信号は、エンコー
ディング装置１１によって行われたエンコーディング動
作がどの程度適応されるべきかを示す。コントローラ１
９は、非コード化信号の局所的音声特性の示す情報をエ
ンコーダ１１から受け取るための入力１８を備える。コ
ントローラ１９は、１８において受信された情報に応答
して、１７において制御信号を提供する。

【０００８】図１Ａは、図１に示された一般的タイプの
音声エンコーディング装置の例を示し、本発明によるエ
ンコーダとソフト的適応コントロールを備える。図１Ａ
は、固定ゲイン形成部１２と、適応ゲイン形成部１４と
を備える符号励起線形予測符号化方式（Code Excited L
inear Prediction (CELP)）音声エンコーダの該当部分
を示す。ソフト的な適応コントロールが、固定ゲイン形
成部１２に備えられ、形成部１２によって実現される固
定ゲイン形成コーディングのソフト的適応を可能にす
る。

【０００９】図２は、図１ＡのＣＥＬＰエンコーディン
グ装置の例をより詳細に示す。図２に示されるように、
図１Ａの固定ゲイン形成コーディング部１２は、固定コ
ードブック（fixed codebook）２１と、ゲインマルチプ
ライア（gain multiplier）２５と、コードモディファ
イア（code modifier）１６とを備える。図１Ａが示す
適応ゲイン形成コーディング部１４は、適応コードブッ
ク（adaptive codebook）２３とゲインマルチプライア
２９とを備える。固定コードブック２１に適用されるゲ
インＦＧと、適応コードブック２３に適用されるゲイン
ＡＧは、従来どおり、ＣＥＬＰエンコーダで生成され
る。特に、当業界で良く知られているように、従来のサ
ーチ方法は、合成フィルタ２８の非コード化信号入力及
び出力に応答して行われる。このサーチ方法は、ゲイン
ＡＧとＦＧ，及びコードブック２１と２３への入力を提
供する。

【００１０】適応コードブックゲインＡＧ及び固定コー
ドブックゲインＦＧは、コントローラ１９に入力され、
局所的音声特性を示す情報を提供する。特に、本発明
は、適応コードブックゲインＡＧが現在の音声文節の有
声レベル（即ち、ピッチ周期の強さ）を示すのにも使用
することができるということ、及び固定コードブックゲ
インＦＧが現在の音声文節の信号エネルギーを示すのに
も使用することができるということを認識している。従
来の８ｋＨｚサンプリング率で、例えば、４０サンプル
から成る各ブロックが、従来の適応及び固定コードブッ
ク２１及び２３のそれぞれから５ミリ秒ごとにアクセス
される。固定コードブック２１と適応コードブック２３
とから現在アクセスされているサンプルの各ブロックに
よって表される音声文節に対し、ＡＧは、音声レベル情
報を提供し、ＦＧは信号エネルギー情報を提供する。

【００１１】コードモディファイア１６は、２５におけ
るゲインＦＧの適用の後、固定コードブック２１からの
コード化された信号評価を受信する。次に、モディファ
イア１６は、２６において、加算回路２７に対し、選択
的に修正されたコード化された信号評価を提供する。加
算回路２７の他の入力は、従来のように、２９における
適応コードブックゲインＡＧの適用の後で、適応コード
ブック２３からのコード化された信号評価を受信する。
加算回路２７の出力は、従来の合成フィルタ２８を駆動
し、また、適応コードブック２３にフィードバックされ
る。

【００１２】適応コードブックゲインＡＧがハイなら
ば、コーダは、適応コードブック成分を大々的に利用
し、音声文節は、音声音文節である確率が高く、それ
は、典型的には、コーディング処理の適応を殆どあるい
は全く伴わずにＣＥＬＰコーダによって受け入れられる
ように処理される。ＡＧがロウであれば、信号は無声音
音声又は背景ノイズであることが多い。このロウＡＧの
場合、モディファイア１６は、比較的高いレベルのコー
ディング修正を提供するのが有利である。高い適応コー
ドブックゲインと低い適応コードブックゲインとの間の
範囲において、必要とされる修正の量は、低い適応コー
ドブックゲインに関連した比較的高いレベルの修正と、
高い適応コードブックゲインに関連した比較的低い修正
あるいは修正なしとの間にあることが好ましい。

【００１３】図３は、図２のモードモディファイア１６
をより詳細に示す。図３の例に示されるように、コント
ローラ１９から１７で受信される制御信号はスイッチ３
１及び３３を動作させて、２４で受信されるコード化信
号評価の所望の修正レベルを選択する。図３に示される
ように、修飾レベル０は、コード化信号評価を修正なし
に渡す。１つの実施の形態において、修正レベル１は、
比較的低いレベルの修正を提供し、修正レベル２は、修
正レベル１によって提供されるものより比較的高い修正
レベルを提供し、修正レベル１も２も、例えば、修正レ
ベルＮによって提供されるより少ないコード修正を提供
する。このようにして、ソフト適応コントローラは、適
応コードブックゲイン（有声レベル情報）と固定コード
ブックゲイン（信号エネルギー情報）を使用して、どの
程度の（どのレベルの）修正をモディファイア１６がコ
ード化信号評価に適用するかを選択する。このゲイン情
報は、コーダによってそのコーディング処理においてす
でに生成されているので、所望の有声レベルと信号エネ
ルギー情報を生成するのにオーバヘッドは必要ない。

【００１４】適応コードブックゲイン及び固定コードブ
ックゲインは、それぞれ、有声レベルと信号エネルギー
とに関する情報を提供するのに使用されるが、本発明の
ソフト適応制御技術がＣＥＬＰコーダ以外の音声コーダ
に組み込まれる場合、その他の適当なパラメータが所望
の有声レベルと信号エネルギー情報（あるいは他の所望
の情報）を提供してもよい。

【００１５】図４の例は、ソフト的適応コントローラ１
９の図２の実施の形態をより詳細に示すブロック図であ
る。各音声文節に対する適応コードブックゲインＡＧ及
び固定コードブックゲインＦＧは、それぞれバッファ４
１及び４２で受信され記憶される。バッファ４１及び４
２を使用して、現在の音声文節のゲイン値のほかに所定
数の先行する音声文節のゲイン値も記憶する。バッファ
４１及び４２は、（音質）改良のためのロジック４３に
接続される。改良用ロジック４３の出力４５は、コード
修正レベルマップ４４に接続される。コード修正レベル
マップ４４（例えば、一覧表）は、その出力４９におい
て、コードモディファイア１６によって実現されるべ
き、提案される新規レベルの修正を提供する。新規レベ
ルの修飾は新規レベルレジスタ４６に記憶される。新規
レベルレジスタ４６は、現在レベルレジスタ４８に接続
され、ヒステリシスロジック４７がレジスタ４７及び４
８に接続される。現在レベルレジスタ４８は、コードモ
ディファイア１６の入力１７へ所望の修正レベル情報を
提供する。次に、コードモディファイア１６は、スイッ
チ３１及び３３を動作させて、現在レベルレジスタ４８
によって示される修正レベルを提供する。

【００１６】図４のソフト的に適応されるコントローラ
の構成及び動作について、図５のフローチャートを参照
しながら説明する。

【００１７】図５は、図２及び図４に示されるソフト的
適応コントローラの実施の形態によって行われるレベル
制御動作の例を示す。図５の５０において、ソフト的適
応コントローラは、適応コードブックから取得されるサ
ンプルの最も新しいブロックに関連した適応コードブッ
クゲインＡＧの受信のために待機する。ＡＧが受信され
た後、図４の改良用ロジック４３は、５１において、こ
の新規適応コードブックゲイン値がしきい値ＴＨ_AGより
大きいかどうかを決定する。もしそうでなければ、適応
コードブックゲイン値ＡＧが５６で使用されて、図５の
マップ４４から新規レベル値が取得される。このよう
に、適応コードブックゲイン値がしきい値ＴＨ_AGを超え
なければ、図４の改良用ロジック４３は適応コードブッ
クゲイン値を図４のコード修正レベルマップ４４に渡
し、そのコード修正レベルマップ４４において適応コー
ドブックゲイン値が使用されて、新規レベル値が取得さ
れる。

【００１８】本発明の１実施の形態において、第１範囲
内の適応コードブックゲイン値が０という新規レベル値
にマップされ（従って図３のコードモディファイアにお
いてレベル０を選択し）、第２範囲内のゲイン値が１と
いう新規レベルにマップされ（従って図３のコーディン
グモディファイアにおいてレベル１を選択し）、第３範
囲内のゲイン値が２という新規レベル値にマップされ
（コードモディファイア１６におけるレベル２修正の選
択に対応）、というように続く。各ゲイン値は、モディ
ファイア１１が充分な修正レベルを有すれば、一義的新
規レベル値にマップすることができる。ＡＧ値に対する
修正レベルの割合が増大するにつれて、修正レベルの変
化がより微細になり（無限小に近づき）、このようし
て、ＡＧ変化に対する「ソフト的」適応を提供する。

【００１９】５１において、適応コードブックゲイン値
がしきい値を超えると、図４の改良用ロジック４３が固
定コードブックゲインバッファ４２を調べ、しきい値を
超えるＡＧ値がＦＧ値の大きな増加に対応するかどうか
を決める。このＦＧの増加は、音声開始（speech onse
t）が生じていることを示す。５２において開始（onse
t）が検出されると、５６において、適応コードブック
ゲイン値がマップに適用される（図４の４４を参照）。

【００２０】５２において開始が示されると、改良用ロ
ジック（図４の４３を参照）は、第４図のバッファ４１
に記憶された適応コードブックゲインの以前の値を考慮
する。ステップ５１から、現在のＡＧ値はしきい値を超
える値であるが、それにもかかわらず、５４において、
しきい値を超える値がスプリアス値であるかどうかを決
めるため、５３において先行するＡＧ値が考慮される。
５３において実行することのできる処理のタイプの例
は、平滑化動作、平均化動作、その他の形式のフィルタ
リング動作、あるいは単にしきい値ＴＨ_AGを超えなかっ
た先行するＡＧ値の数を数える動作である。例えば、バ
ッファ４１内のＡＧ値のうち半分以上が値ＴＨ_AGを超え
なければ、ブロック５４から「Ｙ」の路線（スプリアス
ＡＧ値）が取り込まれ、改良用ロジック（図４の４３）
が５５において、ＡＧ値を下げる。前述のように、低い
ＡＧ値は、低いレベルの有声を示すので、低いＡＧ値
は、結果的に比較的大きなコード化音声評価の修正とな
る、より高い新規レベル値にマッピングするのが好まし
い。尚、しきい値を超えるＡＧ値は、５２において開始
が検出されれば、先行するＡＧ値を考慮することなし
に、受け入れられる。５３及び５４においてスプリアス
ＡＧ値が検出されなければ、しきい値を超えるＡＧ値は
受け入れられ、５６において、４４をマッピングするの
に適用される。

【００２１】例えば図５の５３乃至５５におけるＡＧ値
のように、コーダにより使用される先行情報が使用でき
それを考慮することによって、高解像度の「ソフト的」
適応制御が可能となり、その適応制御においては、コー
ディング方法の無限の変更あるいは適応が可能となる。

【００２２】図５の５７において、ヒステリシスロジッ
ク（図４の４７を参照）は新規レベル値（ＮＬ）を現在
レベル値（ＣＬ）と比較して、それらの値の差を得る。
５８において、差ＤＩＦＦがヒステリシスしきい値ＴＨ
_Hを超えると、５９において、ヒステリシスロジックは
新規レベル値を必要に応じてインクリメント又はデクリ
メントして、それを現在レベル値に近づける。その後、
新規レベル及び現在レベル値は、再度、５７において比
較され、それらの間の差ＤＩＦＦが求められる。その
後、５８において、ＤＩＦＦがヒステリシスしきい値を
超えるかどうか決められ、もしそうであれば、新規レベ
ル値は、再度、５９において、現在レベル値に近づけら
れ、差ＤＩＦＦが再度、５７において、求められる。差
ＤＩＦＦが５８においてヒステリシスしきい値を超えな
いとわかると、６０において、ヒステリシスロジック
（図４の４７）は、新規レベル値が現在レベルレジスタ
４８に書き込まれることを許容する。レジスタ４８から
の現在レベル値は、図３のコードモディファイアの制御
入力１７を切り替えるように接続され、それにより、所
望のレベルの修正が選択される。

【００２３】尚、前述からわかるように、ヒステリシス
ロジック４７は、１つの音声文節から次の音声文節に修
正が変化することのできるレベルの数を制限する。しか
しながら、５７乃至５９のヒステリシス動作は、改良用
ロジックが音声開始が生じていると固定コードブックゲ
インバッファから判定すれば、判定ブロック６１からバ
イパスされる。この場合、改良用ロジック４３は、ヒス
テリシスロジック４７（図４の制御ライン４０を参照）
のヒステリシス動作を不能にする。これにより、新規レ
ベル値が直接的に現在レベルレジスタ４８にロードされ
る。従って、音声開始がある場合、ヒステリシスは適用
されない。

【００２４】前述のＡＧ及びＦＧを使用した適応判定制
御は、ビット送信オーバヘッドを必要としないので有利
である。なぜなら、ＡＧ及びＦＧは、非コード化信号の
特性に基づいてコーダ自身によって生成されるからであ
る。

【００２５】図２０の例は、本発明を音声デコーディン
グ処理に適用した例である。図２０の構成は、例えば、
セルラー電話のような無線音声通信装置に利用すること
ができる。２００の音声デコーディング装置は、その入
力において、コード化情報を受け取り、その出力におい
てデコードされた信号を提供する。デコーダ２００の入
力において受信されたコード化情報は、例えば、図１の
コーダ１１によって出力されたコード化信号の受信版
で、通信チャンネルを介してデコーダ２００に送信され
たものである。本発明のソフト的適応コントロール１９
は、前述の図１のエンコーダと同様に、デコーダ２００
に適用される。

【００２６】図２０Ａは、図２０に示されたタイプの音
声デコーディング構成の例を示し、デコーダと本発明に
基づくソフト的適応コントロールとを備える。図２０Ａ
は、ＣＥＬＰ音声デコーダの該当部分を示す。図２０Ａ
のＣＥＬＰデコーディング装置は、図１Ａに示されたＣ
ＥＬＰコーディング装置と同様であるが、固定及び適応
ゲイン形成コーディング部１２及び１４は、デコーダ入
力で受信されるコード化情報をデマルチプレクスするこ
とによって得られる（従来のように）のに対して、図１
Ａエンコーダのそれらの部分への入力は、従来のサーチ
方法から得られることが異なる。これらのＣＥＬＰエン
コーダとＣＥＬＰデコーダとの間の関係は、当業者にと
っては明らかである。図２０Ａにおいて、図１Ａにおけ
ると同様に、本発明のソフト的適応コントロール１９
は、固定ゲイン形成コーディング部１２に、図１Ａにつ
いての説明と同様に適用される。

【００２７】図２０Ａの装置を詳細に示す図２１の例に
おいてより明確に見られるように、図２１のデコーダ装
置における本発明のソフト的適応コントロール１９の適
用は、図２のエンコーダ装置に実現された場合と同様で
ある。前述のように、固定及び適応コードブック２１及
び２３への入力は、受信されたコード化情報からデマル
チプレクスされる。ゲインデコーダ２２は、また、従来
と同様に、デコーダで受信されたコード化情報からデマ
ルチプレクスされた入力信号を受信する。図２と図２１
を比較すると明らかなように、本発明のソフト的適応コ
ントロールは、図２のエンコーダについて説明された方
法と同様に、図２１のデコーダにおいて動作する。従っ
て、図２のエンコーダについての本発明のソフト的適応
コントロールの前述の説明（図３乃至５、及び対応の説
明を含む）は、同様に、図２１のデコーダに適用するこ
とができることが分る。

【００２８】図６は、図３のコードモディファイア（co
de modifier）の修正レベルの１つを実現した例を示
す。図６の装置は、図２又は図２１の固定コードブック
から受信されたコード化音声評価における希薄分散(spa
rseness)を減少させるために設計された反希薄分散フィ
ルタ（anti-sparseness filter）として特徴付けられ
る。希薄分散（sparseness）とは、例えば代数コードブ
ックのような固定コードブック２１内の所与のコードブ
ックエントリのサンプルのうち少数のサンプルだけが非
ゼロサンプル値を持っているような状態を指す。この希
薄分散状態は、特に、音声圧縮をするために代数コード
ブックのビットレートが減少させられた場合に、よくお
きる。コードブックエントリにおいて非ゼロサンプルが
非常に少ない場合、その結果生じる希薄分散は、従来の
音声コーダのコード化音声信号において容易に実感され
る劣化となる。

【００２９】図６に示された反希薄分散フィルタは、希
薄分散問題を軽減するために設計されている。図６の反
希薄分散フィルタは、オールパスフィルタ（all-pass f
ilter）と関連するインパルスレスポンス（６５）を有
する固定（例えば、代数）コードブック２１から受信さ
れたコード化音声評価の巡回たたみ込み（circular con
volution）を行うコンボルバ(convolver)６３を備え
る。図６の反希薄分散フィルタの動作例は図７乃至１１
に示される。

【００３０】図１０は、４０個のサンプルのうち非ゼロ
サンプルがたった２個である図２（又は図２１）のコー
ドブック２１からのエントリの例を示す。この希薄分散
特性は、非ゼロサンプルの数を増加させることができれ
ば、減らすことができる。非ゼロサンプルの数を増加さ
せる方法の１つは、４０個のサンプルのブロック全体に
エネルギーを分散させるのに適した特性を持つフィルタ
に、図１０のコードブックエントリを適用することであ
る。図７及び図８は、それぞれ、図１０のコードブック
エントリの４０個のサンプル全体にエネルギーを適切に
分散させることのできるオールパスフィルタの強度と位
相（ラジアン）を示す。図７及び図８のフィルタは、高
周波数範囲の位相スペクトルを２と４ｋＨｚの間で変化
させ、一方、低周波数範囲を２ｋＨｚ未満でわずかに変
化させる。

【００３１】図９の例は、図７及び図８で定義されたオ
ールパスフィルタのインパルスレスポンスを示すグラフ
である。図６の反希薄分散フィルタは、図１０のサンプ
ルブロック上に図９のインパルスの巡回たたみ込みを行
う。コードブックエントリは４０個のサンプルのブロッ
クとしてコードブックから提供されるので、たたみ込み
動作はブロック単位で行われる。図１０の各サンプル
は、たたみ込み動作において４０個の中間乗算結果を生
成する。例えば、図１０における位置７におけるサンプ
ルに注目すると、最初の３４個の乗算結果は図１１の結
果ブロックの位置７乃至４０に割り当てられ、残りの６
個の乗算結果は、結果ブロックの位置１乃至６に割り当
てられるように、巡回たたみ込み動作によって「ラッピ
ング(wrapped arcund)」される。残りの図１０のサンプ
ルのそれぞれによって生成された４０個の中間乗算結果
は、同様に、図１１の結果ブロック内の位置に割り当て
られた、サンプル１は、もちろん、ラッピングを必要と
しない。図１１の結果ブロック内各位置について、そこ
に割り当てられた４０個の中間乗算結果（図１０のサン
プルごとに１つの乗算結果）が合計され、その合計は、
その位置のたたみ込み結果を示す。

【００３２】図１０及び図１１を調べるとわかるよう
に、巡回たたみ込みは、エネルギーがブロック全体に分
散されることによって、非ゼロサンプルの数を格段に増
加させ、それに応じて、希薄分散の量を減らすよう図１
０のブロックのフーリエスペクトルを変化させる。ブロ
ック単位の巡回たたみ込みを行うことによる効果は、図
２（又は図２１）の合成フィルタ２８によって平滑化す
ることができる。

【００３３】図１２乃至図１６は、図６に示されたタイ
プの反希薄分散フィルタの動作の別の例を示す。図１２
及び図１３のオールパスフィルタは、３ｋＨｚ未満の位
相スペクトルを実質的に変化させることなく、３乃至４
ｋＨｚの位相スペクトルを変化させる。フィルタのイン
パルスレスポンスは図１４に示されている。図１６を参
照し、また図１５が図１０と同じサンプルブロックを示
していることを考慮すると、図１２乃至図１６に示され
た反希薄分散動作は、図１１に示されたほどのエネルギ
ー分散を行わない。従って、図１２乃至図１６が定義す
る反希薄分散フィルタは、図７乃至図１１に定義される
フィルタほどはコードブックエントリを修正しない。従
って、図７乃至図１１のフィルタ及び図１２乃至図１６
のフィルタは、それぞれ、コード化音声評価の異なった
レベルの修正を定義する。再度、図２及び図３を参照す
ると、低いＡＧ値は、適応コードブック成分が比較的小
さく、固定（例えば、代数）コードブック２１から比較
的大きな貢献が得られることを示す。固定コードブック
エントリの前記希薄分散により、コントローラ１９は、
図１２乃至図１６の反希薄分散フィルタよりも、図７乃
至図１１の反希薄分散フィルタを選択する。なぜなら、
図７乃至図１１のフィルタは、図１２乃至図１６のフィ
ルタより大きなサンプルブロックの修正を提供するから
である。適応コードブックゲインＡＧの値がより大きい
場合には、固定コードブックの貢献は比較的少なく、コ
ントローラ１９は、例えば、より少ない反希薄分散の修
正を提供する図１２乃至図１６のフィルタを選択する。

【００３４】このように、本発明は、所与の音声文節の
局所的特性を利用して、その文節のコード化音声評価を
修正すべきか否か、また修正するとしたらどの程度修正
するかを決めることができるようにする。様々なレベル
の修正の例としては、修正がないこと、比較的高いエネ
ルギー分散特性をもった反希薄分散フィルタ、比較的低
いエネルギー分散特性をもった反希薄分散フィルタがあ
る。一般にＣＥＬＰコーダにおいては、適応コードブッ
クゲインが高い場合、それは、比較的高い有声レベルを
示し、典型的には、殆ど、あるいは全く、修正が必要な
い。反対に、適応コードブックゲインが低い場合、典型
的には、実質的修正が有利であることを示す。反希薄分
散フィルタの特定の例において、高い適応コードブック
ゲイン値が低い固定コードブックゲイン値と結合されて
いる場合、固定コードブックの貢献（希薄分散の貢献）
は比較的小さく、従って反希薄分散フィルタからの修正
はあまり必要としない（例えば、図１２乃至１６）こと
を示す。反対に、より高い固定コードブックゲイン値が
より低い適応コードブックゲイン値と結合されている場
合、固定コードブックの貢献は比較的大きく、従って大
きい反希薄分散の修正を使用することを示す。（例え
ば、図７乃至図１１の反希薄フィルタ）。前述のよう
に、本発明に基づくマルチーレベルコードモディファイ
アは、選択可能な修正のレベルを必要な数だけ使用する
ことができる。

【００３５】図１７は、図２のＣＥＬＰエンコーディン
グ装置及び図２１のＣＥＬＰデコーディング装置に代わ
る例を示し、特にソフト的適応コントロールを用いたマ
ルチレベル修正を適応コードブック出力に適用する例で
ある。

【００３６】図１８は、図２のＣＥＬＰエンコーディン
グ装置及び図２１のＣＥＬＰデコーディング装置に代わ
る例を示し、加算ゲートの出力で適用されるマルチレベ
ルコードモディファイアとソフト的適応コントローラと
を備える。

【００３７】図１９の例は、図２、図１７、及び図２１
のＣＥＬＰコーディング装置が、どのようにして、モデ
ィファイア１６の上流に入力のある加算回路１０から適
応コードブック２３へフィードバックを提供するように
変更できるかを示す。

【００３８】当業者には明らかなように、図１乃至図２
１を参照した上記実施の形態は、適当にプログラムされ
たデジタル信号プロセッサその他のデータプロセッサを
使用することによって簡単に実現することができ、ある
いは、そのような適当にプログラムされたデジタル信号
プロセッサその他のデータプロセッサを、それに結合さ
れた付加的外部回路と組み合わせて使用することによっ
ても実現することができる。

【００３９】以上、本発明の実施の形態を例として説明
してきたが、これは、本発明の範囲を限定するものでは
なく、本発明は、様々な実施の形態で実現することがで
きる。［図面の簡単な説明］

【図１】本発明によるソフト的適応音声エンコーディン
グ方式を示すブロック図である。

【図１Ａ】図１の構成を詳細に示す。

【図２】図１Ａの構成の詳細を示す。

【図３】図２及び図２１のマルチレベルコードモディフ
ァイアの詳細を示す。

【図４】図２及び図２１のソフト的適応コントローラの
例を示す。

【図５】図４のソフト的適応コントローラの動作を示す
フローチャートである。

【図６】図３のマルチレベルコードモディファイアにお
けるモディファイアレベルの１つとして提供されること
のできる本発明に基づく反希薄分散フィルタを示す。

【図７】図６に示された形式の反希薄分散フィルタの動
作を示す。

【図８】図６に示された形式の反希薄分散フィルタの動
作を示す。

【図９】図６に示された形式の反希薄分散フィルタの動
作を示す。

【図１０】図６に示された形式の反希薄分散フィルタの
動作を示す。

【図１１】図６に示された形式の反希薄分散フィルタの
動作を示す。

【図１２】図６に示されたタイプの反希薄分散フィルタ
の動作であって、図７乃至１１の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。

【図１３】図６に示されたタイプの反希薄分散フィルタ
の動作であって、図７乃至１１の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。

【図１４】図６に示されたタイプの反希薄分散フィルタ
の動作であって、図７乃至１１の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。

【図１５】図６に示されたタイプの反希薄分散フィルタ
の動作であって、図７乃至１１の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。

【図１６】図６に示されたタイプの反希薄分散フィルタ
の動作であって、図７乃至１１の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。

【図１７】本発明に基づく他の音声コーディング装置の
該当部分を示す。

【図１８】本発明に基づく更に他の音声コーディング装
置の該当部分を示す。

【図１９】図２、図１７、及び図２１の音声コーディン
グ装置に適用可能な変更を示す。

【図２０】本発明に基づくソフト的適応音声コーディン
グ装置を示すブロック図である。

【図２０Ａ】図２０の装置の詳細を示す。

【図２１】図２０Ａの装置の更なる詳細を示す。

フロントページの続き (56)参考文献特開平１−237699（ＪＰ，Ａ) 特開平７−287600（ＪＰ，Ａ) 片岡章俊，守谷健弘，ＣＥＬＰ方式に基づく８ｋｂｉｔ／低遅延音声符号化, 電子情報通信学会技術研究報告［音声］，1992年２月19日，ＳＰ91−119, ｐ．９−16 ＲｏａｒＨａｇｅｎｅｔａｌ, ＲｅｍｏｖａｌｏｆＳｐａｒｓｅ− ＥｘｃｉｔａｔｉｏｎＡｒｔｉｆａｃｔｓＩｎＣＥＬＰ，Ｐｒｏｃ．ＩＣＡＳＳＰ98，1998年５月，ｐ．145− 148 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/00 - 19/14 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】所定のコードブックを用いて、音声信号
のコード化表現を生成するための音声エンコーディング
装置であって、前記音声信号を受信するための入力と、前記音声信号の前記コード化表現を提供するための出力
と、前記入力と前記出力との間に接続され、前記音声信号
に、前記コードブックを用いたコーディング動作を行う
と共に、制御信号に応じて前記コードブックからの出力
に希薄分散（sparseness）を減少させるようなコード修
正を適応的に行って、前記コード化表現を生成するため
のコーダと、前記コーダに接続されたコントローラであって、前記コ
ーディング動作において現在及び過去に使用された情報
を記憶するメモリを有し、当該メモリに記憶された前記
現在及び過去に使用された情報に基づいて、前記コード
修正のための前記制御信号を生成して前記コーダに出力
する前記コントローラとを備えることを特徴とする音声エンコーディング装置。
【請求項２】前記コーダは、コード修正なしを含む異
なるレベルのコード修正を行うことができ、前記制御信号は、前記コード修正の修正レベルを示すことを特徴とする請求項１に記載の音声エンコーディン
グ装置。
【請求項３】前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の有声レベルを示す有声情報を含むことを特徴とする請求項１に記載の音声エンコーディン
グ装置。
【請求項４】前記コーディング動作は、適応ゲイン形
成コーディングを含み、前記有声情報は、前記適応ゲイン形成コーディングと関
連するゲイン信号を含むことを特徴とする請求項３に記載の音声エンコーディン
グ装置。
【請求項５】前記コントローラは、さらに改良用ロジ
ックを有し、当該改良用ロジックは、前記コントローラが前記メモリ
に記憶された現在の有声レベルを示す前記有声情報を使
用すべきかどうか判定するため、前記現在の有声レベル
が所定のしきい値を超えていれば当該現在の有声レベル
を過去の有声レベルに対して評価することを特徴とする請求項３に記載の音声エンコーディン
グ装置。
【請求項６】前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の信号エネルギーを示す信号エネルギー情報を含むことを特徴とする請求項１に記載の音声エンコーディン
グ装置。
【請求項７】前記コーディング動作は、固定ゲイン形
成コーディングを含み、前記信号エネルギー情報は、前記固定ゲイン形成コーデ
ィングに関連するゲイン信号を含むことを特徴とする請求項６に記載の音声エンコーディン
グ装置。
【請求項８】前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の有声レベルを示す有声情報も含むことを特徴とする請求項６に記載の音声エンコーディン
グ装置。
【請求項９】前記コントローラは、さらに改良用ロジ
ックを有し、当該改良用ロジックは、前記コントローラが前記メモリ
に記憶された現在の有声レベルを示す前記有声情報を使
用すべきかどうかを判定するため、前記現在の有声レベ
ルが所定のしきい値を超えていれば現在の信号エネルギ
ーを過去の信号エネルギーに対して評価することを特徴とする請求項８に記載の音声エンコーディン
グ装置。
【請求項１０】前記コーディング動作は、線形予測コ
ーディングを行うことを特徴とする請求項１に記載の音声エンコーディン
グ装置。
【請求項１１】前記コントローラは、さらに、前記コ
ーディング動作において現在使用されている前記情報に
基づいて、前記修正レベルを示すレベル情報を出力する
マップロジックを備えることを特徴とする請求項２に記載の音声エンコーディン
グ装置。
【請求項１２】前記コントローラは、さらに、前記マ
ップロジックから出力された前記レベル情報が示す修正
レベルが前記コーディング動作において現在行われてい
るコード修正の修正レベルに対して所定値以上異なるか
判定するロジックを備えることを特徴とする請求項１１に記載の音声エンコーディ
ング装置。
【請求項１３】前記コーダは、前記コードブックとし
て代数コードブックを備え、前記コード修正として、前
記代数コードブックからの出力に対してインパルスレス
ポンスとの畳み込み処理を行う反希薄分散フィルタを備
えることを特徴とする請求項１に記載の音声エンコーディン
グ装置。
【請求項１４】所定のコードブックを用いて、音声信
号のコード化表現を生成するための音声エンコーディン
グ方法であって、前記音声信号を受信するステップと、前記音声信号に、前記コードブックを用いたコーディン
グ動作を行うと共に、制御信号に応じて前記コードブッ
クからの出力に希薄分散（sparseness）を減少させるよ
うなコード修正を適応的に行って、前記コード化表現を
生成するコーディングステップと、前記コーディング動作において現在及び過去に使用され
た情報をメモリに記憶し、前記現在及び過去に使用され
た前記情報に基づいて、前記コード修正のための前記制
御信号を生成するコントロールステップとを備えることを特徴とする音声エンコーディング方法。
【請求項１５】前記コーディングステップは、コード
修正なしを含む異なるレベルのコード修正を行うことが
でき、前記制御信号は、前記コード修正の修正レベルを示すことを特徴とする請求項１４に記載の音声エンコーディ
ング方法。
【請求項１６】前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の有声レベルを示す有声情報を含むことを特徴とする請求項１４に記載の音声エンコーディ
ング方法。
【請求項１７】前記コーディングステップは、適応ゲ
イン形成コーディングを含み、前記有声情報は、前記適応ゲイン形成コーディングと関
連するゲイン信号を含むことを特徴とする請求項１６に記載の音声エンコーディ
ング方法。
【請求項１８】前記コントロールステップは、前記有
声情報によって示される現在の有声レベルが所定のしき
い値を超えていれば、当該現在の有声レベルを過去の有
声レベルに対して評価するステップを含むことを特徴とする請求項１６に記載の音声エンコーディ
ング方法。
【請求項１９】前記コントロールステップは、さら
に、前記評価によって前記現在の有声レベルがスプリア
スであることが判明した場合、異なる有声レベルを示す
ように前記現在の有声レベルを示す前記有声情報を変更
するステップを含むことを特徴とする請求項１８に記載の音声エンコーディ
ング方法。
【請求項２０】前記異なる有声レベルは低い方の有声
レベルであることを特徴とする請求項１９に記載の音声エンコーディ
ング方法。
【請求項２１】前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
における信号エネルギーを示す信号エネルギー情報を含
むことを特徴とする請求項１４に記載の音声エンコーディ
ング方法。
【請求項２２】前記コーディングステップは、固定ゲ
イン形成コーディングを含み、前記信号エネルギー情報は前記固定ゲイン形成コーディ
ングに関連するゲイン信号を含むことを特徴とする請求項２１に記載の音声エンコーディ
ング方法。
【請求項２３】前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の有声レベルを示す有声情報を含むことを特徴とする請求項２１に記載の音声エンコーディ
ング方法。
【請求項２４】前記コントロールステップは、現在の
有声レベルを示す前記有声情報を使用すべきかどうか判
定するため、前記現在の有声レベルが所定のしきい値を
超えていれば現在の信号エネルギーを過去の信号エネル
ギーに対して評価するステップを含むことを特徴とする請求項２３に記載の音声エンコーディ
ング方法。
【請求項２５】前記コーディングステップは線形予測
コーディングを行うことを特徴とする請求項１４に記載の音声エンコーディ
ング方法。
【請求項２６】前記コントロールステップは、前記コ
ーディング動作において現在使用されている前記情報に
基づいて、前記修正レベルを示すレベル情報を生成する
と共に、前記レベル情報によって示される前記修正レベ
ルと前記コーディング動作において現在行われているコ
ード修正の修正レベルとの差を判定するステップを含むことを特徴とする請求項１５に記載の音声エンコーディ
ング方法。
【請求項２７】前記コントロールステップは、前記差
が所定のしきい値以上あれば、前記現在の修正レベルと
の差がより小さい別の修正レベルに変更するステップを
含むことを特徴とする請求項２６に記載の音声エンコーディ
ング方法。
【請求項２８】前記コーディングステップは、前記コ
ードブックとして代数コードブックを使用し、前記コー
ド修正として、前記代数コードブックからの出力に対し
てインパルスレスポンスとの畳み込み処理を行う反希薄
分散フィルタリングのステップを含むことを特徴とする請求項１４に記載の音声エンコーディ
ング方法。
【請求項２９】所定のコードブックを用いて、音声信
号のコード化表現からデコードされた音声信号を生成す
るするための音声デコーディング装置であって、前記音声信号の前記コード化表現を受信するための入力
と、前記デコードされた音声信号を提供するための出力と、前記入力と前記出力との間に接続され、前記コード化表
現に、前記コードブックを用いたデコーディング動作を
行うと共に、制御信号に応じて前記コードブックからの
出力に希薄分散（sparseness）を減少させるようなコー
ド修正を適応的に行って、前記デコードされた音声信号
を生成するためのデコーダと、前記デコーダに接続されたコントローラであって、前記
デコーディング動作において現在及び過去に使用された
情報を記憶するメモリを有し、当該メモリに記憶された
前記現在及び過去に使用された前記情報に基づいて、前
記コード修正のための前記制御信号を生成して前記デコ
ーダに出力する前記コントローラとを備えることを特徴とする音声デコーディング装置。
【請求項３０】前記デコーダは、コード修正なしを含
む異なるレベルのコード修正を行うことができ、前記制御信号は、前記コード修正の修正レベルを示すことを特徴とする請求項２９に記載の音声デコーディン
グ装置。
【請求項３１】前記デコーディング動作に使用され、
前記メモリに記憶される前記情報は、前記音声信号の有
声レベルを示す有声情報を含むことを特徴とする請求項２９に記載の音声デコーディン
グ装置。
【請求項３２】前記デコーディング動作は、適応ゲイ
ン形成コーディングを含み、前記有声情報は、前記適応ゲイン形成コーディングと関
連するゲイン信号を含むことを特徴とする請求項３１に記載の音声デコーディン
グ装置。
【請求項３３】前記コントローラは、さらに改良用ロ
ジックを有し、当該改良用ロジックは、前記コントローラが前記メモリ
に記憶された現在の有声レベルを示す前記有声情報を使
用すべきかどうか判定するため、前記現在の有声レベル
が所定のしきい値を越えていれば当該現在の有声レベル
を過去の有声レベルに対して評価することを特徴とする請求項３１に記載の音声デコーディン
グ装置。
【請求項３４】前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号の信号エネルギーを示す信号エネルギー情報を含むことを特徴とする請求項２９に記載の音声デコーディン
グ装置。
【請求項３５】前記デコーディング動作は、固定ゲイ
ン形成コーディングを含み、前記信号エネルギー情報は、前記固定ゲイン形成コーデ
ィングに関連するゲイン信号を含むことを特徴とする請求項３４に記載の音声デコーディン
グ装置。
【請求項３６】前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号の有声レベルを示す有声情報を含むことを特徴とする請求項３４に記載の音声デコーディン
グ装置。
【請求項３７】前記コントローラは、さらに改良用ロ
ジックを有し、当該改良用ロジックは、前記コントローラが前記メモリ
に記憶された現在の有声レベルを示す前記有声情報を使
用すべきかどうか判定するため、前記現在の有声レベル
が所定のしきい値を越えていれば現在の信号エネルギー
を過去の信号エネルギーに対して評価することを特徴とする請求項３６に記載の音声デコーディン
グ装置。
【請求項３８】前記デコーディング動作は線形予測コ
ーディングを含むことを特徴とする請求項２９に記載の音声デコーディン
グ装置。
【請求項３９】前記コントローラは、さらに、前記デ
コーディング動作において現在使用されている前記情報
に基づいて、前記修正レベルを示すレベル情報を出力す
るマップロジックを備えることを特徴とする請求項３０に記載の音声デコーディン
グ装置。
【請求項４０】前記コントローラは、さらに、前記マ
ップロジックから出力された前記レベル情報が示す修正
レベルが前記デコーディング動作において現在行われて
いるコード修正の修正レベルに対して所定値以上異なる
か判定するロジックを備えることを特徴とする請求項３９に記載の音声デコーディン
グ装置。
【請求項４１】前記デコーダは、前記コードブックと
して代数コードブックを備え、前記コード修正として、
前記代数コードブックからの出力に対してインパルスレ
スポンスとの畳み込み処理を行う反希薄分散フィルタを
備えることを特徴とする請求項２９に記載の音声デコーディン
グ装置。
【請求項４２】所定のコードブックを用いて、音声信
号のコード化表現からデコードされた音声信号を生成す
るための音声デコーディング方法であって、前記音声信号の前記コード化表現を受信するためのステ
ップと、前記コード化表現に、前記コードブックを用いたデコー
ディング動作を行うと共に、制御信号に応じて前記コー
ドブックからの出力に希薄分散（sparseness）を減少さ
せるようなコード修正を適応的に行って、前記デコード
された音声信号を生成するためのデコーディングステッ
プと、前記デコーディング動作において現在及び過去に使用さ
れた情報をメモリに記憶し、前記現在及び過去に使用さ
れた前記情報に基づいて、前記コード修正のための前記
制御信号を生成するコントロールステップとを備えることを特徴とする音声デコーディング方法。
【請求項４３】前記デコーディングステップは、コー
ド修正なしを含む異なるレベルのコード修正を行うこと
ができ、前記制御信号は、前記コード修正の修正レベルを示すことを特徴とする請求項４２に記載の音声デコーディン
グ方法。
【請求項４４】前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号の有声レベルを示す有声情報を含むことを特徴とする請求項４２に記載の音声デコーディン
グ方法。
【請求項４５】前記デコーディングステップは、適応
ゲイン形成コーディングを含み、前記有声情報は、前記適応ゲイン形成コーディングと関
連するゲイン信号を含むことを特徴とする請求項４４に記載の音声デコーディン
グ方法。
【請求項４６】前記コントロールステップは、前記有
声情報によって示される現在の有声レベルが所定のしき
い値を超えていれば、当該現在の有声レベルを過去の有
声レベルに対して評価するステップを含むことを特徴とする請求項４４に記載の音声デコーディン
グ方法。
【請求項４７】前記コントロールステップは、さら
に、前記評価によって前記現在の有声レベルがスプリア
スであることが判明した場合、異なる有声レベルを示す
ように前記現在の有声レベルを示す前記有声情報を変更
するステップを含むことを特徴とする請求項４６に記載の音声デコーディン
グ方法。
【請求項４８】前記異なる有声レベルは低い方の有声
レベルであることを特徴とする請求項４７に記載の音声デコーディン
グ方法。
【請求項４９】前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号における信号エネルギーを示す信号エネルギー情報を
含むことを特徴とする請求項４２に記載の音声デコーディン
グ方法。
【請求項５０】前記デコーディングステップは、固定
ゲイン形成コーディングを含み、前記信号エネルギー情報は前記固定ゲイン形成コーディ
ングに関連するゲイン信号を含むことを特徴とする請求項４９に記載の音声デコーディン
グ方法。
【請求項５１】前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号の有声レベルを示す有声情報を含むことを特徴とする請求項４９に記載の音声デコーディン
グ方法。
【請求項５２】前記コントロールステップは、現在の
有声レベルを示す前記有声情報を使用すべきかどうか判
定するため、前記現在の有声レベルが所定のしきい値を
超えていれば現在の信号エネルギーを過去の信号エネル
ギーに対して評価するステップを含むことを特徴とする請求項５１に記載の音声デコーディン
グ方法。
【請求項５３】前記デコーディングステップは線形予
測コーディングを行うことを特徴とする請求項４２に記載の音声デコーディン
グ方法。
【請求項５４】前記コントロールステップは、前記デ
コーディング動作において現在使用されている前記情報
に基づいて、前記修正レベルを示すレベル情報を生成す
ると共に、前記レベル情報によって示される前記修正レ
ベルと前記デコーディング動作において現在行われてい
るコード修正の修正レベルとの差を判定するステップを
含むことを特徴とする請求項４３に記載の音声デコーディン
グ方法。
【請求項５５】前記コントロールステップは、前記差
が所定のしきい値以上あれば、前記現在の修正レベルと
の差がより小さい別の修正レベルに変更するステップを
含むことを特徴とする請求項５４に記載の音声デコーディン
グ方法。
【請求項５６】前記デコーディングステップは、前記
コードブックとして代数コードブックを使用し、前記コ
ード修正として、前記代数コードブックからの出力に対
してインパルスレスポンスとの畳み込み処理を行う反希
薄分散フィルタリングのステップを含むことを特徴とする請求項４２に記載の音声デコーディン
グ方法。