JP2012509515A

JP2012509515A - スケーラブルエンコーダでのノイズ変換を伴う音声デジタル信号の符号化

Info

Publication number: JP2012509515A
Application number: JP2011543801A
Authority: JP
Inventors: バラーツ・コヴシー; ステファン・ラゴ; アラン・ル・ギヤデール
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2008-11-18
Filing date: 2009-11-17
Publication date: 2012-04-19
Anticipated expiration: 2029-11-17
Also published as: EP2366177A1; US20110224995A1; KR101339857B1; KR20110095387A; EP2366177B1; FR2938688A1; CN102282611B; WO2010058117A1; JP5474088B2; US8965773B2; CN102282611A

Abstract

本発明は、音声デジタル信号のスケーラブル符号化のための方法であって、入力信号の共通のセクションに対して、共通のセクションの各サンプルnに対するスカラ数量化のインデックス(I^B(n))を生成するコア符号化ステップと、エンハンスメント信号の各符号化サンプルに対するスカラ数量化(Q^k _enh)のインデックス(J_k(n))を生成する、少なくとも1つのエンハンスメント符号化ステップとを含む方法に関する。この方法は、エンハンスメント符号化ステップは、目標信号を決定するために使用される符号化ノイズを変換するためのフィルタ(W(z))を得るステップを含み、前記エンハンスメント信号のスカラ数量化(Q^k _enh(n))に対するインデックス(J_k(n))は、可能なスカラ数量化値の組と、前記目標信号との間の誤差を最小化することにより決定されるというものである。本発明による符号化方法は、さらに、コアフローを符号化するための符号化ノイズの変換を含むことができる。

Description

本発明は、デジタル信号の符号化の分野に関する。

本発明による符号化は、特に、可聴周波数信号(音声、音楽など)のようなデジタル信号の送信および/または格納に適している。

本発明は、より詳細には、ADPCM(「適応差分パルス符号変調」を表す)符号化タイプの波形符号化、および、特に、スケーラブルなバイナリ列(binary train)で量子化インデックスを送出することを可能にする、埋め込み符号(embedded code)を用いるADPCMタイプの符号化に関する。

ITU-T G.722またはITU-T G.727の勧告により具体的に明記される、埋め込み符号ADPCM符号化/復号化の一般的な原理は、図1および図2を参照して説明されるようなものである。

すなわち、図1は、ADPCMタイプの埋め込み符号のコーダを示す。

それは、
− 信号

の予測を、量子化誤差信号(quantized error signal)の前のサンプル

(ただし、ν(n’)はスケールファクタである)に基づいて、および、再構成信号(reconstructed signal)の前のサンプルr^B(n’)(n’=n-1〜n-N_P、ただし、nは現在の時点である)に基づいて与えることを可能にする予測モジュール110、
− e(n)で示される予測誤差信号を得るために、入力信号x(n)から、その予測

を差し引く減算モジュール120、
− B+Kビットからなる量子化インデックスI^B+K(n)を与えるために、入力として誤差信号e(n)を受信する、誤差信号に対する量子化モジュール130Q^B+Kを備える。量子化モジュールQ^B+Kは、埋め込み符号タイプの量子化モジュールであり、すなわち、それは、Bビットを用いるコア量子化器(core quantizer)、および、コア量子化器に埋め込まれる、B+k(k=1〜K)ビットを用いる量子化器を備える。

ITU-T G.722標準の場合には、B=4に対する量子化器Q^B、Q^B+1、Q^B+2の判定レベルおよび再構成レベルが、“X. Maitre、「7 kHz audio coding within 64 kbit/s」、IEEE Journal on Selected Areas in Communication、第6-2巻、1988年2月”による、G.722標準を説明する概論の表IVおよびVIによって定義される。

量子化モジュールQ^B+Kの出力でのB+Kビットの量子化インデックスI^B+K(n)は、送信チャネル140を介して、図2を参照して説明されるようなデコーダに送信される。

コーダは、さらに、
− 低ビットレートインデックスI^B(n)を与えるために、インデックスI^B+K(n)のK個の低次ビットを削除するためのモジュール150、
− 出力として、Bビットの量子化誤差信号

を与えるための逆量子化モジュール120(Q^B)^-1、
− 量子化器および逆量子化器に対して、次の時点に対する、スケールファクタとも呼ばれるレベル制御パラメータν(n)を与えるための、適応化モジュール(adaptation module)170Q_Adapt、
− 低ビットレートの再構成信号r^B(n)を与えるために、量子化誤差信号に対して、予測

を加算するための加算モジュール180、
− 予測モジュールに対する、Bビットの量子化誤差信号

に基づく、および、1+P_z(z)によりフィルタリングされる信号

に基づく適応化モジュール190P_Adapt、
を備える。

図1では、155と符号が付けられたドット表示の部分が、予測器(predictor)165および175、ならびに逆量子化器120を含む、低ビットレートのローカルデコーダを示すことが確認され得る。したがって、このローカルデコーダは、逆量子化器120を、170で、低ビットレートインデックスI^B(n)に基づいて適応させること、ならびに、予測器165および175を、再構成低ビットレートデータに基づいて適応させることを可能にする。

この部分は、図2を参照して説明されるような埋め込み符号ADPCMデコーダにおいて、同じように見られる。

図2の埋め込み符号ADPCMデコーダは、入力として、送信チャネル140から発生するインデックスI’^B+K、バイナリエラーにより場合によっては乱される可能性があるI^B+Kの変形(version)を受信し、信号

を得るために、1サンプル当たりBビットのビットレートの逆量子化モジュール210(Q^B)^-1による逆量子化を実行する。記号「’」は、送信エラーのために、コーダにより送信されるものと、場合によっては異なる可能性がある、デコーダで受信される値を示す。

Bビットで表される出力信号r’^B(n)は、信号の予測と、Bビットを用いる逆量子化器の出力との和に等しいことになる。デコーダのこの部分255は、図1の低ビットレートのローカルデコーダ155と同一である。

ビットレートインジケータモードおよびセレクタ220を使用することにより、デコーダは、復元される信号の質をエンハンスする（enhance：高める）ことができる。

実際は、モードが、B+1ビットが送信されたことを示すならば、出力は、予測

と、B+1ビットを用いる逆量子化器230の出力

との和に等しいことになる。

モードが、B+2ビットが送信されたことを示すならば、出力は、予測

と、B+2ビットを用いる逆量子化器240の出力

との和に等しいことになる。

z変換の表記を使用することにより、この繰り返しの構造を表すために、以下のように記述され得る。
R^B+k(z)=X(Z)+Q^B+k(z)
ただし、B+kビットでの量子化ノイズQ^B+k(z)を次式により定義する。

ITU-T G.722標準(以下、G.722という)の埋め込み符号ADPCM符号化は、[50〜7000Hz]の最小の帯域幅で規定され、16kHzでサンプリングされる、広帯域での信号の符号化を実行する。G.722の符号化は、直交ミラーフィルタによる信号の分解によって得られる、信号の2つのサブバンド、[50〜4000Hz]および[4000〜7000Hz]のそれぞれのADPCM符号化である。低帯域は、1サンプル当たり6、5および4ビットの埋め込み符号ADPCM符号化により符号化され、一方で、高帯域は、1サンプル当たり2ビットのADPCMコーダにより符号化される。全体のビットレートは、低帯域を復号化するために使用されるビット数に応じて、64、56または48bit/sとなる。

この符号化は、最初にISDN(サービス総合ディジタル網)において、その後、IPネットワークでの音声符号化の応用例において使用された。

例として、G.722標準では、図3に示されるような以下の方式で、8ビットが割り当てられる。
高帯域に対しては、I_h1およびI_h2の2ビット。
低帯域に対しては、I_L1、I_L2、I_L3、I_L4、I_L5、I_L6の6ビット。

ビットI_L5およびI_L6は、データによって「盗まれる」か、またはデータによって置換される場合があり、低帯域エンハンスメントビットを構成する。ビットI_L1、I_L2、I_L3、I_L4は、低帯域コアビットを構成する。

したがって、G.722標準に従って量子化される信号のフレームは、8、7または6ビットで符号化される量子化インデックスからなる。インデックスの送信の周波数は8kHzであるので、ビットレートは、64、56または48kbit/sとなる。

多数のレベルを有する量子化器に関しては、量子化ノイズのスペクトルは、図4により示されるように、比較的平坦となる。信号のスペクトルもまた、図4に示される(ここでは、有声音信号ブロック)。このスペクトルは、大きなダイナミック振幅(約40dB)を有する。低エネルギー区域では、ノイズは、信号に非常に接近し、したがって、もはや必ずしもマスクされるわけではないことが理解され得る。その場合、それは、これらの領域、特に図4での周波数[2000〜2500Hz]の区域では、可聴となり得る。

したがって、符号化ノイズのシェーピングが必要である。埋め込み符号の符号化に適応する符号化ノイズシェーピングが、さらに望ましいことになる。

埋め込み符号を用いるPCM(「パルス符号変調」を表す)タイプの符号化に対するノイズシェーピング技術は、“ITU-T G.711.1勧告「Wideband embedded extension for G.711 pulse code modulation」または「G.711.1: A wideband extension to ITU-T G.711」、Y. Hiwasaki、S. Sasaki、H. Ohmuro、T. Mori、J. Seong、M. S. Lee、B. Kovesi、S. Ragot、J.-L. Garcia、C. Marro、L. M.、J. Xu、V. Malenovsky、J. Lapierre、R. Lefebvre、EUSIPCO、Lausanne、2008”で説明される。

このように、この勧告は、コアビットレート符号化に対する、符号化ノイズのシェーピングを伴う符号化を説明する。符号化ノイズをシェーピングするための知覚フィルタ(perceptual filter)が、逆コア量子化器から発生する過去の復号化信号(decoded signal)に基づいて計算される。したがって、コアビットレートのローカルデコーダは、ノイズシェーピングフィルタを計算することを可能にする。このように、デコーダでは、このノイズシェーピングフィルタを、コアビットレートの復号化信号に基づいて計算することが可能である。

エンハンスメントビットを送出する量子化器は、コーダで使用される。

コアのバイナリストリームおよびエンハンスメントビットを受信するデコーダは、コーダにおけるフィルタ計算と同じ方式で、コアビットレートの復号化信号に基づいて、符号化ノイズをシェーピングするためのフィルタを計算し、このフィルタを、エンハンスメントビットの逆量子化器からの出力信号に適用し、そしてシェーピングされた高ビットレート信号が、フィルタリングされた信号を復号化コア信号に加算することにより得られる。

このように、ノイズのシェーピングは、コアビットレート信号の知覚品質をエンハンスする。それは、エンハンスメントビットについて、品質の限定的なエンハンスメントを提供する。実際は、符号化ノイズのシェーピングは、エンハンスメントビットの符号化について実行されず、量子化器の入力は、コア量子化に対しては、エンハンスされる量子化に対してと同じである。

次いで、デコーダは、コアビットに加えて、エンハンスメントビットが復号化されるとき、適切に適応化されるフィルタリングを通じて、結果として得られる、誤った(spurious：不要の)構成要素を削除しなければならない。

デコーダでのフィルタの余分な計算は、デコーダの複雑さ(complexity)を増大させる。

この技術は、G.722またはG.727のデコーダタイプのすでに存在する標準のスケーラブルデコーダでは使用されない。したがって、既存の標準のスケーラブルデコーダとの互換性を維持しながら、どのようなビットレートでも信号の品質をエンハンスする要求が存在する。

仏国特許第２７４２５６８号（FR2742568）

X. Maitre、「7 kHz audio coding within 64 kbit/s」、IEEE Journal on Selected Areas in Communication、第6-2巻、1988年2月 ITU-T G.711.1勧告「Wideband embedded extension for G.711 pulse code modulation」「G.711.1: A wideband extension to ITU-T G.711」、Y. Hiwasaki、S. Sasaki、H. Ohmuro、T. Mori、J. Seong、M. S. Lee、B. Kovesi、S. Ragot、J.-L. Garcia、C. Marro、L. M.、J. Xu、V. Malenovsky、J. Lapierre、R. Lefebvre、EUSIPCO、Lausanne、2008 ITU-T勧告G.711、「Pulse Code Modulation (PCM) of voice frequencies」

本発明は、この状況を改善することを目的とする。

この目的のために、本発明は、デジタル音声信号の階層符号化(hierarchical coding)の方法であって、入力信号の現在のフレームに対して、
− 現在のフレームの各サンプルに対するスカラ量子化インデックスを送出するコア符号化と、
− エンハンスメント信号の各符号化サンプル(coded sample)に対するスカラ量子化のインデックスを送出する、少なくとも1つのエンハンスメント符号化とを含む方法を提案する。この方法は、エンハンスメント符号化が、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタを得るステップを含み、前記エンハンスメント信号のスカラ量子化のインデックスが、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより決定されるというものである。

したがって、より高いビットレートのエンハンスメント信号の符号化ノイズのシェーピングが実行される。本発明の要旨を構成する合成ベースの分析スキームは、従来技術の符号化ノイズシェーピングの解決法の場合にあり得るような、デコーダで何らかの相補信号処理を実行することを必要とはしない。

したがって、デコーダで受信される信号は、何らかのノイズシェーピングの計算、または何らかの補正項(corrective term)を必要としない、コアビットレートの信号、および埋め込みビットレートの信号を復号化することができる標準デコーダにより、復号化され得ることになる。

したがって、復号化信号の品質は、デコーダで使用可能なビットレートが何であっても、エンハンスされる。

以下で述べられる様々な特定の実施形態は、上記で定義された方法のステップに対して、独立に、または相互に組み合わせて加えられ得る。

したがって、目標信号の決定の実施のモードは、現在のエンハンスメント符号化段階に対して、この方法が、現在のサンプルに対して、以下のステップ、すなわち、
− 階層符号化の入力信号を、前の符号化段階の符号化に基づいて、および、現在のエンハンスメント符号化段階の再構成信号の過去のサンプルに基づいて部分的に再構成される信号と組み合わせることにより、エンハンスメント符号化誤差信号を得るステップと、
− 得られたノイズシェーピングフィルタによる、目標信号を得るための、エンハンスメント符号化誤差信号のフィルタリングステップと、
− 前の段階の符号化から発生する再構成信号と、量子化ステップから発生する信号との加算による、現在のサンプルに対する再構成信号の計算ステップと、
− 量子化ステップから発生する信号に基づく、ノイズシェーピングフィルタのメモリの適応化ステップと
を含むというものである。

本明細書で説明される演算の構成は、複雑さが非常に低減した演算による、符号化ノイズのシェーピングをもたらす。

特定の実施形態では、可能なスカラ量子化値の組、および現在のサンプルに対する誤差信号の量子化値は、コアビットレートの量子化インデックスに関して計算されるレベル制御パラメータによりスケーリングされる、量子化再構成レベルを示す値である。

したがって、これらの値は、コア符号化の出力レベルに適応化される。

特定の実施形態では、エンハンスメント段階kに対する量子化再構成レベルを示す値は、Bがコア符号化のビット数を示すB+kビットを用いる埋め込み量子化器の量子化の再構成レベルを示す値と、B+k-1ビットを用いる埋め込み量子化器の量子化再構成レベルを示す値との間の差分により定義され、B+kビットを用いる埋め込み量子化器の再構成レベルは、B+k-1ビットを用いる埋め込み量子化器の再構成レベルを2つに分けることにより定義される。

さらには、エンハンスメント段階kに対する量子化再構成レベルを示す値は、メモリ空間に格納され、コアビットレートの量子化およびエンハンスメントのインデックスの関数として、インデックスが付与される。

エンハンスメント量子化器の出力値は、直接ROMに格納されるが、B+kビットを用いる量子化器の出力値を、B+k-1ビットを用いる量子化器の出力値から減算することにより、各サンプリング時点に対して再計算される必要はない。さらには、それらは、例えば、前の段階のインデックスにより容易にインデックスの付与が可能であるテーブル内に、2つずつ配置される。

特定の実施形態では、スカラ量子化の可能な値の数は、各サンプルに対して変動する。

したがって、エンハンスメントビットの数を、符号化されるべきサンプルの関数として適応させることが可能である。

別の変形の実施形態では、スカラ量子化インデックスを与える、前記エンハンスメント信号の符号化サンプルの数は、入力信号のサンプルの数よりも小さい。

これは、例えば、あるサンプルに対して、エンハンスメントビットの割り当て数が0に設定されるときの場合であり得る。

コア符号化の実施の可能なモードは、例えば、スカラ量子化および予測フィルタを使用するADPCM符号化である。

コア符号化の実施の別の可能なモードは、例えば、PCM符号化である。

コア符号化は、さらに、例えば、現在のサンプルに対して、以下のステップ、すなわち、
− 符号化ノイズに対する予測信号を、過去の量子化ノイズサンプルに基づいて、および、所定のノイズシェーピングフィルタによりフィルタリングされる量子化ノイズの過去のサンプルに基づいて得るステップと、
− 量子化されるべき修正入力信号を得るために、コア符号化の入力信号と符号化ノイズ予測信号とを組み合わせるステップと
を用いる符号化ノイズのシェーピングを含むことができる。

このように、複雑さがより少ない符号化ノイズのシェーピングが、コア符号化に対して実行される。

特定の実施形態では、ノイズシェーピングフィルタは、1つのARMAフィルタ、またはARMAフィルタの連続体により規定される。

したがって、分子の値および分母の値から構成される、このタイプの加重関数には、分母の値により信号スパイクを考慮し、分子の値によりこれらのスパイクを減衰させ、したがって、量子化ノイズの最適なシェーピングを与えるという利点がある。ARMAフィルタの縦続接続された連続体(cascaded succession)は、信号のスペクトルの包絡線をモデリングするための構成要素、および、周期性もしくは準周期性の構成要素により、マスキングフィルタのより良好なモデリングを可能にする。

特定の実施形態では、ノイズシェーピングフィルタは、分離したスペクトル傾斜(spectral slope)およびフォルマント形状の2つの縦続状態のARMAフィルタリングセルに分解される。

このように、各フィルタは、入力信号のスペクトル特性の関数として適応化され、したがって、様々なタイプのスペクトル傾斜を表す信号に適している。

有利に、エンハンスメント符号化により使用されるノイズシェーピングフィルタ(W(z))は、さらに、コア符号化により使用され、したがって、実施の複雑さが低減する。

特定の実施形態では、ノイズシェーピングフィルタは、様々な入力信号に最良に適応するように、前記入力信号の関数として計算される。

変形の実施形態では、ノイズシェーピングフィルタは、コア符号化によりローカルに復号化される信号に基づいて計算される。

本発明は、さらに、デジタル音声信号の階層コーダであって、入力信号の現在のフレームに対して、
− 現在のフレームの各サンプルに対するスカラ量子化インデックスを送出するコア符号化段階と、
− エンハンスメント信号の各符号化サンプルに対するスカラ量子化のインデックスを送出する、少なくとも1つのエンハンスメント符号化段階と
を備える階層コーダに関する。

このコーダは、エンハンスメント符号化段階が、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタを得るためのモジュール、および、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより、前記エンハンスメント信号のスカラ量子化のインデックスを送出する量子化モジュールを備えるというものである。

それは、さらに、コード命令を含むコンピュータプログラムであって、これらの命令がプロセッサにより実行される場合に、本発明による符号化方法のステップを実施するコンピュータプログラムに関する。

最後に、本発明は、説明されたようなコンピュータプログラムを記憶する、プロセッサにより読み取り可能な記憶手段に関する。

本発明の他の特性および利点は、単に限定的でない例として与えられ、添付図面に基づく以下の説明を読むことにより、より明瞭に明らかとなる。

従来技術による、および先に説明されたような、埋め込み符号ADPCMタイプのコーダを示す図である。従来技術による、および先に説明されたような、埋め込み符号ADPCMタイプのデコーダを示す図である。従来技術による、および先に説明されたような、埋め込み符号ADPCMタイプのコーダの量子化インデックスの例示的なフレームを示す図である。本発明を実施しないコーダに存在する量子化ノイズのスペクトルに対する信号ブロックのスペクトルを示す図である。本発明の一般的な実施形態による埋め込み符号コーダの、および符号化方法のブロック図を示す図である。本発明によるエンハンスメント符号化段階の、およびエンハンスメント符号化方法のブロック図を示す図である。本発明によるエンハンスメント符号化段階の、およびエンハンスメント符号化方法のブロック図を示す図である。本発明による符号化から発生する信号の復号化に適応するデコーダの様々な構成を示す図である。本発明によるコーダの、および本発明による符号化方法の第1の詳細な実施形態のブロック図を示す図である。本発明によるコーダのコア符号化段階に対する符号化ノイズの例示的な計算を示す図である。図9の符号化ノイズを計算するための詳細な関数を示す図である。本発明の符号化方法による量子化再構成レベルの組の取得の例を示す図である。本発明の符号化方法によるエンハンスメント信号の表現を示す図である。本発明による符号化のためのマスキングフィルタの計算の第1の実施形態のステップを表すフローチャートを示す図である。本発明による符号化のためのマスキングフィルタの計算の第2の実施形態のステップを表すフローチャートを示す図である。本発明によるコーダの、および本発明による符号化方法の第2の詳細な実施形態のブロック図を示す図である。本発明によるコーダの、および本発明による符号化方法の第3の詳細な実施形態のブロック図を示す図である。本発明によるコーダの可能な実施形態を示す図である。

以下、この文書では、「予測」という用語は、過去のサンプルのみを使用する計算を説明するために、意図的に使用される。

次に、図5を参照して、本発明による埋め込み符号コーダが説明される。符号化が、1つの追加のサンプル当たり1ビットを与えるエンハンスメント段階で実行されることを留意することは重要である。この制約は、本明細書で、本発明の説明を簡素化するためにのみ有用である。しかしながら、以下で説明される本発明は、エンハンスメント段階が、1サンプル当たり1を超えるビットを与える場合に容易に一般化されることは明らかである。

このコーダは、例えば、標準化されたG.722もしくはG.727のコーダなどのADPCM符号化タイプ、または、G.711の標準化されたコーダなどのPCM(「パルス符号変調」)コーダの、Bビットの量子化を伴い、ブロック520の出力の関数として修正されるコアビットレート符号化段階500を備える。

510と符号が付けられたブロックは、符号化ノイズのシェーピング、すなわち、図8、15または16を参照して、後でより詳細に説明される、コア符号化のノイズのマスキングを伴う、このコア符号化段階を示す。

このように提示される本発明は、さらに、コア部分で符号化ノイズのマスキングが実行されない場合に関する。さらには、「コアコーダ」という用語が、本文書では広い意味で使用される。したがって、例えば、ITU-T G.722の56または64kbit/sのような既存のマルチビットレートのコーダは、「コアコーダ」であるとみなされ得る。極端には、0kbit/sのコアコーダを考えること、すなわち、まさしく、符号化の第1のステップから、本発明の要旨を構成するエンハンスメント符号化技術を適用することもまた可能である。後者の場合には、エンハンスメント符号化はコア符号化となる。

ここで図5を参照して説明される、ノイズのシェーピングを伴うコア符号化段階は、予測信号

を提供するために、量子化ノイズq^B(n)に基づいて、および、フィルタリングされる量子化ノイズ

に基づいて予測P_r(z)を実行するフィルタリングモジュール520を備える。このフィルタリングされる量子化ノイズ

は、例えば、フィルタリングされるノイズのK_Mの部分予測を、図9を参照して後で説明されるような量子化ノイズに加算することにより得られる。

コア符号化段階は、入力として信号x(n)を受信し、出力として、量子化インデックスI^B(n)、I^B(n)に基づいて再構成される信号r^B(n)、および、例えば図1を参照して説明されるようなADPCM符号化の場合には、量子化器のスケールファクタν(n)を提供する。

図5に示されるようなコーダは、さらに、複数のエンハンスメント符号化段階を備える。段階EA1(530)、段階EAk(540)および段階EAk2(550)が、ここに示される。

このように示されるエンハンスメント符号化段階は、図6aおよび6bを参照して、後で詳細に説明されることになる。

一般には、各エンハンスメント符号化段階kは、入力として信号x(n)、最適インデックスI^B+k-1(n)、コア符号化のインデックスI^B(n)と前のエンハンスメント段階のインデックスJ₁(n)〜J_k-1(n)との連結(concatenation)、または同じことであるが、これらのインデックスの組、前のステップで再構成される信号r^B+k-1(n)、マスキングフィルタのパラメータ、および適切ならば、適応符号化の場合にはスケールファクタν(n)を有する。

このエンハンスメント段階は、出力として、連結モジュール560でインデックスI^B+k-1(n)と連結されることになる、この符号化段階に関するエンハンスメントビットに対する量子化インデックスJ_k(n)を提供する。エンハンスメント段階kは、さらに、出力として、再構成信号r^B+k(n)を提供する。ここで、インデックスJ_k(n)は、インデックスnの各サンプルに対して1ビットを示すが、しかしながら、一般的な場合には、J_k(n)は、可能な量子化値の数が2より大きいならば、1サンプル当たり複数ビットを示すことができることに留意されたい。

一部の段階は、インデックスI^B(n)と連結されることになる、送信されるべきビットJ₁(n)〜J_k1(n)に対応し、それにより、結果として得られるインデックスが、後で図7において示され、かつ説明されるような標準デコーダにより復号化され得る。したがって、リモートデコーダを変更する必要はなく、さらには、リモートデコーダに、コーダで実行される処理を「通知する」ための追加の情報は、必要ではない。

他のビットJ_k1+1(n)〜J_k2(n)は、ビットレートを上昇させ、マスキングすることにより、エンハンスメントビットに対応し、図7を参照して説明される追加の復号化モジュールを必要とする。

図5のコーダは、さらに、入力信号に基づいて、または、図13および14を参照して後で説明されるようなコーダの合成フィルタの係数に基づいて、ノイズシェーピングフィルタまたはマスキングフィルタを計算するための、モジュール580を備える。モジュール580は、入力として、元の信号ではなく、ローカルに復号化された信号を有する場合があることに留意されたい。

ここで示されるようなエンハンスメント符号化段階は、復号化信号のビットレートが何であっても、デコーダを修正することなしに、したがって、デコーダでの何らかの余分な複雑さもなしに、デコーダで信号の向上された品質を提供するエンハンスメントビットを提供することを可能にする。

このように、本発明の一実施形態によるエンハンスメント符号化段階kを示す図5のモジュールEakが、次に、図6aを参照して説明される。

この符号化段階により実行されるエンハンスメント符号化は、出力として、可能な量子化値の組と、符号化ノイズシェーピングフィルタの使用により決定される目標信号との間の誤差を最小化する、インデックスおよび量子化値を送出する量子化ステップ

を含む。

埋め込み符号量子化器を備えるコーダが、ここでは考察される。

段階kは、エンハンスメントビットJ_k、またはビットJ_k(k=1〜G_K)のグループを得ることを可能にする。

それは、符号化誤差信号e^B+k(n)を与えるために、入力信号x(n)から、現在のフレームの、およびサンプルnに対する前の段階の信号r^B+k-1(n)の、各前のサンプルn’=n-1〜n-N_Dに対して、段階kで合成される信号r^B+k(n)を減算するためのモジュールEAk-1を備える。

図4を用いて示されるような平坦なスペクトルで量子化ノイズを引き起こすことになる、二次誤差基準(quadratic error criterion)を最小化することではなく、量子化ステップでは、加重二次誤差基準が最小化されることになり、その結果、スペクトルがシェーピングされたノイズは、より可聴でなくなる。

このように、段階kは、加重関数W(z)により誤差信号e^B+k(n)をフィルタリングするためのフィルタリングモジュールEAk-2を備える。この加重関数は、さらに、コア符号化段階で、ノイズのシェーピングのために使用され得る。

ノイズシェーピングフィルタは、ここでは、スペクトル加重の逆関数に等しく、すなわち、次式のように表される。

このシェーピングフィルタは、ARMAタイプ(「自己回帰移動平均(AutoRegressive Moving Average)」)である。その伝達関数は、次数N_Nの分子および次数N_Dの分母から構成される。このように、ブロックEAk-1は、本質的には、H^M(z)の分母に対応するフィルタW(z)の非再帰型(non-recursive)部分のメモリを定義する働きをする。W(z)の再帰型部分のメモリの定義は、簡潔化のために示されていないが、それは、

から、および、

から推定される。

このフィルタリングモジュールは、出力として、目標信号に対応する、フィルタリングされた信号

を与える。

スペクトル加重の役割は、符号化誤差のスペクトルをシェーピングすることであり、これは、加重誤差のエネルギーを最小化することにより実行される。

量子化モジュールEAk-3は、量子化出力の可能な値に基づいて、以下の式による加重誤差基準を最小化することに努める量子化ステップを実行する。

この式は、エンハンスメントビットが、各サンプルnに対して計算される場合を示す。
その場合に、量子化器の２つの出力値が考えられる（possible）。我々は、後で、量子化ステップの可能な出力値が如何にして定義されるかを理解することになる。

すなわち、このモジュールEAk-3は、第1の出力として、前の段階I^B+k-1のインデックスと連結されるべき最適ビットJ_kの値を有し、そして第2の出力

として、最適インデックスJ_kに対する量子化器の出力信号を有する、エンハンスメント量子化

を実行する。ただし、ν(n)は、量子化器の出力レベルを適応させるために、コア量子化により定義されるスケールファクタを示す。

最後に、エンハンスメント符号化段階は、段階kでの合成信号(synthesized signal)r^B+k(n)を与えるために、量子化誤差信号

を、前の段階で合成された信号r^B+k-1(n)に加算するためのモジュールEAk-4を備える。

同等の方式で、r^B+k(n)は、EAk-4の代わりに、インデックスI^B+k(n)を復号化することにより、すなわち、任意には有限の精度で、

を計算することにより、および、予測

を加算することにより得られ得る。この場合は、Bビット、B+1〜を用いる量子化器の量子化値

をメモリに格納し、エンハンスメント量子化器の値を

により計算することが適切である。

n’=nに対してx(n’)-r^B+k-1(n’)に等しい値を有していた信号e^B+k(n)は、次のサンプリング時点に対して、以下の式に従って補足される(supplemented)。

ただし、e^B+k(n)もまた、フィルタのメモリMA(「移動平均」を表す)である。したがって、メモリに保存されるべきサンプルの数は、ノイズシェーピングフィルタの分母の係数の数に等しい。

次いで、フィルタリングのAR(「自己回帰」を表す)部分のメモリは、以下の式に従って更新される。

複数のARMAセルを縦続状態に配置することによるフィルタリングの場合には、図10に関連して、フィルタの内部変数が、同様に適応化される。

インデックスnは、1単位だけ増分される。初期化ステップが最初のN_D個のサンプルに対して実行された後で、e^B+k(n)の計算が、e^B+k(n)に関して格納メモリをシフトすることにより(最古のサンプルを上書きすることを伴う)、および、値e^B+k(n)=x(n)-r^B+k-1(n)を空き状態のスロットに書き込むことによりなされることになる。

図6aに示される本発明は、等価の変形により実行され得ることが留意され得る。実際に、再構成信号は、単に、すでに利用可能なサンプル(過去のサンプルn’=n-1〜n-N_D、前の段階の現在のサンプル、フィルタのメモリ)により決定される部分s_det(n)と、最適化されるべき現在のサンプルに単に依存して決定されるべき別の部分s_opt(n)とに分解され得る。したがって、計算の負荷を最適化するために、入力信号x(n)と再構成信号r^B+k(n)との間の加重誤差である、最小化されるべき誤差

の計算もまた、2つの部分に分解され得る。第1のステップでは、入力サンプルx(n)とs_det(n)との間の、W(z)による加重差分が計算される(図6aのモジュールEAK-1およびEAK-2)。このようにして得られる値

は、単一の目標値に減少する、時点nでの目標信号であり、必要であれば、それぞれの可能な量子化値

に対して1回だけ計算される。次に、最適化ループでは、すべての可能なスカラ量子化値の中から、ユークリッド距離の意味でこの目標値に最も近いものを、簡単に発見する必要がある。

目標値を計算するための別の変形は、2つの加重フィルタリングW(z)を実行することである。第1のフィルタリングは、入力信号と前の段階の再構成信号r^B+k-1(n)との間の差分に加重する。第2のフィルタは、0入力であるが、これらのメモリは、

の助力により更新される。これら2つのフィルタリングの出力の間の差分は、同じ目標信号を与える。

図6aで説明される本発明の原理は、図6bで一般化される。ブロック601は、前の段階の符号化誤差ε^B+k-1(n)を与える。ブロック602は、すべての可能なスカラ量子化値

を1つずつ導出し、これらの値は、現在の段階の符号化誤差ε^B+k(n)を得るために、ブロック603により、ε^B+k-1(n)から減算される。この誤差は、ブロック602を制御するために、ノイズシェーピングフィルタW(z)により加重され(ブロック604)、最小化される(ブロック605)。最終的には、エンハンスメント符号化段階によりローカルに復号化される値は、

である。

ここで、表記^B+kは、1サンプル当たりのビットレートがB+kビットであることを想定していることを留意することは重要である。したがって、図6は、1サンプル当たり単一のビットが、エンハンスメント符号化段階により加算され、そのため、ブロック602で、2つの可能な量子化値を含む場合について示している。図6bで説明されるエンハンスメント符号化が、1サンプル当たり、任意のビット数kを生成することができることは明らかであり、この場合には、ブロック602での可能なスカラ量子化値の数は2^kである。

図7を参照して、次に、出願人は、本発明による、および図5を参照して説明されるようなコーダからの出力として得られる信号を復号化することができる、埋め込み符号デコーダの様々な構成を説明する。

実施される復号化デバイスは、信号送信ビットレートによって、および、例えば、信号が、例えばISDNネットワーク710から発信するか、それともIPネットワーク720から発信するかによる、信号の起源によって決まる。

低ビットレート(48、56または64kbit/s)での送信チャネルに対しては、k1=0、1、2であり、Bがコアビットレートのビット数であるB+k1ビットのバイナリ列を復号化するために、例えばG.722の標準化されたADPCMデコーダタイプの標準デコーダ700を使用することが可能になる。この復号化から発生する、復元される信号r^B+k1(n)は、コーダで実施されるエンハンスメント符号化段階の効力によるエンハンスされた品質から利点を得ることになる。

より高いビットレート、80、96kbit/sでの送信チャネルに対しては、バイナリ列I^B+k1+k2(n)が、標準デコーダ700のビットレートよりも大きなビットレートを有し、モードインジケータ740により示されるならば、予測信号

に加算されるときに、高ビットレートのエンハンスされた信号r^B+k1+k2(n)を与えることになる量子化誤差を提供するために、図2を参照して説明されるB+1ビットおよびB+2ビットでの逆量子化に加えて、追加のデコーダ730が、I^B+k1+k2(n)の逆量子化を実行する。

次に、本発明によるコーダの第1の実施形態が、図8を参照して説明される。この実施形態では、コアビットレート符号化段階800が、符号化ノイズシェーピングを伴うADPCMタイプの符号化を実行する。

コア符号化段階は、コア層の低ビットレートインデックスI^B(n)による量子化誤差信号の前のサンプル

に基づいて、および、図1を参照して説明されたような再構成信号の前のサンプルr^B(n’)(n’=n-1〜n-N_P)に基づいて実行される信号予測

を計算するためのモジュール810を備える。

予測

を入力信号x(n)から減算するための減算モジュール801が、予測誤差信号

を得るために提供される。

コアコーダは、さらに、量子化ノイズの前のサンプルq^B(n’)(n’=n-1〜n-N_NH)に基づいて、およびフィルタリングされたノイズの前のサンプル

に基づいて実行される、ノイズ

を予測することP_r(z)のためのモジュール802を備える。

ノイズ予測

を、予測誤差信号

に加算するための加算モジュール803が、さらに、e^B(n)で示される誤差信号を得るために提供される。

コア量子化Q^Bモジュール820は、量子化インデックスI^B(n)を与えるために、入力として、誤差信号e^B(n)を受信する。最適量子化インデックスI^B(n)および量子化値

は、誤差基準

を最小化する。ただし、値

は、再構成レベルであり、ν(n)は、量子化器適応化モジュール804から発生するスケールファクタである。

G.722コーダに対する例として、コア量子化器Q^Bの再構成レベルが、“X. Maitreによる論説(article)、「7 kHz audio coding within 64 kbit/s」、IEEE Journal on Selected Areas in Communication、第6-2巻、1988年2月”の表VIによって定義される。

量子化モジュールQ^BによるBビット出力の量子化インデックスI^B(n)は、送信チャネル840を介して、図7を参照して説明されるようなデコーダに送信される前に、エンハンスメントビットJ₁〜J_Kと多重化モジュール830で多重化されることになる。

コア符号化段階は、さらに、量子化器の入力とその出力との間の差分である量子化ノイズ

を計算するためのモジュール805と、量子化ノイズを量子化ノイズの予測に加算することにより、フィルタリングされる量子化ノイズ

を計算するためのモジュール806と、信号の予測を量子化誤差に加算することにより、再構成信号

を計算するためのモジュール807とを備える。

量子化器Q^B適応

モジュール804は、次の時点n+1に対する、スケールファクタとも呼ばれるレベル制御パラメータν(n)を与える。

予測モジュール810は、再構成量子化誤差信号

のサンプル、および任意には、1+P_z(z)によりフィルタリングされる再構成量子化誤差信号

のサンプルに基づいた適応のための適応P_Adaptモジュール811を備える。

後で詳細に説明されるモジュールCalc Mask850は、コア符号化段階およびエンハンスメント符号化段階の両方により、入力信号に基づいて、またはコア符号化により(コアビットレートで)ローカルに復号化される信号に基づいて、または簡易勾配(simplified gradient)アルゴリズムによりADPCM符号化で計算される予測フィルタ係数に基づいて使用され得る、符号化ノイズをシェーピングするためのフィルタを提供するように構成される。後者の場合には、ノイズシェーピングフィルタは、コアビットレート符号化に対して使用される予測フィルタの係数に基づいて、減衰定数を加えること、およびデエンファシスフィルタを加えることにより得られ得る。

さらには、エンハンスメント段階だけでマスキングモジュールを使用することが可能である。この代替方法は、コア符号化が1サンプル当たりでビットをほとんど使用しない場合に有利であり、この場合、符号化誤差は白色雑音ではなく、信号対雑音比は非常に低い。この状況は、G.722標準での高帯域(4000〜8000Hz)の1サンプル当たり2ビットのADPCM符号化で見られ、この場合には、フィードバックによるノイズシェーピングは、有効ではない。

図8のブロック802、803、805、806に対応するコア符号化のノイズシェーピングは、任意であることに留意されたい。図16に示されるような本発明は、ブロック801、804、807、810、811、820に削減されるADPCMのコア符号化に関してさえも適用される。

図9は、一般式が

であるARMA(「自己回帰移動平均」を表す)フィルタによって、量子化ノイズ

の予測の計算を実行するモジュール802をより詳細に説明する。

簡単のために、ここでは、z変換の表記が使用される。

一度に、および同時に、可聴周波数信号の短期間の特性、および長期間の特性を考慮することができるノイズのシェーピングを得るために、フィルタH^M(z)が、縦続状態のARMAフィルタリングセル900、901、902により示される。

このフィルタの縦続状態から発生する、図9のフィルタリングされる量子化ノイズは、量子化ノイズQ^B(z)の関数として、次式で与えられることになる。

図10は、モジュールF^k(z)901をより詳細に示す。このセルkの出力での量子化ノイズは、次式で与えられる。

k=1〜K_Mで繰り返すことが、

すなわち、

により与えられるノイズ予測

を用いた、

を与える。

したがって、図8によるコア符号化ノイズのシェーピングは、以下の式により有効であることが容易に確認される。

Q^B(z)=E_Q(z)-E^B(z) ・・・（１４）

ただし、

である。

量子化ノイズはほぼ白色であるため、知覚される符号化ノイズのスペクトルは、フィルタ

によりシェーピングされ、したがって、より可聴でなくなる。

後で説明されるように、ARMAフィルタリングセルは、係数g₁およびg₂を以下の方式

で割り当てることにより、入力信号

の線形予測のための逆フィルタから推定され得る。

分子の値および分母の値から構成される、このタイプの加重関数には、分母の値により信号スパイクを考慮し、分子の値によりこれらのスパイクを減衰させ、したがって、量子化ノイズの最適なシェーピングを与えるという利点がある。g₁およびg₂の値は、
1>g₂>g₁>0
である。

特定の値g₁=0は、純粋な自己回帰マスキングフィルタを与え、g₂=0のそれは、MA移動平均フィルタを与える。

さらには、有声音信号の場合、および高忠実度のデジタル音声信号の場合には、信号の周期性を表す信号の微細構造に基づくわずかなシェーピングが、信号の高調波の間で知覚される量子化ノイズを低減する。エンハンスメントは、特に、例えば200Hzより大きな、比較的高い基本周波数すなわちピッチを有する信号の場合に重要である。

長期間のノイズシェーピングARMAセルは、次式で与えられる。

図8の説明に戻ると、コーダは、さらに、複数のエンハンスメント符号化段階を備える。2つの段階EA1およびEAkが、ここに示される。

エンハンスメント符号化段階EAkは、エンハンスメントビットJ_k、またはビットJ_k(k=1、G_K)のグループを得ることを可能にし、図6aおよび6bを参照して説明されるようなものである。

この符号化段階は、符号化誤差信号e^B+k(n)を与えるために、入力信号x(n)から、サンプリング時点n-1〜n-N_Dに対する段階kでの合成信号r^B+k(n)と、時点nに対して段階k-1で合成される信号r^B+k-1(n)とで構成される信号r^B+k(n)を減算するためのモジュールEAk-1を備える。

加重関数W(z)によりe^B+k(n)をフィルタリングするためのモジュールEAk-2もまた、符号化段階kに含まれる。この加重関数は、先に説明されたようなコア符号化により与えられるマスキングフィルタH^M(z)の逆関数に等しい。モジュールEAk-2の出力では、フィルタリングされた信号

が得られる。

エンハンスメント符号化段階kは、j=0、1に対して、誤差基準

を最小化し、第1の出力として、前の段階のインデックスI^B+k-1と連結されるべき最適ビットJ_kの値を有し、そして第2の出力

として、最適インデックスJ_kに対する量子化器からの出力信号を有する、エンハンスメント量子化

を実行するためのモジュールEAk-3を備える。

段階kは、さらに、段階kでの合成信号r^B+k(n)を与えるために、量子化誤差信号

を、前の段階での合成信号r^B+k-1(n)に加算するための加算モジュールEAk-4を備える。

次いで、単一のシェーピングARMAフィルタの場合には、フィルタリングされる誤差信号は、z変換の表記で次式により与えられる。

したがって、それぞれのサンプリング時点nに対しては、部分的な再構成信号r^B+k(n)が、前の段階で再構成された信号r^B+k-1(n)に基づいて、および、信号r^B+k(n)の過去のサンプルに基づいて計算される。

この信号は、誤差信号e^B+k(n)を与えるために、信号x(n)から減算される。

誤差信号は、フィルタリングARMAセルW¹を有するフィルタによりフィルタリングされ、それにより次式が与えられる。

加重誤差基準は、量子化器の可能な出力の2つの値(または、複数ビットならばN_G個の値)に対する二次誤差を最小化することに等しい。

この最小化ステップは、最適インデックスJ_k、および、最適インデックスに対する量子化値

であって、

とも示される値を与える。

マスキングフィルタが、複数の縦続状態のARMAセルからなる場合には、縦続接続したフィルタリングが実行される。

例えば、縦続状態の短期間のフィルタリングおよびピッチのセルに対して、我々は次式を得ることになる。

第1のフィルタリングセルの出力は、次式に等しくなる。

そして、第2のセルの出力は、次式で与えられる。

が、基準を最小化することにより得られると、e^B+k(n)は、

をe^B+k(n)から差し引くことにより適応化され、次いで、格納メモリが左にシフトされ、値r^B+k+1(n+1)が、次の時点n+1に対して直近の位置に入れられる。

その後、フィルタのメモリが、次式により適応化される。

前の手順が、一般的な場合には、次式

のように繰り返される。

このように、エンハンスメントビットは、縦続状態のエンハンスメント段階において、ビット単位で、またはビットのグループ単位で得られる。

コーダのコアビットおよびエンハンスメントビットが、図1に示されるように、誤差信号e(n)を量子化することにより直接得られる従来技術とは対照的に、本発明によるエンハンスメントビットは、標準デコーダの出力におけるエンハンスメント信号が、量子化ノイズのシェーピングを伴って再構成されるように計算される。

コア量子化器の出力で得られるインデックスI^B(n)を知ることにより、および、B+1ビットを用いるADPCMタイプの量子化器が埋め込み符号量子化器であるため、2つの出力値のみが、B+1ビットを用いる量子化器に対して考えられる（possible）。

同じ論法が、B+kビットでのエンハンスメント段階の出力に関して、B+k-1ビットでのエンハンスメント段階の関数として適用される。

図11は、B=4ビットに対するBビットを用いるコア量子化器の最初の4つのレベル、ならびに、G.722コーダの低帯域の符号化のB+1およびB+2ビットを用いる量子化器のレベル、ならびに、B+2ビットに対するエンハンスメント量子化器の出力値を示す。

この図に示されるように、B+1=5ビットを用いる埋め込み量子化器は、B=4ビットを用いる量子化器のレベルを2つに分けることにより得られる。B+2=6ビットを用いる埋め込み量子化器は、B+1=5ビットを用いる量子化器のレベルを2つに分けることにより得られる。

本発明の実施形態では、エンハンスメント段階kに対する量子化再構成レベルを示す値は、Bがコア符号化のビット数を示すB+kビットを用いる埋め込み量子化器の量子化の再構成レベルを示す値と、B+k-1ビットを用いる埋め込み量子化器の量子化の再構成レベルを示す値との間の差分により定義され、B+kビットを用いる埋め込み量子化器の再構成レベルは、B+k-1ビットを用いる埋め込み量子化器の再構成レベルを2つに分けることにより定義される。

したがって、我々は、以下の式を得る。

は、B+kビットを用いる埋め込み量子化器の可能な再構成レベルを示し、

は、B+k-1ビットを用いる埋め込み量子化器の再構成レベルを示し、

は、段階kに対するエンハンスメント項または再構成レベルを示す。例として、段階k=2の、すなわちB+k=6に対する出力でのレベルが、B+k=5ビットに対する埋め込み量子化器の関数として、図11で与えられる。

B+kビットを用いる量子化器の可能な出力は、次式で与えられる。

ただし、ν(n)は、固定した量子化器の出力レベルを適応させるために、コア符号化により定義されるスケールファクタを示す。

従来技術のスキームでは、B、B+1〜B+Kビットを用いる量子化器に対する量子化は、量子化されるべき値e(n)が位置する、B+kビットを用いる量子化器の判定範囲をタグ付けすることにより、1回だけ実行された。

本発明は、異なるスキームを提案する。B+k-1ビットを用いる量子化器から発生する量子化値を知ることにより、量子化器の入力での信号

の量子化は、量子化誤差を最小化することにより、および、判定しきい値を呼び出すことなしに処理され、それにより、有利に、積

の固定小数点実装(fixed-point implementation)に対する計算ノイズを、以下のように低減することを可能にする。

図4を用いて示されるような平坦なスペクトルで量子化ノイズを引き起こすことになる、二次誤差基準を最小化することではなく、加重二次誤差基準が最小化されることになり、その結果、スペクトルがシェーピングされたノイズは、より可聴でなくなる。

使用されるスペクトル加重関数はW(z)であり、これは、さらに、コア符号化段階で、ノイズシェーピングのために使用され得る。

図8の説明に戻ると、復元されるコア信号は、予測と逆量子化器の出力との和に等しく、すなわち、

であることが理解される。

信号予測は、コアADPCMコーダに基づいて実行されるため、段階kで可能な2つの再構成信号は、以下の式

により、段階k-1で実際に再構成される信号の関数として与えられる。

これから、段階kで最小化されるべき誤差基準が推定される。

先に説明されたような平坦なスペクトルで量子化ノイズを引き起こすことになる、二次誤差基準を最小化することではなく、コア符号化についてと同じように、加重二次誤差基準が最小化されることになり、その結果、スペクトルがシェーピングされたノイズは、より可聴でなくなる。使用されるスペクトル加重関数はW(z)であり、これは、与えられた例でコア符号化のためにすでに使用されているが、しかしながら、この加重関数を、エンハンスメント段階だけで使用することが可能である。

図12によれば、信号

は、2つの信号、すなわち、n’<nに対してはすべての値

の連結を示し、n’=nに対しては0に等しい信号

と、n’=nに対しては

に等しく、n’<nに対しては0である信号

との和に等しいものとして定義される。

次いで、誤差基準は、z変換の領域で解釈する方が容易であり、以下の式で与えられる。

ただし、

は、

のz変換である。

を分解することにより、我々は、次式を得る。

例えば、この基準を最小化するために、我々は、量子化値がまだ不明であるので、信号

を、

で計算することにより開始する。前の段階の信号の和、および

の和は、段階kの再構成信号に等しい。

したがって、

は、

のように、n’<nに対しては、r^B+k(n’)に等しい信号のz変換であり、n’=nに対しては、r^B+k-1(n’)に等しい。

プロセッサにおける実施に関しては、信号r^B+k(n)は、一般には明示的に計算されることにはならないが、誤差信号e^B+k(n)は、有利に計算されることになり、これは、x(n)とr^B+k(n)との間の差分、すなわち、
e^B+k(n’)=x(n’)-r^B+k(n’) n’=n-1〜n-N_D
=x(n’)-r^B+k-1(n’) n’=n ・・・（４１）
である。

e^B+k(n)は、r^B+k-1(n)に基づいて、およびr^B+k(n)に基づいて構成され、後に続くことになるフィルタリングのためにメモリに保存されるべきサンプルの数は、N_D個のサンプル、マスキングフィルタの分母の係数の数である。

フィルタリングされる誤差信号

は、次式に等しくなる。

加重二次誤差基準は、これから推定される。

最適インデックスJ_kは、基準

をj=0、1に対して最小化するものであり、したがって、スカラ量子化

を、B+kビットを用いるスカラ量子化器の再構成レベルに基づいて計算される2つのエンハンスメントレベル

に基づいて実行し、最適コアインデックスおよびインデックスJ_i(i=1〜k-1)、または同じことであるが、I^B+k-1を知る。

最適インデックスに対する量子化器の出力値は、

に等しく、時点nでの再構成信号の値は、次式で与えられることになる。

量子化出力

を知ることにより、差分信号e^B+k(n)は、サンプリング時点nに対して更新される。

そして、フィルタのメモリが適応化される。

nの値は、1単位だけ増分される。次いで、e^B+k(n)の計算が、きわめて単純であることが理解される。e^B+k(n)のための格納メモリを、左に1スロットだけシフトすることにより、最古のサンプルを脱落させ、直近のサンプルr^B+k-1(n+1)として、その時まで不明である量子化値を書き込めば十分である。メモリをシフトすることは、ポインタを賢明に使用することにより回避され得る。

図13および図14は、マスキングフィルタ計算モジュール850により実施されるマスキングフィルタ計算の実施の2つのモードを示す。

図13に示される実施の第1のモードでは、前のフレームのサンプルのセグメントS(n)(n=-N_s〜-1、0〜N_T)で補足される現在フレームのブロックに対応する信号の現在ブロックが考慮される。

マスキングフィルタのスペクトルのスパイクを強調するために、信号は、フィルタA₁(z)による、E60における相関係数の計算の前に、あらかじめ処理され(プリエンファシス処理)、このフィルタA₁(z)の1つまたは複数の係数は、固定されるか、または仏国特許第２７４２５６８号（FR2742568）で説明されるような線形予測により適応化されるかのいずれかである。

プリエンファシスが使用される場合には、分析されるべき信号S_P(n)は、次式の逆フィルタリングにより計算される。
S_P(z)=A₁(z)S(z)

その後、信号ブロックは、E61において、従来技術から知られるような、ハニングウィンドウ、またはサブウィンドウの連結から構成されるウィンドウにより加重される。

その後、K_c2+1の相関係数は、E62において、次式により計算される。

プリエンファシスされる信号の包絡線をモデリングする、(自己回帰を表す)ARフィルタA₂(z)の係数が、E63において、レビンソン-ダービンのアルゴリズムにより与えられる。

したがって、フィルタA(z)が、E64において得られ、前記フィルタは、入力信号の包絡線をモデリングする伝達関数

を有する。

この計算が、本発明によるコーダの2つのフィルタ1-A₁(z)および1-A₂(z)に対して実施されるとき、それにより、シェーピングフィルタは、E65において、次式により得られる。

定数g_N1、g_D1、g_N2およびg_D2は、マスキングフィルタのスペクトルを適合させることを可能にし、特に、最初の2つは、マスキングフィルタのスペクトルの傾斜を調整することを可能にする。

このように、マスキングフィルタは、傾斜フィルタおよびフォルマントフィルタが分離された、縦続接続する2つのフィルタにより構成されて得られる。各フィルタが入力信号のスペクトル特性の関数として適応化されるこのモデリングは、特に、任意のタイプのスペクトル傾斜を表す信号に適応化される。g_N1およびg_N2が0である場合には、第1近似としては十分である、2つの自己回帰フィルタの縦続マスキングフィルタリングが得られる。

複雑さの低いマスキングフィルタの第2の例示的な実施が、図14を参照して説明される。

ここでの原理は、ARMAフィルタの合成フィルタを、入力信号の傾斜に依存している補償フィルタにより適用される強調解除(deaccentuation)を伴う復号化信号の再構成のために、直接使用することである。

マスキングフィルタの式は、次式で与えられる。

G.722、G.726およびG.727標準では、ADPCMのARMA予測器は、分母に2つの係数を有する。この場合、E71において計算される補償フィルタは、次式の形式になる。

そして、E70において与えられるフィルタP_z(z)およびP_P(z)は、E72において与えられる減衰定数g_Z1およびg_P1により制約されるそれらの変形で置換されることになり、それにより、次式の形式のノイズシェーピングフィルタを与える。

p_Com(i)=0 i=1、2
を用いることにより、ARMAセルからなるマスキングフィルタの単純化された形式が得られる。

マスキングフィルタの別の非常に単純な形式は、わずかな減衰を伴うARMA予測器の分母のみを、次式

のように、例えばg_P=0.92で用いることにより得られるものである。

信号の部分的な再構成のためのこのARフィルタは、低減された複雑さにつながる。

特定の実施形態では、および、各サンプリング時点でフィルタを適応させることを回避するために、平滑化効果を保存するように、1つの信号フレームで、または1フレーム当たり複数回減衰されるべきフィルタの係数を凍結することが可能になる。

平滑化を実行する1つの方法は、量子化器の入力での信号に関するダイナミック振幅の急な変動を検出することであり、または、等価であるが、しかし複雑さが最小である、直接に量子化器の出力におけるインデックスに関する方法によるものである。インデックスの2つの急な変動の間で、スペクトル特性の変動がより少なく、したがって、マスキングの目的でより良好に適応化されるADPCM係数を有する区域が得られる。

量子化ノイズの長期間のシェーピングに対するセルの係数の計算

は、有声音に対する周期的な構成要素を含む量子化器の入力信号に基づいて実行される。周期的な信号に対して、特に有声の音声信号に対して、品質において価値のあるエンハンスメントを得ることを望むならば、長期間のノイズシェーピングが重要であることが留意され得る。これは、実際に、その合成モデルが何らかの長期間の予測器を備えないコーダに関して、周期的な信号の周期性を考慮する唯一の方法である。

ピッチの周期は、例えば、図8の量子化器Q^Bの入力e^B(n)での長期間の二次予測誤差を最小化することにより、相関係数

を最大化することにより計算される。

ピッチは、次のようなものである。
Cor(Pitch)=Max{Cor(i)} i=P_Min〜P_Max

マスキングフィルタを生成するために使用されるピッチ予測利得Cor_f(i)は、次式により与えられる。

長期間のマスキングフィルタの係数は、
p_2MP(i)=g_2PitchCor_f(Pitch+i) i=-M_P〜M_P、
および、
p_1MP(i)=g_1PitchCor_f(Pitch+i) i=-M_P〜M_P、
により与えられることになる。

ピッチの値の計算の複雑さを低減するためのスキームが、“ITU-T G.711.1標準「Wideband embedded extension for G.711 pulse code modulation」”の図8-4により説明される。

図15は、本発明によるコーダの第2の実施形態を提案する。

この実施形態は、図8を参照して説明されるフィルタリングモジュールの代わりに、予測モジュールを使用し、どちらも、コア符号化段階に対するもの、およびエンハンスメント符号化段階に対するものである。

この実施形態では、コア量子化ノイズシェーピングを伴うADPCMタイプのコーダは、入力信号x(n)と低ビットレート合成信号r^B(n)との間の差分である、再構成ノイズを予測するための予測モジュール1505のP_D(z)[X(z)-R^B(z)]と、予測を入力信号x(n)に加算するための加算モジュール1510とを備える。

それは、さらに、図8を参照して説明されるものと同一である、信号

に対する予測モジュール810であって、低ビットレート量子化インデックスI^B(n)により量子化される誤差信号の前のサンプル

に基づいて、および、再構成信号の前のサンプルr^B(n’)(n’=n-1〜n-N_P)に基づいて、予測を実行する予測モジュールを備える。予測

を修正入力信号x(n)から減算するための減算モジュール1520は、予測誤差信号を提供する。

コアコーダは、さらに、量子化ノイズの前のサンプルq^B(n’)(n’=n-1〜n-N_NH)に基づいて実行されるノイズ予測を計算するためのモジュールP_N(z)1530と、このようにして得られる予測を、e^B(n)で示される誤差信号を得るために、予測誤差信号から減算するための減算モジュール1540とを備える。

コア量子化モジュールQ^Bは、1550で、二次誤差基準

の最小化を実行する。ただし、値

は、再構成レベルであり、ν(n)は、量子化器適応化モジュール1560から発生するスケールファクタである。量子化モジュールは、入力として、誤差信号e^B(n)を受信し、それにより、出力として、量子化インデックスI^B(n)および量子化信号

を与える。G.722に対する例として、コア量子化器Q^Bの再構成レベルが、“X. Maitreによる論説、「7 kHz audio coding within 64 kbit/s」、IEEE Journal on Selected Areas in Communication、第6-2巻、1988年2月”の表VIによって定義される。

量子化モジュールQ^Bの出力におけるBビットの量子化インデックスI^B(n)は、送信チャネル840を介して、図7を参照して説明されるようなデコーダに送信される前に、エンハンスメントビットJ₁〜J_kと多重化モジュール830で多重化されることになる。

量子化ノイズを計算するためのモジュール1570は、量子化器の入力と量子化器の出力との間の差分

を計算する。

モジュール1580は、信号の予測を量子化誤差に加算することにより、再構成信号

を計算する。

量子化器の適応化モジュールQ_Adapt1560は、次の時点に対する、スケールファクタとも呼ばれるレベル制御パラメータν(n)を与える。

予測モジュールの適応化モジュールP_Adapt811は、再構成信号r^B(n)の過去のサンプルに基づいて、および、再構成量子化誤差信号

に基づいて、適応化を実行する。

エンハンスメント段階EAkは、信号

を与えるために、先行の段階で再構成された信号r^B+k-1(n)を、入力信号x(n)から減算するためのモジュールEAk-10を備える。

信号

のフィルタリングは、フィルタリングモジュールEAk-11によって、フィルタ

により、フィルタリングされた信号

を与えるために実行される。

予測信号

を計算するためのモジュールEAk-12が、さらに提供され、この計算は、量子化誤差信号の量子化された前のサンプル

に基づいて、および、

によりフィルタリングされるこの信号のサンプルに基づいて実行される。エンハンスメント段階EA-kは、さらに、目標信号

を与えるために、予測

を、信号

から減算するための減算モジュールEA-k13を備える。

エンハンスメント量子化モジュールEAk-14

は、二次誤差基準

を最小化するステップを実行する。

このモジュールは、入力として、信号

を受信し、第1の出力として、量子化信号

を提供し、そして第2の出力として、インデックスJ_kを提供する。

B+kビットを用いる埋め込み量子化器の再構成レベルは、B+k-1ビットを用いる量子化器の埋め込み出力レベルを2つに分けることにより計算される。B+kビットを用いる埋め込み量子化器のこれらの再構成レベルと、B+k-1ビットを用いる量子化器の再構成レベルとの間の差分値が計算される。この差分値

は、その後1回限りでプロセッサのメモリに格納され、コア量子化インデックスと、前の段階のエンハンスメント量子化器のインデックスとの組み合わせによりインデックスが付与される。

こうして、これらの差分値は、可能な量子化値を得るために、段階kの量子化モジュールにより使用される辞書(dictionary)を構成する。

量子化器の出力における信号

を、予測

に加算するための加算モジュールEAk-15が、さらに、段階kでの再構成信号r^B+k(n)を与えるために、先行の信号を前の段階で再構成された信号r^B+k-1(n)に加算するためのモジュールEAk-16と同様に、エンハンスメント段階kに統合される。

図8を参照して説明されるコーダについてと同じように、先に詳細に説明されたモジュールCalc Mask850は、入力信号に基づいて(図13)か、または図14を参照して説明されるようなADPCM合成フィルタの係数に基づいてかのどちらかで、マスキングフィルタを提供する。

このように、エンハンスメント段階kは、現在のサンプルに対して、以下のステップ、すなわち、
− 階層符号化の入力信号x(n)と、前のエンハンスメント符号化段階のエンハンスメント符号化から発生する再構成信号r^B+k-1(n)との間の差分を計算することにより、差分信号

を得るステップと、
− 所定のマスキングフィルタW(z)による差分信号のフィルタリングステップと、
− 目標信号

を得るための、予測信号

の、フィルタリングされた差分信号

からの減算ステップと、
− 信号

を、量子化ステップから発生する信号

に加算することによる、

によりフィルタリングされる量子化器の出力での信号の計算ステップと、
− 前のエンハンスメント符号化段階のエンハンスメント符号化から発生する再構成信号と、前のフィルタリングされた信号とを加算することによる、現在のサンプルに対する再構成信号r^B+k(n)の計算ステップと、を実施する。

図15は、単一のARMAセルからなるマスキングフィルタに関して、説明を簡単にする目的で与えられる。縦続状態の複数のARMAセルへの一般化は、式7から式17により説明されると共に、図9および図10で説明されるスキームに従って行われることになることが理解される。

マスキングフィルタが、1-P_D(z)タイプのただ1つのセルを備える、すなわちP_N(z)=0である場合には、

の寄与が、

から差し引かれることになり、または、さらに良好には、量子化器の入力信号は、EAk-11およびEAk-13を

により置換することによって与えられることになる。

縦続状態の複数のセルARへの一般化は、式7から式17により説明されると共に、図9および図10で説明されるスキームに従って行われることになることが理解される。

図16は、本発明の第3の実施形態を示し、今回はPCMタイプのコア符号化段階に関する。コア符号化段階1600は、ノイズ

の予測を、G.711の標準化されたPCMの量子化ノイズの前のサンプル

に基づいて、および、フィルタリングされたノイズの前のサンプル

に基づいて計算する予測モジュールP_r(z)1610による符号化ノイズのシェーピングを含む。

図16におけるブロック1610、1620、1640および1650に対応するコア符号化のノイズシェーピングは、任意であることに留意されたい。図16で示されるような発明は、ブロック1630に削減されるPCMコア符号化に関してさえも適用される。

モジュール1620は、e(n)で示される誤差信号を得るために、予測

の、入力信号x(n)への加算を実行する。

コア量子化モジュール

1630は、量子化インデックスI^B(n)を与えるために、入力として、誤差信号e(n)を受信する。最適量子化インデックスI^B(n)および量子化値

は、誤差基準

を最小化する。ただし、値

は、G.711のPCM量子化器の再構成レベルである。

例として、B=8に対するG.711標準のコア量子化器

の再構成レベルは、“ITU-T勧告G.711、「Pulse Code Modulation (PCM) of voice frequencies」”の、A則(A-law)に対しては表1a、およびμ則(μ-law)に対しては表2a、により定義される。

量子化モジュール

の出力におけるBビットの量子化インデックスI^B(n)は、多重化モジュール830で、送信チャネル840を介して、G.711タイプの標準デコーダに送信される前に、エンハンスメントビットJ₁〜J_Kと連結されることになる。

量子化ノイズを計算するためのモジュール1640は、PCM量子化器の入力と、量子化された出力との間の差分

を計算する。

フィルタリングされた量子化ノイズを計算するためのモジュール1650は、量子化ノイズの、量子化ノイズの予測への加算

を実行する。

エンハンスメント符号化は、中間のビットレートに対する再構成ノイズの最適なシェーピングを保持しながら、量子化ビットを連続的に加算することにより、復号化信号の品質をエンハンスするものである。

エンハンスメントPCMビットJ_k、またはビットJ_k(k=1、G_K)のグループを得ることを可能にする段階kは、ブロックEAkにより説明される。

このエンハンスメント符号化段階は、図8を参照して説明されるそれに類似する。

それは、符号化誤差信号e^B+k(n)を与えるために、サンプルn-N_D〜n-1に対して段階kで合成される信号r^B+k(n)と、時点nに対して段階k-1で合成される信号r^B+k-1(n)とで構成される信号r^B+k(n)から、入力信号x(n)を減算するための減算モジュールEAk-1を備える。

それは、さらに、フィルタリングされた信号

を与えるために、マスキングフィルタH^M(z)の逆関数に等しい加重関数W(z)によりe^B+k(n)をフィルタリングするためのフィルタリングモジュールEAk-2を備える。

量子化モジュールEAk-3は、j=0、1に対する、誤差基準

の最小化を実行し、第1の出力として、前のステップのPCMインデックスI^B+k-1と連結されるべき最適PCMビットJ_kの値を有し、そして第2の出力

として、最適PCMビットJ_kに対するエンハンスメント量子化器の出力信号を有する、エンハンスメント量子化

を実行する。

量子化誤差信号

を、前のステップで合成された信号r^B+k-1(n)に加算するための加算モジュールEAk-4は、ステップkでの合成信号r^B+k(n)を与える。信号e^B+k(n)およびフィルタのメモリは、図6および図8に関して前に説明されたように適応化される。

図8を、および図15を参照して説明されるものと同様にして、モジュール850は、コア符号化のため、および、エンハンスメント符号化のため、の両方のために使用されるマスキングフィルタを計算する。

図8、15または16で示される他の変形の階層コーダを考察することが可能である。ある変形では、エンハンスメント符号化における可能な量子化値の数は、各符号化サンプルに対して変動する。エンハンスメント符号化は、符号化されるべきサンプルの関数として可変のビットの数を使用する。割り当てられるエンハンスメントビットの数は、固定の割り当て規則、または可変の割り当て規則に従って適応化され得る。例示的な可変の割り当ては、例えば、ITU-T G.711.1標準での低帯域のエンハンスメントPCM符号化により与えられる。好ましくは、割り当てアルゴリズムは、それが可変であるならば、リモートデコーダに利用可能な情報を使用しなければならず、それにより、追加の情報が送信される必要がなく、これは、例えば、ITU-T G.711.1標準での場合である。

同様に、および別の変形では、エンハンスメント符号化でスカラ量子化インデックス(J_k(n))を与える、エンハンスメント信号の符号化サンプルの数は、入力信号のサンプルの数よりも小さくすることができる。この変形は、エンハンスメントビットの割り当て数があるサンプルに対して0に設定される場合に、前の変形から推定される。

次に、本発明によるコーダの例示的な実施形態が、図17を参照して説明される。

ハードウェアの点からは、本発明の趣旨内で、第1、第2または第3の実施形態に従って説明されたようなコーダは、典型的には、メモリブロックBMと協働するプロセッサμPを備え、このメモリブロックBMは、格納ならびに/またはワークのメモリ、ならびに、例えば、先行する符号化段階の量子化値、そうでなければ、量子化再構成のレベルの辞書、もしくは、図6、8、15および16を参照して説明されるような符号化方法の実施のために必要な他の任意のデータを格納するための手段を装う上述のバッファメモリMEMを含む。このコーダは、入力として、デジタル信号x(n)の連続的なフレームを受信し、連結された量子化インデックスI^B+Kを送出する。

本発明による方法のステップの実施のためのコード命令であって、これらの命令が、コーダのプロセッサμPにより実行され、ならびに特に、コアビットレートと呼ばれる所定のビットレートでの符号化、現在のフレームの各サンプルに対するスカラ量子化インデックスを送出すること、および、エンハンスメント信号の各符号化サンプルに対するスカラ量子化インデックスを送出する、少なくとも1つのエンハンスメント符号化であるときに、メモリブロックBMは、これらのコード命令を含むコンピュータプログラムを含むことができる。このエンハンスメント符号化は、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタを得るステップを含む。前記エンハンスメント信号のスカラ量子化のインデックスは、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより決定される。

より一般には、コンピュータまたはプロセッサにより読み取り可能であり、コーダに統合される場合もあればされない場合もあり、任意には取り外し式である記憶手段が、本発明による符号化方法を実施するコンピュータプログラムを記憶する。

例えば、図8、15または16は、そのようなコンピュータプログラムのアルゴリズムを例証することができる。

500 コアビットレート符号化段階
510 ブロック
520 ブロック、フィルタリングモジュール
530 段階EA1
540 段階EAk
550 段階EAk2
560 連結モジュール
580 モジュール
601〜606 ブロック
700 標準デコーダ
710 ISDNネットワーク
720 IPネットワーク
730 追加のデコーダ
740 モードインジケータ
800 コアビットレート符号化段階
801 減算モジュール、ブロック
802 モジュール、ブロック
803 加算モジュール、ブロック
804 量子化器適応化モジュール、ブロック
805、806 モジュール、ブロック
807 モジュール、ブロック
810 モジュール、予測モジュール、ブロック
811 適応P_Adaptモジュール、ブロック
820 コア量子化Q^Bモジュール、ブロック
830 多重化モジュール
840 送信チャネル
850 モジュール、マスキングフィルタ計算モジュール、モジュールCalc Mask
900 ARMAフィルタリングセル
901 ARMAフィルタリングセル、モジュールF^k(z)
902 ARMAフィルタリングセル
1505 予測モジュール
1510 加算モジュール
1520 減算モジュール
1530 モジュールP_N(z)
1540 減算モジュール
1550 コア量子化モジュール
1560 量子化器適応化モジュール、適応化モジュールQ_Adapt
1570、1580 モジュール
1600 コア符号化段階
1610 予測モジュールP_r(z)、ブロック
1620 モジュール、ブロック
1630 コア量子化モジュール、ブロック
1640、1650 モジュール、ブロック

Claims

デジタル音声信号の階層符号化の方法であって、入力信号の現在のフレームに対して、
− 前記現在のフレームの各サンプル(x(n))に対するスカラ量子化インデックス(I^B(n))を送出するコア符号化と、
− エンハンスメント信号
の各符号化サンプルに対するスカラ量子化
のインデックス(J_k(n))を送出する、少なくとも1つのエンハンスメント符号化とを含み、
前記エンハンスメント符号化が、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタ(W(z))を得るステップを含み、前記エンハンスメント信号のスカラ量子化
の前記インデックス(J_k(n))が、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより決定されることを特徴とする方法。
現在のエンハンスメント符号化段階に対する前記目標信号の前記決定が、現在のサンプルに対して、以下のステップ、すなわち、
− 前記階層符号化の前記入力信号(x(n))を、前の符号化段階の符号化に基づいて、および、前記現在のエンハンスメント符号化段階の再構成信号の過去のサンプルに基づいて部分的に再構成される信号と組み合わせることにより、エンハンスメント符号化誤差信号(e^B+k(n))を得るステップと、
− 得られた前記ノイズシェーピングフィルタ(W(z))による、前記目標信号
を得るための、前記エンハンスメント符号化誤差信号のフィルタリングステップと、
− 前の符号化段階の前記符号化から発生する前記再構成信号(r^B+k-1(n))と、量子化ステップ
から発生する信号との加算による、前記現在のサンプルに対する前記再構成信号(r^B+k(n))の計算ステップと、
− 前記量子化ステップから発生する前記信号に基づく、前記ノイズシェーピングフィルタのメモリの適応化ステップと
を含むことを特徴とする、請求項1に記載の方法。
前記可能なスカラ量子化値の組、および前記現在のサンプルに対する誤差信号の量子化値が、コアビットレートの量子化インデックスに関して計算されるレベル制御パラメータによりスケーリングされる、量子化再構成レベルを示す値であることを特徴とする、請求項1に記載の方法。
エンハンスメント段階kに対する量子化再構成レベルを示す値が、Bが前記コア符号化のビット数を示すB+kビットを用いる埋め込み量子化器の前記量子化の前記再構成レベルを示す値と、B+k-1ビットを用いる埋め込み量子化器の前記量子化再構成レベルを示す値との間の差分により定義され、B+kビットを用いる前記埋め込み量子化器の前記再構成レベルが、B+k-1ビットを用いる前記埋め込み量子化器の前記再構成レベルを2つに分けることにより定義されることを特徴とする、請求項3に記載の方法。
前記エンハンスメント段階kに対する量子化再構成レベルを示す値が、メモリ空間に格納され、前記コアビットレートの量子化およびエンハンスメントのインデックスの関数として、インデックスが付与されることを特徴とする、請求項4に記載の方法。
スカラ量子化の可能な値の数が、各サンプルに対して変動することを特徴とする、請求項1に記載の方法。
前記スカラ量子化インデックス(J_k(n))を与える、前記エンハンスメント信号の符号化サンプルの数が、前記入力信号のサンプルの数よりも小さいことを特徴とする、請求項1に記載の方法。
前記コア符号化が、スカラ量子化および予測フィルタを使用するADPCM符号化であることを特徴とする、請求項1に記載の方法。
前記コア符号化が、PCM符号化であることを特徴とする、請求項1に記載の方法。
前記コア符号化が、さらに、現在のサンプルに対して、以下のステップ、すなわち、
− 前記符号化ノイズ
に対する予測信号を、過去の量子化ノイズサンプルに基づいて、および、所定のノイズシェーピングフィルタによりフィルタリングされる量子化ノイズの過去のサンプルに基づいて得るステップと、
− 量子化されるべき修正入力信号を得るために、前記コア符号化の前記入力信号と前記符号化ノイズ予測信号とを組み合わせるステップと
を含むことを特徴とする、請求項8または9に記載の方法。
前記エンハンスメント符号化により使用される前記ノイズシェーピングフィルタ(W(z))が、さらに、前記コア符号化により使用されることを特徴とする、請求項10に記載の方法。
前記ノイズシェーピングフィルタが、前記入力信号の関数として計算されることを特徴とする、請求項1または10に記載の方法。
前記ノイズシェーピングフィルタが、前記コア符号化によりローカルに復号化される信号に基づいて計算されることを特徴とする、請求項1または10に記載の方法。
デジタル音声信号の階層コーダであって、入力信号の現在のフレームに対して、
− 前記現在のフレームの各サンプルに対するスカラ量子化インデックス(I^B(n))を送出するコア符号化段階(800、1500、1600)と、
− エンハンスメント信号の各符号化サンプルに対するスカラ量子化
のインデックス(J_k(n))を送出する、少なくとも1つのエンハンスメント符号化段階(EA-k)とを備え、
前記エンハンスメント符号化段階が、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタ(W(z))を得るためのモジュール(850)、および、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより、前記エンハンスメント信号のスカラ量子化
のインデックス(J_k(n))を送出する量子化モジュール(EAk-3、EAk-4)を備えることを特徴とする階層コーダ。
コード命令を含むコンピュータプログラムであって、これらの命令がプロセッサにより実行される場合に、請求項1から13のいずれか一項に記載の符号化方法のステップを実施することを特徴とするコンピュータプログラム。