JP2007515677A

JP2007515677A - 最適化された複合的符号化方法

Info

Publication number: JP2007515677A
Application number: JP2006543574A
Authority: JP
Inventors: ダヴィド・ヴィレット; クロード・ランブラン; アブデラティフ・ベンジェロン・トゥイミ
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2003-12-10
Filing date: 2004-11-24
Publication date: 2007-06-14
Anticipated expiration: 2024-11-24
Also published as: PL1692689T3; CN1890714B; US7792679B2; ATE442646T1; FR2867649A1; KR20060131782A; DE602004023115D1; CN1890714A; JP4879748B2; ES2333020T3; EP1692689B1; ZA200604623B; US20070150271A1; EP1692689A1; KR101175651B1; WO2005066938A1

Abstract

本発明は、マルチメディア信号（オーディオまたはビデオ）のようなデジタル信号の圧縮符号化に関するものであると共に、更に特に、それぞれ一連の機能ブロックを含むいくらかの符号器が並列状態で入力信号を受信する複合的符号化方法に関するものである。本発明によれば、a)各ブロックの実行された１つ、またはいくつかの機能と一緒に、各符号器を形成する機能ブロック（BF10,...,BFnN）が識別され、b)様々な符号器に共通である機能が列挙されると共に、c)前記共通の機能が、少なくとも１つの同じ計算モジュール（BF1CC,...,BFnCC）の中の少なくとも全ての符号器の一部分に関して、決定的に実行される。

Description

本発明は、オーディオ（音声及び／または音）信号、またはビデオ信号のようなマルチメディア信号を送信するか、もしくは記憶する応用システムにおけるデジタル信号の符号化及び復号化に関する。

移動性、及び連続性を提供するために、現代の、そして革新的なマルチメディア通信サービスは、多種多様な状況の下で機能しなければならない。マルチメディア通信セクタの発展過程、そしてネットワーク、アクセスポイント、及び端末の異種の性質は、圧縮フォーマットの増設を発生させた。

本発明は、デジタル信号、またはデジタル信号の一部分が、２つ以上の符号化技術を用いて符号化されるときに使用される“複合的符号化（multiple coding）”技術の最適化に関するものである。複合的符号化は、同時に発生する（単一経路において実行される）か、もしくは非同時に発生する可能性がある。その処理は、同じ信号に、もしくは同じ信号から得られた（例えば、異なる帯域幅を備える）異なるバージョンに適用され得る。従って、“複合的符号化”は、各符号器が、前の符号器によって圧縮された信号の復号化から得られたバージョンを圧縮する“トランスコーディング（transcoding）”と区別される。

複合的符号化の１つの例は、２つ以上のフォーマットに同じ内容を符号化することであると共に、その次に、同じ符号化フォーマットをサポートしない端末にそれを送信することである。リアルタイムの同報通信の場合は、その処理は、同時に実行されなければならない。データベースに対するアクセスの場合は、符号化は、順々に、そして“オフラインで”実行されるであろう。これらの例において、複合的符号化は、複数の符号器（または、場合により、複数のビットレート、または同じ符号器の複数のモード）を使用して異なるフォーマットによって同じ信号を符号化するために使用され、各符号器は、その他の符号器とは独立して動作する。

複合的符号化の別の使用は、信号セグメントを符号化するために複数の符号器が参加すると共に、そのセグメントを符号化するために、最終的にその符号器の内の１つだけが選択される符号化構造において見られる。その符号器は、セグメントを処理した後で、またはもっと後で（遅延判定）、選択され得る。この種類の構造は、“マルチモード符号化（multimode coding）”構造（符号化“モード”の選択を参照）として以下で言及される。これらのマルチモード符号化構造において、“共通部分”を共用する複数の符号器は、同じ信号部分を符号化する。使用される符号化技術は、１つの符号化構造と異なる可能性があるか、もしくは、１つの符号化構造から生じる可能性がある。しかしながら、“無記憶（memoryless）”技術の場合を除いて、それらは、完全には独立していないことになる。再帰的処理を使用する符号化技術の（ルーチン）状況において、所定の信号セグメントの処理は、過去にその信号がどのように符号化されたかによって変わる。従って、符号器が、そのメモリ内の別の符号器からの出力に考慮しなければならないとき、いくらかの符号器の相互依存性がある。

“複合的符号化”の概念、及びそのような手法を使用するための条件が、上記で参照された様々な状況において導入された。しかしながら、実現の複雑さは、克服できないと証明される可能性がある。

例えば、アクセス状況、ネットワーク、及び異なるクライアントの端末に適応した異なるフォーマットによって同じコンテンツを同報通信するコンテンツサーバの状況においては、要求されるフォーマットの数が増加するので、この動作は非常に複雑になる。リアルタイムの同報通信の場合は、様々なフォーマットが並列に符号化されるので、システムの資源によって、制限が急速に課される。

上記で参照された第２の使用は、分析された各信号部分に関して、一組の符号器の中から１つの符号器を選択するマルチモード符号化の応用システムに関するものである。選択は、基準の定義を必要とし、より通常の基準は、ビットレート／ひずみのトレードオフを最適化することを目指す。信号は連続する時間セグメントに関して分析され、複数の符号化が各セグメントにおいて見積もられる。所定の品質のための最も低いビットレートを有する符号化、または所定のビットレートのための最上品質を有する符号化が、その場合に選択される。ビットレート、及びひずみのトレードオフ以外の制限が使用され得る点に注意が必要である。

そのような構造において、その符号化は、一般的に、関係のあるセグメントに関して信号を分析することによって、演繹的に選択される（信号の特性に基づいた選択）。しかしながら、この選択の目的のための信号の強い分類を生成することの難しさは、全てのモードを符号化した後の最高モードの後天的な選択の提案を導いたが、しかしこれは、高い複雑さを犠牲にして実行される。

上述の２つのアプローチを結合する中間の方法が、計算コストを減少させる目的で提案された。しかしながら、そのような方法は最適条件より少なく、そして全てのモードを調査するより悪い性能を提供する。全てのモード、またはモードの主要部分を調査することは、例えば、潜在的に非常に複合的であると共に、容易にリアルタイム符号化と演繹的に互換性がない、複合的符号化の応用システムを構成する。

現在、大部分の複合的符号化、及びトランスコーディングの動作は、フォーマットの間の相互関係、及びフォーマットとそのコンテンツとの間の相互関係を無視する。少数のマルチモード符号化技術が提案されたが、しかし、一般的に、使用するモードに関する決定は、例えば、分類による信号に関して（ＳＭＶ符号器“選択可能モードボコーダ（selectable mode vocoder）”などの場合）、またはネットワークの状況の関数として（例えば、適応マルチレート（ＡＭＲ：adaptive multirate）符号器などの場合）、演繹的に実行される。

様々な選択モードは、以下の文書において説明されると共に、特に信号源によって制御された決定、及びネットワークによって制御された決定が説明される。

「“An overview of variable rate speech coding for cellular networks”, Gersho, A.; Paksoy, E.; Wireless Communications, 1992. Conference Proceedings, 1992 IEEE International Conference on Selected Topics, 25-26 June 1992 Page(s):172-175」

「“A variable rate speech coding algorithm for cellular networks”, Paksoy, E.; Gersho, A.; Speech Coding for Telecommunications, 1993. Proceedings, IEEE Workshop 1993, Page(s):109-110」

「“Variable rate speech coding for multiple access wireless networks”, Paksoy E.; Gersho A.; Proceedings, 7th Mediterranean Electrotechnical Conference, 12-14 April 1994 Page(s):47-50 vol.1」

信号源によって制御された決定の場合は、演繹的決定は、入力信号の分類に基づいて実行される。入力信号を分類する多くの方法がある。

ネットワークによって制御された決定の場合、ビットレートが、信号源によって選択されるより、むしろ外部のモジュールによって選択されるマルチモード符号器を提供することは、更に簡単である。最もシンプルな方法は、それぞれ固定ビットレートであるが、異なる符号器は異なるビットレートを有する符号器の系列を生成すると共に、必要とされる現在のモードを獲得するために、それらのビットレートの間でビットレートを切り替えることである。

特に、以下の文書を参照すると、使用されるべきモードの演繹的な選択のために、複数の基準を結合することに関する研究が同様に行われた。

「“Variable-rate for the basic speech service in UMTS” Berruto, E.; Sereno, D.; Vehicular Technology Conference, 1993 IEEE 43rd, 18-20 May 1993 Page(s):520-523」

「“A VR-CELP codec implementation for CDMA mobile communications” Cellario, L.; Sereno, D.; Giani, M.; Blocher, P.; Hellwig, K.; Acoustics, Speech, and Signal Processing, 1994, ICASSP-94, 1994 IEEE International Conference, Volume: 1 , 19-22 April 1994 Page(s):I/281-I/284 vol.1」

演繹的な符号化モード選択を使用する全てのマルチモード符号化アルゴリズムは、特に演繹的分類の強さに関する問題に関連する同じ欠点に苦しむ。

この理由のために、例えば、以下の文書において、符号化モードに関する後天的な決定を用いる技術が提案された。

「“Finite state CEIJP for variable rate speech coding” Vaseghi, S.V.; Acoustics, Speech, and Signal Processing, 1990, ICASSP-90, 1990 International Conference, 3-6 April 1990 Page(s):37-40 vol.1」

符号器は、客観的な品質測定を最適化することによって、異なるモードの間でモードを切り替えることができ、その結果として、入力信号の特性、対象信号対量子化雑音比（signal-to-quantization noise ratio：ＳＱＮＲ）、及び符号器の現在の状態の関数として、後天的に決定が実行される。この種類の符号化方式は、品質を改良する。しかしながら、異なる符号化が並列に実行されると共に、従って、その結果生じるこの種類のシステムの複雑さは法外である。

以下の文書において、演繹的決定とクローズドループの改良点とを結合する他の技術が提案された。

「“Multimode variable bit rate speech coding: an efficient paradigm for high-quality low-rate representation of speech signal” Das, A.; DeJaco, A.; Manjunath, S.; Ananthapadmanabhan, A.; Huang, J.; Choy, E.; Acoustics, Speech, and Signal Processing, 1999. ICASSP '99 Proceedings, 1999 IEEE International Conference, Volume: 4, 15-19 March 1999 Page(s):2307-2310 vol.4」

提案されたシステムは、信号の特性の関数としてのモードの第１の選択（開ループ選択）を実行する。この決定は、分類によって実行され得る。その場合に、もし選択されたモードの性能が満足なものではない場合、エラー測定に基づいて、更に高いビットレートモードが適用されると共に、その動作が繰り返される（閉ループ決定）。

同様の手法が、以下文書において説明される。

「＊“Variable rate speech coding for UMTS” Cellario, L.; Sereno, D.; Speech Coding for Telecommunications, 1993. Proceedings, IEEE Workshop, 1993 Page(s):1-2」

「“Phonetically-based vector excitation coding of speech at 3.6 kbps” Wang, S.; Gersho, A.; Acoustics, Speech, and Signal Processing, 1989. ICASSP-89 1989 International Conference, 23-26 May 1989 Page(s): 49-52 vol.1」

「＊“A modified CS-ACELP algorithm for variable-rate speech coding robust in noisy environments” Beritelli, F.; IEEE Signal Processing Letters, Volume: 6 Issue: 2, February 1999 Page(s): 31-34」

開ループの第１の選択は、入力信号の分類（音声の、もしくは、有声／無声の分類)の後で実行され、その後で下記のいずれかに関して閉ループ決定が実行される。
・完全な符号器に関して（その場合には、全スピーチセグメントが再び符号化される）。
または、
・上記のアスタリスク（＊）が最初に付与された参照文献のように、符号化の一部分に関して（その場合には、使用されるべき辞書が閉ループ処理によって選択される）。

上記を参照する研究の全ては、複合的符号化を回避するか、もしくは並列に使用されるべき符号器の数を削減する、演繹的選択または事前選択の全体的使用、あるいは部分的使用によって、最適モード選択の複雑さの問題を解決することを模索する。

しかしながら、符号化の複雑さを減少させる従来技術は、過去に提案されなかった。

本発明は、この状況を改善することを模索する。

この目的を実行するために、それぞれが一連の機能ユニットを備える複数の符号器に対して、入力信号が、各符号器による前記入力信号の圧縮符号化を目的として並列に供給される複合的圧縮符号化方法を提案する。

本発明の方法は、以下の準備段階を含む。
ａ）各符号器を構成する機能ユニット、及び各機能ユニットにより実行される１つ以上の機能を特定する段階。
ｂ）１つの符号器から別の符号器まで共通する機能を選出する段階。
ｃ）共通の計算モジュール内の少なくともいくつかの符号器に関して、前記共通する機能を最終的に実行する段階。

本発明の有利な実施例において、上述の段階は、これを実行するためのプログラム命令を含むソフトウェア製品によって実行される。この点に関して、本発明は、同様に、特にコンピュータ、または移動端末機内のプロセッサユニットのメモリ内、もしくは前記プロセッサユニットの読み取り機と協同するように構成される取り外し可能なメモリ媒体内に記憶されるように構成される上述の種類のソフトウェア製品を対象にする。

本発明は、同様に、本発明の方法を実行すると共に、前掲の種類のソフトウェア製品の命令を記憶するように構成されるメモリを備えるための圧縮符号化補助システムを対象にする。

本発明の他の特徴、及び利点は、以下の詳細な記述を読むと共に、添付された図面を検討すると明白になる。

まず図１ａを参照すると、それは、それぞれ入力信号“ｓ_０”を受信すると共に、並列状態にある複数の符号器“Ｃ０、Ｃ１、．．．ＣＮ”を表す。各符号器は、連続する符号化段階を実行すると共に、最終的に符号化されたビットストリーム“ＢＳ０、ＢＳ１、．．．ＢＳＮ”を供給するための機能ユニット“ＢＦ１”から機能ユニット“ＢＦｎ”を備える。マルチモード符号化の応用システムにおいて、符号器“Ｃ０”から符号器“ＣＮ”までの出力は、最適モード選択モジュール“ＭＭ”に接続されていると共に、最適符号器から先に送られるのは、ビットストリーム“ＢＳ”である（図１ａにおける点線の矢印）。

簡単化のために、図１ａの例における全ての符号器は、同じ数の機能ユニットを備えているが、しかし、実際上、全ての符号器において、全てのこれらの機能ユニットが必ずしも提供されるとは限らないということが理解されなければならない。

いくつかの機能ユニット“ＢＦｉ”は、１つのモード（または、符号器）から別のものまで、多くの場合同じである。別のものは、量子化される層のレベルだけが異なる。同様のモデルを利用するか、もしくは物理的に信号と連結されたパラメータを計算する同じ符号化系列から提供される符号器を使用する場合、同様に、使用可能な関係が存在する。

本発明は、複合的符号化動作の複雑さを削減するために、これらの関係を活用することを目的とする。

本発明は、第一に各々の符号器を構成する機能ユニットを識別することを提案する。符号器の間の技術的な類似は、その場合に、機能が同等であるか、もしくは類似している機能ユニットを考察することによって活用される。各々のそれらのユニットに関して、本発明は、以下のことを提案する。
・“共通の”動作を定義すると共に、全ての符号器のために、それらを１度だけ実行すること。
及び、
・各符号器に特有であると共に、特に前述の共通計算の結果を用いる計算方法を使用すること。

これらの計算方法は、完全な符号化によって生成された結果と異なるかもしれない結果を生成する。その場合に、目的は、実際には、特に共通計算によって供給された利用可能な情報を活用することによって処理を加速することである。計算を加速するためのこのような方法は、トランスコーディング動作の複雑さを削減するための技術（例えば、“知的なトランスコーディング”として知られている技術）において使用される。

図１ｂは、提案された解決法を示す。本例において、前掲の“共通”動作は、獲得された結果を、少なくともいくつかの符号器に対して、もしくは好ましくは全ての符号器に対して再分配する独立モジュール“ＭＩ”内において、少なくともいくつかの符号器のために、及び好ましくは全ての符号器のために、１度だけ実行される。従って、それは、符号器“ＣＯ”から符号器“ＣＮ”までの少なくともいくつかの符号器の間で、獲得された結果を共用すること（これは“相互化（ｍｕｔｕａｌｉｚａｔｉｏｎ）”として以下で言及される）の問題である。上記で定義されたように、前述の種類の独立モジュール“ＭＩ”は、複合的圧縮符号化補助システムの一部を形成することができる。

有利な変形においては、外部の計算モジュール“ＭＩ”を使用するよりむしろ、同じ符号器または複数の個別の符号器における現行の１つの機能ユニット、または複数の機能ユニット“ＢＦ１”から機能ユニット“ＢＦｎ”が使用されると共に、１つの符号器、または複数の符号器は、後述される基準に従って選択される。

本発明は、当然ながら関係のある機能ユニットの役割に従って異なる可能性がある複数の方法を使用することができる。

第１の方法は、他の全てのモードに関するパラメータ検索に集中するために、最も低いビットレートを有する符号器のパラメータを使用する。

第２の方法は、最も高いビットレートを有する符号器のパラメータを使用すると共に、その場合に、次第に最も低いビットレートを有する符号器まで等級を下げる。

もちろん、もし優先権が特別な符号器に与えられるべきである場合、その符号器を使用して信号セグメントを符号化することが可能であると共に、その場合に、前述の２つの方法を適用することによって、更に高いビットレートの符号器、及び更に低いビットレートの符号器を得ることが可能である。

もちろん、ビットレート以外の基準が、検索を制御するために使用され得る。例えば、いくらかの機能ユニットに関して、そのパラメータが効率的な抽出（または分析）、及び／または他の符号器の同様のパラメータの符号化に最もよく適している符号器に優先権が与えられ得ると共に、有効性が、複雑さ、または品質、または２つの間のトレードオフに従って判断される。

符号器内に存在しないが、しかし全ての符号器に関係する機能ユニットのパラメータの更に効率的な符号化を可能にする独立符号化モジュールが、同様に作成され得る。

様々な実現方法は、マルチモード符号化の場合に特に有益である。図１ｃで示されるこの状況において、本発明は、ビットストリーム“ＢＳ”を転送する前に例えば最後のモジュール“ＭＭ”により最後の段階において実行される符号器の後天的な選択に先行する計算の複雑さを削減する。

マルチモード符号化のこの特別な場合において、図１ｃにおいて示される本発明の変形は、各符号化段階の後に（従って、相互に競争すると共に、選択されたブロック“ＢＦｉｃｃ”に関して生じる結果が後で使用されることになる機能ユニット“ＢＦｉ１”から機能ユニット“ＢＦｉＮ_１”の後に）部分的選択モジュール“ＭＳＰｉ”（ここで、ｉ＝１、２、．．．、Ｎ）を導入する。このように、異なるモードの類似は、各機能ユニットの計算を加速するために活用される。この場合、必ずしも全ての符号化方式が、必ずしも評価されるとは限らないであろう。

上記で示された機能ユニット内の分割に基づくマルチモード構造の更に洗練された変形が、次に図１ｄを参照して説明される。図１ｄのマルチモード構造は、格子（trellis）を通過し得る複数の経路を提供する“格子”構造である。実際、図１ｄは、格子を通過し得る全ての経路を示すと共に、従ってツリー形状を有する。格子の各経路は、機能ユニットの動作モードの組み合わせによって定義されると共に、各機能ユニットは、次の機能ユニットの存在し得る複数の変形に信号を供給する。

このように、各符号化モードは、機能ユニットの動作モードの組み合わせから得られると共に、機能ユニット１は、“Ｎ_１”動作モードを有しており、機能ユニット２は、“Ｎ_２”動作モードを有しており、ユニットＰまで同様に動作モードを有している。“ＮＮ”の組み合わせ＝“Ｎ_１×Ｎ_２×．．．×Ｎ_Ｐ”の可能な組み合わせは、従って、端から端までで“ＮＮ”モードを有する完全なマルチモード符号器を定義している“ＮＮ”ブランチを有する格子によって表される。格子のいくつかのブランチは、削減されたブランチ数を有するツリーを定義するために、演繹的に消去され得る。この構造の第１の特別な特徴は、所定の機能ユニットに関して、前の機能ユニットの各出力に関する共通の計算モジュールを提供することである。これらの共通の計算モジュールは、同じ動作を実行するが、信号が異なる前のユニットから来るので、異なる信号に関して同じ動作を実行する。同じレベルの共通の計算モジュールは、有利に相互化される（mutualized）と共に、次のモジュールによって使用できる所定のモジュールからの結果は、それらの次のモジュールに供給される。第二に、各機能ユニットの処理の後に続く部分的選択処理は、有利に、選択された基準に対して最も低い性能を提供するブランチの除去を可能にする。このように、評価されるべき格子のブランチ数は、削減され得る。

このマルチモード格子構造の１つの有利な応用システムは、以下のとおりである。

もし機能ユニットが、ビットレートに特有のそれぞれのパラメータを使用して、それぞれの異なるビットレートで動作する傾向がある場合、所定の機能ユニットに関して、符号化の前後関係によれば、選択された格子の経路は、最も低いビットレートの機能ユニットを通過する経路であるか、または最も高いビットレートの機能ユニットを通過する経路であると共に、最も低い（または最も高い）ビットレートを有する機能ユニットから得られた結果は、最も高い（または個々に最も低い）ビットレートを有する符号器に至るまで、少なくともいくつかの他の機能ユニットに関する集中的なパラメータ検索を通じて、少なくともいくつかの他の機能ユニットのビットレートに適合させられる。

代りに、所定のビットレートの機能ユニットが選択されると共に、その機能ユニットに特有の少なくともいくつかのパラメータは、集中的な検索によって最も高いビットレートで動作することができる符号器に至るまで、そして集中的な検索によって最も低いビットレートで動作することができる符号器に至るまで、次第に適合させられる。

これは、一般的に複合的符号化と関係がある複雑さを削減する。

本発明は、マルチメディアコンテンツの複合的符号化を使用するあらゆる圧縮技術に適用される。オーディオ（発話、及び音）圧縮の分野における３つの実施例が、以下で説明される。最初の２つの実施例は、以下の参照文書が関係する変形符号器の系列に関するものである。

「“Perceptual Coding of Digital Audio”, Painter, T.; Spanias, A.; Proceedings of the IEEE, Vol. 88, No 4, April 2000」

第３の実施例は、以下の参照文書が関係するＣＥＬＰ符号器に関するものである。

「“Code Excited Linear Prediction (CELP) : High quality speech at very low bit rates” Schroeder M.R.; Atal B.S.; Acoustics, Speech, and Signal Processing, 1985. Proceedings. 1985 IEEE International Conference, Page(s): 937-940」

これらの２つの符号化系列の主な特性の要約が最初に与えられる。

「＊変換、またはサブバンド符号器」
これらの符号器は、心理的音響の基準に基づいていると共に、一組の係数を獲得するために、時間領域で信号のブロックを変換する。それらの変換は、時間−周波数タイプ（time-frequency type）の変換であり、最も広く使用されている変換の内の１つは、修正離散コサイン変換（modified discrete cosine transform：ＭＤＣＴ）である。それらの係数が量子化される前に、アルゴリズムは、できる限り量子化雑音が聞き取れないようにビットを割り当てる。ビット割り当て、及び係数量子化は、考察されたスペクトルの各ラインに関して、その周波数における音が聞き取れるために必要な振幅を表すマスキングしきい値を評価するために使用される、心理的音響モデルから獲得されたマスキング曲線を使用する。図２は、周波数領域の符号器の構成図である。機能ユニットの形式におけるその構造が明らかに示される点に注意が必要である。図２を参照すると、主要な機能ユニットは、以下のユニットである。
・入力デジタルオーディオ信号“ｓ_０”に関する時間／周波数変換を実行するためのユニット２１。
・変換された信号から知覚モデルを決定するためのユニット２２。
・概念モデルに関して動作する量子化及び符号化ユニット２３。
及び、
・コード化されたオーディオストリーム“Ｓ_ｔｃ”を獲得するために、ビットストリームをフォーマットするためのユニット２４。

「＊合成符号器による分析（ＣＥＬＰ符号化）」
合成タイプによる分析器の符号器において、符号器は、符号化されるべき信号を作っているパラメータを抽出するために、復元された信号の合成モデルを使用する。それらの信号は、８キロヘルツ（ｋＨｚ）（３００〜３４００ヘルツ（Ｈｚ）の電話帯域）の周波数で、もしくは、更に高い周波数で、例えば広げられた帯域符号化（broadened band coding）（５０［Ｈｚ］から７［ｋＨｚ］までの帯域幅）のための１６［ｋＨｚ］で、サンプリング（標本化）され得る。応用システム、及び必要とされた品質に応じて、圧縮比は、１から１６まで変化する。これらの符号器は、電話帯域における２キロビットパーセコンド（ｋｂｐｓ）から１６［ｋｂｐｓ］までのビットレート、及び広げられた帯域における６［ｋｂｐｓ］から３２［ｋｂｐｓ］までのビットレートで動作する。図３は、最も広く現在使用される合成符号器による分析器であるＣＥＬＰデジタル符号器の主要な機能ユニットを示す。スピーチ信号“ｓ_０”は、サンプリングされると共に、Ｌサンプルを含む一連のフレームに変換される。各フレームは、ディレクトリ（辞書とも呼ばれる）から抽出されると共に、利得を掛けられた波形を、適切な時期に変化する２つのフィルタを介してフィルタ処理することによって合成される。固定励振辞書（fixed excitation dictionary）は、Ｌサンプルの波形の有限集合である。第１のフィルタは、長期間予測（long-term prediction：ＬＴＰ）フィルタである。ＬＴＰ分析は、有声音の周期的な性質を活用する、この長期予測変数のパラメータを評価すると共に、調和成分が、適応辞書の形（ユニット３２）でモデル化される。第２のフィルタは、短期間予測フィルタである。線形予測符号化（Linear prediction coding：ＬＰＣ）分析法は、声道の伝達関数、及び信号のスペクトルのエンベロープの特性を表す短期間予測パラメータを獲得するために使用される。革新シーケンスを決定するために使用される方法は、合成法による分析であると共に、それは、以下のように、“符号器において、固定励振辞書から提供される多数の革新シーケンスは、ＬＰＣフィルタ（図３における機能ユニット３４の合成フィルタ）によってフィルタ処理される”、と要約され得る。適応励振は、前もって同様の方法で獲得された。選択された波形は、一般的にＣＥＬＰ基準として知られている知覚による加重基準（機能ユニット３６）と対照して判断されたとき、最も原信号に近い合成信号を生成する（機能ユニット３５のレベルでエラーを最小化する）波形である。

図３のＣＥＬＰ符号器の構成図において、有声音の基本周波数（“ピッチ（pitch）”）は、機能ユニット３１におけるＬＰＣ分析に起因する信号から抽出されると共に、それ以降、調和（harmonic）励振、もしくは適応励振（Ｅ．Ａ．）と呼ばれる、機能ユニット３２において抽出されるべき成分の長期間の相関を可能にする。最終的に、残りの信号は、通常、全ての位置が、固定励振（Ｅ．Ｆ．）ディレクトリと呼ばれる機能ユニット３３におけるディレクトリに事前に定義される少しのパルスによってモデル化される。

復号化は、符号化よりずっと複雑ではない。復号器は、逆多重化後に、符号器によって生成されたビットストリームから、各パラメータの量子化インデックスを獲得し得る。信号は、その場合に、パラメータを復号化すると共に、合成モデルを適用することによって復元され得る。

図２において示されたタイプの変換符号器を発端に、前記の３つの実施例が以下で示される。

「＊第１の実施例：“ＴＤＡＣ”符号器への応用」
第１の実施例は、特に米国特許出願公開第2001/027393号明細書において示された“ＴＤＡＣ”知覚の周波数領域符号器に関するものである。ＴＤＡＣ符号器は、１６［ｋＨｚ］（広げられた帯域信号）でサンプリングされたデジタルオーディオ信号を符号化するために使用される。図４ａは、この符号器の主要な機能ユニットを示す。オーディオ信号“ｘ（ｎ）”は、７［ｋＨｚ］に帯域制限されると共に、１６［ｋＨｚ］でサンプリングされて、３２０サンプル（２０［ｍｓ］）のフレームに分割される。修正離散コサイン変換（ＭＤＣＴ）が、５０［％］のオーバラップによって６４０サンプルを含む入力信号のフレームに適用されると共に、従ってＭＤＣＴ分析は２０［ｍｓ］毎にリフレッシュされる（機能ユニット４１）。スペクトルは、最後の３１個の係数をゼロに設定する（最初の２８９個の係数のみがゼロでない）ことによって、７２２５［Ｈｚ］に制限される。マスキング曲線は、このスペクトルから決定される（機能ユニット４２）と共に、全てのマスクされた係数はゼロに設定される。そのスペクトルは、同等でない幅の３２個の帯域に分割される。あらゆるマスクされた帯域は、信号の変換された係数の関数として決定される。倍率を獲得するために、ＭＤＣＴ係数のエネルギーは、スペクトルの各帯域に関して計算される。量子化された信号のスペクトル包絡線を構成する３２個の倍率は、（機能ユニット４３において）エントロピー符号化によって符号化されると共に、最終的に符号化されたフレーム“Ｓ_ｃ”で送信される。

（機能ユニット４４における）動的なビット割り当ては、スペクトル包絡線の復号化されると共に逆量子化されたバージョンから計算された、各帯域に関するマスキング曲線に基づいている（機能ユニット４２）。これは、符号器及び復号器によるビット割り当てを互換性がある状態にする。各帯域における正規化されたＭＤＣＴ係数は、その場合に、タイプII順列コードの組み合わせから構成される大きさで交互配置された（size-interleaved）辞書を使用して、ベクトル量子化によって（機能ユニット４５において）量子化される。最終的に、図４ｂを参照すると、調性に関する情報（ここでは、１ビット“Ｂ_１”に符号化される）と有声に関する情報（ここでは、１ビット“Ｂ_０”に符号化される）、スペクトル包絡線“ｅ_ｑ（ｉ）”、及び符号化された係数“ｙ_ｑ（ｊ）”は、（機能ユニット４６において：図４ａ参照）フレーム内に多重化されて送信される。

この符号器は、いくつかのビットレートで動作することができると共に、従って、マルチビットレート（multiple bit rate：複合的ビットレート）符号器、例えば１６［ｋｂｐｓ］、２４［ｋｂｐｓ］、そして３２［ｋｂｐｓ］のビットレートを提供する符号器を生成することが提案される。この符号化方式において、以下の機能ユニットは、様々なモードの間で共同利用され得る。
・ＭＤＣＴ（機能ユニット４１）。
・有声の検出（機能ユニット４７、図４ａ）、及び調性の検出（機能ユニット４８、図４ａ）。
・スペクトル包絡線の計算、量子化、及びンエントロピー符号化（機能ユニット４３）。及び、
・係数によるマスキング曲線係数の計算、及び各帯域に関するマスキング曲線の計算（機能ユニット４２）。

これらのユニットは、符号化処理によって実行された処理の複雑さの６１．５［％］を占める。異なるビットレートに対応する複数のビットストリームを生成する場合、それらの因数分解は、従って、複雑さを削減することに関する主要な関心事である。

上述の機能ユニットから提供される結果は、既に、有声、調性、及び符号化されたスペクトル包絡線に関する情報を伝送するビットを備える全ての出力ビットストリームに共通の第１の部分をもたらす。

この実施例の第１の変形において、考察されたビットレートの各々と対応する出力ビットストリームの各々に関して、ビット割り当て、及び量子化動作を実行することが可能である。これらの２つの動作は、ＴＤＡＣ符号器において通常実行されるのと正確に同じ方法で実行される。

更に進歩した変形である、図５に示されたこの実施例の第２の変形において、（前掲の米国特許出願公開第2001/027393号明細書において説明されたように、）更に複雑さを削減すると共に、特定の動作、特に以下の動作を相互化するために、“知的な”トランスコーディング技術が使用され得る。
・ビット割り当て（機能ユニット４４）。
及び、
・係数量子化（機能ユニット４５＿ｉ、以下を参照）。

図５において、（“相互化される”（mutualized））符号器の間で共用される機能ユニット４１、機能ユニット４２、機能ユニット４７、機能ユニット４８、機能ユニット４３、及び機能ユニット４４は、図４ａで示された１つのＴＤＡＣ符号器の機能ユニットと同じ照合番号を有している。特に、ビット割り当て機能ユニット４４は、複数の経路において使用されると共に、割り当てられたビットの数は、各符号器が実行する変換量子化（transquantization）（機能ユニット４５＿１，．．．，４５＿（Ｋ−２），４５＿（Ｋ−１）”、以下参照）のために調整される。更に、これらの変換量子化は、選択されたインデックス０の符号器（ここで示された例における最も低いビットレートを有する符号器）のための量子化機能ユニット４５＿０によって獲得された結果を利用することに注意する必要がある。それらは、全て、同じ有声及び調性に関する情報と、同じ符号化されたスペクトル包絡線を使用するけれども、最終的に、実際の相互関係なしで動作する符号器の唯一の機能ユニットは、多重化機能ユニット４６＿０，４６＿１，．．．，４６＿（Ｋ−２），４６＿（Ｋ−１）である。この点に関しては、多重化の部分的な相互化が再度実行され得ると言えば十分である。

ビット割り当て及び量子化機能ユニットに関して使用される方法は、“Ｋ−１”個の他のビットストリーム（ｋ）（１≦ｋ＜Ｋ）に関して対応する２つの機能ユニットの動作を加速するために、最も低いビットレート“Ｄ_０”においてビットストリーム（０）に関して獲得されたビット割り当て及び量子化機能ユニットから提供される結果を、活用することにある。各ビットストリームに関して（そのユニットに関する因数分解なしで）ビット割り当て機能ユニットを使用するが、しかしいくらかの次の量子化動作を相互化するマルチビットレート符号化方式が、同様に考察され得る。

上述された複合的符号化技術は、一般的に、ネットワークのノードにおいて、符号化されたオーディオストリームのビットレートを削減するために、知的なトランスコーディングに有利に基づいている。

ビットストリームｋ（０≦ｋ＜Ｋ）は、以下の増加するビットレート順序（Ｄ_０＜Ｄ_１＜．．．＜Ｄ_Ｋ−１）に分類される。従って、ビットストリーム０は、最も低いビットレートに対応する。

「＊ビット割り当て」
ＴＤＡＣ符号器におけるビット割り当ては、２つの段階によって実行される。第一に、好ましくは下記数１式を用いて、各帯域に割り当てるべきビットの数が計算される。

ここで、

は、定数であり、Ｂは、利用可能なビットの総数であり、Ｍは、帯域の数であり、“ｅ_ｑ（ｉ）”は、帯域ｉを横断するスペクトル包絡線の復号化されると共に、逆量子化された値であり、そして“Ｓ_ｂ（ｉ）”は、その帯域に関するマスキングしきい値である。

獲得された各々の値は、最も近い自然整数（natural integer）に四捨五入される。もし割り当てられた全ビットレートが利用可能なビットレートに必ずしも等しくない場合、第２の段階が、好ましくは、知覚の基準に基づく一連の反復動作を用いて、帯域にビットを追加するか、または帯域からビットを除去する調整を実行する。

従って、もし分配されたビットの総数が利用可能なビットの総数より少ない場合、最初の帯域割り当てと、最後の帯域割り当てとの間の“noise-to-mask”比率（noise-to-mask ratio）の変化によって判断された最も大きい知覚の向上を見せる帯域にビットが追加される。ビットレートは、最も大きい変化を示す帯域に関して増加される。分配されたビットの総数が利用可能なビットの総数より多い反対の状況においては、帯域からのビットの抽出は、前述の手続きの２つの部分から成る。

ＴＤＡＣ符号器に対応するマルチビットレート符号化方式においては、ビットの割り当てのための特定の動作を因数分解することが可能である。従って、前述の方程式を使用する決定の第１の段階が、最も低いビットレート“Ｄ_０”に基づいて、一度だけ実行され得る。ビットを追加することによる調整の段階は、その場合に連続して実行され得る。一度分配されたビットの総数が、ビットストリームｋ（ｋ＝１、２．．．、Ｋ−１）のビットレートに対応する数に達すれば、現在の配分は、そのビットストリームの各帯域に関する正規化された係数ベクトルを量子化するために使用されるものであると考察される。

「＊係数量子化」
係数量子化のために、ＴＤＡＣ符号器は、タイプII順列コードの組み合わせから構成される大きさで交互配置された辞書（size-interleaved dictionary）を利用するベクトル量子化を使用する。この種類の量子化は、帯域を横断するＭＤＣＴ係数の各々のベクトルに適用される。この種類のベクトルは、前もって、その帯域を横断するスペクトル包絡線の逆量子化された値を用いて正規化される。以下の表記法が使用される。

・Ｃ（ｂ_ｉ，ｄ_ｉ）は、ビット数ｂ_ｉ、及び次元ｄ_ｉに対応する辞書である。
・Ｎ（ｂ_ｉ，ｄ_ｉ）は、その辞書における要素の数である。
・ＣＬ（ｂ_ｉ，ｄ_ｉ）は、そのリーダー（leader）のセットである。
そして、
・ＮＬ（ｂ_ｉ，ｄ_ｉ）は、リーダーの数である。

フレームの各帯域ｉに関する量子化の結果は、ビットストリームで送信される符号語“ｍ_ｉ”である。それは、以下の情報から計算された辞書における量子化されたベクトルのインデックスを表す。

・現在のリーダーである

に最も近い量子化されたリーダーベクトルである

の辞書Ｃ（ｂ_ｉ，ｄ_ｉ）のリーダーのセットＣＬ（ｂ_ｉ，ｄ_ｉ）の中の数“Ｌ_ｉ”。

・リーダーである

の階層における“Ｙ_ｑ（ｉ）”の階級“ｒ_ｉ”。

・“Ｙ_ｑ（ｉ）”（または、

）に適用されるべき符号“ｓｉｇｎ_ｑ（ｉ）”の組み合わせ。

以下の表記法が使用される。

・“Ｙ（ｉ）”は、帯域ｉの正規化された係数の絶対値のベクトルである。

・“ｓｉｇｎ（ｉ）”は、帯域ｉの正規化された係数の符号のベクトルである。

・

は、減少する順序（対応する順列は、表示された“ｐｅｒｍ（ｉ）”である）でその要素を並べることによって獲得された前掲のベクトル“Ｙ（ｉ）”のリーダーベクトルである。

・“Ｙ_ｑ（ｉ）”は、“Ｙ（ｉ）”（または、辞書“Ｃ（ｂ_ｉ，ｄ_ｉ）”における「“Ｙ（ｉ）”の最も近い仲間」）の量子化されたベクトルである。

以下で、指数ｋを有する表記法“α^（ｋ）”は、符号器のビットストリームｋを獲得するために実行される処理において使用されるパラメータを表す。この指数がないパラメータは、最終的にビットストリーム０に関して計算される。それらは、関係のあるビットレート（または、モード）から独立している。

上記で参照される辞書の“交互配置”特性は、同様に

と共に、以下の式

のように表される。

は、

における

の補数である。

その基数は、

に等しい。

ビットストリームｋの各々に関する帯域ｉの係数のベクトルの量子化の結果である符号語

（ここで、Ｏ≦ｋ＜Ｋである）は、以下のように獲得される。

・ビットストリームｋ＝０に関して、通常通りの量子化動作が、ＴＤＡＣ符号器において通常に実行される。それは、符号語

を構成するために使用されるパラメータ

、

、及び

を生成する。

ベクトル

、及び“ｓｉｇｎ（ｉ）”は、このステップにおいて同様に決定される。

それらは、他のビットストリームに関する次のステップにおいてもし必要な場合に使用されるべき、対応する順列“ｐｅｒｍ（ｉ）”と共に、メモリに格納される。

・ビットストリーム“１≦ｋ＜Ｋ”に関して、ｋ＝１からｋ＝Ｋ−１まで、好ましくは以下のステップを使用する付加的アプローチが採用される。

もし

である場合、その場合には以下のようになる。

１．帯域ｉを横断する、ビットストリームｋのフレームの符号語は、ビットストリーム（ｋ−１）のフレームの符号語と同じである：

もしそうでなければ、すなわち、もし

の場合には以下のようになる。

２．

のリーダー

は、

の最も近い仲間を検索される。

３．ステップ２の結果を与えられて、

における

の最も近い仲間を把握し、

内の

の最も近い仲間が、

内にあるか（これは、以下で説明される“Ｆｌａｇ＝０”の状況である）、または

内にあるか（これは、以下で説明される“Ｆｌａｇ＝１”の状況である）を決定するために、テストが実行される。

４．もしＦｌａｇ＝０（最も近い

内の

のリーダーが、同様に、

内のそれの最も近い仲間である）の場合、その場合に、

である。

もしＦｌａｇ＝１（ステップ２において発見された

内の

に最も近いリーダーが、同様に、

内のそれの最も近い仲間である）場合、

をその数にさせ（ここで、

である）、そして以下のステップが実行される。

ａ．例えば、ｐｅｒｍ（ｉ）を使用する“Schalkwijk”アルゴリズムを利用して、

（リーダーである

の階層における新しい量子化されたベクトルＹ（ｉ））の階級

を検索する。

ｂ．“ｓｉｇｎ（ｉ）”、及び“ｐｅｒｍ（ｉ）”を使用して、

を決定する。

ｃ．

、

、及び

から、符号語

を決定する。

「＊第２の実施例：ＭＰＥＧ−１レイヤI＆II変換符号器への適用」
図６ａで示されるＭＰＥＧ−１レイヤI＆II符号器は、入力オーディオ信号ｓ_０に時間／周波数変換を適用するために、３２個の均一のサブバンドを有するフィルタのバンクを使用する（図６ａ、及び図７における機能ユニット６１）。各サブバンドの出力サンプルは、量子化される（機能ユニット６２）前に、グループ化されて、そして共通の倍率（機能ユニット６７によって決定される）によって正規化される。各サブバンドに関して使用される均一スカラー量子化器（uniform scalar quantizer）のレベルの数は、ビットの配分を決定するために、量子化雑音を可能な限り微小なものとする心理的音響モデル（機能ユニット６４）を使用する、（機能ユニット６３によって実行される）動的なビット割り当て手続きの結果である。標準において提案されたヒアリングモデルは、高速フーリエ変換（ＦＦＴ）を時間領域の入力信号に適用する（機能ユニット６５）ことによって獲得されたスペクトルの推定に基づいている。図６ｂを参照すると、図６ａにおける機能ユニット６６によって多重化された、最後に送信されるフレームｓ_ｃは、ヘッダフィールドＨ_Ｄの後に、主要な情報を表す、量子化されたサブバンドＥ_ＳＢの全てのサンプルと、倍率Ｆ_Ｅ及びビット割り当て因子Ａ_ｉから構成される、復号化動作のために使用される補足的な情報とを含む。

この符号化方式からスタートして、本発明の１つの応用システムにおいて、マルチビットレート符号器は、以下の機能ユニットを共同利用することによって構成され得る（図７を参照）。

・分析フィルタのバンクのユニット６１。
・倍率の決定のユニット６７。
・ＦＦＴ計算のユニット６５。
そして、
・心理的音響モデルを使用するマスキングしきい値決定のユニット６４。

機能ユニット６４、及び機能ユニット６５は、前々から、ビット割り当て手続き（図７における機能ユニット７０）のために使用される“signal-to-mask”比率（図６ａ、及び図７における矢印ＳＭＲ）を供給する。

図７において示される実施例においては、ビット割り当てのために使用される手続きを、それにいくらかの修正を加えて共同利用することによって、活用することが可能である（図７におけるビット割り当て機能ユニット７０）。量子化機能ユニット６２＿０〜６２＿（Ｋ−１）だけが、その場合に、ビットレートＤ_ｋ（０≦ｋ＜Ｋ−１）に対応する各ビットストリームに特有である。同じことが、多重化ユニット６６＿０〜６６＿（Ｋ−１）にも当てはまる。

「＊ビット割り当て」
ＭＰＥＧ−１レイヤI＆II符号器において、ビット割り当ては、以下のとおりに、好ましくは対話型ステップの連続によって実行される。

ステップ０：サブバンドｉ（０≦ｉ＜Ｍ）の各々に関して、ビットの数ｂ_ｉをゼロに初期化する。

ステップ１：サブバンドＮＭＲ（ｉ）＝ＳＭＲ（ｉ）−ＳＮＲ（ｂ_ｉ）の各々を横断するひずみ関数ＮＭＲ（ｉ）（“noise-to-mask”比率）を更新する。ここで、ＳＮＲ（ｂ_ｉ）は、多数のビットｂ_ｉを有する量子化器に対応する信号対雑音比（signal-to-noise ratio）であり、そしてＳＭＲ（ｉ）は、心理的音響モデルによって供給された“signal-to-mask”比率である。

ステップ２：サブバンドｉ_０のビットの数

をインクリメントすると共に、この歪みは、最大値で

であり、ここで、εは、一般的に１に等しいと考えられる帯域に基づいて、正の整数値である。

ステップ１及びステップ２は、使用中のビットレートに対応する利用可能なビットの総数が分配されるまで繰り返される。これの結果は、ビット配分ベクトル（ｂ_０，ｂ_１，．．．，ｂ_Ｍ−１）である。

複合的ビットレート符号化方式において、特に、これらのステップは、いくらかの他の修正を加えることによって、共同利用される。

・機能ユニットの出力は、Ｋビット配分ベクトル

（０≦ｋ＜Ｋ−１）から構成されると共に、ベクトル

は、ステップ１、及びステップ２の反復において、ビットストリームｋのビットレートＤ_ｋに対応する利用可能なビットの総数が分配されたときに獲得される。

・ステップ１、及びステップ２の反復は、最も高いビットレートＤ_Ｋ−１に対応する利用可能なビットの総数が完全に分配されたときに停止される（ビットストリームはビットレートが増加する順である）。

ビット配分ベクトルが、ｋ＝０からｋ＝Ｋ−１まで連続して獲得される点に注意が必要である。従って、ビット割り当て機能ユニットのＫ個の出力は、所定のビットレートのビットストリームの各々のための量子化機能ユニットに供給される。

「＊第３の実施例：ＣＥＬＰ符号器への適用」
最後の実施例は、３ＧＰＰ標準に適合する電話帯域スピーチ符号器である、後天的な決定の３ＧＰＰのＮＢ−ＡＭＲ（Narrow-Band Adaptive Multi-Rate：狭帯域適応マルチレート）符号器を使用したマルチモードスピーチ（multimode speech）の符号化に関係する。この符号器は、その理論が簡潔に上述される有名なＣＥＬＰ符号器の系列に属していると共に、全て代数的な符号励振線形予測（ＡＣＥＬＰ：algebraic code excited linear prediction）技術に基づく、１２．２［ｋｂｐｓ］から４．７５［ｋｂｐｓ］までの８つのモード（または、ビットレート）を有する。図８は、機能ユニットの形態で、この符号器の符号化方式を示す。この構造は、４つＮＢ−ＡＭＲモード（７．４；６．７；５．９；５．１５）に基づく後天的な決定のマルチモード符号器を生成するために活用された。

第１の変形においては、同じ機能ユニットの相互化のみが活用される（４つの符号化の結果は、その場合に、並列状態にある４つの符号化の結果と同じである)。

第２の変形においては、その複雑さは、更に削減される。特定のモードに関して、同じではない機能ユニットの計算は、別のモードの計算、もしくは共通の処理モジュールの計算を活用することによって加速される（以下を参照）。このような方法で相互化される４つの符号化による結果は、その場合に、並列状態にある４つの符号化の結果とは異なる。

更なる変形において、これらの４つのモードの機能ユニットは、図１ｄを参照して上述されたマルチモードトレリス符号化のために使用される。

３ＧＰＰのＮＢ−ＡＭＲ符号器の４つのモード（７．４；６．７；５．９；５．１５）は、以下で簡潔に説明される。

３ＧＰＰのＮＢ−ＡＭＲ符号器は、３．４［ｋＨｚ］に帯域制限され、８［ｋＨｚ］でサンプリングされると共に、２０［ｍｓ］のフレームに分割された（１６０個のサンプル）スピーチ信号に関して動作する。各フレームは、２つずつ１０［ｍｓ］の“スーパーサブフレーム”（８０個のサンプル）にグループ化された、４つの５［ｍｓ］サブフレーム（４０個のサンプル）を含む。全てのモードに関して、パラメータのモデル化、及び／または量子化に関する変形を伴ってはいるが、同じ種類のパラメータが信号から抽出される。ＮＢ−ＡＭＲ符号器においては、５種類のパラメータが、分析されて、符号化される。線スペクトルペア（line spectral pair：ＬＳＰ）パラメータは、１２．２のモード（従って、スーパーサブフレーム毎に１度）を除いて、全てのモードに関して、１フレーム毎に１度処理される。他のパラメータ（特に、ＬＴＰ遅延、適応励振利得（adaptive excitation gain）、固定励振（fixed excitation）、及び固定励振利得（fixed excitation gain）は、１サブフレーム毎に１度処理される。

ここで考察された４つのモード（７．４；６．７；５．９；５．１５）は、主にそれらのパラメータの量子化に関して異なる。これらの４つのモードのビット割り当ては、以下の表１に要約される。

ＮＢ−ＡＭＲ符号器のこれらの４つのモード（７．４；６．７；５．９；５．１５）は、正確に同じモジュール、例えば前処理モジュール、線形予測係数分析モジュール、及び加重信号計算モジュールを使用する。信号の前処理は、オーバフローを妨げるために、入力信号の２つに分割された部分と結合されたＤＣ成分を消去するための８０［Ｈｚ］のカットオフ周波数による高域通過フィルタ処理である。ＬＰＣ分析は、ウィンドウイングサブモジュール（windowing submodule）、自己相関計算サブモジュール、“Levinson-Durbin”のアルゴリズム実装サブモジュール、“Ａ（ｚ）→ＬＳＰ”変換サブモジュール、過去のフレームのＬＳＰと現在のフレームのＬＳＰと間の補間によって、各サブフレームに関する非量子化パラメータＬＳＰ_ｉ（ｉ＝０，．．．，３）を計算するためのサブモジュール、及び逆の“ＬＳＰ_ｉ→Ａ_ｉ（ｚ）”変換サブモジュールを含む。

加重スピーチ信号を計算することは、知覚の加重フィルタ（Ｗ_ｉ（ｚ）＝Ａ_ｉ（ｚ／γ_１）／Ａ_ｉ（ｚ／γ_２））によってフィルタ処理することであり、ここで、Ａ_ｉ（ｚ）は、インデックスｉのサブフレームの非量子化フィルタであると共に、γ_１＝０．９４、そしてγ_２＝０．６である。

他の機能ユニットは、モードの内の３つ（７．４；６．７；５．９）だけに関して、同じである。例えば、これらの３つのモードのために、加重信号に関する開ループＬＴＰ遅延検索が、１スーパーサブフレーム毎に１度実行される。しかしながら、５．１５のモードに関して、それは１フレーム毎に１度だけ実行される。

同様に、もし４つのモードが、正規化された周波数領域において、ＬＳＰパラメータの抑制された平均、及びデカルト積（Cartesian product）の一次予測加重ベクトルのＭＡ（移動平均：moving average）量子化を使用した場合、５．１５［ｋｂｐｓ］モードのＬＳＰパラメータは、２３ビットに量子化されると共に、他の３つのモードのＬＳＰパラメータは２６ビットに量子化される。正規化された周波数領域への変換の後で、ＬＳＰパラメータのデカルト積毎の“split VQ”ベクトル量子化は、１０個のＬＳＰパラメータを、それぞれ大きさ３、大きさ３、及び大きさ４の３つのサブベクトルに分割する。最初の３つのＬＳＰから成る第１のサブベクトルは、４つのモードに関して、同じ辞書を使用して８ビットに量子化される。次の３つのＬＳＰから成る第２のサブベクトルは、３つの高ビットレートモードに関しては、大きさ５１２（９ビット）の辞書を使用して量子化されると共に、５．１５のモードに関しては、その辞書の半分（２つで１つのベクトル）を使用して量子化される。最後の４つのＬＳＰから成る第３の、そして最後のサブベクトルは、３つの高ビットレートモードに関しては、大きさ５１２（９ビット）の辞書を使用して量子化されると共に、より低いビットレートモードに関しては、大きさ１２８（７ビット）の辞書を使用して量子化される。４つのモードに関して、正規化された周波数領域への変換、二次の誤差基準（誤差規範）の重みの計算、及び量子化されるべきＬＳＰ剰余の移動平均（ＭＡ）予測は、正確に同じである。ＬＳＰを量子化するために３つの高ビットレートモードが同じ辞書を使用するので、同じベクトル量子化モジュールに加えて、過去のフレームの量子化されたＬＳＰと現在のフレームの量子化されたＬＳＰとの間の補間によって、各サブフレームに関して量子化されたＬＳＰ^Ｑ _ｉの計算（ｉ＝０,．．．,３）、そして最終的に逆変換“ＬＳＰ^Ｑ _ｉ→Ａ^Ｑ _ｉ（ｚ）”と同様に、それらは（正規化された周波数領域からコサイン領域まで戻すために）逆変換を共用することができる。

適応励振、及び固定励振閉ループ検索は、連続して実行されると共に、加重合成フィルタのインパルス応答と、そして対象信号の事前計算を必要とする。加重合成フィルタのインパルス応答（Ａ_ｉ（ｚ／γ_１）／［Ａ^Ｑ _ｉ（ｚ）Ａ_ｉ（ｚ／γ_２）］）は、３つの高ビットレートモード（７．４；６．７；５．９）に関して、正確に同じである。各サブフレームに関して、適応励振に関する対象信号の計算は、（モードとは無関係に）加重信号、（３つのモードに関して正確に同じである）量子化されたフィルタ“Ａ^Ｑ _ｉ（ｚ）”、及び（最初のサブフレームを除いた各サブフレームに関して異なる）サブフレームの過去によって変わる。各サブフレームに関して、固定励振に関する対象信号は、先行する対象信号から、そのサブフレームのフィルタ処理された適応励振の寄与部分（それは、最初の３つのモードの最初のサブフレームを除いて、１つのモードと他のモードとの間で異なる）を減じることによって獲得される。

３冊の適応辞書が、使用される。７．４；６．７；５．９のモードの偶数のサブフレーム（ｉ＝０及び２）に関して使用されると共に、５．１５のモードの最初のサブフレームに関して使用される第１の辞書は、範囲［１９＋１／３，８４＋２／３］においては１／３分解能の、そして範囲［８５，１４３］において完全な分解能の、２５６個の断片的な絶対遅延を備えている。この絶対遅延辞書を検索することは、開ループモードにおいて発見される遅延（５．１５のモードに関しては±５の間隔、他のモードに関しては±３の間隔）の周辺に集中させられる。７．４；６．７；５．９のモードの最初のサブフレームに関して、対象信号及び開ループ遅延は同じであり、閉ループ検索の結果も同様に同じである。他の２つの辞書は、差動式タイプの辞書であると共に、現在の遅延と、先行するサブフレームの断片的な遅延に最も近い全体の遅延Ｔ_ｉ−１との間の差異を符号化するために使用される。７．４のモードの奇数のサブフレームに関して使用される５ビットの第１の差動式辞書は、範囲［Ｔ_ｉ−１−５＋２／３，Ｔ_ｉ−１＋４＋２／３］においては、全体の遅延Ｔ_ｉ−１に関する１／３分解能の辞書である。第１の差動式辞書に含まれる４ビットの第２の差動式辞書は、６．７そして５．９のモードの奇数のサブフレームに関して、そして５．１５のモードの最後の３つのサブフレームに関して使用される。この第２の辞書は、範囲［Ｔ_ｉ−１−５，Ｔ_ｉ−１＋４］においては、全体の遅延Ｔ_ｉ−１に関する完全な分解能の辞書であり、更に、範囲［Ｔ_ｉ−１−１＋２／３，Ｔ_ｉ−１＋２／３］においては、１／３の分解能の辞書である。

固定辞書は、有名なＡＣＥＬＰ辞書の系列に属している。ＡＣＥＬＰディレクトリの構造は、交互配置された単一パルス順列（ＩＳＰＰ：interleaved single-pulse permutation）思想に基づいていると共に、それはＬ個の位置のセットをＫ個の交互配置されたトラックに分割することであり、Ｎ個のパルスが特定の事前に定義されたトラックに配置される。表２ａで示されたように、７．４のモード、６．７のモード、５．９のモード、及び５．１５のモードは、サブフレームの４０個のサンプルを５個の交互配置された長さ８のトラックに分割するという同じ分割を使用する。７．４のモード、６．７のモード、そして５．９のモードに関して、表２ｂは、辞書のビットレート、パルスの数、及びトラックにおけるそれらの配分を示す。９ビットを有するＡＣＥＬＰ辞書の５．１５のモードの２つのパルスの配分は、更に抑制される。

適応励振利得、及び固定励磁利得は、ＣＥＬＰ基準を最小限にする共同のベクトル量子化（固定励振利得には、ＭＡ予測も適用される）によって、７ビットまたは６ビットに量子化される。

「＊同じ機能ユニットの相互化のみを活用する後天的な決定によるマルチモード符号化」
以下で示された機能ユニットを共同利用する後天的な決定のマルチモード符号器は、上述の符号化方式に基づくことができる。

図８を参照すると、４つのモードに関して、以下の処理が共通に実行される。

・前処理（機能ユニット８１）。
・線形予測係数の分析（自己相関のウィンドウイング（windowing）及び計算（機能ユニット８２）、“Levinson-Durbin”のアルゴリズムの実行（機能ユニット８３）、“Ａ（ｚ）→ＬＳＰ”変換の実行（機能ユニット８４）、ＬＳＰ補間及び逆変換（機能ユニット８６２））。
・加重入力信号の計算（機能ユニット８７）。
・（機能ユニット８５における）ＬＳＰパラメータの正規化された周波数領域への変換、ＬＳＰのベクトル量子化に関する二次の誤差基準（誤差規範）の重みの計算、ＬＳＰ剰余のＭＡ予測、最初の３つのＬＳＰのベクトル量子化。

従って、全てのこれらのユニットに関する累積的な複雑さは４で割られる。

高い方の３つのビットレートモード（７．４、６．７、及び５．９）に関して、以下の処理が実行される。

・（図８の機能ユニット８５における）（１フレーム毎に１度の）最後の７個のＬＳＰのベクトル量子化。
・（１フレーム毎に２度の）開ループＬＴＰ遅延検索（機能ユニット８８）。
・量子化ＬＳＰ補間（機能ユニット８６１）、及び（各サブフレームに関する）フィルタＡ^Ｑ _ｉへの逆変換。
そして、
・（各サブフレームに関する）加重合成フィルタのインパルス応答の計算（機能ユニット８９）。

これらのユニットに関して、それらの計算は２回だけで、もはや４回実行されず、１回は高い方の３つのビットレートモードに関して実行され、１回は低いビットレートモードに関して実行される。従って、それらの複雑さは２で割られる。

高い方の３つのビットレートモードにおいては、同様に、最初のサブフレームに関して、閉ループＬＴＰ検索（機能ユニット８８１）と共に、固定励振に関するの対象信号の計算（図８における機能ユニット９１）、及び適応励振に関する対象信号の計算（機能ユニット９０）を相互化することが可能である。最初のサブフレームに関する動作の相互化が、後天的な決定のマルチモードタイプの複合的符号化の状況においてのみ、同じ結果を生成する点に注意が必要である。複合的符号化の一般的な状況において、最初のサブフレームの過去は、ビットレートに従って異なり、他の３つのサブフレームに関して、これらの動作は、一般的に、この場合には異なる結果を生成する。

「＊進化した後天的な決定のマルチモード符号化」
同一でない機能ユニットは、別のモードの機能ユニット、または共通の処理モジュールを活用することによって加速され得る。（品質、及び／または複雑さに関する）応用システムの制限に応じて、異なる変形が使用され得る。いくつかの例が、以下で説明される。それは、同様に、ＣＥＬＰ符号器の間の知的なトランスコーディング技術に依存することが可能である。

「＊第２のＬＳＰサブベクトルのベクトル量子化」
ＴＤＡＣ符号器の実施例と同様に、特定の辞書を交互配置することは、計算を加速し得る。従って、５．１５のモードの第２のＬＳＰのサブベクトルの辞書が、他の３つのモードの辞書に含まれるので、従って、４つのモードによるそのサブベクトルＹの量子化が有利に結合され得る。

ステップ１：（大きな辞書の半分に対応する）最も小さな辞書における最も近い仲間Ｙ_１を検索する。
・５．１５に関して、Ｙ_１はＹを量子化する。

ステップ２：大きな辞書における片割れ（すなわち、辞書のもう一方の半分）における最も近い仲間Ｙ_ｈを検索する。

ステップ３：９ビット辞書におけるＹの最も近い仲間が、Ｙ_１（“Ｆｌａｇ＝０”）であるか、またはＹ_ｈ（“Ｆｌａｇ＝１”）であるかどうかを検査する。
・“Ｆｌａｇ＝０”：Ｙ_１が、同様に、７．４のモード、６．７のモード、及び５．９のモードに関して、Ｙを量子化する。
・“Ｆｌａｇ＝１”：Ｙ_ｈが、７．４のモード、６．７のモード、及び５．９のモードに関して、Ｙを量子化する。

この実施例は、同じ結果を非最適化マルチモード符号化に与える。もし量子化の複雑さが更に削減されるべきである場合、我々は、ステップ１で停止すると共に、もしそのベクトルがＹに十分に近いと思われるならば、Ｙ_１を高ビットレートモードに関する量子化されたベクトルとみなすことができる。この単純化は、従って、徹底的な検索と異なる結果を生成することができる。

「＊開ループＬＴＰ検索の加速性」
５．１５のモードの開ループＬＴＰ遅延検索は、検索結果を他のモードに関して使用することができる。もし２つのスーパーサブフレームに関して発見された２つの開ループ遅延が、差分符号化を可能にするのに十分に近い場合、５．１５のモードの開ループ検索は実行されない。より高いモードの結果が、その代りに使用される。もしそうでなければ、それらのオプションは、以下のようになる。

・標準の検索を実行すること。
または、
・フレーム全体に対する開ループ検索を、より高いモードによって発見された２つの開ループ遅延の周辺に集中させること。

逆に、５．１５のモードの開ループ遅延検索（open loop delay search）は、同様に、最初に実行され得ると共に、２つのより高いモードの開ループ遅延検索は、５．１５のモードによって決定された値の周辺に集中させられる。

図１ｄに示される３番目の、そして更に進化した実施例において、機能ユニットの多くの組み合わせを可能にするマルチモードトレリス符号器が生成されると共に、各機能ユニットは、少なくとも２つの動作モード（または、ビットレート）を備える。この新しい符号器は、前掲のＮＢ−ＡＭＲ符号器の４ビットレート（５．１５；５．９０；６．７０；７．４０）から構成される。この符号器において、４つの機能ユニットは、ＬＰＣ機能ユニット、ＬＴＰ機能ユニット、固定励振機能ユニット、及び利得機能ユニットとして区別される。上記の表１を参照すると、以下の表３ａは、これらの機能ユニットの各々に関して、そのビットレートの数、及びそのビットレートを要約する。

従って、Ｐ＝４の機能ユニット、及び２×３×４×２＝４８通りの可能な組み合わせがある。特にこの実施例においては、機能ユニット２の高ビットレート（ＬＴＰビットレートが２６ビット／フレーム）は考察されない。もちろん、他の選択が可能である。

このような方法で獲得されたマルチビットレート符号器は、３２個の可能なモードと共に、ビットレートに関する高い精度を備えている（表３ｂを参照）。しかしながら、その結果生じる符号器は、前掲のＮＢ−ＡＭＲ符号器と相互作用することができない。表３ｂにおいて、ＮＢ−ＡＭＲ符号器の５．１５のビットレート、５．９０のビットレート、及び６．７０のビットレートに対応するモードが太字（ボールド体）で表されると共に、機能ユニットＬＴＰの最も高いビットレートの除外は、７．４０のビットレートを消去する。

この符号器は、３２個の可能なビットレートを有すると共に、使用されるモードを識別するために５ビットが必要である。前の変形と同様に、機能ユニットは、相互化される。異なる符号化方法が、異なる機能ユニットに適用される。

例えば、ＬＳＰ量子化を含む機能ユニット１に関しては、上述のように、そして以下のように、優先権が低ビットレートに対して与えられる。

・この機能ユニットと関連付けられた２つのビットレートに関して、最初の３つのＬＳＰで構成される第１のサブベクトルは、同じ辞書を使用して８ビットに量子化される。

・次の３つのＬＳＰで構成される第２のサブベクトルは、最も低いビットレートを有する辞書を使用して８ビットに量子化される。その辞書は、より高いビットレートの辞書の半分に対応すると共に、３つのＬＳＰと、辞書において選択された要素との間の距離が特定のしきい値を越える場合に限り、検索が辞書のもう一方の半分で実行される。

・最後の４つのＬＳＰで構成される第３の、そして最後のサブベクトルは、大きさ５１２（９ビット）の辞書、及び大きさ１２８（７ビット）の辞書を用いて量子化される。

一方、上述のように、第２の変形（進化した後天的な決定によるマルチモード符号化に対応する）においては、機能ユニット２に関して、高いビットレートに優先権（ＬＴＰ遅延）を与えるように、選択が実行される。ＮＢ−ＡＭＲ符号器において、開ループＬＴＰ遅延検索（open loop LTP delay search）は、２４ビットのＬＴＰ遅延に関して、１フレーム毎に２度実行されると共に、２０ビットのＬＴＰ遅延に関して、１フレーム毎に１度だけ実行される。その目的は、この機能ユニットに関して、高ビットレートに優先権を与えることである。従って、開ループＬＴＰ遅延計算は、以下の方法で実行される。

・２つの開ループ遅延が、２つのスーパーサブフレーム（supersubframe）に関して計算される。もし、差動符号化を可能にするほど、それらが十分に近い場合、開ループ検索は、全体のフレームでは実行されない。２つのスーパーサブフレームに関する結果が、その代りとして使用される。

・もしそれらが十分に近くない場合、開ループ検索が、前もって発見された２つの開ループ遅延の周辺に集中して、フレーム全体に渡って実行される。複雑さを削減する変形は、それらの内の第１の開ループ遅延のみを保持する。

特定の機能ユニットの後で検討されるべき組み合わせの数を削減するために、部分的選択をすることが可能である。例えば、機能ユニット１（ＬＰＣ）の後で、もし２３ビットモードの性能が十分に近い場合、２６ビットを有する組み合わせがこのブロックで消去され得るか、もしくはその性能があまりにも２６ビットモードと比べると低下する場合、２３ビットモードが消去され得る。

従って、本発明は、相互化すると共に、様々な符号器によって実行される計算を加速することによって、複合的符号化の複雑さの問題に対する効果的な解決法を与え得る。従って、符号化構造は、実行される処理動作を説明する機能ユニットを用いて描写されることができる。複合的符号化に使用される、異なる形の符号化の機能ユニットは、本発明が活用する強い関係を有している。異なる符号化が同じ構造の異なるモードに対応するとき、それらの関係は特に強い。

最終的に、複雑さの観点から本発明が柔軟であることに注意が必要である。演繹的に複合的符号化の最大の複雑さを決定すると共に、検討された符号器の数を、複雑さの関数として適応させることが、実際可能である。

並列に配置された複数の符号器を示す本発明の応用システムの状況の図である。並列に配置された複数の符号器の間で共用される機能ユニットを備えた本発明の応用システムの図である。マルチモード符号化において共用される機能ユニットを備えた本発明の応用システムの図である。マルチモードトレリス符号化に対する本発明の応用システムの図である。知覚の周波数領域符号器のメイン機能ユニットの図である。合成符号器による分析器のメイン機能ユニットの図である。ＴＤＡＣ符号器のメイン機能ユニットの図である。図４ａの符号器によって符号化されたビットストリームのフォーマットの図である。並列状態の複数のＴＤＡＣ符号器に適用された本発明の有利な実施例の図である。ＭＰＥＧ−１（レイヤI、及びレイヤII）符号器のメイン機能ユニットの図である。図６ａの符号器によって符号化されたビットストリームのフォーマットの図である。並列状態に配置された複数のＭＰＥＧ−１（レイヤI、及びレイヤII）符号器に適用された本発明の有利な実施例の図である。３ＧＰＰ標準に適合する合成符号器によるＮＢ−ＡＭＲ分析器の機能ユニットを更に詳細に示す図である。

符号の説明

Ｃ０、Ｃ１、．．．ＣＮ符号器
ＢＳ０、ＢＳ１、．．．ＢＳＮ符号化されたビットストリーム
ＢＦ１〜ＢＦｎ機能ユニット
Ｃ０〜ＣＮ符号器
ＭＭ最適モード選択モジュール
ＢＦｉ機能ユニット
ＭＩ独立モジュール
ＢＦｉｃｃ選択されたブロック
ＢＦｉ１〜ＢＦｉＮ_１機能ユニット
ＭＳＰｉ部分的選択モジュール
２１機能ユニット（時間／周波数変換）
２２機能ユニット（知覚モデルの決定）
２３機能ユニット（量子化及び符号化）
２４機能ユニット（ビットストリームのフォーマット）
３１機能ユニット（ＬＰＣ分析）
３２機能ユニット（適応励振辞書）
３３機能ユニット（固定励振辞書）
３４機能ユニット（合成フィルタ）
３５機能ユニット（エラーの最小化）
３６機能ユニット（ＣＥＬＰ基準／知覚による加重基準）
４１機能ユニット（ＭＤＣＴ）
４２機能ユニット（マスキング曲線）
４３機能ユニット（スペクトル包絡線の符号化）
４４機能ユニット（動的なビット割り当て）
４５機能ユニット（係数のベクトル量子化）
４６機能ユニット（多重化）
４７機能ユニット（有声の検出）
４８機能ユニット（調性の検出）
Ｂ_０有声に関する情報
Ｂ_１調性に関する情報
ｅ_ｑ（ｉ）スペクトル包絡線
ｙ_ｑ（ｊ）符号化されたＭＤＣＴ係数
４５＿０量子化０
４５＿１機能ユニット（変換量子化１）
４５＿（Ｋ−２）機能ユニット（変換量子化Ｋ−２）
４５＿（Ｋ−１）機能ユニット（変換量子化Ｋ−１）
４６＿０，４６＿１，．．．，４６＿（Ｋ−２），４６＿（Ｋ−１）機能ユニット（多重化）
６１機能ユニット（分析フィルタバンク）
６２機能ユニット（量子化）
６３機能ユニット（ビット割り当て）
６４機能ユニット（心理的音響モデル）
６５機能ユニット（高速フーリエ変換）
６６機能ユニット（多重化）
６７機能ユニット（倍率決定）
６２＿０機能ユニット（量子化０）
６２＿（Ｋ−２）機能ユニット（量子化Ｋ−２）
６２＿（Ｋ−１）機能ユニット（量子化Ｋ−１）
６６＿０機能ユニット（多重化）
６６＿（Ｋ−２）機能ユニット（多重化）
６６＿（Ｋ−１）機能ユニット（多重化）
７０機能ユニット（ビット割り当て）
８１機能ユニット（前処理）
８２機能ユニット（自己相関のウィンドウイング及び計算）
８３機能ユニット（“Levinson-Durbin”のアルゴリズム）
８４機能ユニット（“Ａ（ｚ）→ＬＳＰ”変換）
８５機能ユニット（ＬＳＰのベクトル量子化）
８６１機能ユニット（量子化ＬＳＰ補間）
８６２機能ユニット（ＬＳＰ補間及び逆変換）
８７機能ユニット（加重入力信号の計算）
８８機能ユニット（開ループＬＴＰ遅延検索）
８８１機能ユニット（閉ループＬＴＰ検索）
８９機能ユニット（インパルス応答の計算）
９０機能ユニット（適応励振に関する対象信号の計算）
９１機能ユニット（固定励振に関する対象信号の計算）

Claims

それぞれが一連の機能ユニットを備える複数の符号器に対して、入力信号が、各符号器による前記入力信号の圧縮符号化を目的として並列に供給される複合的圧縮符号化方法であって、
前記方法が、
ａ）各符号器を構成する機能ユニット、及び各機能ユニットにより実行される１つ以上の機能を特定する段階と、
ｂ）１つの符号器から別の符号器まで共通する機能を選出する段階と、
ｃ）共通の計算モジュール内の少なくともいくつかの符号器に関して、前記共通する機能を最終的に実行する段階という準備段階を含む
ことを特徴とする複合的圧縮符号化方法。
前記計算モジュールが、前記符号器の内の１つにおける１つ以上の機能ユニットから構成される
ことを特徴とする請求項１に記載の方法。
前記段階ｃ）において実行される各機能のために、前記複数の符号器から選択される符号器の少なくとも１つの機能ユニットが使用されると共に、
前記選択される符号器の機能ユニットが、複雑さと符号化品質との間で最高の基準を立証する他の符号器による効率的な符号化のために、部分的な結果を他の符号器に配信するように構成される
ことを特徴とする請求項２に記載の方法。
前記符号器が、それぞれの異なるビットレートで動作する傾向があり、
前記選択される符号器が、最も低いビットレートを有する符号器であると共に、
前記段階ｃ）において選択された符号器に特有のパラメータによる機能の実行後に得られた結果が、最も高いビットレートを有する符号器に至るまで、少なくともいくつかの他のモードに関する集中的なパラメータ検索によって、少なくともいくつかの他の符号器のビットレートに適合させられる
ことを特徴とする請求項３に記載の方法。
前記符号器が、それぞれの異なるビットレートで動作するように構成され、
前記選択される符号器が、最も高いビットレートを有する符号器であると共に、
前記段階ｃ）において選択された符号器に特有のパラメータによる機能の実行後に得られた結果が、最も高いビットレートを有する符号器に至るまで、少なくともいくつかの他のモードに関する集中的なパラメータ検索によって、少なくともいくつかの他の符号器のビットレートに適合させられる
ことを特徴とする請求項３に記載の方法。
所定のビットレートで動作する符号器の機能ユニットが、そのビットレートのための計算モジュールとして使用されると共に、
その符号器に特有の少なくともいくつかのパラメータが、集中的な検索によって最も高いビットレートを有する符号器に至るまで、そして集中的な検索によって最も低いビットレートを有する符号器に至るまで、次第に適合させられる
ことを特徴とする、請求項５と結合された請求項４に記載の方法。
様々な符号器の機能ユニットが、格子内に存在し得る複数の経路を有する格子状に配置され、
前記格子内の各経路が、前記機能ユニットの動作モードの組み合わせによって定義されると共に、
各機能ユニットが、次の機能ユニットの存在し得る複数の変形に信号を供給する
ことを特徴とする請求項１に記載の方法。
１つ以上の機能ユニットによって実行される各符号化段階の後に、部分的選択モジュールが提供されると共に、
前記部分的選択モジュールが、次の符号化段階のために、それらの機能ユニットの１つ以上によって供給された結果を選択することが可能である
ことを特徴とする請求項７に記載の方法。
前記機能ユニットが、前記ビットレートに特有のそれぞれのパラメータを使用して、それぞれの異なるビットレートで動作する傾向があり、
所定の機能ユニットに関して、前記格子内で選択された経路は最も低いビットレートの機能ユニットを通過する経路であると共に、
前記最も低いビットレートの機能ユニットから得られた結果が、最も高いビットレートを有する符号器に至るまで、少なくともいくつかの他の機能ユニットに関する集中的なパラメータ検索によって、少なくともいくつかの他の機能ユニットのビットレートに適合させられる
ことを特徴とする請求項７に記載の方法。
前記機能ユニットが、前記ビットレートに特有のそれぞれのパラメータを使用して、それぞれの異なるビットレートで動作する傾向があり、
所定の機能ユニットに関して、前記格子内で選択された経路は最も高いビットレートの機能ユニットを通過する経路であると共に、
前記最も高いビットレートの機能ユニットから得られた結果が、最も低いビットレートを有する符号器に至るまで、少なくともいくつかの他の機能ユニットに関する集中的なパラメータ検索によって、少なくともいくつかの他の機能ユニットのビットレートに適合させられる
ことを特徴とする請求項７に記載の方法。
前記符号器の機能ユニットのパラメータと関連付けられた所定のビットレートに関して、前記所定のビットレートで動作する機能ユニットが、計算モジュールとして使用されると共に、
その機能ユニットに特有の少なくともいくつかのパラメータが、集中的な検索によって最も高いビットレートで動作することができる符号器に至るまで、そして集中的な検索によって最も低いビットレートで動作することができる符号器に至るまで、次第に適合させられる
ことを特徴とする、請求項１０と結合された請求項９に記載の方法。
前記計算モジュールが、前記符号器から独立していると共に、前記段階ｃ）において得られた結果を全ての符号器に再分配するように構成される
ことを特徴とする請求項１に記載の方法。
独立モジュールと、前記符号器の内の少なくとも１つにおける１つの機能ユニットまたは複数の機能ユニットとが、前記段階ｃ）において得られた結果をお互いに交換するように構成されると共に、
前記計算モジュールが、異なる符号器の機能ユニットの間の適応トランスコーディングを実行するように構成される
ことを特徴とする、請求項２と結合された請求項１２に記載の方法。
独立モジュールが、少なくとも部分的符号化機能ユニット、及び適応トランスコーディング機能ユニットを含む
ことを特徴とする請求項１２、または請求項１３のいずれか一項に記載の方法。
並列の符号器が、マルチモード符号化を処理するように構成されると共に、
前記符号器の内の１つを選択することが可能である後天的選択モジュールが提供される
ことを特徴とする請求項１から請求項１４のいずれか一項に記載の方法。
１つ以上の機能ユニットによって実行される各符号化段階の後に、前記符号器から独立していると共に、１つ以上の符号器を選択することが可能である部分的選択モジュールが供給される
ことを特徴とする請求項１５に記載の方法。
前記符号器が、変換タイプの符号器であり、
前記計算モジュールが、全ての符号器の間で共有されたビット割り当て機能ユニットを備えると共に、
特にそのビットレートの関数として１つの符号器に関して実行される各ビット割り当て処理の後に、その符号器に対する適応処理が続いている
ことを特徴とする請求項１から請求項１６のいずれか一項に記載の方法。
その結果が全ての符号器に供給される量子化段階を更に含む、
ことを特徴とする請求項１７に記載の方法。
全ての符号器に共通の段階を更に含み、前記共通の段階が、
・時間−周波数（ＭＤＣＴ）変換段階と、
・入力信号における有声の検出段階と、
・調性の検出段階と、
・マスキング曲線の決定段階と、
・スペクトル包絡線の符号化段階と
を含むことを特徴とする請求項１８に記載の方法。
前記符号器がサブバンド（ＭＰＥＧ−１）符号化を実行すると共に、
全ての符号器に共通の段階を更に含み、前記共通の段階が、
・分析フィルタのバンクの適用段階と、
・倍率の決定段階と、
・スペクトルの変換（ＦＦＴ）計算段階と、
・心理的音響のモデルに基づくマスキングしきい値の決定段階と
を含むことを特徴とする請求項１７に記載の方法。
前記符号器が、合成（ＣＥＬＰ）タイプによる分析の符号器であると共に、
全ての符号器に共通の段階を更に含み、前記共通の段階が、
・前処理段階と、
・線形予測係数分析段階と、
・加重入力信号計算段階と、
・少なくともいくつかのパラメータに関する量子化段階と
を含むことを特徴とする請求項１から請求項１６のいずれか一項に記載の方法。
前記部分的選択モジュールが、短期（ＬＰＣ）パラメータに関する分割ベクトル量子化段階の後で使用される
ことを特徴とする、請求項１６と結合された請求項２１に記載の方法。
前記部分的選択モジュールが、共有された開ループの長期（ＬＴＰ）パラメータ検索段階の後で使用される
ことを特徴とする、請求項１６と結合された請求項２１に記載の方法。
特にコンピュータ、または移動端末機内のプロセッサユニットのメモリ内、もしくは前記プロセッサユニットの読み取り機と協同するように構成される取り外し可能なメモリ媒体内に記憶されるように構成されるソフトウェア製品であって、
請求項１から請求項２３のいずれか一項に記載のトランスコーディング方法を実行するための命令を備える
ことを特徴とするソフトウェア製品。
それぞれが一連の機能ユニットを備える複数の符号器に対して、入力信号が、各符号器による前記入力信号の圧縮符号化の目的のために並列に供給される複合的圧縮符号化を支援するためのシステムであって、
請求項２４に記載のソフトウェア製品の命令を記憶するように構成されるメモリを備える
ことを特徴とするシステム。
請求項１２から請求項１６、そして請求項２２及び請求項２３のいずれか一項に記載の方法を実行するための独立計算モジュール（ＭＩ）を備える
ことを特徴とする請求項２５に記載のシステム。