JP2014519044A

JP2014519044A - 線形予測係数量子化方法、サウンド符号化方法、線形予測係数逆量子化方法、サウンド復号化方法、その記録媒体及び電子機器

Info

Publication number: JP2014519044A
Application number: JP2014506341A
Authority: JP
Inventors: ソン，ホ−サン; オ，ウン−ミ
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2011-04-21
Filing date: 2012-04-23
Publication date: 2014-08-07
Anticipated expiration: 2032-04-23
Also published as: JP2017203997A; US20150162017A1; MX354812B; CN105719654A; ZA201308709B; AU2016203627B2; US20120278069A1; JP6178305B2; US10229692B2; CN105513602A; WO2012144878A2; TW201729182A; TWI672691B; TW201243828A; TWI591621B; MX2013012300A; RU2675044C1; CN105719654B; CN103620676A; BR112013027093B1

Abstract

低複雑度で効率的にＬＰＣ係数を量子化するために、入力信号の予測モード、予測エラー及び伝送チャンネル状態のうち少なくとも一つを考慮し、入力信号について、フレーム間予測を使用しない第１量子化スキームと、入力信号について、フレーム間予測を使用する第２量子化スキームとのうち一つを介して、該入力信号が量子化されるように制御する段階を含む。

Description

本発明は、線形予測係数量子化及び逆量子化に係り、さらに具体的には、低い複雑度で線形予測係数を効率的に量子化する方法、それを採用するサウンド符号化方法、線形予測係数逆量子化方法、それを採用するサウンド復号化方法、電子機器並びにその記録媒体に関する。

音声あるいはオーディオのようなサウンド符号化システムでは、サウンドの短区間周波数特性を表現するために、線形予測符号化（ＬＰＣ：linear predictive coding）係数が使われる。ＬＰＣ係数は、入力サウンドをフレーム単位に分け、各フレーム別に予測誤差のエネルギーを最小化させる形態で求められる。ところで、ＬＰＣ係数は、ダイナミックレンジが大きく、使用されるＬＰＣフィルタの特性が、ＬＰＣ係数の量子化エラーに非常に敏感であり、フィルタの安定性が保証されるものではない。

そのために、ＬＰＣ係数を、フィルタの安定性確認が容易であり、補間に有利であり、量子化特性が良好である他の係数に変換して量子化を行うが、主に、線スペクトル周波数（ＬＳＦ：line spectral frequency）あるいはイミッタンススペクトル周波数（ＩＳＦ：immittance spectral frequency）に変換して量子化することが好まれている。特に、ＬＳＦ係数の量子化技法は、周波数領域及び時間領域で有するＬＳＦ係数のフレーム間の高相関度を利用することにより、量子化利得を高めることができる。

ＬＳＦ係数は、短区間サウンドの周波数特性を示し、入力サウンドの周波数特性が急変するフレームの場合、当該フレームのＬＳＦ係数も急変する。ところで、ＬＳＦ係数のフレーム間の高相関度を利用するフレーム間予測器を含む量子化器の場合、急変するフレームについては、適切な予測が不可能であって量子化性能が落ちる。従って、入力サウンドの各フレーム別信号特性に対応して最適化された量子化器を選択する必要がある。

本発明が解決しようとする課題は、低複雑度で、ＬＰＣ係数を効率的に量子化する方法、それを採用するサウンド符号化方法、ＬＰＣ係数逆量子化方法、それを採用するサウンド復号化方法、その記録媒体及び電子機器を提供するところにある。

前記課題を解決するための本発明の一実施形態による量子化方法は、入力信号に対して、フレーム間予測を使用しない第１量子化スキームを利用して量子化する段階と、前記入力信号に対して、前記フレーム間予測を使用する第２量子化スキームを利用して量子化する段階と、前記入力信号の予測モード、予測エラー及びチャンネル状態のうち少なくとも一つを考慮し、前記第１量子化スキームと、前記第２量子化スキームとのうち一つを介して、前記入力信号が量子化されるように制御する段階と、を含む。

前記課題を解決するための本発明の一実施形態によるサウンド符号化方法は、入力信号の符号化モードを決定する段階と、前記入力信号の予測モード、予測エラー及びチャンネル状態のうち少なくとも一つを考慮し、フレーム間予測を使用しない第１量子化スキームと、フレーム間予測を使用する第２量子化スキームとのうち一つを利用して量子化する段階と、前記第１量子化スキームと、前記第２量子化スキームとのうち一つを介して量子化された入力信号を、前記符号化モードに対応して符号化する段階と、前記第１量子化スキームによって量子化された結果と前記第２量子化スキームによって量子化された結果のうち一つ、前記入力信号の前記符号化モード、及び前記入力信号の量子化と係わる経路情報を含むビットストリームを生成する段階と、を含む。

前記課題を解決するための本発明の一実施形態による逆量子化方法は、入力信号に対して、フレーム間予測を使用しない第１逆量子化スキームを利用して逆量子化する段階と、前記入力信号に対して、前記フレーム間予測を使用する第２逆量子化スキームを利用して逆量子化する段階と、ビットストリームに含まれた経路情報に基づいて、前記第１逆量子化スキームと、前記第２逆量子化スキームとのうち一つを介して、前記入力信号が逆量子化されるように制御する段階と、を含み、前記ビットストリームに含まれた経路情報は、符号化端で、前記入力信号の予測モード、予測エラー及びチャンネル状態のうち少なくとも一つを考慮して決定する。

前記課題を解決するための本発明の一実施形態によるサウンド復号化方法は、ビットストリームに含まれた線形予測符号化パラメータと符号化モードとを復号化する段階と、前記ビットストリームに含まれた経路情報に基づいて、線形予測符号化パラメータに対して、フレーム間予測を使用しない第１逆量子化スキームと、前記フレーム間予測を使用する第２逆量子化スキームとのうち一つを利用して逆量子化する段階と、前記逆量子化された線形予測符号化パラメータを、前記復号化された符号化モードに対応して復号化する段階と、を含み、前記ビットストリームに含まれた経路情報は、符号化端で、入力信号の予測モード、予測エラー及びチャンネル状態のうち少なくとも一つを考慮して決定される。

前記課題を解決するための本発明の一実施形態による量子化器タイプ決定方法は、入力信号のビット率を第１基準値と比較する段階と、前記入力信号の帯域を第２基準値と比較する段階と、内部サンプリング周波数を第３基準値と比較する段階と、前記一つ以上の比較結果に基づいて、前記入力信号の量子化器タイプを開ループ並びに閉ループのうち一つに決定する段階と、を含む。

前記課題を解決するための本発明の一実施形態による電子機器は、サウンド信号と、符号化されたビットストリームとのうち少なくとも一つを受信したり、あるいは符号化されたサウンド信号と、復元されたサウンドとのうち少なくとも一つを送信する通信部；及び前記サウンド信号の予測モード、予測エラー及びチャンネル状態のうち少なくとも一つを考慮し、フレーム間予測を使用しない第１量子化スキームと、フレーム間予測を使用する第２量子化スキームとのうち一つを介して、前記サウンド信号を量子化し、前記量子化されたサウンド信号を、符号化モードに対応して符号化する符号化モジュール；を含む。

前記課題を解決するための本発明の他の実施形態による電子機器は、サウンド信号と、符号化されたビットストリームとのうち少なくとも一つを受信したり、あるいは符号化されたサウンド信号と、復元されたサウンドとのうち少なくとも一つを送信する通信部；及び前記ビットストリームに含まれた線形予測符号化パラメータと符号化モードとを復号化し、前記ビットストリームに含まれた経路情報に基づいて、フレーム間予測を使用しない第１逆量子化スキームと、前記フレーム間予測を使用する第２逆量子化スキームとのうち一つを利用して、前記復号化された線形予測符号化パラメータを逆量子化し、前記逆量子化された線形予測符号化パラメータを、前記復号化された符号化モードに対応して復号化する復号化モジュール；を含み、前記経路情報は、符号化端で、前記サウンド信号の予測モード、予測エラー及びチャンネル状態のうち少なくとも一つを考慮して決定される。

前記課題を解決するための本発明のさらに他の実施形態による電子機器は、サウンド信号と、符号化されたビットストリームとのうち少なくとも一つを受信したり、あるいは符号化されたサウンド信号と、復元されたサウンドとのうち少なくとも一つを送信する通信部；前記サウンド信号の予測モード、予測エラー及びチャンネル状態のうち少なくとも一つを考慮し、フレーム間予測を使用しない第１量子化スキームと、フレーム間予測を使用する第２量子化スキームとのうち一つを介して、前記サウンド信号を量子化し、前記量子化されたサウンド信号を、符号化モードに対応して符号化する符号化モジュール；及び前記ビットストリームに含まれた線形予測符号化パラメータと符号化モードとを復号化し、前記ビットストリームに含まれた経路情報に基づいて、フレーム間予測を使用しない第１逆量子化スキームと、前記フレーム間予測を使用する第２逆量子化スキームとのうち一つを利用して、前記復号化された線形予測符号化パラメータを逆量子化し、前記逆量子化された線形予測符号化パラメータを、前記復号化された符号化モードに対応して復号化する復号化モジュール；を含む。

本発明によれば、音声信号あるいはオーディオ信号をさらに効率的に量子化するために、音声信号あるいはオーディオ信号の特性によって、複数の符号化モードに分けて、各符号化モードに適用される圧縮率によって、多様なビット数を割り当てるにおいて、各符号化モードに対応して低複雑度で最適の量子化器を選択することができる。

本発明の一実施形態によるサウンド符号化装置の構成を示したブロック図である。図１に図示された符号化モード選択部で選択される多様な符号化モードの例を示した図面である。図１に図示された符号化モード選択部で選択される多様な符号化モードの例を示した図面である。図１に図示された符号化モード選択部で選択される多様な符号化モードの例を示した図面である。図１に図示された符号化モード選択部で選択される多様な符号化モードの例を示した図面である。本発明の一実施形態によるＬＰＣ量子化部の構成を示したブロック図である。本発明の一実施形態による加重関数決定部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態による量子化経路決定部の構成を示したブロック図である。図６に図示された量子化経路決定部の例による動作について説明するフローチャートである。図６に図示された量子化経路決定部の例による動作について説明するフローチャートである。本発明の一実施形態による量子化経路決定部の構成を示したブロック図である。コーデックサービスを提供するとき、ネットワーク端で伝送が可能なチャネルの状態に係わる情報について説明する図面である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図２０は本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。本発明の一実施形態による量子化器構造選択部の構成について説明する図面である。本発明の一実施形態による量子化器構造選択方法の動作について説明する図面である。本発明の一実施形態によるサウンド復号化装置の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数逆量子化部の構成を示したブロック図である。本発明の一実施形態によるＬＰＣ係数逆量子化部の詳細的な構成を示したブロック図である。図２５に図示された第１逆量子化スキームと第２逆量子化スキームとの一例を示した図面である。本発明の一実施形態による量子化方法の動作について説明するフローチャートである。本発明の一実施形態による逆量子化方法の動作について説明するフローチャートである。本発明の一実施形態による符号化モジュールを含む電子機器の構成を示したブロック図である。本発明の一実施形態による復号化モジュールを含む電子機器の構成を示したブロック図である。本発明の一実施形態による符号化モジュールと復号化モジュールとを含む電子機器の構成を示したブロック図である。

本発明は、多様な変換を加えることができ、さまざまな実施形態を有することができ、特定実施形態を図面に例示し、詳細な説明で具体的に説明する。しかし、それは、本発明を特定の実施形態について限定するものではなく、本発明の技術的思想及び技術範囲に含まれる全ての変換、均等物ないし代替物を含むものであると理解する。本発明についての説明において、関連公知技術についての具体的な説明が、本発明の要旨を不明確にすると判断される場合、その詳細な説明を省略する。

第１、第２のような用語は、多様な構成要素について説明するのに使用されるが、構成要素が用語によって限定されるものではない。用語は、１つの構成要素を他の構成要素から区別する目的のみに使用される。

本発明で使用した用語は、ただ特定の実施形態について説明するために使用されたものであり、本発明を限定する意図ではない。本発明で使用した用語は、本発明での機能を考慮しながら、可能な限り現在広く使用される一般的な用語を選択したが、それは、当分野の当業者の意図、判例、または新たな技術の出現などによって異なりもする。また、特定の場合は、出願人が任意に選定した用語もあり、その場合、当該発明の説明部分で詳しくその意味を記載する。従って、本発明で使用される用語は、単純な用語の名称ではない、その用語が有する意味と、本発明の全般にわたる内容とを基に定義されなければならない。

単数の表現は、文脈上明白に取り立てて意味しない限り、複数の表現を含む。本発明で、「含む」または「有する」のような用語は、明細書上に記載された特徴、数字、段階、動作、構成要素、部品、またはそれらを組み合わせたものが存在するということを指定するものであり、一つまたはそれ以上の他の特徴や数字、段階、動作、構成要素、部品、またはそれらを組み合わせたものの存在または付加の可能性を前もって排除するものではないと理解しなければならない。

以下、本発明の実施形態について、添付図面を参照しつつ詳細に説明し、添付図面を参照して説明するにおいて、同一であるか、あるいは対応する構成要素は、同一の図面番号を付し、それに係わる重複説明は省略する。

図１は、本発明の一実施形態によるサウンド符号化装置の構成を示したブロック図である。図１に図示されたサウンド符号化装置１００は、前処理部１１１、スペクトル及びＬＰ（linear prediction）分析部１１３、符号化モード選択部１１５、ＬＰＣ（linear predictive coding）係数量子化部１１７、可変モード符号化部１１９並びにパラメータ符号化部１２１を含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも１つの以上のプロセッサ（図示せず）によって具現される。ここで、サウンドは、オーディオあるいは音声の信号、あるいはオーディオと音声との混合信号を意味することができるので、以下では、説明の便宜のために、サウンドを音声とする。

図１を参照すれば、前処理部１１１は、入力される音声信号を前処理することができる。前処理過程を介して、音声信号から所望しない周波数成分が除去されたり、あるいは符号化に有利になるように、音声信号の周波数特性が調整される。具体的には、前処理部１１１は、ハイパス・フィルタリング（high pass filtering）、プリエンファシス（pre-emphasis）またはサンプリング（sampling）変換などを行うことができる。

スペクトル及び線形予測（ＬＰ）分析部１１３は、前処理された音声信号に対して、周波数ドメインの特性を分析したり、あるいはＬＰ分析を行い、ＬＰＣ係数を抽出することができる。一般的に、フレーム当たり１回のＬＰ分析が行われるが、さらなる音質向上のために、フレーム当たり２回以上のＬＰ分析も行われる。その場合、１回は、既存のＬＰ分析であるフレームエンド（frame-end）のためのＬＰであり、残りは、音質向上のための中間サブフレーム（mid-subframe）のためのＬＰが追加される。そのとき、現在フレームのフレームエンドは、現在フレームを構成するサブフレームにおいて、最後のサブフレームを意味し、以前フレームのフレームエンドは、以前フレームを構成するサブフレームのうち、最後のサブフレームを意味する。一例として、１つのフレームは、４個のサブフレームから構成される。

ここで、中間サブフレームは、以前フレームのフレームエンドである最後のサブフレームと、現在フレームのフレームエンドである最後のサブフレームとの間に存在するサブフレームのうち、一つ以上のサブフレームを意味する。これにより、スペクトル及びＬＰ分析部１１３は、全２セット以上のＬＰＣ係数を抽出することができる。一方、ＬＰＣ係数は、入力信号が狭帯域（ＮＢ：narrowband）である場合、次数１０を使用し、広帯域（ＷＢ：wideband）である場合、次数１６〜２０を使用するが、それに限定されるものではない。

符号化モード選択部１１５は、マルチレート（multi-rate）に対応し、複数個の符号化モードのうち一つを選択することができる。また、符号化モード選択部１１５は、帯域情報、ピッチ情報または周波数ドメインの分析情報から得られる音声信号の特性を利用して、複数個の符号化モードのうち一つを選択することができる。また、符号化モード選択部１１５は、マルチレートと、音声信号の特性とを利用して、複数個の符号化モードのうち一つを選択することができる。

ＬＰＣ係数量子化部１１７は、スペクトル及びＬＰ分析部１１３で抽出されたＬＰＣ係数を量子化することができる。ＬＰＣ係数量子化部１１７は、ＬＰＣ係数を量子化に適する他の係数に変換して量子化を行うことができる。ＬＰＣ係数量子化部１１７は、音声信号の量子化以前に、所定基準に基づいて、フレーム間予測を使用しない第１経路と、フレーム間予測を使用する第２経路と、を含む複数の経路のうち一つを、音声信号の量子化経路として選択し、選択された量子化経路によって、第１量子化スキームと、第２量子化スキームとのうち一つを利用して、量子化することができる。一方、ＬＰＣ係数量子化部１１７は、フレーム間予測を使用しない第１量子化スキームによる第１経路、並びにフレーム間予測を使用する第２量子化スキームによる第２経路いずれについても、ＬＰＣ係数を量子化し、所定基準に基づいて、第１経路及び第２経路のうち１つの量子化結果を選択することができる。

可変モード符号化部１１９は、ＬＰＣ係数量子化部１１７で量子化されたＬＰＣ係数を符号化し、ビットストリームを生成する。可変モード符号化部１１９は、量子化されたＬＰＣ係数を、符号化モード選択部１１５で選択された符号化モードに対応して符号化することができる。一方、可変モード符号化部１１９は、ＬＰＣ係数の励起信号を、フレームまたはサブフレームの単位で符号化することができる。

可変モード符号化部１１９で使用される符号化アルゴリズムの一例としては、ＣＥＬＰ（code-excited linear prediction）またはＡＣＥＬＰ（algebraic ＣＥＬＰ）が挙げられる。一方、符号化モードによって、変換符号化アルゴリズムが追加して使用される。ＣＥＬＰ技法によって、ＬＰＣ係数を符号化するための代表的なパラメータは、適応コードブック・インデックス、適応コードブック利得、固定コードブック・インデックス、固定コードブック利得などがある。可変モード符号化部１１９で符号化された現在フレームは、次のフレームの符号化のために保存される。可変モード符号化部１１９で生成されたビットストリームは、保存や伝送の目的で使用される。

パラメータ符号化部１２１は、復号化端で復号化に使用されるパラメータを符号化することができる。望ましくは、符号化モードに対応するパラメータを符号化することができる。

図２Ａないし図２Ｄは、図１に図示された符号化モード選択部１１５で選択される多様な符号化モードの例を示したものである。図２Ａ及び図２Ｃは、量子化に割り当てられるビット数が多い場合、すなわち、高ビット率である場合の符号化モードの分類例であり、図２Ｂ及び図２Ｄは、量子化に割り当てられるビット数が少ない場合、すなわち、低ビット率である場合の符号化モードの分類例である。

まず、高ビット率である場合、単純な構造のために、図２Ａでのように、音声信号は、一般符号化（ＧＣ：generic coding）モードと、トランジション符号化（ＴＣ：transition coding）モードとに分類することができる。その場合、無声音符号化（ＵＣ：unvoiced coding）モードと、有声音符号化（ＶＣ：voiced coding）モードとをＧＣモードに含めたものである。高比率である場合、図２Ｃでのように、インアクティブ符号化（ＩＣ：inactive coding）モードと、オーディオ符号化（ＡＣ：audio coding）モードとをさらに含んでもよい。

一方、低ビット率である場合、図２Ｂでのように、音声信号は、ＧＣモード、ＵＣモード、ＶＣモード及びＴＣモードに分類することができる。また、低ビット率である場合、図２Ｄでと同じように、ＩＣモードとＡＣモードとをさらに含んでもよい。

図２Ａ及び図２Ｃにおいて、ＵＣモードは、音声信号が、無声音であるか、または無声音と類似した特性を有するノイズの場合に選択される。ＶＣモードは、音声信号が有声音であるときに選択される。ＴＣモードは、音声信号の特性が急変するトランジション区間の信号を符号化するときに使用される。ＧＣモードは、それ以外の信号について符号化される。ＵＣモード、ＶＣモード、ＴＣモード及びＧＣモードは、ＩＴＵ−ＴＧ．７１８に記載された定義及び分類基準によるが、それに限定されるものではない。

図２Ｂ及び図２Ｄにおいて、ＩＣモードは、黙音である場合に選択され、ＡＣモードである場合、音声信号の特性がオーディオに近い場合に選択される。

符号化モードは、音声信号の帯域により、さらに細分化される。音声信号の帯域は、例えば、狭帯域（ＮＢ）、広帯域（ＷＢ）、超広帯域（ＳＷＢ：super wideband）、全帯域（ＦＢ：full band）に分類することができる。ＮＢは、３００〜３，４００Ｈｚまたは５０〜４，０００Ｈｚの帯域幅を有し、ＷＢは、５０〜７，０００Ｈｚまたは５０〜８，０００Ｈｚの帯域幅を有し、ＳＷＢは、５０〜１４，０００Ｈｚまたは５０〜１６，０００Ｈｚの帯域幅を有し、ＦＢは、２０，０００Ｈｚまでの帯域幅を有することができる。ここで、帯域幅と係わる数値は、便宜上設定されたものであり、それらに限定されるものではない。また、帯域の区分も、さらに簡単であったり、あるいは複雑に設定することができる。

図１の可変モード符号化部１１９は、図２Ａないし図２Ｄに図示された符号化モードに対応し、ＬＰＣ係数に対して、互いに異なる符号化アルゴリズムを利用して、符号化を行うことができる。符号化モードの種類及び個数が決定されれば、決定された符号化モードに該当する音声信号を利用して、コードブックをさらに訓練させる必要がある。

下記表１は、４種符号化モードである場合、量子化スキームと構造との一例を示したものである。ここで、フレーム間予測を使用せずに量子化する方式をセーフティーネット（safety-net）スキームと命名し、フレーム間予測を使用して量子化する方式を予測（predictive）スキームと命名する。そして、ＶＱ（vector quantizer）は、ベクトル量子化器、ＢＣ−ＴＣＱ（block-constrained trellis-coded quantizer）は、ブロック制限されたトレリス符号化量子化器を示したものである。

一方、符号化モードは、適用されるビット率によっても変わる。前述のように、２つのモードを使用する高ビット率で、ＬＰＣ係数を量子化するために、ＧＣモードで、フレームごとに４０ビットまたは４１ビットを使用し、ＴＣモードで、フレームごとに４６ビットを使用することができる。

図３は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図３に図示されたＬＰＣ係数量子化部３００は、第１係数変換部３１１、加重関数決定部３１３、ＩＳＦ（immittance spectral frequency）／ＬＳＦ（Line Spectral Frequency）量子化部３１５及び第２係数変換部３１７を含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも１つの以上のプロセッサ（図示せず）によって具現される。

図３を参照すれば、第１係数変換部３１１は、音声信号の現在フレーム、または以前フレームのフレームエンドをＬＰ分析して抽出されたＬＰＣ係数を、他の形態の係数に変換することができる。一例として、第１係数変換部３１１は、現在フレーム、または以前フレームのフレームエンドに係わるＬＰＣ係数を、線スペクトル周波数（ＬＳＦ）係数と、イミッタンススペクトル周波数（ＩＳＦ）係数とのうちいずれか１つの形態に変換することができる。そのとき、ＩＳＦ係数やＬＳＦ係数は、ＬＰＣ係数を、さらに容易に量子化することができる形態を示す。

加重関数決定部３１３は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数を利用して、現在フレームのフレームエンド及び以前フレームのフレームエンドに係わるＬＰＣ係数の重要度と係わる加重関数（weighting function）を決定することができる。決定された加重関数は、量子化経路を選択したり、あるいは量子化時に加重エラーを最小化するコードブック・インデックスを探索する過程で使用される。一例として、加重関数決定部３１３は、大きさ別加重関数と周波数別加重関数を決定することができる。

そして、加重関数決定部３１３は、周波数帯域、符号化モード及びスペクトル分析情報のうち少なくとも一つを考慮し、加重関数を決定することができる。一例として、加重関数決定部３１３は、符号化モード別に最適の加重関数を導き出すことができる。そして、加重関数決定部３１３は、音声信号の周波数帯域によって、最適の加重関数を導き出すことができる。また、加重関数決定部３１３は、音声信号の周波数分析情報によって、最適の加重関数を導き出すことができる。そのとき、周波数分析情報は、スペクトルチルト情報を含んでもよい。加重関数決定部３１３については、追って具体的に説明する。

ＩＳＦ／ＬＳＦ量子化部３１５は、現在フレームのフレームエンドのＬＰＣ係数が変換されたＩＳＦ係数またはＬＳＦ係数を量子化することができる。ＩＳＦ／ＬＳＦ量子化部３１５は、入力された符号化モードによって、最適量子化インデックスを求めることができる。ＩＳＦ／ＬＳＦ量子化部３１５は、加重関数決定部３１３で決定された加重関数を利用して、ＩＳＦ係数またはＬＳＦ係数を量子化することができる。ＩＳＦ／ＬＳＦ量子化部３１５は、加重関数決定部３１３で決定された加重関数を利用して、複数の量子化経路のうち一つを選択し、ＩＳＦ係数またはＬＳＦ係数を量子化することができる。量子化の結果、現在フレームのフレームエンドに係わるＩＳＦ係数またはＬＳＦ係数の量子化インデックスと、量子化されたＩＳＦ係数（ＱＩＳＦ）または量子化されたＬＳＦ係数（ＱＬＳＦ）とが求められる。

第２係数変換部３１７は、量子化されたＩＳＦ係数（ＱＩＳＦ）、または量子化されたＬＳＦ係数（ＱＬＳＦ）を、量子化されたＬＰＣ係数（ＱＬＰＣ）に変換することができる。

以下、ＬＰＣ係数のベクトル量子化と加重関数との関係について説明する。

ベクトル量子化は、ベクトル内のエントリー（entry）をいずれも同一の重要度と見なし、二乗誤差距離尺度（squared error distance measure）を利用して、最も少ないエラーを有するコードブック・インデックスを選択する過程を意味する。しかし、ＬＰＣ係数において、全ての係数の重要度が異なるので、重要な係数のエラーを減少させれば、最終合成信号の知覚的な品質（perceptual quality）が向上する。従って、ＬＳＦ係数を量子化するとき、復号化装置は、各ＬＰＣ係数の重要度を表現する加重関数を、二乗誤差距離尺度に適用し、最適のコードブック・インデックスを選択することにより、合成信号の性能を向上させることができる。

本発明の一実施形態によれば、ＩＳＦやＬＳＦの周波数情報と、実際のスペクトル強度とを利用して、各ＩＳＦまたはＬＳＦが、実際にスペクトル包絡線にいかなる影響を与えるかに係わる強度（magnitude）別加重関数を決定することができる。本発明の一実施形態によれば、周波数ドメインの知覚的な特性及びフォーマットの分布を考慮した周波数別加重関数を強度別加重関数と組み合わせ、さらなる量子化効率を得ることができる。本発明の一実施形態によれば、実際周波数ドメインの強度を使用するので、全体周波数の包絡線情報が良好に反映され、それぞれのＩＳＦ係数またはＬＳＦ係数の加重値を正確に導き出すことができる。

本発明の一実施形態によれば、ＬＰＣ係数を変換したＩＳＦまたはＬＳＦを、ベクトル量子化するとき、各係数の重要度が異なる場合、ベクトル内で、いかなるエントリーが相対的にさらに重要であるかを示す加重関数を決定することができる。そして、符号化するフレームのスペクトルを分析し、エネルギーが大きい部分にさらに大きい加重値を与えることができる加重関数を決定することにより、符号化の正確度を向上させることができる。スペクトルのエネルギーが大きいというのは、時間ドメインで、相関度が高いということを意味する。

そのような加重関数を、エラー関数に適用した例について説明すれば、次の通りである。

まず、入力信号の変動性が大きい場合、フレーム間予測を利用せずに量子化を行うとき、量子化されたＩＳＦを介して、コードブック・インデックスを探索するためのエラー関数は、下記数式（１）のように示すことができる。一方、入力信号の変動性が小さい場合、フレーム間予測を利用して量子化を行うとき、量子化されたＩＳＦを介して、コードブック・インデックスを探索するためのエラー関数は、下記数式（２）のように示すことができる。コードブック・インデックスは、エラー関数を最小化する値を意味する。

ここで、ｗ（ｉ）は、加重関数を意味する。ｚ（ｉ）とｒ（ｉ）は、量子化器の入力として使用されて、ｚ（ｉ）は、図３において、ＩＳＦ（ｉ）から平均値を除去したベクトルであり、ｒ（ｉ）は、ｚ（ｉ）からフレーム間の予測値を除去したベクトルである。従って、Ｅ_ｗｅｒｒ（ｋ）は、フレーム間予測を行わない場合、コードブック探索のために使用され、Ｅ_ｗｅｒｒ（ｐ）は、フレーム間予測を行う場合、コードブック探索のために使用される。一方、ｃ（ｉ）は、コードブックを示す。ｐは、ＩＳＦ係数の次数を意味し、ＮＢでは、通常１０、ＷＢでは、通常１６〜２０を使用する。

本発明の一実施形態によれば、符号化装置は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に該当するスペクトル強度を利用した強度別加重値関数と、入力信号の知覚的な特性及びフォーマット分布を考慮した周波数別加重値関数とを組み合わせ、最適の加重値関数を決定することができる。

図４は、本発明の一実施形態による加重関数決定部の構成を示したブロック図である。加重関数決定部４００は、スペクトル及びＬＰ分析部４１０の一部構成要素であるウィンドー処理部４２１、周波数マッピング部４２３及び強度計算部４２５と共に図示されている。

図４を参照すれば、ウィンドー処理部４２１は、入力信号にウィンドーを適用することができる。ウィンドーは、四角ウィンドー（rectangular window）、ハミングウィンドー（hamming window）、サインウィンドー（sine window）などが使用される。

周波数マッピング部４２３は、時間ドメインの入力信号を、周波数ドメインの入力信号にマッピングさせることができる。一例として、周波数マッピング部４２３は、ＦＦＴ（fast Fourier transform）、ＭＤＣＴ（modified discrete cosine transform）を介して、入力信号を周波数ドメインに変換することができる。

強度計算部４２５は、周波数ドメインに変換された入力信号に対して、周波数スペクトルビンの強度を計算することができる。周波数スペクトルビンの個数は、加重関数決定部４００が、ＩＳＦまたはＬＳＦを正規化するための個数と同一である。

スペクトル及びＬＰ分析部４１０の遂行結果、スペクトル分析情報が、加重関数決定部４００に入力される。そのとき、スペクトル分析情報は、スペクトルチルトを含んでもよい。

加重関数決定部４００は、ＬＰＣ係数が変換されたＩＳＦまたはＬＳＦを正規化することができる。ｐ次数のＩＳＦにおいて、実際に本過程の適用される範囲は、０〜（ｐ−２）までである。通常０〜（ｐ−２）までのＩＳＦは、０〜πに存在する。加重関数決定部４００は、スペクトル分析情報を利用するために、周波数マッピング部４２３を介して導き出された周波数スペクトルビンの個数と同一の個数Ｋに正規化を行うことができる。

加重関数決定部４００は、スペクトル分析情報を利用して、中間サブフレームに対して、ＩＳＦ係数またはＬＳＦ係数がスペクトル包絡線に影響を及ぼす強度別加重値関数Ｗ_１（ｎ）を決定することができる。一例として、加重関数決定部４００は、ＩＳＦ係数またはＬＳＦ係数の周波数情報と、入力信号の実際スペクトル強度とを利用して、強度別加重関数を決定することができる。そのとき、強度別加重関数は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数のために決定される。

そして、加重関数決定部４００は、ＩＳＦ係数またはＬＳＦ係数の周波数それぞれに対応する周波数スペクトルビンの強度を利用して、強度別加重関数を決定することができる。

また、加重関数決定部４００は、ＩＳＦ係数またはＬＳＦ係数の周波数それぞれに対応するスペクトルビン、及びスペクトルビンの周辺に位置した少なくとも１つの周辺スペクトルビンの強度を利用して、強度別加重関数を決定することができる。そのとき、加重関数決定部４００は、スペクトルビン、及び少なくとも１つの周辺スペクトルビンの代表値を抽出し、スペクトル包絡線と係わる強度別加重関数を決定することができる。代表値の例は、ＩＳＦ係数またはＬＳＦ係数の周波数それぞれに対応するスペクトルビン、及びスペクトルビンに係わる少なくとも１つの周辺スペクトルビンの最大値、平均値または中間値でもある。

加重関数決定部４００は、ＩＳＦ係数またはＬＳＦ係数の周波数情報を利用して、周波数別加重関数Ｗ_２（ｎ）を決定することができる。具体的には、加重関数決定部４００は、入力信号の知覚的な特性及びフォーマット分布を利用して、周波数別加重値関数を決定することができる。そのとき、加重関数決定部４００は、バークスケール（bark scale）によって、入力信号の知覚的な特性を抽出することができる。そして、加重関数決定部４００は、フォーマットの分布のうち最初のフォーマットに基づいて、周波数別加重関数を決定することができる。

周波数別加重関数の場合、超低周波及び高周波で、相対的に低い加重値を示し、低周波で、一定周波数区間内、例えば、第１フォーマットに該当する区間で、同一強度の加重値を示すことができる。

加重関数決定部４００は、強度別加重関数と、周波数別加重関数とを組み合わせ、最終的な加重関数を決定することができる。そのとき、加重関数決定部４００は、強度別加重関数と、周波数別加重関数とを乗じるか、あるいは加え、最終的な加重関数を決定することができる。

他の一例として、加重関数決定部４００は、入力信号の符号化モード及び周波数帯域情報を考慮し、強度別加重関数と周波数別加重関数とを決定することができる。

そのために、加重関数決定部４００は、入力信号の帯域幅を確認し、入力信号の帯域幅がＮＢである場合とＷＢである場合とについて、入力信号の符号化モードを確認することができる。入力信号の符号化モードがＵＣモードである場合、加重関数決定部４００は、ＵＣモードについて、強度別加重関数と周波数別加重関数とを決定し、強度別加重関数と周波数別加重関数とを組み合わせることができる。

一方、入力信号の符号化モードがＵＣモードではない場合、加重関数決定部４００は、ＶＣモードについて、強度別加重関数と周波数別加重関数とを決定し、強度別加重関数と周波数別加重関数とを組み合わせることができる。

もし入力信号の符号化モードが、ＧＣモードまたはＴＣモードである場合、加重関数決定部４００は、ＶＣモードと同一の過程を介して、加重関数を決定することができる。

一例として、入力信号をＦＦＴ方式によって周波数変換したとき、ＦＦＴ係数のスペクトル強度を利用した強度別加重関数は、下記数式（３）によって決定される。

一例として、ＶＣモードでの周波数別加重関数は、下記数式（４）によって、ＵＣモードでの周波数別加重関数は、下記数式（５）によって決定される。数式（４）及び数式（５）において、定数は、入力信号の特性によって変更される。

最終的に導き出される加重関数は、下記数式（６）によって決定される。

図５は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図５に図示されたＬＰＣ係数量子化部５００は、加重関数決定部５１１、量子化経路決定部５１３、第１量子化スキーム５１５及び第２量子化スキーム５１７を含んでもよい。加重関数決定部５１１については、図４を介して説明したので、ここでは説明を省略する。

量子化経路決定部５１３は、入力信号の量子化以前に、所定基準に基づいて、フレーム間予測を使用しない第１経路と、フレーム間予測を使用する第２経路と、を含む複数の経路のうち一つが、入力信号の量子化経路として選択されるように制御することができる。

第１量子化スキーム５１５は、入力信号の量子化経路として第１経路が選択された場合、量子化経路決定部５１３を介して提供される入力信号を量子化することができる。第１量子化スキーム５１５は、入力信号を粗量子化する第１量子化器（図示せず）と、入力信号と、第１量子化器の出力信号との間の量子化エラー信号を精密に量子化する第２量子化器（図示せず）と、を含んでもよい。

第２量子化スキーム５１７は、入力信号の量子化経路として第２経路が選択された場合、量子化経路決定部５１３を介して提供される入力信号を量子化することができる。第２量子化スキーム５１７は、入力信号について、ブロック制限されたトレリス符号化量子化を行う部分と、フレーム間予測部分とを含んでもよい。

ここで、第１量子化スキーム５１５は、フレーム間予測を使用せずに量子化する方式であり、セーフティーネット・スキームと命名することができる。第２量子化スキーム５１７は、フレーム間予測を使用して量子化する方式であり、予測スキームと命名することができる。

第１量子化スキーム５１５と、第２量子化スキーム５１７は、前記実施形態に限定されるものではなく、後述する多様な実施形態それぞれの第１量子化スキーム及び第２量子化スキームを利用して具現される。

これにより、効率性が高い対話形音声サービスのための低ビット率から、差別化された品質のサービスを提供するための高ビット率まで多様なビット率に対応し、最適の量子化器が選択される。

図６は、本発明の一実施形態による量子化経路決定部の構成を示したブロック図である。図６に図示された量子化経路決定部６００は、予測エラー算出部６１１と、量子化スキーム選択部６１３とを含んでもよい。

予測エラー算出部６１１は、フレーム間予測値ｐ（ｎ）、加重関数ｗ（ｎ）、ＤＣ値が除去されたＬＳＦ係数ｚ（ｎ）を入力にし、多様な方法に基づいて、予測エラーを算出することができる。まず、フレーム間予測器は、第２量子化スキーム、すなわち、予測スキームで使用されるものと同一のものを使用することができる。ここで、ＡＲ（auto-regressive)方式と、ＭＡ（movingaverage）方式とのうちいずれを使用してもよい。フレーム間予測のための以前フレームの信号ｚ（ｎ）は、量子化された値を使用することもでき、量子化されていない値を使用することもできる。また、予測エラーを求めるとき、加重関数を適用することもあり、適用しないこともある。これにより、全体８種の組み合わせが可能であり、そのうち４種は、次の通りである。

第一に、以前フレームの量子化されたｚ（ｎ）信号を利用した加重ＡＲ予測エラーは、下記数式（７）のように示すことができる。

第二に、以前フレームの量子化されたｚ（ｎ）信号を利用したＡＲ予測エラーは、下記数式（８）のように示すことができる。

第三に、以前フレームのｚ（ｎ）信号を利用した加重ＡＲ予測エラーは、下記数式（９）のように示すことができる。

第四に、以前フレームのｚ（ｎ）信号を利用したＡＲ予測エラーは、下記数式（１０）のように示すことができる。

ここで、Ｍは、ＬＳＦの次数を意味し、入力音声信号の帯域幅がＷＢである場合、通常１６を使用する。ρ（ｉ）は、ＡＲ方式の予測係数を意味する。このように、すぐ前のフレームの情報を利用する場合が一般的であり、ここで求められた予測エラーを利用して、量子化スキームを決定することができる。

一方、以前フレームについてフレームエラーが発生し、以前フレームの情報がない場合に備え、以前フレームの以前フレームを利用して、第２予測エラーを求め、第２予測エラーを利用して、量子化スキームを決定することができる。その場合、第２予測エラーは、前記最初の場合と比べ、下記数式（１１）のように示すことができる。

量子化スキーム選択部６１３は、予測エラー算出部６１１で求められた予測エラーと、符号化モード決定部１１５（図１）で求められた符号化モードとのうち少なくとも一つを利用して、現在フレームの量子化スキームを決定する。

図７Ａは、図６に図示された量子化経路決定部の一例による動作について説明するフローチャートである。ここで使用される予測モードの例として、０、１、２が可能である。予測モード０は、常にセーフティーネット・スキームを使用する場合を意味し、予測モード１は、いつも予測スキームを使用する場合を意味する。そして、予測モード２は、セーフティーネット・スキームと予測スキームとをスイッチングして使用する場合を意味する。

予測モード０で符号化しなければならない信号の特性は、非静的（non-stationary）である場合である。非静的信号は、毎フレームごとに変化がはんはだしく、予測を行う場合、予測エラーが原信号よりさらに大きくなる現象によって、量子化器の性能低下が生じる。予測モード１で符号化しなければならない信号の特性は、静的（stationary）である。静的信号は、以前フレームとの差が大きくなく、フレーム間相関度が高い。そして、２つの特性が混合している信号については、予測モード２を使用して量子化を行う場合、最適の性能を示すことができる。一方、２つの特性が混合していても、その混合の比率によって、予測モード０または予測モード１と設定することも可能であり、そのとき、予測モード２に設定される混合比率は、実験的にまたはシミュレーションを介して、最適の値に設定される。

図７Ａを参照すれば、７１１段階では、現在フレームの予測モードが「０」であるか否か、すなわち、現在フレームの音声信号が非静的特性を有するか否かを判断する。７１１段階での判断結果、予測モードが「０」である場合、例えば、ＴＣモードまたはＵＣモードのように、現在フレームの音声信号が変動性が大きい場合には、フレーム間予測が困難であるので、常にセーフティーネット・スキーム、すなわち、第１量子化スキームを量子化経路として決定する（７１４段階）。

一方、７１１段階での判断結果、予測モードが「０」ではない場合、７１２段階で、予測モードが「１」であるか否か、すなわち、現在フレームの音声信号が静的特性を有するか否かを判断する。７１２段階での判断結果、予測モードが「１」である場合、フレーム間予測性能にすぐれるので、常に予測スキーム、すなわち、第２量子化スキームを量子化経路として決定する（７１５段階）。

一方、７１２段階での判断結果、予測モードが「１」ではない場合、７１３段階で、予測モードが「２」であると決定し、第１量子化スキームと第２量子化スキームとをスイッチングして使用する。一例として、現在フレームの音声信号が静的特性を有する場合、すなわち、ＧＣモードまたはＶＣモードであり、予測モードが「２」である場合、予測エラーを考慮し、第１量子化スキームと、第２量子化スキームとのうち一つを、量子化経路として決定する。そのために、７１３段階では、現在フレームと以前フレームとの間の第１予測エラーが、第１臨界値より大きいか否かを判断する。ここで、第１臨界値は、前もって実験的に、またはシミュレーションを介して、最適の値に決定される。一例を挙げれば、次数が１６であるＷＢの場合、第１臨界値の例として、２，０８５，９７５を設定することができる。

７１３段階での判断結果、第１予測エラーが第１臨界値より大きい場合、第１量子化スキームを量子化経路として決定する（７１４段階）。一方、７１３段階での判断結果、第１予測エラーが第１臨界値より小さい場合、予測スキーム、すなわち、第２量子化スキームを量子化経路として決定する（７１５段階）。

図７Ｂは、図６に図示された量子化経路決定部の他の例による動作について説明するフローチャートである。

図７Ｂを参照すれば、７３１段階ないし７３３段階は、図７Ａの７１１段階ないし７１３段階と同一であり、以前フレームの以前フレームと、現在フレームとの間の第２予測エラーを求め、第２臨界値と比較する７３４段階をさらに追加したものである。ここで、第２臨界値は、前もって実験的に、またはシミュレーションを介して、最適の値に決定される。一例を挙げれば、次数が１６であるＷＢの場合、第２臨界値の例として、（第１臨界値＊１．１を設定することができる。

７３４段階での判断結果、第２予測エラーが第２臨界値より大きい場合、セーフティーネット・スキーム、すなわち、第１量子化スキームを量子化経路として決定する（７３５段階）。一方、７３４段階での判断結果、第２予測エラーが第２臨界値より小さい場合、予測スキーム、すなわち、第２量子化スキームを量子化経路として決定する（７３６段階）。
図７Ａ及び図７Ｂの実施形態では、予測モードが３種であるものと例として挙げたが、それに限定されるものではない。

一方、量子化スキームを決定するとき、前述の予測モードまたは予測エラー以外に、さらなる情報を利用することができる。

図８は、本発明の一実施形態による量子化経路決定部の構成を示したブロック図である。図８に図示された量子化経路決定部８００は、予測エラー算出部８１１、スペクトル分析部８１３及び量子化スキーム選択部８１５を含んでもよい。

予測エラー算出部８１１は、図６の予測エラー算出部６１１と同一であるので、具体的な説明は省略する。

スペクトル分析部８１３は、スペクトル情報を分析し、現在フレームの信号特性を決定する。スペクトル分析部８１３は、一例として、スペクトル情報のうち、周波数ドメインのスペクトル強度情報を利用して、Ｎ個（ここで、Ｎは、１より大きい整数）の以前フレームと現在フレームとの加重距離（weighted distance）を求め、加重距離が所定臨界値を超える場合、すなわち、フレーム間変動性が大きい場合、量子化スキームをセーフティーネット・スキームとして決定することができる。ここで、Ｎが大きくなるほど、比較すべき対象が多くなるので、複雑度が高くなる。加重距離Ｄは、下記数式（１２）を利用して求められる。加重距離Ｄを低複雑度で求めるためには、ＬＳＦ／ＩＳＦによって決定された周波数周辺のスペクトル強度のみを利用して、以前フレームと比較することができる。そのとき、ＬＳＦ／ＩＳＦによって決定された周波数周辺Ｍ個の周波数ビンに係わる強度の平均、最大値、中間値が使用される。

ここで、スペクトルの強度情報を利用した加重関数Ｗｋ（ｉ）は、前述の数式（３）を介して得られ、数式（３）のＷ_１（ｎ）と同一の値である。Ｄ_ｎでｎは、以前フレームと現在フレームとの差を意味する。ｎ＝１である場合には、すぐ以前のフレームと現在フレームとの加重距離を意味し、ｎ＝２である場合には、以前２番目のフレームと現在フレームとの加重距離を意味する。そのように求められたＤ_ｎ値が所定臨界値を超えるとき、現在フレームが非静的特性を有するといえる。

量子化スキーム選択部８１５は、予測エラー算出部８１１から提供される予測エラー、スペクトル分析部８１３から提供される信号特性、予測モード、及び伝送チャンネル情報を入力にし、現在フレームに係わる量子化経路を選択する。一例として、量子化スキーム選択部８１５に入力される各情報について優先順位を決め、量子化経路決定時に、順次に考慮される。例えば、伝送チャンネル情報に、ハイＦＥＲモード（high ＦＥＲ（frame error rate） mode）が含まれた場合、セーフティーネット・スキーム選択比率をさらに高く設定するか、あるいはセーフティーネット・スキームのみを選択することができる。セーフティーネット・スキーム選択比率は、予測エラーと係わる臨界値を調整し、可変的に設定することができる。

図９は、コーデックサービスを提供するとき、ネットワーク端で伝送可能なチャンネル状態に係わる情報について説明する図面である。

チャンネル状態が良好ではないほどチャンネルエラーが大きくなり、その結果、フレーム間変動性が大きくなり、フレームエラーが生じる。従って、量子化経路として、予測スキームの選択の比率を下げ、セーフティーネット・スキームがさらに多く選択されるように設定する。極端にチャンネル状態が望ましくない場合には、量子化経路をセーフティーネット・スキームによってのみ使用することができる。そのために、伝送チャンネル情報を組み合わせ、チャンネル状態を示す値を１個以上の段階で表現する。段階が高いほど、チャンネルエラーが多く発生する状況を意味する。最も単純な場合は、段階が１個である場合であり、図９に図示されているように、ハイＦＥＲ（frame error rate）モード決定部９１１で、チャンネル状態がハイＦＥＲモードに決定される場合である。ハイＦＥＲモードに決定された場合には、チャンネル状態が非常に不安定であるということを意味するので、セーフティーネット・スキームの選択比率を最も高い状態にするか、あるいはセーフティーネット・スキームのみを利用して符号化を行う。一方、段階が複数個である場合には、セーフティーネット・スキームの選択比率を段階的に高める方向に設定することができる。

一方、図９を参照すれば、ハイＦＥＲモード決定部９１１で、ハイＦＥＲモードに決定するアルゴリズムは、例えば、４種情報を介して遂行される。具体的には、４種情報は、（１）物理的階層に伝送されたハイブリッド自動反復要請（ＨＡＲＱ：hybrid automatic repeat request）フィードバックであるファーストフィードバック（ＦＦＢ：fast feedback）情報、（２）物理的階層よりさらに高い階層に伝送されたネットワーク・シグナリングからフィードバックされたスローフィードバック（ＳＦＢ：slow feedback：ＳＦＢ）情報、（３）終端（far end）で、ＥＶＳデコーダ９１３からシグナリングされたインバンド（in-band）であるインバンド・フィードバック（ＩＳＢ：in-band feedback）情報；及び（４）リダンダント方式（redundant fashion）で伝送される特定クリティカル・フレーム（specific critical frame）のＥＶＳエンコーダ９１５による選択であるハイセンシティビティー・フレーム（ＨＳＦ：high sensitivityframe）情報を有することができる。ＦＦＢ情報及びＳＦＢ情報は、ＥＶＳコーデックに独立している一方、ＩＳＢ情報とＨＳＦ情報は、ＥＶＳコーデックに依存的であり、ＥＶＳコーデックのための特定アルゴリズムを要求することができる。

前記４種情報を利用して、チャンネル状態をハイＦＥＲモードに決定するアルゴリズムは、一例を挙げ、次のようなコードによって表現される。

前述のように、４種情報のうち一つ以上で処理された分析情報に基づいて、ＥＶＳコーデックに、ハイＦＥＲモードに進入することを指示することができる。ここで、分析情報は、一例を挙げれば、（１）ＳＦＢ情報を利用して、Ｎｓフレームの計算された平均エラーレートから導き出されたＳＦＢａｖｇ、（２）ＦＦＢ情報を利用して、Ｎｆフレーム平均の計算された平均エラーレートから導き出されたＦＦＢａｖｇ、（３）ＩＳＢ情報と、それぞれの臨界値であるＴｓ、Ｔｆ及びＴｉを利用して、Ｎｉフレームの計算された平均エラーレートから導き出されたＩＳＢａｖｇでもある。ＳＦＢａｖｇ、ＦＦＢａｖｇ、ＩＳＢａｖｇについて、それぞれの臨界値を比べた結果に基づいて、ハイＦＥＲ動作モードに進入することを決定することができる。そして、全ての条件は、共通してコーデックで、ハイＦＥＲモードを支援するするか否かに係わるＨｉＯＫを確認することができる。

ここで、ハイＦＥＲモード決定部９１１は、ＥＶＳエンコーダ９１５または他のフォーマットのエンコーダの構成要素としても含まれる。一方、ハイＦＥＲモード決定部９１１は、ＡＶＳエンコーダ９１５または他のフォーマットのエンコーダの構成要素ではなく、外部の他のデバイスで具現される。

図１０は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図１０に図示されたＬＰＣ係数量子化部１０００は、量子化経路決定部１０１０、第１量子化スキーム１０３０及び第２量子化スキーム１０５０を含んでもよい。

量子化経路決定部１０１０は、予測エラーと符号化モードとのうち少なくとも一つに基づいて、セーフティーネット・スキームを含む第１経路と、予測スキームを含む第２経路とのうち一つを、現在フレームの量子化経路として選択する。

第１量子化スキーム１０３０は、量子化経路として第１経路が選択された場合、フレーム間予測を使用せずに量子化を行うものであり、マルチステージベクトル量子化器（ＭＳＶＱ：multi-stage vector quantizer）１０４１と、格子ベクトル量子化器（ＬＶＱ：lattice vector quantizer）１０４３と、を含んでもよい。ＭＳＶＱ１０４１は、望ましくは、２ステージからなる。ＭＳＶＱ１０４１は、ＤＣ値が除去されたＬＳＦ係数を粗くベクトル量子化して量子化インデックスを生成する。ＬＶＱ１０４３は、ＭＳＶＱ１０４１から出力される逆量子化されたＬＳＦ係数と、ＤＣ値が除去されたＬＳＦ係数との間のＬＳＦ量子化エラーを入力にして量子化を行い、量子化インデックスを生成する。ＭＳＶＱ１０４１の出力と、ＬＶＱ１０４３の出力は、互いに加えられてＤＣ値が合わせられ、最終量子化されたＬＳＦ係数（ＱＬＳＦ）が生成される。第１量子化スキーム１０３０では、コードブックのためのメモリを多く使用するが、低ビット率で優秀な性能を示すＭＳＶＱ１０４１と、少ないメモリと低複雑度とで、低ビット率で効率的なＬＶＱ１０４３を結合して使用することにより、非常に効率的な量子化器構造を具現することができる。

第２量子化スキーム１０５０は、量子化経路として第２経路が選択された場合、フレーム間予測を使用して量子化を行うものとして、フレーム内予測器１０６５を有するブロック制限されたトレリス符号化量子化器（ＢＣ−ＴＣＱ：block-constrained trellis coding quantizerＺ）１０６３と、フレーム間予測器１０６１とを含んでもよい。フレーム間予測器１０６１は、ＡＲ方式とＭＡ方式とのうちいずれを使用してもよい。一例としては、一次（１^ｓｔ order）ＡＲ方式を適用する。予測係数は、前もって定義され、予測のための過去ベクトルは、以前フレームにおいて、最適ベクトルとして選択されたベクトルを利用する。フレーム間予測器１０６１の予測値から得られるＬＳＦ予測エラーは、フレーム内予測器１０６５を有するＢＣ−ＴＣＱ１０６３で量子化される。これにより、高ビット率で少ないメモリ強度と低複雑度とを有し、量子化性能にすぐれるＢＣ−ＴＣＱ１０６３の特性を最大化させることができる。

結果として、第１量子化スキーム１０３０と、第２量子化スキーム１０５０とを利用する場合、入力音声信号の特性に対応し、最適の量子化器を具現することができる。

一方、図１０のＬＰＣ係数量子化部１０００において、一例を挙げ、８ＫＨｚ帯域のＷＢを有し、ＧＣモードである音声信号の量子化に４１ビットを使用する場合、第１量子化スキーム１８３０で、量子化経路情報を示す１ビットを除き、ＭＳＶＱ１０４１には、１２ビットを、ＬＶＱ１０４３には、２８ビットを割り当てることができる。また、第２量子化スキーム１８５０のＢＣ−ＴＣＱ１０６３には、量子化経路情報を示す１ビットを除き、４０ビット全部を割り当てることができる。

下記表２は、８ＫＨｚ帯域のＷＢ音声信号へのビット割り当て例を示している。

図１１は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図１１に図示されたＬＰＣ係数量子化部１１００は、図１０と反対の構造を有する。

ＬＰＣ係数量子化部１１００は、量子化経路決定部１１１０、第１量子化スキーム１１３０及び第２量子化スキーム１１５０を含んでもよい。

量子化経路決定部１１１０は、予測エラーと符号化モードとのうち少なくとも一つに基づいて、セーフティーネット・スキームを含む第１経路と、予測スキームを含む第２経路とのうち一つを、現在フレームの量子化経路として選択する。

第１量子化スキーム１１３０は、量子化経路として第１経路が選択された場合、フレーム間予測を使用せずに量子化を行うものであり、ベクトル量子化器（ＶＱ：vector quantizer）１１４１と、フレーム内予測器１１４５を有するＢＣ−ＴＣＱ１１４３と、を含んでもよい。ＶＱ１１４１は、ＤＣ値が除去されたＬＳＦ係数を粗くベクトル量子化して量子化インデックスを生成する。ＢＣ−ＴＣＱ１１４３は、ＶＱ１１４１から出力される逆量子化されたＬＳＦ係数と、ＤＣ値が除去されたＬＳＦ係数との間のＬＳＦ量子化エラーを入力にして量子化を行い、量子化インデックスを生成する。ＶＱ１１４１の出力と、ＢＣ−ＴＣＱ１１４３の出力は、互いに加えられてＤＣ値が合わせられ、最終量子化されたＬＳＦ係数（ＱＬＳＦ）が生成される。第２量子化スキーム１１５０は、量子化経路として第２経路が選択された場合、フレーム間予測を使用して量子化を行うものであり、ＬＶＱ１１６３と、フレーム間予測器１１６１を含んでもよい。フレーム間予測器１１６１は、図１０でのところと同一であるか、あるいは類似して具現することができる。フレーム間予測器１１６１の予測値から得られるＬＳＦ予測エラーは、ＬＶＱ１１６３で量子化される。

これにより、ＢＣ−ＴＣＱ１１４３は、割り当てられたビット数が少ないので、低複雑度を有し、ＬＶＱ１１６３は、高ビット率で低複雑度を有するので、全体的に低複雑度で量子化を行うことができる。

一例を挙げ、図１１のＬＰＣ係数量子化部１１００において、８ＫＨｚ帯域のＷＢを有し、ＧＣモードである音声信号の量子化に４１ビットを使用する場合、第１量子化スキーム１１３０で量子化経路情報を示す１ビットを除き、ＶＱ１１４１には、６ビットを、ＢＣ−ＴＣＱ１１４３には、３４ビットを割り当てることができる。また、第２量子化スキーム１１５０のＬＶＱ１１６３には、量子化経路情報を示す１ビットを除き、４０ビット全部を割り当てることができる。

下記表３は、８ＫＨｚ帯域のＷＢ音声信号へのビット割り当て例を示している。

一方、ほとんどの符号化モードに使用されるＶＱ１１４１と係わって最適インデックスは、下記の数式（１３）のＥ_ｗｅｒｒ（ｐ）を最小化するインデックスを探索する。

ここで、ｗ（ｉ）は、加重関数決定部３１３（図３）で決定された加重関数、ｒ（ｉ）は、ＶＱ１１４１の入力、ｃ（ｉ）は、ＶＱ１１４１の出力をそれぞれ示す。すなわち、ｒ（ｉ）とｃ（ｉ）との加重歪曲を最小化するインデックスが求められる。

そして、ＢＣ−ＴＣＱ１１４３で使用される歪曲尺度ｄ（ｘ，ｙ）は、下記の数式（１４）で示すことができる。

一実施形態では、歪曲尺度ｄ（ｘ，ｙ）に加重関数（ｗｋ）を適用し、下記の数式（１５）のように、加重歪曲（weighted distortion）を求めることができる。

すなわち、ＢＣ−ＴＣＱ１１４３の全てのステージで加重歪曲を求め、最適のインデックスを求める。

図１２は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図１２に図示されたＬＰＣ係数量子化部１２００は、量子化経路決定部１２１０、第１量子化スキーム１２３０及び第２量子化スキーム１２５０を含んでもよい。

量子化経路決定部１２１０は、予測エラーと符号化モードとのうち少なくとも一つに基づいて、セーフティーネット・スキームを含む第１経路と、予測スキームを含む第２経路とのうち一つを、現在フレームの量子化経路として選択する。

第１量子化スキーム１２３０は、量子化経路として第１経路が選択された場合、フレーム間予測を使用せずに量子化を行うものであり、ＶＱまたはＭＳＶＱ１２４１と、ＬＶＱまたはＴＣＱ１２４３とを含んでもよい。ＶＱまたはＭＳＶＱ１２４１は、ＤＣ値が除去されたＬＳＦ係数を粗くベクトル量子化して量子化インデックスを生成する。ＬＶＱまたはＴＣＱ１２４３は、ＶＱまたはＭＳＶＱ１２４１から出力される逆量子化されたＬＳＦ係数と、ＤＣ値が除去されたＬＳＦ係数との間のＬＳＦ量子化エラーを入力にして量子化を行い、量子化インデックスを生成する。ＶＱまたはＭＳＶＱ１２４１の出力と、ＬＶＱまたはＴＣＱ１２４３の出力は、互いに加えられてＤＣ値が合わせられ、最終量子化されたＬＳＦ係数（ＱＬＳＦ）が生成される。ＶＱまたはＭＳＶＱ１２４１は、複雑度が高くてメモリ使用量が多いが、ビット効率が高い（good bit error rate）ので、全体的な複雑度を考慮し、ステージの個数を、１個からｎ個まで増加させることができる。例えば、最初のステージのみを使用する場合、ＶＱになり、２個以上のステージを使用する場合、ＭＳＶＱになる。一方、ＬＶＱまたはＴＣＱ１２４３は、低複雑度を有するので、ＬＳＦ量子化エラーを効率的に量子化することができる。

第２量子化スキーム１２５０は、量子化経路として第２経路が選択された場合、フレーム間予測を使用して量子化を行うものであり、フレーム間予測器１２６１と、ＬＶＱまたはＴＣＱ１２６３と、を含んでもよい。フレーム間予測器１２６１は、図１０でのところと同一であるか、あるいは類似して具現することができる。フレーム間予測器１２６１の予測値から得られるＬＳＦ予測エラーは、ＬＶＱまたはＴＣＱ１２６３で量子化される。同様に、ＬＶＱまたはＴＣＱ１２６３は、低複雑度を有するので、ＬＳＦ予測エラーを効率的に量子化することができる。これにより、全体的に低複雑度で量子化を行うことができる。

図１３は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図１３に図示されたＬＰＣ係数量子化部１３００は、量子化経路決定部１３１０、第１量子化スキーム１３３０及び第２量子化スキーム１３５０を含んでもよい。

量子化経路決定部１３１０は、予測エラーと符号化モードとのうち少なくとも一つに基づいて、セーフティーネット・スキームを含む第１経路と、予測スキームを含む第２経路とのうち一つを、現在フレームの量子化経路として選択する。

第１量子化スキーム１３３０は、量子化経路として第１経路が選択された場合、フレーム間予測を使用せずに量子化を行うものであり、図１２に図示された第１量子化スキーム１３３０と同一であるので、その説明を省略する。

第２量子化スキーム１３５０は、量子化経路として第２経路が選択された場合、フレーム間予測を使用して量子化を行うものであり、フレーム間予測器１３６１、ＶＱまたはＭＳＶＱ１３６３及びＬＶＱまたはＴＣＱ１３６５を含んでもよい。フレーム間予測器１３６１は、図１０でのところと同一であるか、あるいは類似して具現することができる。フレーム間予測器１３６１の予測値から得られるＬＳＦ予測エラーは、ＶＱまたはＭＳＶＱ１３６３で粗量子化される。ＬＳＦ予測エラーと、ＶＱまたはＭＳＶＱ１３６３で逆量子化されたＬＳＦ予測エラーとの間のエラーベクトルは、ＬＶＱまたはＴＣＱ１３６５で量子化される。同様に、ＬＶＱまたはＴＣＱ１３６５は、低複雑度を有するので、ＬＳＦ予測エラーを効率的に量子化することができる。これにより、全体的に低複雑度で量子化を行うことができる。

図１４は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図１４に図示されたＬＰＣ係数量子化部１４００は、図１２に図示されたＬＰＣ係数量子化部１２００と比較すれば、第１量子化スキーム１４３０が、ＬＶＱまたはＴＣＱ１２４３の代わりに、フレーム内予測器１４４５を有するＢＣ−ＴＣＱ１４４３を含み、第２量子化スキーム１４５０が、ＬＶＱまたはＴＣＱ１２６３のの代わりに、フレーム内予測器１４６５を有するＢＣ−ＴＣＱ１４６３を含むという違いがある。

一例を挙げ、図１４のＬＰＣ係数量子化部１４００において、８ＫＨｚ帯域のＷＢを有し、ＧＣモードである音声信号の量子化に４１ビットを使用する場合、第１量子化スキーム１４３０では、量子化経路情報を示す１ビットを除き、ＶＱ１４４１には、５ビットを、ＢＣ−ＴＣＱ１４４３には、３５ビットを割り当てることができる。また、第２量子化スキーム１４５０のＢＣ−ＴＣＱ１４６３には、量子化経路情報を示す１ビットを除き、４０ビット全部を割り当てることができる。

図１５は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図１５に図示されたＬＰＣ係数量子化部１５００は、図１３に図示されたＬＰＣ係数量子化部１３００の具体的な例であり、第１量子化スキーム１５３０のＭＳＶＱ１５４１と、第２量子化スキーム１５５０のＭＳＶＱ１５６３は、２ステージを有する。

一例を挙げ、図１５のＬＰＣ係数量子化部１５００において、８ＫＨｚ帯域のＷＢを有し、ＧＣモードである音声信号の量子化に、４１ビットを使用する場合、第１量子化スキーム１５３０で、量子化経路情報を示す１ビットを除き、２ステージＶＱ１５４１には、６＋６＝１２ビットを、ＬＶＱ１５４３には、２８ビットを割り当てることができる。また、第２量子化スキーム１５５０の２ステージＶＱ１５６３には、５＋５＝１０ビットを、ＬＶＱ１５６３には、３０ビットを割り当てることができる。

図１６Ａ及び図１６Ｂは、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。特に、図１６Ａ及び図１６ＢのＬＰＣ係数量子化部１６１０，１６３０は、セーフティーネット・スキーム、すなわち、第１量子化スキームの構成に使用される。

図１６Ａに図示されたＬＰＣ係数量子化部１６１０は、ＶＱ１６２１と、フレーム内予測器１６２５を有するＴＣＱまたはＢＣ−ＴＣＱ１６２３と、を含み、図１６Ｂに図示されたＬＰＣ係数量子化部１６３０は、ＶＱまたはＭＳＶＱ１６４１と、ＴＣＱまたはＬＶＱ１６４３と、を含んでもよい。

これにより、ＶＱ１６２１、あるいはＶＱまたはＭＳＶＱ１６４１は、全体入力ベクトルを、少ないビットで粗量子化し、ＴＣＱ１６２３、あるいはＴＣＱまたはＬＶＱ１６４３は、ＬＳＦ量子化エラーに対して精密に符号化する。

一方、毎フレームで、セーフティーネットスチーム、すなわち、第１量子化スキームのみを使用する場合には、さらなる性能向上のために、ＬＶＡ（list Viterbi algorithm）方式を適用することができる。すなわち、第１量子化スキームのみを使用すれば、スイッチング方式に比べ、複雑度で余裕があるので、探索時、複雑度を上昇させ、性能向上をなすＬＶＡ方式を適用することができる。ＬＶＡ方式を一例として挙げ、ＢＣ−ＴＣＱに適用することにより、複雑度は上昇するが、上昇程度がスイッチング構造の複雑度より低いように設定することができる。

図１７Ａないし図１７Ｃは、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図であり、特に、加重関数を利用するＢＣ−ＴＣＱの構造を示したものである。

図１７Ａを参照すれば、ＬＰＣ係数量子化部は、加重関数決定部１７１０と、フレーム内予測器１７２３を有するＢＣ−ＴＣＱ１７２１とからなる量子化スキーム１７２０を含んでもよい。

図１７Ｂを参照すれば、ＬＰＣ係数量子化部は、加重関数決定部１７３０と、フレーム内予測器１７４５を有するＢＣ−ＴＣＱ１７４３と、フレーム間予測器１７４１とからなる量子化スキーム１７４０を含んでもよい。ここで、ＢＣ−ＴＣＱ１７４３に、４０ビットが割り当てられる。

図１７Ｃを参照すれば、ＬＰＣ係数量子化部は、加重関数決定部１７５０と、フレーム内予測器１７６５を有するＢＣ−ＴＣＱ１７６３と、ＶＱ１７６１と、からなる量子化スキーム１７６０を含んでもよい。ここで、ＶＱ１７６１に５ビット、ＢＣ−ＴＣＱ１７６３に４０ビットが割り当てられる。

図１８は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図１８に図示されたＬＰＣ係数量子化部１８００は、第１量子化スキーム１８１０と、第２量子化スキーム１８３０と、量子化経路決定部１８５０と、を含んでもよい。

第１量子化スキーム１８１０は、フレーム間予測を使用せずに量子化を行うものであり、量子化性能向上のために、ＭＳＶＱ１８２１と、ＬＶＱ１８２３と、を組み合わせて使用することができる。ＭＳＶＱ１８２１は、望ましくは、２ステージからなる。ＭＳＶＱ１８２１は、ＤＣ値が除去されたＬＳＦ係数を粗くベクトル量子化して量子化インデックスを生成する。ＬＶＱ１８２３は、ＭＳＶＱ１８２１から出力される逆量子化されたＬＳＦ係数と、ＤＣ値が除去されたＬＳＦ係数との間のＬＳＦ量子化エラーを入力にして量子化を行い、量子化インデックスを生成する。ＭＳＶＱ１８２１の出力と、ＬＶＱ１８２３の出力は、互いに加えられてＤＣ値が合わせられ、最終量子化されたＬＳＦ係数（ＱＬＳＦ）が生成される。第１量子化スキーム１８１０では、低ビット率で優秀な性能を示すＭＳＶＱ１８２１と、低ビット率で効率的なＬＶＱ１８２３と、を結合して使用することにより、非常に効率的な量子化器構造を具現することができる。

第２量子化スキーム１８３０は、フレーム間予測を使用して量子化を行うものであり、フレーム内予測器１８４５を有するＢＣ−ＴＣＱ１８４３と、フレーム間予測器１８４１と、を含んでもよい。フレーム間予測器１８４１の予測値から得られるＬＳＦ予測エラーは、フレーム内予測器１８４５を有するＢＣ−ＴＣＱ１８４３で量子化される。これにより、高ビット率で量子化性能にすぐれるＢＣ−ＴＣＱ１８４３の特性を最大化させることができる。

量子化経路決定部１８５０は、予測モードと加重歪曲とを考慮し、第１量子化スキーム１８１０の出力と、第２量子化スキーム１８３０の出力とのうち一つを選択する。

結果として、第１量子化スキーム１８１０と、第２量子化スキーム１８３０とを利用する場合、入力音声信号の特性に対応し、最適の量子化器を具現することができる。一例を挙げ、図１８のＬＰＣ係数量子化部１８００において、８ＫＨｚ帯域のＷＢを有し、ＶＣモードである音声信号の量子化に、４３ビットを使用する場合、第１量子化スキーム１８１０で、量子化経路情報を示す１ビットを除き、ＭＳＶＱ１８２１には、１２ビットを、ＬＶＱ１８２３には、３０ビットを割り当てることができる。また、第２量子化スキーム１８３０のＢＣ−ＴＣＱ１８４３に、量子化経路情報を示す１ビットを除き、４２ビット全部を割り当てることができる。

下記表４は、８ＫＨｚ帯域のＷＢ音声信号へのビット割り当て例を示している。

図１９は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図１９に図示されたＬＰＣ係数量子化部１９００は、第１量子化スキーム１９１０と、第２量子化スキーム１９３０と、量子化経路決定部１９５０と、を含んでもよい。

第１量子化スキーム１９１０は、フレーム間予測を使用せずに量子化を行うものであり、量子化性能向上のために、ＶＱ１９２１と、フレーム内予測器１９２５を有するＢＣ−ＴＣＱ１９２３と、を組み合わせて使用することができる。

第２量子化スキーム１９３０は、フレーム間予測を使用して量子化を行うものであり、フレーム内予測器１９４５を有するＢＣ−ＴＣＱ１９４３と、フレーム間予測器１９４１を含んでもよい。

量子化経路決定部１９５０は、予測モードと、第１量子化スキーム１９１０及び第２量子化スキーム１９３０から求められた最適量子化された値とを利用した加重歪曲と、を入力にし、量子化経路を選択する。一例として、現在フレームの予測モードが「０」、すなわち、現在フレームの音声信号が非静的特性を有するか否かを判断する。ＴＣモードまたはＵＣモードのように、現在フレームの音声信号が変動性が大きい場合には、フレーム間予測が困難であるので、常にセーフティーネット・スキーム、すなわち、第１量子化スキーム１９１０を量子化経路として決定する。

一方、現在フレームの予測モードが「１」、すなわち、現在フレームの音声信号が非静的特性を有さないＧＣモードまたはＶＣモードである場合、予測エラーを考慮し、第１量子化スキーム１９１０と、第２量子化スキーム１９３０とのうち一つを量子化経路として決定する。そのために、フレームエラーにロバスト（robust）になるように、第１量子化スキーム１９１０の加重歪曲が優先的に考慮される。すなわち、第１量子化スキーム１９１０の加重歪曲の値が前もって定義した臨界値より小さい場合には、第２量子化スキーム１９３０の加重歪曲の値にかかわらず、第１量子化スキーム１９１０が選択される。また、単に、加重歪曲の値が小さい量子化スキームを選択するものではなく、同一の加重歪曲の値である場合、フレームエラーを考慮し、第１量子化スキーム１９１０が選択される。一方、第１量子化スキーム１９１０の加重歪曲の値が、第２量子化スキーム１９３０の加重歪曲の値より所定倍数以上大きい場合には、第２量子化スキーム１９３０が選択される。ここで、所定倍数は、例えば、１．１５に設定される。そのように、量子化経路が選択されれば、当該量子化スキームで生成された量子化インデックスを伝送する。

一方、予測モードが３種である場合を考慮し、「０」である場合には、常に第１量子化スキーム１９１０を選択し、「１」である場合には、常に第２量子化スキーム１９３０を選択し、「２」である場合には、第１量子化スキーム１９１０と、第２量子化スキーム１９３０とをスイッチングし、そののうち一つを量子化経路として決定するように具現することも可能である。

一例を挙げ、図１９のＬＰＣ係数量子化部１９００において、８ＫＨｚ帯域のＷＢを有し、ＧＣモードである音声信号の量子化に、３７ビットを使用する場合、第１量子化スキーム１９１０では、量子化経路情報を示す１ビットを除き、ＶＱ１９２１には、２ビットを、ＢＣ−ＴＣＱ１９２３には、３４ビットを割り当てることができる。また、第２量子化スキーム１９３０のＢＣ−ＴＣＱ１９４３には、量子化経路情報を示す１ビットを除き、３６ビット全部を割り当てることができる。

下記表５は、８ＫＨｚ帯域のＷＢ音声信号へのビット割り当て例を示している。

図２０は、本発明の一実施形態によるＬＰＣ係数量子化部の構成を示したブロック図である。図２０に図示されたＬＰＣ係数量子化部２０００は、第１量子化スキーム２０１０と、第２量子化スキーム２０３０と、量子化経路決定部２０５０と、を含んでもよい。

第１量子化スキーム２０１０は、フレーム間予測を使用せずに量子化を行うものであり、量子化性能向上のためにＶＱ２０２１と、フレーム内予測器２０２５を有するＢＣ−ＴＣＱ２０２３と、を組み合わせて使用することができる。

第２量子化スキーム２０３０は、フレーム間予測を使用して量子化を行うものであり、ＬＶＱ２０４３と、フレーム間予測器２０４１と、を含んでもよい。

量子化経路決定部２０５０は、符号化モードと、第１量子化スキーム２０１０及び第２量子化スキーム２０３０から求められた最適量子化された値を利用した加重歪曲と、を入力にし、量子化経路を選択する。

一例を挙げ、図２０のＬＰＣ係数量子化部２０００において、８ＫＨｚ帯域のＷＢを有し、ＶＣモードである音声信号の量子化に、４３ビットを使用する場合、第１量子化スキーム２０１０では、量子化経路情報を示す１ビットを除き、ＶＱ２０２１には、６ビットを、ＢＣ−ＴＣＱ２０２３には、３６ビットを割り当てることができる。また、第２量子化スキーム２０３０のＢＣ−ＴＣＱ２０４３には、量子化経路情報を示す１ビットを除き、４２ビット全部を割り当てることができる。

下記表６は、８ＫＨｚ帯域のＷＢ音声信号へのビット割り当て例を示している。

図２１は、本発明の一実施形態による量子化器タイプ選択部の構成について説明する図面である。図２１に図示された量子化器タイプ選択部２１００は、ビット率決定部２１０１、帯域決定部２１３０、内部サンプリング周波数決定部２１５０及び量子化器タイプ決定部２１０７を含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ（図示せず）によって具現される。量子化器タイプ選択部２１００は、２種の量子化スキームがスイッチングされる予測モード２で使用される。量子化器タイプ選択部２１００は、図１のサウンド符号化装置１００のＬＰＣ係数量子化部１１７の構成要素として含まれるか、あるいは図１のサウンド符号化装置１００の構成要素として含まれる。

図２１を参照すれば、ビット率決定部２１１０は、音声信号の符号化するビット率（coding bit rate）を決定する。符号化するビット率は、全体フレームについて決定されるか、あるいはフレーム単位で決定される。符号化するビット率によって、量子化器構造が変更される。

帯域決定部２１３０は、音声信号の帯域（bandwidth）を決定する。音声信号の帯域によって、量子化器構造が変更されもする。

内部サンプリング周波数決定部２１５０は、量子化器で使用される帯域の上限（upper limit）による内部サンプリング周波数を決定する。音声信号の帯域がＷＢ以上、すなわち、ＷＢ、ＳＷＢそしてＦＢである場合、符号化する帯域の上限が、６．４ＫＨｚであるか、あるいは８ＫＨｚであるかによって、内部サンプリング周波数が可変される。符号化する帯域の上限が６．４ＫＨｚである場合、内部サンプリング周波数は、１２，８００Ｈｚになり、８ＫＨｚである場合、１６，０００Ｈｚになる。一方、帯域の上限は、前記数値に限定されるものではない。

量子化器タイプ決定部２１０７は、ビット率決定部２１１０の出力、帯域決定部２１３０の出力、及び内部サンプリング周波数決定部２１５０の出力を入力にし、量子化器タイプを開ループ（open loop）と閉ループ（closed-loop）とのうち一つに選択する。量子化器タイプ決定部２１０７は、符号化するビット率が所定基準値より大きく、音声信号の帯域がＷＢ以上であり、内部サンプリング周波数が、符号化する帯域の上限が１６，０００Ｈｚである場合、量子化器タイプを開ループに選択することができる。一方、それ以外の場合には、量子化器タイプを閉ループに選択することができる。

図２２は、本発明の一実施形態による量子化器タイプ選択方法の動作について説明する図面である。図２２において、２２０１段階では、ビット率が所定基準値より大きいか否かを判断する。ここで、所定基準値の例としては、１６．４ｋｂｐｓに設定されたが、それに限定されるものではない。２２０１段階での判断結果、ビット率が所定基準値より低いか、あるいは同一である場合、閉ループタイプを選択する（２２０９段階）。

一方、２２０１段階での判断結果、ビット率が所定基準値より高い場合、２２０３段階では、音声信号の帯域がＮＢより広いか否かを判断する。２２０３段階での判断結果、音声信号の帯域がＮＢである場合、閉ループタイプを選択する（２２０９段階）。

一方、２２０３段階での判断結果、音声信号の帯域がＮＢより広い場合、すなわち、ＷＢ、ＳＷＢそしてＦＢである場合、２２０５段階で、内部サンプリング周波数が１６，０００Ｈｚであるか否かを判断する。２２０５段階での判断結果、内部サンプリング周波数が１６，０００Ｈｚではない場合、閉ループタイプを選択する（２２０９段階）。

一方、２２０５段階での判断結果、内部サンプリング周波数が１６，０００Ｈｚである場合、開ループタイプを選択する（２２０７段階）。

図２３は、本発明の一実施形態によるサウンド復号化装置の構成を示したブロック図である。図２３を参照すれば、サウンド復号化装置２３００は、パラメータ復号化部２３１１、ＬＰＣ係数逆量子化部２３１３、可変モード復号化部２３１５及び後処理部２３１９を含んでもよい。サウンド復号化装置２３００は、エラー復元部２３１７をさらに含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも１つの以上のプロセッサ（図示せず）によって具現される。

パラメータ復号化部２３１１は、ビットストリームから、復号化に使用されるパラメータを復号化することができる。パラメータ復号化部２３１１は、ビットストリームに符号化モードが含まれる場合、符号化モードと、符号化モードに対応するパラメータとを復号化することができる。復号化された符号化モードに対応し、ＬＰＣ係数逆量子化と励起復号化とが行われる。

ＬＰＣ係数逆量子化部２３１３は、ＬＰＣパラメータに含まれた量子化されたＩＳＦ係数またはＬＳＦ係数、ＩＳＦ量子化エラーまたはＬＳＦ量子化エラー、ＩＳＦ予測エラーまたはＬＳＦ予測エラーを逆量子化し、復号化されたＬＳＦ係数を生成し、それを変換してＬＰＣ係数を生成する。

可変モード復号化部２３１５は、ＬＰＣ係数逆量子化部２３１３で生成されたＬＰＣ係数を復号化し、合成信号（synthesized signal）を生成することができる。可変モード復号化部２３１５は、復号化装置に対応する符号化装置によって、図２Ａないし図２Ｄに図示されているような符号化モードに対応して復号化を行うことができる。

エラー復元部２３１７は、可変モード復号化部２３１５での復号化結果、音声信号の現在フレームでエラーが発生したとき、現在フレームを復元するか隠匿することができる。

後処理部２３１９は、可変モード復号化部２３１５で生成された合成信号について、多様なフィルタリングと音質向上処理とを遂行し、最終合成信号、すなわち、復元されたサウンドを生成する。

図２４は、本発明の一実施形態によるＬＰＣ係数逆量子化部の構成を示したブロック図である。図２４に図示されたＬＰＣ係数逆量子化部２４００は、ＩＳＦ／ＬＳＦ逆量子化部２４１１と、係数変換部２４１３とを含んでもよい。

ＩＳＦ／ＬＳＦ逆量子化部２４１１は、ビットストリームに含まれる量子化経路情報に対応し、ＬＳＰパラメータに含まれた量子化されたＩＳＦ係数またはＬＳＦ係数、ＩＳＦ量子化エラーまたはＬＳＦ量子化エラー、ＩＳＦ予測エラーまたはＬＳＦ予測エラーを逆量子化し、復号化されたＬＳＦ係数を生成する。

係数変換部２４１３は、ＩＳＦ／ＬＳＦ逆量子化部２４１１）の逆量子化結果得られる復号化されたＩＳＦ係数またはＬＳＦ係数を、ＩＳＰ（immittance spectral pairs）またはＬＳＰ（linear spectral pairs）に変換し、各サブフレームのために、補間を行う。補間は、以前フレームのＩＳＰ／ＬＳＰと、現在フレームのＩＳＰ／ＬＳとＰを利用して行われる。係数変換部２４１３は、逆量子化されて補間された各サブフレームのＩＳＰ／ＬＳＰを、ＬＰＣ係数に変換することができる。

図２５は、本発明の一実施形態によるＬＰＣ係数逆量子化部の詳細的な構成を示したブロック図である。図２５に図示されたＬＰＣ係数逆量子化部２５００は、量子化経路決定部２５１１、第１逆量子化スキーム２５１３及び第２逆量子化スキーム２５１５を含んでもよい。

量子化経路決定部２５１１は、ビットストリームに含まれた量子化経路情報に基づいてＬＰＣパラメータを、第１逆量子化スキーム２５１３と、第２逆量子化スキーム２５１５とのうち一つに提供することができる。一例として、量子化経路情報は、１ビットで表現されることができる。

第１逆量子化スキーム２５１３は、ＬＰＣパラメータを粗く逆量子化する部分と、ＬＰＣパラメータを精密に逆量子化する部分とを含んでもよい。

第２逆量子化スキーム２５１５は、ＬＰＣパラメータについて、ブロック制限されたトレリス符号化逆量子化を行う部分と、予測部分とを含んでもよい。

第１逆量子化スキーム２５１３と第２逆量子化スキーム２５１５は、前記実施形態に限定されるものではなく、復号化装置に対応する符号化装置によって、前述の多様な実施形態の各第１量子化スキーム及び第２量子化スキームの逆過程を利用して具現される。

前記ＬＰＣ係数逆量子化部の構成は、量子化器構造が開ループ方式または閉ループ方式にかかわらず適用することができる。

図２６は、図２５に図示された第１逆量子化スキームと、第２逆量子化スキームとの一例を示した図面である。図２６を参照すれば、第１逆量子化スキーム２６１０は、符号化端のＭＳＶＱ（図示せず）で生成された第１コードブック・インデックスを利用して、ＬＰＣパラメータに含まれた量子化されたＬＳＦ係数を逆量子化するマルチステージベクトル量子化器（ＭＳＶＱ）２６１１と、符号化端のＬＶＱ（図示せず）で生成された第２コードブック・インデックスを利用して、ＬＰＣパラメータに含まれたＬＳＦ量子化エラーを逆量子化する格子ベクトル量子化器（ＬＶＱ）２６１３と、を含んでもよい。マルチステージベクトル量子化器（ＭＳＶＱ）２６１１で得られる逆量子化されたＬＳＦ係数と、格子ベクトル量子化器（ＬＶＱ）２６１３で得られる逆量子化されたＬＳＦ量子化エラーとを加えた後、所定のＤＣ（direct current）値である平均値を加えれば、最終復号化されたＬＳＦ係数が生成される。

第２逆量子化スキーム２６３０は、符号化端のＢＣ−ＴＣＱ（図示せず）で生成された第３コードブック・インデックスを利用して、ＬＰＣパラメータに含まれたＬＳＦ予測エラーを逆量子化するブロック制限されたトレリス符号化量子化器（ＢＣ−ＴＣＱ）２６３１、フレーム内予測器２６３３及びフレーム間予測器２６３５を含んでもよい。逆量子化過程は、ＬＳＦベクトルのうち最も低いベクトルから始め、フレーム内予測器２６３３は、復号化されたベクトルを利用して、次の順序のベクトル要素のための予測値を生成する。フレーム間予測器２６３５は、以前フレームで復号化されたＬＳＦ係数を利用して、フレーム間予測を介して、予測値を生成する。ブロック制限されたトレリス符号化逆量子化器（ＢＣ−ＴＣＱ）２６３１と、フレーム内予測器２６３３とを介して得られるＬＳＦ係数に、フレーム間予測器２６３５で得られるフレーム間予測値を加え、さらに所定のＤＣ値である平均値を加えれば、最終復号化されたＬＳＦ係数が生成される。

第１逆量子化スキーム２６１０と、第２逆量子化スキーム２６３０は、前記実施形態に限定されるものではなく、復号化装置に対応する符号化装置によって、前述の多様な実施形態の各第１量子化スキーム及び第２量子化スキームの逆過程を利用して具現される。

図２７は、本発明の一実施形態による量子化方法の動作について説明するフローチャートである。図２７を参照すれば、２７１０段階では、受信されたサウンドの量子化以前に、所定基準に基づいて、受信されたサウンドの量子化経路を選択する。一実施形態では、フレーム間予測を使用しない第１経路と、フレーム間予測を使用する第２経路とのうち一つが選択される。

２７３０段階では、第１経路及び第２経路のうち選択された量子化経路を確認する。

２７５０段階では、２７３０段階での確認結果、量子化経路として第１経路が選択された場合、第１量子化スキームを利用して、受信されたサウンドを量子化する。

２７７０段階では、２７３０段階での確認結果、量子化経路として第２経路が選択された場合、第２量子化スキームを利用して、受信されたサウンドを量子化する。

２７１０段階での量子化経路決定過程は、前述の多様な実施形態を介して遂行される。２７５０段階及び２７７０段階での量子化過程は、前述の多様な実施形態の各第１量子化スキーム及び第２量子化スキームを利用して遂行される。

前記実施形態では、選択可能な量子化経路として、第１経路及び第２経路を設定したが、第１経路及び第２経路を含む複数の経路で設定することができ、図２７のフローチャートも、設定された複数の経路に対応して変形されもする。

図２８は、本発明の一実施形態による逆量子化方法の動作について説明するフローチャートである。図２８を参照すれば、２８１０段階では、ビットストリームに含まれた線形予測符号化（ＬＰＣ）パラメータを復号化する。

２８３０段階では、ビットストリームに含まれた量子化経路をチェックし、２７５０段階では、第１経路及び第２経路のうちチェックされた経路を確認する。

２８７０段階では、２８５０段階での確認結果、量子化経路が第１経路である場合、第１逆量子化スキームを利用して、復号化されたＬＰＣパラメータを逆量子化する。

２８９０段階では、２８５０段階での確認結果、量子化経路が第２経路である場合、第２逆量子化スキームを利用して、復号化されたＬＰＣパラメータを逆量子化する。

２８７０段階及び２８９０段階での逆量子化過程は、復号化装置に対応する符号化装置によって、前述の多様な実施形態の各第１量子化スキーム及び第２量子化スキームの逆過程を利用して遂行される。

前記実施形態では、チェックされた量子化経路として、第１経路及び第２経路を設定したが、第１経路及び第２経路を含む複数の経路で設定することができ、図２８のフローチャートも設定された複数の経路に対応して変形されもする。

図２７及び図２８の方法は、プログラミングされ、少なくとも１つのプロセッシング・デバイスによって遂行される。また、前記実施形態は、望ましくは、フレーム単位で遂行される。

図２９は、本発明の一実施形態による符号化モジュールを含む電子機器の構成を示したブロック図である。図２９に図示された電子機器２９００は、通信部２９１０、と符号化モジュール２９３０とを含んでもよい。また、符号化の結果として得られるサウンド・ビットストリームの用途によって、サウンド・ビットストリームを保存する保存部２９５０をさらに含んでもよい。また、電子機器２９００は、マイク２９７０をさらに含んでもよい。すなわち、保存部２８５０とマイク２９７０は、オプションとして具備される。一方、図２９に図示された電子機器２９００は、任意の復号化モジュール（図示せず）、例えば、一般的な復号化機能を遂行する復号化モジュール、または本発明の一実施形態による復号化モジュールをさらに含んでもよい。ここで、符号化モジュール２９３０は、電子機器２９００に具備される他の構成要素（図示せず）と共に一体化され、少なくとも１つの以上のプロセッサ（図示せず）によって具現される。

図２９を参照すれば、通信部２９１０は、外部から提供されるサウンドと、符号化されたビットストリームとのうち少なくとも一つを受信したり、あるいは復元されたサウンドと、符号化モジュール２９３０の符号化結果として得られるサウンド・ビットストリームとのうち少なくとも一つを送信することができる。

通信部２９１０は、無線インターネット、無線イントラネット、無線電話網、無線ＬＡＮ（local area network）、Ｗｉ−Ｆｉ（wireless fidelity）、Ｗｉ−Ｆｉダイレクト（ＷＦＤ：Ｗｉ−Ｆｉ direct）、３Ｇ（３^ｒｄ generation）、４Ｇ（４^ｔｈ generation）、ブルートゥース（登録商標（Bluetooth）、赤外線通信（ＩｒＤＡ：infrared data association）、ＲＦＩＤ（radio frequency identification）、ＵＷＢ（ultra wideband）、ジグビー（登録商標（Zigbee））、ＮＦＣ（near field communication）のような無線ネットワーク；または有線電話網、有線インターネットのような有線ネットワークを介して、外部の電子機器とデータを送受信することができるように構成される。

符号化モジュール２９３０は、通信部２９１０またはマイク２９７０を介して提供されるサウンドの量子化以前に、所定基準に基づいて、フレーム間予測を使用しない第１経路と、フレーム間予測を使用する第２経路とのうち一つを、サウンドの量子化経路として選択し、選択された量子化経路によって、第１量子化スキームと、第２量子化スキームとのうち一つを利用してサウンドを量子化し、量子化されたサウンドを符号化し、ビットストリームを生成することができる。

ここで、第１量子化スキームは、受信されたサウンドを粗量子化する第１量子化器（図示せず）；及び受信されたサウンドと、第１量子化器の出力信号との間の量子化エラー信号を精密に量子化する第２量子化器（図示せず）；を含んでもよい。第１量子化スキームは、望ましくは、受信されたサウンドを量子化するマルチステージベクトル量子化器（ＭＳＶＱ）（図示せず）；及び受信されたサウンドと、マルチステージベクトル量子化器の出力との間のエラー信号を量子化する格子ベクトル量子化器（ＬＶＱ）（図示せず）；を含んでもよい。また、第１量子化スキームは、前述のように、多様な実施形態のうち一つで具現することができる。

一方、第２量子化スキームは、望ましくは、入力サウンドについて、フレーム間予測を行うフレーム間予測器（図示せず）、予測エラーについて、フレーム内予測を行うフレーム内予測器（図示せず）、及び予測エラーを量子化するブロック制限されたトレリス符号化量子化器（ＢＣ−ＴＣＱ）（図示せず）を含んでもよい。同様に、第２量子化スキームは、前述のように、多様な実施形態のうち一つで具現することができる。

保存部２９５０は、符号化モジュール２９３０で生成される符号化されたビットストリームを保存することができる。一方、保存部２９５０は、電子機器２９００の運用に必要な多様なプログラムを保存することができる。

マイク２９７０は、ユーザまたは外部のサウンドを、符号化モジュール２９３０に提供することができる。

図３０は、本発明の一実施形態による復号化モジュールを含む電子機器の構成を示したブロック図である。図３０に図示された電子機器３０００は、通信部３０１０と、復号化モジュール３０３０を含んでもよい。また、復号化の結果として得られる復元されたサウンドの用途によって、復元されたサウンドを保存する保存部３０５０をさらに含んでもよい。また、電子機器３０００は、スピーカ３０７０をさらに含んでもよい。すなわち、保存部３０５０とスピーカ３０７０は、オプションとして具備される。一方、図３０に図示された電子機器３０００は、任意の符号化モジュール（図示せず）、例えば、一般的な符号化機能を遂行する符号化モジュール、または本発明の一実施形態による符号化モジュールをさらに含んでもよい。ここで、復号化モジュール３０３０は、電子機器３０００に具備される他の構成要素（図示せず）と共に一体化され、少なくとも１つの以上のプロセッサ（図示せず）によって具現される。

図３０を参照すれば、通信部３０１０は、外部から提供される符号化されたビットストリームと、サウンドとのうち少なくとも一つを受信したり、あるいは復号化モジュール３０３０の復号化結果として得られる復元されたサウンドと、符号化の結果として得られるサウンド・ビットストリームとのうち少なくとも一つを送信することができる。一方、通信部３０１０は、図２８の通信部３０１０と、実質的に類似して具現される。

復号化モジュール３０３０は、通信部３０１０を介して提供されるビットストリームに含まれた線形予測符号化パラメータを復号化し、ビットストリームに含まれた経路情報に基づいて、フレーム間予測を使用しない第１逆量子化スキームと、フレーム間予測を使用する第２逆量子化スキームとのうち一つを利用して、復号化された線形予測符号化パラメータを逆量子化し、逆量子化された線形予測符号化パラメータを復号化し、復元されたサウンドを生成することができる。ここで、復号化モジュール３０３０は、ビットストリームに符号化モードが含まれる場合、逆量子化された線形予測符号化パラメータを、復号化された符号化モードに対応して復号化することができる。

ここで、第１逆量子化スキームは、線形予測符号化パラメータを粗く逆量子化する第１逆量子化器（図示せず）と、線形予測符号化パラメータを精密に逆量子化する第２逆量子化器（図示せず）と、を含んでもよい。第１逆量子化スキームは、望ましくは、第１コードブック・インデックスを利用して線形予測符号化パラメータを逆量子化するマルチステージベクトル量子化器（ＭＳＶＱ）（図示せず）；及び第２コードブック・インデックスを利用して線形予測符号化パラメータを逆量子化する格子ベクトル量子化器（ＬＶＱ）（図示せず）；を含んでもよい。また、第１逆量子化スキームは、図２８に説明された第１量子化スキームと可逆的な動作を遂行するので、復号化装置に対応する符号化装置によって、前述のように、第１量子化スキームの多様な実施形態の各逆過程で具現することができる。

一方、第２逆量子化スキームは、望ましくは、第３コードブック・インデックスを利用して、線形予測符号化パラメータを逆量子化するブロック制限されたトレリス符号化量子化器（ＢＣ−ＴＣＱ）（図示せず）、フレーム内予測器（図示せず）及びフレーム間予測器（図示せず）を含んでもよい。同様に、第２逆量子化スキームは、図２８に説明された第２量子化スキームと可逆的な動作を遂行するので、復号化装置に対応する符号化装置によって、前述のように、第２量子化スキームの多様な実施形態の各逆過程で具現することができる。

保存部３０５０は、復号化モジュール３０３０で生成される復元されたサウンドを保存することができる。一方、保存部３０５０は、電子機器３０００の運用に必要な多様なプログラムを保存することができる。

スピーカ３０７０は、復号化モジュール３０３０で生成される復元されたサウンドを外部に出力することができる。

図３１は、本発明の一実施形態による符号化モジュールと、復号化モジュールとを含む電子機器の構成を示したブロック図である。図３１に図示された電子機器３１００は、通信部３１１１０、符号化モジュール３１２０及び復号化モジュール３１３０を含んでもよい。また、符号化の結果として得られるサウンド・ビットストリーム、または復号化の結果として得られる復元されたサウンドの用途によって、サウンド・ビットストリームまたは復元されたサウンドを保存する保存部３１４０をさらに含んでもよい。また、電子機器３１００は、マイク３１５０またはスピーカ３１６０をさらに含んでもよい。ここで、符号化モジュール３１２０と、復号化モジュール３１３０は、電子機器３１００に具備される他の構成要素（図示せず）と共に一体化され、少なくとも１つの以上のプロセッサ（図示せず）によって具現される。

図３１に図示された各構成要素は、図２９に図示された電子機器２９００の構成要素、または図３０に図示された電子機器３０００の構成要素と重複するので、その詳細な説明は省略する。

図２９ないし図３１に図示された電子機器２９００，３０００，３１００には、電話、モバイルフォンなどを含む音声通信専用端末；ＴＶ（television）、ＭＰ３プレーヤなどを含む放送専用装置または音楽専用装置；または音声通信専用端末と、放送専用装置または音楽専用装置のと融合端末装置が含まれるが、それらに限定されるものではない。また、電子機器２９００，３０００，３１００は、クライアント、サーバ、またはクライアントとサーバとの間に配置される変換器として使用される。

一方、電子機器２９００，３０００，３１００が、例えば、モバイルフォンである場合、図示されていないが、キーパッドのようなユーザ入力、ユーザインターフェース、またはモバイルフォンで処理される情報をディスプレイするディスプレイ部；及びモバイルフォンの全般的な機能を制御するプロセッサ；をさらに含んでもよい。また、モバイルフォンは、撮像機能を有するカメラ部と、モバイルフォンで必要とする機能を遂行する少なくとも一つ以上の構成要素と、をさらに含んでもよい。

一方、電子機器２９００，３０００，３１００が、例えば、ＴＶである場合、図示されていないが、キーパッドのようなユーザ入力、受信された放送情報をディスプレイするディスプレイ部；及びＴＶの全般的な機能を制御するプロセッサ；をさらに含んでもよい。また、ＴＶで必要とする機能を遂行する少なくとも一つ以上の構成要素をさらに含んでもよい。

一方、ＬＰＣ係数量子化／逆量子化と係わって採用されるＢＣ−ＴＣＱと係わる内容は、ＵＳ７６３０８９０号明細書（Block-constrained ＴＣＱ method, and method and apparatus for quantizing ＬＳＦ parameter employing the same in speech coding system）に詳細に説明されている。そして、ＬＶＡ方式と係わる内容は、ＵＳ２００７０２３３４７３号明細書（Multi-path trellis coded quantization method and Multi-path trellis coded quantizer using the same）に詳細に説明されている。

前記実施形態による量子化法、逆量子化法、符号化法、及び復号化法は、コンピュータで実行されるプログラムに作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。また、前述の本発明の実施形態で使用されるデータ構造、プログラム命令またはデータファイルは、コンピュータで読み取り可能な記録媒体に多様な手段を介しても記録される。コンピュータで読み取り可能な記録媒体は、コンピュータ・システムによって読み取り可能なデータが保存される全ての種類の保存装置を含んでもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー（登録商標）ディスク及び磁気テープのような磁気媒体（magnetic media）；ＣＤ（compact disc）−ＲＯＭ（read only memory）、ＤＶＤ（digital versatile disk）のような光記録媒体（optical media）；フロプティカルディスク（floptical disk）のような磁気・光媒体（magneto-optical media）；及びＲＯＭ、ＲＡＭ（random access memory）、フラッシュメモリのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置；が含まれる。また、コンピュータで読み取り可能な記録媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体でもある。プログラム命令の例としては、コンパイラによって作われるような機械語コードだけではなく、インタ−プリタなどを使用し、コンピュータによって実行される高級言語コードを含んでもよい。

以上、本発明の一実施形態は、たとえ限定された実施形態と図面とによって説明されたにしても、本発明の一実施形態は、前述の実施形態に限定されるものではなく、それは、本発明が属する分野で当業者であるならば、そのような記載から、多様な修正及び変形が可能である。従って、本発明のスコープは、前述の説明ではなく、特許請求の範囲に示されており、それと均等であるか、あるいは等価的変形は、いずれも本発明技術的思想の範疇に属するものである。

Claims

入力信号の予測モード、予測エラー及び伝送チャンネル状態のうち少なくとも一つを考慮し、フレーム間予測を使用しない第１量子化スキームと、フレーム間予測を使用する第２量子化スキームとのうち一つをスイッチングして入力信号を量子化する段階を含む量子化方法。
前記第１量子化スキームは、前記入力信号を粗量子化する第１量子化プロセス；及び前記入力信号と前記第１量子化プロセスの出力信号との間の量子化エラー信号を精密に量子化する第２量子化プロセス；を含むことを特徴とする請求項１に記載の量子化方法。
前記第２量子化スキームは、ブロック制限されたトレリス符号化量子化器（ＢＣ−ＴＣＱ）を含むことを特徴とする請求項１に記載の量子化方法。
前記ブロック制限されたトレリス符号化量子化器は、加重歪曲を利用して、量子化インデックスを決定することを特徴とする請求項３に記載の量子化方法。
前記予測エラーは、前記入力信号の重要度と係わる加重関数を利用して、得られることを特徴とする請求項１に記載の量子化方法。
前記加重関数は、前記入力信号の周波数帯域、符号化モード及びスペクトル分析情報のうち少なくとも一つ以上を利用して決定されることを特徴とする請求項５に記載の量子化方法。
前記入力信号が、非静的である場合、前記第１量子化スキームが選択されることを特徴とする請求項１に記載の量子化方法。
前記入力信号が、静的である場合、前記予測エラーを考慮し、前記第１量子化スキームと、前記第２量子化スキームとのうち一つが選択されることを特徴とする請求項１に記載の量子化方法。
前記入力信号の量子化段階は、
前記入力信号の予測モードを判断する段階と、
前記入力信号の予測モードを利用して、前記入力信号の量子化スキームを、前記第１量子化スキームまたは前記第２量子化スキームとして選択する段階と、
前記入力信号の予測モードを利用して、前記入力信号の量子化スキームが決定されない場合、前記入力信号の現在フレームと以前フレームとから得られた第１予測エラーを利用して、前記入力信号の量子化スキームを、前記第１量子化スキームと、前記第２量子化スキームとのうち一つに決定する段階と、を含むことを特徴とする請求項１に記載の量子化方法。
前記入力信号の量子化段階は、前記以前フレームにエラーが生じた場合、前記現在フレームと、前記以前フレームの以前フレームとから得られた第２予測エラーを利用して、前記入力信号の量子化スキームを、前記第１量子化スキームと、前記第２量子化スキームとのうち一つに決定する段階を含むことを特徴とする請求項８に記載の量子化方法。
前記入力信号の量子化段階は、前記伝送チャンネル状態によって、前記第１量子化スキームの選択比率を調節することを特徴とする請求項１に記載の量子化方法。
前記入力信号の量子化段階は、前記伝送チャンネル状態の安定度が、所定臨界値以下である場合、前記第１量子化スキームだけ選択することを特徴とする請求項１１に記載の量子化方法。
ビットストリームに含まれた経路情報に基づいて、フレーム間予測を使用しない第１逆量子化スキームと、フレーム間予測を使用する第２逆量子化スキームとのうち一つをスイッチングし、入力信号を逆量子化する段階を含み、
前記経路情報は、符号化端で、前記入力信号の予測モード、予測エラー及び伝送チャンネル状態のうち少なくとも一つを考慮し、決定される逆量子化方法。
前記第１逆量子化スキームは、線形予測符号化パラメータを粗く逆量子化する第１逆量子化プロセスと、前記線形予測符号化パラメータを精密に逆量子化する第２逆量子化プロセスと、を含むことを特徴とする請求項１３に記載の逆量子化方法。
入力信号の符号化モードを決定する段階と、
予測モード、予測エラー及び伝送チャンネル状態のうち少なくとも一つを考慮し、フレーム間予測を使用しない第１量子化スキームと、フレーム間予測を使用する第２量子化スキームとのうち一つをスイッチングし、前記入力信号を量子化する段階と、
前記第１量子化スキームと、前記第２量子化スキームとのうち一つを介して量子化された入力信号を、前記符号化モードに対応して符号化する段階と、
前記第１量子化スキームによって量子化された結果と、前記第２量子化スキームによって量子化された結果とのうち一つ；前記入力信号の前記符号化モード；及び前記入力信号の量子化と係わる経路情報；を含むビットストリームを生成する段階と、を含む符号化方法。
ビットストリームに含まれた線形予測符号化パラメータと、符号化モードとを復号化する段階と、
前記ビットストリームに含まれた経路情報に基づいて、線形予測符号化パラメータについて、フレーム間予測を使用しない第１逆量子化スキームと、前記フレーム間予測を使用する第２逆量子化スキームとのうち一つを利用して逆量子化する段階と、
前記逆量子化された線形予測符号化パラメータを、前記復号化された符号化モードに対応して復号化する段階と、を含み、
前記ビットストリームに含まれた経路情報は、符号化端で、入力信号の予測モード、予測エラー及び伝送チャンネル状態のうち少なくとも一つを考慮し、決定される復号化方法。
請求項１に記載の方法を遂行するプログラムを記録したコンピュータで読み取り可能な記録媒体。
請求項１３に記載の方法を遂行するプログラムを記録したコンピュータで読み取り可能な記録媒体。
請求項１５に記載の方法を遂行するプログラムを記録したコンピュータで読み取り可能な記録媒体。
請求項１６に記載の方法を遂行するプログラムを記録したコンピュータで読み取り可能な記録媒体。
入力信号のビット率を第１基準値と比較する段階と、
前記入力信号の帯域を第２基準値と比較する段階と、
内部サンプリング周波数を第３基準値と比較する段階と、
前記一つ以上の比較結果に基づいて、前記入力信号の量子化器タイプを、開ループ並びに閉ループのうち一つに決定する段階と、を含む量子化器タイプ決定方法。