JP6641302B2

JP6641302B2 - 低遅延符号化／復号のための補間による音声信号のリサンプリング

Info

Publication number: JP6641302B2
Application number: JP2016574394A
Authority: JP
Inventors: バラーツ・コヴシー; ステファーヌ・ラゴ
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2014-06-27
Filing date: 2015-06-25
Publication date: 2020-02-05
Anticipated expiration: 2035-06-25
Also published as: EP3161659A1; PT3161659T; KR102304285B1; US20170133027A1; ES2928307T3; FR3023036A1; JP2017526950A; CN106462557A; KR20170024059A; CN106462557B; EP3161659B1; EP4047492A1; US10510357B2; WO2015197989A1; PL3161659T3

Description

本発明は、その伝送または格納のための可聴周波数信号の処理に関する。より具体的には、本発明は、可聴周波数信号のコード化または復号時のサンプリング周波数の変更に関する。

語音または音楽などの可聴周波数信号を圧縮する（損失を伴う）ための多くの技法がある。コード化は、例えば、ＩＴＵ−Ｔ推奨Ｇ．７１１またはＧ．７２９（入力信号が８ｋＨｚでサンプリングされ、コーダおよびデコーダがこの同じ周波数で動作する）にあるような入力信号のサンプリング周波数で直接実行することができる。

しかし、いくつかのコード化方法は、サンプリング周波数の変更を使用して、例えば、コード化の複雑性を低減するか、コード化される異なる周波数サブバンドに従ってコード化を適応させるか、またはそれがコーダの事前に定義された内部サンプリング周波数と一致するように入力信号を変換する。

ＩＴＵ−Ｔ推奨Ｇ．７２２で定義されるサブバンドコード化では、１６ｋＨｚでの入力信号は、ＡＤＰＣＭ（適応差分パルス符号変調）タイプのコーダによって別々にコード化される２つのサブバンド（８ｋＨｚでサンプリングされる）に分割される。この２つのサブバンドへの分割は、２３次の有限インパルス応答（ＦＩＲ）の二次ミラーフィルタバンクによって行われ、それにより、理論上、１６ｍｓで２３個のサンプルの分析合成遅延（コーダ＋デコーダ）が生じる。このフィルタバンクは、多相の実装で採用される。Ｇ．７２２における２つのサブバンドへの分割により、既定の方法で、それらの先験的な知覚的重要度に従って異なるビットレートを２つのサブバンドに割り当てることが可能になり、また、低周波数でＡＤＰＣＭタイプの２つのコーダを実行することによって全体的なコード化の複雑性を低減することも可能になる。しかし、それは、直接のＡＤＰＣＭコード化と比べてアルゴリズム遅延を引き起こす。

例えば、非包括的な方法で、ＦＩＲ（有限インパルス応答）フィルタ、ＩＩＲ（無限インパルス応答）フィルタまたは多項式補間（スプラインを含む）を使用することにより、デジタル信号のサンプリング周波数を変更する（リサンプリングとも呼ばれる）ための様々な方法が知られている。従来のリサンプリング方法のレビューは、例えば、Ｒ．Ｗ．Ｓｃｈａｆｅｒ，Ｌ．Ｒ．Ｒａｂｉｎｅｒによる論文、ＡＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＡｐｐｒｏａｃｈｔｏＩｎｔｅｒｐｏｌａｔｉｏｎ，ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥ，ｖｏｌ．６１，Ｎｏ．６，Ｊｕｎｅ１９７３，ｐｐ．６９２−７０２に見ることができる。

ＦＩＲフィルタ（対称）の利点は、その簡略化された実装形態（特定の条件付き）および線形位相を保証する可能性にある。線形位相フィルタリングは、入力信号の波形の保存を可能にするが、過渡信号上のプレエコータイプのアーチファクトを生成し得る時間的拡散（リンギング）を伴う可能性もある。この方法は、適切なフィルタリング特性（帯域内リップル、エイリアシングまたはスペクトル画像を取り除くのに十分な拒絶レベルなど）を保証するために、一般に、ほぼ１〜数ｍｓ程度の遅延（インパルス応答の長さの関数である）を生じさせる。

リサンプリングのための別の代替形態は、多項式補間技法を使用することである。多項式補間は、とりわけ、近い周波数（例えば、１６ｋＨｚ〜１２．８ｋＨｚ）でのアップサンプリングまたはダウンサンプリングに効果的である。

高い比率（例えば、３２ｋＨｚ〜１２．８ｋＨｚ）でのダウンサンプリングの事例の場合、多項式補間は、高周波数（３２ｋＨｚ〜１２．８ｋＨｚのダウンサンプリングの例では、６．４ｋＨｚ〜１６ｋＨｚの周波数に関与する）が原因でエイリアシングを取り除かないため、最適な方法ではない。フィルタリング技法上の多項式補間の利点は、低遅延（ゼロ遅延でさえも）であり、一般に、より低い複雑性でもある。補間の使用は、とりわけ、例えば、本発明の実施形態において後に説明されるフィルタメモリなど、短い長さ（１０程度のサンプル）のベクトルのリサンプリングに有利である。

最もよく知られ最も広く使用されている多項式補間技法は、補間の局所的または非局所的性質に応じた、かつｋ次導関数の連続性の可能な制約に従った、いくつかの変形形態における線形補間、放物線補間、キュービック補間である。

ここでは、事前に定義されたポイントから多項式曲線のパラメータが特定される、いわゆるラグランジュ補間の単純な事例がより詳細に考慮される。補間されるポイントの数が補間に厳密に必要な事前に定義されたポイントの数より大きい場合、この補間は局所的に繰り返されることが想定される。先行技術では、ｋ次連続導関数の連続性の制約を有する区分的多項式に相当する補間「スプライン」またはＢスプラインなどのより洗練された技法がよく知られているが、本発明はそれらとは区別されるため、ここでは再検討しない。

図１は、一次線形補間（ｏ１、点線）、二次放物線補間（０２、不連続線）、三次キュービック補間（０３、実線）および四次補間（ｏ４、一点鎖線）の間の比較を示す。

線形補間の場合、２つのポイントは、方程式がｖｌ（ｘ）＝ａ１^＊ｘ＋ｂ１である直線を決定する。図１では、間隔［０，１］の範囲を定める瞬間ポイントｘ＝０およびｘ＝１が使用された。これらのポイントの値がｖ（０）およびｖ（１）のそれぞれである場合、係数ａ１およびｂ１は以下の通り得られる。
ａ１＝ｖ（１）−ｖ（０）
ｂ１＝ｖ（０）
直線の係数ａ１およびｂ１は、単一の加法演算を使用して得られ、補間サンプルｖｌ（ｘ）の演算は、加法演算および乗法演算または乗法加法演算（ＭＡＣ）を要する。

放物線補間の場合、３つのポイントは、方程式がｖｐ（ｘ）＝ａ２^＊ｘ^２＋ｂ２^＊ｘ＋ｃ２である放物線を決定する。図１では、２つの間隔［−１，０］および［０，１］の範囲を定める瞬間ポイントｘ＝−１、ｘ＝０およびｘ＝１が使用された。これらのポイントの値がｖ（−１）、ｖ（０）およびｖ（１）のそれぞれである場合、係数ａ２、ｂ２およびｃ２は以下の通り得られる。
ａ２＝（ｖ（−１）＋ｖ（１））／２−ｖ（０）
ｂ２＝ｖ（１）−ｖ（０）−ａ２
ｃ２＝ｖ（０）
放物線の係数ａ２、ｂ２およびｃ２を得るには、４つの加法演算および１つの乗法演算、または３つの加法演算および１つのＭＡＣ演算が必要とされる。補間サンプルｖｐ（ｘ）の演算は、２つの加法演算および３つの乗法演算、または１つの乗法演算および２つのＭＡＣ演算を要する。

キュービック補間の場合、４つのポイントは、方程式がｖｃ（ｘ）＝ａ３^＊ｘ^３＋ｂ３^＊ｘ^２＋ｃ３^＊ｘ＋ｄ３である三次曲線を決定する。図１では、３つの間隔［−１，０］、［０，１］および［１，２］の範囲を定める瞬間ポイントｘ＝−１、ｘ＝０、ｘ＝１およびｘ＝２が使用された。これらのポイントの値がｖ（−１）、ｖ（０）、ｖ（１）およびｖ（２）のそれぞれである場合、係数ａ３、ｂ３、ｃ３およびｄ３は以下の通り得られる。
ｂ３＝（ｖ（−１）＋ｖ（１））／２−ｖ（０）
ａ３＝（ｖ（−１）＋ｖ（２）−ｖ（０）−ｖ（１）−４^＊ｂ３）／６
ｃ３＝ｖ（１）−ｖ（０）−ｂ３−ａ３
ｄ３＝ｖ（０）
三次曲線の係数ａ３、ｂ３、ｃ３およびｄ３を得るには、９つの加法演算および３つの乗法演算、または７つの加法演算、２つのＭＡＣ演算および１つの乗法演算が必要とされる。補間サンプルｖｃ（ｘ）の演算は、３つの加法演算および６つの乗法演算、または最適化による２つの乗法演算および３つのＭＡＣ演算を要する。

四次補間の場合、５つのポイントは、方程式がｖ４（ｘ）＝ａ４^＊ｘ^４＋ｂ４^＊ｘ^３＋ｃ４^＊ｘ^２＋ｄ４^＊ｘ＋ｅ４である四次曲線を決定する。図１では、４つの間隔［−２，−１］、［−１，０］、［０，１］および［１，２］の範囲を定める瞬間ポイントｘ＝−２、ｘ＝−１、ｘ＝０、ｘ＝１およびｘ＝２が使用された。これらのポイントの値がｖ（−２）、ｖ（−１）、ｖ（０）、ｖ（１）およびｖ（２）のそれぞれである場合、係数ａ４、ｂ４、ｃ４、ｄ４およびｅ４は以下の通り得られる。
ｖｔ１＝ｖ（−２）＋ｖ（２）−２^＊ｖ（０）
ｖｔ２＝ｖ（−１）＋ｖ（１）−２^＊ｖ（０）
ｖｔ３＝ｖ（２）−ｖ（−２）
ｖｔ４＝ｖ（１）−ｖ（−１）
ａ４＝（ｖｔ１−４^＊ｖｔ２）／２４
ｂ４＝（ｖｔ３−２^＊ｖｔ４）／１２
ｃ４＝（１６^＊ｖｔ２−ｖｔ１）／２４
ｄ４＝（８^＊ｖｔ４−ｖｔ３）／１２
ｅ４＝ｖ（０）
四次曲線の係数ａ４、ｂ４、ｃ４、ｄ４およびｅ４を得るには、１０の加法演算および１０の乗法演算、または６つの加法演算、８つのＭＡＣ演算および２つの乗法演算が必要とされる。補間サンプルｖｃ（ｘ）の演算は、４つの加法演算および１０の乗法演算、または最適化による３つの乗法演算および４つのＭＡＣ演算を要する。

曲線の係数、例えば、三次曲線の係数ａ３、ｂ３、ｃ３およびｄ３を演算するため、一般性を失うことなく、あたかも４つの連続入力サンプルが演算を簡略化するためのインデックスｘ＝−１、ｘ＝０、ｘ＝１およびｘ＝２のサンプルであるかのように、４つの連続入力サンプルを考慮することが推奨される。

信号のリサンプリングが実行される際には、リサンプリングされる信号の２つの既知のポイントによって範囲が定められた間隔内の、これらの２つのポイント間の信号の値を知っていることが望ましい。例えば、係数２のアップサンプリングの場合、ｘ＝０．５に対する信号の値を推定する必要がある。この推定を行うため、値ｖｌ（０．５）、ｖｐ（０．５）またはｖｃ（０．５）のうちの１つが単に演算される。

線形補間を使用することにより、２つの既知の近隣のポイント（ｘ＝０．５を演算するにはｘ＝０およびｘ＝１、ｘ＝１．５を演算するにはｘ＝１およびｘ＝２）をリンクする直線が使用される。

二次補間の事例では、放物線を決定する３つのポイントは２つの間隔の範囲を定めるため、２つの可能な放物線間における選択がある。例えば、ｘ＝０．５の場合、ポイントｘ＝−１、ｘ＝０およびｘ＝１、またはポイントｘ＝０、ｘ＝１およびｘ＝２をリンクする曲線を取ることが可能である。実験的には、２つの解決策が同じ性質のものであることをチェックすることが可能である。有利には、複雑性を低減するため、２つの間隔に対して単一の放物線を使用することが可能である。この簡略化は、以下で放物線補間について論じる際に使用される。

三次補間の事例では、三次曲線は、３つの間隔（端の２つの間隔および中央の１つの間隔）の範囲を定める４つの入力サンプルを通過する。一般におよび図６に提示される結果として、中央の間隔［０，１］は、瞬間ポイントｘ＝−１、０、１および２から補間を実行するために使用される。

四次補間の事例では、曲線は、４つの間隔（端の２つの間隔および中央の２つの間隔）の範囲を定める５つの入力サンプルを通過する。実験的には、中央の２つの間隔のうちの１つの使用はより良好な結果を与え、中央の２つの間隔は同じ品質を与えることを示し得る。放物線の事例のように、ここでは、２つの入力サンプルのグループごとに進めることも可能である。

先行技術のこれらの補間の性能レベルを比較するため、２００Ｈｚ〜６４００Ｈｚの周波数および２００Ｈｚのピッチを有する一連の正弦曲線は、両方とも１２，８００Ｈｚおよび３２，０００Ｈｚのサンプリング周波数で生成された。次いで、１２，８００Ｈｚの正弦曲線は、３２ｋＨｚにアップサンプリングされ、各正弦曲線周波数に対しておよび各補間方法（ＦＩＲによるリサンプリングに対する遅延補償で）に対して信号対雑音比（ＳＮＲ）が測定された。ここでは、入力周波数での現行のサンプリングと一致するようにするために、瞬間ｘ０をシフトすることによって補間が実行されたことに留意することが重要である。従って、補間は、遅延なしで行われる。リサンプリングされる入力信号のエッジのサンプル（すなわち、最初のサンプルおよび最後のサンプル）は無視された。図２は、線形補間（「ｌｉｎ」）、放物線または二次補間（「ｏ２」、２つの間隔に対する１つの放物線を使用することによる）、キュービックまたは三次補間（「ｏ３」、中央の間隔を使用することによる）、四次補間（「ｏ４」、２つの間隔に対する四次曲線の中央の２つの間隔を使用することによる）、キュービック「スプライン」補間（「スプライン」、Ｍａｔｌａｂ「スプライン」コマンドを使用することによる）およびＦＩＲフィルタリングによるリサンプリング（「ＦＩＲ」、「ｓ３２＝ｒｅｓａｍｐｌｅ（ｓ１２，５，２，３０）」というＭａｔｌａｂコマンドを使用することによる）で得られた結果を要約する。結果は、ＦＩＲフィルタリングが、より高い複雑性および結果として生じるアルゴリズム遅延（ここでは、あたかもそれがゼロ位相フィルタであるかのようにＦＩＲフィルタのインパルス応答を使用することによって補償される）という代償を払って、５５００Ｈｚまでのすべての周波数に対してより良好な準一定のＳＮＲを与えることを示す。異なる補間は、低周波数に対して良好な性能レベルを有するが、ＳＮＲは、周波数の増加と共に急激に降下する。補間次数が高いほど、結果はより良好なものとなるが、この改善は、スペクトルの後半において制限され、スペクトルの後半では、三次補間と四次補間との差はわずかであり、第４四半スペクトルでは存在しない。キュービック補間を用いると、ＳＮＲは、２５００Ｈｚより高い周波数に対しては３０ｄＢ未満であり、この限度は、四次補間の場合には２８００Ｈｚである。より高い複雑性という代償を払って、３５００Ｈｚにおいて３０ｄＢでの最高の補間性能レベルを提供するのは、キュービック「スプライン」補間である。以下では、ＦＩＲ補間が基準と見なされる。また、ＳＮＲは、語音信号（ＦＩＲによって得られた参照信号と比べて）に対しても測定された。得られた信号対雑音比は、線形補間では３４．７ｄＢ、放物線補間では３５．５ｄＢ、キュービック補間では３８．２ｄＢ、四次補間では３７．９ｄＢ、キュービック「スプライン」補間では４１．４ｄＢである。従って、３より高い次数の補間にはあまり関心はなく、この次数の増加は実信号に対しては測定できないと結論付けることができる。以下では、四次補間の事例は考慮されない。

図３は、実際の事例における１２，８００Ｈｚ〜３２，０００Ｈｚの補間を示す。正方形の印は、１２，８００Ｈｚでの信号のサンプルを表し、三角形の印は、ＦＩＲ方法によって３２，０００Ｈｚにアップサンプリングされた信号サンプルを表し、以下で基準として使用される参照信号を与える。垂直の点線は、３２ｋＨｚでのサンプリング瞬間を与える。この例では、１２．８ｋＨｚでの２つの入力サンプルに対して、３２ｋＨｚでの５つの出力サンプルが得られ、その１つは、入力サンプルのものと同一である（依然としてコピー動作を必要とする）ことが観察されるであろう。２つのサンプルは、１２．８ｋＨｚでの連続入力サンプルの間、１つの間隔ごとに補間される。従って、加算、乗算またはＭＡＣ演算はすべて同じ重みを有する（大部分の信号処理プロセッサまたはデジタル信号プロセッサＤＳＰに対する事例である）と想定することにより、２つの入力サンプルに対して、異なる補間に対する演算複雑性を推定することが可能である。
− 線形補間：２つの直線、４つの補間サンプルおよび１つのコピー：７回の演算（すなわち、１秒あたり４４，８００回の演算）。
− 放物線補間：１つの放物線、４つの補間サンプルおよび１つのコピー：１７回の演算（すなわち、１秒あたり１０８，８００回の演算）。
− キュービック補間：２つの三次曲線、４つの補間サンプルおよび１つのコピー：４１回の演算（すなわち、１秒あたり２６２，４００回の演算）。

これらの複雑性は、値ｘ^２およびｘ^３を表にすることによって（すなわち、値ｘ^２およびｘ^３を事前に演算し、それらを表に格納することによって）さらに低減することができる。常に同じ時間インデックスが使用される（例えば、間隔［０，１］内で補間が行われる）ため、これは可能である。例えば、キュービック補間および１２，８００Ｈｚから３２，０００Ｈｚへのアップサンプリングの例では、これらの値は、ｘ＝０．２、０．４、０．６および０．８に対してのみ表にしなければならない。これにより、１つの補間サンプルあたり１回または２回の乗算を省くことができる。従って、放物線補間の場合、複雑性は、１３回の演算（すなわち、１秒あたり８３，２００回の演算）まで低減され、キュービック補間の場合、３３回の演算（すなわち、１秒あたり２１１，２００回の演算）まで低減される。

図４では、線形補間を示すために図３は完了している。アップサンプリングされた信号（円形マーカー）は、２つの入力サンプル（正方形マーカー）間の直線（実線および点線によって示される）と出力サンプリング瞬間（垂直の点線）との交点によって与えられる。参照信号（三角形マーカー）と比べると、いくつかの大幅な偏差を観察することができる。使用される異なる直線は、実線または点線で交互に表されていることに留意されるであろう。

図４と同様な方法で、図５は、２つの間隔に対して放物線が演算された放物線補間を示す。最大誤差は、瞬間２８１．５μｓにおけるものである。使用される異なる放物線は、実線または点線で交互に表されていることに留意されるであろう。

図６は、キュービック補間を示す。円形マーカーによって示される補間サンプルは、中央の間隔で得られた。この場合もやはり、参照信号に対するいくつかの偏差が観察される。ここでは、入力信号は、図で表されている時間領域外にあることが知られており、その結果、補間に対してエッジのサンプル（ここでは、２つの最初のおよび２つの最後の入力サンプル）を使用できることが想定される。使用される異なる三次曲線は、実線または点線で交互に表されていることに留意されるであろう。中央の間隔のみが使用されることが想起されるであろう。

これらの補間を完成させることが可能であることが分かる。３を超える補間の次数の増加は、有利な解決策ではないことが示されてきた。補間「スプライン」が一般的により良好な性能レベルを達成できるが、はるかに高い複雑性という代償を伴うことが先行技術から知られている。

欧州特許第２６５６３４３号明細書

Ｒ．Ｗ．Ｓｃｈａｆｅｒ，Ｌ．Ｒ．Ｒａｂｉｎｅｒ，ＡＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＡｐｐｒｏａｃｈｔｏＩｎｔｅｒｐｏｌａｔｉｏｎ，ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥ，ｖｏｌ．６１，Ｎｏ．６，Ｊｕｎｅ１９７３，ｐｐ．６９２−７０２

従って、複雑性の増大を低減して、より効率的な補間解決策を開発する必要がある。

本発明は、先行技術からの状況を改善する。

この目的を達成するため、本発明は、可聴周波数復号において可聴周波数信号をリサンプリングするための方法であって、リサンプリングが、１より高い次数の補間方法によって実行される、方法を提案する。方法は、補間サンプルが、補間されるサンプルの時間的位置をカバーする複数の間隔にわたって演算された可能な補間値の加重平均の演算によって得られるようなものである。

従って、いくつかの間隔にわたって得られた可能な補間値の平均により、実際の信号値に近い補間サンプル値を得ることが可能になる。この加重平均演算動作は、複雑性の観点では犠牲の大きいものではなく、複雑性の増大を低減するためのより効率的な補間を得ることを可能にする。

以下で言及される異なる特定の実施形態は、互いに独立してまたは組み合わせて、上記で説明されるリサンプリング方法に追加することができる。

特定の実施形態では、補間は、二次放物線タイプである。

この事例では、補間サンプルは、補間されるサンプルの時間的位置をカバーする２つの間隔にわたって演算された可能な補間値の加重平均の演算によって得られる。

この解決策は、単純なキュービック補間にほぼ等しいが、それほど複雑ではないという結果を与える。

本発明の一実施形態では、補間は三次キュービックタイプであり、および補間されるサンプルの時間的位置をカバーする間隔の数は３つである。

この実施形態により、良好な品質の補間を有することが可能になり、補間サンプルは、中央の間隔でのみ得られる単純なキュービック補間によって補間されたサンプルより参照信号に近くなる。従って、同等の複雑性に対して品質が改善される。

特定の実施形態では、加重平均は、可能な補間値の各々に対して同一の重み値で適用される。

これらの重み値は、依然としてラグランジュ多項式補間より大きい性能レベルおよび特により良好な信号対雑音比を得ることを可能にする。

異なる実施形態では、異なる重み値は、３つの間隔のうちの中央の間隔に対して演算された補間値および加重平均の演算に適用される。

重みのうちの１つが０の値を有する場合、この変形形態は、複雑性を低減し、高周波数に対する信号対雑音比性能レベルを改善する。より一般的には、性能レベルは、選択される重み値に応じて、ある特定の周波数ゾーンに対して改善することができる。

別の異なる実施形態では、可能な補間値に適用された重み値は、補間されるサンプルの周波数基準の関数として決定される。

これにより、補間される信号の周波数にかかわらず、より良好な信号対雑音比性能レベルを有することが可能になる。

特に適切な実施形態では、リサンプリングは、ＦＩＲタイプのリサンプリングフィルタのメモリに含まれる信号に対して実行される。

事実上、このリサンプリング方法は、フィルタメモリのような短い長さの信号ベクトルに特に適している。

特に実施形態に関連して、補間サンプルは、予測復号と変換復号との間の遷移フレームにおいて制限された予測復号モードに従って復号された信号を、遷移フレームにおいて制限された予測復号に従って復号されたサンプルと、変換復号に従って復号されたサンプルとを組み合わせるステップの前に補完する。

本発明によるリサンプリングは、２つのコード化モード間のこの遷移に関連して、リサンプリングによる遅延により、サンプルの欠如が生じる際に適している。提案される補間は、このタイプの短い長さの信号に対して効果的であり、それほど複雑ではない。

また、本発明は、可聴周波数信号コーダまたはデコーダにおいて可聴周波数信号をリサンプリングするためのデバイスであって、リサンプリングが、１より高い次数の補間方法によって実行される、デバイスも対象とする。このデバイスは、
− 補間されるサンプルの時間的位置をカバーする複数の間隔に対する可能な補間値を演算するためのモジュールと、
− 演算モジュールから得られた可能な補間値の加重平均の演算により、補間されるサンプルを得るためのモジュールと
を備えるようなものである。

このデバイスは、デバイスが実施する上記の方法と同じ利点を提供する。

また、本発明は、説明されるような少なくとも１つのリサンプリングデバイスを備える可聴周波数信号コーダおよびデコーダも対象とする。

本発明は、プロセッサによって実行されるときに、説明されるようなリサンプリング方法のステップを実施するためのコード命令を含むコンピュータプログラムを対象とする。

最後に、本発明は、上記のリサンプリング方法を実施するコンピュータプログラムを格納する、リサンプリングデバイスに組み込まれるかまたは組み込まれない、場合により取り外し可能であるコンピュータ可読記憶媒体に関する。

本発明の他の特徴および利点は、単に非限定的な例として与えられる以下の説明を読み、添付の図面を参照することで、より明確に明らかになるであろう。

上記のように、ｘ軸上に表されている瞬間に事前に定義されたポイントによって定義された多項式曲線の表現による、先行技術からの異なるタイプの補間の比較を示す。上記のように、先行技術の異なるタイプの補間に対する周波数の関数としての信号対雑音比の結果を示す。上記のように、ＦＩＲタイプのフィルタによって実行された１２，８００Ｈｚ〜３２，０００Ｈｚのリサンプリングに対する補間を示す。上記のように、ＦＩＲタイプの補間によって得られたサンプルと先行技術からの線形タイプの補間によって得られたサンプルとの間の比較を示す。上記のように、ＦＩＲタイプの補間によって得られたサンプルと先行技術からの放物線タイプの補間によって得られたサンプルとの間の比較を示す。上記のように、ＦＩＲタイプの補間によって得られたサンプルと先行技術からのキュービックタイプの補間によって得られたサンプルとの間の比較を示す。本発明の実施形態によるリサンプリング方法のステップをフロー図の形態で示す。本発明の実施形態によるリサンプリングデバイスを備える音声信号コーダの例を示す。先行技術方法による、予測コード化でコード化された信号フレームと変換によってコード化されたフレームとの間の遷移を示す。本発明の実施形態によるリサンプリング方法を使用する、予測コード化でコード化された信号フレームと変換によってコード化されたフレームとの間の遷移を示す。本発明の実施形態によるリサンプリングデバイスを備える音声信号デコーダの例を示す。補間される間隔のエッジにおけるサンプルの処理の例を示す。ＦＩＲタイプの補間によって得られたサンプルと、先行技術からのキュービックタイプの補間によって得られたサンプルと、本発明の実施形態による補間によって得られたサンプルとの間の比較を示す。先行技術からの異なるタイプの補間および本発明の第１の実施形態による補間に対する周波数の関数としての信号対雑音比の結果を示す。先行技術からの異なるタイプの補間および本発明の第２の実施形態による補間に対する周波数の関数としての信号対雑音比の結果を示す。本発明の実施形態によるリサンプリングデバイスのハードウェア表現を示す。

従って、図７は、本発明の実施形態によるリサンプリング方法の主なステップを示す。

この方法のステップは、入力（ｘ_Ｉｎ）として、入力サンプリング周波数ｆ_Ｉｎでの可聴周波数信号を用いて実施される。この入力信号は、例えば、図８および１０を参照して後に説明されるようなリサンプリングフィルタメモリに含まれる短い長さの信号ベクトルであり得る。

ここで説明される実施形態では、三次キュービックタイプの補間方法が使用される。当然ながら異なる次数の補間を使用することができるが、次数は１より大きい。

ステップＥ７０１では、中央の間隔に対してだけでなく、３つの間隔にわたってもキュービック補間が使用される。
［０，１］の時間的瞬間ｘにおける値を補間するための
− 先行の三次曲線の右側の間隔（間隔［１，２］）
− 中央の三次曲線の中央の間隔（間隔［０，１］）
− 次の三次曲線の左側の間隔左（間隔［−１，０］）

３つの可能な補間値が得られる。三次曲線の係数はいかなる事例でも１つの間隔ごとに演算されるため、これは、限られた方法で演算複雑性を増大する。簡略化された表記（三次には触れずに）が使用される場合、中央の間隔が使用される三次曲線の係数に対してはａ_ｎ、ｂ_ｎ、ｃ_ｎ、ｄ_ｎが使用され、先行の間隔における三次曲線の係数に対してはａ_ｎ−１、ｂ_ｎ−１、ｃ_ｎ−１、ｄ_ｎ−１が使用され、次の間隔における三次曲線の係数に対してはａ_ｎ＋１、ｂ_ｎ＋１、ｃ_ｎ＋１、ｄ_ｎ＋１が使用され、３つの可能な補間値は、以下の数式によって得られる。
ｖｃｐ（ｘ）＝ａ_ｎ−１ ^＊（ｘ＋１）^３＋ｂ_ｎ−１ ^＊（ｘ＋１）^２＋ｃ_ｎ−１（ｘ＋１）＋ｄ_ｎ−１、
ｖｃｃ（ｘ）＝ａ_ｎ ^＊ｘ^３＋ｂ_ｎ ^＊ｘ^２＋ｃ_ｎｘ＋ｄ_ｎおよび
ｖｃｓ（ｘ）＝ａ_ｎ＋１ ^＊（ｘ−１）^３＋ｂ_ｎ＋１ ^＊（ｘ−１）^２＋ｃ_ｎ＋１（ｘ−１）＋ｄ_ｎ＋１

この場合もやはり、複雑性を低減するため、値（ｘ＋１）^３、（ｘ＋１）^２、ｘ^３、ｘ^２、（ｘ−１）^３および（ｘ−１）^２を表にすることができる。

従って、ステップＥ７０１は、補間されるサンプルの時間的位置をカバーする複数の間隔にわたって可能な補間値を演算する（ここで与えられる例では、補間次数は３である）。

ステップＥ７０２では、補間されるサンプルを得るために、３つの可能な補間値の加重平均が演算される。次いで、ここで説明されるような補間によって、出力周波数ｆ_Ｏｕｔでリサンプリングされた出力信号（ｘ_Ｏｕｔ）が得られる。

従って、これらの３つの値の加重和によって、瞬間ｘ（中央の三次曲線と比べて、従って、［０，１］におけるｘ）において補間されたサンプルの値が得られる。

Ｖｃ３＝ｐｐ^＊ｖｃｐ（ｘ）＋ｐｃ^＊ｖｃｃ（ｘ）＋ｐｓ^＊ｖｃｓ（ｘ）であり、式中、例示的な実施形態では、加重係数ｐｐ、ｐｃおよびｐｓは、間隔］０，１［におけるものであり、ｐｐ＋ｐｃ＋ｐｓ＝１および一般にはｐｐ＝ｐｓ＝（１−ｐｃ）／２である。

例えば、ｐｐ＝ｐｃ＝ｐｓ＝１／３を選択することができる。この事例では、３での除算は、三次曲線の係数に組み込むことができる。

図７に示される本発明は、入力バッファのエッジのサンプルを考慮に入れない（ｘ_Ｉｎ（ｎ）、ｎ＝０、．．．、Ｌ−１）ことに留意されるであろう。本発明において後に説明される通りである。

出力バッファの開始時のサンプル（２つの最初のサンプル間、ｘ_Ｉｎ（ｎ）、ｎ＝０、１）は、最初の係数ａ_−１、ｂ_−１、ｃ_−１、ｄ_−１、ａ_０、ｂ_０、ｃ_０およびｄ_０を決定するために必要とされる先行の瞬間ｎ＝−１、−２における過去の信号の値を知ることによって補間できることが想定される。これらの過去のサンプルは、入力バッファに組み込むことも、ブロックＥ７０１の実装形態で別々に使用することもできる。

出力バッファの終了時のサンプル（２つの最後のサンプル間および２つの最後のサンプル後、ｘ_Ｉｎ（ｎ）、ｎ＝Ｌ−２、Ｌ−１）は、最後の係数ａ_Ｌ−１、ｂ_Ｌ−１、ｃ_Ｌ−１、ｄ_Ｌ−１、ａ_Ｌ、ｂ_Ｌ、ｃ_Ｌおよびｄ_Ｌを決定するために必要とされる瞬間ｎ＝Ｌ、Ｌ＋１に相当する、一般に利用可能な今後の信号がないため、ブロックＥ７０１およびＥ７０２に従って直接補間することはできない。エッジでサンプルを処理するための異なる変形形態については後に説明する。

ｐｐ＝ｐｃ＝ｐｓ＝１／３でこうして補間されたサンプルは、図１２において、円形マーカーで示される。これらの補間サンプルは、図６に示される中央の間隔で得られた単純なキュービック補間によって補間されたサンプルより参照信号に近いと述べることができる（実線と垂直の点線との交点を参照）。

図１３は、図２の要素を再利用し、本発明による図７の方法によって説明されるような補間に相当する曲線（「ｏ３ｍ」）で補完されている。提案される補間は、依然として単純なキュービック補間より高い性能レベルを有する（とりわけ、単純な補間のＳＮＲが臨界に達する周波数ゾーン（２５００Ｈｚを上回る）において）ことが分かる。このＳＮＲの増加は、３４００Ｈｚ付近の周波数では１４ｄＢにまで達する。本発明による補間方法を用いると、３０ｄＢの限度は、３６００Ｈｚにおけるものであり、それは、キュービック「スプライン」による補間のものよりさらに良好である。１２，８００Ｈｚ〜３２，０００Ｈｚのリサンプリングで使用された例の事例で提案された補間の複雑性は、２つの入力サンプルのグループあたり６０回の演算（すなわち、１秒あたり３８４，０００回の演算）である。

本発明による解決策を用いると、語音信号に対するＳＮＲは４０ｄＢである。要点をまとめると、得られたＳＮＲは、先行技術から知られているキュービック補間では３８．２ｄＢであり、キュービック「スプライン」による補間では４１．４ｄＢであった。提案される補間は、ラグランジュ多項式補間と比べてより良好なＳＮＲを与えることが分かる。

本発明の変形形態では、重み（ｐｐ、ｐｃ、ｐｓ）は、他の既定の値において設定される。別の例示的な実施形態では、ｐｐ＝ｐｓ＝０．５およびｐｃ＝０が選択され、それは、２つの最も端にある間隔からの補間値の平均を使用すると判断される。これは、単純なキュービック（ラグランジュ）補間より著しく高い性能レベルを有する一方で、演算回数を４７回（すなわち、１秒あたり３００，８００回の演算）に低減する。実際のテスト信号に対して得られたＳＮＲは４０．４ｄＢである。この解決策は、低周波数に対してそれほど良好ではない性能レベルを有するが、図１４（曲線「ｏ３ｍ２」）が示すように、高周波数に対しては、３つの同一の重みを有する解決策より良好な性能レベルを有する。

本発明の別の変形形態では、基準に従って変化する重み（ｐｐ、ｐｃ、ｐｓ）を使用することも可能である。例えば、補間される信号の大部分が低周波数を含む場合、提案される第１の解決策（ｐｐ＝ｐｃ＝ｐｓ＝１／３）が使用され、そうでなければ、第２の解決策（ｐｐ＝ｐｓ＝０．５およびｐｃ＝０）が使用される。

本発明の原理は、３次以外の次数の補間に対して一般化することができる。例えば、放物線補間の事例では、２つの可能な放物線によって与えられた２つの値の平均を取ることが可能である。

この事例では、補間サンプルは、補間されるサンプルの時間的位置をカバーする値の２つの間隔にわたって演算された可能な補間値の加重平均の演算によって得られる。

この解決策は、中央の間隔のみが使用される単純なキュービック補間に実質的に等しい結果を与える。

図８は、本発明の実施形態によるリサンプリングデバイスをローカルデコーダにおいて備える音声コーダの例を示す。

この実施形態では、少なくとも２つのコード化モードを交互に行い、そのアルゴリズム遅延が対話型アプリケーション（通常、≦３２ｍｓ）に適応しているマルチモード技法を通じた語音、音楽および混合コンテンツ信号の統合コード化に関心が集められる。これらの統合コード化技法の間では、ＡＭＲ−ＷＢ＋コーデックまたは最近ではＭＰＥＧＵＳＡＣ（「統合語音音声コード化」）コーデックのような先行技術コーダ／デコーダ（コーデック）を引用することが可能である。これらのコーデックが対象とするアプリケーションは、対話型ではないが、アルゴリズム遅延に対する厳しい制約のない放送および格納サービスに相当する。統合コード化の原理は、少なくとも２つのコード化モードを交互に行うことである。
・語音タイプの信号の場合：時間モード、ここでは、一般的にはＣＥＬＰ（符号励振線形予測）タイプのＬＰＤ（線形予測領域）として示される。
・音楽タイプの信号の場合：周波数モード、ここでは、一般的にはＭＤＣＴ（修正離散コサイン変換）タイプの変換を有するＦＤ（周波数領域）として示される。
ＣＥＬＰおよびＭＤＣＴコード化の原理は、以下で要約される。

第１に、ＣＥＬＰコード化（そのＡＣＥＬＰ変形形態を含む）は、ソースフィルタモデルに基づく予測コード化である。一般に、フィルタは、線形予測（ＬＰＣ、線形予測コード化）によって得られる伝達関数１／Ａ（ｚ）の全極フィルタに相当する。実際には、合成は、フィルタ１／Ａ（ｚ）の量子化バージョン

を使用する。ソース、すなわち、線形予測フィルタ

の励振は、一般に、声帯の振動をモデル化する長期予測によって得られる励振と、雑音辞書などの代数コード（ＡＣＥＬＰ）の形態で説明される確率（またはイノベーション）励振との組合せである。「最適な」励振の検索は、Ｗ（ｚ）＝Ａ（ｚ／γ１）／Ａ（ｚ／γ２）またはＡ（ｚ／γ１）／（１−αｚ^１）の形態の、予測線形フィルタＡ（ｚ）から一般に導き出される伝達関数Ｗ（ｚ）のフィルタによって重み付けされた信号の領域における二乗誤差評価規範の最小化によって行われる。

第２に、ＭＤＣＴ変換によるコード化は、一般に異なるステップを含む時間／周波数変換で入力信号を分析する。
１．「ＭＤＣＴ窓」とここでは呼ばれる窓関数による信号の重み付け、
２．低減されたブロック（長さを２で除した従来の公式における）を形成するための時間エイリアシング（または時間領域エイリアシング）、
３．低減されたブロックのＤＣＴ（離散コサイン変換）変換。
ＭＤＣＴ窓関数の掛け合わせを適応することができ、ＭＤＣＴ係数は、ビットの割り当てに応じて様々な方法によって量子化することができる（例えば、周波数サブバンドによって）。

少なくとも２つのコード化モードを使用するコーデックでは、ＬＰＤとＦＤモードとの間の遷移は、ＦＤモードとＬＰＤモードとが異なる性質のものであることを知ったうえで（一方は重畳を有する変換によるコード化に依存し、他方は各フレームで更新される長方形ブロックおよびフィルタメモリを有する線形予測コード化を使用する）、スイッチング欠陥のない十分な品質を保証するために重要である。

図８に示されるコーダの場合、図７を参照して説明されるリサンプリング方法は、ＬＰＤモードからＦＤモードへの遷移の事例においてスイッチングの品質を改善するため、本発明に従って多項式補間を実行するように、ローカルデコーダ（任意選択の）のリサンプリングデバイスにおいて実施される。関連デコーダおよびブロック８００については、図１０を参照して後に説明する。

図８に示されるこの実施形態では、２０ｍｓフレームごとに機能する周波数ｆｓ＝１６、３２または４８ｋＨｚでサンプリングされた入力信号（ブロック８１０）のコード化の事例が考慮される。このコーダは、音声信号（モノラル）を処理し、いくつかのビットレート（例えば、７．２〜１２８ｋｂｉｔ／ｓのビットレートを設定する）を提供する。コーダは、以下を含む、選択モジュール８１１によって選択された少なくとも２つのコード化モードを使用する。
・内部周波数１２．８または１６ｋＨｚでの入力周波数ｆｓのサンプリングの使用を必要とする（ブロック８１５）、１２．８および１６ｋＨｚ（ビットレートによる）で設定された２つの内部サンプリング周波数を有するＬＰＤモード（コード化ユニット８１２）
・入力信号の周波数ｆｓで動作するＦＤモード（コード化ユニット８１３）
各２０ｍｓ入力フレームに対するビットストリームは、多重化モジュール８１４によって多重化される。

ＬＰＤコード化からＦＤコード化への遷移の事例は、例えば、参照により本明細書に組み込まれる欧州特許第２６５６３４３号明細書で説明されている。この事例では、ｆｓ＝１６ｋＨｚであり、信号が先行のフレームにおいてＦＤモードによってコード化されていない（ＣＥＬＰモードに従ってコード化されたフレーム）図９ａに示されるように、ＭＤＣＴコード化メモリは、復号される現行のフレームに利用可能ではない。デコーダ（ローカルまたはリモート）では、ＦＤタイプの現行のフレームの開始時の網掛けゾーン「ＴＲ」に対する相補信号を生成する必要がある。この相補信号は、連続したＬＰＤおよびＦＤモードによって復号された信号間の「結合」を行えるようにする必要がある。従って、この相補信号は、「隙間」を埋める。相補信号は、あるモードから別のモードへの遷移の欠陥を制限するために、クロスフェードが可能なほど十分に長くなければならないことに留意されるであろう。

ここでは、ＬＰＤフレームに続くＦＤタイプの遷移フレームにおけるこの欠落信号（ＴＲとして示されるゾーン）を埋めるために、欧州特許第２６５６３４３号明細書で説明されるような簡略化された制限されたＬＰＤコード化を実行することによる信号の伝播の同じ原理が再び適用される。ここで示されるＭＤＣＴ窓は、本発明の原理を変更することなく、本発明の変形形態において変更できることに留意されるであろう。具体的には、遷移フレームにおけるＭＤＣＴ窓は、現行のフレームがＬＰＤからＦＤへの遷移フレームではない場合、ＦＤコード化モードで「通常」使用されるＭＤＣＴ窓とは異なるようにすることができる。

しかし、図８に示されるコーダでは、制限されたＬＰＤコード化／復号（ブロック８１６）の入力および出力側の信号は、周波数１２．８または１６ｋＨｚ（ビットレートによる）のものである。ローカル復号の事例では、１２．８または１６ｋＨｚで復号された信号は、一般に、それを遷移フレームにおけるＦＤタイプのコード化／復号（ブロック８１３）の出力側の信号と結合する（クロスフェードによって）前に、周波数ｆｓでリサンプリングしなければならず、このクロスフェードの原理は、欧州特許第２６５６３４３号明細書で説明されている。図９ｂは、ＬＰＤコーダの周波数が１２，８００Ｈｚであり、ｆｓ＝３２，０００Ｈｚであるそのような事例を示す。ＬＰＤコーダの周波数が１６，０００Ｈｚである場合、同じ原理が適用される。

ここでは、リサンプリングブロック８３０のｆｓでの１２．８または１６ｋＨｚからのリサンプリングは、フィルタメモリ（ｍｅｍと呼ばれる）での多相ＦＩＲフィルタリングによって実行されることが想定される。このメモリは、周波数１２．８または１６ｋＨｚでＬＰＤまたはＴＲモードによって復号された信号の先行のフレームの最後のサンプルを格納する。このメモリの長さは、ＦＩＲフィルタリング遅延と一致する。このリサンプリング遅延のため、周波数ｆｓ（ここでは３２ｋＨｚ（リサンプリングから得られる））での信号が遅れる。このリサンプリングは、遷移フレームにおけるＬＰＤモードとＦＤモードとの間で埋めるべき隙間を「拡大する」ため、問題が多い。従って、周波数ｆｓでリサンプリングされたＬＰＤ信号とＦＤ復号信号との間のクロスフェードを正しく実施するためのサンプルを欠く。しかし、１２，８００または１６，０００Ｈｚの最後の入力サンプルは、ブロック８３０のリサンプリングステップにおいて格納される。これらの格納されたサンプルは、ＦＩＲフィルタリング遅延とリンクされる３２ｋＨｚでの欠落サンプル（図９ｂの「ＩＮＴ」とマーク付けされた濃い灰色ゾーン）と時間的に一致している。

本発明による補間は、この実施形態では、遷移フレームの開始時に簡略化されたＬＰＤコード化（ブロック８１６）から得られた信号を延長するために、リサンプリングフィルタのメモリ（ｍｅｍ）に含まれる信号をリサンプリングするために使用され、従って、ＬＰＤ合成とＦＤ合成との間のクロスフェードを行えるように３２ｋＨｚで欠落サンプルを得る。

図１０に示されるデコーダは、１６、３２または４８ｋＨｚの出力サンプリング周波数ｆｓで動作する音声信号（モノラル）マルチビットレート（７．２〜１２８ｋｂｉｔ／ｓで設定されたビットレート）デコーダである。

受信され分離されたフレーム（ブロック１００１）に応じて、出力は、線形予測を使用するＣＥＬＰタイプの時間デコーダ（ＬＰＤＤＥＣ）（１００２）の出力と周波数デコーダ（ＦＤＤＥＣ、１００３）の出力との間で切り替えられる（１００４）。ＬＰＤデコーダの出力は、例えばＦＩＲタイプのリサンプリングモジュール１００５によって内部周波数１２．８または１６ｋＨｚから出力周波数ｆｓにリサンプリングされることに留意されるであろう。

ここでは、ＬＰＤフレームに続くＦＤタイプの遷移フレームにおけるこの欠落信号（ＴＲとして示されるゾーン）を埋めるために、欧州特許第２６５６３４３号明細書で説明されるような簡略化された制限されたＬＰＤ復号（ブロック１００６）を実行することによる信号の延長の同じ原理が再び適用される。

ここでは、図１０に示されるデコーダでは、制限されたＬＰＤ復号（ブロック１００６）の入力および出力側の信号は、周波数１２．８または１６ｋＨｚ（ビットレートによる）のものであり、一般に、欧州特許第２６５６３４３号明細書で説明されている原理に従って、モジュール１００８によってそれを遷移フレームにおけるＦＤタイプの復号（ブロック１００３）の出力側の信号と結合する（クロスフェードによって）前に、周波数ｆｓでリサンプリングしなければならない（リサンプリングブロック１００７によって）。図９ｂは、一般性を失うことなくＬＰＤコーダの周波数が１２，８００Ｈｚであり、ｆｓ＝３２，０００Ｈｚであるそのような事例を示す。

ここでは、リサンプリングブロック１００７の１２．８または１６ｋＨｚからｆｓへのリサンプリングは、フィルタメモリ（ｍｅｍと呼ばれる）での多相ＦＩＲフィルタリングによって実行されることが想定される。このメモリは、周波数１２．８または１６ｋＨｚでＬＰＤまたはＴＲモードによって復号された信号の先行のフレームの最後のサンプルを格納する。このメモリの長さは、ＦＩＲフィルタリング遅延と一致する。このリサンプリング遅延のため、周波数ｆｓ（ここでは３２ｋＨｚ（リサンプリングから得られる））での信号が遅れる。このリサンプリングは、遷移フレームにおけるＬＰＤモードとＦＤモードとの間で埋めるべき隙間を「拡大する」ため、問題が多い。従って、周波数ｆｓでリサンプリングされたＬＰＤ信号とＦＤ復号信号との間のクロスフェードを正しく実施するためのサンプルを欠く。しかし、１２，８００または１６，０００Ｈｚの最後の入力サンプルは、ブロック１００７のリサンプリングステップにおいて格納される。これらの格納されたサンプルは、ＦＩＲフィルタリング遅延とリンクされる３２ｋＨｚでの欠落サンプル（図９ｂの「ＩＮＴ」とマーク付けされた濃い灰色ゾーン）と時間的に一致している。

本発明による補間は、この実施形態では、遷移フレームの開始時に簡略化された制限されたＬＰＤ復号（ブロック１００６）から得られた信号を延長するために、リサンプリングフィルタのメモリ（ｍｅｍ）に含まれる信号をリサンプリングするために使用され、従って、ＬＰＤ合成とＦＤ合成との間のクロスフェードを行えるように３２ｋＨｚで欠落サンプルを得る。

リサンプリングフィルタ１００７のメモリに含まれる信号（ｍｅｍ）をリサンプリングするため、本発明によるリサンプリングデバイス８００は、１より高い次数の補間を実行し、補間されるサンプルの時間的位置をカバーする複数の間隔に対する可能な補間値を演算するためのモジュール８０１を備える。これらの可能な補間値は、例えば、三次補間に対して図７を参照して説明されるように演算される。

また、リサンプリングデバイスは、演算モジュール８０１から得られる可能な補間値の加重平均の演算によって補間されるサンプルを得るためのモジュール８０２も備える。

正当にリサンプリングされた信号は、１００８において、欧州特許第２６５６３４３号明細書で説明されるようにクロスフェードを介してモジュール１００３のＦＤコード化から得られた信号と結合することができる。

また、本発明に従って提案される補間を用いると、図１１に示されるように、フィルタメモリ（ｍｅｍ）の全時間領域をカバーすることは不可能であることにも留意しなければならない。この図では、図解を簡略化するため、正方形シンボルで象徴される１２，８００ｋＨｚでの８つのサンプルのフィルタメモリが想定される。そのようなメモリの典型的な長さは、１２，８００Ｈｚでは１２のサンプルまたは１６，０００Ｈｚでは１５のサンプルである。図１１では、メモリの時間領域は、不連続線長方形９００によって範囲が定められる。３２，０００Ｈｚでの出力サンプルは、三角形で象徴され、所定の時間領域にわたって、８^＊５／２＝２０の三角形がある。また、２つの過去の入力サンプル（図の正方形９０１）も利用可能であることも想定され、これは、それらが遷移ゾーンＴＲ（簡略化されたＬＰＤコード化）で復号された信号に相当するため、ここで該当する。従って、可能な２０のサンプルのうちの１６の出力サンプル（図の塗りつぶされた三角形）を本発明の方法に従って補間することができる。次の２つの出力サンプル（三角形９０２）は、右端の間隔を使用することによって、最後の３つの入力サンプル上の放物線補間に従って、または最後の２つの入力サンプル上の線形補間によって補間することができる。時間領域の最後の２つの出力サンプル（三角形９０３）は、最後の三次曲線、放物線もしくは直線の延長を使用することによって、または３２ｋＨｚで補間された最後のサンプルの値もしくは１２．８ｋＨｚでの最後の入力サンプルの値を繰り返すことによって、補外しなければならない。

好ましい実施形態では、最後の三次曲線の右端の間隔は、最後の２つの入力サンプル（塗りつぶされていない黒の三角形）間の補間に対して使用され、最後の補間サンプルは、補外されたサンプルに対して繰り返される（三角形９０３）。

図１５は、本発明によるリサンプリングデバイス１５００の例示的なハードウェア実装形態を表す。後者は、可聴周波数信号コーダ、デコーダまたは可聴周波数信号を受信する機器アイテムの不可欠な部分とすることができる。

このタイプのデバイスは、ストレージおよび／または動作メモリＭＥＭを備えるメモリブロックＢＭと協働するプロセッサＰＲＯＣを備える。そのようなデバイスは、サンプリング周波数ｆ_Ｉｎで音声信号フレームｘ_Ｉｎの受信が可能な入力モジュールＥを備える。これらの音声信号フレームは、例えば、リサンプリングフィルタのメモリに含まれる信号である。

それは、ｆ_Ｏｕｔのサンプリング周波数でリサンプリングされた可聴周波数信号ｘ_ｏｕｔの送信が可能な出力モジュールＳを備える。

メモリブロックは、プロセッサＰＲＯＣによって実行されるときに、本発明の意味内のリサンプリング方法のステップ、特に、補間されるサンプルの時間的位置をカバーする複数の間隔にわたって演算された可能な補間値の加重平均の演算によって補間サンプルを得るステップを実施するためのコード命令を含む、コンピュータプログラムを有利に含み得る。

通常、図７の説明は、そのようなコンピュータプログラムのアルゴリズムのステップを再び包含する。また、コンピュータプログラムは、デバイスのリーダによって読み取れるか、またはその記憶空間にダウンロードできる記憶媒体上に格納することもできる。

メモリＭＥＭは、一般に、方法を実施するために必要なすべてのデータを格納する。

８００，８１０，８１５ブロック
８１１選択モジュール
８１２，８１３コード化ユニット
８１４多重化モジュール
１００１，１００６ブロック
１００２時間デコーダ
１００３周波数デコーダ
１００５リサンプリングモジュール
８００リサンプリングデバイス
８０１，８０２モジュール
１５００リサンプリングデバイス

Claims

可聴周波数信号復号において可聴周波数信号をリサンプリングするための方法であって、前記リサンプリングが、ＦＩＲタイプのリサンプリングフィルタのメモリに含まれる信号に対して実行され、かつ、１より高い次数の補間方法によって実行される、方法において、補間サンプルが、前記補間されるサンプルの時間的位置をカバーする複数の間隔にわたって演算された（Ｅ７０１）可能な補間値の加重平均の演算によって得られ（Ｅ７０２）、前記補間サンプルは、遷移フレームにおいて制限された予測復号に従って復号されたサンプルと変換復号に従って復号されたサンプルとを組み合わせるステップの前に、予測復号と変換復号との間の遷移フレームにおいて制限された予測復号モードに従って復号された信号を補完する、ことを特徴とする、方法。
前記補間は二次放物線タイプであることを特徴とする、請求項１に記載の方法。
前記補間は三次キュービックタイプであり、かつ前記補間されるサンプルの前記時間的位置をカバーする間隔の数は３つであることを特徴とする、請求項１に記載の方法。
前記加重平均は、前記可能な補間値の各々に対して同一の重み値で得られることを特徴とする、請求項１〜３のいずれか一項に記載の方法。
異なる重み値が、前記３つの間隔のうちの中央の間隔に対して演算された前記補間値および前記加重平均の前記演算に適用されることを特徴とする、請求項３に記載の方法。
前記可能な補間値に適用される重み値は、前記補間されるサンプルの周波数基準の関数として決定されることを特徴とする、請求項１〜３のいずれか一項に記載の方法。
補間されるフィルタメモリのサンプルの最後の間隔に対して、最後の三次曲線が使用され、最後の補完されたサンプルが、補外されたサンプルに対して繰り返される、ことを特徴とする、請求項３に記載の方法。
可聴周波数信号コーダまたはデコーダにおいて可聴周波数信号をリサンプリングするためのデバイスであって、前記リサンプリングが、ＦＩＲタイプのリサンプリングフィルタのメモリに含まれる信号に対して実行され、かつ、１より高い次数の補間方法によって実行される、デバイスにおいて、
− 補間されるサンプルの時間的位置をカバーする複数の間隔に対する可能な補間値を演算するためのモジュール（８０１）と、
− 前記演算モジュールから得られた前記可能な補間値の加重平均の演算により、前記補間されるサンプルを得るためのモジュール（８０２）と
を備え、前記補間サンプルは、遷移フレームにおいて制限された予測復号に従って復号されたサンプルと変換復号に従って復号されたサンプルとを組み合わせるステップの前に、予測復号と変換復号との間の遷移フレームにおいて制限された予測復号モードに従って復号された信号を補完する、ことを特徴とする、デバイス。
請求項８に記載のリサンプリングデバイスを備えることを特徴とする、可聴周波数信号コーダ。
請求項８に記載のリサンプリングデバイスを備えることを特徴とする、可聴周波数信号デコーダ。
プロセッサによって実行されるときに、請求項１〜７のいずれか一項に記載のリサンプリング方法のステップを実施するためのコード命令を含むコンピュータプログラム。
請求項１〜７のいずれか一項に記載のリサンプリング方法のステップを実行するためのコード命令を含むコンピュータプログラムが格納される、プロセッサ可読記憶媒体。