JP6099602B2

JP6099602B2 - 重複変換を使用した情報信号変換装置

Info

Publication number: JP6099602B2
Application number: JP2014158475A
Authority: JP
Inventors: シュネール、マルクス; ガイガー、ラルフ; ラヴェリ、エマニュエル; フォトポウロー、エレニ
Original assignee: フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2011-02-14
Filing date: 2014-08-04
Publication date: 2017-03-22
Anticipated expiration: 2032-02-14
Also published as: TWI483245B; EP2550653B1; JP2013531820A; JP2014240973A; WO2012110478A1; CN102959620B; AR085222A1; TW201246186A; CA2799343C; TW201506906A; AU2012217158A1; RU2580924C2; KR101424372B1; ES2458436T3; CA2799343A1; US20130064383A1; TWI564882B; PL2550653T3; US9536530B2; SG185519A1

Description

本発明は重複変換を使用した情報信号変換装置に関し、詳しくは、例えばオーディオ圧縮技術で使用されるようなエイリアシング解消を必要とする情報信号の重複変換を使用した情報信号変換装置に関する。

ほとんどの圧縮技術は、特定の種類の情報信号や、最大許容遅延や可能な送信ビットレートというような圧縮データストリームの特定の条件に合うように設計されている。例えば高いビットレートでスピーチではなく音楽を符号化する場合には、オーディオ圧縮に関して、ＡＡＣのような変換に基づくコーデックの方が、ＡＣＥＬＰのような線形予測に基づく時間領域コーデックよりも優れた性能を示す傾向がある。例えばＵＳＡＣは、様々なオーディオコーディング原理を一つのコーデックに統合することにより、非常に多様な応用場面に対応しようとするものである。しかし、その利点を利用して、例えばより高いコーディング効率を達成するためには、送信ビットレートの変更というような様々なコーディング条件への適応性をさらに上げることが好ましい。

３ＧＰＰ「オーディオコーデック処理機能、拡張適応マルチレート−広帯域（ＡＭＲ−ＷＢ）コーデック、トランスコーディング機能」２００９年、３ＧＰＰＴＳ２６．２９０ＵＳＡＣコーデック（音声合成コーデック）、ＩＳＯ／ＩＥＣＣＤ２３００３−３、２０１０年９月２４日

従って、本発明の目標は、重複変換表記を実際の要求に適合させることが可能となるように、エイリアシング解消を必要とする重複変換による情報信号の表記を可能にする情報信号変換装置を提示することにより、このような概念を提供することであり、これにより、より高いコーディング効率を達成することができるであろう。

この目標は独立請求項の内容によって達成される。

本発明につながる主な思想は以下のようなものである。例えばレートと歪みの比の点で情報信号を効率的に符号化する際にプリステートを形成するために、情報信号の重複変換表記がしばしば使用される。このようなコーデックの例はＡＡＣやＴＣＸ等である。しかし重複変換表記はまた、変換と再変換を様々なスペクトル分解能で連結させることによりリサンプリングを実行するのに使用され得る。一般的に、情報信号の連続する時間領域のウィンドウバージョンの変換形の個々の再変換形の重複部分でエイリアシングが生じる重複変換表記は、重複変換表記をするために符号化されるべき変換係数レベルの個数が少なくなるという点で有利である。極端な状態では、重複変換は「じっくりとサンプリング」されている。つまり、情報信号の時間サンプルの個数に比較して、重複変換表記の係数の個数は増加しない。重複変換表記の一例は、ＭＤＣＴ（修正離散余弦変換）またはＱＭＦ（直交ミラーフィルター）フィルターバンクである。従って、情報信号を効率的に符号化する際に、このような重複変換表記をプリステートとして使用することが好ましい場合がしばしばある。しかし、情報信号が重複変換表記される際のサンプリングレートが、例えば可能な送信ビットレートまたは他の環境条件に適合するように時間変動可能であれば、これもまた好ましい。可能送信ビットレートが変動的であると仮定すると、例えば可能送信ビットレートが所定の閾値よりも下がった場合は常にサンプリングレートを下げることが好ましく、可能送信レートが再び上がった場合には、情報信号を重複変換表記するサンプリングレートが上昇可能であることが好ましい。悪いことに、重複変換表記の再変換の重複エイリアシング部分が、このようなサンプリングレート変更に対して障害を設けており、サンプリングレート変更の場合に重複変換表記を完全に遮断することによってのみ、この障害を打開することが可能であるように思われる。しかし、本発明の発明者たちは上述の問題に対する解決を実現し、これにより、エイリアシングと懸案のサンプリングレート変更を伴う重複変換表記の効率的な使用が可能となる。特に、補間によって、情報信号の先行領域及び／または後続領域が、これらの領域の境界でのサンプリングレート変更に従い、エイリアシング解消部分でリサンプリングされる。そして、結合装置は、エイリアシング解消部分でのリサンプリングにより得られるような先行領域の再変換と後続領域の再変換との境界で、エイリアシング解消を行うことができる。この方法により、サンプリングレート変更／推移時点での重複変換信号の中断を引き起こすことなく、サンプリングレート変更に対して効率的に対処することができる。重複変換を適切に生成するために、変換側での同様の方法も可能である。

上述の考えを用いて、オーディオ圧縮技術のような情報信号圧縮技術を提供することが可能であり、これらの技術は、符号化の環境条件の広範囲にわたって、例えば可能転送帯域幅全体にわたって、サンプリングレート変更そのものによる不利益を全く被ることなく、与えられたサンプリングレートをこれらの条件に適合させることにより、高い符号化効率を得ることができるものである。

本発明の利点は、従属請求項に記載の内容である。さらに、本発明の好ましい実施形態を、添付図面を参照し以下に説明する。

本発明の実施形態が適用可能である情報信号エンコーダのブロック図を示す。本発明の実施形態が適用可能である情報信号デコーダのブロック図を示す。図１Ａのコアエンコーダの可能な内部構成のブロック図を示す。図１Ｂのコアデコーダの可能な内部構成のブロック図を示す。図１Ａのリサンプラーの可能な実施例のブロック図を示す。図１Ｂのリサンプラーの可能な内部構成のブロック図を示す。本発明の実施形態が適用された情報信号エンコーダのブロック図を示す。本発明の実施形態が適用された情報信号デコーダのブロック図を示す。本発明の一実施形態に係る情報信号再構築装置のブロック図を示す。本発明の一実施形態に係る情報信号変換装置のブロック図を示す。図５の情報信号再構築装置が使用された別の実施形態に係る情報信号エンコーダのブロック図を示す。図５の情報信号再構築装置が使用された別の実施形態に係る情報信号デコーダのブロック図を示す。本発明の一実施形態に係る図６の情報信号エンコーダ及びデコーダで発生するサンプリングレート変更を示す概略図である。

以下に説明する本発明の実施形態の動機付けために、前もって、本願の実施形態が使用でき、以下で述べるような本発明と本願の実施形態の利点を明らかにする実施形態について議論する。

図１Ａ，１Ｂは、例えば、以下に説明する実施形態を有利に使用し得る一対のエンコーダとデコーダを示している。図１Ａはエンコーダを示し、図１Ｂはデコーダを示す。図１Ａの情報信号エンコーダ１０は、情報信号が入力される入力部１２と、リサンプラー１４と、コアエンコーダ１６とを含み、リサンプラー１４とコアエンコーダ１６は、エンコーダ１０の入力部１２と出力部１８との間で連続的に接続されている。出力部１８で、エンコーダ１０は入力部１２の情報信号を表すデータストリームを出力する。同様に、参照符号２０で示された図１Ｂのデコーダは、コアデコーダ２２とリサンプラー２４とを含み、コアデコーダ２２とリサンプラー２４は、図１Ｂに示されているように、デコーダ２０の入力部２６と出力部２８との間で連続的に接続されている。

出力部１８で出力されたデータストリームをデコーダ２０の入力部２６に送る際に可能な転送ビットレートが高い場合には、データストリーム内で高サンプリングレートで情報信号１２を表すことが符号化効率の点で好ましく、これにより、情報信号のスペクトルの広スペクトル帯域をカバーすることができる。つまり、レート／歪み比尺度のような符号化効率尺度によると、情報信号の低サンプリングレートでの圧縮と比較して、コアエンコーダ１６がそれよりも高いサンプリングレートで入力信号１２を圧縮する場合には、符号化効率が高くなることが示されている。一方、可能転送ビットレートのうちの低い方のビットレートでは、情報信号１２を低サンプリングレートで符号化する際に符号化効率尺度はより高くなり得る。この点に関して、歪みは心理音響的に動機づけられた方法で、つまり、知覚的にあまり関係のない周波数領域（それに対する人間の耳の感度が低い周波数領域）内の歪みよりも、知覚的により関連のある周波数領域内の歪みを集中的に考慮して測定してもよいことに留意すべきである。一般的に、低周波領域は高周波領域よりも知覚的に関連深い傾向があり、従って、低サンプリングレート符号化では、入力部１２での信号のナイキスト周波数よりも高い周波数成分は符号化の対象から除外される。しかし、その結果ビットレートの節約を得ることができるので、レート／歪み比の点で、この低サンプリングレート符号化は高サンプリングレート符号化よりも好ましいものとなり得る。低周波部分と高周波部分との間の歪みの重要性に関するこれに類似の矛盾は、測定信号などのような他の情報信号内にも存在する。

従って、リサンプラー１４は情報信号１２をサンプリングする際のサンプリングレートを変更するためのものである。とりわけ出力部１８と入力部２６との間の可能転送ビットレートにより規定されるような外部転送条件に応じてサンプリングレートを適切に制御することにより、外部転送条件が時間と共に変化するにもかかわらず、エンコーダ１０は符号化効率を向上させることができる。そして、デコーダ２０はデータストリームを展開するコアデコーダ２２を含み、また、リサンプラー２４は、出力部２８で出力される再構築情報信号が再び一定のサンプリングレートを有するように処理する。

しかし、図１Ａ，１Ｂのエンコーダ／デコーダ対で重複変換が使用される場合には必ず問題が発生する。再変換の重複領域でエイリアシングが発生する重複変換表記は、効率的な符号化ツールではあるが、時間的エイリアシング解消を必要とするので、サンプリングレート変更の際に問題が発生する。例えば図２Ａ，２Ｂを参照して下さい。図２Ａ，２Ｂは、変換符号化タイプのものであると仮定した場合のコアエンコーダ１６とコアデコーダ２２の可能な実施例を示す。従って、コアエンコーダ１６は変換装置３０を含み、この後に圧縮装置３２が設けられている。図２Ｂのコアデコーダは展開装置３４を含み、この後に今度は再変換装置３６が設けられている。図２Ａ，２Ｂに関して、コアエンコーダ１６とコアデコーダ２２内には、他に何のモジュールも存在し得ないというように理解すべきではない。例えば、変換装置３０の前にフィルターがあってもよく、この場合、変換装置３０はリサンプラー１４によって与えられたリサンプル情報信号そのままではなく、事前にフィルタリングされた形のものを変換することになる。同様に、再変換装置３６の後に、逆変換関数を有するフィルターがあってもよく、この場合、再変換信号は続いて逆フィルタリングされることになる。

圧縮装置３２は、変換装置３０によって出力された重複変換表記を、ハフマン符号化または算術符号化のような例を含むエントロピーコーディングのようなロスレスコーディングを使用して圧縮し、展開装置３４は、再変換装置３６へ送られるべき重複変換表記を得るために、例えばハフマン復号または算術復号のようなエントロピーデコーディングにより、まさに逆の処理つまり展開を行う。

図２Ａ，２Ｂに示した変換符号化環境において、リサンプラー１４がサンプリングレートを変更するたびに問題が発生する。この問題は、情報信号１２が存在する符号化側においてはあまり深刻ではない。従って、変換装置３０には、サンプリングレート変更の瞬間を跨いでも、それぞれの領域のウィンドウバージョンを使用したそれぞれの変換のために継続的にサンプリングされた領域が与えられる。変換装置３０の可能な実施形態を、図６を参照して以下に説明する。一般的に、変換装置３０には情報信号の先行領域のウィンドウバージョンが現在のサンプリングレートで与えられ、その後、リサンプラー１４によって、情報信号の次の部分的重複領域が変換装置３０に与えられ、そして、情報信号のウィンドウバージョンの変換形が変換装置３０によって生成される。必要な時間的エイリアシング解消処理は変換装置３０よりもむしろ再変換装置３６において行われなければならないので、さらに追加の問題は起こらない。しかし再変換装置３６においては、前述のすぐ後に続く領域の再変換形は様々な異なるサンプリングレートに関連するので、再変換装置３６は時間的エイリアシング解消を実行することができないという点で、サンプリングレートの変更が問題を発生させる。以下に説明する実施形態はこれらの問題を解決するものである。これらの実施形態によると、再変換装置３６は、以下に記載のような情報信号再構築装置に置き代えられてもよい。

しかし図１Ａ，１Ｂに関して説明した環境においては、コアエンコーダ１６とコアデコーダ２２が変換符号化タイプのものである場合にのみ、問題が発生する。より正確には、リサンプラー１４と２４をそれぞれ形成する重複変換に基づくフィルターバンクを使用した場合にも問題は発生する。例えば図３Ａ，３Ｂを参照して下さい。図３Ａ，３Ｂは、リサンプラー１４，２４を実現するための具体的な一実施形態を示している。図３Ａ，３Ｂの実施形態によると、どちらのリサンプラーも、解析フィルターバンク３８，４０とその後に配置された合成フィルターバンク４２，４４とをそれぞれ連結することにより形成されている。図３Ａ，３Ｂに示されているように、解析及び合成フィルターバンク３８〜４４は、ＱＭＦフィルターバンク、つまり情報信号を事前に分解し、そして再び信号を結合するためのＱＭＦを使用したＭＤＣＴに基づくフィルターバンクとして実施してもよい。このＱＭＦは、１０個のブロック重複している（１０個は単に一例である）マルチチャンネル変調フィルターバンクを意味するＭＰＥＧＨＥ−ＡＡＣまたはＡＡＣ−ＥＬＤのＳＢＲ部分で使用されているＱＭＦと同様に実施されてもよい。このように、重複変換表記は解析フィルターバンク３８，４０によって生成され、合成フィルターバンク４２，４４で、リサンプリングされた信号がこの重複変換表記から再構築される。サンプリングレート変更を可能にするために、合成フィルターバンク４２と解析フィルターバンク４０は様々な変換長で動作するよう構成されていてもよい。しかし、フィルターバンクまたはＱＭＦのレート、つまり、一方では解析フィルターバンク３８，４０それぞれによって連続的な変換形が生成され、他方では合成フィルターバンク４２，４４それぞれによって再変換が行われるレートは一定であり、全ての素子３８〜４０に関して同じである。変換長の変更は、しかし、サンプリングレートの変更をもたらす。例えば、解析フィルターバンク３８と合成フィルターバンク４２の対を考えてみる。解析フィルターバンク３８は、一定の変換長と一定のフィルターバンクまたは変換レートを使用して動作するものと仮定する。この場合、解析フィルターバンク３８によって出力される入力信号の重複変換表記は、入力信号の、連続重複し、一定のサンプル長さを有する領域のそれぞれに関して、それぞれの領域のウィンドウバージョンの変換形を含み、これらの変換形も一定長さを有する。換言すれば、解析フィルターバンク３８は一定の時間／周波数分解能のスペクトログラムを合成フィルターバンク４２へ送る。しかし、合成フィルターバンクの変換長は変動する。例えば、解析フィルターバンク３８の入力部での入力サンプリングレートと合成フィルターバンク４２の出力部での信号出力サンプリングレートとの間で、第１のダウンサンプリングレートから第２のダウンサンプリングレートに下げる場合を考える。第１のダウンサンプリングレートが有効である限り、解析フィルターバンク３８によって出力された重複変換表記またはスペクトログラムは単に部分的に使用され、合成フィルターバンク４２内で再変換をもたらす。合成フィルターバンク４２の再変換は、解析フィルターバンク３８のスペクトログラム内で連続する変換形の低周波部分に単純に適用される。合成フィルターバンク４２の再変換に使用される変換長が短いために、合成フィルターバンク４２の再変換形内のサンプル数もまた、それまでフィルターバンク３８での変換の対象となっていた重複時間部分でのサンプル数よりも少なく、これにより、解析フィルターバンク３８の入力部に入力された情報信号のオリジナルのサンプリングレートに比べて低いサンプリングレートとなる。ダウンサンプリングレートが一定に保たれる限り、合成フィルターバンク４２が、連続する再変換形の間の重複部分と、フィルターバンク４２の出力部での出力信号の連続重複領域とで、時間的エイリアシング解消を実行することに何の問題もないままなので、何も問題は起こらないだろう。

ダウンサンプリングレートが第１のダウンサンプリングレートからそれよりも高い第２のダウンサンプリングレートに変更される場合には、常に問題が発生する。この場合、合成フィルターバンク４２内の再変換で使用される変換長はさらに縮小され、それにより、このサンプリングレート変更時点よりも後のそれぞれの領域に関しては、さらに低いサンプリングレートとなる。このサンプリングレート変更時点の直前の領域に関する再変換と、このサンプリングレート変更時点の直後にリサンプリングされた領域に関する再変換との間での時間的エイリアシング解消が妨げられるので、ここでも、合成フィルターバンク４２にとって問題が発生する。従って、変換長可変の解析フィルターバンク４０が変換長一定の合成フィルターバンク４４の前に備えられている場合には、デコーディングの側でこのような問題は起こらないという考えは、あまり助けにはならない。ここで、合成フィルターバンク４４は、様々な異なる周波数分解能ではない一定のＱＭＦ／変換レートのスペクトログラムに、つまり、解析フィルターバンク４０から合成フィルターバンク４４へ異なるまたは時間変動の変換長ではなく、一定のレートで送られた連続する変換形に適合し、全体変換長の高周波部分を０にして、合成フィルターバンク４４の全体変換長の低周波部分を保つ。合成フィルターバンク４４の出力部で出力される再構築信号のサンプリングレートは一定のサンプリングレートであるので、合成フィルターバンク４４によって出力された連続する再変換形の間の時間的エイリアシング解消は問題ではない。

このように、ここでも、図１Ａ，１Ｂに関して上述したようなサンプリングレートの変更／適合を実行しようとする際に問題があるが、これらの問題は、情報信号の再構築装置のための以下に説明する実施形態に従い図３Ａの逆フィルターバンクまたは合成フィルターバンク４２を実施することにより、克服できる。

サンプリングレートの適合／変更に関する上記の考えは、符号化されるべき情報信号の高周波部分がそれに従うパラメトリック手法で（例えば、その信号の低周波部分が変換符号化及び／または予測符号化などを使用して符号化されるスペクトル帯域複製（ＳＢＲ）を使用して）符号化されるコーディング概念を考慮すると、より興味深くなる。例えば情報信号エンコーダと情報信号デコーダの対を示す図４Ａ，４Ｂを参照して下さい。エンコーディング側では、コアエンコーダ１６が、図３Ａに示すように実施されるリサンプラー、つまり解析フィルターバンク３８と変換長可変の合成フィルターバンク４２の連結によって実施されるリサンプラーの後に続く。上述のように、解析フィルターバンク３８の入力と合成フィルターバンク４２の出力との間の時間変動ダウンサンプリングレートを達成するために、合成フィルターバンク４２は一定領域のスペクトルの一部（合成フィルターバンク４２の変換長の時間変動長を有する部分）に対して再変換、つまり、解析フィルターバンク３８によって出力された一定長と一定変換レート４６の変換を行う。時間変動は両矢印によって示されている。解析フィルターバンク３８と合成フィルターバンク４２の連結によってリサンプリングされた低周波部分５０はコアエンコーダ１６によって符号化されるが、残りの部分、つまりスペクトル４６の残りの周波数部分である高周波部分５２は、パラメトリックエンベロープコーダー５４でのエンベロープのパラメトリック符号化の対象とされてもよい。このように、コアデータストリーム５６は、パラメトリックエンベロープコーダー５４によって出力されたパラメトリック符号化データストリーム５８を伴う。

デコーディング側では、デコーダも同様にコアデコーダ２２を含み、この後に、図３Ｂに示されているようなリサンプラー、つまり、解析フィルターバンク４０とそれに続く合成フィルターバンク４４から成り、解析フィルターバンク４０は、エンコーディング側での合成フィルターバンク４２の変換長の時間変動に同期した時間変動変換長を有するリサンプラーが続く。コアデコーダ２２はコアデータストリーム５６を受信しそれを復号するが、パラメトリックデータストリーム５８を受信し、そこから高周波部分５２’を導き出し、可変変換長の低周波部分５０、つまりエンコーディング側で合成フィルターバンク４２によって使用された変換長の時間変動に同期し、コアデコーダ２２によって出力されたサンプリングレートの変動に同期した変換長の低周波部分５０を完全なものとするために、パラメトリックエンベロープデコーダ６０が設置されている。

図４Ａのエンコーダの場合、解析フィルターバンク３８が存在していることが利点であり、これにより、リサンプラーの形成のためには単に合成フィルターバンク４２を追加するだけでよい。サンプリングレートの切り換えにより、スペクトル４６の低周波部分（低周波部分は、単にパラメトリックエンベロープコーディングの対象となる高周波部分と比較して、より正確なコアエンコーディングの対象となる）の割合を適合させることが可能である。特に、この割合は、データストリーム全体を送信するための可能送信帯域幅などのような外部条件に応じて、効率的に制御してもよい。エンコーディング側で制御される時間変動は、例えばそれぞれのサイド情報データによって、デコーディング側に簡単に信号伝達できる。

このように、図１Ａ〜４Ｂは、時間的エイリアシング解消が必要となる重複変換表記を使用しているにもかかわらず、サンプリングレートの変更を事実上可能にする概念を持っていることが好ましいということを示している。図５は、合成フィルターバンク４２または図２Ｂの再変換装置３６を実施するために使用される場合には、上述のような問題を克服し、既に述べたようにサンプリングレート変更などの利点を活用することができる情報信号再構築装置の一実施形態を示す。

図５に示された情報信号再構築装置は再変換装置７０とリサンプラー７２と結合装置７４を含み、これらは、この順番に、情報信号再変換装置８０の入力部７６と出力部７８との間に連続的に接続されている。

図５に示された情報信号再構築装置は、エイリアシング解消を使用して、入力部７６で入力された情報信号の重複変換表記から情報信号を再構築するためのものである。つまり、情報信号再構築装置は、入力部７６で入力された情報信号の重複変換表記を使用して、出力部７８で、時間変動サンプリングレートで情報信号を出力するためのものである。情報信号の重複変換表記は、情報信号のうちの連続する重複時間領域（または時間間隔）のそれぞれに関して、それぞれの領域のウィンドウバージョンの変換形を含む。以下により詳細に説明するように、情報信号再構築装置８０は、情報信号９０の先行領域８４と後続領域８６の境界部８２で変化するサンプリングレートで情報信号を再構築するよう構成されている。

情報信号再構築装置８０の個々のモジュール７０〜７４の機能性を説明するために、入力部７６で入力された情報信号の重複変換表記は一定の時間／周波数分解能を有する、つまり時間と周波数に関して分解能は一定であると予め仮定する。以降、別の状況について説明する。

この仮定によると、重複変換表記は図５の９２であると考えられる。そこに示されているように、重複変換表記は、ある変換レートΔｔで時間的に連続する一連の変換形を含む。各変換形９４は、情報信号のそれぞれの時間領域ｉのウィンドウバージョンの変換形を表す。特に、表記９２のための周波数分解能は時間に関して一定であるので、各変換形９４は一定個数の変換係数Ｎ_kを含む。これは、表記９２は、図５に示されているようにス
ペクトル軸ｋに沿って厳密に並べられていてもよいＮ_k個のスペクトル成分またはサブバ
ンドを含む情報信号のスペクトログラムであることを、事実上示している。それぞれのスペクトル成分またはサブバンドにおいて、スペクトログラム内の変換係数は変換レートΔｔで発生する。

このような一定の時間／周波数分解能を有する重複変換表記９２は、例えば、図３Ａに示されているようなＱＭＦ解析フィルターバンクによって出力される。この場合、各変換係数は複素数値となる。つまり、各変換係数は例えば実部と虚部を有することになる。しかし、重複変換表記９２の変換係数は、必ずしも複素数値である必要はなく、純粋なＭＤＣＴの場合のように、もっぱら実数値であってもよい。これ以外にも、図５の実施形態はまた、時間領域の重複部分でエイリアシングが発生する他の重複変換表記（その変換形９４が重複変換表記９２内に連続的に配列されるもの）にも適用可能であることに留意すべきである。

再変換装置７０は、各変換形９４に関して、連続時間領域８４，８６に対して各時間エンベロープ９６によって示される再変換形を得るために、変換形９４に対して再変換を行うよう構成されている。時間エンベロープは、一連の変換形９４を生成するために情報信号の前述のような時間領域に適用されるウィンドウに大体相当するものである。先行する時間領域８４に関して、図５では、再変換装置７０は、重複変換表記９２内の領域８４に関連する変換形９４全体に対して再変換を行ったと仮定している。領域８４の再変換形９６は、時間領域８４全体の時間的長さΔｔ・ａ（ａは連続する時間領域間の重複部を決定する係数）をサンプリングした例えばＮ_k個のサンプルまたはＮ_kの二倍の個数のサンプルを含む（表記９２の変換形９４はΔｔ・ａを単位として生成された）。つまり、いずれの場合も、各変換形９４を得る元となったウィンドウバージョンを作り上げたのと同じ個数のサンプルを含む。ここで、時間領域８４内の時間サンプルの個数と同一の個数（または二倍の個数）と、その時間領域８４に属する変換形９４内の変換係数の個数は、単に説明のために選択されたものであり、別の実施形態においては、同一（または二倍）は、使用される重複変換の詳細に応じて、両方の数値間の別の一定比に置き代えられてもよい。

ここで、情報信号再構築装置は時間領域８４と時間領域８６の間で情報信号のサンプリングレートを変更しようとしていることを前提としている。そうすることの動機は外部信号９８から生じる。例えば、情報信号再構築装置８０が図３Ａ、図４Ａの合成フィルターバンク４２を実施するために使用される場合、データストリームの転送条件の変更の場合のように、サンプリングレートの変更がより効率的なコーディングを約束する場合には必ず信号９８が与えられ得る。

本件の場合、情報信号再構築装置８０が時間領域８４と８６の間でサンプリングレートを下げようとしている前提は、説明のためである。従って、再変換装置７０はまた、後続領域８６の再変換形１００を得るために、この後続領域８６のウィンドウバージョンの変換形に対して再変換を行うが、この時、再変換装置７０はこの再変換を行うのに短い方の変換長を使用する。より正確には、再変換装置７０は、後続領域８６の変換に関してだけ、変換係数１…Ｎ_k’のうちの最も低い値Ｎ_k’への再変換を実行し、これにより得られた再変換形１００はより低いサンプリングレートを有することになる。つまり、再変換形１００は、Ｎ_k（またはＮ_kに相当する割合）の代わりに単にＮ_k’でサンプリングされるこ
とになる。

図５に示されているように、再変換形９６と１００の間に以下のような問題が起こる。先行領域８４の再変換形９６と後続領域８６の再変換形１００は、これらの先行領域８４と後続領域８６との間の境界部８２でのエイリアシング解消部分１０２で重なる。エイリアシング解消部分の時間的な長さは例えば（ａ−１）・Δｔであるが、このエイリアシング解消部分１０２内の再変換形９６のサンプルの個数は、同じエイリアシング解消部分１０２内の再変換形１００のサンプルの個数とは異なる（この例では、再変換形１００のサンプルの個数よりも高くなる）。従って、この時間間隔１０２で両方の再変換形９６と１００を重複加算することによる時間的エイリアシング解消は、単純なことではない。

従って、リサンプラー７２は再構築装置７０と結合装置７４の間に接続され、結合装置７４は時間的エイリアシング解消を実行する。特に、リサンプラー７２は、エイリアシング解消部分１０２における先行領域８４の再変換形９６及び／または後続領域８６の再変換形１００を、境界部８２でのサンプリングレート変更に従い、補間により、リサンプリングするよう構成されている。再変換形９６が再変換形１００よりも早くリサンプラー７２の入力部に到達するので、リサンプラー７２は先行領域８４の再変換形９６に対するリサンプリングを行うことが好ましい。つまり、補間１０４により、エイリアシング解消部分１０２に含まれている再変換形９６の部分が、同じエイリアシング解消部分１０２内の再変換形１００のサンプリング条件またはサンプル位置に相当するように、リサンプリングされる。そして、その時間間隔１０２内で新しいサンプリングレートでの再構築信号９０を得るために、結合装置７４は、再変換形９６のリサンプルバージョンと再変換形１００の同一場所のサンプルを単純に加算するだけでもよい。この場合、出力再構築信号は、時間領域８６の最初の部分で前のサンプリングレートから新しいサンプリングレートに変換されたものとなる。しかし、再構築信号９０におけるサンプリングレート変更に間に合う別のポイント８２を得るために、補間はまた、時間間隔１０２の前半と後半とで違う方法で行われてもよい。このように、瞬間８２は図５では領域８４と８６の重複部分の中間に示されているが、それは単に説明のためであり、他の実施形態においては、この同じ時間的ポイントは、領域８６の最初の部分と領域８４の最後の部分との間のどちらも含む部分のどこかにあればよい。

従って、結合装置７４は、エイリアシング解消部分１０２でのリサンプリングによって得られた先行領域８４と後続領域８６それぞれの再変換形９６と１００の間でのエイリアシング解消を実行することができる。より正確には、エイリアシング解消部分１０２でエイリアシングを解消するために、結合装置７４は、リサンプラー７２によって得られたリサンプルバージョンを使用して、部分１０２内の再変換形９６と１００の重複加算処理を行う。情報信号９０のサンプリングレートが時間ポイント８２で高いサンプリングレートから低いサンプリングレートに変化しても、この重複加算処理により、変換形９４を生成するためのウィンドウ処理に沿って、境界部８２を渡っても、エイリアシングフリーで連続的に再構築された情報信号９０を出力部７８で出力することができる。

このように、図５に関する上述の説明から分かるように、先行時間領域８４のウィンドウバージョンの変換形９４に対して行われた再変換の変換長の、その先行領域８４の時間的長さに対する比は、後続時間領域８６のウィンドウバージョンに対して行われた再変換の変換長の、その後続領域８６の時間的長さに対する比とは、これらの領域８４と８６との間の境界部８２でのサンプリングレート変更に相当する係数分だけ異なっている。上述した例では、この比の変化は外部信号９８によって引き起こされたものである。先行領域８４と後続領域８６の時間的長さは互いに同じであり、再変換装置７０は、後続領域８６のウィンドウバージョンの変換形９４に対する再変換の適用を、例えばＮ_k’番目の変換
係数までの低周波部分に制限するよう構成されたものであるという前提で、説明してきた。もちろん、このような処理は、先行領域８４のウィンドウバージョンの変更結果９４に対しても可能である。さらに、上述の説明とは対照的に、境界部８２でのサンプリングレート変更は逆方向でも可能であり、従って、後続領域８６に関しては何の取得も行われず、先行領域８４のウィンドウバージョンの変換形９４に関してだけ処理が行われてもよい。

より正確には、ここまで、情報信号の領域のウィンドウバージョンの変換形９４の変換長と情報信号の領域の時間的長さが一定である場合、つまり、重複変換表記９２は一定の時間／周波数分解能を有するスペクトログラムである場合に対する図５の情報信号再構築装置の動作モードを説明してきた。境界部８２の位置設定の際に、情報信号再構築装置８０は、一例として制御信号９８に反応するものとして説明した。

従って、この構成において、図５の情報信号再構築装置８０は図３Ａのリサンプラー１４の一部となり得る。換言すれば、図３Ａのリサンプラー１４は、情報信号の重複変換表記を出力するフィルターバンク３８と、今まで説明してきたような情報信号の重複変換表記からエイリアシング解消を使用して情報信号を再構築するよう構成された情報信号再構築装置８０を含む逆フィルターバンクとの連結から成る。従って、例えば、図５の再変換装置７０はＱＭＦ合成フィルターバンクとして構成することができ、フィルターバンク３８はＱＭＦ解析フィルターバンクとして実施することができる。

図１Ａ〜４Ａの説明から明らかなように、情報信号エンコーダは、コアエンコーダ１６または集隗コアエンコーダ１６のような圧縮ステージとパラメトリックエンベロープコーダー５４に加えて、このようなリサンプラーを含み得る。圧縮ステージは再構築情報信号を圧縮するよう構成されている。図１Ａ〜４Ａに示されているように、このような情報信号エンコーダは、例えば可能転送ビットレートに関する外部情報に応じて制御信号９８を制御するよう構成されたサンプリングレートコントローラをさらに含み得る。

しかし別の例では、図５の情報信号再構築装置は、重複変換表記内で情報信号の領域のウィンドウバージョンの変換長の変化を検出することにより、領域８２の位置を特定するよう構成可能である。この可能な実施例をより明確にするために、入力された重複変換表記の一例が示されている図５の９２’を参照して下さい。それによると、表記９２’内の連続する変換形９４は一定の変換レートΔｔで再変換装置７０に到着するが、それぞれの変換形の変換長は変化している。図５において、例えば、先行時間領域８４のウィンドウバージョンの変換形の変換長（Ｎ_k）は、後続領域８６のウィンドウバージョンの変換形
の変換長（Ｎｋ’）よりも大きいと仮定する。ともかく、再変換装置７０は入力データストリームから重複変換表記９２’に関する情報をパースし、それに従い、再変換装置７０は、情報信号の連続領域のウィンドウバージョンの変換形に対して行われる再変換の変換長を、重複変換表記９２’の連続する変換形の変換長に適合させてもよい。従って、再変換装置７０は先行時間領域８４のウィンドウバージョンの変換形９４の再変換のために変換長Ｎ_kを使用し、後続時間領域８６のウィンドウバージョンの変換形の再変換のために
変換長Ｎ_k’を使用してもよい。これにより、前述し、図５の上部中央に示されているよ
うな再変換形の間のサンプリングレートの違いが生じる。従って、図５の情報信号再構築装置８０の動作モードに関して、この動作モードは、再変換の変換長を重複変換表記９２’内の変換形の変換長に適合させる際の今述べたような違いに加えて、上記説明と一致する。

このように、後者の機能性に従えば、情報信号再構築装置は外部制御信号９８に反応する必要はない。むしろ、サンプリングレート変更時点に関する情報を情報信号再構築装置に通知するには、入力されてくる重複変換表記９２’で十分である。

今説明したように動作する情報信号再構築装置８０は、図２Ｂの再変換装置３６を形成するために使用できる。つまり、情報信号デコーダは、データストリームから情報信号の重複変換表記９２’を再構築するよう構成された展開装置３４を含んでいてもよい。前述したように、この再構築はエントロピーデコーディングを伴う。変換形９４の時間変動変換長は、展開装置３４に入力されるデータストリーム内で適切な方法で信号伝達できる。図５に示されているような情報信号再構築装置は再構築装置３６として使用できる。図５の情報信号再構築装置は、展開装置によって与えられたような重複変換表記から、エイリアシング解消を使用して情報信号を再構築するよう構成できる。後者の場合、再変換装置７０は、再変換を実行するために、例えばＩＭＤＣＴを使用することもでき、変換形９４は複素数値係数よりもむしろ実数値係数によって表される。

このように、上記の実施形態によると多くの利点が達成できる。例えば毎秒８ｋｂから毎秒１２８ｋｂに渡るような広い範囲の様々なビットレートで動作するオーディオコーデックに関して、最適なサンプリングレートは、図４Ａ，４Ｂに関して上述したように、ビットレートに依存する場合もある。低いビットレートでは、低周波だけが、例えばＡＣＥＬＰや変換コーディングのような、より正確なコーディング方法で符号化されるべきであり、高周波はパラメトリック方法で符号化されるべきである。高いビットレートでは、スペクトル域全体が例えば正確な方法で符号化される。これは、例えば、これらの正確な方法は常に最適な表記で信号を符号化すべきであることを意味している。これらの信号のサンプリングレートは、ナイキスト原理に準じた最も関連性のある信号周波数成分の変換が可能となるよう、最適化されるべきである。ここで示されているサンプリングレートコントローラ１２０は、情報信号がコアエンコーダ１６に送られる際のサンプリングビットレートを、可能転送ビットレートに応じて制御するよう構成され得る。これは、解析フィルターバンクのスペクトルの低周波部分だけをコアエンコーダ１６に送ることを意味している。残りの高周波部分はパラメトリックエンベロープコーダー５４に送られる。上述したように、サンプリングレートの時間変動と転送ビットレートは問題ではない。

図５の説明は、サンプリングレート変更時に時間的エイリアシング解消の問題に対処するために使用できる情報信号再構築装置に関するものである。また、図１Ａ〜図４Ｂに関して前述したように、変換器が重複変換表記を生成し、そして図５の情報信号再構築装置にそれを送る図１Ａ〜４Ｂの装置内で、連続するモジュール間のインターフェースで何らかの対策が行われなければならない。

図６は情報信号変換装置のこのような一実施形態を示す。図６の情報信号変換装置は、一連のサンプルという形態で情報信号を受け取る入力部１０５と、情報信号の連続重複領域を取得するよう構成された取込み器１０６と、各連続重複領域が一定のサンプリングレートを有するように（しかし連続重複領域の間ではサンプリングレートは異なっている）、連続重複領域の少なくとも一部に対してリサンプリングを行うよう構成されたリサンプラー１０７と、連続重複領域に対してウィンドウ処理を行うよう構成されたウィンドウ処理部１０８と、図６の情報信号変換器の出力部１１０で出力される重複変換表記９２’を構成する一連の変換形９４を得るために、ウィンドウ処理された部分に対して個々に変換を行うよう構成された変換器を含む。ウィンドウ処理部１０８はハフマンウィンドウ等を使用してもよい。

取込み器１０６は、情報信号の連続重複領域が同じ時間的長さを有するように、例えばそれぞれ２０ｍｓとなるように、取込みを行う。

取込み器１０６は一連の情報信号部分をリサンプラー１０７に送る。入力情報信号が所定の瞬間に第１のサンプリングレートから第２のサンプリングレートに変わる時間変動サンプリングレートであると仮定すると、例えば、リサンプラー１０７は、図６の１１１で示されているように、サンプリングレートが第１のサンプリングレートから第２のサンプリングレートに一度変化するように時間的に所定の時点を含む入力されてくる情報信号部分を補間によってリサンプルするよう構成されていてもよい。これをより明確にするために、図６は、サンプリングレートが瞬間１１３で変わる一連のサンプル１１２を説明的に示しており、一例として、一定の時間的長さを有する領域１１４ａ〜１１４ｄが一定の領域オフセット１１５Δｔで取り込まれる。この領域オフセット１１５Δｔは、一定の領域時間的長さと共に、連続領域１１４ａ〜１１４ｄの間の所定の重複部分を例えば連続する二つの領域ごとに５０％の重複となるように規定する。しかし、これは単に一例にすぎない。この瞬間１１３より前の第１のサンプリングレートはδｔ₁で示され、この瞬間１１
３より後のサンプリングレートはδｔ₂で示されている。１１１で示されているように、リサンプラー１０７は、例えば、領域１１４ｂを一定のサンプリングレートδｔ₁を有するようリサンプリングするが、時間的後続領域１１４ｃに対しては、一定のサンプリングレートδｔ₂を有するようにリサンプリングするよう構成されていてもよい。原則的に、リサンプラー１０７が、時間的に瞬間１１３を含むそれぞれの領域１１４ｂ，１１４ｃの一部分を補間によってリサンプリングすれば十分であり、それがまだ目標サンプリングレートでなくても構わない。例えば領域１１４ｂの場合、リサンプラー１０７が、領域１１４ｂの時間的に瞬間１１３より後の部分をリサンプリングし、１１４ｃの場合には、瞬間１１３より前の部分だけをリサンプリングすれば十分である。その場合、取り込まれた領域１１４ａ〜１１４ｄは一定の時間的長さであるので、リサンプリングされた各領域は、それぞれの一定サンプリングレートδｔ₁，δｔ₂に対応した個数の時間サンプルＮ₁，Ｎ₂を有する。ウィンドウ処理部１０８は、そのウィンドウまたはウィンドウ長さを各入力部でのこのサンプルの個数に適合させてもよい。同じことが変換器１０９にも当てはまり、変換器１０９もその変換長または変換を同じように適合させてもよい。つまり、図６の１１１で示されている例では、出力部１１０での重複変換表記は一連の変換形から成り、変換形の長さはそれぞれ異なり、連続領域のサンプルの個数に対して一次従属的に、つまりそれぞれの領域に対して行ったリサンプリングの際のサンプリングレートに対して一次従属的に増加減少する。

リサンプラー１０７は、それぞれの連続領域１１４ａ〜１１４ｄ内のリサンプリングされるべきサンプル個数が最小となるように、これらの連続領域１１４ａ〜１１４ｄの間のサンプリングレート変更を記録するよう構成されていてもよい。あるいは、リサンプラー１０７はこれとは異なるように構成されていてもよい。例えば、リサンプラー１０７はダウンサンプリングよりもアップサンプリングを選択するまたはその逆であるように構成されていてもよく、つまり、瞬間１１３と重なる全ての領域が第１のサンプリングレートδｔ₁または第２のサンプリングレートδｔ₂でリサンプリングされるように、リサンプリングを実行するよう構成されていてもよい。

図６の情報信号変換装置は、例えば図２Ａの変換装置３０を実施するのに使用してもよい。その場合、例えば変換器１０９はＭＤＣＴを実行するよう構成されていてもよい。

これに関して、変換器１０９によって行われる変換の変換長は、リサンプリングされたサンプルの個数で測定した領域１１４ｃのサイズよりも大きくてもよいことに留意すべきである。その場合、ウィンドウ処理部１０８から出力されたウィンドウ領域を超える変換長の部分は、変換器１０９による変換を行う前に０にセットされてもよい。

図５の補間１０４と図６のリサンプラー１０７内での補間を実現するための可能な実施例を詳細に説明する前に、図１Ａ，１Ｂのエンコーダとデコーダの可能な実施形態を示す図７Ａ，７Ｂを参照して下さい。特に、リサンプラー１４，２４は図３Ａ，３Ｂに示されているように実施されているが、コアエンコーダ１６とコアデコーダ２２は、それぞれ、ＭＤＣＴに基づく変換コーディングとＡＣＥＬＰコーディングのようなＣＥＬＰコーディングとの間で切り換え可能なコーデックとして実施されている。ＭＤＣＴに基づくコーディング／デコーディングブランチ１２２，１２４は、それぞれ、例えばＴＣＸエンコーダとＴＣＸデコーダであってもよい。あるいは、ＡＡＣコーダー／デコーダ対が使用されてもよい。ＣＥＬＰコーディングのために、ＡＣＥＬＰエンコーダ１２６がコアエンコーダ１６の他方のコーディングブランチとなり、ＡＣＥＬＰデコーダ１２８がコアデコーダ２２の他方のデコーディングブランチとなっていてもよい。これら両方のコーディングブランチ間での切り換えは、これらのコーディングモジュールの詳細についてその標準テキストに記載しているＵＳＡＣ［２］またはＡＭＲ−ＷＢ＋［１］の場合のように、フレーム毎に行われ得る。

図７Ａ，７Ｂのエンコーダとデコーダをさらに詳しい具体例として考え、コーディングブランチ１２２，１２６への入力とデコーディングブランチ１２４，１２８による再構築のために内部サンプリングレートの切り換えを可能にするスキームを、以下に詳細に説明する。特に、入力部１２での入力信号の入力は、例えば３２ｋＨｚという一定のサンプリングレートであってもよい。この信号は、上述のような方法でＱＭＦ解析／合成フィルターバンク対３８，４２を使用して、すなわち、帯域数に関して１．２５または２．５というような適切な解析及び合成比でリサンプリングされてもよく、これは、例えば２５．６ｋＨｚまたは１２．８ｋＨｚの専用サンプリングレートを有するコアデコーダ１６に入力してくる内部時間信号となる。そして、ダウンサンプリングされた信号は、コーディングブランチのうちのコーディングモードに応じたものを使用して符号化される。コーディングブランチ１２２では、ＭＤＣＴ表記及び標準的な変換コーディングスキームを使用して符号化され、または、コーディングブランチ１２６ではＡＣＥＬＰを使用して時間領域で符号化される。コアエンコーダ１６のコーディングブランチ１２６，１２２によってこのように生成されたデータストリームは出力され、デコーディング側に送られ、そこで再構築される。

内部サンプリングレートを切り換えるために、フィルターバンク３８，４４は、コアエンコーダ１６とコアデコーダ２２が動作するであろう内部サンプリングレートに従い、フレーム毎に適合されなければならない。図８は考えられるいくつかの切り換え場面を示しているが、ここでは、単にエンコーダとデコーダのＭＤＣＴコーディングの道筋を示しているだけである。

特に、図８は、３２ｋＨｚであると想定されている入力サンプリングレートが２５．６ｋＨｚ、１２．８ｋＨｚ、８ｋＨｚのいずれかにダウンサンプリングされるか、その入力サンプリングレートが維持される可能性があることを示している。入力サンプリングレートと内部サンプリングレートとの間の選択されたサンプリングレート比に応じて、フィルターバンク解析とフィルターバンク合成との間の変換長の比が決まる。これらの比は図８の影付きの部分（フィルターバンク３８，４４では、選択された内部サンプリングレートとは関係なく、それぞれ４０個のサブバンド、フィルターバンク４２，４０では、選択された内部サンプリングレートに応じて、それぞれ４０個、３２個、１６個または１０個のサブバンド）から導き出すことができる。コアエンコーダ内で使用されるＭＤＣＴの変換長はこのように決定された内部サンプリングレートに適合され、結果的に変換レートまたは変換ピッチ時間間隔が一定または選択された内部サンプリングレートとは無関係となるように適合される。これは例えば常に２０ｍｓであってもよく、その結果、選択された内部サンプリングレートに応じて、それぞれ６４０、５１２、２５６、１６０の変換長となる。

上述のような原理を使用して、フィルターバンク切り換えに関する以下の規制に従い、内部サンプリングレートを切り換えることができる。
−切り換えの間にいかなる遅延も追加されない。
−この切り換えつまりサンプリングレート変更は瞬時に行われる。
−切り換えアーチファクトは最低限に抑えられるかまたは少なくとも低減される。
−計算量が小さい。

基本的に、フィルターバンク３８〜４４とコアコーダー内のＭＤＣＴは、フィルターバンクにおいて、コアエンコーダとデコーダのＭＤＣＴと比較して、ウィンドウ領域の重複度が高くてもよい重複変換である。例えば、フィルターバンクにおいて１０回の重複が適用されてもよく、ＭＤＣＴ１２２，１２４において２回の重複が適用されてもよい。重複変換のために、ステートバッファが、解析フィルターバンクとＭＤＣＴのための解析ウィンドウバッファとして、また合成フィルターバンクとＩＭＤＣＴのための重複加算バッファとして説明できる。レート切り換えの際に、これらのステートバッファは、図５，６に関して上述したような方法で、サンプリングレートの切り換えに応じて調整されるべきである。以下に、図５に関して説明した合成側よりもむしろ、図６に関して説明した解析側でも実行され得る補間に関して、以下に詳細に説明する。重複変換のプロトタイプまたはウィンドウが適合されてもよい。切り換えアーチファクトを低減するには、重複変換部のエイリアシング解消特性を保持するためにステートバッファ内の信号成分を保存すべきである。

以下に、リサンプラー７２内での補間１０４の実行方法について詳細に説明する。

以下のように２種類の場合に区分できる。
１）スイッチアップは、先行時間部分８４から後続時間部分８６へサンプリングレートが増加される処理である。
２）スイッチダウンは、先行時間部分８４から後続時間部分８６へサンプリングレートが減少される処理である。

例えば１２．８ｋＨｚ（２０ｍｓごとに２５６個のサンプル）から３２ｋＨｚ（２０ｍｓごとに６４０個のサンプル）へのようなスイッチアップを想定すると、図５に参照符号１３０で示されているようなリサンプラー７２のステートバッファまたはその容量は、サンプリングレート変更に相当する係数（上述の例では２．５）分だけ拡張される必要がある。追加遅延を発生させない拡張のための可能な方法は、例えば、線形補間またはスプライン補間である。つまり、リサンプラー７２は、先行時間領域８４に関する再変換形９６の後部の（時間間隔１０２に存在するような）サンプルを、ステートバッファ１３０内ですぐに補間してもよい。ステートバッファは、図５に示されているように、先入れ先出しバッファとして機能してもよい。当然、完全なエイリアシング解消のために必要な全ての周波数成分がこの処理によって得られるわけではないが、例えば０〜６．４ｋＨｚのような少なくとも低周波域が何の歪みもなく生成可能であり、これらの周波数は心理音響的な点で最も関連深いものである。

低いサンプリングレートへのスイッチダウンの場合には、線形またはスプライン補間は、また、追加遅延を発生させずにステートバッファを縮小するためにも使用できる。つまり、リサンプラー７２は補間によりサンプリングレートを減少させてもよい。しかし、大きい縮小係数でのサンプリングレートへのスイッチダウン、例えば３２ｋＨｚ（２０ｍｓごとに６４０個のサンプル）から１２．８ｋＨｚ（２０ｍｓごとに２５６個のサンプル）への切り換え（この場合、縮小係数は２．５）は、高周波成分が除去されなければエイリアシング解消をひどく妨害する可能性がある。合成フィルタリングがこの現象に対処してもよく、この合成フィルタリングでは、フィルターバンクまたは再変換装置を「フラッシュ」することにより、高周波成分を除去することができる。これは、切り換えの瞬間にフィルターバンクが少ない周波数成分を合成し、従って、重複加算バッファから高スペクトル成分を取り除いてきれいにすることを意味している。より正確には、先行時間領域８４のための第１のサンプリングレートから後続時間領域８６のための第２のサンプリングレートへのスイッチダウンを想像して下さい。上記説明から離れて、再変換装置７０は、先行時間領域８４のウィンドウバージョンの変換形９４の周波数成分の全てを再変換の対象とするわけではなく、そうすることによりスイッチダウンに備えるよう構成されている。むしろ、再変換装置７０は、変換形９４のあまり関係のない高周波成分を例えば０にセットすることにより、あるいは、これらの高周波成分を次第に減衰させるなどしてそれらの再変換に対する影響を減じることで、高周波成分を再変換から除外してもよい。例えば、この処理の対象となる高周波成分は、周波数成分Ｎ_k’よりも高いものであってもよい。
従って、結果的に生じた情報信号内では、時間領域８４は、意図的に入力部７６で入力された重複変換表記で入手可能であった帯域幅よりも低いスペクトル帯域で再構築されたものとなる。しかし、補間処理１０４にもかかわらず、高周波部分を気付かずに結合装置７４内でのエイリアシング解消処理に導入した場合に重複加算処理で起こるであろうエイリアシング問題を避けることができる。

別の例として、高サンプリングレート表記からの切り換えのために適当なステートバッファ内で使用できるように、さらに低サンプリングレート表記も同時に生成可能である。これにより、デシメーション係数（デシメーションが必要な場合）が常に比較的低く（つまり２より小さく）保たれ、妨害となるようなアーチファクトがエイリアシングから起こることはない。前述したように、これが全ての周波数成分を維持するわけではないが、少なくとも、心理音響的に関連のある低周波を維持することになる。

従って、特定の実施形態によれば、ＵＳＡＣの低遅延型を得るために、以下の方法でＵＳＡＣコーデックを修正することができる。最初に、ＴＣＸコーディングモードとＡＣＥＬＰコーディングモードのみが許可される。ＡＡＣモードは回避できる。２０ｍｓのフレーミングを得るために、そのフレーム長を選択できる。そして、動作モード（超広帯域（ＳＷＢ）、広帯域（ＷＢ）、狭帯域（ＮＢ）または全帯域幅）とビットレートに応じて、以下のようなシステムパラメータが選択可能である。システムパラメータの概略を以下の表１に示す。

狭帯域（ＮＢ）モードに関して、サンプリングレートの増加を避けることができ、内部サンプリングレートを入力サンプリングレートと等しくなるように、つまり８ｋＨｚにセットし、それに応じたフレーム長つまりサンプル数１６０のフレーム長を選択することにより、元に戻すことができる。同様に、広帯域（ＷＢ）動作モードの場合には、１６ｋＨｚを選択し、ＴＣＸのためのＭＤＣＴのフレーム長を、サンプル数２５６ではなく、３２０とすることができる。

特に、動作ポイントのリスト全体を通して、つまりサポートされているサンプリングレート、ビットレート及び帯域幅を通して変更動作を支えることができる。以下の表２に、ＵＳＡＣコーデックの予想低遅延型の内部サンプリングレートに関する様々な構成を示す。

サイド情報として、図２Ａ，２Ｂのリサンプラーを使用する必要はないことに留意すべきである。入力サンプリングレートから専用のコアサンプリング周波数へのリサンプリング機能を負うために、代わりにＩＩＲフィルターセットを設けることができる。これらのＩＩＲフィルター遅延は０．５ｍｓ未満であるが、入力周波数と出力周波数との間の比が半端なものであるので、その複雑さは相当なものである。全てのＩＩＲフィルターに関して遅延が同じであると仮定すると、違うサンプリングレート間での変更が可能となる。

従って、図２Ａ，２Ｂのリサンプラーの実施例を使用することが好ましい。パラメトリックエンベロープモジュール（つまりＳＢＲ）のＱＭＦフィルターバンクが、上述したようなリサンプリング機能を実現するための共同作業に加わってもよい。ＳＷＢの場合、このことは、ＳＢＲエンコーダモジュールにより既に解析ステージが実現されている一方で、合成フィルターバンクステージをエンコーダに付加することになる。デコーダ側では、ＳＢＲが使用可能である場合にＱＭＦがアップサンプリング機能を既に負っている。このスキームは他の全ての帯域幅モードにおいても使用可能である。以下の表３に、必要なＱＭＦ構成の概略を示す。

入力サンプリング周波数が一定であると仮定すると、ＱＭＦ合成プロトタイプを変えることにより、内部サンプリングレート間での変更が可能となる。デコーダ側には逆の動作が適用できる。ＱＭＦ帯域の帯域幅は動作ポイントの全域を通して同じであることに留意すべきである。

本発明のいくつかの態様を装置に関して説明してきたが、これらの態様はまたこれらに相当する方法の説明でもあり、ブロックや装置は方法ステップや方法ステップの特徴に対応する。同様に、方法ステップに関して説明した態様はまた、これらに相当するブロックやアイテムまたはこれらに相当する装置の特徴の説明でもある。これらの方法ステップのうちのいくつかまたは全てが、例えばマイクロプロセッサ、プログラム制御可能なコンピュータや電子回路のようなハードウェア装置により（またはそれを使用して）実施してもよい。いくつかの実施形態において、最も重要な方法ステップのうちの一つまたはそれ以上のものが、このような装置によって実行されてもよい。

実施条件に応じて、本発明の実施形態はハードウェアまたはソフトウェアで実現可能である。これは、例えばフロッピーディスク、ＤＶＤ、ブルーレイ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭやＦＬＡＳＨメモリーなどの、電子読み取り制御可能な信号が中に保存されたデジタル記憶媒体を使用して実施することができ、これらの電子読み取り制御可能な信号は、それぞれの方法が実行できるように、プログラム可能なコンピュータシステムと協働する（または協働可能である）。従って、このようなデジタル記憶媒体はコンピュータ読み取り可能なものであってもよい。

本発明のいくつかの実施形態は、電子読み取り制御可能な信号を有するデータキャリアを含み、これらの電子読み取り制御可能な信号は、ここで説明した方法のうちの一つを実行できるように、プログラム可能なコンピュータシステムと協働可能である。

一般的に、本発明の実施形態は、プログラムコードを備えたコンピュータプログラム製品として実施でき、このプログラム製品がコンピュータで動作した際、このプログラムコードは前述の方法のうちの一つを実行するためのものである。このようなプログラムコードは、例えば機械読み取り可能なキャリアに保存されていてもよい。

他の実施形態は、ここで説明した方法のうちの一つを実行するためのものであり、機械読み取り可能なキャリアに保存されているコンピュータプログラムを含む。

換言すれば、本発明の方法の一実施形態は、従って、コンピュータで動作した際、前述の方法のうちの一つを実行するためのプログラムコードを有するコンピュータプログラムである。

本発明の方法の別の実施形態は、従って、前述の方法のうちの一つを実行するためのコンピュータプログラムを格納しているデータキャリア（またはデジタル媒体またはコンピュータ読み取り可能な媒体）である。

本発明の方法の別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。このデータストリームまたは一連の信号は、例えばインターネットのようなデータ通信接続を介して送信されるように構成されていてもよい。

さらに別の実施形態は、ここで説明した方法のうちの一つを実行するように構成された、例えばコンピュータやプログラム可能な論理装置のような処理手段を含む。

本発明のさらに別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムがインストールされているコンピュータを含む。

本発明の別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムを受信機に転送する（例えば電子的にまたは光学的に）よう構成された装置またはシステムを含む。

いくつかの実施形態において、ここで説明した方法の機能性のうちのいくつかまたは全てを実行するために、プログラム可能な論理装置（例えばフィールドプログラマブルゲートアレイ）を使用してもよい。いくつかの実施形態において、ここで説明した方法のうちの一つを実行するために、フィールドプログラマブルゲートアレイがマイクロプロセッサと協働してもよい。一般的に、これらの方法は何らかのハードウェア装置によって実行されることが好ましい。

上述の実施形態は単に本発明の原理を説明しているにすぎない。ここで説明した配置や詳細に関して様々な修正や変更が当業者には明らかであろう。従って、本発明は以下の特許請求項の範囲によってのみ制限され、上述の実施形態で示された詳細によっては制限されない。

Claims

エイリアシング発生重複変換を使用して情報信号の重複変換表記を生成するよう構成された情報信号変換装置であり、
一連のサンプルという形態で情報信号を受け取る入力部（１０５）と、
情報信号の連続重複領域を取得するよう構成された取込み器（１０６）と、
各連続重複領域が一定のサンプリングレートを有するが、連続重複領域の間ではサンプリングレートは異なるように、連続重複領域の少なくとも一部に対して補間によりリサンプリングを行うよう構成されたリサンプラー（１０７）と、
情報信号の連続重複領域に対してウィンドウ処理を行うよう構成されたウィンドウ処理部（１０８）と、
ウィンドウ処理された領域に対して個々に変換を行うよう構成された変換器（１０９）を含み、
取込み器（１０６）は、情報信号の連続重複領域は時間的に一定の長さであるように、情報信号の連続重複領域の取り込みを行うよう構成されている。
請求項１に記載の情報信号変換装置であり、取込み器（１０６）は、情報信号の連続重複領域が時間的に一定のオフセットを有するように、情報信号の連続重複領域の取り込みを行うよう構成されている。
請求項１または２に記載の情報信号変換装置であり、
一連のサンプルは、所定の瞬間（１１３）に第１のサンプリングレートから第２のサンプリングレートに変わる変動サンプリングレートを有し、
リサンプラー（１０７）は、連続重複領域の一定のサンプリングレートは第１のサンプリングレートから第２のサンプリングレートへ一度だけ変化するように、所定の瞬間に重複している連続重複領域（１１４ｂ，ｃ）に対してリサンプリングを行うよう構成されている。
請求項３に記載の情報信号変換装置であり、変換器は、ウィンドウ処理された各領域の変換形の変換長を、ウィンドウ処理されたそれぞれの領域のサンプル数に適合させるよう構成されている。
エイリアシング発生重複変換を使用して情報信号の重複変換表記を生成する方法であり、
一連のサンプルという形態で情報信号を受け取ることと、
情報信号の連続重複領域を取得することと、
各連続重複領域が一定のサンプリングレートを有するが、連続重複領域の間ではサンプリングレートは異なるように、連続重複領域の少なくとも一部に対して補間によりリサンプリングを行うことと、
情報信号の連続重複領域に対してウィンドウ処理を行うことと、
ウィンドウ処理された領域に対して個々に変換を行うことを含み、
連続重複領域の取得では、情報信号の連続重複領域は時間的に一定の長さであるように、情報信号の連続重複領域の取り込みを行う。
コンピュータ上で起動された際、請求項５に記載の方法をコンピュータに実行させるためのプログラムコードを有するコンピュータプログラム。