JP2012530946A

JP2012530946A - 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し

Info

Publication number: JP2012530946A
Application number: JP2012516454A
Authority: JP
Inventors: ブリュノ・ベセット
Original assignee: ヴォイスエイジ・コーポレーション
Priority date: 2009-06-23
Filing date: 2010-06-23
Publication date: 2012-12-06
Anticipated expiration: 2030-06-23
Also published as: EP3352168A1; PL3352168T3; RU2012102049A; CA2763793A1; WO2010148516A1; US20110153333A1; CA2763793C; EP2446539A1; RU2557455C2; ES2673637T3; EP2446539A4; HK1258874A1; EP3764356A1; JP5699141B2; EP3352168B1; ES2825032T3; EP2446539B1; US8725503B2

Abstract

本発明は、コーダからデコーダへ伝送されるコード化信号における時間領域エイリアシングの順方向取り消しのための方法およびデバイスに関する。コード化信号における時間領域エイリアシングの訂正に関する情報は、コーダで計算され、コーダからデコーダへ送信されるビットストリームに追加される。デコーダはビットストリームを受信し、ビットストリームに含まれる情報に応答してコード化信号内の時間領域エイリアシングを取り消す。この情報は、第1のコーディングモードでエンコードされるオーディオ信号のフレームと、時間領域エイリアシング効果を含むフレームからのデコード信号との間の相違を表すことができる。

Description

本発明は、オーディオ信号のエンコードおよびデコードの分野に関する。より具体的には、本発明は、追加情報の伝送を使用した時間領域エイリアシング取り消しのためのデバイスおよび方法に関する。

最先端のオーディオコーディングは、時間周波数分解を使用してデータ整理のための有意義な方法で信号を表す。具体的に言えば、オーディオコーダは変換を使用して、周波数領域係数への時間領域サンプルのマッピングを実行する。この時間周波数マッピングに使用される離散時間変換は、典型的には、離散フーリエ変換(DFT)および離散コサイン変換(DCT)などのシヌソイド関数のカーネルに基づくものである。こうした変換は、オーディオ信号の「エネルギー圧縮」を達成することが示される。これは、変換(または周波数)領域内でのエネルギー分散が、時間領域サンプル内よりも少ない有意係数にローカライズされることを意味する。その後、コーディング利得は、適応ビット割振りおよび好適な量子化を周波数領域係数に適用することによって、達成可能である。受信機側では、量子化およびエンコードされたパラメータ(たとえば周波数領域係数)を表すビットを使用して、量子化された周波数領域係数(または利得などの他の量子化されたデータ)を回復し、逆の変換は時間領域オーディオ信号を発生させる。こうしたコーディング方式は、一般に変換コーディングと呼ばれる。

定義により、変換コーディングは入力オーディオ信号のサンプルの連続するブロック上で動作する。量子化は、オーディオ信号の各合成ブロックに何らかの歪みをもたらすため、非重複ブロックを使用することでブロック境界に不連続をもたらし、オーディオ信号品質を低下させる可能性がある。したがって変換コーディングでは、不連続を回避するために、離散変換の適用に先立ってオーディオ信号のエンコードブロックが重複され、あるデコードブロックから次のデコードブロックへと滑らかに移行できるように、重複セグメント内で適切にウィンドウ表示される。DFT(またはその高速等価物、FFT)またはDCTなどの「標準」変換を使用し、これを重複ブロックに適用すると、結果として残念ながらいわゆる「非クリティカルサンプリング(non-critical sampling)」が生じる。たとえば、典型的な50%重複条件を採用する場合、N個の連続する時間領域サンプルのブロックをエンコードするには、実際には、現在のブロックからN個のサンプル、次のブロック重複部分からN個のサンプルという、2N個の連続するサンプル上での変換を採用する必要がある。したがって、N個の時間領域サンプルのあらゆるブロックについて、2N個の周波数領域係数がエンコードされる。周波数領域内のクリティカルサンプリングは、N個の入力時間領域サンプルが、N個の周波数領域係数のみを量子化およびエンコードすることを示唆する。

重複ウィンドウを使用すること、および依然として変換領域内でクリティカルサンプリングを維持することが可能なように、特殊な変換が設計されており、変換の入力での2N個の時間領域サンプルは、結果として、変換の出力でのN個の周波数領域係数を発生させることになる。これを達成するために、2N個の時間領域サンプルのブロックは、特殊な時間反転および2Nサンプル長さのウィンドウ表示信号の特定部分の合計を通じて、第1にN個の時間領域サンプルのブロックまで減少される。この特殊な時間反転および合計により、いわゆる「時間領域エイリアシング」またはTDAが導入される。このエイリアシングがいったん信号のブロックに導入されると、そのブロックのみを使用して除去することはできない。これが、サイズNの(2Nではない)変換の入力である、その時間領域エイリアス信号であり、変換のN個の周波数領域係数を生成する。N個の時間領域サンプルを回復するために、逆変換は、実際に2つの連続する重複フレームから変換係数を使用して、時間領域エイリアシング取り消し、またはTDACと呼ばれるプロセス中に、TDAを取り消さなければならない。

オーディオコーディングで広く使用される、TDACを適用するこうした変換の例が、変形離散コサイン変換(またはMDCT)である。実際にMDCTは、時間領域内での明示的な折り畳みなしに、前述のTDAを実行する。むしろ、単一ブロックの直接および逆の両方のMDCT(IMDCT)を考慮する場合、時間領域エイリアシングが導入される。これはMDCTの数学的構造に由来し、当業者には周知である。しかしながら、この暗黙的時間領域エイリアシングは、時間領域サンプルの一部をまず反転し、これらの反転部を信号の他の部分に加算する(または減算する)ことと等価であるものとみなすことができることも知られている。これが「折り畳み」と呼ばれる。

オーディオコーダが、一方はTDACを使用し、他方は使用しないという、2つのコーディングモデル間で切り替える際に、問題が生じる。たとえば、コーデックがTDACコーディングモデルから非TDACコーディングモデルへと切り替えると想定する。TDACを使用せずにエンコードされたブロックには一般的な、TDACコーディングモデルを使用してエンコードされたサンプルのブロック側は、非TDACコーディングモデルを使用してエンコードされたサンプルのブロックを使用して取り消すことができないエイリアシングを含む。

第1の解決策は、取り消すことができないエイリアシングを含むサンプルを廃棄することである。

この解決策の結果、TDAを取り消すことができないサンプルのブロックが、1回目はTDACベースのコーデックによって、2回目は非TDACベースのコーデックによって、2回エンコードされるため、伝送帯域幅を非効率的に使用することになる。

第2の解決策は、時間反転および合計プロセスが適用される場合、ウィンドウの少なくとも一部にTDAが導入されない、特別に設計されたウィンドウを使用することである。図1は、左側にはTDAを導入するが右側には導入しない、例示的ウィンドウを示す図である。より具体的に言えば、図1では、2Nサンプルウィンドウ100がその左側にTDA110を導入する。図1のウィンドウ100は、TDACベースのコーデックから非TDACベースのコーデックへの移行に有用である。このウィンドウの最初の半分は、TDA110を導入するように形成され、前のウィンドウも重複を伴うTDAを使用する場合に取り消すことが可能である。しかしながら、図1のウィンドウの右側は、位置3N/2の折り畳みポイント以降にゼロ値のサンプル120を有する。したがってウィンドウ100のこの部分は、位置3N/2の折り畳みポイント付近で時間反転および合計(または折り畳み)プロセスが実行された場合、いかなるTDAも導入しない。

さらに、ウィンドウ100の左側は、テーパー形領域140が先行する平坦領域130を含む。テーパー形領域140の目的は、変換が計算された場合に良好なスペクトル分解能を提供すること、ならびに、重複および追加動作中の隣接するブロック間の移行を滑らかにすることである。ウィンドウの平坦領域130の持続時間を増加すると、情報帯域幅が減少し、ウィンドウの一部がいかなる情報も伴わずに送信されるため、ウィンドウのスペクトル性能が低下する。

多重モードのムービングピクチャエキスパートグループ(MPEG)のUnified Speech and Audio Codec (USAC)オーディオコーデックでは、図1に記載されたようないくつかの特別なウィンドウを使用して、矩形の非重複ウィンドウを使用するフレームから非矩形の重複ウィンドウを使用するフレームへの、異なる移行を管理する。これらの特別なウィンドウは、スペクトル分解能間での様々な妥協、データオーバヘッドの削減、およびこれらの異なるフレームタイプ間での移行の平滑化を達成するように設計された。

したがって、コーディングモード間の切り替えをサポートするためのエイリアシング取り消し技法が求められており、この技法は、これらのモード間の切り替えポイントでのエイリアシング効果を補償する。

したがって、本発明によれば、デコーダにおいてビットストリームで受信されたコード化信号における、時間領域エイリアシングの順方向取り消しのための方法が提供される。この方法は、デコーダにおいてビットストリームで、コーダから、コード化信号における時間領域エイリアシングの訂正に関する追加情報を受信することを含む。デコーダでは、時間領域エイリアシングは、追加情報に応答してコード化信号内で取り消される。

本発明によれば、コーダからデコーダに伝送するためのコード化信号における、時間領域エイリアシングの順方向取り消しのための方法も提供される。この方法は、コーダ内で、コード化信号における時間領域エイリアシングの訂正に関する追加情報を計算することを含む。コード化信号における時間領域エイリアシングの訂正に関する追加情報は、ビットストリーム内でコーダからデコーダへと送信される。

本発明によれば、ビットストリーム内で受信されたコード化信号における時間領域エイリアシングの順方向取り消しのためのデバイスも提供される。このデバイスは、ビットストリームで、コーダから、コード化信号における時間領域エイリアシングの訂正に関する追加情報を受信するための受信機を備える。このデバイスは、追加情報に応答するコード化信号における時間領域エイリアシングのキャンセラ(canceller)も備える。

さらに本発明は、デコーダへ伝送するためのコード化信号における時間領域エイリアシングの順方向取り消しのためのデバイスに関する。このデバイスは、コード化信号における時間領域エイリアシングの訂正に関する追加情報の計算機を備える。このデバイスは、ビットストリームで、デコーダへ、コード化信号における時間領域エイリアシングの訂正に関する追加情報を送信するための送信機も備える。

前述および他の特徴は、添付の図面を参照しながら単なる例として説明される、その例示的な諸実施形態の以下の非限定的な説明を読めばより明らかとなろう。

本発明の諸実施形態は、添付の図面を参照しながら単なる例として説明される。

左側にはTDAを導入するが右側には導入しないウィンドウの例を示す図である。非重複矩形ウィンドウを使用するブロックから、重複ウィンドウを使用するブロックへの移行例を示す図である。図2の図面に適用される折り畳みおよびTDAを示す図である。図2の図面に適用される順方向エイリアシング訂正を示す図である。非折り畳みFAC訂正(左)および折り畳みFAC訂正(右)を示す図である。 MDCTを使用するFAC訂正の方法の第1の適用を示す図である。 ACELPモードからの情報を使用するFAC訂正を示す図である。重複ウィンドウを使用するブロックから非重複矩形ウィンドウを使用するブロックへの移行時に適用されるFAC訂正を示す図である。非折り畳みFAC訂正(左)および折り畳みFAC訂正(右)を示す図である。 MDCTを使用するFAC訂正の方法の第2の適用を示す図である。 TCX誤り訂正を含むFAC量子化を示すブロック図である。多重モードコーディングシステムにおけるFAC訂正の様々な使用ケースを示す図である。多重モードコーディングシステムにおけるFAC訂正の他の使用ケースを示す図である。短変換ベースフレームとACELPフレームとの間の切り替え時のFAC訂正の第1の使用ケースを示す図である。短変換ベースフレームとACELPフレームとの間の切り替え時のFAC訂正の第2の使用ケースを示す図である。ビットストリームで受信されるコード化信号における時間領域エイリアシングの順方向取り消しのための例示的デバイスを示すブロック図である。デコーダへ送信するためのコード化信号における順方向時間領域エイリアシングの取り消しのための例示的デバイスを示すブロック図である。

以下の開示は、オーディオ信号が連続するフレームにおいて重複ウィンドウおよび非重複ウィンドウの両方を使用してエンコードされる場合、時間領域エイリアシングの効果の取り消しおよび非矩形ウィンドウ表示の問題に対処する。本明細書で説明される技術を使用すると、特別な非最適ウィンドウの使用を回避しながら、依然として、矩形の非重複ウィンドウおよび非矩形の重複ウィンドウの両方を使用したモデルにおけるフレーム移行の適切な管理が可能である。

矩形の非重複ウィンドウを使用するフレームの例は、線形予測(LP)コーディング、および特にACELPコーディングである。別の方法として、非矩形の重複ウィンドウの例は、MPEG Unified Speech and Audio Codec (USAC)で適用されるような変換コード化励振(TCX)コーディングであり、TCXフレームは、時間領域エイリアシング(TDA)を導入する、重複ウィンドウおよび変形離散コサイン変換(MDCT)の両方を使用する。USACも、ACELPフレームにおけるような矩形の非重複ウィンドウ、またはTCXフレームおよびアドバンストオーディオコーディング(AAC)フレームにおけるような非矩形の重複ウィンドウのいずれかを使用して、連続するフレームをエンコードすることが可能な、典型的な例である。したがって本開示は、一般性を喪失することなく、提案されたシステムおよび方法の利点を示すためにUSACの特定の例について考察する。

2つの明確なケースについて対処する。第1のケースは、矩形の非重複ウィンドウを使用するフレームから、非矩形の重複ウィンドウを使用するフレームへ移行する場合に生じる。第2のケースは、非矩形の重複ウィンドウを使用するフレームから、矩形の非重複ウィンドウを使用するフレームへ移行する場合に生じる。例示の目的で、また制限を示唆することなく、矩形の非重複ウィンドウを使用するフレームは、ACELPモデルを使用してエンコード可能であり、非矩形の重複ウィンドウを使用するフレームは、TCXモデルを使用してエンコード可能である。さらに、たとえばTCXフレームに対して20ミリ秒、すなわちTCX20というフレームに、特定の持続時間が使用される。しかしながら、これらの特定の例は単なる例示の目的で使用されるものであり、ACELPおよびTCX以外の他のフレーム長さおよびコーディングタイプが企図可能であることにも留意されたい。

次に、矩形の非重複ウィンドウを備えたフレームから、非矩形の重複ウィンドウを備えたフレームへと移行するケースについて、図2に関連した以下の説明に関して対処するが、この図は、非重複矩形ウィンドウを使用するブロックから重複ウィンドウを使用するブロックへの、例示的移行を示す図である。

図2を参照すると、例示的な矩形の非重複ウィンドウはACELPフレーム202を備え、例示的な非矩形の重複ウィンドウ204はTCX20フレーム206を備える。TCX20はUSAC内の短TCXフレームを言い表すものであり、多くの適用例でのACELPフレームと同様に名目上20ミリ秒の持続時間を有する。図2は、各フレームでどちらのサンプルが使用され、それらがコーダでどのようにウィンドウ表示されるかを示す。同じウィンドウ204がデコーダで適用されるため、結果として、デコーダで見られる組み合わされた効果は、図2に示される四角いウィンドウ形状である。もちろん、1回目はコーダ側で2回目はデコーダ側というこの2重ウィンドウ表示は、変換コーディングでは典型的である。ACELPフレーム202のようにウィンドウが示されていない場合、実際には、そのフレームには矩形ウィンドウが使用されることを意味する。図2に示されるTCX20フレーム206用の非矩形ウィンドウ204は、前および次のフレームも重複する非矩形ウィンドウを使用する場合、ウィンドウの重複部分204aおよび204bは、デコーダでの第2のウィンドウ表示の後、相補的であり、ウィンドウの重複領域内で「非ウィンドウ表示」信号を回復することができるように、選択される。

図2のTCX20フレーム206を効率的にエンコードするために、時間領域エイリアシング(TDA)は、通常、そのTCX20フレーム206用のウィンドウ表示サンプルに適用される。具体的には、ウィンドウ204の左部分204aおよび右部分204dは折り畳まれて組み合わされる。図3は、図2の図面に適用される折り畳みおよびTDAを示す図である。図2の説明で導入された非矩形ウィンドウ204は、4つのクォータ(quarter)に示されている。第1および第4のクォータであるウィンドウ204の204aおよび204dは破線で示されており、実線で示された第2および第3のクォータ204b、204cと組み合わされている。
第1および第4のクォータ204a、204dと第2および第3のクォータ204b、204cとの組み合わせが、以下のようにMDCTエンコードで使用されるプロセスと同様のプロセスで、実行される。第1のクォータ204aは時間反転された後、サンプルごとにウィンドウの第2のクォータ204bと位置合わせされ、最後に時間反転およびシフトされた第1のクォータ204eは、ウィンドウの第2のクォータ204bから減算される。同様に、ウィンドウの第4のクォータ204dは時間反転およびシフトされ(204f)、ウィンドウの第3のクォータ204cと位置合わせされ、最後にウィンドウの第3のクォータ204cに追加される。図2に示されたTCX20ウィンドウ204が2N個のサンプルを有する場合、このプロセスが終了すると、図3のTCX20フレーム206の最初から最後まで確実に延在するN個のサンプルが取得される。その後、これらのN個のサンプルが、変換領域内での効率的なエンコードのための、適切な変換の入力を形成する。図3に記載された特定の時間領域エイリアシングを使用すると、MDCTをこの目的に使用される変換とすることができる。

図3に示されたウィンドウの時間反転部分およびシフト部分を組み合わせた後には、TCX20フレーム内のオリジナルの時間領域サンプルは、TCX20フレーム外のサンプルの時間反転バージョンと混合されているため、もはや回復することはできない。すべてのフレームが同じ変換および重複ウィンドウを使用してエンコードされる、MPEG AACなどのMDCTベースのオーディオコーダでは、この時間領域エイリアシングを取り消すことが可能であり、オーディオサンプルは2つの連続する重複フレームを使用して回復可能である。しかしながら、ACELPフレームがTCX20フレームより先行する図2のように、連続するフレームが同じウィンドウ表示および重複プロセスを使用していない場合、非矩形ウィンドウおよび時間領域エイリアシングの効果は、前のACELPフレームおよび次のTCX20フレームからの情報のみを使用して消去することはできない。

このタイプの移行を管理するための技法は、上記で提示した。本開示は、これらの移行を管理するための代替手法を提案する。この手法は、MDCTベースの変換領域コーディングが使用されるフレーム内で、非最適な非対称ウィンドウを使用しない。代わりに、本明細書で導入される方法およびデバイスは、たとえば図3のTCX20フレームなどの、エンコードフレームの中央を中心とする対称ウィンドウを、非矩形ウィンドウも使用するMDCTコード化フレームと50%重複させて、使用することができる。本明細書で導入されたこの方法およびデバイスは、矩形の非重複ウィンドウでコーディングされたフレームから、非矩形の重複ウィンドウでコーディングされたフレームへ、ならびにその逆へ切り替える場合、ウィンドウ表示効果および時間領域エイリアシングを取り消すための訂正を、ビットストリーム内の追加情報として、コーダからデコーダへと送信することを提案する。これらの移行においては、いくつかのケースが可能である。

図2では、ACELPフレーム用に矩形の非重複ウィンドウが示されており、TCX20用に非矩形の重複ウィンドウが示されている。図3で導入されたTDAを使用して、第1にACELPフレームからビットを受信するデコーダは、このACELPフレームをその最終サンプルまで完全にデコードするために十分な情報を有する。しかしその後、TCX20フレームからビットを受信すると、先行するACELPフレームの存在によって生じるエイリアシング効果によって、TCX20フレーム内のすべてのサンプルの適切なデコーディングが損なわれる。次のフレームも重複ウィンドウを使用する場合、コーダで導入された非矩形ウィンドウ表示およびTDAは、示されたTCX20フレームの第2の半分で取り消すことが可能であり、これらのサンプルを適切にデコードすることができる。したがって、図3で時間反転およびシフトされた第1のクォータ204eが204bから減算される、TCX20フレームの第1の半分では、前のACELPフレームが非重複ウィンドウを使用しているため、コーダで導入された非矩形ウィンドウおよびTDAの効果を取り消すことができない。したがって、本明細書で導入された方法およびデバイスは、これらの効果を取り消すために、順方向時間領域エイリアシング取り消し(FAC)の情報を伝送し、TCX20フレームの第1の半分を適切に回復することを提案する。

図4は、図2の図面に適用された順方向エイリアシング訂正(FAC)を示す図である。図4は、たとえばMDCTによって適用されるコサインウィンドウなどのウィンドウ表示が、すでに逆変換後2回目に適用された、デコーダでの状況を示す。TCX20フレームの後続のフレームとは無関係に、ACELPからTCX20への移行のみが考慮される。したがって図4では、FAC訂正が適用されるサンプルは、TCX20フレームの第1の半分に対応する。これがFACエリア402と呼ばれる。この例では、FACによって補償される2つの効果がある。第1の効果は、図4でx_w 404と示されたウィンドウ表示効果である。これは、図3のTCX20フレーム206の第1の半分内のサンプルと、非矩形ウィンドウの第2のクォータ204bとの積に対応する。したがって、FAC訂正の第1の部分は、図4のx_w 406セグメントに関する訂正に対応する、これらのウィンドウ表示サンプルの補数を加算することを含む。たとえば、コーダで所与の入力サンプルx[n]とウィンドウサンプルw[n]とが乗算された場合、このウィンドウ表示サンプルの補数は、単に((1-w[n])×x[n])である。x_w 404およびx_w 406の訂正の合計は、このセグメント内のすべてのサンプルについて1である。FAC訂正の第2の部分は、TCX20フレーム内のコーダで加算された時間領域エイリアシング構成要素に対応する。図4でエイリアシング部分x_a 408と命名された、このエイリアシング構成要素を消去するために、図4のx_a 406の訂正は時間反転され、TCX20フレームの第1の半分と位置合わせされて、x_aエイリアシング部分408として示されたセグメントの第1の半分に加算される。これが減算ではなく加算される理由は、図3において、時間領域エイリアシングにつながる折り畳みの左部分が、この構成要素の減算を含むことから、これを消去するために再度追加されるためである。これら2つの部分、ウィンドウ補償x_w 404およびエイリアシング補償x_a 408の合計が、FACエリア402における完全なFAC訂正を形成する。

FAC訂正のエンコードにはいくつかのオプションがある。図5は、非折り畳みFAC訂正(左)および折り畳みFAC訂正(右)を示す図である。オプションの1つは、図5の左側に示されたように、FACウィンドウ表示信号を直接エンコードすることであってよい。この信号は、図5ではFACウィンドウ502と示され、FACエリアの長さの2倍をカバーする。デコーダでは、デコードされたFACウィンドウ表示信号を、次に折り畳み(左半分を時間反転し、これを右半分に加える)、次に図5の右側に示されるように、この折り畳まれた信号をFACエリア402内で訂正504として加算することができる。この手法では、訂正の長さに比べて2倍の時間領域サンプルがエンコードされる。

図5の左側に示されるFAC訂正信号をエンコードするための他の手法は、この信号のエンコードに先立って、コーダで折り畳みを実行することである。その結果、図5の右側で信号が折り畳まれ、FACウィンドウ表示信号の左半分は時間反転されて、FACウィンドウ表示信号の右半分に加算される。その後、たとえばDCTを使用した変換コーディングを、この折り畳まれた信号に適用することができる。コーダで折り畳みがすでに適用されているため、デコーダでは、デコードされ折り畳まれた信号をFACエリア内で単に加算することができる。この手法により、FACエリアの長さと同じ数または時間領域のサンプルをエンコードし、結果としてクリティカルサンプリングされた変換コーディングが生じることになる。

図5の左側に示されたFAC訂正信号をエンコードするための他の手法は、MDCTの暗黙的折り畳みを使用することである。図6は、MDCTを使用するFAC訂正の方法の第1の適用を示す。左上の四分区間(quadrant)では、わずかに修正されたFACウィンドウ502のコンテンツが示されている。具体的には、FACウィンドウ502aの最終の四分区間がFACウィンドウ502の左側にシフトされ、符号が反転される(502b)。言い換えれば、図5のFACウィンドウが、その全長の1/4だけ右に循環的に回転され、その後、サンプルの第1の1/4の符号が反転される。その後、MDCTがこのウィンドウ表示信号に適用される。MDCTは、その数学的構造によって暗黙的に折り畳み動作を適用し、その結果、図6の右上四分区間に示される折り畳まれた信号602が生じる。このMDCTにおける折り畳みは、左部分502bでは符号反転を適用するが、右部分502cでは適用せず、折り畳まれたセグメントが追加される。結果として生じる折り畳まれた信号602と図5の完全なFAC訂正504とを比較すると、時間反転を除きFAC訂正504と等価であることがわかる。したがって、デコーダでは、反転MDCT (IMDCT)の後、反転FAC訂正信号であるこの信号602は、時間が反転(またはフリップ)され、図6の右下四分区間に示されたFAC訂正信号604となる。前述のように、FAC訂正604は、図4のFACエリア内の信号に追加することができる。

ACELPフレームからTCXフレームへ移行する特定のケースでは、デコーダですでに使用可能な情報を利用することで、さらなる効率が達成できる。図7は、ACELPモードからの情報を使用するFAC訂正の図である。デコーダで、ACELPフレーム202の終わりまでのACELP合成信号702が認識される。さらに、合成フィルタのゼロ入力応答(ZIR) 704は、TCX20フレーム206の始まりの信号と良好に相関する。これは特に、ACELPからTCXフレームへの移行を管理するために、3GPP AMR-WB+標準ですでに使用されている。ここではこの情報が、1)FAC訂正としてエンコードされることになる信号増幅を削減すること、および2)この誤り信号のMDCTコーディングの効率を強化するように誤り信号における連続性を保証すること、という2つの目的で使用される。図7を見ると、FAC訂正を伝送するためにエンコードされることになる訂正信号706が、以下のように計算される。この訂正信号706の第1の半分は、ACELPフレーム202の終わりまでであり、オリジナルの未コード化領域内の重み付けされた信号710と、ACELPフレーム202内の重み付けされた合成信号702との間の、差異708とみなされる。ACELPコーディングモジュールが十分な性能を有するものと考えると、訂正信号706の第1の半分はオリジナル信号に比べてエネルギーおよび振幅が減少している。その後、当該訂正信号706の第2の半分では、TCX20フレーム206の始めのオリジナルの未コード化領域内の重み付けされた信号712と、ACELP重み付けされた合成フィルタのゼロ入力応答704との間の、差異708が取られる。ゼロ入力応答704は、少なくとも特にTCX20フレームの始めのある範囲まで、重み付けされた信号712と相関するため、この差異は、TCX20フレームの始めの重み付けされた信号712に比べて低い振幅およびエネルギーを有する。オリジナル信号のモデル化におけるゼロ入力応答704のこの効率は、典型的には、フレームの始めの方が高い。このFACウィンドウの第2の半分について振幅が減少するFACウィンドウ502の効果を追加することで、図7の訂正信号706の第2の半分の形状は、重み付けされた信号にZIRを適合させる正確さに応じて、FACウィンドウ502の第2の半分の中間に可能なより多くのエネルギーが集中し、最初と最後でゼロに向かう傾向があるものとする。図7に関して説明されたようなこれらのウィンドウ表示および異なる動作を実行した後、結果として生じる訂正信号706は、図5または図6で説明されたように、またはFAC信号をエンコードするための任意の選択された方法によって、エンコードすることができる。デコーダでは、実際のFAC訂正信号は、前述の伝送された訂正信号706を第1にデコードし、その後、FACウィンドウ502の第1の半分でACELP合成信号702を信号706に再度加算し、FACウィンドウ502の第2の半分でZIR 704を同じ信号706に加算することによって、再計算される。

ここまで本開示は、矩形の非重複ウィンドウを使用するフレームから、非矩形の重複ウィンドウを使用するフレームへの移行について、ACELPフレームからTCXフレームへの移行のケースを例として使用し、説明してきた。この反対の状況、すなわちTCXフレームからACELPフレームへの移行が発生可能であることが理解されよう。図8は、重複する非矩形ウィンドウを使用するフレームから、非重複の矩形ウィンドウを使用するフレームへの移行時に適用される、FAC訂正を示す図である。図8は、デコーダで見られるように、TCXフレーム内に折り畳まれたTCX20ウィンドウ806を備えた、ACELPフレーム804が後に続くTCX20フレーム802を示す。図8は、TCX20フレーム802の終わりにウィンドウ表示効果および時間領域エイリアシングを取り消すためにFAC訂正が適用される、FACエリア810も示す。ACELPフレーム804は、これらの効果を取り消すための情報を担持しないことに留意されたい。FACウィンドウ812は、図5のFACウィンドウ502の対称である。

FACウィンドウ812の2つの部分、812左および812右の折り畳みは、TCXフレームからACELPフレームへの移行の場合に示される。図5と比べた相違点は、ここではFACウィンドウ812は時間反転されており、エイリアシング部分の折り畳みは、ウィンドウのその部分でMDCTの折り畳み符号と整合させるために、図5に示された加算の代わりに減算演算を適用することである。

図9は、折り畳まれていないFAC訂正(左)および折り畳まれたFAC訂正(右)を示す図である。FACウィンドウ812は、図9の左側に再生成される。折り畳まれたFAC訂正信号902は、DCTまたは何らかの他の適用可能な方法を使用してエンコード可能である。たとえばMDCTで使用されるような変換におけるハニング(Hanning)ウィンドウを想定すると、図9の数式904および906は、図9の場合のFACウィンドウ812を記述する。もちろん、他のウィンドウ形状が使用される場合、FACウィンドウを記述するために、ウィンドウ形状に整合する他の数式が使用される。また、MDCTでハニングタイプのウィンドウを使用することは、MDCTに先立って、コーダでコサインウィンドウが使用され、コサインウィンドウは、IMDCTの後、デコーダで再度使用されることを意味する。これら2つのコサインウィンドウのサンプルごとの組み合わせは、結果として、ウィンドウの50%重複部分での重複および加算に適切な相補的形状を有する所望のハニングウィンドウ形状を生じることになる。

再度、MDCT手法を使用して、図6で説明したようにFACウィンドウをエンコードすることもできる。図10は、MDCTを使用するFAC訂正の方法の第2の適用を示す図である。図10の左上四分区間に、図8のFACウィンドウ812が示される。FACウィンドウ812の第1のクォータ812aは、FACウィンドウの右にシフトされ、符号が反転される(812b)。言い換えれば、FACウィンドウ812はその全長の1/4だけ左に循環的に回転され、その後、サンプルの最後の1/4の符号が反転される。その後、図10の右上四分区間で、MDCTがこのウィンドウ表示信号に適用される。MDCTは内部で折り畳み動作を適用し、結果として、図10の右上四分区間に表示される折り畳まれた信号1002が生じる。このMDCTでの折り畳みは、左部分812cで符号反転を適用するが、右部分812bでは適用せず、折り畳まれたセグメントが追加される。結果として生じる折り畳まれた信号1002と、図9の右側のFAC訂正信号902とを比較すると、これは時間反転(フリップ)および符号反転を除き、等価であることがわかる。したがってデコーダでは、IMDCTの後、反転FAC訂正であるこの信号1002は時間反転(またはフリップ)および符号反転され、図10の右下四分区間に示されるようにFAC訂正1004となる。前述のように、このFAC訂正1004は図8のFACエリア内で信号に追加することができる。

FAC訂正に対応する信号の量子化には適切な注意が含まれる。実際、FAC訂正は、ウィンドウ表示およびエイリアシング効果を補償するためにフレームに追加されるため、たとえば図2から10の例で使用されるTCX20フレームを含む、変換領域コード化信号の一部である。このFAC訂正の量子化によって歪みがもたらされるため、この歪みは、変換領域エンコードフレーム内で適切に混合するか、または変換領域エンコードフレームの歪みと一致するように制御され、FACエリアに対応するこの移行において可聴アーチファクトをもたらすことはない。量子化による雑音レベル、ならびに時間および周波数領域内での量子化雑音形状が、FAC訂正が適用される変換ベースのエンコードフレーム内とほぼ同じようにFAC訂正信号内で維持される場合、FAC訂正が追加の歪みをもたらすことはない。

スカラ量子化、ベクトル量子化、確率的コードブック、代数的コードブックなどを含むがこれらに限定されない、FAC訂正信号を量子化することが可能ないくつかの手法がある。あらゆるケースで、例示的TCX20フレームのように、FAC訂正の係数および対応する変換領域コード化フレームの係数の属性において強力な相関が存在することが理解されよう。実際、FACエリアで使用される時間領域サンプルは、変換領域コード化フレームの始めと同じ時間領域サンプルでなければならない。したがって、変換領域コード化フレームに適用される量子化デバイスで使用されるスケール因子は、FAC訂正に適用される量子化デバイスで使用されるスケール因子とほぼ同じである。もちろん、FAC訂正内のサンプルの数または周波数領域係数は、変換領域コード化フレーム内と同じではなく、変換領域コード化フレームは、変換領域コード化フレームの一部のみをカバーするFAC訂正よりも多くのサンプルを有する。重要なことは、FAC訂正信号内の周波数領域係数当たりの量子化雑音レベルを、対応する変換領域コード化フレーム(たとえばTCX20フレーム)内と同じに維持することである。

スペクトル係数を量子化するために3GPP AMR-WB+オーディオコーディング標準で使用される、代数的ベクトル量子化(AVG)手法の特定の例を取り、これをFAC訂正の量子化に適用することで、以下の観察が引き出される。変換領域コード化フレーム、たとえばTCX20フレームの量子化で計算されたAVQの全体的利得は、FACフレームの量子化で使用される1つに対する基準利得とすることが可能であり、この全体的利得は、ビット消費を特定のビット量(bit budget)より下で維持するように周波数領域係数の振幅をスケーリングするために使用される。これは、任意の他のスケール因子、たとえば、AMR-WB+標準で使用されるものなどの、適応低周波数エンハンサ(Enhancer)(ALFE)で使用されるスケール因子にも適用される。さらに他の例には、AACエンコーディングにおけるスケール因子が含まれる。スペクトル内の雑音レベルおよび形状を制御する任意の他のスケール因子も、このカテゴリに入るものとみなされる。

変換領域コード化フレームの長さに応じて、変換領域コード化フレームとFAC訂正との間で、これらのスケール因子パラメータのm対1マッピングが適用される。たとえば、MPEG USACオーディオコーデックの場合など、3つのTCXフレーム長さ、20ミリ秒、40ミリ秒、または80ミリ秒が使用される場合、たとえば、変換領域コード化フレーム内のm個の連続するスペクトル領域係数に使用される、ALFEで使用されるスケール因子などのスケール因子は、FAC訂正における1スペクトル領域係数に使用することができる。

FAC訂正の量子化誤りレベルを、変換ベースのエンコードフレームの量子化誤りレベルと一致させるために、コーダで、ウィンドウ表示変換ベースエンコードフレームのコーディング誤りを考慮に入れることが適切である。図11は、TCX誤り訂正を含むFAC量子化を示すブロック図である。第1に、TCXフレーム内のウィンドウ表示および折り畳まれた信号1104と、そのフレームのウィンドウ表示および折り畳まれたTCX合成1106との間で、差異1102が計算される。このコンテキストでは、TCX合成1106は、デコーダで適用されるウィンドウ表示を含む、そのTCXフレームの量子化された変換領域係数の単なる逆変換である。次に、この差異信号1108すなわちTCXコーディング誤りが、1110でFAC訂正信号1112に加算され、FACエリアと同期される。これが、デコーダに伝送するために量子化器1116によって量子化される、FAC訂正1112信号およびTCXフレームのコーディング誤り1108を含む、複合信号1114である。したがって図11のように、この量子化されたFAC訂正信号1118は、デコーダで、ウィンドウ表示効果およびエイリアシング効果、ならびにFACエリアにおけるTCXコーディング誤りを訂正する。図11に示されるように、TCXスケール因子1120を使用すると、FAC訂正の歪みをTCXフレームにおける歪みと一致させることができる。

図12は、多重モードコーディングシステムにおけるFAC訂正の使用ケースを示す図である。50%またはそれ以上の重複を伴う正規形状ウィンドウと、FACウィンドウを含む可変形状ウィンドウとの間での切り替えを示す例が提示されている。図12では、時間軸上での上の部分の延長として、下の部分をみなすことができる。図12では、たとえば、入力信号でのLPC分析から導出された重み付けフィルタ、または入力信号の重み付けを目的とする何らかの他の処理とすることが可能な、時変フィルタリングプロセスを介して、入力オーディオ信号を事前に処理した後に、すべてのフレームがエンコードされるものと仮定する。この例では、入力信号は、分析ウィンドウが周波数領域コーディング用に最適化された、AACなどの最先端のオーディオコーディング族における手法を使用して、「切り替えポイントA」までエンコードされる。典型的には、これは、たとえ他のウィンドウ形状がこの目的に使用可能であっても、MDCTコーディングで使用されるコサインウィンドウにおけるような50%の重複および正規形状を伴うウィンドウを使用することを意味する。次に、「切り替えポイントA」と「切り替えポイントB」との間で、必ずしも変換領域コーディング用に最適化されておらず、むしろ、このセグメントで使用されるコーディングモードに関する時間および周波数分解能間で何らかの妥協を達成するように設計された、様々な長さおよび形状のウィンドウを使用して、入力信号がエンコードされる。図12は、このセグメントで使用されるACELPおよびTCXのコーディングモードの特定の例を示す。これらのコーディングモードについて、ウィンドウ形状はかなり不均一であり、形状および長さは変化することがわかる。ACELPウィンドウは矩形および非重複であるが、TCX用のウィンドウは非矩形および重複である。ここでは、FACウィンドウが、上記で説明されたように時間領域エイリアシングの取り消しに使用される。図12において特定の形状および長さを伴い、太字で示されたFACウィンドウ自体は、「切り替えポイントA」と「切り替えポイントB」との間のセグメントに包含される可変形状ウィンドウのうちの1つである。

図13は、多重モードコーディングシステムにおけるFAC訂正の他の使用ケースを示す図である。図13は、過渡信号をエンコードするために、コーダが正規形状ウィンドウから可変形状ウィンドウへローカルに切り替えるコンテキストで、FACウィンドウがどのように使用できるかを示す。これは、過渡のエンコードに関する短時間サポートを伴うウィンドウをローカルに使用するために、開始ウィンドウおよび終了ウィンドウが使用される、AACコーディングのコンテキストと同様である。代わりに、図13では、過渡であると想定される「切り替えポイントA」と「切り替えポイントB」との間信号は、ACELPコーディングモードで移行を適切に管理するためにFACウィンドウの使用を必要とする、提示された例におけるACELPおよびTCXを含む、多重モードコーディングを使用してエンコードされる。

図14および15は、短変換ベースフレームとACELPフレームとの間の切り替え時のFAC訂正の第1および第2の使用ケースを示す図である。これらは、LPC領域内の短変換ベースフレーム、たとえば短TCXフレーム、およびACELPフレームの間で切り替えが実行されるケースである。図14および図15の例は、他のフレーム(図示せず)で他のコーディングモードを使用することも可能な、より長い信号におけるローカル状況とみなすことができる。図14および図15における短TCXフレームのためのウィンドウは、50%より多くの重複を有することが可能なことに留意されたい。たとえばこれは、長非対称ウィンドウを使用する、低遅延AACコーデックの場合とすることができる。この場合、図14および図15のこれらの長非対称ウィンドウと短TCXウィンドウとの間で適切な切り替えを可能にするために、いくつかの特定の開始ウィンドウおよび終了ウィンドウが設計される。

図16は、ビットストリーム1601で受信されるコード化信号における時間領域エイリアシングの順方向取り消しのためのデバイス1600の非限定的な例を示すブロック図である。デバイス1600は、ACELPモードからの情報を使用する図7のFAC訂正を参照しながら、例示の目的で与えられる。当業者であれば、対応するデバイス1600が、本開示で与えられたFAC訂正のあらゆる他の例に関して実装可能であることを理解されよう。

デバイス1600は、FAC訂正を含むコード化オーディオ信号を表すビットストリーム1601を受信するための受信機1610を備える。

ビットストリーム1601からのACELPフレームは、ACELP合成フィルタを含むACELPデコーダ1611に供給される。ACELPデコーダ1611は、ACELP合成フィルタのゼロ入力応答(ZIR)704を生成する。さらにACELP合成デコーダ1611は、ACELP合成信号702を生成する。ACELP合成信号702およびZIR 704は、ZIRが後に続くACELP合成信号を形成するように連結される。次に、折り畳まれていないFACウィンドウ502は、連結された信号702および704に適用され、プロセッサ1605内で折り畳みおよび加算されて、TCXフレーム内にオーディオ信号の第1の(オプションの)部分を提供するために加算機1620の正の入力へと適用される。

ビットストリーム1601からのTCX20フレームに関するパラメータ(prm)は、TCXデコーダ1606に供給され、その後IMDCT変換、IMDCT用のウィンドウ1613と続き、加算機1616の正の入力に適用されるTCX20合成信号1602を生成し、TCX20フレーム内のオーディオ信号の第2の部分を提供する。

しかしながら、コーディングモード間の(たとえばACELPフレームからTCX20フレームへの)移行時に、FACキャンセラ1615を使用しない場合、オーディオ信号の一部は適切にデコードされないことになる。図16の例では、FACキャンセラ1615は、受信したビットストリーム1601から、図5のように折り畳んだ後、訂正信号706(図7)に対応する訂正信号504(図5)をデコードするための、FACデコーダ1617と、反転DCT(IDCT)とを備える。IDCT 1618の出力は、加算機1620の正の入力に供給される。加算機1620の出力は、加算機1616の正の入力に供給される。

加算機1616の全体的出力は、ACELPフレームに続くTCXフレームのためのFAC取り消し合成信号を表す。

図17は、デコーダへ送信するためのコード化信号における順方向時間領域エイリアシングの取り消しのためのデバイス1700の非限定的な例を示すブロック図である。デバイス1700は、ACELPモードからの情報を使用する図7のFAC訂正を参照しながら、例示の目的で与えられる。当業者であれば、対応するデバイス1700が、本開示で与えられたFAC訂正のあらゆる他の例に関して実装可能であることを理解されよう。

エンコードされることになるオーディオ信号1701が、デバイス1700に適用される。論理(図示せず)は、オーディオ信号1701のACELPフレームをACELPコーダ1710に適用する。ACELPコーダ1710の出力であるACELPコード化パラメータ1702は、マルチプレクサ(MUX) 1711の第1の入力に適用される。ACELPコーダの他の出力は、ACELP合成信号1760であり、コーダ17170のACELP合成フィルタのゼロ入力応答(ZIR) 1761が後に続く。FACウィンドウ502が信号1760および1761の連結に適用される。FACウィンドウプロセッサ502の出力は、加算機1751の負の入力に適用される。

論理(図示せず)は、マルチプレクサ1711の第2の入力に適用されるTCX20エンコードパラメータ1703を生成するために、オーディオ信号1701のTCX20フレームをMDCTエンコードモジュール1712にも適用する。MDCTエンコードモジュール1712は、MDCTウィンドウ1731、MDCT変換1732、および量子化器1733を備える。MDCTモジュール1732へのウィンドウ表示入力は、加算機1750の正の入力に供給される。量子化されたMDCT係数1704は逆MDCT(IMDCT) 1733に適用され、IMDCT 1733の出力は加算機1750の負の入力に供給される。加算機1750の出力は、プロセッサ1736内にウィンドウ表示されるTCX量子化誤りを形成する。プロセッサ1736の出力は、加算機1751の正の入力に供給される。図17に示されるように、プロセッサ1736の出力はオプションで、デバイス内で使用することができる。

コーディングモード間の(たとえばACELPフレームからTCX20フレームへの)移行時に、MDCTモジュール1712によってコード化されるいくつかのオーディオフレームは、追加情報なしでは適切にデコードされない可能性がある。計算機1713は、この追加情報を、具体的には訂正信号706 (図7)を提供する。計算機1713のすべての構成要素は、FAC訂正信号の生成器とみなすことができる。FAC訂正信号の生成器は、FACウィンドウ502をオーディオ信号1701に適用すること、FACウィンドウ502の出力を加算機1751の正の入力に提供すること、加算機1751の出力をMDCT 1734に提供すること、および、マルチプレクサ1711の入力に適用されるFACパラメータ706を生成するために量子化器1737内のMDCT 1734の出力を量子化することを含む。

マルチプレクサ1711の出力での信号は、コード化ビットストリーム1757内で送信機1756を介してデコーダ(図示せず)へ送信されることになる、エンコードオーディオ信号1755を表す。

当業者であれば、コード化信号における時間領域エイリアシングの順方向取り消しのためのデバイスおよび方法についての説明が単なる例示的なものであり、いかなる方法でも制限的なものでないことを理解されよう。他の諸実施形態は、本開示の恩恵を有する当業者に対してそれ自体を容易に示唆することになろう。さらに、開示されたシステムは、コード化信号における時間領域エイリアシングの取り消しの既存の必要性および問題に対して、有益な解決策を提供するようにカスタマイズすることができる。

当業者であれば、多数のタイプの端末または他の装置が、同じデバイス内の、コード化オーディオを伝送するためのコーディングの諸態様、および、その後コード化オーディオを受信するためのデコーディングの諸態様の、両方を具体化できることも理解されよう。

明瞭にするために、コード化信号内の時間領域エイリアシングの順方向取り消しの実装のすべてのルーチン機能については図示および説明していない。もちろん、オーディオコーディングの任意のこうした実際の実装の開発において、アプリケーション関係、システム関係、ネットワーク関係、およびビジネス関係の制約を順守するなど、開発者の特定の目標を達成するために、多数の実装特有の決定を実行しなければならないこと、ならびに、これらの特定の目標が、実装によって、および開発者によって変化することを理解されよう。さらに、開発作業は複雑かつ時間のかかるものである可能性があるが、それにもかかわらず、本開示の恩恵を有するオーディオコーディングシステムの当業者にとっては日常的なエンジニアリング業務であることを理解されよう。

本開示によれば、本明細書で説明された構成要素、プロセスステップ、および/またはデータ構造は、様々なタイプのオペレーティングシステム、コンピューティングプラットフォーム、ネットワークデバイス、コンピュータプログラム、および/または汎用マシンを使用して実装可能である。加えて、当業者であれば、ハードワイヤードデバイス、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)などの、汎用性の少ないデバイスも使用可能であることを理解されよう。一連のプロセスステップを含む方法がコンピュータまたはマシンによって実装され、それらのプロセスステップがマシンによる読み取り可能な一連の命令として格納可能である場合、それらは有形媒体上に格納することができる。

本明細書で説明されたシステムおよびモジュールは、ソフトウェア、ファームウェア、ハードウェア、あるいは、本明細書で説明された目的に好適なソフトウェア、ファームウェア、またはハードウェアの任意の組み合わせを備えることができる。ソフトウェアおよび他のモジュールは、サーバ、ワークステーション、パーソナルコンピュータ、コンピュータ化されたタブレット、PDA、および、本明細書で説明された目的に好適な他のデバイス上に常駐可能である。ソフトウェアおよび他のモジュールは、ローカルメモリを介して、ネットワークを介して、ASPコンテキスト内のブラウザまたは他のアプリケーションを介して、あるいは、本明細書で説明された目的に好適な他の手段を介して、アクセス可能である。本明細書で説明されたデータ構造は、コンピュータファイル、変数、プログラミングアレイ、プログラミング構造、あるいは、任意の電子情報格納機構または方法、あるいは、本明細書で説明された目的に好適な、それらの任意の組み合わせを含むことができる。

以上、本発明について、その非限定的な例示的諸実施形態を用いて説明してきたが、これらの諸実施形態は、本発明の趣旨および性質を逸脱することなく、添付の特許請求の範囲内で修正することができる。

100 ウィンドウ
110 TDA
120 ゼロ値のサンプル
130 平坦領域
140 テーパー形領域
202 ACELPフレーム
204 TCX20フレーム用ウィンドウ
204a 第1のクォータ
204b 第2のクォータ
204c 第3のクォータ
204d 第4のクォータ
204e 時間反転およびシフトされた第1のクォータ
206 TCX20フレーム
402 FACエリア
404 x_w
406 x_aの訂正
406 x_wの訂正
408 エイリアシング部分x_a
502 FACウィンドウ
504 FAC訂正
602 折り畳まれた信号
604 FAC訂正
702 ACELP合成信号
704 ゼロ入力応答
706 訂正信号
708 差異
710 重み付けされた信号
712 重み付けされた信号
802 TCX20フレーム
804 ACELPフレーム
806 TCX20ウィンドウ
810 FACエリア
812 FACウィンドウ
812a 第1のクォータ
812b 右部分
812c 左部分
902 FAC訂正信号
904 数式
906 数式
1002 折り畳まれた信号
1004 FAC訂正
1102 差異
1104 折り畳まれた信号
1106 TCX合成
1108 コーディング誤り
1112 FAC訂正信号
1114 複合信号
1116 量子化器
1118 FAC訂正信号
1120 TCXスケール因子
1600 デバイス
1601 ビットストリーム
1602 TCX20合成信号
1605 折り畳みおよび加算
1606 TCXデコーダ
1610 受信機
1611 ACELPデコーダ
1613 IMDCT
1614 ウィンドウ
1615 FACキャンセラ
1616 加算機
1617 FACデコーダ
1618 IDCT
1620 加算機
1700 デバイス
1701 オーディオ信号
1702 ACELPコード化パラメータ
1703 TCX20エンコードパラメータ
1704 MDCT係数
1710 ACELPコーダ
1711 マルチプレクサ
1712 MDCTエンコードモジュール
1713 計算機
1731 MDCTウィンドウ
1732 MDCT変換
1733 量子化器
1734 MDCT
1736 プロセッサ
1737 量子化器
1750 加算機
1751 加算機
1755 エンコードオーディオ信号
1756 送信機
1757 ビットストリーム
1760 ACELP合成信号
1761 ゼロ入力応答

Claims

デコーダにおいてビットストリームで受信されたコード化信号における、時間領域エイリアシングの順方向取り消しのための方法であって、
前記デコーダにおいて前記ビットストリームで、コーダから、前記コード化信号における前記時間領域エイリアシングの訂正に関する追加情報を受信するステップと、
前記デコーダ内で、前記追加情報に応答して前記コード化信号内の前記時間領域エイリアシングを取り消すステップと、
を含む、方法。
矩形の非重複ウィンドウを使用するフレームと、非矩形の重複ウィンドウを使用するフレームとの間での移行に使用される、請求項1に記載の方法。
前記追加情報は順方向エイリアシング取り消し(FAC)訂正信号を表す、請求項1に記載の方法。
前記FAC訂正信号は、ウィンドウ表示された、またはウィンドウ表示および折り畳まれた、FAC訂正信号である、請求項3に記載の方法。
前記FAC訂正信号は、非矩形の重複ウィンドウを使用するフレームをコード化するための変換を使用して変換コード化される、請求項3に記載の方法。
前記FAC訂正信号がコード励起線形予測(CELP)フレームから変換コード化フレームへの移行のためである場合、前記FAC訂正信号は、CELPフレームからの合成信号に関する、請求項3に記載の方法。
前記FAC訂正信号は、コード化される信号と合成フィルタのゼロ入力応答に連結された合成信号との間の差異に基づく差異信号に関する、請求項6に記載の方法。
前記デコーダで、前記時間領域エイリアシングを取り消すステップが、
前記差異信号をデコードするステップと、
前記合成フィルタの前記ゼロ入力応答に連結された前記合成信号、および前記デコードされた差異信号を使用して、前記FAC訂正信号を再計算するステップと、
を含む、請求項7に記載の方法。
前記デコーダで、前記時間領域エイリアシングを取り消すステップが、
前記FAC訂正信号をデコードするステップと、
前記デコードされたFAC訂正信号を前記コード化信号に加算するステップと、
を含む、請求項3に記載の方法。
前記FAC訂正信号が、非矩形の重複ウィンドウで使用されるスケール因子を使用して量子化される、請求項3に記載の方法。
コーダからデコーダに伝送するためのコード化信号における、時間領域エイリアシングの順方向取り消しのための方法であって、
前記コーダ内で、前記コード化信号における前記時間領域エイリアシングの訂正に関する追加情報を計算するステップと、
前記コード化信号における前記時間領域エイリアシングの前記訂正に関する前記追加情報を、ビットストリーム内で前記コーダから前記デコーダへと送信するステップと、
を含む、方法。
矩形の非重複ウィンドウを使用するフレームと、非矩形の重複ウィンドウを使用するフレームとの間での移行に使用される、請求項11に記載の方法。
前記追加情報を計算するステップは、順方向エイリアシング取り消し(FAC)訂正信号を生成するステップを含む、請求項11に記載の方法。
前記追加情報を計算するステップは、前記FAC訂正信号をウィンドウ表示するステップ、またはウィンドウ表示および折り畳むステップを含む、請求項13に記載の方法。
前記追加情報を計算するステップは、非矩形の重複ウィンドウを使用するフレームをコード化するための変換を使用して、前記FAC訂正信号を変換コード化するステップを含む、請求項13に記載の方法。
前記追加情報を計算するステップは、前記FAC訂正信号がコード励起線形予測(CELP)フレームから変換コード化フレームへの移行のためである場合、前記FAC訂正信号を生成するために、CELPフレームからの合成信号を使用するステップを含む、請求項13に記載の方法。
前記追加情報を計算するステップは、コード化される信号と合成フィルタのゼロ入力応答に連結された合成信号との間の差異に基づく差異信号を計算するステップを含む、請求項16に記載の方法。
非矩形の重複ウィンドウで使用されるスケール因子を使用して前記FAC訂正信号を量子化するステップを含む、請求項13に記載の方法。
前記FAC訂正信号の量子化に先立って、前記FAC訂正信号から変換コード化フレームの量子化誤りを減算するステップを含む、請求項18に記載の方法。
ビットストリームで受信されたコード化信号における、時間領域エイリアシングの順方向取り消しのためのデバイスであって、
コーダからのビットストリームからの、前記コード化信号における前記時間領域エイリアシングの訂正に関する追加情報の受信機と、
前記追加情報に応答した前記コード化信号内の前記時間領域エイリアシングのキャンセラと、
を備える、デバイス。
矩形の非重複ウィンドウを使用するフレームと、非矩形の重複ウィンドウを使用するフレームとの間での移行に使用される、請求項20に記載のデバイス。
前記追加情報は順方向エイリアシング取り消し(FAC)訂正信号を含む、請求項20に記載のデバイス。
前記FAC訂正信号は、ウィンドウ表示された、またはウィンドウ表示および折り畳まれた、FAC訂正信号である、請求項22に記載のデバイス。
前記FAC訂正信号は、非矩形の重複ウィンドウを使用するフレームをコード化するための変換を使用して変換コード化される、請求項22に記載のデバイス。
前記FAC訂正信号がコード励起線形予測(CELP)フレームから変換コード化フレームへの移行のためである場合、前記FAC訂正信号は、CELPフレームからの合成信号に関する、請求項22に記載のデバイス。
前記FAC訂正信号は、コード化される信号と合成フィルタのゼロ入力応答に連結された合成信号との間の差異に基づく差異信号に関する、請求項25に記載のデバイス。
前記キャンセラは、前記デコーダで、
前記差異信号をデコードし、
前記合成フィルタの前記ゼロ入力応答に連結された前記合成信号、および前記デコードされた差異信号を使用して、前記FAC訂正信号を再計算する、
請求項26に記載のデバイス。
前記キャンセラは、前記デコーダで、
前記FAC訂正信号をデコードし、
前記デコードされたFAC訂正信号を前記コード化信号に加算する、
請求項22に記載のデバイス。
前記FAC訂正信号が、非矩形の重複ウィンドウで使用されるスケール因子を使用して量子化される、請求項22に記載のデバイス。
デコーダに伝送するためのコード化信号における、時間領域エイリアシングの順方向取り消しのためのデバイスであって、
前記コード化信号における前記時間領域エイリアシングの訂正に関する追加情報の計算機と、
前記コード化信号における前記時間領域エイリアシングの前記訂正に関する前記追加情報を、前記ビットストリーム内でデコーダへと送信するための送信機と、
を備える、デバイス。
矩形の非重複ウィンドウを使用するフレームと、非矩形の重複ウィンドウを使用するフレームとの間での移行に使用される、請求項30に記載のデバイス。
前記追加情報の計算機は、順方向エイリアシング取り消し(FAC)訂正信号の生成器を備える、請求項30に記載のデバイス。
前記FAC訂正信号の生成器は、前記FAC訂正信号をウィンドウ表示するか、またはウィンドウ表示および折り畳む、請求項32に記載のデバイス。
前記FAC訂正信号の生成器は、非矩形の重複ウィンドウを使用するフレームをコード化するための変換を使用して、前記FAC訂正信号を変換コード化する、請求項32に記載のデバイス。
前記FAC訂正信号の生成器は、前記FAC訂正信号がコード励起線形予測(CELP)フレームから変換コード化フレームへの移行のためである場合、前記FAC訂正信号を生成するために、CELPフレームからの合成信号を使用する、請求項32に記載のデバイス。
前記FAC訂正信号の生成器は、コード化される信号と合成フィルタのゼロ入力応答に連結された合成信号との間の差異に基づく差異信号を計算する、請求項35に記載のデバイス。
非矩形の重複ウィンドウで使用されるスケール因子を使用する前記FAC訂正信号の量子化器を備える、請求項32に記載のデバイス。
前記FAC訂正信号の量子化に先立った、前記FAC訂正信号からの合成されたTCXフレームの誤りの減算機を備える、請求項37に記載のデバイス。