JP2010517083A

JP2010517083A - 符号化及び復号化の方法及び装置

Info

Publication number: JP2010517083A
Application number: JP2009546636A
Authority: JP
Inventors: グオ、ウェイ; リウ、ペイリン; リ、ウェイ; シュー、リジン; チャン、チン; シュー、ジァンフェン; サン、シェンフー; ドゥ、チェンチョン; フー、チェン
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2007-01-23
Filing date: 2008-01-23
Publication date: 2010-05-20
Also published as: WO2008089705A1; US20090299757A1; CN101231850B; EP2120233A1; EP2120233A4; CN101231850A

Abstract

符号化方法は、先のフレームが第１の符号化モードを使用して符号化され、現在のフレームが第２の符号化モードを使用して符号化された後で、現在のフレームと対応する先のフレームとに関連する符号化データの重複部分の決定されたデータ長に基づいて、対応する先のフレームの重複部分についてのデータ長の符号化データを取得することを含み、先のフレームから取得された符号化データと、現在のフレームの符号化データとが第２の符号化モードを使用して符号化して、符号化結果を取得する。対応する復号化方法、および符号化装置、復号化装置も提供される。

Description

本発明は、符号化および復号化技術に関し、特に、符号化および復号化の方法と、装置とに関する。

マルチメディアサービスのますます広範な展開に伴って、マルチメディアサービスのための符号化におけるより高い符号化効率とリアルタイム特性とが、マルチメディアサービスの自己特性により必要とされている。同時に、可聴音（オーディオ、音声）に対応する符号化帯域幅は、さらに拡張される必要がある。

現在、この業界で使用されている低ビットレートと高品質とを有する可聴音符号化技術としては、適応型マルチレート広帯域コーデック（ＡＭＲ−ＷＢ＋）技術が挙げられる。基礎となるＡＭＲ−ＷＢ＋符号化器は、以下の２つの符号化モードを主として含む。
（１）音声を符号化するための、代数符号励振線形予測（ＡＣＥＬＰ）モード
（２）楽音を符号化するための、変換符号化励起（ＴＣＸ）モード

ＡＭＲ−ＷＢ＋技術は、低ビットレートの音声符号化を拡張することからなり、特に、音声のためのＡＣＥＬＰ符号化と楽音のためのＴＣＸ符号化とを組み合わせることによって形成されたハイブリッド符号化手法である。各フレームの符号化の間、２つのモードのセグメント信号対雑音比（ＳＥＧＳＮＲ）を比較することによって、現在選択されるべき符号化モードが決定される。モード切り換え状況は、先のフレームにＡＣＥＬＰ符号化モードが使用されており、一方、現在のフレームにはＴＣＸ符号化モードが要求される、という場合である。この場合、フレーム間の不連続性をなくすために、符号化の間に、対応する方策が使用されてもよい。先のフレームの状態から取得されたゼロ入力応答は、現在のフレームの最初の部分における信号に非常に類似しているため、ＡＭＲ−ＷＢ＋ではモードの移行においてスムーズさを良好に維持するために、ＡＣＥＬＰ符号化フレームからＴＣＸ符号化フレームへの移行の間にゼロ入力応答を除去する実装方式を利用する。

先のフレームにＡＣＥＬＰ符号化モードが使用されており、かつ、現在のフレームにＴＣＸ符号化モードが使用されるというモード切り換え状況の場合、ＴＣＸ符号化の対応する実装プロセスは、図１に示すとおりである。符号化の間、入力音声（オーディオ）信号は最初に知覚重み付けフィルタを通過し、次に、判定される。次に、知覚重み付けされた信号からウィンドウ処理された（ｗｉｎｄｏｗｅｄ）ゼロ入力応答（ＺＩＲ）が減算され、結果として得られた信号は、さらに、適応するようウィンドウ処理され、変換領域符号化によって符号化されて、ＴＣＸモードで符号化された対応する符号ストリームが取得される。

図１に対応して、同じモード切り換え状況における、ＴＣＸ復号化の対応する実装プロセスは、図２に示すとおりである。ＴＣＸモードで符号化された入力符号ストリームが変換領域復号化によって復号化され、ウィンドウ処理され、およびオーバーラッピングされた後は、ＡＣＥＬＰ符号化モードが先のフレームに使用されているため、変換領域復号化されたデータは、ウィンドウ処理されたＺＩＲと加算され、逆知覚重み付けによって音声信号が再生され、それにより、対応するＴＣＸ復号化が達成される。

本発明を実現する間に、ＡＭＲ−ＷＢ＋に含まれるＴＣＸ符号化および復号化プロセスにおいて、フレーム間の不連続性をなくすために使用される符号化および復号化方式の理論的基礎は、ゼロ入力応答と現在のフレームの最初の部分における信号との間の類似性であるということを、発明者らは見出した。しかし、ゼロ入力応答が現在のフレームの最初の部分における信号に類似していない場合、フレーム間の不連続性をなくすという効果は保証されることができない。さらに、フレーム間の不連続性をなくすプロセスの間、合成重み付けフィルタのゼロ入力応答を計算することが要求されるため、そのアルゴリズムは比較的複雑であり、そのため、符号化および復号化の実装はより複雑になる。

本発明の実施形態は、符号化および復号化において、フレーム間の不連続性をなくすためのプロセスをより単純にし、それにより、符号化および復号化の実装をより単純にできるようにするための、符号化および復号化方法と装置とを提供する。

本発明の一実施形態では、符号化方法が提供され、この方法は、
先のフレームが第１の符号化モードで符号化されており、現在のフレームが第２の符号化モードで符号化される場合、現在のフレームの符号化データと先のフレームの符号化データとの間の重複（オーバーラップ）部分のデータ長に従って、先のフレームから重複部分のデータ長に対応する符号化データを取得し、
符号化結果を取得するために、取得した先のフレームからの重複部分のデータ長の符号化データと、現在のフレームの符号化データとを、第２の符号化モードで符号化することを含む。

本発明の一実施形態では、符号化装置が提供され、この装置は、符号化モード切り換え認識ユニットと、先の符号化フレーム重複データ取得ユニットと、第２の符号化ユニットとを具備し、
符号化モード切り換え認識ユニットは、先の符号化フレーム重複データ取得ユニットの動作をトリガするために、先のフレームが第１の符号化モードで符号化されており、現在のフレームが第２の符号化モードで符号化されるということを判定するように構成され、
先の符号化フレーム重複データ取得ユニットは、現在のフレームの符号化データと先のフレームの符号化データとの間の重複部分のデータ長に従って、先のフレームから重複部分のデータ長に対応する符号化データを取得するように構成され、
第２の符号化ユニットは、符号化結果を取得するために、先の符号化フレーム重複データ取得ユニットによって取得された符号化データと、現在のフレームの符号化データとを、第２の符号化モードで符号化するように構成される。

本発明の一実施形態では、復号化方法が提供され、この方法は、
受信した符号ストリームを復号化し、先のフレームが第１の復号化モードで復号化されており、現在のフレームが第２の復号化モードで復号化されていることを判定し、
現在のフレームの復号化データと先のフレームの復号化データとの間の重複部分の、定められたデータ長に従って、先のフレームから重複部分のデータ長に対応する復号化データを取得し、
復号化結果を取得するために、先のフレームから取得した復号化データと、現在のフレームの復号化データとを重畳（オーバーラッピング）することを含む。

本発明の一実施形態では、復号化装置が提供され、この装置は、復号化モード切り換え認識ユニットと、先の復号化フレーム重複データ取得ユニットと、第２の復号化ユニットとを含み、
復号化モード切り換え認識ユニットは、先の復号化フレーム重複データ取得ユニットの動作をトリガするために、復号化された符号ストリーム内の情報に従って、先のフレームが第１の復号化モードで復号化されており、現在のフレームが第２の復号化モードで復号化されていることを判定するように構成され、
先の復号化フレーム重複データ取得ユニットは、現在のフレームの復号化データと先のフレームの復号化データとの間の重複部分のデータ長に従って、先のフレームから重複部分のデータ長に対応する復号化データを取得し、前記復号化データを第２の復号化ユニットに提供するように構成され、
第２の復号化ユニットは、復号化結果を取得するために、先の復号化フレーム重複データ取得ユニットによって取得された復号化データと、現在のフレームの復号化データとを重畳（オーバーラッピング）するように構成される。

上記の本発明の実施形態による技術方式からわかるように、本発明の実施形態は、符号化および復号化プロセスの間のモード切り換えを、フィルタ計算なしで達成し得ることで、符号化および復号化プロセス全体の計算が比較的単純であることを可能にし、ソフトウェアおよびハードウェアによる実装を容易にする。同時に、本発明の実施形態により、ゼロ入力応答が現在のフレームの最初の部分における信号と類似していない場合に、フレーム間の不連続性をなくす効果は有効に保証され得る。

従来技術におけるＴＣＸ符号化プロセスの概略ブロック図である。従来技術におけるＴＣＸ復号化プロセスの概略ブロック図である。従来技術において、ウィンドウ処理されたＺＩＲ値を計算するプロセスで適用される、時間領域ウィンドウ関数ｗ（ｎ）の概略図である。本発明の一実施形態による、ＴＣＸ符号化プロセスの概略ブロック図である。本発明の一実施形態による、ＴＣＸ復号化プロセスの概略ブロック図である。本発明の一実施形態による、入力音声フレームの構成の概略図である。本発明の一実施形態による、ウィンドウ処理された形状の概略図である。本発明の一実施形態による、復号化プロセスにおけるフレーム間重複平滑化の概略図である。本発明の一実施形態による、符号化および復号化装置の概略図である。

本発明の符号化の一実施形態は、先のフレームが第１の符号化モードで符号化されていることが判定され、さらに、現在のフレームが第２の符号化モードで符号化されることになっていると判定された場合、すなわち、符号化中に符号化モードの切り換えが発生することが判定された場合、先のフレームの重複部分のデータ長の符号化データ、および、次のフレームの重複部分のデータ長の符号化データを、それぞれ、現在のフレームの符号化データと先のフレームの符号化データとの間、および、現在のフレームの符号化データと次のフレームの符号化データとの間の、重複部分の対応するデータ長に従って取得し、符号化結果を取得するために、先のフレームおよび次のフレームのデータから取得した符号化データを、現在のフレームの符号化データとともに、第２の符号化モードに基づいて符号化することを含む。重複部分のデータ長は、符号化フレームのフレーム長から決定され、符号化器内に予め設定される。符号化フレームのフレーム長が長ければ長いほど、対応する重複部分のデータ長はより長くなる。

本実施形態では、現在のフレームの符号化データと先のフレームの符号化データとの間の重複部分のデータ長は第１の長さであり、現在のフレームの符号化データと次のフレームの符号化データとの間の重複部分のデータ長は、第２の長さであると仮定される、ということを指摘しておく。そして好ましくは、第１の長さは第２の長さと同一であってもよいが、本発明の実施形態の特定の適用例では、２つの長さの値は必ずしも同じではない。

本発明の一実施形態では、具体的には、第１の符号化モードは、これに限定されないが線形予測符号化モードであってよく、第２の符号化モードは、これに限定されないが変換領域符号化であってよい。さらに、対応する実施形態は、さまざまな線形予測符号化モードと変換領域符号化モードとの間のモード切り換え（例えば、ＡＣＥＬＰ符号化からＴＣＸ符号化などのモード切り換え）を伴う符号化において適用されてもよい。

したがって、本発明における復号化の一実施形態は、受信した符号ストリームを復号化し、受信した符号ストリーム内の先のフレームが第１の復号化モードで復号化されており、現在のフレームが第２の復号化モードで復号化されていることが判定された場合、受信した符号ストリームを復号化して受信した符号ストリーム内の先のフレームは第１の復号化モードで復号化されており現在のフレームは第２の復号化モードで復号化されていることを判定しときに、先のフレームの復号化データと現在のフレームの復号化データとの間の重複部分の、定められたデータ長に従って、先のフレームから、重複部分のデータ長に対応する復号化データを取得し、復号化結果を取得するために、現在のフレームの復号化データを、先のフレームから取得した復号化データと重畳すること、具体的には、先のフレームの重複部分のデータ長の復号化データと、現在のフレームの復号化データのヘッダとが、ウィンドウ処理および重畳されることを含む。

ＡＭＲ−ＷＢ＋符号化を例として説明する。ＡＣＥＬＰ符号化（すなわち線形予測符号化）フレームからＴＣＸ符号化（すなわち変換領域符号化）フレームへの移行に関して、本発明の一実施形態は、ＡＣＥＬＰ符号化モードとＴＣＸ符号化モードとの間の切り換えのための、重複平滑化（オーバーラップスムージング）技術を提案する。この技術では、より良好なフレーム間スムージング効果を得ることが可能であると同時に、ビットレートは不変であることが保証される。さらに、本実施形態の適用のプロセスにおいては、合成知覚重み付けフィルタの複雑な計算は必要とされず、その結果、その計算複雑度は、従来技術におけるＡＭＲ−ＷＢ＋のためのモード間スムージング技術に比較して減少する。

言い換えると、本発明の一実施形態は、２つの符号化モードの間の切り換えによって発生する、符号化への影響を減少させるために、モード間重複平滑化技術を主として使用する。この実施形態は、ＴＣＸ符号化および復号化の効率を向上させ、ＴＣＸ符号化および復号化プロセスによる、ＴＣＸ符号化および復号化の複雑度を減少させることを意図するものである。本発明のモード間重複平滑化技術に基づく、ＴＣＸ符号化および復号化の技術方式について、以下で説明する。

（Ｉ）モード間重複平滑化技術を使用するＴＣＸ符号化方式

本方式の具体的な実装は、図４に示すとおりである。ＴＣＸモードで符号化された符号ストリームを得るために、ＴＣＸ符号化のための入力ＴＣＸフレーム信号は、知覚重み付けフィルタによって処理され、適応的にウィンドウ処理され、変換領域符号化によって符号化される。先のフレームがＡＣＥＬＰモードで符号化されている場合、現在入力されているＴＣＸフレーム信号の、次のフレームと重畳されるデータ長は、半分にされる。同時に、予約空間は、先のフレームの最後のサブフレーム内のいくつかのサンプルポイントの値を使用して補完される。すなわち、フレーム間平滑化を達成するために、現在のフレームの符号化データと、先のフレームと現在のフレームの両方の重複部分の符号化データと、次のフレームと現在のフレームの両方の重複部分の符号化データとが符号化される。

図４に示す実施形態では、ゼロ入力応答の除去はもはや必要とされず、その結果、符号化のプロセスは単純化され得ることは明白である。同時に、現在のフレームと先のフレームとの間、および、現在のフレームと次のフレームとの間で、それぞれ重複データを使用して平滑化が実行されるため、効果的なフレーム間平滑化が達成され得る。

（ＩＩ）モード間重複平滑化技術を使用するＴＣＸ復号化方式

上記のＴＣＸ符号化方式に対応して、対応するＴＣＸ復号化方式の実装のブロック図は、図５に示すとおりである。復号化プロセスでは、合成音声信号を得るために、ＴＣＸ復号化器は、ＴＣＸ符号化器から送信されたＴＣＸモードで符号化された符号ストリームを受信し、受信した符号ストリームに対してＴＣＸモードで変換領域復号化とウィンドウ処理および重畳とを実行し、逆知覚重み付けフィルタを通過させる。先のフレームのためにＡＣＥＬＰ符号化モードが使用された場合、現在のフレームの復号化結果を得るために、上記の符号化器に対応する復号化器において、現在のフレームと重畳される先のフレームの復号化結果の部分との重畳を実行する処理方策が使用される。上記の符号化プロセスにおける例を参照すると、現在のフレームの重複開始部分と、先のフレームについてのＡＣＥＬＰ合成信号の最後のサブフレームとが、ＴＣＸ復号化器でウィンドウ処理および重畳されて、最終的な合成音声信号がもたらされる。

本発明の実施形態の理解のために、本発明の実施形態による符号化および復号化アルゴリズムについて、すなわち、先のフレームにＡＣＥＬＰ符号化モードが使用され、現在のフレームにＴＣＸ符号化モードが使用される、符号化および復号化プロセスについて、添付の図面を参照して詳細に説明する。

（Ｉ）符号化プロセス
図４をさらに参照すると、先のフレームはＡＣＥＬＰモードで符号化されており、現在のフレームはＴＣＸを使用して符号化されることになっている状況の場合、利用可能なフレーム間重畳技術は、
現在のフレームの音声データを、先のフレームのＡＣＥＬＰ処理された音声データの最後のいくつかの部分（例えば、１６、３２、または６４ポイントの発話（スピーチ）データ）とともに、現在のフレームのＴＣＸ符号化モード（例えば、２５６、５１２、または１０２４の符号化フレーム長を有するＴＣＸ符号化モード）に従ってＴＣＸ符号化することを含み、音声データの最後のいくつかの部分とは、符号化フレーム長に従って決定された、先のフレームと重畳される部分のデータ長を有する音声データを意味する。

対応するＴＣＸ符号化器に対する入力音声フレームの構成は図６に示すとおりであり、ここで、Ｌ＿ｆｒａｍｅは現在のフレームのＴＣＸ符号化フレーム長を表し、これはＴＣＸの３つの符号化モードに対応してそれぞれ２５６、５１２、または１０２４であってもよく、Ｌ１は先のフレームと重畳する音声信号の長さを表し、Ｌ２は次のフレームと重畳する音声信号のサンプル数であり、Ｌは現在のフレームの実際に処理される音声信号長を表す。図６におけるパラメータの値は、以下のとおりであってもよい。
Ｌ＿ｆｒａｍｅ＝２５６の場合、Ｌ１＝１６、Ｌ２＝１６、Ｌ＝２８８、
Ｌ＿ｆｒａｍｅ＝５１２の場合、Ｌ１＝３２、Ｌ２＝３２、Ｌ＝５７６、
Ｌ＿ｆｒａｍｅ＝１０２４の場合、Ｌ１＝６４、Ｌ２＝６４、Ｌ＝１１５２。

したがって、現在のフレームと先のフレームとの間で重畳される長さはＴＣＸ符号化モードの違いに伴って変化し、適応性のある効果を有する。一方で、本方法においてＴＣＸ処理される発話信号の各フレームの実際のフレーム長は、ＡＭＲ−ＷＢ＋における実際のフレーム長と一致しており、これにより符号化の正確さが保証される。

ＴＣＸモードで符号化される発話信号は知覚重み付けフィルタによって処理され、次に、図７に示すようにウィンドウ関数によって適応的にウィンドウ処理される。即ち、
ｗ（ｎ）＝ｓｉｎ（２πｎ／（４Ｌ２））、ｎ＝Ｌ２，．．．，（２Ｌ２−１）
上式で、ｗ（ｎ）は、図７においてＬ２の区画内に示されている曲線を意味する。言い換えると、先のフレームと重畳される部分はウィンドウ処理されず、次のフレームと重畳される部分は、コサインウィンドウ関数ｗ（ｎ）によってウィンドウ処理される。

さらに、先のフレームと重畳される部分が設定されるため、コサインウィンドウ関数のウィンドウ長は、ＡＭＲ−ＷＢ＋におけるコサインウィンドウ関数のウィンドウ長の半分だけである。

加えて、次のフレームが引き続きＴＣＸモードで符号化される場合、フレーム間平滑化の効果を保証するためには、次のフレームのフレームヘッダをウィンドウ処理するためのウィンドウ長はＬ２の長さと一致していなければならず、すなわち、対応する重複部分は現在のフレームと一致する長さを有していなければならない。

（ＩＩ）復号化プロセス
上記の符号化プロセスに対応して、ＴＣＸ復号化器は、現在のフレームのＴＣＸモードで符号化された受信符号ストリームから、現在のフレームの合成音声信号を復号化し、先のフレームのＡＣＥＬＰで復号化された音声信号を使用して、先頭の重複部分をウィンドウ処理および重畳して、最終的な合成音声出力を生成する。

具体的には、先のＡＣＥＬＰ符号化フレームから復号化された合成音声信号と、現在のＴＣＸ符号化フレームから復号化された音声信号は、図８に示すようにウィンドウ処理され、次に重複部分を重畳することによって最終的な合成音声信号が得られる。

図８を参照すると、重複部分に三角形のウィンドウが使用され、ＡＣＥＬＰの最後のＬ１個のサンプルポイントの合成音声信号はｗ２（ｎ）として表され、ＴＣＸの重複部分の合成音声信号はｗ１（ｎ）として表される場合、対応する合成音声信号は、次のとおりである。
（１）ｗ１（ｎ）＝ｎ／Ｌ１、ｎ＝０，．．．Ｌ１
（２）ｗ２（ｎ）＝（Ｌ１−ｎ）／Ｌ１、ｎ＝０，．．．Ｌ１

上記のプロセスを使用して、対応するＴＣＸ復号化結果を得るための対応するＴＣＸ復号化を正常に完了することができる。

図９に示す符号化装置と復号化装置とを含む本発明の一実施形態において、符号化および復号化装置の一実施形態がさらに提供される。２つの装置の具体的な実装構成について、以下で説明する。

（Ｉ）符号化装置
この装置は、符号化モード切り換え認識ユニットと、先の符号化フレーム重複データ取得ユニットと、次の符号化フレーム重複データ取得ユニットと、第２の符号化ユニットと、を含み、
符号化モード切り換え認識ユニットは、先の符号化フレーム重複データ取得ユニットと次の符号化フレーム重複データ取得ユニットとの動作をトリガするために、先のフレームは第１の符号化モードで符号化されており、現在のフレームは第２の符号化モードで符号化されるということを判定するように構成され、
先の符号化フレーム重複データ取得ユニットは、現在のフレームの符号化データと先のフレームの符号化データとの間の重複部分の定められたデータ長に従って、先のフレームから重複部分のデータ長に対応する符号化データを取得し（例えば、先のフレームから重複部分のデータ長に対応する符号化データを取得し）、前記符号化データを変換領域符号化ユニット（すなわち第２の符号化ユニット）に提供するように構成され、
次の符号化フレーム重複データ取得ユニットは、現在のフレームの符号化データと次のフレームの符号化データとの間の重複部分の定められたデータ長に従って、次のフレームから重複部分のデータ長に対応する符号化データを取得し、前記符号化データを変換領域符号化ユニット（すなわち第２の符号化ユニット）に提供するように構成され（ここで、第２の符号化モードであるＴＣＸ符号化モードを例に取ると、本符号化においてＴＣＸフレーム同士の間にも対応する平滑化方式が必要とされているため、このようなユニットは対応するフレーム間平滑化を実行するために本装置の本実施形態において依然として使用されうる）、
第２の符号化ユニットはフレーム間平滑化を達成するために、先の符号化フレーム重複データ取得ユニットと次の符号化フレーム重複データ取得ユニットとによって取得された符号化データを、現在のフレームの符号化データと重畳して、符号化結果を取得するように構成される。

この装置では、先のフレーム重複データ取得ユニットで使用される重複部分のデータ長と、次のフレーム重複データ取得ユニットで使用される重複部分のデータ長とは、それぞれ符号化フレームのフレーム長に従って予め決定される。具体的には、先のフレーム重複データ取得ユニットで使用される重複部分のデータ長は第１の長さであり、次のフレーム重複データ取得ユニットで使用される重複部分のデータ長は第２の長さであると仮定すると、第１の長さは第２の長さと等しいが、必ずしも等しいということには限定されない。

（ＩＩ）復号化装置
この装置は、復号化モード切り換え認識ユニットと、先の復号化フレーム重複データ取得ユニットと、第２の復号化ユニットとを含み、
復号化モード切り換え認識ユニットは、受信した符号ストリームの先のフレームが第１の復号化モードで復号化されており、現在のフレームが第２の復号化モードで復号化されていることを、受信した符号ストリームを第２の復号化ユニットが復号化する間に判定して、先の復号化フレーム重複データ取得ユニットの動作をトリガするように構成され、
先の復号化フレーム重複データ取得ユニットは、現在のフレームの復号化データと先のフレームの復号化データとの間の重複部分の定められたデータ長に従って、先のフレームから重複部分のデータ長に対応する復号化データを取得し、前記復号化データを第２の復号化ユニットに提供するように構成され、
第２の復号化ユニットは、受信した符号ストリームを復号化し、先の復号化フレーム重複データ取得ユニットによって取得された復号化データを、現在のフレームの復号化データとともに、ウィンドウ処理および重畳して復号化結果を取得するように構成され、
重複部分データ長決定ユニットは、受信した符号ストリーム内の指示情報に従って、重複部分のデータ長を決定し、前記データ長を先の復号化フレーム重複データ取得ユニットに提供するように構成される。例えば、復号化器への符号ストリーム内で符号化モード（すなわち符号化フレームのフレーム長）を転送し、復号化器は符号化モードを受信したら、符号化モードに従って重複部分のデータ長の値を判定する。ただし、復号化器によって使用される重複部分のデータ長の値は、その他の指示情報を使用して指示されてもよい。

上記の装置で、第１の符号化モードは線形予測符号化モードであり、第２の符号化モードは変換領域符号化である。

本発明の実施形態は、２つの異なる符号化モードの間、または２つの異なる復号化モードの間の切り換えによって発生する問題に適用可能である、ということを指摘しておきたい。具体的には、切り換えに起因する符号化および復号化の品質の低下を平滑化するために、第１および第２の符号化モードが重畳されて符号化されることができ、これにより符号化および復号化の品質は向上する。例えば、本実施形態は、ＡＣＥＬＰ符号化モードからアドバンストオーディオ符号化（ＡＡＣ）モードへの移行の平滑化に適用されてもよく、あるいは、符号励振線形予測（ＣＥＬＰ）モードからＡＡＣモードへの移行の平滑化に適用されてもよく、あるいは、ＡＣＥＬＰ符号化モードから修正離散コサイン変換（ＭＤＣＴ）符号化モードへの移行の平滑化に適用されてもよく、またはその他の移行の平滑化に適用されてもよい。

上述のように、重複の計算は、復号化器において合成音声信号に対して実行されるため、良好なフレーム間平滑化効果が達成されることができる。さらに、本発明の実施形態ではフィルタ計算は必要とされず、それにより符号化および復号化プロセス全体の計算複雑度は低く保たれ、ソフトウェアおよびハードウェアによる実装は容易になる。

上記は、本発明の例示的実施形態にすぎず、したがって本発明の範囲はこのような実施形態に限定されない。本発明によって開示された技術的範囲内の、当業者によって容易に考案されることが可能なあらゆる変形形態および均等物が、本発明の範囲に含まれることが意図されている。したがって、本発明の範囲は、特許請求の範囲で規定された範囲によって解釈されるべきである。

Claims

先のフレームが第１の符号化モードで符号化され、かつ、現在のフレームが第２の符号化モードで符号化される場合、前記現在のフレームの符号化データと前記先のフレームの符号化データとの間の重複部分のデータ長に従って、前記先のフレームから前記重複部分のデータ長に対応する符号化データを取得し、
前記先のフレームからの前記重複部分のデータ長に対応する前記取得した符号化データと、前記現在のフレームの符号化データとを、前記第２の符号化モードで符号化して、符号化結果を取得すること
を含む、符号化方法。
前記第１の符号化モードは線形予測符号化モードであり、前記第２の符号化モードは変換領域符号化であることを特徴とする、請求項１に記載の方法。
前記重複部分の前記データ長は、対応する符号化フレームのフレーム長に従って決定されることを特徴とする、請求項１に記載の方法。
前記現在のフレームの符号化データと次のフレームの符号化データとの間の重複部分の決定されたデータ長に従って、前記次のフレームから前記重複部分の決定されたデータ長に対応する符号化データを取得し、
前記次のフレームから取得した符号化データと、前記先のフレームから取得した符号化データと、前記現在のフレームの符号化データとに対して、変換領域符号化を実行すること
をさらに含むことを特徴とする、請求項１〜３のいずれか一項に記載の方法。
前記現在のフレームの符号化データと前記先のフレームの符号化データとの間の前記重複部分のデータ長は、前記現在のフレームの符号化データと前記次のフレームの符号化データとの間の前記重複部分のデータ長と同一であることを特徴とする、請求項４に記載の方法。
符号化モード切り換え認識ユニットと、先の符号化フレーム重複データ取得ユニットと、第２の符号化ユニットとを備える符号化装置であって、
前記符号化モード切り換え認識ユニットは、先のフレームが第１の符号化モードで符号化されており、かつ、現在のフレームが第２の符号化モードで符号化されるということを判定して、前記先の符号化フレームの重複データ取得ユニットの動作をトリガするように構成され、
前記先の符号化フレーム重複データ取得ユニットは、前記現在のフレームの符号化データと前記先のフレームの符号化データとの間の重複部分のデータ長に従って、前記先のフレームから前記重複部分のデータ長に対応する符号化データを取得するように構成され、
前記第２の符号化ユニットは、前記先の符号化フレーム重複データ取得ユニットによって取得された前記符号化データと、前記現在のフレームの符号化データとを、前記第２の符号化モードで符号化して、符号化結果を取得するように構成された、符号化装置。
前記第１の符号化モードは線形予測符号化モードであり、前記第２の符号化モードは変換領域符号化であることを特徴とする、請求項６に記載の装置。
前記先の符号化フレーム重複データ取得ユニットで使用される前記重複部分のデータ長と、次の符号化フレーム重複データ取得ユニットで使用される重複部分のデータ長とは、対応する符号化フレームのフレーム長に従って予め決定されることを特徴とする、請求項６に記載の装置。
前記現在のフレームの符号化データと次のフレームの符号化データとの間の重複部分の決定されたデータ長に従って、前記次のフレームから前記重複部分のデータ長に対応する符号化データを取得し、前記符号化データを変換領域符号化ユニットに提供して符号化するように構成された、次の符号化フレーム重複データ取得ユニットをさらに備えることを特徴とする、
請求項６〜８のいずれか一項に記載の装置。
前記先の符号化フレーム重複データ取得ユニットで使用される前記重複部分のデータ長は、前記次の符号化フレームの重複データ取得ユニットで使用される前記重複部分のデータ長と同一であることを特徴とする、請求項９に記載の装置。
受信した符号ストリームを復号化し、先のフレームが第１の復号化モードで復号化されており、かつ、現在のフレームが第２の復号化モードで復号化されていることを判定し、
前記現在のフレームの復号化データと前記先のフレームの復号化データとの間の重複部分の決定されたデータ長に従って、前記先のフレームから前記重複部分のデータ長に対応する復号化データを取得し、
前記先のフレームから取得した前記復号化データと、前記現在のフレームの復号化データとを重畳して復号化結果を取得すること
を含む、復号化方法。
第１の符号化モードは線形予測符号化モードであり、第２の符号化モードは変換領域符号化であることを特徴とする、請求項１１に記載の方法。
前記重複部分のデータ長は、前記受信した符号ストリーム内の指示情報に従って決定されることを特徴とする、請求項１１に記載の方法。
復号化モード切り換え認識ユニットと、先の復号化フレーム重複データ取得ユニットと、第２の復号化ユニットとを備える復号化装置であって、
前記復号化モード切り換え認識ユニットは、復号化された符号ストリーム内の情報に従って、先のフレームが第１の復号化モードで復号化されており、かつ、現在のフレームが第２の復号化モードで復号化されていることを判定して、前記先の復号化フレーム重複データ取得ユニットの動作をトリガするように構成され、
前記先の復号化フレームの重複データ取得ユニットは、前記現在のフレームの復号化データと前記先のフレームの復号化データとの間の重複部分のデータ長に従って、前記先のフレームから前記重複部分のデータ長に対応する復号化データを取得し、前記復号化データを前記第２の復号化ユニットに提供するように構成され、
前記第２の復号化ユニットは、前記先の復号化フレームの重複データ取得ユニットによって取得された前記復号化データと、前記現在のフレームの復号化データとを重畳して復号化結果を取得するように構成された、復号化装置。
第１の符号化モードは線形予測符号化モードであり、第２の符号化モードは変換領域符号化であることを特徴とする、請求項１４に記載の装置。
受信した符号ストリーム内の指示情報に従って、前記重複部分のデータ長を決定するように構成された、重複部分データ長決定ユニットをさらに備えることを特徴とする、請求項１４または１５に記載の装置。