JP2012042534A

JP2012042534A - オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム

Info

Publication number: JP2012042534A
Application number: JP2010181345A
Authority: JP
Inventors: Kei Kikuiri; 圭菊入; Chunsen Bun; チュンセンブン
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2010-08-13
Filing date: 2010-08-13
Publication date: 2012-03-01
Anticipated expiration: 2030-08-13
Also published as: US20130159005A1; JP5749462B2; CN103098125A; TWI476762B; CN104835501B; TW201222531A; TWI570712B; TW201514975A; EP2605240A1; EP2605240B1; CN103098125B; CN104835501A; WO2012020828A1; US9280974B2; EP2605240A4

Abstract

【課題】サイズの小さいストリームを生成し得るオーディオ符号化装置、オーディオ復号装置、等を提供する。
【解決手段】オーディオ復号装置では、複数の復号部が、互いに異なるオーディオ復号処理を実行して符号系列からオーディオ信号を生成する。抽出部が、ストリームから長期符号化処理情報を抽出する。ストリームは、各々がオーディオ信号の符号系列を含む複数のフレームを有する。長期符号化処理情報は、複数のフレームに対して単一の長期符号化処理情報であり当該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す。選択部は、長期符号化処理情報が抽出されたことに応じて、複数の復号部のうち、複数のフレームの符号系列の復号に共通に使用する復号部を選択する。
【選択図】図７

Description

本発明は、オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラムに関するものである。

音声信号と音楽信号の双方を効率的に符号化するためには、音声信号に適した符号化処理と音楽信号に適した符号化処理とを切り替えて利用する複合型のオーディオ符号化方式が有効である。

下記の特許文献１には、このような、複合型のオーディオ符号化方式が記載されている。特許文献１に記載されたオーディオ符号化方式では、フレームごとに、当該フレームにおける符号系列の生成に使用された符号化処理を示す情報を付加している。

また、ＭＰＥＧＵＳＡＣ(ＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｉｎｇ）におけるオーディオ符号化においては、三つの符号化処理、即ち、ＦＤ（ＭｏｄｉｆｉｅｄＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ））、ＴＣＸ（ｔｒａｎｓｆｏｒｍｃｏｄｅｄｅｘｃｉｔａｔｉｏｎ）、ＡＣＥＬＰ（ＡｌｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）が用いられている。ＭＰＥＧＵＳＡＣでは、ＴＣＸとＡＣＥＬＰを一組にまとめてＬＰＤと定義している。ＭＰＥＧＵＳＡＣでは、ＦＤが使用されたか又はＬＰＤが使用されたかを表すために１ビットの情報が各フレームに付加される。また、ＭＰＥＧＵＳＡＣでは、ＬＰＤを用いる場合には、ＴＣＸとＡＣＥＬＰを組み合わせて利用する手順を規定するために４ビットの情報が各フレームに付加される。

また、第３世代携帯電話システム（３ＧＰＰ）のＡＭＲ−ＷＢ＋（ＥｘｔｅｎｄｅｄＡｄａｐｔｉｖｅＭｕｌｔｉ−ＲａｔｅＷｉｄｅｂａｎｄ）では、二つの符号化処理、即ち、ＴＣＸ及びＡＣＥＬＰが用いられている。ＡＭＲ−ＷＢ＋では、ＴＣＸ又はＡＣＥＬＰの使用を規定するために２ビットの情報が各フレームに付加される。

特開２０００−２６７６９９号公報

オーディオ信号は、人の発声に基づく信号である音声信号が中心であることもあり、音楽信号が中心であることもある。このようなオーディオ信号を符号化すると、複数のフレームに共通の符号化処理が利用され得る。このようなオーディオ信号に対して、符号化側から復号側へのより効率的な情報伝達を可能とする手法が要請されている。

本発明は、サイズの小さいストリームを生成し得るオーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム、並びに、サイズの小さいストリームを用いることができるオーディオ復号装置、オーディオ復号方法、及び、オーディオ復号プログラムを提供することを目的としている。

本発明の一側面は、オーディオ符号化に関するものであり、以下のオーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラムを含み得る。

本発明の一側面に係るオーディオ符号化装置は、複数の符号化部、選択部、生成部、及び、出力部を備えている。複数の符号化部は、互いに異なるオーディオ符号化処理を実行してオーディオ信号から符号系列を生成する。選択部は、複数の符号化部のうち、複数のフレームのオーディオ信号の符号化に共通に使用する符号化部を選択し、又は、各々が複数のフレームを含む複数のスーパーフレームのオーディオ信号の符号化に共通に使用する一組の符号化部を選択する。生成部は、長期符号化処理情報を生成する。長期符号化処理情報は、複数のフレームに対して単一の情報であり、当該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す情報である。或いは、長期符号化処理情報は、複数のスーパーフレームに対して単一の情報であり、当該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す情報である。出力部は、選択部によって選択された符号化部によって生成された上記複数のフレームの符号系列、又は、選択部によって選択された一組の符号化部によって生成された上記複数のスーパーフレームの符号系列と、長期符号化処理情報と、を含むストリームを出力する。

本発明の一側面に係るオーディオ符号化方法は、（ａ）互いに異なる複数のオーディオ符号化処理のうち、複数のフレームのオーディオ信号の符号化に共通に使用するオーディオ符号化処理を選択し、又は、複数のオーディオ符号化処理のうち、各々が複数のフレームを含む複数のスーパーフレームのオーディオ信号の符号化に共通に使用する一組のオーディオ符号化処理を選択するステップと、（ｂ）選択されたオーディオ符号化処理を使用して上記複数のフレームのオーディオ信号を符号化して当該複数のフレームの符号系列を生成し、又は、選択された一組のオーディオ符号化処理を使用して上記複数のスーパーフレームのオーディオ信号を符号化して当該複数のスーパーフレームの符号系列を生成するステップと、（ｃ）上記複数のフレームに対して単一の長期符号化処理情報であり当該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報、又は、上記複数のスーパーフレームに対して単一の長期符号化処理情報であり当該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報を生成するステップと、（ｄ）上記複数のフレームの符号系列、又は、上記複数のスーパーフレームの符号系列と、上記長期符号化処理情報と、を含むストリームを出力するステップと、を含んでいる。

本発明の一側面に係るオーディオ符号化プログラムは、コンピュータを、複数の符号化部、選択部、生成部、及び、出力部として機能させる。

本発明の一側面に係るオーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化プログラムによれば、長期符号化処理情報により、符号化側においては、複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたこと、又は、複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを通知することができる。この長期符号化処理情報の通知により、復号側では、共通のオーディオ復号処理、又は、共通の一組のオーディオ復号処理が選択され得る。したがって、ストリーム内に含めるオーディオ符号化処理を特定するための情報の量を低減することができる。

一実施形態においては、ストリームには、少なくとも複数のフレームのうち先頭のフレームより後のフレームには、当該後のフレームの符号系列の生成に使用されたオーディオ符号化処理を特定するための情報が含まれていなくてもよい。

一実施形態においては、上記複数のフレームに対して、複数の符号化部（又は複数のオーディオ符号化処理）のうち所定の符号化部（又は所定のオーディオ符号化処理）が選択されてもよく、ストリームには、上記複数のフレームの符号系列の生成に使用されたオーディオ符号化処理を特定するための情報が含まれていなくてもよい。この形態によれば、ストリームの情報量をより低減することが可能である。また、一実施形態においては、長期符号化処理情報は、１ビットの情報であってもよい。この形態によれば、ストリームの情報量を更に低減することが可能である。

本発明の別の一側面は、オーディオ復号に関するものであり、オーディオ復号装置、オーディオ復号方法、及び、オーディオ復号プログラムを含み得る。

本発明の別の一側面に係るオーディオ復号装置は、複数の復号部、抽出部、及び、選択部を備えている。複数の復号部は、互いに異なるオーディオ復号処理を実行して符号系列からオーディオ信号を生成する。抽出部は、ストリームから長期符号化処理情報を抽出する。ストリームは、各々がオーディオ信号の符号系列を含む複数のフレーム、及び／又は、各々が複数のフレームを含む複数のスーパーフレームを有する。長期符号化処理情報は、複数のフレームに対して単一の長期符号化処理情報であり当該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す。或いは、長期符号化処理情報は、複数のスーパーフレームに対して単一の長期符号化処理情報であり当該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す。選択部は、長期符号化処理情報が抽出されたことに応じて、複数の復号部のうち、複数のフレームの符号系列の復号に共通に使用する復号部を選択する。或いは、選択部は、複数の復号部のうち、複数のスーパーフレームの符号系列の復号に共通に使用する一組の復号部を選択する。

本発明の別の一側面に係るオーディオ復号方法は、（ａ）各々がオーディオ信号の符号系列を含む複数のフレーム及び／又は各々が複数のフレームを含む複数のスーパーフレームを有するストリームから、当該複数のフレームに対して単一の長期符号化処理情報であり当該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す長期符号化処理情報、又は、当該複数のスーパーフレームに対して単一の長期符号化処理情報であり当該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す長期符号化処理情報を抽出するステップと、（ｂ）長期符号化処理情報が抽出されたことに応じて、互いに異なる複数のオーディオ復号処理のうち、上記複数のフレームの符号系列の復号に共通に使用するオーディオ復号処理を選択し、又は、当該複数の復号処理のうち、上記複数のスーパーフレームの符号系列の復号に共通に使用する一組のオーディオ復号処理を選択するステップと、（ｃ）選択されたオーディオ復号処理を使用して上記複数フレームの符号系列を復号し、又は、選択された上記一組のオーディオ復号処理を使用して上記複数のスーパーフレームの符号系列を復号するステップと、を含む。

本発明の別の一側面に係るオーディオ復号プログラムは、コンピュータを、複数の復号部、抽出部、及び、選択部として機能させる。

本発明の別の一側面に係るオーディオ復号装置、オーディオ復号方法、及びオーディオ復号プログラムによれば、上述した符号化に関する本発明の一側面に基づいて生成されたストリームからオーディオ信号を生成することが可能である。

一実施形態においては、上記複数のフレームに対して、複数の復号部（又は複数のオーディオ復号処理）のうち所定の復号部（又は所定のオーディオ復号処理）が選択されてもよく、ストリームには、上記複数のフレームの符号系列の生成に使用されたオーディオ符号化処理を特定するための情報が含まれていなくてもよい。この形態によれば、ストリームにおける情報の量をより低減することが可能である。また、一実施形態においては、長期符号化処理情報は、１ビットの情報であってもよい。この形態によれば、ストリームにおける情報の量を更に低減することが可能である。

以上説明したように、本発明によれば、サイズの小さいストリームを生成し得るオーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム、並びに、サイズの小さいストリームを用いることができるオーディオ復号装置、オーディオ復号方法、及び、オーディオ復号プログラムが提供される。

一実施形態に係るオーディオ符号化装置を示す図である。一実施形態に係るオーディオ符号化装置によって生成されるストリームを示す図である。一実施形態に係るオーディオ符号化方法を示すフローチャートである。一実施形態に係るオーディオ符号化プログラムを示す図である。一実施形態に係るコンピュータのハードウェア構成を示す図である。一実施形態に係るコンピュータを示す斜視図である。変形態様に係るオーディオ符号化装置を示す図である。一実施形態に係るオーディオ復号装置を示す図である。一実施形態に係るオーディオ復号方法を示すフローチャートである。一実施形態に係るオーディオ復号プログラムを示す図である。別の一実施形態に係るオーディオ符号化装置を示す図である。従来のＭＰＥＧＵＳＡＣに従って生成されるストリームと図１１に示すオーディオ符号化装置によって生成されるストリームとを示す図である。別の一実施形態に係るオーディオ符号化方法のフローチャートである。別の一実施形態に係るオーディオ符号化プログラムを示す図である。別の一実施形態に係るオーディオ復号装置を示す図である。別の一実施形態に係るオーディオ復号方法のフローチャートである。ｍｏｄ［ｋ］とａ（ｍｏｄ［ｋ］）の関係を示す図である。別の一実施形態に係るオーディオ復号プログラムを示す図である。更に別の一実施形態に係るオーディオ符号化装置を示す図である。従来のＡＭＲＷＢ＋に従って生成されるストリームと図１９に示すオーディオ符号化装置によって生成されるストリームとを示す図である。更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。更に別の一実施形態に係るオーディオ復号装置を示す図である。更に別の一実施形態に係るオーディオ復号方法のフローチャートである。更に別の一実施形態に係るオーディオ復号プログラムを示す図である。更に別の一実施形態に係るオーディオ符号化装置を示す図である。図２６に示すオーディオ符号化装置によって生成されるストリームを示す図である。更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。更に別の一実施形態に係るオーディオ復号装置を示す図である。更に別の一実施形態に係るオーディオ復号方法のフローチャートである。更に別の一実施形態に係るオーディオ復号プログラムを示す図である。更に別の一実施形態に係るオーディオ符号化装置を示す図である。従来のＭＰＥＧＵＳＡＣに従って生成されるストリームと図３３に示すオーディオ符号化装置によって生成されるストリームとを示す図である。更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。更に別の一実施形態に係るオーディオ復号装置を示す図である。更に別の一実施形態に係るオーディオ復号方法のフローチャートである。更に別の一実施形態に係るオーディオ復号プログラムを示す図である。更に別の一実施形態に係るオーディオ符号化装置を示す図である。図４０に示すオーディオ符号化装置によって生成されるストリームを示す図である。更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。更に別の一実施形態に係るオーディオ復号装置を示す図である。更に別の一実施形態に係るオーディオ復号方法のフローチャートである。更に別の一実施形態に係るオーディオ復号プログラムを示す図である。更に別の一実施形態に係るオーディオ符号化装置を示す図である。従来のＡＭＲＷＢ＋に従って生成されるストリームと図４７に示すオーディオ符号化装置によって生成されるストリームとを示す図である。更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。更に別の一実施形態に係るオーディオ復号装置を示す図である。更に別の一実施形態に係るオーディオ復号方法のフローチャートである。更に別の一実施形態に係るオーディオ復号プログラムを示す図である。

以下、図面を参照して本発明の好適な実施形態について詳細に説明する。なお、各図面において同一又は相当の部分に対しては同一の符号を附すこととする。

図１は、一実施形態に係るオーディオ符号化装置を示す図である。図１に示すオーディオ符号化装置１０は、入力端子Ｉｎ１に入力される複数のフレームのオーディオ信号を、共通のオーディオ符号化処理を使用して符号化し得るものである。図１に示すように、オーディオ符号化装置１０は、複数の符号化部１０ａ_１〜１０ａ_ｎ、選択部１０ｂ、生成部１０ｃ、及び、出力部１０ｄを備えている。ここで、ｎは２以上の整数である。

符号化部１０ａ_１〜１０ａ_ｎは、互いに異なるオーディオ符号化処理を実行してオーディオ信号から符号系列を生成する。これらオーディオ符号化処理には、任意のオーディオ符号化処理を採用し得る。例えば、オーディオ符号化処理として、ＭｏｄｉｆｉｅｄＡＡＣ符号化処理、ＡＣＥＬＰ符号化処理、及びＴＣＸ符号化処理といった処理が使用され得る。

選択部１０ｂは、入力端子Ｉｎ２に入力される入力情報に応じて、符号化部１０ａ_１〜１０ａ_ｎのうち一つの符号化部を選択する。入力情報は、例えば、ユーザによって入力されるものである。一実施形態においては、この入力情報は、複数のフレームのオーディオ信号に共通に使用されるオーディオ符号化処理を特定する情報であり得る。選択部１０ｂは、スイッチＳＷを制御して、符号化部１０ａ_１〜１０ａ_ｎのうち入力情報によって特定されるオーディオ符号化処理を実行する符号化部と入力端子Ｉｎ１とを結合し得る。

生成部１０ｃは、入力情報に基づいて長期符号化処理情報を生成する。長期符号化処理情報は、複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す情報である。また、長期符号化処理情報は、復号側にて識別可能なユニークワードであってもよい。また、一実施形態においては、複数のフレームの符号系列の生成に共通に使用されたオーディオ符号化処理を復号側にて特定し得る情報であってもよい。

出力部１０ｄは、選択された符号化部によって生成された複数のフレームの符号系列、及び、生成部１０ｃによって生成された長期符号化処理情報を含むストリームを出力する。

図２は、一実施形態に係るオーディオ符号化装置によって生成されるストリームを示す図である。図２に示すストリームは、第１〜第ｍの複数のフレームを含んでいる。ここで、ｍは、２以上の整数である。以下、ストリームにおけるフレームのことを、出力フレームということがある。各出力フレームには、入力オーディオ信号において当該出力フレームに対応するフレームのオーディオ信号から生成された符号系列が含まれている。また、ストリームの第１フレームには、パラメータ情報として、長期符号化処理情報が付加され得る。

以下、オーディオ符号化装置１０の動作と、一実施形態のオーディオ符号化方法について説明する。図３は、一実施形態に係るオーディオ符号化方法を示すフローチャートである。図３に示すように、一実施形態においては、ステップＳ１０−１において、選択部１０ｂが、入力情報に基づいて符号化部１０ａ_１〜１０ａ_ｎのうち一つの符号化部を選択する。

次いで、ステップＳ１０−２において、生成部１０ｃが、入力情報に基づいて長期符号化処理情報を生成する。続くステップＳ１０−３において、出力部１０ｄが、パラメータ情報として、第１フレームに長期符号化処理情報を付加する。

次いで、ステップＳ１０−４において、選択部１０ｂによって選択された符号化部が、現在の符号化対象のフレームのオーディオ信号を符号化して、符号系列を生成する。続くステップＳ１０−５において、出力部１０ｄが、符号化対象のフレームに対応するストリーム内の出力フレームに、符号化部によって生成された符号系列を含め、当該出力フレームを出力する。

続くステップＳ１０−５においては、符号化していないフレームが存在するか否かの判定が行われる。符号化していないフレームが存在しない場合には、処理は終了する。一方、更に符号化すべきフレームが存在する場合には、符号化していないフレームを対象にステップＳ１０−４からの一連の処理が継続される。

以上説明したオーディオ符号化装置１０及び一実施形態のオーディオ符号化方法によれば、ストリームの第１フレームのみに長期符号化処理情報が含まれている。即ち、ストリームにおいて第２フレームより後のフレームには、使用されたオーディオ符号化処理を特定するための情報が含まれていない。したがって、サイズの小さい効率的なストリームが生成され得る。

以下、コンピュータをオーディオ符号化装置１０として動作させるプログラムについて説明する。図４は、一実施形態に係るオーディオ符号化プログラムを示す図である。図５は、一実施形態に係るコンピュータのハードウェア構成を示す図である。図６は、一実施形態に係るコンピュータを示す斜視図である。図４に示すオーディオ符号化プログラムＰ１０は、図５に示すコンピュータＣ１０をオーディオ符号化装置１０として動作させることができる。なお、本明細書に説明するプログラムは、図５に示すようなコンピュータに限定されず、携帯電話や、携帯情報端末といった任意の装置を、当該プログラムに従って動作させることができる。

オーディオ符号化プログラムＰ１０は、記録媒体ＳＭに格納されて提供され得る。なお、記録媒体ＳＭとしては、フロッピーディスク、ＣＤ−ＲＯＭ、ＤＶＤ、あるいはＲＯＭ等の記録媒体、あるいは半導体メモリ等が例示される。

図５に示すように、コンピュータＣ１０は、フロッピーディスクドライブ装置、ＣＤ−ＲＯＭドライブ装置、ＤＶＤドライブ装置等の読取装置Ｃ１２と、オペレーティングシステムを常駐させた作業用メモリ（ＲＡＭ）Ｃ１４と、記録媒体ＳＭに記憶されたプログラムを記憶するメモリＣ１６と、ディスプレイといった表示装置Ｃ１８と、入力装置であるマウスＣ２０及びキーボードＣ２２と、データ等の送受を行うための通信装置Ｃ２４と、プログラムの実行を制御するＣＰＵＣ２６と、を備え得る。

コンピュータＣ１０は、記録媒体ＳＭが読取装置Ｃ１２に挿入されると、読取装置Ｃ１２から記録媒体ＳＭに格納されたオーディオ符号化プログラムＰ１０にアクセス可能になり、当該プログラムＰ１０によって、オーディオ符号化装置１０として動作することが可能になる。

図６に示すように、オーディオ符号化プログラムＰ１０は、搬送波に重畳されたコンピュータデータ信号ＣＷとしてネットワークを介して提供されるものであってもよい。この場合、コンピュータＣ１０は、通信装置Ｃ２４によって受信したオーディオ符号化プログラムＰ１０をメモリＣ１６に格納し、プログラムＰ１０を実行することができる。

図４に示すように、オーディオ符号化プログラムＰ１０は、複数の符号化モジュールＭ１０ａ_１〜Ｍ１０ａ_ｎ、選択モジュールＭ１０ｂ、生成モジュールＭ１０ｃ、及び、出力モジュールＭ１０ｄを備えている。

一実施形態においては、符号化モジュール部Ｍ１０ａ_１〜Ｍ１０ａ_ｎ、選択モジュールＭ１０ｂ、生成モジュールＭ１０ｃ、出力モジュールＭ１０ｄは、符号化部１０ａ_１〜１０ａ_ｎ、選択部１０ｂ、生成部１０ｃ、出力部１０ｄとそれぞれ同様の機能をコンピュータＣ１０に実行させる。かかるオーディオ符号化プログラムＰ１０によれば、コンピュータＣ１０は、オーディオ符号化装置１０として動作することが可能となる。

ここで、オーディオ符号化装置１０の変形態様について説明する。図７は、変形態様に係るオーディオ符号化装置を示す図である。オーディオ符号化装置１０では、入力情報に基づいて符号化部（符号化処理）が選択されるが、図７に示すオーディオ符号化装置１０Ａでは、オーディオ信号の解析結果に基づいて符号化部が選択される。そのために、オーディオ符号化装置１０Ａは、解析部１０ｅを備えている。

解析部１０ｅは、複数のフレームのオーディオ信号を解析して、当該複数のフレームのオーディ信号の符号化に適したオーディオ符号化処理を決定する。解析部１０ｅは、決定したオーディオ符号化処理を特定する情報を、選択部１０ｂに与えて、選択部１０ｂに当該オーディオ符号化処理を実行する符号化部を選択させる。また、解析部１０ｅは、決定したオーディオ符号化処理を特定する情報を、生成部１０ｃに与えて、生成部１０ｃに長期符号化処理情報を生成させる。

解析部１０ｅは、例えば、オーディオ信号のトーン性、ピッチ周期、時間包絡，過渡的成分（突然の信号の立ち上がり／下がり）を解析し得る。例えば、解析部１０ｅは、オーディオ信号のトーン性が所定のトーン性より強い場合には周波数領域の符号化を行うオーディオ符号化処理を使用するように決定をなすことができる。また、解析部１０ｅは、例えば、オーディオ信号のピッチ周期が所定の範囲内にある場合には当該オーディオ信号の符号化に適したオーディオ符号化処理を使用するように決定をなすことができる。さらに、解析部１０ｅは、例えば、オーディオ信号の時間包絡の変動が所定の変動より大きい場合、又は、オーディオ信号が過渡成分を含む場合には、時間領域の符号化を行うオーディオ符号化処理を使用するように決定をなすことができる。

以下、オーディオ符号化装置１０によって生成されたストリームを復号し得るオーディオ復号装置について説明する。図８は、一実施形態に係るオーディオ復号装置を示す図である。図８に示すオーディオ復号装置１２は、複数の復号部１２ａ_１〜１２ａ_ｎ、抽出部１２ｂ、及び、選択部１２ｃを備えている。復号部１２ａ_１〜１２ａ_ｎは、互いに異なるオーディオ復号処理を実行して符号系列からオーディオ信号を生成する。復号部１２ａ_１〜１２ａ_ｎの処理は、符号化部１０ａ_１〜１０ａ_ｎの処理とそれぞれ対称の処理である。

抽出部１２ｂは、入力端子Ｉｎに入力されるストリームから長期符号化処理情報（図３を参照）を抽出する。抽出部１２ｂは、抽出した長期符号化処理情報を選択部１２ｃに与え、長期符号化処理情報を取り除いたストリームの残部をスイッチＳＷへと出力し得る。

選択部１２ｃは、長期符号化処理情報に基づいてスイッチＳＷを制御する。選択部１２ｃは、復号部１２ａ_１〜１２ａ_ｎのうち、長期符号化処理情報に基づいて特定される符号化処理を実行する復号部を選択する。また、選択部１２ｃは、ストリームに含まれる複数のフレームが選択した復号部に結合されるよう、スイッチＳＷを制御する。

以下、オーディオ復号装置１２の動作、及び、一実施形態に係るオーディオ復号方法について説明する。図９は、一実施形態に係るオーディオ復号方法を示すフローチャートである。図９に示すように、一実施形態においては、ステップＳ１２−１において、抽出部１２ｂが、ストリームから長期符号化処理情報を抽出する。続くステップＳ１２−２において、選択部１２ｃが、抽出された長期符号化処理情報に応じて復号部１２ａ_１〜１２ａ_ｎから一つの復号部を選択する。

続くステップＳ１２−３において、選択された復号部が、復号対象のフレームの符号系列を復号する。次いで、ステップＳ１２−４で復号していないフレームが存在するか否かが判定される。復号していないフレームが存在しない場合には、処理は終了する。一方、復号していないフレームが存在する場合には、当該フレームを対象に、ステップＳ１２−２において選択された復号部を用いて、ステップＳ１２−３からの処理が継続される。

以下、コンピュータをオーディオ復号装置１２として動作させ得るオーディオ復号プログラムについて説明する。図１０は、一実施形態に係るオーディオ復号プログラムを示す図である。

図１０に示すオーディオ復号プログラムＰ１２は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ復号プログラムＰ１２は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

図１０に示すように、オーディオ復号プログラムＰ１２は、復号モジュールＭ１２ａ_１〜Ｍ１２ａ_ｎ、抽出モジュールＭ１２ｂ、及び、選択モジュールＭ１２ｃを備えている。復号モジュールＭ１２ａ_１〜Ｍ１２ａ_ｎ、抽出モジュールＭ１２ｂ、選択モジュールＭ１２ｃは、復号部１２ａ_１〜１２ａ_ｎ、抽出部１２ｂ、選択部１２ｃとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、別の一実施形態に係るオーディオ符号化装置について説明する。図１１は、別の一実施形態に係るオーディオ符号化装置を示す図である。図１１に示すオーディオ符号化装置１４は、ＭＰＥＧＵＳＡＣの拡張において使用し得る装置である。

図１２は、従来のＭＰＥＧＵＳＡＣに従って生成されるストリームと図１１に示すオーディオ符号化装置によって生成されるストリームとを示す図である。図１２に示すように、従来のＭＰＥＧＵＳＡＣでは、ストリームにおける各フレームに、ＦＤ（ＭｏｄｉｆｉｅｄＡＡＣ）が使用されたかＬＰＤ（ＡＣＥＬＰ又はＴＣＸ）が使用されたかを示す情報、即ち、１ビットのｃｏｒｅ＿ｍｏｄｅが付加される。また、従来のＭＰＥＧＵＳＡＣでは、ＬＰＤが使用されるフレームは４つのフレームを含むスーパーフレーム構造を有している。ＬＰＤが使用される場合には、スーパーフレームの各フレームの符号化にＡＣＥＬＰ又はＴＣＸの何れが使用されたかを示す情報として、４ビットのｌｐｄ＿ｍｏｄｅが、そのスーパーフレームに付加されている。

図１１に示すオーディオ符号化装置１４は、全てのフレームのオーディオ信号を共通のオーディオ符号化処理によって符号化し得る。また、オーディオ符号化装置１４は、従来のＭＰＥＧ＿ＵＳＡＣと同様に、各フレームに使用するオーディオ符号化処理を切り替えることも可能である。なお、一実施形態においては、オーディオ符号化装置は、全てのスーパーフレームにＬＰＤ、即ち、一組のオーディオ符号化処理を共通に使用してもよい。

図１１に示すように、オーディオ符号化装置１４は、ＡＣＥＬＰ符号化部１４ａ_１、ＴＣＸ符号化部１４ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３、選択部１４ｂ、生成部１４ｃ、出力部１４ｄ、ヘッダ生成部１４ｅ、第１判定部１４ｆ、ｃｏｒｅ＿ｍｏｄｅ生成部１４ｇ、第２判定部１４ｈ、ｌｐｄ＿ｍｏｄｅ生成部１４ｉ、ＭＰＳ符号化部１４ｍ、及び、ＳＢＲ符号化部１４ｎを備えている。

ＭＰＳ符号化部１４ｍは、入力端子Ｉｎ１に入力されるオーディオ信号を受ける。ＭＰＳ符号化部１４ｍに入力されるオーディオ信号は、２チャネル以上のマルチチャネルのオーディオ信号であり得る。ＭＰＳ符号化部１４ｍは、各フレームのマルチチャネルのオーディオ信号を、当該マルチチャネルのチャネル数より少ないチャネル数のオーディオ信号と、当該より少ないチャネル数のオーディオ信号からマルチチャネルのオーディ信号を復号するためのパラメータとで表現する。

マルチチャネルのオーディオ信号がステレオ信号である場合には、ＭＰＳ符号化部１４ｍは、当該ステレオ信号をダウンミックスすることによりモノラルのオーディオ信号を生成する。また、ＭＰＳ符号化部１４ｍは、モノラル信号からステレオ信号を復号するためのパラメータとして、モノラル信号とステレオ信号の各チャネルとの間のレベル差、位相差、及び／又は、相関値を生成する。ＭＰＳ符号化部１４ｍは、生成したモノラル信号をＳＢＲ符号化部１４ｎへ出力し、生成したパラメータを符号化することによって得た符号化データを出力部１４ｄに出力する。なお、ステレオ信号は、モノラル信号と残差信号、及び、パラメータによって表現されてもよい。

ＳＢＲ符号化部１４ｎは、ＭＰＳ符号化部１４ｍから各フレームのオーディオ信号を受ける。ＳＢＲ符号化部１４ｎが受けるオーディオ信号は、例えば、上述したモノラル信号であり得る。ＳＢＲ符号化部１４ｎは、入力端子Ｉｎ１に入力されるオーディオ信号がモノラル信号である場合には、当該オーディオ信号を受ける。ＳＢＲ符号化部１４ｎは、所定の周波数を基準として、入力されたオーディオ信号から低周波帯域のオーディオ信号及び高周波帯域のオーディオ信号を生成する。また、ＳＢＲ符号化部１４ｎは、低周波帯域のオーディオ信号から高周波帯域のオーディオ信号を生成するためのパラメータを算出する。当該パラメータとしては、例えば、所定の周波数を表す周波数情報、時間・周波数分解能情報、スペクトル包絡情報、付加雑音情報、及び、付加正弦波情報といった情報が利用され得る。ＳＢＲ符号化部１４ｎは、低周波帯域のオーディオ信号をスイッチＳＷ１へ出力する。また、ＳＢＲ符号化部１４ｎは、算出したパラメータを符号化することによって得た符号化データを出力部１４ｄへ出力する。

符号化部１４ａ_１は、ＡＣＥＬＰ符号化処理によりオーディオ信号を符号化して符号系列を生成する。符号化部１４ａ_２は、ＴＣＸ符号化処理によりオーディオ信号を符号化して符号系列を生成する。符号化部１４ａ_３は、ＭｏｄｉｆｉｅｄＡＡＣ符号化処理によりオーディオ信号を符号化して符号系列を生成する。

選択部１４ｂは、入力端子Ｉｎ２に入力される入力情報に応じて、スイッチＳＷ１に入力される複数のフレームのオーディオ信号を符号化する符号化部を選択する。本実施形態では、入力情報は、ユーザによって入力され得る情報であり得る。また、入力情報は、複数のフレームを共通の一つの符号化処理により符号化するか否かを示す情報であり得る。

本実施形態では、選択部１４ｂは、入力情報が複数のフレームを共通の一つのオーディオ符号化処理により符号化することを示す場合に、所定の符号化処理を実行する所定の符号化部を選択する。例えば、説明するように、入力情報が複数のフレームを共通の一つのオーディオ符号化処理により符号化することを示す場合に、選択部１４ｂは、スイッチＳＷ１を制御して、ＡＣＥＬＰ符号化部１４ａ_１を所定の符号化部として選択することができる。したがって、本実施形態では、入力情報が複数のフレームを共通の一つのオーディオ符号化処理により符号化することを示す場合には、ＡＣＥＬＰ符号化部１４ａ_１によって複数のフレームのオーディオ信号が符号化される。

一方、選択部１４ｂは、入力情報が複数のフレームを共通の一つのオーディオ符号化処理により符号化しないことを示す場合に、スイッチＳＷ１に入力される各フレームのオーディオ信号を、第１判定部１４ｆ等に繋がるパスへと結合する。

生成部１４ｃは、入力情報に基づいて長期符号化処理情報を生成する。図１２に示すように、長期符号化処理情報としては、１ビットのＧＥＭ＿ＩＤが用いられ得る。また、入力情報が複数のフレームを共通の一つのオーディオ符号化処理により符号化することを示す場合には、生成部１４ｃは、ＧＥＭ＿ＩＤの値「１」に設定し得る。一方、入力情報が複数のフレームを共通の一つのオーディオ符号化処理により符号化しないことを示す場合には、生成部１４ｃは、ＧＥＭ＿ＩＤの値「０」に設定し得る。

ヘッダ生成部１４ｅは、ストリームに含めるヘッダを生成し、設定されたＧＥＭ＿ＩＤを当該ヘッダに含める。図１２に示すように、このヘッダは、出力部１４ｄから出力されるときに、第１フレームに含められ得る。

第１判定部１４ｆは、入力情報が複数のフレームを共通の一つのオーディオ符号化処理により符号化しないことを示す場合に、ＳＷ１を介して符号化対象のフレームのオーディオ信号を受ける。第１判定部１４ｆは、符号化対象のフレームのオーディオ信号を解析して、ＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３により当該オーディオ信号を符号化すべきか否かを判定する。

第１判定部１４ｆは、符号化対象のフレームのオーディオ信号をＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３により符号化すべきであると判定する場合には、スイッチＳＷ２を制御して、当該フレームをＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３に結合する。

一方、第１判定部１４ｆは、符号化対象のフレームのオーディオ信号をＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３により符号化すべきでないと判定する場合には、スイッチＳＷ２を制御して、当該フレームを第２判定部１４ｈ及びスイッチＳＷ３に結合する。この場合に、符号化対象のフレームは、後続の処理において、４つのフレームに分割され、当該４つのフレームを含むスーパーフレームとして取り扱われる。

なお、第１判定部１４ｆは、例えば、符号化対象のフレームのオーディ信号を解析して、当該オーディオ信号が所定量以上のトーン成分を有する場合には、ＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３を当該フレームの音声信号用の符号化部として選択し得る。

ｃｏｒｅ＿ｍｏｄｅ生成部１４ｇは、第１判定部１４ｆの判定結果に応じて、ｃｏｒｅ＿ｍｏｄｅを生成する。図１２に示すように、ｃｏｒｅ＿ｍｏｄｅは１ビットの情報である。ｃｏｒｅ＿ｍｏｄｅ生成部１４ｇは、第１判定部１４ｆが符号化対象のフレームのオーディオ信号をＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３により符号化すべきであると判定した場合には、ｃｏｒｅ＿ｍｏｄｅの値を「０」に設定する。一方、ｃｏｒｅ＿ｍｏｄｅ生成部１４ｇは、第１判定部１４ｆが判定対象のフレームのオーディオ信号をＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３により符号化すべきでないと判定した場合には、ｃｏｒｅ＿ｍｏｄｅの値を「１」に設定する。このｃｏｒｅ＿ｍｏｄｅは、出力部１４ｄから出力されるときに、符号化対象のフレームに対応するストリーム内の出力フレームにパラメータ情報として付加される。

第２判定部１４ｈは、スイッチＳＷ２を介して符号化対象のスーパーフレームのオーディオ信号を受ける。第２判定部１４ｈは、符号化対象のスーパーフレームにおける各フレームのオーディオ信号をＡＣＥＬＰ符号化部１４ａ_１により符号化すべきか又はＴＣＸ符号化部１４ａ_２で符号化すべきかを判定する。

第２判定部１４ｈは、符号化対象のフレームのオーディオ信号をＡＣＥＬＰ符号化部１４ａ_１により符号化すべきと判定する場合に、スイッチＳＷ３を制御して当該フレームのオーディオ信号をＡＣＥＬＰ符号化部１４ａ_１に結合する。一方、第２判定部１４ｈは、符号化対象のフレームのオーディオ信号をＴＣＸ符号化部１４ａ_２により符号化すべきと判定する場合に、スイッチＳＷ３を制御して当該フレームのオーディオ信号をＴＣＸ符号化部１４ａ_２に結合する。

第２判定部１４ｈは、例えば、符号化対象のフレームのオーディオ信号が強い音声成分を有する信号である場合、当該オーディオ信号の時間包絡が短時間で所定の変動より大きく変動する場合、又は、当該オーディオ信号が過渡的成分を含む場合には、当該オーディオ信号をＡＣＥＬＰ符号化部１４ａ_１により符号化すべきと判定し得る。第２判定部１４ｈは、その他の場合には、当該オーディオ信号をＴＣＸ符号化部１４ａ_２により符号化すべきと判定し得る。なお、オーディオ信号が強い音声成分を有する信号である場合とは、当該オーディオ信号のピッチ周期が所定の範囲内にある場合、ピッチ周期のときの自己相関が所定の自己相関より強い場合、又は、ゼロクロスレートが所定のレートより小さい場合であり得る。

ｌｐｄ＿ｍｏｄｅ生成部１４ｉは、第２判定部１４ｈの判定結果に応じてｌｐｄ＿ｍｏｄｅを生成する。図１２に示すようにｌｐｄ＿ｍｏｄｅは、４ビットの情報である。ｌｐｄ＿ｍｏｄｅ生成部１４ｉは、第２判定部１４ｈからのスーパーフレームにおける各フレームのオーディオ信号に対する判定結果に対応する所定の値に、ｌｐｄ＿ｍｏｄｅの値を設定する。ｌｐｄ＿ｍｏｄｅ生成部１４ｉによって値が設定されたｌｐｄ＿ｍｏｄｅは、出力部１４ｄから出力されるときに、符号化対象のスーパーフレームに対応するストリーム内の出力スーパーフレームに付加される。

出力部１４ｄは、ストリームを出力する。ストリームには、上述したＧＥＭ＿ＩＤを含むヘッダ及び対応の符号系列を有する第１フレーム、及び、対応の符号系列をそれぞれ有する第２〜第ｍフレーム（ｍは２以上の整数）が含まれる。また、出力部１４ｄは、各出力フレームに、ＭＰＳ符号化部１４ｍによって生成されたパラメータの符号化データ及びＳＢＲ符号化部１４ｎによって生成されたパラメータの符号化データを含める。

以下、オーディオ符号化装置１４の動作、及び、別の一実施形態に係るオーディオ符号化方法について説明する。図１３は、別の一実施形態に係るオーディオ符号化方法のフローチャートである。

図１３に示すように、一実施形態においては、ステップＳ１４−１において、生成部１４ｃが、入力情報に基づいて、上述したようにＧＥＭ＿ＩＤを生成（設定）する。続くステップＳ１４−２において、ヘッダ生成部１４ｅが、設定されたＧＥＭ＿ＩＤを含むヘッダを生成する。

次いで、ステップＳ１４−ｐに示す判定により、入力端子Ｉｎ１に入力されるオーディオ信号がマルチチャネル信号であると判断される場合には、ステップＳ１４−ｍにおいて、ＭＰＳ符号化部１４ｍが、上述したように、入力される符号化対象のフレームのマルチチャネルのオーディオ信号から、マルチチャネルのチャネル数より少ないチャネル数のオーディオ信号と、当該より少ないチャネル数のオーディオ信号からマルチチャネルのオーディ信号を復号するためのパラメータと、を生成する。また、ＭＰＳ符号化部１４ｍが、当該パラメータの符号化データを生成する。この符号化データは、出力部１４ｄにより、対応の出力フレームに含められる。一方、入力端子Ｉｎ１に入力されるオーディオ信号がモノラル信号である場合には、ＭＰＳ符号化部１４ｍは動作せず、入力端子Ｉｎ１に入力されるオーディオ信号は、ＳＢＲ符号化部１４ｎに入力される。

次いで、ステップＳ１４−ｎにおいて、ＳＢＲ符号化部１４ｎが、上述したように、入力されるオーディオ信号から、低周波帯域のオーディオ信号と、低周波帯域のオーディオ信号から高周波帯域のオーディオ信号を生成するためのパラメータと、を生成する。また、ＳＢＲ符号化部１４ｎが、当該パラメータの符号化データを生成する。この符号化データは、出力部１４ｄにより、対応の出力フレームに含められる。

次いで、ステップＳ１４−３において、選択部１４ｂが、入力情報に基づいて、複数のフレームのオーディオ信号、即ち、ＳＢＲ符号化部１４ｎから出力された複数のフレームの低周波帯域のオーディオ信号を共通のオーディオ符号化処理により符号化するか否かを判定する。

ステップＳ１４−３において、入力情報が複数のフレームのオーディオ信号を共通のオーディオ符号化処理により符号化することを示す場合、即ち、ＧＥＭ＿ＩＤの値が「１」である場合には、選択部１４ｂは、ＡＣＥＬＰ符号化部１４ａ_１を選択する。

次いで、ステップＳ１４−４において、選択部１４ｂによって選択されたＡＣＥＬＰ符号化部１４ａ_１が、符号化対象のフレームのオーディオ信号を符号化して、符号系列を生成する。

次いで、ステップＳ１４−５において、出力部１４ｄが、フレームにヘッダを付加するか否かを判断する。ステップＳ１４−５においては、出力部１４ｄは、符号化対象のフレームが第１フレームである場合に、当該符号化対象のフレームに対応するストリーム内の第１フレームにヘッダを付加するものと判定し、続くステップＳ１４−６において、第１フレームにヘッダ及び符号系列を含めて、当該第１フレームを出力する。一方、第２フレーム以降のフレームの場合には、ヘッダは付加されず、ステップＳ１４−７において、出力部１４ｄが、フレームに符号系列を含めて出力する。

次いで、ステップＳ１４−８において、符号化していないフレームが存在するか否かが判断される。符号化していないフレームが存在しない場合には、処理が終了する。一方、符号化していないフレームが存在する場合には、符号化していないフレームを対象にステップＳ１４−ｍからの処理が継続される。

このように、本実施形態では、ＧＥＭ＿ＩＤの値が「１」である場合には、ＡＣＥＬＰ符号化部１４ａ_１が、複数のフレームのオーディオ信号の全ての符号化に継続して使用される。

ステップＳ１４−３において、ＧＥＭ＿ＩＤの値が「０」であると判断される場合、即ち、入力情報が、各フレームが個別の符号化処理方法によって処理されるべきことを示す場合には、ステップＳ１４−９において、第１判定部１４ｆが、符号化対象のフレームのオーディオ信号、即ち、ＳＢＲ符号化部１４ｎから出力された符号化対象のフレームの低周波帯域のオーディオ信号をＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３により符号化すべきか否かを判定する。続くステップＳ１４−１０においては、ｃｏｒｅ＿ｍｏｄｅ生成部１４ｇが、第１判定部１４ｆによる判定結果に応じた値にｃｏｒｅ＿ｍｏｄｅの値を設定する。

次いで、ステップＳ１４−１１において、第１判定部１４ｆの判定結果がＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３により符号化対象のフレームのオーディオ信号を符号化すべきことを示しているか否かが判定される。第１判定部１４ｆの判定結果がＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３により符号化対象のフレームのオーディオ信号を符号化すべきことを示している場合には、続くステップＳ１４−１２において、符号化対象のフレームのオーディオ信号がＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３によって符号化される。

次いで、ステップＳ１４−１３において、出力部１４ｄが、符号化対象のフレームに対応するストリーム内の出力フレーム（又はスーパーフレーム）にｃｏｒｅ＿ｍｏｄｅを付加する。そして、処理は、ステップＳ１４−５に進む。

ステップＳ１４−１１において、第１判定部１４ｆの判定結果がＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３により符号化対象のフレームのオーディオ信号を符号化すべきでないことを示している場合には、ステップＳ１４−１４からの処理は、符号化対象のフレームをスーパーフレームとして取り扱う。

ステップＳ１４−１４においては、第２判定部１４ｈが、スーパーフレームにおける各フレームをＡＣＥＬＰ符号化部１４ａ_１で符号化すべきか、ＴＣＸ符号化部１４ａ_２で符号化すべきかを判定する。続くステップＳ１４−１５においては、ｌｐｄ＿ｍｏｄｅ生成部１４ｉが、第２判定部１４ｈの判定結果に応じた値にｌｐｄ＿ｍｏｄｅを設定する。

次いで、ステップＳ１４−１６において、第２判定部１４ｈの判定結果が、スーパーフレーム内の符号化対象のフレームをＡＣＥＬＰ符号化部１４ａ_１で符号化すべきことを示しているか、当該符号化対象のフレームをＴＣＸ符号化部１４ａ_２で符号化すべきことを示しているかが判定される。

第２判定部１４ｈの判定結果が符号化対象のフレームをＡＣＥＬＰ符号化部１４ａ_１で符号化すべきことを示している場合には、ステップＳ１４−１７において、符号化対象のフレームのオーディオ信号がＡＣＥＬＰ符号化部１４ａ_１によって符号化される。一方、第２判定部１４ｈの判定結果が符号化対象のフレームをＴＣＸ符号化部１４ａ_２で符号化すべきことを示している場合には、ステップＳ１４−１８において、符号化対象のフレームのオーディオ信号がＴＣＸ符号化部１４ａ_２によって符号化される。

次いで、ステップＳ１４−１９において、符号化対象のスーパーフレームに対応するストリーム内の出力スーパーフレームにｌｐｄ＿ｍｏｄｅが付加される。そして、処理は、ステップＳ１４−１３に進む。

以上説明したオーディオ符号化装置１４及びオーディオ符号化方法によれば、「１」に設定したＧＥＭ＿ＩＤをヘッダに含めることにより、各フレームに使用されたオーディオ符号化処理を特定する情報を含めることなく、複数のフレームのオーディオ信号をＡＣＥＬＰ符号化部のみで符号化したことを復号側に通知することができる。したがって、よりサイズの小さいストリームが生成される。

以下、コンピュータをオーディオ符号化装置１４として動作させるオーディオ符号化プログラムについて説明する。図１４は、別の一実施形態に係るオーディオ符号化プログラムを示す図である。

図１４に示すオーディオ符号化プログラムＰ１４は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ符号化プログラムＰ１４は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

図１４に示すように、オーディオ符号化プログラムＰ１４は、ＡＣＥＬＰ符号化モジュールＭ１４ａ_１、ＴＣＸ符号化モジュールＭ１４ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ符号化モジュールＭ１４ａ_３、選択モジュールＭ１４ｂ、生成モジュールＭ１４ｃ、出力モジュールＭ１４ｄ、ヘッダ生成モジュールＭ１４ｅ、第１判定モジュールＭ１４ｆ、ｃｏｒｅ＿ｍｏｄｅ生成モジュールＭ１４ｇ、第２判定モジュールＭ１４ｈ、ｌｐｄ＿ｍｏｄｅ生成モジュールＭ１４ｉ、ＭＰＳ符号化モジュールＭ１４ｍ、及び、ＳＢＲ符号化モジュール１４ｎを備えている。

ＡＣＥＬＰ符号化モジュールＭ１４ａ_１、ＴＣＸ符号化モジュールＭ１４ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ符号化モジュールＭ１４ａ_３、選択モジュールＭ１４ｂ、生成モジュールＭ１４ｃ、出力モジュールＭ１４ｄ、ヘッダ生成モジュールＭ１４ｅ、第１判定モジュールＭ１４ｆ、ｃｏｒｅ＿ｍｏｄｅ生成モジュールＭ１４ｇ、第２判定モジュールＭ１４ｈ、ｌｐｄ＿ｍｏｄｅ生成モジュールＭ１４ｉ、ＭＰＳ符号化モジュールＭ１４ｍ、及び、ＳＢＲ符号化モジュール１４ｎは、ＡＣＥＬＰ符号化部１４ａ_１、ＴＣＸ符号化部１４ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３、選択部１４ｂ、生成部１４ｃ、出力部１４ｄ、ヘッダ生成部１４ｅ、第１判定部１４ｆ、ｃｏｒｅ＿ｍｏｄｅ生成部１４ｇ、第２判定部１４ｈ、ｌｐｄ＿ｍｏｄｅ生成部１４ｉ、ＭＰＳ符号化部１４ｍ、ＳＢＲ符号化部１４ｎとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、オーディオ符号化装置１４によって生成されたストリームを復号し得るオーディオ復号装置について説明する。図１５は、別の一実施形態に係るオーディオ復号装置を示す図である。図１５に示すオーディオ復号装置１６は、ＡＣＥＬＰ復号部１６ａ_１、ＴＣＸ復号部１６ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３、抽出部１６ｂ、選択部１６ｃ、ヘッダ解析部１６ｄ、ｃｏｒｅ＿ｍｏｄｅ抽出部１６ｅ、第１選択部１６ｆ、ｌｐｄ＿ｍｏｄｅ抽出部１６ｇ、第２選択部１６ｈ、ＭＰＳ復号部１６ｍ、及び、ＳＢＲ復号部１６ｎを備えている。

ＡＣＥＬＰ復号部１６ａ_１は、ＡＣＥＬＰ復号処理によりフレーム内の符号系列を復号して、オーディオ信号を生成する。ＴＣＸ復号部１６ａ_２は、ＴＣＸ復号処理によりフレーム内の符号系列を復号して、オーディオ信号を生成する。ＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３は、ＭｏｄｉｆｉｅｄＡＡＣ復号処理によりフレーム内の符号系列を復号して、オーディオ信号を生成する。一実施形態においては、これらの復号部から出力されるオーディオ信号は、オーディオ符号化装置１４に関して上述した低周波帯域のオーディ信号である。

ヘッダ解析部１６ｄは、第１フレームからヘッダを分離し得る。ヘッダ解析部１６ｄは、分離したヘッダを抽出部１６ｂに提供し、ヘッダが分離された第１フレーム、及び後続のフレームを、スイッチＳＷ１、ＭＰＳ復号部１６ｍ、及びＳＢＲ復号部１６ｎへと出力する。

抽出部１６ｂは、ヘッダからＧＥＭ＿ＩＤを抽出する。選択部１６ｃは、抽出されたＧＥＭ＿ＩＤに応じて、複数のフレームの符号系列の復号に用いる復号部を選択する。具体的に、選択部１６ｃは、ＧＥＭ＿ＩＤの値が「１」の場合には、スイッチＳＷ１を制御して、複数のフレームの全てをＡＣＥＬＰ復号部１６ａ_１に結合する。一方、ＧＥＭ＿ＩＤの値が「０」の場合には、選択部１６ｃは、スイッチＳＷ１を制御して、復号対象のフレーム（又はスーパーフレーム）をｃｏｒｅ＿ｍｏｄｅ抽出部１６ｅに結合する。

ｃｏｒｅ＿ｍｏｄｅ抽出部１６ｅは、復号対象のフレーム（又はスーパーフレーム）内のｃｏｒｅ＿ｍｏｄｅを抽出し、当該ｃｏｒｅ＿ｍｏｄｅを第１選択部１６ｆに提供する。第１選択部１６ｆは、提供されたｃｏｒｅ＿ｍｏｄｅの値に応じて、スイッチＳＷ２を制御する。具体的に、ｃｏｒｅ＿ｍｏｄｅの値が「０」である場合には、第１選択部１６ｆは、スイッチＳＷ２を制御して、復号対象のフレームをＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３に結合する。これにより、復号対象のフレームがＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３に入力される。一方、ｃｏｒｅ＿ｍｏｄｅの値が「１」である場合には、第１選択部１６ｆは、スイッチＳＷ２を制御して、復号対象のスーパーフレームをｌｐｄ＿ｍｏｄｅ抽出部１６ｇに結合する。

ｌｐｄ＿ｍｏｄｅ抽出部１６ｇは、復号対象のフレーム、即ちスーパーフレームからｃｏｒｅ＿ｍｏｄｅを抽出する。ｌｐｄ＿ｍｏｄｅ抽出部１６ｇは、抽出したｃｏｒｅ＿ｍｏｄｅを第２選択部１６ｈに結合する。第２選択部１６ｈは、入力されたｃｏｒｅ＿ｍｏｄｅに応じて、ｌｐｄ＿ｍｏｄｅ抽出部１６ｇから出力される復号対象のスーパーフレーム内の各フレームを、ＡＣＥＬＰ復号部１６ａ_１又はＴＣＸ復号部１６ａ_２に結合する。

具体的に、第２選択部１６ｈは、ｌｐｄ＿ｍｏｄｅの値に関連付けられた所定のテーブルを参照して、ｍｏｄ［ｋ］（ｋ＝０，１，２，３）の値を設定する。そして、第２選択部１６ｈは、ｍｏｄ［ｋ］の値に応じて、スイッチＳＷ３を制御して、復号対象のスーパーフレーム内の各フレームを、ＡＣＥＬＰ復号部１６ａ_１又はＴＣＸ復号部１６ａ_２に結合する。なお、ｍｏｄ［ｋ］の値と、ＡＣＥＬＰ復号部１６ａ_１又はＴＣＸ復号部１６ａ_２の選択の関係については、後述する。

ＳＢＲ復号部１６ｎは、復号部１６ａ_１、１６ａ_２、及び１６ａ_３から低周波帯域のオーディオ信号を受ける。ＳＢＲ復号部１６ｎは、また、復号対象のフレームに含まれる符号化データを復号することにより、パラメータを復元する。ＳＢＲ復号部１６ｎは、低周波帯域のオーディオ信号及び復元したパラメータを用いて高周波帯域のオーディ信号を生成する。また、ＳＢＲ復号部１６ｎは、高周波帯域のオーディオ信号及び低周波帯域のオーディオ信号を合成することにより、オーディオ信号を生成する。

ＭＰＳ復号部１６ｍは、ＳＢＲ復号部１６ｎからオーディオ信号を受ける。このオーディオ信号は、復元すべきオーディオ信号がステレオ信号である場合には、モノラルのオーディオ信号で有り得る。ＭＰＳ復号部１６ｍは、また、復号対象のフレームに含まれる符号化データを復号することにより、パラメータを復元する。また、ＭＰＳ復号部１６ｍは、ＳＢＲ復号部１６ｎから受けたオーディオ信号と復元したパラメータを用いて、マルチチャネルのオーディオ信号を生成し、当該マルチチャネルのオーディオ信号を出力する。復元すべきオーディオ信号がモノラル信号である場合には、ＭＰＳ復号部１６ｍは動作せず、上記ＳＢＲ復号部１６ｎが生成するオーディオ信号を出力する。

以下、オーディオ復号装置１６の動作と、別の一実施形態に係るオーディオ復号方法について説明する。図１６は、別の一実施形態に係るオーディオ復号方法のフローチャートである。

図１６に示すように、一実施形態においては、ステップＳ１６−１において、ヘッダ解析部１６ｄがストリームからヘッダを分離する。続くステップＳ１６−２において、抽出部１６ｂが、ヘッダ解析部１６ｄから提供されるヘッダからＧＥＭ＿ＩＤを抽出する。

次いで、ステップＳ１６−３において、選択部１６ｃが、抽出部１６ｂによって抽出されたＧＥＭ＿ＩＤの値に応じて、複数のフレームを復号する復号部を選択する。具体的には、ＧＥＭ＿ＩＤの値が「１」の場合には、選択部１６ｃは、ＡＣＥＬＰ復号部１６ａ_１を選択する。この場合には、ステップＳ１６−４において、ＡＣＥＬＰ復号部１６ａ_１が、復号対象のフレーム内の符号系列を復号する。ステップＳ１６−４により生成されるオーディオ信号は、上述した低周波帯域のオーディオ信号である。

次いで、ステップＳ１６−ｎにおいて、ＳＢＲ復号部１６ｎが、復号対象のフレームに含まれる符号化データを復号することにより、パラメータを復元する。また、ステップＳ１６−ｎにおいては、ＳＢＲ復号部１６ｎが、入力された低周波帯域のオーディオ信号及び復元したパラメータを用いて高周波帯域のオーディ信号を生成する。また、ステップＳ１６−ｎにおいては、ＳＢＲ復号部１６ｎが、高周波帯域のオーディオ信号及び低周波帯域のオーディオ信号を合成することにより、オーディオ信号を生成する。

次いで、ステップＳ１６−ｐにおける判定によりマルチチャネル信号を処理の対象としていると判断される場合には、続くステップＳ１６−ｍにおいて、ＭＰＳ復号部１６ｍが、復号対象のフレームに含まれる符号化データを復号することにより、パラメータを復元する。また、ステップＳ１６−ｍにおいては、ＭＰＳ復号部１６ｍが、ＳＢＲ復号部１６ｎから受けたオーディオ信号と復元したパラメータを用いて、マルチチャネルのオーディオ信号を生成し、当該マルチチャネルのオーディオ信号を出力する。一方、モノラル信号を処理の対象としていると判断される場合には、ＳＢＲ復号部１６ｎが生成するオーディオ信号を出力する。

次いで、ステップＳ１６−５において、復号していないフレームが存在するか否かの判定が行われる。復号していないフレームが存在しない場合には、処理は終了する。一方、復号しないフレームが存在する場合には、復号していないフレームを対象にステップＳ１６−４からの処理が継続される。これにより、ＧＥＭ＿ＩＤの値が「１」である場合には、複数のフレームの符号系列が、共通の復号部、即ち、ＡＣＥＬＰ復号部１６ａ_１により復号される。

ステップＳ１６−３に戻り、ＧＥＭ＿ＩＤの値が「０」である場合には、選択部１６ｃは、復号対象のフレームをｃｏｒｅ＿ｍｏｄｅ抽出部１６ｅに結合する。この場合には、ステップＳ１６−６において、ｃｏｒｅ＿ｍｏｄｅ抽出部１６ｅが、復号対象のフレームからｃｏｒｅ＿ｍｏｄｅを抽出する。

次いで、ステップＳ１６−７において、第１選択部１６ｆが、抽出されたｃｏｒｅ＿ｍｏｄｅに応じて、ＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３又はｌｐｄ＿ｍｏｄｅ抽出部１６ｇを選択する。具体的には、ｃｏｒｅ＿ｍｏｄｅの値が「０」である場合には、第１選択部１６ｆは、ＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３を選択し、復号対象のフレームをＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３に結合する。この場合には、続くステップＳ１６−８おいて、処理対象のフレーム内の符号系列がＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３によって復号される。このステップＳ１６−８において生成されるオーディオ信号は、上述した低周波帯域のオーディオ信号である。このステップＳ１６−８に続き、上述したＳＢＲ復号処理（ステップＳ１６−ｎ）及びＭＰＳ復号処理（ステップＳ１６−ｍ）が行われる。

次いで、ステップＳ１６−９において、復号していないフレームが存在するか否かが判定され、復号していないフレームが存在しない場合には、処理が終了する。一方、復号していないフレームが存在する場合には、復号していないフレームを対象にステップＳ１６−６からの処理が継続される。

ステップＳ１６−７に戻り、ｃｏｒｅ＿ｍｏｄｅの値が「１」である場合には、第１選択部１６ｆは、ｌｐｄ＿ｍｏｄｅ抽出部１６ｇを選択し、復号対象のフレームをｌｐｄ＿ｍｏｄｅ抽出部１６ｇに結合する。なお、この場合には、復号対象のフレームは、スーパーフレームとして取り扱われる。

次いで、ステップＳ１６−１０において、ｌｐｄ＿ｍｏｄｅ抽出部１６ｇが、復号対象のスーパーフレームからｌｐｄ＿ｍｏｄｅを抽出する。そして、第２選択部１６ｈが、抽出されたｌｐｄ＿ｍｏｄｅに応じてｍｏｄ［ｋ］（ｋ＝０，１，２，３）を設定する。

次いで、ステップＳ１６−１１において、第２選択部１６ｈは、ｋの値を「０」に設定する。続くステップＳ１６−１２において、第２選択部１６ｈは、ｍｏｄ［ｋ］の値が０より大きいか否かを判定する。ｍｏｄ［ｋ］の値が０以下である場合には、第２選択部１６ｈは、ＡＣＥＬＰ復号部１６ａ_１を選択する。一方、ｍｏｄ［ｋ］の値が０より大きい場合には、第２選択部１６ｈは、ＴＣＸ復号部１６ａ_２を選択する。

そして、ＡＣＥＬＰ復号部１６ａ_１が選択された場合には、続くステップＳ１６−１３において、ＡＣＥＬＰ復号部１６ａ_１がスーパーフレーム内の復号対象のフレームの符号系列を復号する。次いで、ステップＳ１６−１４において、ｋの値がｋ＋１に設定される。一方、ＴＣＸ復号部１６ａ_２が選択された場合には、続くステップＳ１６−１５において、ＴＣＸ復号部１６ａ_２がスーパーフレーム内の復号対象のフレームの符号系列を復号する。ついで、ステップＳ１６−１６において、ｋの値が、ｋ＋ａ（ｍｏｄ［ｋ］）に更新される。なお、ｍｏｄ［ｋ］とａ（ｍｏｄ［ｋ］）の関係については、図１７を参照されたい。

次いで、ステップＳ１６−１７において、ｋの値が４より小さいか否かが判定される。ｋの値が４より小さい場合には、ステップＳ１６−１２からの処理がスーパーフレーム内の後続のフレームに対して継続される。一方、ｋの値が４以上である場合には、処理はステップＳ１６−ｎに進む。

以下、コンピュータをオーディオ復号装置１６として動作させるオーディオ復号プログラムについて説明する。図１８は、別の一実施形態に係るオーディオ復号プログラムを示す図である。

図１８に示すオーディオ復号プログラムＰ１６は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ復号プログラムＰ１６は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

図１８に示すように、オーディオ復号プログラムＰ１６は、ＡＣＥＬＰ復号モジュールＭ１６ａ_１、ＴＣＸ復号モジュールＭ１６ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ復号モジュールＭ１６ａ_３、抽出モジュールＭ１６ｂ、選択モジュールＭ１６ｃ、ヘッダ解析モジュールＭ１６ｄ、ｃｏｒｅ＿ｍｏｄｅ抽出モジュールＭ１６ｅ、第１選択モジュールＭ１６ｆ、ｌｐｄ＿ｍｏｄｅ抽出モジュールＭ１６ｇ、第２選択モジュールＭ１６ｈ、ＭＰＳ復号モジュールＭ１６ｍ、及び、ＳＢＲ復号モジュールＭ１６ｎを備えている。

ＡＣＥＬＰ復号モジュールＭ１６ａ_１、ＴＣＸ復号モジュールＭ１６ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ復号モジュールＭ１６ａ_３、抽出モジュールＭ１６ｂ、選択モジュールＭ１６ｃ、ヘッダ解析モジュールＭ１６ｄ、ｃｏｒｅ＿ｍｏｄｅ抽出モジュールＭ１６ｅ、第１選択モジュールＭ１６ｆ、ｌｐｄ＿ｍｏｄｅ抽出モジュールＭ１６ｇ、第２選択モジュールＭ１６ｈ、ＭＰＳ復号モジュールＭ１６ｍ、ＳＢＲ復号モジュールＭ１６ｎは、ＡＣＥＬＰ復号部１６ａ_１、ＴＣＸ復号部１６ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３、抽出部１６ｂ、選択部１６ｃ、ヘッダ解析部１６ｄ、ｃｏｒｅ＿ｍｏｄｅ抽出部１６ｅ、第１選択部１６ｆ、ｌｐｄ＿ｍｏｄｅ抽出部１６ｇ、第２選択部１６ｈ、ＭＰＳ復号部１６ｍ、ＳＢＲ復号部１６ｎとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、更に別の一実施形態に係るオーディオ符号化装置について説明する。図１９は、更に別の一実施形態に係るオーディオ符号化装置を示す図である。図１９に示すオーディオ符号化装置１８は、ＡＭＲ−ＷＢ＋の拡張として使用し得る装置である。

図２０は、従来のＡＭＲ−ＷＢ＋に従って生成されるストリームと図１９に示すオーディオ符号化装置によって生成されるストリームとを示す図である。図２０に示すように、ＡＭＲ−ＷＢ＋では、各フレームに、２ビットのＭｏｄｅｂｉｔｓが付加されている。Ｍｏｄｅｂｉｔｓは、その値によって、ＡＣＥＬＰ符号化処理を選択するかＴＣＸ符号化処理を選択するか否かを示す情報である。

一方、図１９に示すオーディオ符号化装置１８は、全てのフレームのオーディオ信号を共通のオーディオ符号化処理によって符号化することができる。また、オーディオ符号化装置１８は、各フレームに使用するオーディオ符号化処理を切替えることもできる。

図１９に示すように、オーディオ符号化装置１８は、ＡＣＥＬＰ符号化部１８ａ_１、及び、ＴＣＸ符号化部１８ａ_２備えている。ＡＣＥＬＰ符号化部１８ａ_１は、ＡＣＥＬＰ符号化処理によりオーディオ信号を符号化して符号系列を生成する。ＴＣＸ符号化部１８ａ_２は、ＴＣＸ符号化処理によりオーディオ信号を符号化して符号系列を生成する。オーディオ符号化装置１８は、更に、選択部１８ｂ、生成部１８ｃ、出力部１８ｄ、ヘッダ生成部１８ｅ、符号化処理判定部１８ｆ、Ｍｏｄｅｂｉｔｓ生成部１８ｇ、分析部１８ｍ、ダウンミックス部１８ｎ、高周波帯域符号化部１８ｐ、及び、ステレオ符号化部１８ｑを備えている。

分析部１８ｍは、所定の周波数を基準として、入力端子Ｉｎ１に入力される各フレームのオーディオ信号を低周波数帯域のオーディオ信号と高周波数帯域のオーディオ信号に分割する。分析部１８ｍは、入力端子Ｉｎ１に入力されるオーディオ信号がモノラルのオーディオ信号である場合には、生成した低周波数帯域のオーディオ信号をスイッチＳＷ１へ出力し、高周波数帯域のオーディオ信号を高周波数帯域符号化部１８ｐへ出力する。一方、入力端子Ｉｎ１に入力されるオーディオ信号がステレオ信号である場合には、分析部１８ｍは、生成した低周波数帯域のオーディオ信号（ステレオ信号）をダウンミックス部１８ｎに出力する。

ダウンミックス部１８ｎは、入力端子Ｉｎ１に入力されるオーディオ信号がステレオ信号である場合に、低周波数帯域のオーディオ信号（ステレオ信号）をモノラルのオーディオ信号にダウンミックスする。ダウンミックス部１８ｎは、生成したモノラルのオーディオ信号をスイッチＳＷ１へ出力する。ダウンミックス部１８ｎは、低周波数帯域のオーディオ信号を所定の周波数を基準として二つの周波数帯域のオーディオ信号に分割する。ダウンミックス部１８ｎは、二つの周波数帯域のオーディオ信号のうち低い周波数帯域のオーディオ信号（モノラル信号）と右チャネルのオーディオ信号をステレオ符号化部１８ｑへ出力する。

高周波帯域符号化部１８ｐは、復号側において低周波数帯域のオーディオ信号から高周波数帯域のオーディオ信号を生成するためのパラメータを算出し、当該パラメータの符号化データを生成し、当該符号化データを出力部１８ｄに出力する。パラメータとしては、例えば、スペクトル包絡をモデル化した線形予測係数やパワー調整のためのゲインが用いられ得る。

ステレオ符号化部１８ｑは、上記の二つの周波数帯域のオーディオ信号のうち低い周波数帯域のモノラルのオーディオ信号と右チャネルのオーディオ信号の差分信号であるサイド信号を算出する。ステレオ符号化部１８ｑは、モノラルのオーディオ信号とサイド信号のレベル差を表すバランスファクタを算出し、当該バランスファクタと、サイド信号の波形をそれぞれ所定の方法で符号化し、符号化データを出力部１８ｄに出力する。また、ステレオ符号化部１８ｑは、上記二つの周波数帯域のオーディオ信号のうち低い周波数帯域のオーディオ信号から復号装置にてステレオオーディオ信号を生成するためのパラメータを算出し、当該パラメータの符号化データを出力部１８ｄに出力する。

選択部１８ｂは、選択部１４ｂと同様の機能を有する。具体的には、入力情報が複数のフレームを共通の一つのオーディオ符号化処理により符号化することを示す場合には、選択部１８ｂは、スイッチＳＷ１を制御して、スイッチＳＷ１に入力される全てのフレームのオーディオ信号を、ＡＣＥＬＰ符号化部１８ａ_１に結合する。一方、入力情報が複数のフレームを共通の一つの符号化処理により符号化しないことを示す場合には、選択部１８ｂは、スイッチＳＷ１を制御して、スイッチＳＷ１に入力される各フレームのオーディオ信号を、符号化処理判定部１８ｆ等に繋がるパスへと結合する。

生成部１８ｃは、生成部１４ｃと同様にＧＥＭ＿ＩＤを設定する。ヘッダ生成部１８ｅは、生成部１８ｃによって生成されたＧＥＭ＿ＩＤを含むＡＭＲ−ＷＢ＋対応のヘッダを生成する。このヘッダは、ストリームの先頭において、出力部１８ｄによって出力される。本実施形態では、ＧＥＭ＿ＩＤは、ヘッダのＡＭＲＷＢＰＳａｍｐｌｅＥｎｔｒｙ＿ｆｉｅｌｄｓ内の未使用の領域に含められ得る。

符号化処理判定部１８ｆは、入力情報が複数のフレームを共通の一つの符号化処理により符号化しないことを示す場合に、ＳＷ１を介して符号化対象のフレームのオーディオ信号を受ける。

符号化処理判定部１８ｆは、符号化対象のフレームを、当該符号化対象のフレームを４以下のフレームに分割したスーパーフレームとして取り扱う。符号化処理判定部１８ｆは、スーパーフレームにおける各フレームのオーディオ信号を解析して、当該オーディオ信号をＡＣＥＬＰ符号化部１８ａ_１により符号化すべきか、ＴＣＸ符号化部１８ａ_２により符号化すべきかを判定する。この解析は、上述した第２判定部１４ｈと同様の解析であってもよい。

判定部１８ｆは、フレームのオーディオ信号をＡＣＥＬＰ符号化部１８ａ_１により符号化すべきと判定した場合には、スイッチＳＷ２を制御して、ＡＣＥＬＰ符号化部１８ａ_１に当該フレームのオーディオ信号を結合する。一方、フレームのオーディオ信号をＴＣＸ符号化部１８ａ_２により符号化すべきと判定した場合には、スイッチＳＷ２を制御して、ＴＣＸ符号化部１８ａ_２に当該フレームのオーディオ信号を結合する。

Ｍｏｄｅｂｉｔｓ生成部１８ｇは、符号化処理判定部１８ｆの判定結果に応じた値を有するＫ個のＭｏｄｅＢｉｔｓ［ｋ］（ｋ＝０〜Ｋ−１）を生成する。ここで、Ｋの値は、４以下の整数であり、スーパーフレーム内のフレーム数に対応する数であり得る。また、Ｍｏｄｅｂｉｔｓ［ｋ］は、少なくとも符号化対象のフレームのオーディオ信号の符号化にＡＣＥＬＰ符号化処理が使用されたか、又は、ＴＣＸ符号化処理が使用されたかを示す２ビットの情報である。

出力部１８ｄは、ヘッダ、及び、対応の符号系列複数のフレームを有するストリームを出力する。また、出力部１８ｄは、ＧＥＭ＿ＩＤの値が０である場合には、出力フレームにＭｏｄｅｂｉｔｓ［ｋ］を含める。さらに、出力部１８ｄは、高周波帯域符号化部１８ｐによって生成された符号化データ、及び、ステレオ符号化部１８によって生成された符号化データを対応のフレームに含める。

以下、オーディオ符号化装置１８の動作、及び、一実施形態に係るオーディオ符号化方法について説明する。図２１は、更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。

図２１に示すように、一実施形態においては、まず、ステップＳ１４−１と同様のステップＳ１８−１が行われる。次いで、ステップＳ１８−２において、ヘッダ生成部１８ｅが、上述したように、ＧＥＭ＿ＩＤを含むＡＭＲ−ＷＢ＋のヘッダを生成する。続くステップＳ１８−３では、出力部１８ｄが、生成されたヘッダをストリームの先頭において出力する。

次いで、ステップＳ１８−ｍにおいて、分析部１８ｍが、上述したように、入力端子Ｉｎ１に入力される符号化対象のフレームのオーディオ信号を低周波数帯域のオーディオ信号と高周波数帯域のオーディオ信号に分割する。また、ステップＳ１８−ｍにおいては、分析部１８ｍが、入力端子Ｉｎ１に入力されるオーディオ信号がモノラルのオーディオ信号である場合には、生成した低周波数帯域のオーディオ信号をスイッチＳＷ１へ出力し、高周波数帯域のオーディオ信号を高周波数帯域符号化部１８ｐへ出力する。一方、入力端子Ｉｎ１に入力されるオーディオ信号がステレオ信号である場合には、分析部１８ｍは、生成した低周波数帯域のオーディオ信号（ステレオ信号）をダウンミックス部１８ｎに出力する。

次いで、ステップＳ１８−ｒに示す判定により、入力端子Ｉｎ１に入力されるオーディオ信号がモノラル信号であると判断される場合には、ステップＳ１８−ｐにおいて高周波帯域符号化部１８ｐによる上述の処理が行われ、高周波帯域符号化部１８ｐによって生成された上述の符号化データが出力部１８ｄにより出力される。一方、入力端子Ｉｎ１に入力されるオーディオ信号がステレオ信号である場合には、ステップＳ１８−ｎにおいてダウンミックス部１８ｎによる上述の処理が行われ、続くステップＳ１８−ｑにおいてステレオ符号化部１８ｑによる上述の処理が行われ、ステレオ符号化部１８ｑによって生成された上述の符号化データが出力部１８ｄにより出力され、処理は、ステップＳ１８−ｐに進む。

次いで、ステップＳ１８−４において、選択部１８ｂが、ＧＥＭ＿ＩＤの値が「０」であるか否かを判定する。ＧＥＭ＿ＩＤの値が「０」でない場合、即ち、ＧＥＭ＿ＩＤの値が「１」である場合には、選択部１８ｂは、ＡＣＥＬＰ符号化部１８ａ_１を選択する。次いで、ステップＳ１８−５において、選択されたＡＣＥＬＰ符号化部１８ａ_１によりフレームのオーディオ信号（低周波帯域のオーディオ信号）が符号化される。続くステップＳ１８−６において、生成された符号系列を含むフレームが出力部１８ｄによって出力される。そして、ＧＥＭ＿ＩＤの値が「１」である場合には、ステップＳ１８−７における更に符号化すべきフレームがあるか否かの判定を経て、全てのフレームのオーディオ信号（低周波帯域のオーディオ信号）が、ＡＣＥＬＰ符号化部１８ａ_１により符号化されて、出力される。

ステップＳ１８−４に戻り、ＧＥＭ＿ＩＤの値が「０」である場合には、続くステップＳ１８−８において、符号化処理判定部１８ｆが、符号化対象のフレーム、即ち、スーパーフレームにおける各フレームのオーディオ信号（低周波帯域のオーディオ信号）をＡＣＥＬＰ符号化処理により符号化するか、ＴＣＸ符号化処理により符号化するかを判定する。

次いで、ステップＳ１８−９において、Ｍｏｄｅｂｉｔｓ生成部１８ｇが、符号化処理判定部１８ｆにおける判定結果に応じた値を有するＭｏｄｅｂｉｔｓ［ｋ］を生成する。

次いで、ステップＳ１８−１０において、ステップＳ１８−８の判定結果が符号化対象のフレームのオーディオ信号をＴＣＸ符号化処理により符号化すること、即ち、ＴＣＸ符号化部１８ａ_２により符号化することを示しているか否かの判定が行われる。

ステップＳ１８−８の判定結果が符号化対象のフレームのオーディオ信号をＴＣＸ符号化部１８ａ_２により符号化することを示している場合には、続くステップＳ１８−１１において、ＴＣＸ符号化部１８ａ_２により当該フレームのオーディオ信号（低周波帯域のオーディオ信号）が符号化される。一方、判定結果が符号化対象のフレームのオーディオ信号をＴＣＸ符号化部１８ａ_２により符号化することを示していない場合には、続くステップＳ１８−１２において、ＡＣＥＬＰ符号化部１８ａ_１により当該フレームのオーディオ信号（低周波帯域のオーディオ信号）が符号化される。なお、ステップＳ１８−１０〜ステップＳ１８−１２までの処理は、スーパーフレーム内の各フレームに対して行われる。

次いで、ステップＳ１８−１３において、出力部１８ｄが、ステップＳ１８−１１又はステップＳ１８−１２において生成された符号系列にＭｏｄｅｂｉｔｓ［ｋ］を付加する。そして、処理は、ステップＳ１８−６に進む。

以上説明したオーディオ符号化装置１８及びオーディオ符号化方法においても、「１」に設定したＧＥＭ＿ＩＤをヘッダに含めることにより、複数のフレームのオーディオ信号をＡＣＥＬＰ符号化部のみで符号化したことを復号側に通知することができる。したがって、よりサイズの小さいストリームが生成される。

以下、コンピュータをオーディオ符号化装置１８としで動作させるオーディオ符号化プログラムについて説明する。図２２は、更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。

図２２に示すオーディオ符号化プログラムＰ１８は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ符号化プログラムＰ１８は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

オーディオ符号化プログラムＰ１８は、ＡＣＥＬＰ符号化モジュールＭ１８ａ_１、ＴＣＸ符号化モジュールＭ１８ａ_２、選択モジュールＭ１８ｂ、生成モジュールＭ１８ｃ、出力モジュールＭ１８ｄ、ヘッダ生成モジュールＭ１８ｅ、符号化処理判定モジュールＭ１８ｆ、Ｍｏｄｅｂｉｔｓ生成モジュールＭ１８ｇ、分析モジュールＭ１８ｍ、ダウンミックスモジュールＭ１８ｎ、高周波帯域符号化モジュールＭ１８ｐ、及び、ステレオ符号化モジュールＭ１８ｑを備えている。

ＡＣＥＬＰ符号化モジュールＭ１８ａ_１、ＴＣＸ符号化モジュールＭ１８ａ_２、選択モジュールＭ１８ｂ、生成モジュールＭ１８ｃ、出力モジュールＭ１８ｄ、ヘッダ生成モジュールＭ１８ｅ、符号化処理判定モジュールＭ１８ｆ、Ｍｏｄｅｂｉｔｓ生成モジュールＭ１８ｇ、分析モジュールＭ１８ｍ、ダウンミックスモジュールＭ１８ｎ、高周波帯域符号化モジュールＭ１８ｐ、及び、ステレオ符号化モジュールＭ１８ｑは、ＡＣＥＬＰ符号化部１８ａ_１、ＴＣＸ符号化部１８ａ_２、選択部１８ｂ、生成部１８ｃ、出力部１８ｄ、ヘッダ生成部１８ｅ、符号化処理判定部１８ｆ、Ｍｏｄｅｂｉｔｓ生成部１８ｇ、分析部１８ｍ、ダウンミックス部１８ｎ、高周波帯域符号化部１８ｐ、ステレオ符号化部１８ｑとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、オーディオ符号化装置１８によって生成されたストリームを復号し得るオーディオ復号装置について説明する。図２３は、更に別の一実施形態に係るオーディオ復号装置を示す図である。図２３に示すオーディオ復号装置２０は、ＡＣＥＬＰ復号部２０ａ_１、及び、ＴＣＸ復号部２０ａ_２を備えている。ＡＣＥＬＰ復号部２０ａ_１は、ＡＣＥＬＰ復号処理によりフレーム内の符号系列を復号して、オーディオ信号（低周波帯域のオーディオ信号）を生成する。ＴＣＸ復号部２０ａ_２は、ＴＣＸ復号処理によりフレーム内の符号系列を復号して、オーディオ信号（低周波帯域のオーディオ信号）を生成する。オーディオ復号装置２０は、更に、抽出部２０ｂ、選択部２０ｃ、ヘッダ解析部２０ｄ、Ｍｏｄｅｂｉｔｓ抽出部２０ｅ、復号処理選択部２０ｆ、高周波帯域復号部２０ｐ、ステレオ復号部２０ｑ、及び、合成部２０ｍを備えている。

ヘッダ解析部２０ｄは、図２０に示すストリームを受け、当該ストリームからヘッダを分離する。ヘッダ解析部２０ｄは、分離したヘッダを抽出部２０ｂに提供する。また、ヘッダ解析部２０ｄは、ヘッダを分離したストリームにおける各フレームをスイッチＳＷ１、高周波帯域復号部２０ｐ、及び、ステレオ復号部２０ｑへ出力する。

抽出部２０ｂは、ヘッダからＧＥＭ＿ＩＤを抽出する。選択部２０ｃは、抽出されたＧＥＭ＿ＩＤの値が「１」の場合に、スイッチＳＷ１を制御して、複数のフレームをＡＣＥＬＰ復号部２０ａ_１に結合する。これにより、ＧＥＭ＿ＩＤの値が「１」である場合には、全てのフレームの符号系列がＡＣＥＬＰ復号部２０ａ_１によって復号される。

一方、ＧＥＭ＿ＩＤの値が「０」である場合には、選択部２０ｃは、スイッチＳＷ１を制御して、各フレームをＭｏｄｅｂｉｔｓ抽出部２０ｅに結合する。Ｍｏｄｅｂｉｔｓ抽出部２０ｅは、入力された各フレーム、即ちスーパーフレームにおける各フレーム用のＭｏｄｅｂｉｔｓ［ｋ］を抽出して、復号処理選択部２０ｆに提供する。

復号処理選択部２０ｆは、Ｍｏｄｅｂｉｔｓ［ｋ］の値に応じてスイッチＳＷ２を制御する。具体的に、復号処理選択部２０ｆは、Ｍｏｄｅｂｉｔｓ［ｋ］の値からＡＣＥＬＰ復号処理を選択すべきと判断する場合には、スイッチＳＷ２を制御して、復号対象のフレームをＡＣＥＬＰ復号部２０ａ_１に結合する。一方、復号処理選択部２０ｆは、Ｍｏｄｅｂｉｔｓ［ｋ］の値からＴＣＸ復号処理を選択すべきと判断する場合には、スイッチＳＷ２を制御して、復号対象のフレームをＴＣＸ復号部２０ａ_２に結合する。

高周波数帯域復号部２０ｐは、復号対象のフレームに含まれる符号化データを復号し、上述したパラメータを復元する。高周波数帯域復号部２０ｐは、復元したパラメータ、並びに、ＡＣＥＬＰ復号部２０ａ_１及び／又はＴＣＸ復号部２０ａ_２で復号された低周波数帯域のオーディオ信号を用いて、高周波数帯域のオーディオ信号を生成し、当該高周波帯域のオーディオ信号を合成部２０ｍに出力する。

ステレオ復号部２０ｑは、復号対象のフレームに含まれる符号化データを復号して、上述したパラメータ、バランスファクタ、及びサイド信号の波形を復元する。ステレオ復号部２０ｑは、復元したパラメータ、バランスファクタ、及びサイド信号の波形、並びに、ＡＣＥＬＰ復号部２０ａ_１及び／又はＴＣＸ復号部２０ａ_２で復号された低周波数帯域のモノラルのオーディオ信号を用いて、ステレオ信号を生成する。

合成部２０ｍは、ＡＣＥＬＰ復号部２０ａ_１及び／又はＴＣＸ復号部２０ａ_２で復元された低周波数帯域のオーディオ信号と、高周波数帯域復号部２０ｐで生成された高周波数帯域のオーディオ信号を合成して、復号オーディオ信号を生成する。また、ステレオ信号を処理の対象としている場合には、合成部２０ｍは、ステレオ復号部２０ｑからの入力信号（ステレオ信号）も用いて、ステレオオーディオ信号を生成する。

以下、オーディオ復号装置２０の動作と、一実施形態に係るオーディオ復号方法について説明する。図２４は、更に別の一実施形態に係るオーディオ復号方法のフローチャートである。

図２４に示すように、一実施形態においては、まず、ステップＳ２０−１において、ヘッダ解析部２０ｄが、ストリームからヘッダを分離する。

次いで、ステップＳ２０−２において、抽出部２０ｂが、ヘッダからＧＥＭ＿ＩＤを抽出する。続くステップＳ２０−３においては、選択部２０ｃが、ＧＥＭ＿ＩＤの値に応じてスイッチＳＷ１を制御する。

具体的に、ＧＥＭ＿ＩＤの値が「１」である場合には、選択部２０ｃは、スイッチＳＷ１を制御して、ストリームにおける複数のフレームの符号系列を復号する復号部として、ＡＣＥＬＰ復号部２０ａ_１を選択する。この場合には、続くステップＳ２０−４において、ＡＣＥＬＰ復号部２０ａ_１が、復号対象のフレームの符号系列を復号する。これにより、低周波帯域のオーディオ信号が復元される。

次いで、ステップＳ２０−ｐにおいて、高周波帯域復号部２０ｐが復号対象のフレームに含まれる符号化データからパラメータを復元する。また、ステップＳ２０−ｐにおいては、高周波帯域復号部２０ｐが、復元したパラメータ、及び、ＡＣＥＬＰ復号部２０ａ_１で復元された低周波数帯域のオーディオ信号を用いて、高周波数帯域のオーディオ信号を生成し、当該高周波帯域のオーディオ信号を合成部２０ｍに出力する。

次いで、ステップＳ２０−ｒにおける判定によりステレオ信号を処理の対象としていると判断される場合には、続くステップＳ２０−ｑにおいて、ステレオ復号部２０ｑが、復号対象のフレームに含まれる符号化データを復号して、上述したパラメータ、バランスファクタ、及びサイド信号の波形を復元する。また、ステップＳ２０−ｑにおいては、ステレオ復号部２０ｑが、復元したパラメータ、バランスファクタ、及びサイド信号の波形、並びに、ＡＣＥＬＰ復号部２０ａ_１で復元された低周波数帯域のモノラルのオーディオ信号を用いて、ステレオ信号を復元する。

次いで、ステップＳ２０−ｍにおいて、合成部２０ｍが、ＡＣＥＬＰ復号部２０ａ_１で復元された低周波数帯域のオーディオ信号と、高周波数帯域復号部２０ｐで生成された高周波数帯域のオーディオ信号を合成して、復号オーディオ信号を生成する。また、ステレオ信号を処理の対象としている場合には、合成部２０ｍが、ステレオ復号部２０ｑからの入力信号（ステレオ信号）も用いて、ステレオオーディオ信号を復元する。

そして、ステップＳ２０−５において復号していないフレームが存在しないと判定される場合には、処理は終了する。一方、復号していないフレームが存在する場合には、未処理のフレームを対象としてステップＳ２０−４からの処理が継続される。

ステップＳ２０−３に戻り、ＧＥＭ＿ＩＤの値が「０」である場合に、選択部２０ｃは、スイッチＳＷ１を制御して、ストリームの各フレームをＭｏｄｅｂｉｔｓ抽出部２０ｅに結合する。この場合には、続くステップＳ２０−６において、Ｍｏｄｅｂｉｔｓ抽出部２０ｅが、復号対象のスーパーフレームからＭｏｄｅｂｉｔｓ［ｋ］を抽出する。なお、Ｍｏｄｅｂｉｔｓ［ｋ］は、スーパーフレームから１度に抽出されてもよく、スーパーフレーム内の各フレームの復号時に順に抽出されてもよい。

次いで、ステップＳ２０−７において、復号処理選択部２０ｆが、ｋの値を「０」に設定する。続くステップＳ２０−８において、復号処理選択部２０ｆが、Ｍｏｄｅｂｉｔｓ［ｋ］の値が０より大きいか否かを判定する。Ｍｏｄｅｂｉｔｓ［ｋ］の値が０以下である場合には、続くステップＳ２０−９において、スーパーフレーム内の復号対象フレームの符号系列がＡＣＥＬＰ復号部２０ａ_１によって復号される。一方、Ｍｏｄｅｂｉｔｓ［ｋ］の値が０より大きい場合いは、スーパーフレーム内の復号対象フレームの符号系列がＴＣＸ復号部２０ａ_２によって復号される。

次いで、ステップＳ２０−１１において、復号処理選択部２０ｆが、ｋの値がｋ＋ａ（Ｍｏｄｅｂｉｔｓ［ｋ］）により更新される。ここで、Ｍｏｄｅｂｉｔｓ［ｋ］の値とａ（Ｍｏｄｅｂｉｔｓ［ｋ］）との関係は、図１７に示したｍｏｄ［ｋ］とａ（ｍｏｄ［ｋ］）と同様の関係を有し得る。

次いで、ステップＳ２０−１２において、復号処理選択部２０ｆは、ｋの値が４より小さいか否かの判定を行う。ｋの値が４より小さい場合には、スーパーフレーム内の後続のフレームを対象に、ステップＳ２０−８からの処理が継続される。一方、ｋの値が４以上である場合には、ステップＳ２０−ｐにおいて、高周波帯域復号部２０ｐが復号対象のフレームに含まれる符号化データからパラメータを復元する。また、ステップＳ２０−ｐにおいては、高周波帯域復号部２０ｐが、当該パラメータ、及び、復号部２０ａ_１又は復号部２０ａ_２で復元された低周波数帯域のオーディオ信号から高周波数帯域のオーディオ信号を生成し、当該高周波帯域のオーディオ信号を合成部２０ｍに出力する。

次いで、ステップＳ２０−ｒにおける判定によりステレオ信号を処理の対象としていると判断される場合には、続くステップＳ２０−ｑにおいて、ステレオ復号部２０ｑが、復号対象のフレームに含まれる符号化データを復号して、上述したパラメータ、バランスファクタ、及びサイド信号の波形を復元する。また、ステップＳ２０−ｑにおいては、ステレオ復号部２０ｑが、復元したパラメータ、バランスファクタ、及びサイド信号の波形、並びに、復号部２０ａ_１又は復号部２０ａ_２で復元された低周波数帯域のモノラルのオーディオ信号を用いて、ステレオ信号を復元する。

次いで、ステップＳ２０−ｍにおいて、合成部２０ｍが、復号部２０ａ_１又は復号部２０ａ_２で復元された低周波数帯域のオーディオ信号と、高周波数帯域復号部２０ｐで生成された高周波数帯域のオーディオ信号を合成して、復号オーディオ信号を生成する。また、ステレオ信号を処理の対象としている場合には、合成部２０ｍが、ステレオ復号部２０ｑからの入力信号（ステレオ信号）も用いて、ステレオオーディオ信号を復元する。そして、処理は、ステップＳ２０−１３に進む。

ステップＳ２０−１３においては、復号していないフレームがあるか否かの判定がなされる。復号していないフレームが存在しない場合には、処理は終了する。一方、復号していないフレームが存在する場合には、当該フレーム（スーパーフレーム）を対象として、ステップＳ２０−６からの処理が継続される。

以下、コンピュータをオーディオ復号装置２０として動作させ得るオーディオ復号プログラムについて、説明する。図２５は、更に別の一実施形態に係るオーディオ復号プログラムを示す図である。

図２５に示すオーディオ復号プログラムＰ２０は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ復号プログラムＰ２０は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

オーディオ復号プログラムＰ２０は、ＡＣＥＬＰ復号モジュールＭ２０ａ_１、ＴＣＸ復号モジュールＭ２０ａ_２、抽出モジュールＭ２０ｂ、選択モジュールＭ２０ｃ、ヘッダ解析モジュールＭ２０ｄ、Ｍｏｄｅｂｉｔｓ抽出モジュールＭ２０ｅ、復号処理選択モジュールＭ２０ｆ、高周波帯域復号モジュールＭ２０ｐ、ステレオ復号モジュールＭ２０ｑ、及び、合成モジュールＭ２０ｍを備えている。

ＡＣＥＬＰ復号モジュールＭ２０ａ_１、ＴＣＸ復号モジュールＭ２０ａ_２、抽出モジュールＭ２０ｂ、選択モジュールＭ２０ｃ、ヘッダ解析モジュールＭ２０ｄ、Ｍｏｄｅｂｉｔｓ抽出モジュールＭ２０ｅ、復号処理選択モジュールＭ２０ｆ、高周波帯域復号モジュールＭ２０ｐ、ステレオ復号モジュールＭ２０ｑ、合成モジュールＭ２０ｍは、ＡＣＥＬＰ復号部２０ａ_１、ＴＣＸ復号部２０ａ_２、抽出部２０ｂ、選択部２０ｃ、ヘッダ解析部２０ｄ、Ｍｏｄｅｂｉｔｓ抽出部２０ｅ、復号処理選択部２０ｆ、高周波帯域復号部２０ｐ、ステレオ復号部２０ｑ、合成部２０ｍとそれぞれ同様の機能をコンピュータに実行させる。

以下、更に別の実施形態のオーディオ符号化装置について説明する。図２６は、更に別の一実施形態に係るオーディオ符号化装置を示す図である。図２６に示すオーディオ符号化装置２２は、第１の複数のフレームのオーディオ信号の符号化に使用するオーディオ符号化処理と、後続の第２の複数のフレームのオーディオ信号の符号化に使用するオーディオ符号化処理とを切り替えることが可能である。

オーディオ符号化装置２２は、オーディオ符号化装置１０と同様に、符号化部１０ａ_１〜１０ａ_ｎを備えている。オーディオ符号化装置２２は、更に、生成部２２ｃ、選択部２２ｂ、出力部２２ｄ、及び、検査部２２ｅを備えている。

検査部２２ｅは、入力端子Ｉｎ２への入力を監視し、入力端子Ｉｎ２に入力される入力情報を受ける。入力情報は、複数のフレームの符号化に共通に使用するオーディオ符号化処理を特定する情報である。

選択部２２ｂは、入力情報に応じた符号化部を選択する。具体的に、選択部２２ｂは、スイッチＳＷを制御して、入力情報によって特定されるオーディオ符号化処理を実行する符号化部に入力端子Ｉｎ１に入力されるオーディオ信号を結合する。選択部２２ｂは、次に検査部２２ｅに入力情報が入力されるまでの間、単一の符号化部の選択を継続する。

生成部２２ｃは、検査部２２ｅによって入力情報が受信される度に、当該入力情報基づいて複数のフレームに共通の符号化処理が使用されたことを示す長期符号化処理情報を生成する。

出力部２２ｄは、生成部２２ｃによって長期符号化処理情報が生成されると、当該長期符号化処理情報を複数のフレームに対して付加する。図２７は、図２６に示すオーディオ符号化装置によって生成されるストリームを示す図である。図２７に示すように、長期符号化処理情報は、複数のフレームのうち先頭のフレームに付加される。図２７に示す例では、第１フレームから第ｌ−１フレームまでの複数のフレームが、共通の符号化処理によって符号化されており、第ｌフレームにおいて符号化処理が切り替わり、第ｌフレームから第ｍフレームまでの複数のフレームが、共通の符号化処理によって符号化されていることを示している。

以下、オーディオ符号化装置２２の動作と、一実施形態に係るオーディオ符号化方法について説明する。図２８は、更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。

図２８に示すように、一実施形態においては、ステップＳ２２−１において、検査部２２ｅが、入力情報の入力を監視する。入力情報が入力されると、ステップＳ２２−２において、選択部２２ｂが、入力情報に応じた符号化部を選択する。

次いで、ステップＳ２２−３において、選択部２２ｂが、入力情報に基づいて長期符号化処理情報を生成する。長期符号化処理情報は、ステップＳ２２−４において、出力部２２ｄにより、複数のフレームのうち先頭のフレームに付加され得る。

そして、ステップＳ２２−５において、符号化対象のフレームのオーディオ信号が、選択された符号化部によって符号化される。なお、次に入力情報が入力されるまでの間は、ステップＳ２２−２〜Ｓ２２−４の処理を経ずに、符号化対象のフレームのオーディオ信号が符号化される。

次いで、ステップＳ２２−６において、符号化された符号系列が、符号化対象のフレームに対応するビットストリーム内のフレームに含められて出力部２２ｄから出力される。

次いで、ステップＳ２２−７において、符号化していないフレームが存在するか否かが判定される。符号化していないフレームが存在しない場合には、処理が終了する。一方、符号化していないフレームが存在する場合には、ステップＳ２２−１からの処理が継続される。

以下、コンピュータをオーディオ符号化装置２２として動作させ得るオーディオ符号化プログラムについて説明する。図２９は、更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。

図２９に示すオーディオ符号化プログラムＰ２２は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ符号化プログラムＰ２２は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

図２９に示すように、オーディオ符号化プログラムＰ２２は、符号化モジュールＭ１０ａ_１〜１０ａ_ｎ、生成モジュールＭ２２ｃ、選択モジュールＭ２２ｂ、出力モジュールＭ２２ｄ、及び、検査モジュールＭ２２ｅを備えている。

符号化モジュールＭ１０ａ_１〜１０ａ_ｎ、生成モジュールＭ２２ｃ、選択モジュールＭ２２ｂ、出力モジュールＭ２２ｄ、検査モジュールＭ２２ｅは、符号化部１０ａ_１〜１０ａ_ｎ、生成部２２ｃ、選択部２２ｂ、出力部２２ｄ、検査部２２ｅとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、オーディオ符号化装置２２によって生成されたストリームを復号し得るオーディオ復号装置について説明する。図３０は、更に別の一実施形態に係るオーディオ復号装置を示す図である。

図３０に示すオーディオ復号装置２４は、オーディオ復号装置１２と同様に、復号部１２ａ_１〜１２ａ_ｎを備えている。オーディオ復号装置２４は、更に、抽出部２４ｂ、選択部２４ｃ、検査部２４ｄを備えている。

検査部２４ｄは、入力端子Ｉｎに入力されるストリーム内の各フレームに長期符号化処理情報が含まれているか否かを検査する。抽出部２４ｂは、検査部２４ｄによってフレームに長期符号化処理情報が含まれていると判断されると、当該フレームから長期符号化処理情報を抽出する。また、抽出部２４ｂは、長期符号化処理情報を取り除いた上で、フレームをスイッチＳＷに送出する。

選択部２４ｃは、抽出部２４ｂによって長期符号化処理情報が抽出されると、スイッチＳＷを制御して、当該長期符号化処理情報に基づいて特定される符号化処理に対応するオーディオ復号処理を実行する復号部を選択する。選択部２４ｃは、検査部２４ｄによって次に長期符号化処理情報が抽出されるまでの間、単一の復号部を継続して選択し、複数のフレームの符号系列を共通のオーディオ復号処理によって復号することを継続する。

以下、オーディオ復号装置２４の動作と、一実施形態にかかるオーディオ復号方法について説明する。図３１は、更に別の一実施形態に係るオーディオ復号方法のフローチャートである。

図３１に示すように、一実施形態においては、ステップＳ２４−１において、検査部２４ｄが、入力されるフレームに長期符号化処理情報が含まれているか否かを監視する。検査部２４ｄによって長期符号化処理情報が検出されると、続くステップＳ２４−２において、抽出部２４ｂが、フレームから長期符号化処理情報を抽出する。

次いで、ステップＳ２４−３において、選択部２４ｃが、抽出された長期符号化処理情報に基づいて適切な復号部を選択する。続くステップＳ２４−４において、選択された復号部が、復号対象のフレームの符号系列を復号する。

そして、ステップＳ２４−５において、復号していないフレームが存在するか否かの判定がなされる。復号していないフレームが存在しない場合には、処理が終了する。一方、復号していないフレームが存在する場合には、ステップＳ２４−１からの処理が継続される。

本実施形態では、ステップＳ２４−１においてフレームに長期符号化処理情報が付加されていないと判断されると、ステップＳ２４−２〜ステップＳ２４−３からの処理を経ずに、ステップＳ２４−４の処理が実行される。

以下、コンピュータをオーディオ復号装置２４として動作させ得るオーディオ復号プログラムについて説明する。図３２は、更に別の一実施形態に係るオーディオ復号プログラムを示す図である。

図３２に示すオーディオ復号プログラムＰ２４は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ復号プログラムＰ２４は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

図３２に示すように、オーディオ復号プログラムＰ２４は、復号モジュールＭ１２ａ_１〜１２ａ_ｎ、抽出モジュールＭ２４ｂ、選択モジュールＭ２４ｃ、及び、検査モジュールＭ２４ｄを備えている。

復号モジュールＭ１２ａ_１〜１２ａ_ｎ、抽出モジュールＭ２４ｂ、選択モジュールＭ２４ｃ、検査モジュールＭ２４ｄは、復号部１２ａ_１〜１２ａ_ｎ抽出部２４ｂ、選択部２４ｃ、検査部２４ｄとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、更に別の一実施形態に係るオーディオ符号化装置について説明する。図３３は、更に別の一実施形態に係るオーディオ符号化装置を示す図である。また、図３４は、従来のＭＰＥＧＵＳＡＣに従って生成されるストリームと図３３に示すオーディオ符号化装置によって生成されるストリームとを示す図である。

上述したオーディオ符号化装置１４では、全フレームのオーディオ信号を単一の共通のオーディオ符号化処理によって符号化するか、各フレームのオーディオ信号を個別のオーディオ符号化処理によって符号化することができるものであった。

一方、図３３に示すオーディオ符号化装置２６は、複数のフレームのうち一部の複数のフレームに対して共通のオーディオ符号化処理を使用することができる。また、オーディオ符号化装置２６は、全フレームのうちの一部のフレームに対して個別のオーディオ符号化処理を使用することも可能である。さらに、オーディオ符号化装置２６は、全フレームのうち中間のフレームからの複数のフレームに対して共通のオーディオ符号化処理を使用することができる。

図３３に示すように、オーディオ符号化装置２６は、オーディオ符号化装置１４と同様に、ＡＣＥＬＰ符号化部１４ａ_１、ＴＣＸ符号化部１４ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３、第１判定部１４ｆ、ｃｏｒｅ＿ｍｏｄｅ生成部１４ｇ、第２判定部１４ｈ、ｌｐｄ＿ｍｏｄｅ生成部１４ｉ、ＭＰＳ符号化部１４ｍ、及び、ＳＢＲ符号化部１４ｎを備えている。オーディオ符号化装置２６は、更に、検査部２６ｊ、選択部２６ｂ、生成部２６ｃ、出力部２６ｄ、及び、ヘッダ生成部２６ｅを備えている。以下、オーディオ符号化装置２６の要素のうち、オーディオ符号化装置１４と異なる要素について、説明する。

検査部２６ｊは、入力端子Ｉｎ２に入力情報が入力されているか否かを検査する。入力情報は、複数のフレームのオーディオ信号を共通のオーディオ符号化処理により符号化するか否かを示す情報である。

選択部２６ｂは、検査部２６ｊによって入力情報が検出されると、スイッチＳＷ１を制御する。具板的に、選択部２６ｂは、検出された入力情報が複数のフレームのオーディオ信号を共通のオーディオ符号化処理により符号化することを示している場合に、スイッチＳＷ１を制御して、スイッチＳＷ１とＡＣＥＬＰ符号化部１４ａ_１を結合する。一方、検出された入力情報が複数のフレームのオーディオ信号を共通のオーディオ符号化処理により符号化しないことを示している場合に、選択部２６ｂは、スイッチＳＷ１を制御して、スイッチＳＷ１を、第１判定部１４ｆ等を含むパスに結合する。

生成部２６ｃは、検査部２６ｊによって入力情報が検出されると、その時点の符号化対象フレームに対応する出力フレーム用のＧＥＭ＿ＩＤを生成する。具体的に、生成部２６ｃは、検出された入力情報が複数のフレームのオーディオ信号を共通のオーディオ符号化処理により符号化することを示している場合に、ＧＥＭ＿ＩＤの値を「１」に設定する。一方、検出された入力情報が複数のフレームのオーディオ信号を共通のオーディオ符号化処理により符号化しないことを示している場合に、生成部２６ｃは、ＧＥＭ＿ＩＤの値を「０」に設定する。

ヘッダ生成部２６ｅは、検査部２６ｊによって入力情報が検出されると、その時点の符号化対象フレームに対応する出力フレームのヘッダを生成して、当該ヘッダ内に生成部２６ｃによって生成されたＧＥＭ＿ＩＤを含める。

出力部２６ｄは、生成された符号系列を含む出力フレームを出力する。また、出力部２６ｄは、各出力フレームに、ＭＰＳ符号化部１４ｍによって生成されたパラメータの符号化データ及びＳＢＲ符号化部１４ｎによって生成されたパラメータの符号化データを含める。なお、出力フレームは、検査部２６ｊによって入力情報が検出されている場合には、ヘッダ生成部２６ｅによって生成されたヘッダを含むものである。

以下、オーディオ符号化装置２６の動作と、更に別の一実施形態に係るオーディオ符号化方法について説明する。図３５は、更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。

図３５に示すフローにおいては、ステップＳ１４−３〜４、ステップＳ１４−９〜１９、ステップＳ１４−ｍ〜ステップＳ１４−ｎの処理は、図１３に示したものと同様である。以下、図１３に示したフロート異なる処理について説明する。

図３５に示すように、一実施形態においては、ステップＳ２６−ａにおいて、ＧＥＭ＿ＩＤの値が初期化される。ＧＥＭ＿ＩＤの値は例えば「０」に初期化され得る。ステップＳ２６−１において、検査部２６ｊが上述したように入力情報を監視する。入力情報が入力されたことが検出されると、続くステップＳ２６−２において、生成部２６ｃが当該入力情報に応じたＧＥＭ＿ＩＤを生成し、続くステップＳ２６−３において、ヘッダ生成部２６ｅが、生成されたＧＥＭ＿ＩＤを含むヘッダを生成する。一方、入力情報がない場合には、ステップＳ２６−２及びＳ２６−３の処理を経ずに、処理はステップＳ１４−ｍに進む。

ステップＳ２６−４においては、ヘッダを付加するか否かの判断がなされる。検査部２６ｊによって入力情報が検出されると、その時点の符号化対象フレームに対応する出力フレームには、ステップＳ２６−５において、ＧＥＭ＿ＩＤを含むヘッダが付加されて、当該ヘッダを含むフレームが出力される。一方、入力情報が検出されていないときには、その時点での符号化対象フレームに対応する出力フレームは、ステップＳ２６−６において、そのまま出力される。

次いで、ステップＳ２６−７においては、符号化していないフレームが存在するか否かの判定がなされる。符号化していないフレームが存在しない場合には、処理が終了する。一方、符号化していないフレームが存在する場合には、符号化していないフレームを対象にステップＳ２６−１からの処理が継続される。

以上説明したオーディオ符号化装置２６及び一実施形態に係るオーディオ符号化方法によれば、複数のフレームを共通のオーディオ符号化処理により符号化し、その後、幾つかのフレームを個別のオーディオ符号化処理により符号化し、更に後続の複数のフレームを共通のオーディオ符号化処理により符号化することができる。

なお、オーディオ符号化装置２６では、入力情報に基づいて複数のフレームのオーディオ信号の符号化に使用するオーディオ符号化処理を決定しているが、本発明は、各フレームのオーディオ信号の解析結果に基づいて、複数のフレームに共通に使用するオーディオ符号化処理を決定してもよい。例えば、入力端子Ｉｎ１とスイッチＳＷ１との間に、各フレームのオーディオ信号を解析する解析部を含めて、この解析結果に基づいて、選択部２６ｂ及び生成部２６ｃ等を動作させてもよい。また、この解析には、上述した解析手法を使用し得る。

また、全フレームのオーディオ信号を、一旦、第１判定部１４ｆを含むパスへと結合し、符号系列を含む出力フレームを出力部２６ｄにおいて蓄積してもよい。この場合には、第１判定部１４ｆ及び第２判定部１４ｈの判定結果を用いて、ｌｐｄ＿ｍｏｄｅ、ｃｏｒｅ＿ｍｏｄｅ等の設定、ヘッダの生成、付加等を各フレームに対して事後的に調整することができる。

なお、所定数のフレームの解析、又は、所定数のフレームに対する第１判定部１４ｆ及び第２判定部による判定を行って、当該所定数のフレームの解析結果又は判定結果を用いて、当該所定数のフレームを含む複数のフレームに共通に利用する符号化処理を予測してもよい。

また、複数のフレームに共通の符号化処理を用いるか、又は、個別の符号化処理を用いるかは、ｃｏｒｅ＿ｍｏｄｅ、ｌｐｄ＿ｍｏｄｅ、及びヘッダ等を含む付加情報の量が少なくなるように、決定することができる。

以下、コンピュータをオーディオ符号化装置２６として動作させ得るオーディオ符号化プログラムについて説明する。図３６は、更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。

図３６に示すオーディオ符号化プログラムＰ２６は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ符号化プログラムＰ２６は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

図３６に示すように、オーディオ符号化プログラムＰ２６は、ＡＣＥＬＰ符号化モジュールＭ１４ａ_１、ＴＣＸ符号化モジュールＭ１４ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ符号化モジュールＭ１４ａ_３、第１判定モジュールＭ１４ｆ、ｃｏｒｅ＿ｍｏｄｅ生成モジュールＭ１４ｇ、第２判定モジュールＭ１４ｈ、ｌｐｄ＿ｍｏｄｅ生成モジュールＭ１４ｉ、ＭＰＳ符号化モジュールＭ１４ｍ、ＳＢＲ符号化モジュールＭ１４ｎ、検査モジュールＭ２６ｊ、選択モジュールＭ２６ｂ、生成モジュールＭ２６ｃ、出力モジュールＭ２６ｄ、及び、ヘッダ生成モジュールＭ２６ｅを備えている。

ＡＣＥＬＰ符号化モジュールＭ１４ａ_１、ＴＣＸ符号化モジュールＭ１４ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ符号化モジュールＭ１４ａ_３、第１判定モジュールＭ１４ｆ、ｃｏｒｅ＿ｍｏｄｅ生成モジュールＭ１４ｇ、第２判定モジュールＭ１４ｈ、ｌｐｄ＿ｍｏｄｅ生成モジュールＭ１４ｉ、ＭＰＳ符号化モジュールＭ１４ｍ、ＳＢＲ符号化モジュールＭ１４ｎ、検査モジュールＭ２６ｊ、選択モジュールＭ２６ｂ、生成モジュールＭ２６ｃ、出力モジュールＭ２６ｄ、ヘッダ生成モジュールＭ２６ｅは、ＡＣＥＬＰ符号化部１４ａ_１、ＴＣＸ符号化部１４ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ符号化部１４ａ_３、第１判定部１４ｆ、ｃｏｒｅ＿ｍｏｄｅ生成部１４ｇ、第２判定部１４ｈ、ｌｐｄ＿ｍｏｄｅ生成部１４ｉ、ＭＰＳ符号化部１４ｍ、ＳＢＲ符号化部１４ｎ、検査部２６ｊ、選択部２６ｂ、生成部２６ｃ、出力部２６ｄ、ヘッダ生成部２６ｅとそれぞれ同様の機能を、コンピュータＣ１０に実行させる。

以下、オーディオ符号化装置２６によって生成されたストリームを復号し得るオーディオ復号装置について説明する。図３７は、更に別の一実施形態に係るオーディオ復号装置を示す図である。

図３７に示すオーディオ復号装置２８は、オーディオ復号装置１６と同様に、ＡＣＥＬＰ復号部１６ａ_１、ＴＣＸ復号部１６ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３、ｃｏｒｅ＿ｍｏｄｅ抽出部１６ｅ、第１選択部１６ｆ、ｌｐｄ＿ｍｏｄｅ抽出部１６ｇ、第２選択部１６ｈ、ＭＰＳ復号部１６ｍ、及びＳＢＲ復号部１６ｎを備えている。オーディオ復号装置２８は、更に、ヘッダ検査部２８ｊ、ヘッダ解析部２８ｄ、抽出部２８ｂ、及び、選択部２８ｃを備えている。以下、オーディオ復号装置２８の要素のうち、オーディオ復号装置１６の要素と異なる要素について説明する。

ヘッダ検査部２８ｊは、入力端子Ｉｎに入力される各フレームにヘッダが存在するか否かを監視する。ヘッダ解析部２８ｄは、ヘッダ検査部２８ｊによってフレームにヘッダが存在することが検出されると、当該ヘッダを分離する。抽出部２８ｂは、抽出されたヘッダからＧＥＭ＿ＩＤを抽出する。

選択部２８ｃは、抽出されたＧＥＭ＿ＩＤに応じて、スイッチＳＷ１を制御する。具体的に、ＧＥＭ＿ＩＤの値が「１」である場合に、選択部２８ｃは、スイッチＳＷ１を制御して、次にＧＥＭ＿ＩＤが抽出されるまでの間、ヘッダ解析部２８ｄから送出されるフレームをＡＣＥＬＰ復号部１６ａ_１に結合させる。

一方、ＧＥＭ＿ＩＤの値が「０」である場合に、選択部２８ｃは、ヘッダ解析部２８ｄから送出されるフレームを、ｃｏｒｅ＿ｍｏｄｅ抽出部１６ｅに結合する。

以下、オーディオ復号装置２８の動作と更に別の一実施形態に係るオーディオ復号方法について説明する。図３８は、更に別の一実施形態に係るオーディオ復号方法のフローチャートである。

図３８における「Ｓ１６」を含む参照符号によって特定される処理は、図１６における対応の処理と同様の処理である。以下、図３８における処理のうち、図１６に示す処理と異なる処理について、説明する。

図３８に示すように、一実施形態においては、ステップＳ２８−１において、ヘッダ検査部２８ｊが入力されるフレームにヘッダが含まれるか否かを監視する。フレームにヘッダが含まれている場合には、続くステップＳ２８−２において、ヘッダ解析部２８ｄが当該フレームからヘッダを分離する。そして、ステップＳ２８−３において、抽出部２８ｂがヘッダからＧＥＭ＿ＩＤを抽出する。一方、フレームにヘッダが含まれていない場合には、ステップＳ２８−４において、直前に抽出されたＧＥＭ＿ＩＤがコピーされて、以降、コピーされたＧＥＭ＿ＩＤが利用される。

ステップＳ２８−５においては、復号していないフレームが存在するか否かの判定がなされる。復号していないフレームが存在しない場合には、処理が終了する。一方、復号していないフレームが存在する場合には、復号していないフレームを対象にして、ステップＳ２６−１からの処理が継続される。

また、ステップＳ２８−６においては、復号していないフレームが存在するか否かの判定がなされる。復号していないフレームが存在しない場合には、処理が終了する。一方、復号していないフレームが存在する場合には、復号していないフレームを対象にして、ステップＳ２６−１からの処理が継続される。

以下、コンピュータをオーディオ復号装置２８として動作させ得るオーディオ復号プログラムについて説明する。図３９は、更に別の一実施形態に係るオーディオ復号プログラムを示す図である。

図３９に示すオーディオ復号プログラムＰ２８は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ復号プログラムＰ２８は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

図３９に示すように、オーディオ復号プログラムＰ２８は、ＡＣＥＬＰ復号モジュールＭ１６ａ１、ＴＣＸ復号モジュールＭ１６ａ２、ＭｏｄｉｆｉｅｄＡＡＣ復号モジュールＭ１６ａ３、ｃｏｒｅ＿ｍｏｄｅ抽出モジュールＭ１６ｅ、第１選択モジュールＭ１６ｆ、ｌｐｄ＿ｍｏｄｅ抽出モジュールＭ１６ｇ、第２選択モジュールＭ１６ｈ、ＭＰＳ復号モジュールＭ１６ｍ、ＳＢＲ復号モジュールＭ１６ｎ、ヘッダ検査モジュールＭ２８ｊ、ヘッダ解析モジュールＭ２８ｄ、抽出モジュールＭ２８ｂ、及び、選択モジュールＭ２８ｃを備えている。

ＡＣＥＬＰ復号モジュールＭ１６ａ１、ＴＣＸ復号モジュールＭ１６ａ２、ＭｏｄｉｆｉｅｄＡＡＣ復号モジュールＭ１６ａ３、ｃｏｒｅ＿ｍｏｄｅ抽出モジュールＭ１６ｅ、第１選択モジュールＭ１６ｆ、ｌｐｄ＿ｍｏｄｅ抽出モジュールＭ１６ｇ、第２選択モジュールＭ１６ｈ、ＭＰＳ復号モジュールＭ１６ｍ、ＳＢＲ復号モジュールＭ１６ｎ、ヘッダ検査モジュールＭ２８ｊ、ヘッダ解析モジュールＭ２８ｄ、抽出モジュールＭ２８ｂ、選択モジュールＭ２８ｃは、ＡＣＥＬＰ復号部１６ａ_１、ＴＣＸ復号部１６ａ_２、ＭｏｄｉｆｉｅｄＡＡＣ復号部１６ａ_３、ｃｏｒｅ＿ｍｏｄｅ抽出部１６ｅ、第１選択部１６ｆ、ｌｐｄ＿ｍｏｄｅ抽出部１６ｇ、第２選択部１６ｈ、ＭＰＳ復号部１６ｍ、ＳＢＲ復号部１６ｎ、ヘッダ検査部２８ｊ、ヘッダ解析部２８ｄ、抽出部２８ｂ、選択部２８ｃとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、更に別の一実施形態に係るオーディオ符号化装置について説明する。図４０は、更に別の一実施形態に係るオーディオ符号化装置を示す図である。図４１は、図４０に示すオーディオ符号化装置によって生成されるストリームを示す図である。

図４０に示すオーディオ符号化装置３０は、出力部３０ｄを除いて、オーディオ符号化装置２２の対応の要素と同様の要素を有している。即ち、オーディオ符号化装置３０では、ＧＥＭ＿ＩＤが生成された場合に、出力フレームは長期符号化処理情報を含む第１フレームタイプの出力フレームとして出力部３０ｄから出力される。一方、長期符号化処理情報が生成されていない場合には、出力フレームは長期符号化処理情報を含まない第２フレームタイプの出力フレームとして出力部３０ｄから出力される。

図４２は、更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。以下、図４２を参照して、オーディオ符号化装置３０の動作と、更に別の一実施形態に係るオーディオ符号化方法について説明する。なお、図４２に示すフローは、ステップＳ３０−１及びステップＳ３０−２の処理以外は、図２８に示したフロート同様である。したがって、以下では、ステップＳ３０−１及びステップＳ３０−２について説明する。

ステップＳ３０−１では、入力情報がステップＳ２２−１で入力されていると、出力部３０ｄが、その時の符号化対象フレームに対応する出力フレームを、長期符号化処理情報を含み得る第１フレームタイプに設定する。一方、入力情報がステップＳ２２−１で入力されていない場合には、ステップＳ３０−２において、出力部３０ｄが、その時の符号化対象フレームに対応する出力フレームを、長期符号化処理情報を含まない第２フレームタイプに設定する。なお、一実施形態においては、オーディオ信号の最初のフレームが入力される際には、入力情報が入力され、当該最初のフレームに対応する出力フレームは第１フレームタイプに設定され得る。

このように、長期符号化処理情報の有無によりフレームタイプを変更することにより、長期符号化処理情報を復号側に通知することも可能である。

以下、コンピュータをオーディオ符号化装置３０として動作させ得るオーディオ符号化プログラムについて説明する。図４３は、更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。

図４３に示すオーディオ符号化プログラムＰ３０は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ符号化プログラムＰ３０は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

図４３に示すように、オーディオ符号化プログラムＰ３０は、符号化モジュールＭ１０ａ_１〜１０ａ_ｎ、生成モジュールＭ２２ｃ、選択モジュールＭ２２ｂ、出力モジュールＭ３０ｄ、及び、検査モジュールＭ２２ｅを備えている。

符号化モジュールＭ１０ａ_１〜１０ａ_ｎ、生成モジュールＭ２２ｃ、選択モジュールＭ２２ｂ、出力モジュールＭ３０ｄ、検査モジュールＭ２２ｅは、符号化部１０ａ_１〜１０ａ_ｎ、生成部２２ｃ、選択部２２ｂ、出力部３０ｄ、検査部２２ｅとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、オーディオ符号化装置３０によって生成されたストリームを復号し得るオーディオ復号装置について説明する。図４４は、更に別の一実施形態に係るオーディオ復号装置を示す図である。図４４に示すオーディオ復号装置３２は、抽出部３２ｂ及びフレームタイプ検査部３２ｄを除いて、オーディオ復号装置２４における対応の要素と同様の要素を有している。以下、抽出部３２ｂ及びフレームタイプ検査部３２ｄについて説明する。

フレームタイプ検査部３２ｄは、入力端子Ｉｎに入力されるストリームにおける各フレームのフレームタイプを検査する。具体的に、フレームタイプ検査部３２ｄは、復号対象のフレームが第１フレームタイプのフレームである場合には、当該フレームを抽出部３０ｂ及びスイッチＳＷ１に提供する。一方、フレームタイプ検査部３２ｄは、復号対象のフレームが第２フレームタイプのフレームである場合には、当該フレームをスイッチＳＷ１にのみ送出する。抽出部３２ｂは、フレームタイプ検査部３２ｄから受けたフレーム内から長期符号化処理情報を抽出して、当該長期符号化処理情報を選択部２４ｃに提供する。

図４５は、更に別の一実施形態に係るオーディオ復号方法のフローチャートである。以下、図４５を参照して、オーディオ復号装置３２の動作、及び、更に別の一実施形態に係るオーディオ復号方法について説明する。なお、図４５に示すフローにおいては、「Ｓ２４」を含む参照符号によって示される処理は、図３１に示した対応の処理と同様の処理である。以下、図３１に示した処理とは異なるステップＳ３０−１及びステップＳ３０−２について説明する。

ステップＳ３２−１では、フレームタイプ検査部３２ｄが、復号対象のフレームが第１のフレームタイプのフレームであるか否かを解析する。続くステップＳ３０−２において、復号対象のフレームが第１フレームタイプのフレームであると判定されると、ステップＳ２４−２において、抽出部３２ｂによって当該フレームから長期符号化処理情報が選択される。一方、ステップＳ３２−２の判定において、復号対象のフレームが第１フレームタイプのフレームでないと判定されると、処理はステップＳ２４−４に進む。即ち、一旦、ステップＳ２４−３において復号部が選択されると、次に第１フレームタイプのフレームが入力されるまでの間、共通の復号部が継続して使用される。

以下、コンピュータをオーディオ復号装置３２として動作させ得るオーディオ復号プログラムについて説明する。図４６は、更に別の一実施形態に係るオーディオ復号プログラムを示す図である。

図４６に示すオーディオ復号プログラムＰ３２は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ復号プログラムＰ３２は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

図４６に示すように、オーディオ復号プログラムＰ２４は、復号モジュールＭ１２ａ_１〜１２ａ_ｎ、抽出モジュールＭ３２ｂ、選択モジュールＭ２４ｃ、及び、フレームタイプ検査モジュールＭ３２ｄを備えている。

復号モジュールＭ１２ａ_１〜１２ａ_ｎ、抽出モジュールＭ３２ｂ、選択モジュールＭ２４ｃ、フレームタイプ検査モジュールＭ３２ｄは、復号部１２ａ_１〜１２ａ_ｎ抽出部３２ｂ、選択部２４ｃ、フレームタイプ検査部３２ｄとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、更に別の一実施形態のオーディオ符号化装置について説明する。図４７は、更に別の一実施形態に係るオーディオ符号化装置を示す図である。図４７に示すオーディオ符号化装置３４は、以下に説明する点において、オーディオ符号化装置１８と異なっている。即ち、オーディオ符号化装置３４は、入力される複数のフレームのうち、一部の連続する複数のフレームに対して共通のオーディオ符号化処理を使用し、別の一部のフレームに対して個別のオーディオ符号化処理を使用し得る。また、オーディオ符号化装置３４は、第１の複数のフレームに共通のオーディオ符号化処理を使用し、後続の一部のフレームに個別のオーディオ符号化処理を使用し、更に後続の第２の複数のフレームに共通のオーディオ符号化処理を使用し得る。図４８は、従来のＡＭＲ−ＷＢ＋に従って生成されるストリームと図４７に示すオーディオ符号化装置によって生成されるストリームとを示す図である。図４８に示すように、オーディオ符号化装置３４は、ＧＥＭ＿ＩＤを含む第１フレームタイプのフレーム、及び、ＧＥＭ＿ＩＤを含まない第２フレームタイプのフレームを出力し得る。

図４７に示すように、オーディオ符号化装置３４は、オーディオ符号化装置１８と同様に、ＡＣＥＬＰ符号化部１８ａ_１、ＴＣＸ符号化部１８ａ_２、符号化処理判定部１８ｆ、Ｍｏｄｅｂｉｔｓ生成部１８ｇ、分析部１８ｍ、ダウンミックス部１８ｎ、高周波帯域符号化部１８ｐ、及び、ステレオ符号化部１８ｑを備えている。オーディオ符号化装置３４は、更に、検査部３４ｅ、選択部３４ｂ、生成部３４ｃ、及び、出力部３４ｄを備えている。以下、オーディオ符号化装置３４の要素のうち、オーディオ符号化装置１８の要素と異なる要素について説明する。

検査部３４ｅは、入力端子Ｉｎ２への入力情報の入力を監視する。入力情報は、複数のフレームのオーディオ信号に共通の符号化処理を使用するか否かを示す情報である。選択部３４ｂは、検査部によって入力情報の入力が検出されると、入力情報が複数のフレームのオーディオ信号に共通の符号化処理を使用することを示しているか否かを判定する。入力情報が複数のフレームのオーディオ信号に共通の符号化処理を使用することを示している場合には、選択部３４ｂは、スイッチＳＷ１を制御して、スイッチＳＷ１をＡＣＥＬＰ符号化部１８ａ_１に結合する。この結合は、次に入力情報の入力が検出されるまで維持される。一方、入力情報が、入力情報が複数のフレームのオーディオ信号に共通の符号化処理を使用することを示していない、即ち、入力情報が符号化対象のフレームに個別の符号化処理を用いることを示している場合には、選択部３４ｂは、スイッチＳＷ１を、符号化処理判定部１８ｆ等を含むパスへと結合する。

生成部３４ｃは、検査部によって入力情報の入力が検出されると、入力情報に応じた値を有するＧＥＭ＿ＩＤを生成する。具板的に、入力情報が複数のフレームのオーディオ信号に共通の符号化処理を使用することを示している場合には、生成部３４ｃは、ＧＥＭ＿ＩＤの値を「１」に設定する。一方、入力情報が複数のフレームのオーディオ信号に共通の符号化処理を使用することを示していない場合には、生成部３４ｃは、ＧＥＭ＿ＩＤの値を「０」に設定する。

出力部３４ｄは、検査部３４ｅによって入力情報が検出された場合には、その時点の符号化対象フレームに対応する出力フレームを第１フレームタイプの出力フレームとし、当該出力フレームに、生成部３４ｃによって生成されたＧＥＭ＿ＩＤを含め、符号化対象フレームのオーディオ信号の符号系列を含める。出力部３４ｄは、ＧＥＭ＿ＩＤの値が０である場合には、出力フレームにＭｏｄｅｂｉｔｓ［ｋ］を含める。一方、検査部３４ｅによって入力情報が検出されていない場合には、その時点の符号化対象フレームに対応する出力フレームを第２フレームタイプの出力フレームとし、当該出力フレームに、符号化対象フレームのオーディオ信号の符号系列を含める。出力部３４ｄは、このように生成した出力フレームを出力する。

図４９は、更に別の一実施形態に係るオーディオ符号化方法のフローチャートである。以下、図４９を参照して、オーディオ符号化装置３４の動作と、更に別の一実施形態に係るオーディオ符号化方法について説明する。なお、図４９に示すフローにおいて、「Ｓ１８」を含む参照符号によって示す処理は、図２１における対応の処理と同様である。以下、図４９に示すフローにおける処理のうち、図２１における処理と異なる処理について、説明する。

図４９に示すように、一実施形態においては、ステップＳ３４−１において、検査部３４ｅが、入力端子Ｉｎ２への入力情報の入力を監視する。入力情報の入力が検出された場合には、続くステップＳ３４−２において、符号化対象のフレームに対応する出力フレームが第１フレームタイプの出力フレームとされる。一方、入力情報の入力が検出されていない場合には、続くステップＳ３４−３において、符号化対象のフレームに対応する出力フレームが第２フレームタイプの出力フレームとされる。

次いで、ステップＳ３４−４において、入力情報がフレーム毎に符号化処理を指定することを示しているか否かが判定される。即ち、入力情報が複数のフレームに共通の符号化処理を用いることを示しているか否かが判定される。入力情報が複数のフレームに共通の符号化処理を用いることを示している場合には、続くステップＳ３４−５において、ＧＥＭ＿ＩＤの値が「１」に設定される。一方、入力情報が複数のフレームに共通の符号化処理を用いることを示していない場合には、続くステップＳ３４−６において、ＧＥＭ＿ＩＤの値が「０」に設定される。

ステップＳ３４−７においては、ＧＥＭ＿ＩＤを付加するか否かが判定される。具体的に、入力情報の入力が検出された時の符号化対象フレームを処理している場合には、続くステップＳ３４−８において、ＧＥＭ＿ＩＤを付加し、符号系列を含めた第１フレームタイプの出力フレームが出力される。一方、入力情報の入力が検出されていない時の符号化対象フレームを処理している場合には、続くステップＳ３４−９において、符号系列を含めた第２フレームタイプの出力フレームが出力される。

次いで、ステップＳ３４−１０において、符号化していないフレームが存在するか否かが判定される。符号化していないフレームが存在しない場合には、処理が終了する。一方、符号化していないフレームが存在する場合には、当該フレームを対象にステップＳ３４−１からの処理が継続される。

以下、コンピュータをオーディオ符号化装置３４として動作させ得るオーディオ符号化プログラムについて説明する。図５０は、更に別の一実施形態に係るオーディオ符号化プログラムを示す図である。

図５０に示すオーディオ符号化プログラムＰ３４は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ符号化プログラムＰ３４は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

オーディオ符号化プログラムＰ３４は、ＡＣＥＬＰ符号化モジュールＭ１８ａ_１、ＴＣＸ符号化モジュールＭ１８ａ_２、選択モジュールＭ３４ｂ、生成モジュールＭ３４ｃ、出力モジュールＭ３４ｄ、符号化処理判定モジュールＭ１８ｆ、Ｍｏｄｅｂｉｔｓ生成モジュールＭ１８ｇ、分析モジュールＭ１８ｍ、ダウンミックスモジュールＭ１８ｎ、高周波帯域符号化モジュールＭ１８ｐ、及び、ステレオ符号化モジュールＭ１８ｑを備えている。

ＣＥＬＰ符号化モジュールＭ１８ａ_１、ＴＣＸ符号化モジュールＭ１８ａ_２、選択モジュールＭ３４ｂ、生成モジュールＭ３４ｃ、出力モジュールＭ３４ｄ、符号化処理判定モジュールＭ１８ｆ、Ｍｏｄｅｂｉｔｓ生成モジュールＭ１８ｇ、分析モジュールＭ１８ｍ、ダウンミックスモジュールＭ１８ｎ、高周波帯域符号化モジュールＭ１８ｐ、ステレオ符号化モジュールＭ１８ｑは、ＡＣＥＬＰ符号化部１８ａ_１、ＴＣＸ符号化部１８ａ_２、選択部３４ｂ、生成部３４ｃ、出力部３４ｄ、符号化処理判定部１８ｆ、Ｍｏｄｅｂｉｔｓ生成部１８ｇ、分析部１８ｍ、ダウンミックス部１８ｎ、高周波帯域符号化部１８ｐ、ステレオ符号化部１８ｑとそれぞれ同様の機能をコンピュータＣ１０に実行させる。

以下、オーディオ符号化装置３４によって生成されたストリームを復号し得るオーディオ復号装置について説明する。図５１は、更に別の一実施形態に係るオーディオ復号装置を示す図である。

図５１に示すオーディオ復号装置３６は、オーディオ復号装置２０と同様に、ＡＣＥＬＰ復号部２０ａ_１、ＴＣＸ復号部２０ａ_２、Ｍｏｄｅｂｉｔｓ抽出部２０ｅ、復号処理選択部２０ｆ、高周波帯域復号部２０ｐ、ステレオ復号部２０ｑ、及び、合成部２０ｍを備えている。オーディオ復号装置３６は、更に、フレームタイプ検査部３６ｄ、抽出部３６ｂ、及び、選択部３６ｃを備えている。以下、オーディオ復号装置３６の要素のうち、オーディオ復号装置２０の要素と異なる要素について説明する。

フレームタイプ検査部３６ｄは、入力端子Ｉｎに入力されるストリーム内の各フレームのフレームタイプを検査する。フレームタイプ検査部３６ｄは、第１フレームタイプのフレームを、抽出部３６ｂ、スイッチＳＷ１、高周波帯域復号部２０ｐ、及び、ステレオ復号部２０ｑに送出する。一方、フレームタイプ検査部３６ｄは、第２フレームタイプのフレームを、スイッチＳＷ１、高周波帯域復号部２０ｐ、及び、ステレオ復号部２０ｑのみに送出する。

抽出部３６ｂは、フレームタイプ検査部３６ｄから受けたフレームからＧＥＭ＿ＩＤを抽出する。選択部３６ｃは、抽出されたＧＥＭ＿ＩＤの値に応じてスイッチＳＷ１を制御する。具体的には、ＧＥＭ＿ＩＤの値が「１」である場合には、選択部３６ｃは、スイッチＳＷ１を制御して、復号対象のフレームをＡＣＥＬＰ復号部２０ａ_１に結合する。ＧＥＭ＿ＩＤの値が「１」である場合には、次に第１フレームタイプのフレームが入力されるまでの間、ＡＣＥＬＰ復号部２０ａ_１が継続して選択される。一方、ＧＥＭ＿ＩＤの値が「０」である場合には、選択部３６ｃは、スイッチＳＷ１を制御して、復号対象のフレームをＭｏｄｅｂｉｔｓ抽出部２０ｅに結合する。

図５２は、更に別の一実施形態に係るオーディオ復号方法のフローチャートである。以下、図５２を参照して、オーディオ復号装置３６の動作と、更に別の一実施形態に係るオーディオ復号方法について説明する。なお、図５２に示すフローにおける処理のうち、「Ｓ２０」を含む処理は、図２４に示した対応の処理と同様の処理である。以下、図５２に示すフローにおける処理のうち、図２４に示した処理と異なる処理について説明する。

図５２に示すように、一実施形態においては、ステップＳ３６−１において、フレームタイプ検査部３６ｄが、復号対象のフレームが第１フレームタイプのフレームか否かを判定する。復号対象のフレームが第１フレームタイプのフレームである場合には、続くステップＳ３６−２において、抽出部３６ｂが、ＧＥＭ＿ＩＤを抽出する。一方、復号対象のフレームが第２フレームタイプのフレームである場合には、続くステップＳ３６−３において、既存のＧＥＭ＿ＩＤがコピーされ、当該ＧＥＭ＿ＩＤが以降の処理に利用される。

ステップＳ３６−４においては、復号していないフレームが存在するか否かが判定される。復号していないフレームが存在しない場合には、処理が終了する。一方、復号していないフレームが存在する場合には、当該フレームを対象に、ステップＳ３６−１からの処理が継続される。

以下、コンピュータをオーディオ復号装置３６として動作させ得るオーディオ復号プログラムについて説明する。図５３は、更に別の一実施形態に係るオーディオ復号プログラムを示す図である。

図５３に示すオーディオ復号プログラムＰ３６は、図５及び図６に示したコンピュータにおいて使用され得るものである。また、オーディオ復号プログラムＰ３６は、オーディオ符号化プログラムＰ１０と同様に提供され得る。

オーディオ復号プログラムＰ３６は、ＡＣＥＬＰ復号モジュールＭ２０ａ_１、ＴＣＸ復号モジュールＭ２０ａ_２、抽出モジュールＭ３６ｂ、選択モジュールＭ３６ｃ、フレームタイプ検査モジュールＭ３６ｄ、Ｍｏｄｅｂｉｔｓ抽出モジュールＭ２０ｅ、復号処理選択モジュールＭ２０ｆ、高周波帯域復号モジュールＭ２０ｐ、ステレオ復号モジュールＭ２０ｑ、及び、合成モジュールＭ２０ｍを備えている。

ＡＣＥＬＰ復号モジュールＭ２０ａ_１、ＴＣＸ復号モジュールＭ２０ａ_２、抽出モジュールＭ３６ｂ、選択モジュールＭ３６ｃ、フレームタイプ検査モジュールＭ３６ｄ、Ｍｏｄｅｂｉｔｓ抽出モジュールＭ２０ｅ、復号処理選択モジュールＭ２０ｆ、高周波帯域復号モジュールＭ２０ｐ、ステレオ復号モジュールＭ２０ｑ、合成モジュールＭ２０ｍは、ＡＣＥＬＰ復号部２０ａ_１、ＴＣＸ復号部２０ａ_２、抽出部３６ｂ、選択部３６ｃ、フレームタイプ検査部３６ｄ、Ｍｏｄｅｂｉｔｓ抽出部２０ｅ、復号処理選択部２０ｆ、高周波帯域復号部２０ｐ、ステレオ復号部２０ｑ、合成部２０ｍとそれぞれ同様の機能をコンピュータに実行させる。

以上、本発明の種々の実施形態について説明した。本発明は上述した実施形態に限定されることなく種々の変形が可能である。例えば、上述した一部の実施形態では、ＡＣＥＬＰ符号化処理及びＡＣＥＬＰ復号処理が、複数のフレームに共通に使用される符号化処理及び復号処理としてそれぞれ選択されている。しかしながら、共通に使用される符号化処理及び復号処理は、ＡＣＥＬＰ符号化処理及び復号処理に限定されず、任意のオーディオ符号化処理及びオーディオ復号処理であってもよい。また、上述したＧＥＭ＿ＩＤは、任意のビットサイズ及び値に設定されるＧＥＭ＿ＩＤであってもよい。

１０，１０Ａ…オーディオ符号化装置，１０ａ_１〜１０ａ_ｎ…符号化部、１０ｂ…選択部、１０ｃ…生成部、１０ｄ…出力部、１０ｅ…解析部、１２…オーディオ復号装置、１２ａ_１〜１２ａ_ｎ…復号部、１２ｂ…抽出部、１２ｃ…選択部、１４…オーディオ符号化装置、１４ａ_１…ＡＣＥＬＰ符号化部、１４ａ_２…ＴＣＸ符号化部、１４ａ_３…ＭｏｄｉｆｉｅｄＡＡＣ符号化部、１４ｂ…選択部、１４ｃ…生成部、１４ｄ…出力部、１４ｅ…ヘッダ生成部、１４ｆ…第１判定部、１４ｇ…ｃｏｒｅ＿ｍｏｄｅ生成部、１４ｈ…第２判定部、１４…ｌｐｄ＿ｍｏｄｅ生成部、１６…オーディオ復号装置、１６ａ_１…ＡＣＥＬＰ復号部、１６ａ_２…ＴＣＸ復号部、１６ａ_３…ＭｏｄｉｆｉｅｄＡＡＣ復号部、１６ｂ…抽出部、１６ｃ…選択部、１６ｄ…ヘッダ解析部、１６ｅ…ｃｏｒｅ＿ｍｏｄｅ抽出部、１６ｆ…第１選択部、１６ｇ…ｌｐｄ＿ｍｏｄｅ抽出部、１６ｈ…第２選択部、１８…オーディオ符号化装置、１８ｂ…選択部、１８ｃ…生成部、１８ｄ…出力部、１８ｅ…ヘッダ生成部、１８ｆ…符号化処理判定部、１８ｇ…生成部、２０…オーディオ復号装置、２０ｂ…抽出部、２０ｃ…選択部、２０ｄ…ヘッダ解析部、２０ｅ…Ｍｏｄｅｂｉｔｓ抽出部、２０ｆ…復号処理選択部、２２…オーディオ符号化装置、２２ｂ…選択部、２２ｃ…生成部、２２ｄ…出力部、２２ｅ…検査部、２４…オーディオ復号装置、２４ｂ…抽出部、２４ｃ…選択部、２４ｄ…検査部、２６…オーディオ符号化装置、２６ｂ…選択部、２６ｃ…生成部、２６ｄ…出力部、２６ｅ…ヘッダ生成部、２６ｊ…検査部、２８…オーディオ復号装置、２８ｂ…抽出部、２８ｃ…選択部、２８ｄ…ヘッダ解析部、２８ｊ…ヘッダ検査部、３０…オーディオ符号化装置、３０ｂ…抽出部、３０ｄ…出力部、３２…オーディオ復号装置、３２ｂ…抽出部、３２ｄ…フレームタイプ検査部、３４…オーディオ符号化装置、３４ｂ…選択部、３４ｃ…生成部、３４ｄ…出力部、３４ｅ…検査部、３６…オーディオ復号装置、３６ｂ…抽出部、３６ｃ…選択部。

Claims

互いに異なるオーディオ復号処理を実行して符号系列からオーディオ信号を生成する複数の復号部と、
各々がオーディオ信号の符号系列を含む複数のフレーム及び／又は各々が複数のフレームを含む複数のスーパーフレームを有するストリームから、該複数のフレームに対して単一の長期符号化処理情報であり該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報、又は、該複数のスーパーフレームに対して単一の長期符号化処理情報であり該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報を抽出する抽出部と、
前記長期符号化処理情報が抽出されたことに応じて、前記複数の復号部のうち、前記複数のフレームの符号系列の復号に共通に使用する復号部を選択し、又は、前記複数の復号部のうち、前記複数のスーパーフレームの符号系列の復号に共通に使用する一組の復号部を選択する選択部と、
を備える、オーディオ復号装置。
前記ストリームにおいて、少なくとも前記複数のフレームのうち先頭のフレームより後のフレームには、当該後のフレームの符号系列の生成に使用されたオーディオ符号化処理を特定するための情報が含まれていない、請求項１に記載のオーディオ復号装置。
前記選択部は、前記抽出部によって前記長期符号化処理情報が抽出されたことに応じて、前記複数の復号部のうち所定の復号部を選択し、
前記ストリームには、前記複数のフレームの符号系列の生成に使用されたオーディオ符号化処理を特定するための情報が含まれていない、請求項２に記載のオーディオ復号装置。
前記長期符号化処理情報は、１ビットの情報である、請求項３に記載のオーディオ復号装置。
互いに異なるオーディオ符号化処理を実行してオーディオ信号から符号系列を生成する複数の符号化部と、
前記複数の符号化部のうち、複数のフレームのオーディオ信号の符号化に共通に使用する符号化部を選択し、又は、各々が複数のフレームを含む複数のスーパーフレームのオーディオ信号の符号化に共通に使用する一組の符号化部を選択する選択部と、
前記複数のフレームに対して単一の長期符号化処理情報であり該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報、又は、前記複数のスーパーフレームに対して単一の長期符号化処理情報であり該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報を生成する生成部と、
前記選択部によって選択された前記符号化部によって生成された前記複数のフレームの符号系列、又は、前記選択部によって選択された前記一組の符号化部によって生成された前記複数のスーパーフレームの符号系列と、前記長期符号化処理情報と、を含むストリームを出力する出力部と、
を備えるオーディオ符号化装置。
前記ストリームには、少なくとも前記複数のフレームのうち先頭のフレームより後のフレームには、当該後のフレームの符号系列の生成に使用されたオーディオ符号化処理を特定するための情報が含まれていない、請求項５に記載のオーディオ符号化装置。
前記選択部は、前記複数の符号化部のうち所定の符号化部を選択し、
前記ストリームには、前記複数のフレームの符号系列の生成に使用されたオーディオ符号化処理を特定するための情報が含まれていない、請求項６に記載のオーディオ符号化装置。
前記長期符号化処理情報は、１ビットの情報である、請求項７に記載のオーディオ符号化装置。
各々がオーディオ信号の符号系列を含む複数のフレーム及び／又は各々が複数のフレームを含む複数のスーパーフレームを有するストリームから、該複数のフレームに対して単一の長期符号化処理情報であり該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報、又は、該複数のスーパーフレームに対して単一の長期符号化処理情報であり該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報を抽出するステップと、
前記長期符号化処理情報が抽出されたことに応じて、互いに異なる複数のオーディオ復号処理のうち、前記複数のフレームの符号系列の復号に共通に使用するオーディオ復号処理を選択し、又は、該複数のオーディオ復号処理のうち、前記複数のスーパーフレームの符号系列の復号に共通に使用する一組のオーディオ復号処理を選択するステップと、
選択された前記オーディオ復号処理を使用して前記複数フレームの符号系列を復号し、又は、選択された前記一組のオーディオ復号処理を使用して前記複数のスーパーフレームの符号系列を復号するステップと、
を含む、オーディオ復号方法。
互いに異なる複数のオーディオ符号化処理のうち、複数のフレームのオーディオ信号の符号化に共通に使用するオーディオ符号化処理を選択し、又は、該複数のオーディオ符号化処理のうち、各々が複数のフレームを含む複数のスーパーフレームのオーディオ信号の符号化に共通に使用する一組のオーディオ符号化処理を選択するステップと、
選択された前記オーディオ符号化処理を使用して前記複数のフレームのオーディオ信号を符号化して該複数のフレームの符号系列を生成し、又は、選択された前記一組のオーディオ符号化処理を使用して前記複数のスーパーフレームのオーディオ信号を符号化して該複数のスーパーフレームの符号系列を生成するステップと、
前記複数のフレームに対して単一の長期符号化処理情報であり該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報、又は、前記複数のスーパーフレームに対して単一の長期符号化処理情報であり該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報を生成するステップと、
前記複数のフレームの符号系列、又は、前記複数のスーパーフレームの符号系列と、前記長期符号化処理情報と、を含むストリームを出力するステップと、
を含む、オーディオ符号化方法。
コンピュータを、
互いに異なるオーディオ復号処理を実行して符号系列からオーディオ信号を生成する複数の復号部と、
各々がオーディオ信号の符号系列を含む複数のフレーム及び／又は各々が複数のフレームを含む複数のスーパーフレームを有するストリームから、該複数のフレームに対して単一の長期符号化処理情報であり該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報、又は、該複数のスーパーフレームに対して単一の長期符号化処理情報であり該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報を抽出する抽出部と、
前記長期符号化処理情報が抽出されたことに応じて、前記複数の復号部のうち、前記複数のフレームの符号系列の復号に共通に使用する復号部を選択し、又は、前記複数の復号部のうち、前記複数のスーパーフレームの符号系列の復号に共通に使用する一組の復号部を選択する選択部と、
として機能させるプログラム。
コンピュータを、
互いに異なるオーディオ符号化処理を実行してオーディオ信号から符号系列を生成する複数の符号化部と、
前記複数の符号化部のうち、複数のフレームのオーディオ信号の符号化に共通に使用する符号化部を選択し、又は、各々が複数のフレームを含む複数のスーパーフレームのオーディオ信号の符号化に共通に使用する一組の符号化部を選択する選択部と、
前記複数のフレームに対して単一の長期符号化処理情報であり該複数のフレームの符号系列の生成に共通のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報、又は、前記複数のスーパーフレームに対して単一の長期符号化処理情報であり該複数のスーパーフレームの符号系列の生成に共通の一組のオーディオ符号化処理が使用されたことを示す該長期符号化処理情報を生成する生成部と、
前記選択部によって選択された前記符号化部によって生成された前記複数のフレームの符号系列、又は、前記選択部によって選択された前記一組の符号化部によって生成された前記複数のスーパーフレームの符号系列と、前記長期符号化処理情報と、を含むストリームを出力する出力部と、
として機能させるプログラム。