明 細 書
オーディオ信号符号化方法及び複号化方法
技術分野
[0001] 本発明は、オーディオ信号の符号化方法及び復号化方法に関するものである。
背景技術
[0002] 従来のオーディオ信号符号化方法及び復号化方法としては、公知なものとして IS O/IECの国際標準方式、通称 MPEG (Moving Picture Experts Group)方 式などが挙げられる。現在、幅広い応用を持ち、低ビットレート時でも高音質な符号 化方式として、 ISO/IEC14496— 3、通称 MPEG— 4 GA (General Audio C oding) (非特許文献 1参照)などがあげられる。本方式の拡張規格も複数規格化が 現在なされている。
[0003] その一つとして、符号化及び復号化における遅延を小さくする低遅延技術がある。
例ぇば、130/1£じ国際標準規格でぁる^1?£0— 4 Audio (ISO/IEC 14496 —3)において定められた Low Delay AAC (Advanced Audio Coding)方式 力 る。また、別の例としては、特許文献 1及び非特許文献 2に記載の技術がある。
[0004] 以下では、非特許文献 2に記載された従来のオーディオ信号符号化方法及び復号 化方法について説明する。
[0005] 図 1は、従来のオーディオ信号符号化装置の構成図である。同図のオーディオ信 号符号化装置 100は、特に、処理に力、かる遅延を小さくすることを特徴とする装置で ある。オーディオ信号符号化装置 100は、聴覚的冗長性除去部 101と、情報量的冗 長性除去部 102とを備える。
[0006] 聴覚的冗長性除去部 101は、入力されたオーディオ信号から、聴覚的な冗長性を 除去する。すなわち、人が有する聴覚の特性に基づいてオーディオ信号から人が知 覚しない成分を除去する。聴覚的冗長性除去部 101は、聴覚モデル 103と、プレフィ ルタ部 104と、量子化部 105とを備える。
[0007] 聴覚モデル 103は、符号化されたオーディオ信号の音質劣化を決定する重要な要 素であり、継時マスキングや同時マスキングなど当業者には公知な技術を用いて、人
に知覚されない周波数成分の音及びそのレベルを選別する。その結果、人に知覚さ れる周波数成分の音が各周波数帯域においてどのレベルであるの力、を入力された オーディオ信号に対して適応的に算出する。聴覚モデル 103は、算出した結果に基 づレ、てプレフィルタ部 104力 、かなるフィルタを用レ、るかを示す情報をプレフィルタ部 104に出力する。同時に、この情報をオーディオ信号符号化装置の出力信号である オーディオ信号の符号化列に含めて出力する。聴覚モデル 103は、例えば、 MPEG - 1 Layer III (通称 MP3)の規格書に記載のある聴覚モデルである。入力される デジタルオーディオ信号列は、まず聴覚モデル 103に入力される。
[0008] プレフィルタ部 104は、聴覚モデル 103から入力されるいかなるフィルタを用いるか を示す情報、具体的には、人に知覚される周波数成分の音が各帯域においてどのレ ベルである力、を示す値を基に、入力されたデジタルオーディオ信号列から人に知覚 されないレベルの成分の音をフィルタによって除去する。これにより、プレフィルタ部 1 04は、人が知覚しない成分を除去したオーディオ信号列を出力する。プレフィルタ部 104は、非特許文献 2にあるように、複数の線形予測フィルタで構成する。
[0009] 量子化部 105は、プレフィルタ部 104から入力されるオーディオ信号列に対して、 整数値以下の値を四捨五入することで量子化を行レ、、整数値のオーディオ信号列を 出力する。
[0010] 以上のように、聴覚的冗長性除去部 101は、入力されるオーディオ信号列に対して
、人が知覚しない成分を除去し、整数値に量子化したオーディオ信号列を出力する
[0011] 情報量的冗長性除去部 102は、聴覚的冗長性除去部 101から入力されるオーディ ォ信号列から、情報量的な冗長性を除去することによって、符号化効率を高める。情 報量的冗長性除去部 102は、ロスレス符号化部 106を備える。
[0012] ロスレス符号化部 106は、従来から提案されており、当業者には公知の技術である ハフマン符号化などの手法で構成される。ロスレス符号化部 106へ入力されるォー ディォ信号列は、前段の量子化部 105によって、整数値化されている。このため、ハ フマン符号化などのロスレス符号化部 106は、その整数値化された値に対して、情報 量的な冗長性を取り除くことによって符号化効率が高まることになる。
[0013] 以上の構成により、従来のオーディオ信号符号化装置 100は、プレフィルタ部 104 で!/、かなるプレフィルタが使用された力、、具体的には、どのような線形予測係数で構 成されたのかを示す情報と、ロスレス符号化部 106で符号化されたオーディオ信号 列 (情報)との両方を符号化列として出力する。
[0014] 続!/、て、従来のオーディオ信号復号化装置につ!/、て説明する。
[0015] 図 2は、従来のオーディオ信号復号化装置の構成図である。同図のオーディオ信 号復号化装置 200は、符号化されたオーディオ信号を復号化する。オーディオ信号 復号化装置 200は、ロスレス復号化部 201と、ポストフィルタ部 202とを備える。
[0016] ロスレス復号化部 201は、ロスレス符号化部 106が出力する符号化列に対してロス レス復号によりオーディオ信号列を復号化する。
[0017] ポストフィルタ部 202では、復号化された線形予測係数列から、ポストフィルタ(プレ フィルタ部 104で用いられたフィルタの逆フィルタ)を構成する。ロスレス復号化部 20 1でロスレス復号されたオーディオ信号列に対してポストフィルタを施すことで得られ た結果であるオーディオ信号列を最終的に出力する。
[0018] 以上のように図 1及び図 2に示すオーディオ信号符号化装置及びオーディオ信号 復号化装置を用いることで、 AAC等の符号化及び復号化方法を用いるよりも遅延が 小さくなる。これは、 AAC等の方式が有する 1フレームが 1024サンプルなどの一括 直交変換部分に要する遅延がなくなり、対して、プレフィルタやポストフィルタの消費 する遅延が小さいことから、結果的に低遅延化することが可能になるためである。 特許文献 1: WO2005/078705号公報
非特許文献 1: ISO/IEC 14496 - 3: 2005"General Audio Coding"
非特許文献 2 :学会論文" Perceptual Audio Coding Using Adaptive Pre— and Post— Filters and Lossless し ompression" (IEEE Transaction on Speech and Audio Processing, vol. 10, No. 6 , September 2002) 発明の開示
発明が解決しょうとする課題
[0019] しかしながら、上記従来のオーディオ信号符号化方法及び復号化方法では、以下 の課題がある。
[0020] 例えば、 MPEG規格である Low Delay AACなどでは、 AAC方式を用いた技術 としては低遅延である力 それでも遅延は 60ms程度であり、さらなる改良を加えたも のでも 40ms程度である。双方向のコミュニケーションで使用する際には、遅延が十 分に小さレ、とは言えな!/、と!/、う課題があった。
[0021] 一方、非特許文献 2に記載の技術では、遅延は 10数 ms程度に抑えられるが、低レ ート化が難しいという課題がある。さらに、入力されるオーディオ信号に対して、量子 化部 105が量子化する処理は、フレーム毎に処理される。このため、時間的に大きな 変動を有するオーディオ信号列が入力された場合、量子化部 105による量子化ノィ ズ (符号化にともなう音質劣化)が適切に制御できないという課題がある。また、十分 な符号化効率をロスレス符号化部 106で確保できないという課題がある。
[0022] そこで、本発明は、上記課題を解決するためになされたものであり、低遅延を実現 すること力 Sできるだけでなく、さらに、符号化効率を高め、かつ、符号化に伴う音質の 劣化を削減することができるオーディオ信号符号化方法及び復号化方法を提供する ことを目白勺とする。
課題を解決するための手段
[0023] 上記課題を解決するため、本発明のオーディオ信号符号化方法は、オーディオ信 号を符号化するオーディオ信号符号化方法であって、前記オーディオ信号を複数の サンプル毎に分割したフレームに含まれるオーディオ信号に基づいて、前記フレー ムを 2以上に分割したサブフレーム毎に符号化すべきか否かを前記フレーム毎に判 断する判断ステップと、前記サブフレーム毎に符号化すべきでないと判断された場合 に、前記フレーム毎に、該フレームのオーディオ信号の特性を示す第 1の値を決定し 、決定された前記第 1の値を用いて前記オーディオ信号を符号化するフレーム処理 ステップと、前記サブフレーム毎に符号化すべきと判断された場合に、前記サブフレ ーム毎に、該サブフレームのオーディオ信号の特性を示す第 2の値を決定し、決定さ れた前記第 2の を用いて前記オーディオ信号を符号化するサブフレーム処理ステ ップとを含み、前記サブフレーム処理ステップでは、前記サブフレーム毎に決定され た前記第 2の値が全て同じであるか否かを判定し、前記第 2の値が全て同じである場 合、例外処理として前記第 2の値の少なくとも 1つは異なる値とすることで、前記ォー
ディォ信号を符号化する。
[0024] これにより、低遅延を実現することができるだけでなぐさらに、符号化効率を高め、 かつ、符号化に伴う音質の劣化を削減することができる。さらに、例外的な処理を実 行させる機能を有しており、符号化の無駄を活用することができる。ここで、符号化の 無駄とは、サブフレーム毎に分割して得られた符号化データと、フレーム毎に分割し て得られた符号化データとが同一の意味を示していることをいう。サブフレーム毎に 分割して得られた符号化データは、フレーム毎に分割して得られた符号化データより ビット数カ 、通常、多くなる。すなわち、同一のことを示すのであれば、フレーム毎に 分割して得られた符号化データの方が、ビット数が少なくすむので好ましい。
[0025] また、前記サブフレーム処理ステップでは、隣接するサブフレーム間で前記第 2の 値が同じ値であるか異なる値であるかを識別する識別符号を、全てのサブフレーム 間に対して符号化し、全ての前記識別符号が、全ての前記第 2の値が同じであること を示す場合に、前記例外処理として前記第 2の値の少なくとも 1つは異なる値とするこ とで、前記オーディオ信号を符号化してもよい。
[0026] これにより、符号化効率を高めることができる。
[0027] また、前記例外処理では、前記第 2の値が、隣接するサブフレーム間にお!/、て単調 増加又は単調減少するものとみなすことで、前記オーディオ信号を符号化してもよ!/、
[0028] また、前記第 1の値及び前記第 2の値は、前記オーディオ信号の正規化に用いら れるゲイン値、又は、量子化精度を決定する値としてもよい。
[0029] また、本発明のオーディオ信号復号化方法は、上述のオーディオ信号符号化方法 によって符号化されたオーディオ信号の符号化列を復号化するオーディオ信号復号 化方法であって、前記符号化列が前記サブフレーム処理で符号化されて!/、る場合、 前記例外処理が実行されてレ、ることを識別することで、前記符号化列を復号化する 復号化ステップを含む。
[0030] これにより、例外処理を含んだ符号化処理が実行された符号化列に対して、適した 復号化を実施することができる。
[0031] また、本発明のオーディオ信号符号化方法及び復号化方法は、装置として実現す
ること力 Sできる。さらに、本発明は、それぞれの方法の各ステップをコンピュータに実 行させるプログラム、及び、該プログラムを記録するコンピュータ読み取り可能な記録 媒体として実現すること力 Sできる。
発明の効果
[0032] 本発明のオーディオ信号符号化方法及び復号化方法では、低遅延を実現すること ができるだけでなぐさらに、符号化効率を高め、かつ、符号化に伴う音質の劣化を 肖 IJ減すること力でさる。
図面の簡単な説明
[0033] [図 1]図 1は、従来のオーディオ信号符号化装置の構成図である。
[図 2]図 2は、従来のオーディオ信号復号化装置の構成図である。
[図 3]図 3は、本実施の形態のオーディオ信号符号化装置の構成図である。
[図 4]図 4は、入力された 1フレームのオーディオ信号列をサブフレームに分割したこ とを示す図である。
[図 5]図 5は、符号ストリーム構造の一例を示す図である。
[図 6]図 6は、ビットストリームシンタックスの一例を示す図である。
[図 7]図 7は、本実施の形態のオーディオ信号符号化装置の動作を示すフローチヤ ートである。
[図 8]図 8は、例外処理となりうるオーディオ信号列の一例を示す図である。
[図 9]図 9は、本実施の形態のオーディオ信号復号化装置の構成図である。
[図 10]図 10は、従来のビットストリームシンタックスの一例を示す図である。
[図 11]図 11は、ビットストリームシンタックスの一例を示す図である。
[図 12]図 12は、例外処理となりうるオーディオ信号列の一例を示す図である。
[図 13]図 13は、例外処理となりうるオーディオ信号列の一例を示す図である。
符号の説明
[0034] 100、 300 オーディオ信号符号化装置
101、 311、 321 聴覚的冗長性除去部
102、 312、 322 情報量的冗長性除去部
103、 313、 323 聴覚モデル
104、 314、 324 プレフイノレタ部
105、 315 量子化部
106、 316、 326 ロスレス符号化部
200、 400 オーディオ信号復号化装置
201、 401 ロスレス復号化部
202、 402 ポストフイノレタ部
301 判断部
310 フレーム処理部
320 サブフレーム処理部
325 サブフレーム量子化部
403 ゲイン増幅部
発明を実施するための最良の形態
[0035] 以下、本発明の実施の形態について、図面を参照しながら説明する。
[0036] (実施の形態 1)
本実施の形態のオーディオ信号符号化装置は、フレーム毎に符号化するフレーム 符号化モードと、フレームをさらに 2以上に分割したサブフレーム毎に符号化するサ ブフレーム符号化モードとを選択することができる。さらに、サブフレーム符号化モー ドにおいて、サブフレーム毎に決定されたゲイン 力 S、時間的に連続するサブフレー ム間で同じ値である力、、異なる値である力、を示す情報を符号化する。決定されたゲイ ン値が全てのサブフレームで同じ値である場合、フレーム毎に 1つのゲイン値を決定 した場合と同様であるため、通常の処理(全てのサブフレームでゲイン値を同じ値で あるとみなした場合の符号化処理)とは異なる例外処理を行う。なお、本実施の形態 において、ゲインは、オーディオ信号のある振幅を 1としたときの比を表すものであり、 オーディオ信号の正規化に用いられる値である。
[0037] 図 3は、本実施の形態のオーディオ信号符号化装置の構成図である。
[0038] 同図のオーディオ信号符号化装置 300は、判断部 301と、フレーム処理部 310と、 サブフレーム処理部 320とを備える。なお、フレーム処理部 310は、図 1に示す従来 のオーディオ信号符号化装置 100に相当する。フレーム処理部 310が備える聴覚的
冗長性除去部 311と、情報量的冗長性除去部 312とは、それぞれ、図 1の聴覚的冗 長性除去部 101と、情報量的冗長性除去部 102とに相当する。また、聴覚的冗長性 除去部 311が備える聴覚モデル 313と、プレフィルタ部 314と、量子化部 315とは、 それぞれ、図 1の聴覚モデル 103と、プレフィルタ部 104と、量子化部 105とに相当 する。情報量的冗長性除去部 312が備えるロスレス符号化部 316は、図 1のロスレス 符号化部 106に相当する。したがって、ここでは同じ構成要素については説明を省 略し、異なる点を中心に説明する。
[0039] 判断部 301は、フレームに含まれるオーディオ信号に基づいて、サブフレーム毎に 符号化するべきか否かを判断することで、フレーム処理部 310とサブフレーム処理部 320とのいずれにオーディオ信号列を出力するかを決定する。
[0040] 具体的には、判断部 301は、入力されたオーディオ信号列に対して、サブフレーム 毎に最大振幅 (エネルギー)を検出することで、フレーム毎に符号化を行うべき(フレ ーム符号化モード)か、サブフレーム毎に符号化を行うべき(サブフレーム符号化モ ード)かを判断する。フレーム符号化モードが選択された場合は、入力されたオーデ ィォ信号列をフレーム処理部 310に出力する。サブフレーム符号化モードが選択さ れた場合は、入力されたオーディオ信号列をサブフレーム処理部 320に出力する。
[0041] サブフレーム処理部 320は、入力されたオーディオ信号列に対して、サブフレーム 毎に符号化を実行する。サブフレーム処理部 320は、聴覚的冗長性除去部 321と、 情報量的冗長性除去部 322とを備える。なお、情報量的冗長性除去部 322、及び、 該情報量的冗長性除去部 322が備えるロスレス符号化部 326は、図 1の情報量的冗 長性除去部 102とロスレス符号化部 106とに相当する。したがって、ここでは、情報量 的冗長性除去部 102とロスレス符号化部 106とについては説明を省略し、聴覚的冗 長性除去部 321につ!/、て説明する。
[0042] 聴覚的冗長性除去部 321は、サブフレーム毎に聴覚的な冗長性を除去する。聴覚 的冗長性除去部 321は、聴覚モデノレ 323と、プレフイノレタ部 324と、サブフレーム量 子化部 325とを備える。なお、聴覚モデル 323とプレフィルタ部 324とは、それぞれ、 図 1の聴覚モデル 103とプレフィルタ部 104と同じ構成である。したがって、ここでは、 聴覚モデル 323とプレフィルタ部 324とについては説明を省略し、サブフレーム量子
化部 325について説明する。
[0043] サブフレーム量子化部 325は、プレフィルタ部 324から入力されるオーディオ信号 歹 IJに対して、 1フレームのオーディオ信号を 2以上のサブフレームに分けて、サブフレ ーム毎に、ゲインを乗じて量子化を実施する。
[0044] サブフレーム量子化部 325に入力されるオーディオ信号列を y (i)として、ゲインを
Gpとした場合、量子化の対象となる値 x (i)について、式 1で示すような関係が得られ
[0045] (式 1) y (i) = Gp X x (i)
[0046] 式 1のような関係から、ゲイン Gpを決定することで、 x (i)が導出される。一般に、 x (i )は実数値であり、サブフレーム量子化部 325は、実数値である x (i)を整数値に量子 化する。そして、量子化された x (i)をロスレス符号化部 326へ出力する。
[0047] 図 4は、入力された 1フレームのオーディオ信号列を 4つのサブフレームに分割した ことを示す図である。図 4において、横軸に時間、縦軸にオーディオ信号の振幅を示 した。 1フレームのサンプル数を、特に限定しないが一例として、 128個のサンプルと した。 1フレームのオーディオ信号列を、 32個のサンプル毎に 4つのサブフレームに 均一に分割した場合を示した。なお、本発明は、サブフレームの数や各サブフレーム の長さが均一であることに拘らない。
[0048] 図 4の場合、サブフレーム 2及びサブフレーム 3の振幅がサブフレーム 1及びサブフ レーム 4の振幅と比較して大きい。このため、全てのサブフレームを均一に整数値に 量子化する場合、サブフレーム 2及びサブフレーム 3の振幅値を小さくするようなゲイ ンの値を取ると、サブフレーム 1及びサブフレーム 4の振幅値にゼロが頻出して、音質 劣化が発生する可能性がある。また、サブフレーム 1及びサブフレーム 4の振幅値を 確保するようにゲインの値を取ると、サブフレーム 2及びサブフレーム 3の値が大きく なることで、符号化効率が悪くなり、結果的にビットレートが高くなる可能性がある。
[0049] 以上のことから、図 4の場合は、サブフレーム 1及びサブフレーム 4に対して、サブフ レーム 2及びサブフレーム 3のサブフレーム量子化(設定すべきゲインの値)を切り替 えた方が音質劣化を抑え、かつ、符号化効率を高められる可能性がある。
[0050] 音質劣化を抑え、かつ、符号化効率を高める符号化を実施可能とするため、図 3に
示すように、サブフレーム量子化部 325は、入力された原音に相当するオーディオ信 号歹 !]、プレフィルタ部 324の出力結果、及び、聴覚モデル 323の出力のいずれか、 又は、全てを参照として用いてもよい。例えば、プレフィルタ部 324から入力されたォ 一ディォ信号列の振幅値の大小に関わらず、原音の振幅値に基づいて大振幅の前 にある小振幅を有するサブフレームでは、音質向上のために十分に大きなゲインを 確保してもよい。
[0051] 図 5は、符号化ストリーム構造の一例を示す図である。
[0052] ゲイン情報を格納するストリームの最初は、ゲインがどのように格納されるかを示す ゲインコンフィグレーション情報を示す。同図に示す例では、値力 S"0"の場合には、複 数のサブフレームに対して、ゲインがただ 1つの値を与える場合を示す。値が" 1 "の 場合には、複数のサブフレームに対して、ゲインが 2つ以上の値が与えられる場合を 示す。ゲインコンフィグレーション情報の設定は、判断部 301によって行われる。判断 部 301は、入力された 1フレームのオーディオ信号に対して、サブフレームで共通の ゲインの値を利用する力、 (値を" 0"に設定)、サブフレーム毎に異なるゲインの値を利 用するか (値を" 1 "に設定)を選択する。
[0053] すなわち、ゲインコンフィグレーション情報の先頭の値力 0"であることは、フレーム 符号化モードを実行することを示す。ゲインコンフィグレーション情報の先頭の値が" 1 "であることは、サブフレーム符号化モードを実行することを示す。
[0054] ゲインコンフィグレーション情報の先頭の値力 である場合に" 1 "に続く値として、 図 5に示すように、サブフレームの数力 つである場合、サブフレームより 1つ少ない 3 つの値" x"、 'V"、 "ζ"を格納する構造を有する。これらの" x"、 "y"、 "z"は、サブフレ ーム間の相互関係を示す値である。当然ながらサブフレームの数は 4に限定されな い。 "X"はサブフレーム 1とサブフレーム 2のゲインの値が同じ値である場合に、 "0"を 値としてとる。サブフレーム 1とサブフレーム 2のゲインの値が異なる場合には";!"を値 としてとる。 "y"はサブフレーム 2とサブフレーム 3のゲインの値が同じ値である場合に "0"を値としてとる。サブフレーム 2とサブフレーム 3のゲインの値が異なる場合には" 1"を値としてとる。 "z "はサブフレーム 3とサブフレーム 4のゲインの値が同じ値である 場合に" 0"を値としてとる。サブフレーム 3とサブフレーム 4のゲインの値が異なる場合
には "1"を値としてとる。ゲインコンフィグレーション情報の先頭の値力 1"である場合 に続くサブフレーム間の相互関係を示す値の設定は、サブフレーム量子化部 325に よって行われる。なお、当然ながら、 "0"ど '1"は反対の意味を持たせてもよい。すな わち、 "0"が時間的に連続するサブフレーム間でのゲインの値が異なる場合を示し、 "1 "が時間的に連続するサブフレーム間でのゲインの値が同じ値である場合を示し てもよい。
[0055] 以上のようにしてゲインコンフィグレーション情報を設定する。ゲインのコンフィグレ ーシヨン情報力 0"の場合は、ゲインのパラメタは全部で 1つしかない。また、ゲインの コンフィグレーション情報力 S、例えば" 1010"の場合は、ゲインのパラメタは 2つである 。具体的には、サブフレーム 1とサブフレーム 2のゲインの値が同じ値で、サブフレー ム 2とサブフレーム 3のゲインの値は異なる値で、サブフレーム 3とサブフレーム 4のゲ インのィ直が同じィ直となる。
[0056] なお、特異的に、ゲインのコンフィグレーション情報が" 1000"となる場合が考えら れる。この場合、通常の処理とは異なる例外的な処理を実行するものとする。このよう に例外的な処理を設けた理由は、以下の通りである。
[0057] ゲインのコンフィグレーション情報が" 1000"となる場合は、上記に述べた通常の意 味として捉えるとゲインの値が 2以上あり、しかしながら、サブフレーム 1からサブフレ ーム 4の全てのゲインの値が同じと定義されてしまう。つまり、ゲインコンフィグレーショ ン情報力 0"と" 1000"とは、 1つのフレーム(全てのサブフレーム)で単一のゲインを 有することを意味する。つまり、同じ情報を示すために、少なくとも 3ビットが無駄にな る。このように、判断部 301がサブフレーム符号化モードを選択し、サブフレーム毎に 分割して処理を行った場合であっても、フレーム符号化モードを実行した場合と、同 様の結果が出力されることがある。この場合、結果的に、符号化効率が悪くなつてし まうためである。
[0058] 通常の処理とは異なる例外的な処理として、サブフレームのゲインは、例えば、単 調増加(又は、単調減少)と定義する。
[0059] なお、符号化ストリームにおいて、ゲインコンフィグレーション情報に続ぐ実際のサ ブフレームのゲインを導出する符号化列については、まず、値 glが続き、さらに、値 d
elta— gxが続く。ィ直 glは、サブフレーム 1に含まれるオーディオ信号の最大振幅など を利用して求められたゲインを符号化することで得られる値である。値 delta— gxは、 サブフレーム X— 1のゲインとサブフレーム Xのゲインとの差を符号化することで得られ る値である。 Xは 2以上の整数値であり、 Xの最大値はサブフレーム数(図 5では 4)で ある。
[0060] 値 gl及び値 delta— gxに対して、後述する復号化処理を行うことで、それぞれ、 G1 及び delta— Gxが導出される。 G1は、サブフレーム 1のゲインを示す値である。 delt a— Gxは、サブフレーム x— 1のゲインとサブフレーム xのゲインとの差を示す値であ
[0061] 1つのフレームでゲインの値が 1つの場合は、符号化処理では、符号化された値 gl のみがゲインコンフィグレーション情報に続く。復号化処理では、値 glからゲイン G1 を導出し、 G1 =G2 = G3 = G4とする。 1つのフレームでゲインの値が 2つ以上の異 なる値である場合は、符号化処理では、値 glに続いて、値 delta— g2、 delta— g3、 delta— g4が続く。復号化処理では、まず、値 glからゲイン G1を導出する。続いて、 delta— g2を復号化した値である delta— G2から、 G2 = G1 + delta— G2を算出す る。以下、 delta— g3及び delta— g4を復号化し、順次、ゲイン G3及び G4を算出す
[0062] 図 6はビットストリームシンタックスの一例であり、図 5の符号化ストリーム構造例をよ り具体的に示したものである。 "syntax"側に書かれたものがビットストリームシンタック スの一例で、 "number of bits"がその際に使用されるビット数の一例である。 synt axにボールドフォントのイタリック体で記載されたもの力 S、ビットストリームとして符号化 されるべきものである。ボールドフォントでないイタリック体で記載されたものは、一度 ビットストリームとして読み込まれた場合にその値を保持した変数である。ビット数で記 載のある numGainBits、 numMonoDeltaBits及び numDeltaBitsは、実装の際 に、ある整数値があてがわれる。
[0063] 図 6において、 bs— multi— gainは、ゲインが単一であるの力、、複数のサブフレー ムで少なくとも 2つ以上の異なる値からなるのかを識別するフラグ情報である。すなわ ち、図 5のゲインコンフィグレーション情報の先頭の値を示す。例として、図 5と同様に
、 bs― multi― gainが 0であれば'、ゲインは単一であることを示す。 bs― multi― gain 力 S iであれば複数のサブフレームで少なくとも 2つ以上の異なる値からなることを示す
〇
[0064」 bs一 same一 gain[num」(ま、 num— 1番目のサフ、、フレーム (以下、 num— 1サフ、、フ レームと記す)のゲインと、 num番目のサブフレーム(以下、 numサブフレームと記す )のゲインとが同一であるかどうかを識別するフラグ情報である。すなわち、図 5のゲイ ンコンフィグレーション情報の "x"、 "y"、 "z "を示す。例として、 bs— same— gain [nu m]が 0である場合は、 num— 1サブフレームと numサブフレームのゲインが同一であ ることを示す。 bs— same— gain [num]が 1である場合は、違う値のゲインであること を示す。
[0065] bs— gain[0]は、ゲインを導出するために用いられる値である。ゲインが単一である
(bs— multi— gainが 0である)場合は、 bs— gain[0]を用いて導出されるゲイン値が 、全てのサブフレームのゲイン値である。複数のサブフレームで少なくとも 2つ以上の 異なる値からなる(bs— multi— gainが 1である)場合は、 bs— gain[0]を用いて導出 されるゲイン値は、最初のサブフレームのゲイン値である。
[0066] bs— same— gain[num]が 0であるフレームにおいては、 numが小さなフレームか ら順に、 num— 1サブフレームと numサブフレームのゲインの差を導出(又は、 num サブフレームのゲイン値を導出)する値を、 bs— delta [num]として符号化して!/、る。
[0067] 図 6に示す syntaxでは、 bs— same— gain [num]が全て 0である場合に備え、例 外処理を行う記載がなされている。ここでは、例外処理として、ゲインが単調増加する ことを意味している。したがって、あるサブフレームとその直前のサブフレームとの差 分を導出する値を bs— mono— deltaとして符号化している。すなわち、 bs— mono —deltaは、単調増加の増加割合を導出するための値である。よって、単調増加の増 加量を直接符号化してもよぐまた、間接的にテーブルなどから導出してもよい。
[0068] 次に、本実施の形態のオーディオ信号符号化装置の動作について説明する。
[0069] 図 7は、本実施の形態のオーディオ信号符号化装置の動作を示すフローチャート である。
[0070] 判断部 301は、オーディオ信号列が入力されると、フレーム符号化処理モード及び
サブフレーム符号化モードのいずれかを選択する(S 101)。すなわち、図 6の bs— m ulti— gainを決定する。フレーム符号化モードが選択された場合(S 101で No)、ォ 一ディォ信号列をフレーム処理部 310へ出力する。この場合、フレーム処理部 310 において、 bs— multi— gainが 0と設定される。サブフレーム符号化モードが選択さ れた場合(S 101で Yes)、オーディオ信号列をサブフレーム処理部 320へ出力する 。この場合、サブフレーム処理部 320において、 bs— multi— gainが 1と設定される。
[0071] 具体的には、判断部 301は、オーディオ信号列の最大振幅を用いてオーディオ信 号列の変動を検出する。オーディオ信号に変動がほとんどない場合、例えば、最大 振幅がある閾値以下である場合は、フレーム毎で量子化及び符号化するべきであり 、オーディオ信号列をフレーム処理部 310へ出力する。逆に、最大振幅がある閾値よ り大きい場合は、サブフレーム毎で量子化及び符号化するべきであり、オーディオ信 号列をサブフレーム処理部 320へ出力する。図 4の例のオーディオ信号列は変動が 大きいために、サブフレーム処理部 320へ出力され、サブフレーム毎に量子化及び 符号化される。
[0072] サブフレーム符号化モードが選択された場合(S 101で Yes)、サブフレーム量子化 部 325は、サブフレーム毎にゲインを決定し、決定されたゲインの相互関係を検出す る(S 102)。具体的には、サブフレーム毎に決定されたゲイン値が同じ値であるか、 異なる値であるかを検出する。すなわち、図 5の "x"、 'V"、 "z"に相当する値を検出 する。
[0073] 次に、検出された相互関係(サブフレーム毎のゲインの値)を判断する(S 103)。決 定されたゲイン力 S、複数のサブフレームで少なくとも 2つ以上の異なる値である場合(
S 103で Yes)、サブフレーム毎にゲインを導出する(S 104)。
[0074] 具体的には、サブフレーム毎に決定されたゲインの値に対して、 1番目のサブフレ ームのゲインの値との差を算出する。
[0075] 決定されたゲイン力 S、全てのサブフレームで同じ値である場合(S 103で No)、例外 処理を実行する(S 105)。ここでは、例外処理の一例として、決定されたゲインが単 調増加(又は単調減少)するものとみなす。
[0076] 図 8は、例外処理が起こる可能性があるオーディオ信号列の一例を示す図である。
なお、このようなオーディオ信号列は、ノイズに近い音から楽音などにフェードインす る場合などに生じる。
[0077] 同図に示すオーディオ信号列が入力されると、判断部 301は、サブフレーム毎の最 大振幅を用いることでオーディオ信号の変動が大きいと判断することができ、サブフ レーム符号化モードを選択する。このとき、サブフレーム量子化部 325は、サブフレ ームに含まれるオーディオ信号列をエネルギーレベルで判断することでゲイン値を決 定するものとする。図 8に示す例では、サブフレーム 1〜サブフレーム 4のエネルギー は、ほぼ等しい。したがって、ゲイン値は全てのサブフレームで単一の等しい値となる 。つまり、ゲインコンフィグレーション情報は" 1000"となる。
[0078] なお、仮に図 8に示すオーディオ信号列に対して、判断部 301でフレーム符号化モ ードが選択されたとすると、サブフレーム 1〜サブフレーム 4を 1つのフレームとして判 断され、単一のゲイン値が決定される。これにより、サブフレーム符号化モードを選択 したにもかかわらず、フレーム符号化モードが選択された場合と同じ結果が出力され る。すなわち、サブフレーム符号化モードが選択されたことが無駄になる。
[0079] 以上のように、サブフレーム符号化モードが選択されたことが無駄になることを防ぐ ために、ゲインコンフィグレーション情報が" 1000"となった場合に、例外処理として、 ゲインが単調増加するものとみなして、サブフレーム毎にゲインの量子化及び符号化 処理を実行する。
[0080] なお、選択処理(S101)において、フレーム符号化モードが選択された場合(S10 1で No)、フレーム毎で 1つのゲインを決定し、決定されたゲインを量子化及び符号 化する(S106)。
[0081] 1つのフレームに対して、上記の処理(S10;!〜 S106)が終了すると、次のフレーム に対して、同じ処理を繰り返す。
[0082] 以上のように、本実施の形態では、サブフレーム符号化モードが選択された場合で あっても、フレーム符号化モードが選択された場合と同様の結果が生じる場合に、例 外的な処理を行う。これにより、処理が無駄になることを防ぐことができる。
[0083] ここで、本実施の形態との違いを明確にするために、従来のビットストリームシンタツ
[0084] 図 10は、従来のビットストリームシンタックスの一例であり、このシンタックスは AAC 方式における複数のグルーピングと呼ばれるモジュールを構成するものである。この シンタックスにおいて、 window— sequenceが EIGHT— SHORT— SEQUENCE と同値になった場合に、 8つの MDCT (Modified Discrete Cosine Transform )係数列を何組かにグルーピングする構成である。 V、かにグループが構成されるかは ビットストリーム変数である scale— factor— grouping (7ビット)で示される。具体的 には、 8つの MDCT係数列が 1つ前の MDCT係数列とグループを構成するか否か を示す情報が各 1ビットずつの計 7ビットで符号化されるものである。全てのビットで同 じグループとして構成される情報が示された場合では、 8つの MDCT係数列が 1つ のグループとされ符号化及び復号化される定義となっているだけである。すなわち、 ゲインの単調増加などの別の処理に移ることはない。本実施の形態のように、結果的 に無駄が生じる場合に、無駄の発生を防ぐための例外処理を実行することはない。
[0085] 続いて、本実施の形態のオーディオ信号復号化方法を用いた装置について説明 する。
[0086] 図 9は、本実施の形態のオーディオ信号復号化装置の構成図である。同図のォー ディォ信号復号化装置 400は、符号化されたオーディオ信号を復号化する。オーデ ィォ信号復号化装置 400は、ロスレス復号化部 401と、ポストフィルタ部 402と、ゲイ ン増幅部 403とを備える。なお、ロスレス復号化部 401と、ポストフィルタ部 402とは、 図 1のロスレス復号化部 201と、ポストフィルタ部 202とに相当する。したがって、ロス レス復号化部 401と、ポストフィルタ部 402とについては説明を省略し、ゲイン増幅部 403について説明する。
[0087] ゲイン増幅部 403は、ポストフィルタ部 402から入力されるオーディオ信号に対して 、サブフレーム毎に、復号化されたオーディオ信号を増幅する。
[0088] 以上のように、本実施の形態のオーディオ信号符号化方法及び復号化方法によれ ば、符号化時に無駄となりうる符号化パターンに対して例外処理を行うことで、有効 に利用することができる。これにより、低遅延処理の利点を維持しつつ、音質劣化を 抑え、かつ、高効率な符号化を達成することが可能となる。
[0089] 以上、本実施の形態のオーディオ信号符号化方法及び復号化方法について説明
したが、以上の実施の形態に限定されることなぐ種々の変更が可能であり、それらも 本発明の範囲内に包含されるものであることは言うまでもない。
[0090] 例えば、例外処理として、サブフレームが単調増加するとみなせる場合において、 図 11に示すように、単調増加するサブフレームの個数を符号化してもよ!/、。
[0091] 図 11は、図 6とは異なる形態のビットストリームシンタックスの一例であり、図 5の符 号化ストリーム構造例をより具体的に示したものである。 "syntax"側に書かれたもの がビットストリームシンタックスの一例で、 "number of bits"がその際に使用される ビット数の一例である。 syntaxに、ボールドフォントのイタリック体で記載されたものが 、ビットストリームとして符号化されるべきものである。ボールドフォントでないイタリック 体で記載されたものは、一度ビットストリームとして読み込まれた場合にその値を保持 した変数である。ビット数で己載のある numGainBits、 numSubFrBits、 numMon oDeltaBits及び numDeltaBitsは、実装の際に、ある整数値があてがわれる。
[0092」 こお!/、て、 bs一 multi一 gain、 bs一 same一 gain[num」及び bs一 gain [0」(ま
、図 6の bs一 multi一 gain、 bs一 same一 gain[num]及び bs一 gain[0]と | じであ^) 。よって、これらについての説明は省略する。
[0093] 図 11において、図 6と同様に bs— same— gain[num]がすべて 0である場合にお いては、単調増加を意味している。 bs— num— contは、いくつのサブフレームが単 調増加するのかを導出する値である。そして、単調増加する個数のサブフレームに お!/、ては、あるサブフレームとその直前にサブフレームとの差分を導出する値を bs— mono— deltaとして符号化している。例えば、全サブフレーム数が 8つで、 bs— num —contによって 3つが単調増加であると導出される場合、サブフレーム 1からサブフ レーム 2、サブフレーム 2からサブフレーム 3、サブフレーム 3からサブフレーム 4と bs —mono— deltaで導出される差分値でゲインは単調増加する。それ以降のサブフレ ーム、つまり、サブフレーム 5からサブフレーム 8は、例えば、サブフレーム 4と同一の ィ直をとるとする。
[0094] 一方、 bs— same— gain[num]が 0であるフレームにおいては、 numが小さなフレ ームから順に、 num— 1サブフレームのゲインと numサブフレームのゲインとの差を 導出(又は、 numサブフレームのゲイン値を導出)する値を、 bs delta [num]として
符号化している。
[0095] 以上のように、図 11のビットストリームシンタックスでは、例外処理を実施する場合に おいて単調増加するサブフレームの個数を符号化することができる。これにより、符 号化効率を高めることができる。
[0096] また、本実施の形態では、判断部 301は、オーディオ信号の最大振幅を用いて、フ レーム符号化モードとサブフレーム符号化モードとを選択したが、最大振幅ではなく 、オーディオ信号のエネルギーを用いてもよい。
[0097] この場合であっても、図 12に示すようなオーディオ信号列が入力された場合、例外 処理を行う必要がある。図 12は、例外処理が起こる可能性があるオーディオ信号列 の一例を示す図であり、例えば、弦楽器又は打楽器で演奏された音源の場合のォー ディォ信号列をしめす。弦楽器又は打楽器の場合、一音あたりの強度 (最大振幅)は 同じであるが、サブフレームに入る数が違うため、図 12に示すようなオーディオ信号 列が得られる。
[0098] 図 12に示すように、判断部 301は、サブフレーム毎のエネルギーの変動が大きいこ と力、ら、サブフレーム符号化モードを選択する。このとき、サブフレーム量子化部 325 は、サブフレームに含まれるオーディオ信号歹 IJを最大振幅で判断することでゲイン値 を決定するものとする。図 12に示す例では、サブフレーム 1〜サブフレーム 4の最大 振幅はほぼ等しい。したがって、ゲイン値は全てのサブフレームで単一の等しい値と なる。つまり、ゲインコンフィグレーション情報は" 1000"となる。これにより、サブフレ ーム量子化部 325は、図 8の場合と同様に、例外処理を実行することとなる。
[0099] また、判断部 301は、エネルギーを用いて判定し、サブフレーム符号化モードを選 択した場合であっても、制限によりビットレートを上げることができない場合が考えられ る。この場合、結果的に、各サブフレームでビット消費の小さいものを選択せざるを得 なくなり、各サブフレームで同じ符号化処理を選択する。この場合も、ゲインコンフイダ レーシヨン情報は" 1000"となる。これにより、図 8及び図 12の場合と同様に、サブフ レーム量子化部 325は、例外処理を実行することになる。
[0100] また、図 13に示すように、 AACなどの方式では、フレーム間の接続における連続 性確保のため、時間的に前後するフレームがサブフレーム符号化モードで符号化さ
れて!/、る場合、符号化の規程により現フレームもサブフレーム符号化を選択せざるを 得なくなる。これにより、現フレームのオーディオ信号列に変動がほとんどないのであ れば、ゲインコンフィグレーション情報は" 1000"となる。これにより、サブフレーム量 子化部 325は、例外処理を実行することとなる。
[0101] また、本実施の形態では、ゲインの値を導出する際に、ゲインの値が予め用意され たテーブルなどで定義されていてもよい。この場合は、 Gl =table (gl)などの方法 で復号化される場合もあり、その場合は、 G2 = table (gl + g2)や、 G2 = table (gl) + table2 (g2)などとして復号化される場合もある。
[0102] ゲインのコンフィグレーション情報によって、単調増加(単調減少)と定義された場合 においては、 G2力、ら G4のィ直は、 Gp = Gp- l + delta Gp、 Gp = table (gp - 1 + g p)、又は、 Gp = table (gp—l) +tablep (gp)などのように復号化される。この場合 p は 2以上の整数である。
[0103] また、 2つ以上のゲインの符号化において、差分符号化などを用いたが、差分情報 を用いず、 2つ目以降のゲインについて、前サブフレームのィ直を用いずにそのサブフ レームの値を直接復号化できる値を用いてもょレ、。
[0104] また、本実施の形態では、フレーム毎での処理とサブフレーム毎の処理とを明確に 分けて示すために、オーディオ信号符号化装置 300は、図 3に示すようにフレーム処 理部 310とサブフレーム処理部 320とを備えるとした力 例えば、聴覚モデル 313と 聴覚モデル 323、プレフィルタ部 314とプレフィルタ部 324、及び、ロスレス符号化部 316とロスレス符号化部 326とは、それぞれ共通としてもよい。
[0105] (実施の形態 2)
本実施の形態のオーディオ信号符号化方法及び復号化方法では、ロスレス符号化 を行う際の符号化効率に影響を与える量子化精度情報に対して、符号化及び復号 化を行う。すなわち、符号化及び復号化の対象がゲインではなぐ量子化精度情報 であるのが実施の形態 1と異なる点である。本実施の形態では、実施の形態 1と同じ 点は説明を省略し、異なる点を中心に説明する。
[0106] 本実施の形態のオーディオ信号符号化方法を実施する装置は、実施の形態 1と同 様に図 3に示すオーディオ信号符号化装置である。
[0107] 本実施の形態において、サブフレーム量子化部 325は、量子化精度情報を量子化 する。例えば、聴感上、重要なサンプルのオーディオ信号に対しては、十分な量子 化精度を保持するために、量子化精度情報 Rpを小さな値に設定する。
[0108] サブフレーム量子化部 325に入力されるオーディオ信号を、 y(i)として、量子化精 度情報を Rpとした場合、量子化の対象となる z (i)について、式 2で示すような関係が 得られる。
[0109] (式 2) y(i) = Rp X z (i)
[0110] 式 2のような関係から、量子化精度情報 Rpを決定することで、 z (i)が導出される。一 般に、 z (i)は実数値であるので、サブフレーム量子化部 325は、実数値である z (i)を 整数値に量子化する。そして、量子化された z (i)をロスレス符号化部 326へ出力する
[0111] 実施の形態 1に示した式 1と式 2を比較して判るように、ゲイン Gpが量子化精度情 報 Rpになり、それに伴い x(i)力 Sz (i)になっただけである。それ以外のモジュール、例 えばロスレス符号化部 326や聴覚モデル 323などに変更はない。
[0112] 以上のように、本実施の形態のオーディオ信号符号化方法及び復号化方法では、 音質劣化を抑え、聴感上、重要なサンプルのオーディオ信号に対して、量子化精度 情報 Rpを小さな値に設定することで、結果 z (i)の絶対値を大きくすることができる。こ れにより、実数力 整数値に変換する量子化の過程で生じる量子化誤差の影響を小 さくすることが可能となる。
[0113] (実施の形態 3)
本実施の形態のオーディオ信号符号化方法及び復号化方法は、時間周波数変換 を有するオーディオ信号符号化及び復号化方法へ適用することができる。この点が、 実施の形態 1及び 2が、主に時間周波数変換処理を伴わない、いわゆる時間領域の 符号化及び復号化方法であったこととの相違点である。
[0114] 1つ目の適用は、 MPEG2— AACに代表される、複数の変換長を有する一括直交 変換方式における系への適用である。
[0115] この系では、入力されたオーディオ信号をあるサンプルごとにフレームを構成し、そ のフレームのサンプルを一括直交変換して周波数スペクトル列を生成し、そのスぺク
トルを量子化及び符号化するものである。 1フレームに対して 1つの一括直交変換す る場合と、 1フレームに対して時間的に連続な複数の一括直交変換する場合とを切り 替えて使用する。
[0116] 1フレームに対して、時間的に連続な複数の一括直交変換をして、各々の一括直 交変換から周波数スペクトル列を得るとき、各々の周波数スペクトル列に対する代表 ゲインに対して、実施の形態 1で述べた符号化方法を適用することで、符号化効率を 高めることが可能となる。
[0117] 2つ目の適用は、 Low Delay AACに代表される、単一の変換長を有する一括 直交変換方式における系への適用である。
[0118] この系では、入力されたオーディオ信号をあるサンプルごとにフレームを構成し、そ のフレームのサンプルを一括直交変換して周波数スペクトル列を生成し、そのスぺク トルを量子化及び符号化するものである。 1フレームに対して 1つの直交変換を施す ものである。
[0119] したがって、 1フレームに対して 1つの直交変換しかないため、 1フレーム内の時間 的な変動を得られない。この場合は、時間的な変動情報を直交変換とは関係なぐ 別途、予め時間的な複数のサブフレームを構成しておいて、その時間的なゲイン情 報を量子化し符号化するのに複数のサブフレームを用いる。復号化のプロセスでは 、一括直交変換で復号化された 1フレームのオーディオ信号に対して、前記の時間 的なゲイン情報で補正するなどに複数のサブフレームを用いてもょレ、。
[0120] 若しくは、 1つの直交変換から得られる周波数スペクトル列に対して、周波数軸上で 、複数のサブバンド(時間軸上のサブフレームに相当する)に分割して、各々のサブ バンドに対する代表ゲインに対して、実施の形態 1で述べた符号化方法を適用する ことで、符号化効率を高めることも可能である。
[0121] 3つ目の適用は、 QMF (Quadrature Mirror Filter)フィルタに代表される、時 間周波数マトリクスを構成するポリフェーズフィルター方式における系への適用である
[0122] この系では、複数の周波数サブバンドにおける複数サンプルからなる時間信号列 力 S得られるものである。したがって、ある時間サンプルにおける複数の周波数サブバ
ンドの信号のゲインに対して、実施の形態 1で述べた符号化方法を適用してもよい。 また、ある周波数サブバンドを選んで、その周波数サブバンドの複数サンプルからな る時間信号列に対して、 1つ毎又は幾つか毎に、グルーピングした代表ゲインに対し て、実施の形態 1で述べた符号化方法を適用してもよい。
[0123] 4つ目の適用は、 3つ目の適用であるポリフェーズフィルター方式に加えて、追加処 理として、 DCTに代表される一括直交変換を加えた系における適用である。
[0124] この系では、ポリフェーズフィルター方式での出力は 3つ目の適用と同様であるが、 サブバンドの周波数間隔が大き!/、場合などにお!/、ては、特に低域成分の周波数分 解能が不足する。したがって、低域周波数成分の周波数分解能を向上させるため、 ポリフェーズフィルターからの出力のうち、低域周波数成分に相当する時間信号列に 対して、離散コサイン変換 (DCT変換)などの直交変換を用いて、時間周波数変換し 、低域の周波数分解能を向上させるものである。
[0125] この 4つ目の適用では、前記 2つ目と 3つ目の適用の組み合わせで実現でき、例え ば、低域においては、 2つ目の適用と同様の手法をとり、高域においては、 3つ目の 手法を適用することができ、同様に符号化効率を高めることができる。
[0126] 以上、オーディオ信号符号化方法及び復号化方法における時間周波数変換を有 する様々な系においても、基本的に実施の形態 1と同様の符号化方法及び復号化 方法を用いれば、符号化効率を高めることができる。上記ではゲインの符号化につ いて、述べたが、量子化精度に置き換えて実施の形態 2と同様の符号化方法及び復 号化方法を実施しても、同じように符号化効率の向上が期待できる。
[0127] 以上のように、本実施の形態のオーディオ信号符号化方法及び復号化方法は、符 号化対象をいくつかのグループ(例えば、時間軸上のフレーム及び周波数軸上のバ ンド)に分割して符号化する場合に、さらに、 1つのグループを複数のサブグループ( 例えば、時間軸上のサブフレーム及び周波数軸上のサブバンド)に分割して、サブグ ループ毎に符号化する場合に適用することができる。
[0128] 以上、本発明のオーディオ信号符号化方法及び復号化方法について、実施の形 態に基づいて説明した力 本発明は、この実施の形態に限定されるものではない。 本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施し
たものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、 本発明の範囲内に含まれる。
[0129] 例えば、本実施の形態では、例外処理としてゲイン値などを単調増加又は単調減 少するものとみなす処理を用いたが、通常の処理でなければいかなる処理であって もよい。例えば、サブフレーム毎にゲイン値などが大小 2つの値を交互にとるとみなす 処理でもよい。また、サブフレーム毎にゲインィ直などがあらかじめ定められた規則に 従って変動するとみなす処理でもよレ、。
[0130] また、本実施の形態では、ゲイン値又は量子化精度を決定する値を量子化及び符 号化するとしたが、量子化及び符号化の対象はこれらに限られない。オーディオ信 号の符号化に関する他の値を量子化及び符号化するとしてもよい。
[0131] 本発明のオーディオ信号符号化方法及び復号化方法に含まれるステップをコンビ ユータに実行させるプログラムとして実現したり、そのプログラムを記録したコンビユー タ読み取り可能な CD— ROMなどの記録媒体として実現したり、そのプログラムを示 す情報、データ又は信号として実現したりすることもできる。そして、それらプログラム 、情報、データ及び信号は、インターネット等の通信ネットワークを介して配信してもよ い。
産業上の利用可能性
[0132] 本発明のオーディオ信号符号化方法及び復号化方法は、従来からオーディオ符 号化及び復号化方法が適用されていたあらゆるアプリケーションにおいて、適用可 能である。特に放送コンテンツの伝送、 DVDや SDカードなどの蓄積媒体に記録さ れ再生される応用、携帯電話に代表される通信機器に AVコンテンツを伝送する場 合などに用いることができる。また、インターネット上でやりとりされる電子データとして 、オーディオ信号を伝送する場合においても有用である。