WO2008072524A1

WO2008072524A1 - オーディオ信号符号化方法及び復号化方法

Info

Publication number: WO2008072524A1
Application number: PCT/JP2007/073503
Authority: WO
Inventors: Mineo Tsushima; Akihisa Kawamura
Original assignee: Panasonic Corporation
Priority date: 2006-12-13
Filing date: 2007-12-05
Publication date: 2008-06-19
Also published as: US8160890B2; US20100042415A1; JP5238512B2; JPWO2008072524A1

Abstract

　低遅延を実現することができるだけでなく、符号化効率を高め、かつ、符号化に伴う音質の劣化を削減する。　オーディオ信号を符号化するオーディオ信号符号化方法であって、複数のサンプル毎に分割したフレームに含まれるオーディオ信号に基づいて、フレームを２以上に分割したサブフレーム毎に符号化すべきか否かをフレーム毎に判断する判断ステップと、サブフレーム毎に符号化すべきと判断された場合に、サブフレーム毎に、該サブフレームのオーディオ信号の特性を示す値を決定し、決定された値を用いてオーディオ信号を符号化するサブフレーム処理ステップとを含み、サブフレーム処理ステップでは、サブフレーム毎に決定された値が全て同じであるか否かを判定し、値が全て同じである場合、例外処理として決定された値が示すオーディオ信号の特性とは異なる特性を用いて、前記オーディオ信号を符号化する。

Description

明細書

オーディオ信号符号化方法及び複号化方法

技術分野

[0001] 本発明は、オーディオ信号の符号化方法及び復号化方法に関するものである。

背景技術

[0002] 従来のオーディオ信号符号化方法及び復号化方法としては、公知なものとして IS O/IECの国際標準方式、通称 MPEG (Moving Picture Experts Group)方式などが挙げられる。現在、幅広い応用を持ち、低ビットレート時でも高音質な符号化方式として、 ISO/IEC14496— 3、通称 MPEG— 4 GA (General Audio C oding) (非特許文献 1参照）などがあげられる。本方式の拡張規格も複数規格化が現在なされている。

[0003] その一つとして、符号化及び復号化における遅延を小さくする低遅延技術がある。

例ぇば、130/1£じ国際標準規格でぁる^1?£0— 4 Audio (ISO/IEC 14496 —3)において定められた Low Delay AAC (Advanced Audio Coding)方式力る。また、別の例としては、特許文献 1及び非特許文献 2に記載の技術がある。

[0004] 以下では、非特許文献 2に記載された従来のオーディオ信号符号化方法及び復号化方法について説明する。

[0005] 図 1は、従来のオーディオ信号符号化装置の構成図である。同図のオーディオ信号符号化装置 100は、特に、処理に力、かる遅延を小さくすることを特徴とする装置である。オーディオ信号符号化装置 100は、聴覚的冗長性除去部 101と、情報量的冗長性除去部 102とを備える。

[0006] 聴覚的冗長性除去部 101は、入力されたオーディオ信号から、聴覚的な冗長性を除去する。すなわち、人が有する聴覚の特性に基づいてオーディオ信号から人が知覚しない成分を除去する。聴覚的冗長性除去部 101は、聴覚モデル 103と、プレフィルタ部 104と、量子化部 105とを備える。

[0007] 聴覚モデル 103は、符号化されたオーディオ信号の音質劣化を決定する重要な要素であり、継時マスキングや同時マスキングなど当業者には公知な技術を用いて、人に知覚されない周波数成分の音及びそのレベルを選別する。その結果、人に知覚される周波数成分の音が各周波数帯域においてどのレベルであるの力、を入力されたオーディオ信号に対して適応的に算出する。聴覚モデル 103は、算出した結果に基づレ、てプレフィルタ部 104力、かなるフィルタを用レ、るかを示す情報をプレフィルタ部 104に出力する。同時に、この情報をオーディオ信号符号化装置の出力信号であるオーディオ信号の符号化列に含めて出力する。聴覚モデル 103は、例えば、 MPEG - 1 Layer III (通称 MP3)の規格書に記載のある聴覚モデルである。入力されるデジタルオーディオ信号列は、まず聴覚モデル 103に入力される。

[0008] プレフィルタ部 104は、聴覚モデル 103から入力されるいかなるフィルタを用いるかを示す情報、具体的には、人に知覚される周波数成分の音が各帯域においてどのレベルである力、を示す値を基に、入力されたデジタルオーディオ信号列から人に知覚されないレベルの成分の音をフィルタによって除去する。これにより、プレフィルタ部 1 04は、人が知覚しない成分を除去したオーディオ信号列を出力する。プレフィルタ部 104は、非特許文献 2にあるように、複数の線形予測フィルタで構成する。

[0009] 量子化部 105は、プレフィルタ部 104から入力されるオーディオ信号列に対して、整数値以下の値を四捨五入することで量子化を行レ、、整数値のオーディオ信号列を出力する。

[0010] 以上のように、聴覚的冗長性除去部 101は、入力されるオーディオ信号列に対して

、人が知覚しない成分を除去し、整数値に量子化したオーディオ信号列を出力する

[0011] 情報量的冗長性除去部 102は、聴覚的冗長性除去部 101から入力されるオーディォ信号列から、情報量的な冗長性を除去することによって、符号化効率を高める。情報量的冗長性除去部 102は、ロスレス符号化部 106を備える。

[0012] ロスレス符号化部 106は、従来から提案されており、当業者には公知の技術であるハフマン符号化などの手法で構成される。ロスレス符号化部 106へ入力されるォーディォ信号列は、前段の量子化部 105によって、整数値化されている。このため、ハフマン符号化などのロスレス符号化部 106は、その整数値化された値に対して、情報量的な冗長性を取り除くことによって符号化効率が高まることになる。 [0013] 以上の構成により、従来のオーディオ信号符号化装置 100は、プレフィルタ部 104 で!/、かなるプレフィルタが使用された力、、具体的には、どのような線形予測係数で構成されたのかを示す情報と、ロスレス符号化部 106で符号化されたオーディオ信号列 (情報)との両方を符号化列として出力する。

[0014] 続!/、て、従来のオーディオ信号復号化装置につ!/、て説明する。

[0015] 図 2は、従来のオーディオ信号復号化装置の構成図である。同図のオーディオ信号復号化装置 200は、符号化されたオーディオ信号を復号化する。オーディオ信号復号化装置 200は、ロスレス復号化部 201と、ポストフィルタ部 202とを備える。

[0016] ロスレス復号化部 201は、ロスレス符号化部 106が出力する符号化列に対してロスレス復号によりオーディオ信号列を復号化する。

[0017] ポストフィルタ部 202では、復号化された線形予測係数列から、ポストフィルタ（プレフィルタ部 104で用いられたフィルタの逆フィルタ）を構成する。ロスレス復号化部 20 1でロスレス復号されたオーディオ信号列に対してポストフィルタを施すことで得られた結果であるオーディオ信号列を最終的に出力する。

[0018] 以上のように図 1及び図 2に示すオーディオ信号符号化装置及びオーディオ信号復号化装置を用いることで、 AAC等の符号化及び復号化方法を用いるよりも遅延が小さくなる。これは、 AAC等の方式が有する 1フレームが 1024サンプルなどの一括直交変換部分に要する遅延がなくなり、対して、プレフィルタやポストフィルタの消費する遅延が小さいことから、結果的に低遅延化することが可能になるためである。特許文献 1： WO2005/078705号公報

非特許文献 1： ISO/IEC 14496 - 3： 2005"General Audio Coding"

非特許文献 2 :学会論文" Perceptual Audio Coding Using Adaptive Pre— and Post— Filters and Lossless し ompression" (IEEE Transaction on Speech and Audio Processing, vol. 10, No. 6 , September 2002) 発明の開示

発明が解決しょうとする課題

[0019] しかしながら、上記従来のオーディオ信号符号化方法及び復号化方法では、以下の課題がある。 [0020] 例えば、 MPEG規格である Low Delay AACなどでは、 AAC方式を用いた技術としては低遅延である力それでも遅延は 60ms程度であり、さらなる改良を加えたものでも 40ms程度である。双方向のコミュニケーションで使用する際には、遅延が十分に小さレ、とは言えな!/、と!/、う課題があった。

[0021] 一方、非特許文献 2に記載の技術では、遅延は 10数 ms程度に抑えられるが、低レート化が難しいという課題がある。さらに、入力されるオーディオ信号に対して、量子化部 105が量子化する処理は、フレーム毎に処理される。このため、時間的に大きな変動を有するオーディオ信号列が入力された場合、量子化部 105による量子化ノィズ (符号化にともなう音質劣化）が適切に制御できないという課題がある。また、十分な符号化効率をロスレス符号化部 106で確保できないという課題がある。

[0022] そこで、本発明は、上記課題を解決するためになされたものであり、低遅延を実現すること力 Sできるだけでなく、さらに、符号化効率を高め、かつ、符号化に伴う音質の劣化を削減することができるオーディオ信号符号化方法及び復号化方法を提供することを目白勺とする。

課題を解決するための手段

[0023] 上記課題を解決するため、本発明のオーディオ信号符号化方法は、オーディオ信号を符号化するオーディオ信号符号化方法であって、前記オーディオ信号を複数のサンプル毎に分割したフレームに含まれるオーディオ信号に基づいて、前記フレームを 2以上に分割したサブフレーム毎に符号化すべきか否かを前記フレーム毎に判断する判断ステップと、前記サブフレーム毎に符号化すべきでないと判断された場合に、前記フレーム毎に、該フレームのオーディオ信号の特性を示す第 1の値を決定し、決定された前記第 1の値を用いて前記オーディオ信号を符号化するフレーム処理ステップと、前記サブフレーム毎に符号化すべきと判断された場合に、前記サブフレーム毎に、該サブフレームのオーディオ信号の特性を示す第 2の値を決定し、決定された前記第 2のを用いて前記オーディオ信号を符号化するサブフレーム処理ステップとを含み、前記サブフレーム処理ステップでは、前記サブフレーム毎に決定された前記第 2の値が全て同じであるか否かを判定し、前記第 2の値が全て同じである場合、例外処理として前記第 2の値の少なくとも 1つは異なる値とすることで、前記ォーディォ信号を符号化する。

[0024] これにより、低遅延を実現することができるだけでなぐさらに、符号化効率を高め、かつ、符号化に伴う音質の劣化を削減することができる。さらに、例外的な処理を実行させる機能を有しており、符号化の無駄を活用することができる。ここで、符号化の無駄とは、サブフレーム毎に分割して得られた符号化データと、フレーム毎に分割して得られた符号化データとが同一の意味を示していることをいう。サブフレーム毎に分割して得られた符号化データは、フレーム毎に分割して得られた符号化データよりビット数カ、通常、多くなる。すなわち、同一のことを示すのであれば、フレーム毎に分割して得られた符号化データの方が、ビット数が少なくすむので好ましい。

[0025] また、前記サブフレーム処理ステップでは、隣接するサブフレーム間で前記第 2の値が同じ値であるか異なる値であるかを識別する識別符号を、全てのサブフレーム間に対して符号化し、全ての前記識別符号が、全ての前記第 2の値が同じであることを示す場合に、前記例外処理として前記第 2の値の少なくとも 1つは異なる値とすることで、前記オーディオ信号を符号化してもよい。

[0026] これにより、符号化効率を高めることができる。

[0027] また、前記例外処理では、前記第 2の値が、隣接するサブフレーム間にお!/、て単調増加又は単調減少するものとみなすことで、前記オーディオ信号を符号化してもよ!/、

[0028] また、前記第 1の値及び前記第 2の値は、前記オーディオ信号の正規化に用いられるゲイン値、又は、量子化精度を決定する値としてもよい。

[0029] また、本発明のオーディオ信号復号化方法は、上述のオーディオ信号符号化方法によって符号化されたオーディオ信号の符号化列を復号化するオーディオ信号復号化方法であって、前記符号化列が前記サブフレーム処理で符号化されて!/、る場合、前記例外処理が実行されてレ、ることを識別することで、前記符号化列を復号化する復号化ステップを含む。

[0030] これにより、例外処理を含んだ符号化処理が実行された符号化列に対して、適した復号化を実施することができる。

[0031] また、本発明のオーディオ信号符号化方法及び復号化方法は、装置として実現すること力 Sできる。さらに、本発明は、それぞれの方法の各ステップをコンピュータに実行させるプログラム、及び、該プログラムを記録するコンピュータ読み取り可能な記録媒体として実現すること力 Sできる。

発明の効果

[0032] 本発明のオーディオ信号符号化方法及び復号化方法では、低遅延を実現することができるだけでなぐさらに、符号化効率を高め、かつ、符号化に伴う音質の劣化を肖 IJ減すること力でさる。

図面の簡単な説明

[0033] [図 1]図 1は、従来のオーディオ信号符号化装置の構成図である。

[図 2]図 2は、従来のオーディオ信号復号化装置の構成図である。

[図 3]図 3は、本実施の形態のオーディオ信号符号化装置の構成図である。

[図 4]図 4は、入力された 1フレームのオーディオ信号列をサブフレームに分割したことを示す図である。

[図 5]図 5は、符号ストリーム構造の一例を示す図である。

[図 6]図 6は、ビットストリームシンタックスの一例を示す図である。

[図 7]図 7は、本実施の形態のオーディオ信号符号化装置の動作を示すフローチヤートである。

[図 8]図 8は、例外処理となりうるオーディオ信号列の一例を示す図である。

[図 9]図 9は、本実施の形態のオーディオ信号復号化装置の構成図である。

[図 10]図 10は、従来のビットストリームシンタックスの一例を示す図である。

[図 11]図 11は、ビットストリームシンタックスの一例を示す図である。

[図 12]図 12は、例外処理となりうるオーディオ信号列の一例を示す図である。

[図 13]図 13は、例外処理となりうるオーディオ信号列の一例を示す図である。

符号の説明

[0034] 100、 300 オーディオ信号符号化装置

101、 311、 321 聴覚的冗長性除去部

102、 312、 322 情報量的冗長性除去部

103、 313、 323 聴覚モデル 104、 314、 324 プレフイノレタ部

105、 315 量子化部

106、 316、 326 ロスレス符号化部

200、 400 オーディオ信号復号化装置

201、 401 ロスレス復号化部

202、 402 ポストフイノレタ部

301 判断部

310 フレーム処理部

320 サブフレーム処理部

325 サブフレーム量子化部

403 ゲイン増幅部

発明を実施するための最良の形態

[0035] 以下、本発明の実施の形態について、図面を参照しながら説明する。

[0036] (実施の形態 1)

本実施の形態のオーディオ信号符号化装置は、フレーム毎に符号化するフレーム符号化モードと、フレームをさらに 2以上に分割したサブフレーム毎に符号化するサブフレーム符号化モードとを選択することができる。さらに、サブフレーム符号化モードにおいて、サブフレーム毎に決定されたゲイン力 S、時間的に連続するサブフレーム間で同じ値である力、、異なる値である力、を示す情報を符号化する。決定されたゲイン値が全てのサブフレームで同じ値である場合、フレーム毎に 1つのゲイン値を決定した場合と同様であるため、通常の処理（全てのサブフレームでゲイン値を同じ値であるとみなした場合の符号化処理）とは異なる例外処理を行う。なお、本実施の形態において、ゲインは、オーディオ信号のある振幅を 1としたときの比を表すものであり、オーディオ信号の正規化に用いられる値である。

[0037] 図 3は、本実施の形態のオーディオ信号符号化装置の構成図である。

[0038] 同図のオーディオ信号符号化装置 300は、判断部 301と、フレーム処理部 310と、サブフレーム処理部 320とを備える。なお、フレーム処理部 310は、図 1に示す従来のオーディオ信号符号化装置 100に相当する。フレーム処理部 310が備える聴覚的冗長性除去部 311と、情報量的冗長性除去部 312とは、それぞれ、図 1の聴覚的冗長性除去部 101と、情報量的冗長性除去部 102とに相当する。また、聴覚的冗長性除去部 311が備える聴覚モデル 313と、プレフィルタ部 314と、量子化部 315とは、それぞれ、図 1の聴覚モデル 103と、プレフィルタ部 104と、量子化部 105とに相当する。情報量的冗長性除去部 312が備えるロスレス符号化部 316は、図 1のロスレス符号化部 106に相当する。したがって、ここでは同じ構成要素については説明を省略し、異なる点を中心に説明する。

[0039] 判断部 301は、フレームに含まれるオーディオ信号に基づいて、サブフレーム毎に符号化するべきか否かを判断することで、フレーム処理部 310とサブフレーム処理部 320とのいずれにオーディオ信号列を出力するかを決定する。

[0040] 具体的には、判断部 301は、入力されたオーディオ信号列に対して、サブフレーム毎に最大振幅 (エネルギー）を検出することで、フレーム毎に符号化を行うべき（フレーム符号化モード)か、サブフレーム毎に符号化を行うべき（サブフレーム符号化モード）かを判断する。フレーム符号化モードが選択された場合は、入力されたオーディォ信号列をフレーム処理部 310に出力する。サブフレーム符号化モードが選択された場合は、入力されたオーディオ信号列をサブフレーム処理部 320に出力する。

[0041] サブフレーム処理部 320は、入力されたオーディオ信号列に対して、サブフレーム毎に符号化を実行する。サブフレーム処理部 320は、聴覚的冗長性除去部 321と、情報量的冗長性除去部 322とを備える。なお、情報量的冗長性除去部 322、及び、該情報量的冗長性除去部 322が備えるロスレス符号化部 326は、図 1の情報量的冗長性除去部 102とロスレス符号化部 106とに相当する。したがって、ここでは、情報量的冗長性除去部 102とロスレス符号化部 106とについては説明を省略し、聴覚的冗長性除去部 321につ!/、て説明する。

[0042] 聴覚的冗長性除去部 321は、サブフレーム毎に聴覚的な冗長性を除去する。聴覚的冗長性除去部 321は、聴覚モデノレ 323と、プレフイノレタ部 324と、サブフレーム量子化部 325とを備える。なお、聴覚モデル 323とプレフィルタ部 324とは、それぞれ、図 1の聴覚モデル 103とプレフィルタ部 104と同じ構成である。したがって、ここでは、聴覚モデル 323とプレフィルタ部 324とについては説明を省略し、サブフレーム量子化部 325について説明する。

[0043] サブフレーム量子化部 325は、プレフィルタ部 324から入力されるオーディオ信号歹 IJに対して、 1フレームのオーディオ信号を 2以上のサブフレームに分けて、サブフレーム毎に、ゲインを乗じて量子化を実施する。

[0044] サブフレーム量子化部 325に入力されるオーディオ信号列を y (i)として、ゲインを

Gpとした場合、量子化の対象となる値 x (i)について、式 1で示すような関係が得られ

[0045] (式 1) y (i) = Gp X x (i)

[0046] 式 1のような関係から、ゲイン Gpを決定することで、 x (i)が導出される。一般に、 x (i )は実数値であり、サブフレーム量子化部 325は、実数値である x (i)を整数値に量子化する。そして、量子化された x (i)をロスレス符号化部 326へ出力する。

[0047] 図 4は、入力された 1フレームのオーディオ信号列を 4つのサブフレームに分割したことを示す図である。図 4において、横軸に時間、縦軸にオーディオ信号の振幅を示した。 1フレームのサンプル数を、特に限定しないが一例として、 128個のサンプルとした。 1フレームのオーディオ信号列を、 32個のサンプル毎に 4つのサブフレームに均一に分割した場合を示した。なお、本発明は、サブフレームの数や各サブフレームの長さが均一であることに拘らない。

[0048] 図 4の場合、サブフレーム 2及びサブフレーム 3の振幅がサブフレーム 1及びサブフレーム 4の振幅と比較して大きい。このため、全てのサブフレームを均一に整数値に量子化する場合、サブフレーム 2及びサブフレーム 3の振幅値を小さくするようなゲインの値を取ると、サブフレーム 1及びサブフレーム 4の振幅値にゼロが頻出して、音質劣化が発生する可能性がある。また、サブフレーム 1及びサブフレーム 4の振幅値を確保するようにゲインの値を取ると、サブフレーム 2及びサブフレーム 3の値が大きくなることで、符号化効率が悪くなり、結果的にビットレートが高くなる可能性がある。

[0049] 以上のことから、図 4の場合は、サブフレーム 1及びサブフレーム 4に対して、サブフレーム 2及びサブフレーム 3のサブフレーム量子化（設定すべきゲインの値）を切り替えた方が音質劣化を抑え、かつ、符号化効率を高められる可能性がある。

[0050] 音質劣化を抑え、かつ、符号化効率を高める符号化を実施可能とするため、図 3に示すように、サブフレーム量子化部 325は、入力された原音に相当するオーディオ信号歹 !]、プレフィルタ部 324の出力結果、及び、聴覚モデル 323の出力のいずれか、又は、全てを参照として用いてもよい。例えば、プレフィルタ部 324から入力されたォ一ディォ信号列の振幅値の大小に関わらず、原音の振幅値に基づいて大振幅の前にある小振幅を有するサブフレームでは、音質向上のために十分に大きなゲインを確保してもよい。

[0051] 図 5は、符号化ストリーム構造の一例を示す図である。

[0052] ゲイン情報を格納するストリームの最初は、ゲインがどのように格納されるかを示すゲインコンフィグレーション情報を示す。同図に示す例では、値力 S"0"の場合には、複数のサブフレームに対して、ゲインがただ 1つの値を与える場合を示す。値が" 1 "の場合には、複数のサブフレームに対して、ゲインが 2つ以上の値が与えられる場合を示す。ゲインコンフィグレーション情報の設定は、判断部 301によって行われる。判断部 301は、入力された 1フレームのオーディオ信号に対して、サブフレームで共通のゲインの値を利用する力、 (値を" 0"に設定）、サブフレーム毎に異なるゲインの値を利用するか (値を" 1 "に設定)を選択する。

[0053] すなわち、ゲインコンフィグレーション情報の先頭の値力 0"であることは、フレーム符号化モードを実行することを示す。ゲインコンフィグレーション情報の先頭の値が" 1 "であることは、サブフレーム符号化モードを実行することを示す。

[0054] ゲインコンフィグレーション情報の先頭の値力である場合に" 1 "に続く値として、図 5に示すように、サブフレームの数力つである場合、サブフレームより 1つ少ない 3 つの値" x"、 'V"、 "ζ"を格納する構造を有する。これらの" x"、 "y"、 "z"は、サブフレーム間の相互関係を示す値である。当然ながらサブフレームの数は 4に限定されない。 "X"はサブフレーム 1とサブフレーム 2のゲインの値が同じ値である場合に、 "0"を値としてとる。サブフレーム 1とサブフレーム 2のゲインの値が異なる場合には"；!"を値としてとる。 "y"はサブフレーム 2とサブフレーム 3のゲインの値が同じ値である場合に "0"を値としてとる。サブフレーム 2とサブフレーム 3のゲインの値が異なる場合には" 1"を値としてとる。 "z "はサブフレーム 3とサブフレーム 4のゲインの値が同じ値である場合に" 0"を値としてとる。サブフレーム 3とサブフレーム 4のゲインの値が異なる場合には "1"を値としてとる。ゲインコンフィグレーション情報の先頭の値力 1"である場合に続くサブフレーム間の相互関係を示す値の設定は、サブフレーム量子化部 325によって行われる。なお、当然ながら、 "0"ど '1"は反対の意味を持たせてもよい。すなわち、 "0"が時間的に連続するサブフレーム間でのゲインの値が異なる場合を示し、 "1 "が時間的に連続するサブフレーム間でのゲインの値が同じ値である場合を示してもよい。

[0055] 以上のようにしてゲインコンフィグレーション情報を設定する。ゲインのコンフィグレーシヨン情報力 0"の場合は、ゲインのパラメタは全部で 1つしかない。また、ゲインのコンフィグレーション情報力 S、例えば" 1010"の場合は、ゲインのパラメタは 2つである。具体的には、サブフレーム 1とサブフレーム 2のゲインの値が同じ値で、サブフレーム 2とサブフレーム 3のゲインの値は異なる値で、サブフレーム 3とサブフレーム 4のゲインのィ直が同じィ直となる。

[0056] なお、特異的に、ゲインのコンフィグレーション情報が" 1000"となる場合が考えられる。この場合、通常の処理とは異なる例外的な処理を実行するものとする。このように例外的な処理を設けた理由は、以下の通りである。

[0057] ゲインのコンフィグレーション情報が" 1000"となる場合は、上記に述べた通常の意味として捉えるとゲインの値が 2以上あり、しかしながら、サブフレーム 1からサブフレーム 4の全てのゲインの値が同じと定義されてしまう。つまり、ゲインコンフィグレーション情報力 0"と" 1000"とは、 1つのフレーム（全てのサブフレーム）で単一のゲインを有することを意味する。つまり、同じ情報を示すために、少なくとも 3ビットが無駄になる。このように、判断部 301がサブフレーム符号化モードを選択し、サブフレーム毎に分割して処理を行った場合であっても、フレーム符号化モードを実行した場合と、同様の結果が出力されることがある。この場合、結果的に、符号化効率が悪くなつてしまうためである。

[0058] 通常の処理とは異なる例外的な処理として、サブフレームのゲインは、例えば、単調増加（又は、単調減少）と定義する。

[0059] なお、符号化ストリームにおいて、ゲインコンフィグレーション情報に続ぐ実際のサブフレームのゲインを導出する符号化列については、まず、値 glが続き、さらに、値 d elta— gxが続く。ィ直 glは、サブフレーム 1に含まれるオーディオ信号の最大振幅などを利用して求められたゲインを符号化することで得られる値である。値 delta— gxは、サブフレーム X— 1のゲインとサブフレーム Xのゲインとの差を符号化することで得られる値である。 Xは 2以上の整数値であり、 Xの最大値はサブフレーム数（図 5では 4)である。

[0060] 値 gl及び値 delta— gxに対して、後述する復号化処理を行うことで、それぞれ、 G1 及び delta— Gxが導出される。 G1は、サブフレーム 1のゲインを示す値である。 delt a— Gxは、サブフレーム x— 1のゲインとサブフレーム xのゲインとの差を示す値であ

[0061] 1つのフレームでゲインの値が 1つの場合は、符号化処理では、符号化された値 gl のみがゲインコンフィグレーション情報に続く。復号化処理では、値 glからゲイン G1 を導出し、 G1 =G2 = G3 = G4とする。 1つのフレームでゲインの値が 2つ以上の異なる値である場合は、符号化処理では、値 glに続いて、値 delta— g2、 delta— g3、 delta— g4が続く。復号化処理では、まず、値 glからゲイン G1を導出する。続いて、 delta— g2を復号化した値である delta— G2から、 G2 = G1 + delta— G2を算出する。以下、 delta— g3及び delta— g4を復号化し、順次、ゲイン G3及び G4を算出す

[0062] 図 6はビットストリームシンタックスの一例であり、図 5の符号化ストリーム構造例をより具体的に示したものである。 "syntax"側に書かれたものがビットストリームシンタックスの一例で、 "number of bits"がその際に使用されるビット数の一例である。 synt axにボールドフォントのイタリック体で記載されたもの力 S、ビットストリームとして符号化されるべきものである。ボールドフォントでないイタリック体で記載されたものは、一度ビットストリームとして読み込まれた場合にその値を保持した変数である。ビット数で記載のある numGainBits、 numMonoDeltaBits及び numDeltaBitsは、実装の際に、ある整数値があてがわれる。

[0063] 図 6において、 bs— multi— gainは、ゲインが単一であるの力、、複数のサブフレームで少なくとも 2つ以上の異なる値からなるのかを識別するフラグ情報である。すなわち、図 5のゲインコンフィグレーション情報の先頭の値を示す。例として、図 5と同様に、 bs― multi― gainが 0であれば'、ゲインは単一であることを示す。 bs― multi― gain 力 S iであれば複数のサブフレームで少なくとも 2つ以上の異なる値からなることを示す

〇

[0064」 bs一 same一 gain[num」（ま、 num— 1番目のサフ、、フレーム (以下、 num— 1サフ、、フレームと記す）のゲインと、 num番目のサブフレーム（以下、 numサブフレームと記す )のゲインとが同一であるかどうかを識別するフラグ情報である。すなわち、図 5のゲインコンフィグレーション情報の "_x"、 "y"、 "z "を示す。例として、 bs— same— gain [nu m]が 0である場合は、 num— 1サブフレームと numサブフレームのゲインが同一であることを示す。 bs— same— gain [num]が 1である場合は、違う値のゲインであることを示す。

[0065] bs— gain[0]は、ゲインを導出するために用いられる値である。ゲインが単一である

(bs— multi— gainが 0である）場合は、 bs— gain[0]を用いて導出されるゲイン値が、全てのサブフレームのゲイン値である。複数のサブフレームで少なくとも 2つ以上の異なる値からなる（bs— multi— gainが 1である）場合は、 bs— gain[0]を用いて導出されるゲイン値は、最初のサブフレームのゲイン値である。

[0066] bs— same— gain[num]が 0であるフレームにおいては、 numが小さなフレームから順に、 num— 1サブフレームと numサブフレームのゲインの差を導出（又は、 num サブフレームのゲイン値を導出）する値を、 bs— delta [num]として符号化して!/、る。

[0067] 図 6に示す syntaxでは、 bs— same— gain [num]が全て 0である場合に備え、例外処理を行う記載がなされている。ここでは、例外処理として、ゲインが単調増加することを意味している。したがって、あるサブフレームとその直前のサブフレームとの差分を導出する値を bs— mono— deltaとして符号化している。すなわち、 bs— mono —deltaは、単調増加の増加割合を導出するための値である。よって、単調増加の増加量を直接符号化してもよぐまた、間接的にテーブルなどから導出してもよい。

[0068] 次に、本実施の形態のオーディオ信号符号化装置の動作について説明する。

[0069] 図 7は、本実施の形態のオーディオ信号符号化装置の動作を示すフローチャートである。

[0070] 判断部 301は、オーディオ信号列が入力されると、フレーム符号化処理モード及びサブフレーム符号化モードのいずれかを選択する（S 101)。すなわち、図 6の bs— m ulti— gainを決定する。フレーム符号化モードが選択された場合（S 101で No)、ォ一ディォ信号列をフレーム処理部 310へ出力する。この場合、フレーム処理部 310 において、 bs— multi— gainが 0と設定される。サブフレーム符号化モードが選択された場合（S 101で Yes)、オーディオ信号列をサブフレーム処理部 320へ出力する。この場合、サブフレーム処理部 320において、 bs— multi— gainが 1と設定される。

[0071] 具体的には、判断部 301は、オーディオ信号列の最大振幅を用いてオーディオ信号列の変動を検出する。オーディオ信号に変動がほとんどない場合、例えば、最大振幅がある閾値以下である場合は、フレーム毎で量子化及び符号化するべきであり、オーディオ信号列をフレーム処理部 310へ出力する。逆に、最大振幅がある閾値より大きい場合は、サブフレーム毎で量子化及び符号化するべきであり、オーディオ信号列をサブフレーム処理部 320へ出力する。図 4の例のオーディオ信号列は変動が大きいために、サブフレーム処理部 320へ出力され、サブフレーム毎に量子化及び符号化される。

[0072] サブフレーム符号化モードが選択された場合（S 101で Yes)、サブフレーム量子化部 325は、サブフレーム毎にゲインを決定し、決定されたゲインの相互関係を検出する（S 102)。具体的には、サブフレーム毎に決定されたゲイン値が同じ値であるか、異なる値であるかを検出する。すなわち、図 5の "x"、 'V"、 "z"に相当する値を検出する。

[0073] 次に、検出された相互関係（サブフレーム毎のゲインの値)を判断する（S 103)。決定されたゲイン力 S、複数のサブフレームで少なくとも 2つ以上の異なる値である場合（

S 103で Yes)、サブフレーム毎にゲインを導出する（S 104)。

[0074] 具体的には、サブフレーム毎に決定されたゲインの値に対して、 1番目のサブフレームのゲインの値との差を算出する。

[0075] 決定されたゲイン力 S、全てのサブフレームで同じ値である場合（S 103で No)、例外処理を実行する（S 105)。ここでは、例外処理の一例として、決定されたゲインが単調増加（又は単調減少）するものとみなす。

[0076] 図 8は、例外処理が起こる可能性があるオーディオ信号列の一例を示す図である。なお、このようなオーディオ信号列は、ノイズに近い音から楽音などにフェードインする場合などに生じる。

[0077] 同図に示すオーディオ信号列が入力されると、判断部 301は、サブフレーム毎の最大振幅を用いることでオーディオ信号の変動が大きいと判断することができ、サブフレーム符号化モードを選択する。このとき、サブフレーム量子化部 325は、サブフレームに含まれるオーディオ信号列をエネルギーレベルで判断することでゲイン値を決定するものとする。図 8に示す例では、サブフレーム 1〜サブフレーム 4のエネルギーは、ほぼ等しい。したがって、ゲイン値は全てのサブフレームで単一の等しい値となる。つまり、ゲインコンフィグレーション情報は" 1000"となる。

[0078] なお、仮に図 8に示すオーディオ信号列に対して、判断部 301でフレーム符号化モードが選択されたとすると、サブフレーム 1〜サブフレーム 4を 1つのフレームとして判断され、単一のゲイン値が決定される。これにより、サブフレーム符号化モードを選択したにもかかわらず、フレーム符号化モードが選択された場合と同じ結果が出力される。すなわち、サブフレーム符号化モードが選択されたことが無駄になる。

[0079] 以上のように、サブフレーム符号化モードが選択されたことが無駄になることを防ぐために、ゲインコンフィグレーション情報が" 1000"となった場合に、例外処理として、ゲインが単調増加するものとみなして、サブフレーム毎にゲインの量子化及び符号化処理を実行する。

[0080] なお、選択処理（S101)において、フレーム符号化モードが選択された場合（S10 1で No)、フレーム毎で 1つのゲインを決定し、決定されたゲインを量子化及び符号化する（S106)。

[0081] 1つのフレームに対して、上記の処理（S10；!〜 S106)が終了すると、次のフレームに対して、同じ処理を繰り返す。

[0082] 以上のように、本実施の形態では、サブフレーム符号化モードが選択された場合であっても、フレーム符号化モードが選択された場合と同様の結果が生じる場合に、例外的な処理を行う。これにより、処理が無駄になることを防ぐことができる。

[0083] ここで、本実施の形態との違いを明確にするために、従来のビットストリームシンタツ [0084] 図 10は、従来のビットストリームシンタックスの一例であり、このシンタックスは AAC 方式における複数のグルーピングと呼ばれるモジュールを構成するものである。このシンタックスにおいて、 window— sequenceが EIGHT— SHORT— SEQUENCE と同値になった場合に、 8つの MDCT (Modified Discrete Cosine Transform )係数列を何組かにグルーピングする構成である。 V、かにグループが構成されるかはビットストリーム変数である scale— factor— grouping (7ビット）で示される。具体的には、 8つの MDCT係数列が 1つ前の MDCT係数列とグループを構成するか否かを示す情報が各 1ビットずつの計 7ビットで符号化されるものである。全てのビットで同じグループとして構成される情報が示された場合では、 8つの MDCT係数列が 1つのグループとされ符号化及び復号化される定義となっているだけである。すなわち、ゲインの単調増加などの別の処理に移ることはない。本実施の形態のように、結果的に無駄が生じる場合に、無駄の発生を防ぐための例外処理を実行することはない。

[0085] 続いて、本実施の形態のオーディオ信号復号化方法を用いた装置について説明する。

[0086] 図 9は、本実施の形態のオーディオ信号復号化装置の構成図である。同図のォーディォ信号復号化装置 400は、符号化されたオーディオ信号を復号化する。オーディォ信号復号化装置 400は、ロスレス復号化部 401と、ポストフィルタ部 402と、ゲイン増幅部 403とを備える。なお、ロスレス復号化部 401と、ポストフィルタ部 402とは、図 1のロスレス復号化部 201と、ポストフィルタ部 202とに相当する。したがって、ロスレス復号化部 401と、ポストフィルタ部 402とについては説明を省略し、ゲイン増幅部 403について説明する。

[0087] ゲイン増幅部 403は、ポストフィルタ部 402から入力されるオーディオ信号に対して、サブフレーム毎に、復号化されたオーディオ信号を増幅する。

[0088] 以上のように、本実施の形態のオーディオ信号符号化方法及び復号化方法によれば、符号化時に無駄となりうる符号化パターンに対して例外処理を行うことで、有効に利用することができる。これにより、低遅延処理の利点を維持しつつ、音質劣化を抑え、かつ、高効率な符号化を達成することが可能となる。

[0089] 以上、本実施の形態のオーディオ信号符号化方法及び復号化方法について説明したが、以上の実施の形態に限定されることなぐ種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

[0090] 例えば、例外処理として、サブフレームが単調増加するとみなせる場合において、図 11に示すように、単調増加するサブフレームの個数を符号化してもよ!/、。

[0091] 図 11は、図 6とは異なる形態のビットストリームシンタックスの一例であり、図 5の符号化ストリーム構造例をより具体的に示したものである。 "syntax"側に書かれたものがビットストリームシンタックスの一例で、 "number of bits"がその際に使用されるビット数の一例である。 syntaxに、ボールドフォントのイタリック体で記載されたものが、ビットストリームとして符号化されるべきものである。ボールドフォントでないイタリック体で記載されたものは、一度ビットストリームとして読み込まれた場合にその値を保持した変数である。ビット数で己載のある numGainBits、 numSubFrBits、 numMon oDeltaBits及び numDeltaBitsは、実装の際に、ある整数値があてがわれる。

[0092」こお!/、て、 bs一 multi一 gain、 bs一 same一 gain[num」及び bs一 gain [0」（ま

、図 6の bs一 multi一 gain、 bs一 same一 gain[num]及び bs一 gain[0]と | じであ^) 。よって、これらについての説明は省略する。

[0093] 図 11において、図 6と同様に bs— same— gain[num]がすべて 0である場合においては、単調増加を意味している。 bs— num— contは、いくつのサブフレームが単調増加するのかを導出する値である。そして、単調増加する個数のサブフレームにお!/、ては、あるサブフレームとその直前にサブフレームとの差分を導出する値を bs— mono— deltaとして符号化している。例えば、全サブフレーム数が 8つで、 bs— num —contによって 3つが単調増加であると導出される場合、サブフレーム 1からサブフレーム 2、サブフレーム 2からサブフレーム 3、サブフレーム 3からサブフレーム 4と bs —mono— deltaで導出される差分値でゲインは単調増加する。それ以降のサブフレーム、つまり、サブフレーム 5からサブフレーム 8は、例えば、サブフレーム 4と同一のィ直をとるとする。

[0094] 一方、 bs— same— gain[num]が 0であるフレームにおいては、 numが小さなフレームから順に、 num— 1サブフレームのゲインと numサブフレームのゲインとの差を導出（又は、 numサブフレームのゲイン値を導出）する値を、 bs delta [num]として符号化している。

[0095] 以上のように、図 11のビットストリームシンタックスでは、例外処理を実施する場合において単調増加するサブフレームの個数を符号化することができる。これにより、符号化効率を高めることができる。

[0096] また、本実施の形態では、判断部 301は、オーディオ信号の最大振幅を用いて、フレーム符号化モードとサブフレーム符号化モードとを選択したが、最大振幅ではなく、オーディオ信号のエネルギーを用いてもよい。

[0097] この場合であっても、図 12に示すようなオーディオ信号列が入力された場合、例外処理を行う必要がある。図 12は、例外処理が起こる可能性があるオーディオ信号列の一例を示す図であり、例えば、弦楽器又は打楽器で演奏された音源の場合のォーディォ信号列をしめす。弦楽器又は打楽器の場合、一音あたりの強度 (最大振幅）は同じであるが、サブフレームに入る数が違うため、図 12に示すようなオーディオ信号列が得られる。

[0098] 図 12に示すように、判断部 301は、サブフレーム毎のエネルギーの変動が大きいこと力、ら、サブフレーム符号化モードを選択する。このとき、サブフレーム量子化部 325 は、サブフレームに含まれるオーディオ信号歹 IJを最大振幅で判断することでゲイン値を決定するものとする。図 12に示す例では、サブフレーム 1〜サブフレーム 4の最大振幅はほぼ等しい。したがって、ゲイン値は全てのサブフレームで単一の等しい値となる。つまり、ゲインコンフィグレーション情報は" 1000"となる。これにより、サブフレーム量子化部 325は、図 8の場合と同様に、例外処理を実行することとなる。

[0099] また、判断部 301は、エネルギーを用いて判定し、サブフレーム符号化モードを選択した場合であっても、制限によりビットレートを上げることができない場合が考えられる。この場合、結果的に、各サブフレームでビット消費の小さいものを選択せざるを得なくなり、各サブフレームで同じ符号化処理を選択する。この場合も、ゲインコンフイダレーシヨン情報は" 1000"となる。これにより、図 8及び図 12の場合と同様に、サブフレーム量子化部 325は、例外処理を実行することになる。

[0100] また、図 13に示すように、 AACなどの方式では、フレーム間の接続における連続性確保のため、時間的に前後するフレームがサブフレーム符号化モードで符号化されて!/、る場合、符号化の規程により現フレームもサブフレーム符号化を選択せざるを得なくなる。これにより、現フレームのオーディオ信号列に変動がほとんどないのであれば、ゲインコンフィグレーション情報は" 1000"となる。これにより、サブフレーム量子化部 325は、例外処理を実行することとなる。

[0101] また、本実施の形態では、ゲインの値を導出する際に、ゲインの値が予め用意されたテーブルなどで定義されていてもよい。この場合は、 Gl =table (gl)などの方法で復号化される場合もあり、その場合は、 G2 = table (gl + g2)や、 G2 = table (gl) + table2 (g2)などとして復号化される場合もある。

[0102] ゲインのコンフィグレーション情報によって、単調増加（単調減少）と定義された場合においては、 G2力、ら G4のィ直は、 Gp = Gp- l + delta Gp、 Gp = table (gp - 1 + g p)、又は、 Gp = table (gp—l) +tablep (gp)などのように復号化される。この場合 p は 2以上の整数である。

[0103] また、 2つ以上のゲインの符号化において、差分符号化などを用いたが、差分情報を用いず、 2つ目以降のゲインについて、前サブフレームのィ直を用いずにそのサブフレームの値を直接復号化できる値を用いてもょレ、。

[0104] また、本実施の形態では、フレーム毎での処理とサブフレーム毎の処理とを明確に分けて示すために、オーディオ信号符号化装置 300は、図 3に示すようにフレーム処理部 310とサブフレーム処理部 320とを備えるとした力例えば、聴覚モデル 313と聴覚モデル 323、プレフィルタ部 314とプレフィルタ部 324、及び、ロスレス符号化部 316とロスレス符号化部 326とは、それぞれ共通としてもよい。

[0105] (実施の形態 2)

本実施の形態のオーディオ信号符号化方法及び復号化方法では、ロスレス符号化を行う際の符号化効率に影響を与える量子化精度情報に対して、符号化及び復号化を行う。すなわち、符号化及び復号化の対象がゲインではなぐ量子化精度情報であるのが実施の形態 1と異なる点である。本実施の形態では、実施の形態 1と同じ点は説明を省略し、異なる点を中心に説明する。

[0106] 本実施の形態のオーディオ信号符号化方法を実施する装置は、実施の形態 1と同様に図 3に示すオーディオ信号符号化装置である。 [0107] 本実施の形態において、サブフレーム量子化部 325は、量子化精度情報を量子化する。例えば、聴感上、重要なサンプルのオーディオ信号に対しては、十分な量子化精度を保持するために、量子化精度情報 Rpを小さな値に設定する。

[0108] サブフレーム量子化部 325に入力されるオーディオ信号を、 y(i)として、量子化精度情報を Rpとした場合、量子化の対象となる z (i)について、式 2で示すような関係が得られる。

[0109] (式 2) y(i) = Rp X z (i)

[0110] 式 2のような関係から、量子化精度情報 Rpを決定することで、 z (i)が導出される。一般に、 z (i)は実数値であるので、サブフレーム量子化部 325は、実数値である z (i)を整数値に量子化する。そして、量子化された z (i)をロスレス符号化部 326へ出力する

[0111] 実施の形態 1に示した式 1と式 2を比較して判るように、ゲイン Gpが量子化精度情報 Rpになり、それに伴い x(i)力 S_z (i)になっただけである。それ以外のモジュール、例えばロスレス符号化部 326や聴覚モデル 323などに変更はない。

[0112] 以上のように、本実施の形態のオーディオ信号符号化方法及び復号化方法では、音質劣化を抑え、聴感上、重要なサンプルのオーディオ信号に対して、量子化精度情報 Rpを小さな値に設定することで、結果 z (i)の絶対値を大きくすることができる。これにより、実数力整数値に変換する量子化の過程で生じる量子化誤差の影響を小さくすることが可能となる。

[0113] (実施の形態 3)

本実施の形態のオーディオ信号符号化方法及び復号化方法は、時間周波数変換を有するオーディオ信号符号化及び復号化方法へ適用することができる。この点が、実施の形態 1及び 2が、主に時間周波数変換処理を伴わない、いわゆる時間領域の符号化及び復号化方法であったこととの相違点である。

[0114] 1つ目の適用は、 MPEG2— AACに代表される、複数の変換長を有する一括直交変換方式における系への適用である。

[0115] この系では、入力されたオーディオ信号をあるサンプルごとにフレームを構成し、そのフレームのサンプルを一括直交変換して周波数スペクトル列を生成し、そのスぺクトルを量子化及び符号化するものである。 1フレームに対して 1つの一括直交変換する場合と、 1フレームに対して時間的に連続な複数の一括直交変換する場合とを切り替えて使用する。

[0116] 1フレームに対して、時間的に連続な複数の一括直交変換をして、各々の一括直交変換から周波数スペクトル列を得るとき、各々の周波数スペクトル列に対する代表ゲインに対して、実施の形態 1で述べた符号化方法を適用することで、符号化効率を高めることが可能となる。

[0117] 2つ目の適用は、 Low Delay AACに代表される、単一の変換長を有する一括直交変換方式における系への適用である。

[0118] この系では、入力されたオーディオ信号をあるサンプルごとにフレームを構成し、そのフレームのサンプルを一括直交変換して周波数スペクトル列を生成し、そのスぺクトルを量子化及び符号化するものである。 1フレームに対して 1つの直交変換を施すものである。

[0119] したがって、 1フレームに対して 1つの直交変換しかないため、 1フレーム内の時間的な変動を得られない。この場合は、時間的な変動情報を直交変換とは関係なぐ別途、予め時間的な複数のサブフレームを構成しておいて、その時間的なゲイン情報を量子化し符号化するのに複数のサブフレームを用いる。復号化のプロセスでは、一括直交変換で復号化された 1フレームのオーディオ信号に対して、前記の時間的なゲイン情報で補正するなどに複数のサブフレームを用いてもょレ、。

[0120] 若しくは、 1つの直交変換から得られる周波数スペクトル列に対して、周波数軸上で、複数のサブバンド（時間軸上のサブフレームに相当する）に分割して、各々のサブバンドに対する代表ゲインに対して、実施の形態 1で述べた符号化方法を適用することで、符号化効率を高めることも可能である。

[0121] 3つ目の適用は、 QMF (Quadrature Mirror Filter)フィルタに代表される、時間周波数マトリクスを構成するポリフェーズフィルター方式における系への適用である

[0122] この系では、複数の周波数サブバンドにおける複数サンプルからなる時間信号列力 S得られるものである。したがって、ある時間サンプルにおける複数の周波数サブバンドの信号のゲインに対して、実施の形態 1で述べた符号化方法を適用してもよい。また、ある周波数サブバンドを選んで、その周波数サブバンドの複数サンプルからなる時間信号列に対して、 1つ毎又は幾つか毎に、グルーピングした代表ゲインに対して、実施の形態 1で述べた符号化方法を適用してもよい。

[0123] 4つ目の適用は、 3つ目の適用であるポリフェーズフィルター方式に加えて、追加処理として、 DCTに代表される一括直交変換を加えた系における適用である。

[0124] この系では、ポリフェーズフィルター方式での出力は 3つ目の適用と同様であるが、サブバンドの周波数間隔が大き!/、場合などにお!/、ては、特に低域成分の周波数分解能が不足する。したがって、低域周波数成分の周波数分解能を向上させるため、ポリフェーズフィルターからの出力のうち、低域周波数成分に相当する時間信号列に対して、離散コサイン変換 (DCT変換)などの直交変換を用いて、時間周波数変換し、低域の周波数分解能を向上させるものである。

[0125] この 4つ目の適用では、前記 2つ目と 3つ目の適用の組み合わせで実現でき、例えば、低域においては、 2つ目の適用と同様の手法をとり、高域においては、 3つ目の手法を適用することができ、同様に符号化効率を高めることができる。

[0126] 以上、オーディオ信号符号化方法及び復号化方法における時間周波数変換を有する様々な系においても、基本的に実施の形態 1と同様の符号化方法及び復号化方法を用いれば、符号化効率を高めることができる。上記ではゲインの符号化について、述べたが、量子化精度に置き換えて実施の形態 2と同様の符号化方法及び復号化方法を実施しても、同じように符号化効率の向上が期待できる。

[0127] 以上のように、本実施の形態のオーディオ信号符号化方法及び復号化方法は、符号化対象をいくつかのグループ（例えば、時間軸上のフレーム及び周波数軸上のバンド）に分割して符号化する場合に、さらに、 1つのグループを複数のサブグループ（例えば、時間軸上のサブフレーム及び周波数軸上のサブバンド）に分割して、サブグループ毎に符号化する場合に適用することができる。

[0128] 以上、本発明のオーディオ信号符号化方法及び復号化方法について、実施の形態に基づいて説明した力本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。

[0129] 例えば、本実施の形態では、例外処理としてゲイン値などを単調増加又は単調減少するものとみなす処理を用いたが、通常の処理でなければいかなる処理であってもよい。例えば、サブフレーム毎にゲイン値などが大小 2つの値を交互にとるとみなす処理でもよい。また、サブフレーム毎にゲインィ直などがあらかじめ定められた規則に従って変動するとみなす処理でもよレ、。

[0130] また、本実施の形態では、ゲイン値又は量子化精度を決定する値を量子化及び符号化するとしたが、量子化及び符号化の対象はこれらに限られない。オーディオ信号の符号化に関する他の値を量子化及び符号化するとしてもよい。

[0131] 本発明のオーディオ信号符号化方法及び復号化方法に含まれるステップをコンビユータに実行させるプログラムとして実現したり、そのプログラムを記録したコンビユータ読み取り可能な CD— ROMなどの記録媒体として実現したり、そのプログラムを示す情報、データ又は信号として実現したりすることもできる。そして、それらプログラム、情報、データ及び信号は、インターネット等の通信ネットワークを介して配信してもよい。

産業上の利用可能性

[0132] 本発明のオーディオ信号符号化方法及び復号化方法は、従来からオーディオ符号化及び復号化方法が適用されていたあらゆるアプリケーションにおいて、適用可能である。特に放送コンテンツの伝送、 DVDや SDカードなどの蓄積媒体に記録され再生される応用、携帯電話に代表される通信機器に AVコンテンツを伝送する場合などに用いることができる。また、インターネット上でやりとりされる電子データとして、オーディオ信号を伝送する場合においても有用である。

Claims

請求の範囲

[1] オーディオ信号を符号化するオーディオ信号符号化方法であって、

前記オーディオ信号を複数のサンプル毎に分割したフレームに含まれるオーディォ信号に基づレ、て、前記フレームを 2以上に分割したサブフレーム毎に符号化すベきか否かを前記フレーム毎に判断する判断ステップと、

前記サブフレーム毎に符号化すべきと判断された場合に、前記サブフレーム毎に、該サブフレームのオーディオ信号の特性を示す値を決定し、決定された前記値を用いて前記オーディオ信号を符号化するサブフレーム処理ステップとを含み、

前記サブフレーム処理ステップでは、

前記サブフレーム毎に決定された前記値が全て同じであるか否かを判定し、前記値が全て同じである場合、例外処理として前記値が示すオーディオ信号の特性とは異なる特性を用いて、前記オーディオ信号を符号化する

ことを特徴とするオーディオ信号符号化方法。

[2] 前記サブフレーム処理ステップでは、

隣接するサブフレーム間で前記値が同じ値であるか異なる値であるかを識別する識別符号を、全てのサブフレーム間に対して符号化し、

全ての前記識別符号が、全ての前記値が同じであることを示す場合に、前記例外処理として前記値が示すオーディオ信号の特性とは異なる特性を用いて、前記ォーディォ信号を符号化する

ことを特徴とする請求項 1記載のオーディオ信号符号化方法。

[3] 前記例外処理では、前記値が、隣接するサブフレーム間において単調増加するものとみなすことで、前記オーディオ信号を符号化する

[4] 前記例外処理では、前記値が、隣接するサブフレーム間において単調減少するものとみなすことで、前記オーディオ信号を符号化する

[5] 前記値は、前記オーディオ信号の正規化に用いられるゲイン値である

ことを特徴とする請求項;!〜 4のいずれか 1項に記載のオーディオ信号符号化方法 [6] 前記値は、量子化精度を決定する値である

ことを特徴とする請求項;!〜 4のいずれか 1項に記載のオーディオ信号符号化方法

[7] 請求項 1記載のオーディオ信号符号化方法によって符号化されたオーディオ信号の符号化列を復号化するオーディオ信号復号化方法であって、

前記符号化列が前記サブフレーム処理で符号化されて!/、る場合、前記例外処理が実行されてレ、ることを識別することで、前記符号化列を復号化する復号化ステップを含む

ことを特徴とするオーディオ信号復号化方法。

[8] オーディオ信号を符号化するオーディオ信号符号化装置であって、

前記オーディオ信号を複数のサンプル毎に分割したフレームに含まれるオーディォ信号に基づレ、て、前記フレームを 2以上に分割したサブフレーム毎に符号化すベきか否かを前記フレーム毎に判断する判断手段と、

前記サブフレーム毎に符号化すべきと判断された場合に、前記サブフレーム毎に、該サブフレームのオーディオ信号の特性を示す値を決定し、決定された前記値を用いて前記オーディオ信号を符号化するサブフレーム処理手段とを備え、

前記サブフレーム処理手段は、

ことを特徴とするオーディオ信号符号化装置。

[9] 請求項 9記載のオーディオ信号符号化装置によって符号化されたオーディオ信号の符号化列を復号化するオーディオ信号復号化装置であって、

前記符号化列が前記サブフレーム処理で符号化されて!/、る場合、前記例外処理が実行されて!/、ることを識別することで、前記符号化列を復号化する復号化手段を備える

ことを特徴とするオーディオ信号復号化装置。 [[1100]] オオーーデディィオオ信信号号をを符符号号化化すするるオオーーデディィオオ信信号号符符号号化化方方法法ををココンンピピュューータタにに実実行行ささせせるるププロロググララムムででああっってて、、

前前記記オオーーデディィオオ信信号号をを複複数数ののササンンププルル毎毎にに分分割割ししたたフフレレーームムにに含含ままれれるるオオーーデディィォォ信信号号にに基基づづレレ、、てて、、前前記記フフレレーームムをを 22以以上上にに分分割割ししたたササブブフフレレーームム毎毎にに符符号号化化すすベベききかか否否かかをを前前記記フフレレーームム毎毎にに判判断断すするる判判断断スステテッッププとと、、

前前記記ササブブフフレレーームム毎毎にに符符号号化化すすべべききとと判判断断さされれたた場場合合にに、、前前記記ササブブフフレレーームム毎毎にに、、該該ササブブフフレレーームムののオオーーデディィオオ信信号号のの特特性性をを示示すす値値をを決決定定しし、、決決定定さされれたた前前記記値値をを用用いいてて前前記記オオーーデディィオオ信信号号をを符符号号化化すするるササブブフフレレーームム処処理理スステテッッププととをを含含みみ、、

前前記記ササブブフフレレーームム処処理理スステテッッププでではは、、

前前記記ササブブフフレレーームム毎毎にに決決定定さされれたた前前記記値値がが全全てて同同じじででああるるかか否否かかをを判判定定しし、、前前記記値値がが全全てて同同じじででああるる場場合合、、例例外外処処理理ととししてて前前記記値値がが示示すすオオーーデディィオオ信信号号のの特特性性ととはは異異ななるる特特性性をを用用いいてて、、前前記記オオーーデディィオオ信信号号をを符符号号化化すするる

[[1111]] 請請求求項項 1100記記載載ののププロロググララムムをを記記録録すするるココンンピピュューータタ読読みみ取取りり可可能能なな記記録録媒媒体体。。