JP5434592B2

JP5434592B2 - オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム

Info

Publication number: JP5434592B2
Application number: JP2009520622A
Authority: JP
Inventors: 修嶋田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2007-06-27
Filing date: 2008-06-25
Publication date: 2014-03-05
Anticipated expiration: 2028-06-25
Also published as: EP2159790A1; WO2009001874A1; JPWO2009001874A1; US8788264B2; EP2159790B1; US20100106509A1; EP2159790A4

Description

本発明は、オーディオ符号化・復号技術に関し、特に、オーディオ信号のスケーリングに用いるゲイン情報を符号化・復号する技術に関する。

一般的なオーディオ信号（音響／音声信号）を、少ない情報量で符号化でき、かつ高品質な再生信号を得られる技術として、帯域分割符号化を利用する方法が広く知られている。このような帯域分割を利用した符号化の代表例としては、ＩＳＯ／ＩＥＣの国際標準方式であるＭＰＥＧ−２ＡＡＣ（Advanced Audio Coding）がある。
ＡＡＣ方式では、符号化の際に、時間信号を周波数変換した信号Ｘを複数まとめたバンド単位で、次の式（１）に表されるスケーリングと量子化を行う。ここで、ａｂｓ(Ｘ)はＸの絶対値を表し、Ｇはゲイン情報、αは適当な定数値である。

あるバンド内では共通のゲイン情報Ｇを用いて信号Ｘをスケーリングし、スケーリング後の信号を量子化する。ゲイン情報Ｇは、オーディオ信号の特性と人間の聴覚特性に基づいて決定される。
量子化信号Ｘｑとゲイン情報Ｇは符号化され、符号化情報をビットストリームに書き込む。ゲイン情報Ｇは、初期値Ａと次の式（２）で表される隣接バンドとのゲイン差分ｄ_ｓｃｆとから表す。ここで、ｉはバンド番号のインデックスを表し、Ｇ(−１)を初期値Ａとする。

ＡＡＣ方式では、初期値Ａを８ビットで符号化し、ゲイン差分をハフマン符号化する。ここで用いるハフマン符号長は、ゲイン差分の絶対値が小さい場合に符号長が短くなり、ゲイン差分の絶対値が大きい場合に符号長が長くなるように設計されている。
復号側では、初期値Ａとハフマン復号したゲイン差分ｄ_ｓｃｆからゲイン情報Ｇを次の式（３）に従い生成する。ここで、ｉはバンド番号のインデックスを表し、Ｇ(−１)を初期値Ａとする。

次に、ゲイン情報Ｇと量子化信号Ｘｑを用いて、次の式（４）に従い、逆量子化を行う。逆量子化した信号Ｘを時間信号に変換すると、出力オーディオ信号が得られる。

ゲイン差分の符号量を少なくする従来例として、特開２００２−２６８６９３号公報で開示されている方法がある。図１０は、従来のオーディオ符号化・復号装置の構成を示すブロック図である。この図１０を参照すると、従来のゲイン差分を少なくする方法は、周波数バンド統合部において、複数のバンドをまとめ、ゲイン計算部において、複数のバンドで共通のゲインを算出する。共通のゲインを使用するバンド間の差分を０としてハフマン符号量を削減することにより、ゲイン情報の符号量を削減している。

しかしながら、このような従来技術では、初期ゲインＡを必ず符号化する必要があり、ゲイン情報の符号量を削減するには不十分である。また、特許文献１に記載されている技術では、複数の周波数バンドで同一のゲインを適用しているため、最小単位のバンドでの細かな制御ができないので音質が不十分である。
本発明はこのような課題を解決するためのものであり、ゲイン情報の符号量を効率よく削減でき、高品質に符号化・復号できるオーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システムを提供することを目的としている。

このような目的を達成するために、本発明にかかるオーディオ符号化方法は、入力オーディオ信号をフレーム単位で周波数信号に変換する直交変換ステップと、直交変換ステップで得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これらゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出するゲイン計算ステップと、ゲイン計算ステップで得られた修正ゲインを用いて周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成する量子化ステップと、ゲイン計算ステップで得られた修正ゲインとこれに対応する過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成するゲイン符号化ステップと、量子化ステップで得られた量子化信号とゲイン符号化ステップで得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成する多重化ステップとを備えている。

また、本発明にかかるオーディオ復号方法は、フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離ステップと、過去のフレームで用いたゲインをバンド単位で記憶部により記憶する記憶ステップと、記憶部から取得した過去のフレームのゲインと分離ステップで分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号ステップと、ゲイン復号ステップで得られたゲインに基づいて、分離ステップで分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化ステップと、逆量子化ステップで得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換ステップとを備えている。

また、本発明にかかるオーディオ符号化装置は、入力オーディオ信号をフレーム単位で周波数信号に変換する直交変換部と、直交変換部で得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これらゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出するゲイン計算部と、ゲイン計算部で得られた修正ゲインを用いて周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成する量子化部と、ゲイン計算部で得られた修正ゲインとこれに対応する過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成するゲイン符号化部と、量子化部で得られた量子化信号とゲイン符号化部で得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成する多重化部とを備えている。

また、本発明にかかるオーディオ復号装置は、フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離部と、過去のフレームで用いたゲインをバンド単位で記憶する記憶部と、記憶部から取得した過去のフレームのゲインと分離部で分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号部と、ゲイン復号部で得られたゲインに基づいて、分離部で分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化部と、逆量子化部で得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換部とを備えている。

また、本発明にかかるプログラムは、オーディオ符号化装置のコンピュータで、上述したいずれかのオーディオ符号化方法を実行させるためのプログラムである。
また、本発明にかかるプログラムは、オーディオ復号装置のコンピュータで、上述したいずれかのオーディオ復号方法を実行させるためのプログラムである。

また、本発明にかかるオーディオ符号化・復号システムは、入力オーディオ信号を符号化して符号化オーディオデータを生成するオーディオ符号化装置と、このオーディオ符号化装置で生成された符号化オーディオデータを復号して、復号オーディオ信号を生成するオーディオ復号装置とから構成され、オーディオ符号化装置は、入力オーディオ信号をフレーム単位で周波数信号に変換する直交変換部と、直交変換部で得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これらゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出するゲイン計算部と、ゲイン計算部で得られた修正ゲインを用いて周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成する量子化部と、ゲイン計算部で得られた修正ゲインとこれに対応する過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成するゲイン符号化部と、量子化部で得られた量子化信号とゲイン符号化部で得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成する多重化部とを備え、オーディオ復号装置は、フレームごとに入力される、オーディオ符号化装置で生成された符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離部と、過去のフレームで用いたゲインをバンド単位で記憶する記憶部と、記憶部から取得した過去のフレームのゲインと分離部で分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号部と、ゲイン復号部で得られたゲインに基づいて、分離部で分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化部と、逆量子化部で得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換部とを備えている。

本発明によれば、過去フレームのゲインと初期ゲインから、量子化歪量を増加させないでゲイン符号量を抑制するようにゲイン情報を修正するため、最小単位のバンドでゲインを制御できると同時に、ゲイン情報の符号量を削減することができる。また、予め定めた変換式に従い、ゲインを算出することにより、低演算量で音質を向上することができる。その結果、抑制したゲイン符号量を量子化信号の符号量に費やすことができるため、高品質なオーディオ符号化復号方法、装置およびプログラムを実現することが可能となる。また、ゲイン符号量を抑制するため、従来よりも低ビットレートで、高品質なオーディオ符号化復号方法、装置およびプログラムを実現することが可能となる。

図１は、本発明の第１の実施形態にかかるオーディオ符号化装置の構成を示すブロック図である。図２は、本発明の第１の実施形態にかかるオーディオ符号化装置におけるゲイン修正動作を示すフローチャートである。図３は、本発明の第２の実施形態にかかるオーディオ復号装置の構成を示すブロック図である。図４は、本発明の第４の実施形態にかかるオーディオ符号化装置におけるゲイン修正動作を示すフローチャートである。図５は、初期ゲインと過去ゲインの差分と補正ゲインの関係を示すグラフである。図６は、本発明の第５の実施形態にかかるオーディオ符号化装置の構成を示すブロック図である。図７は、本発明の第６の実施形態にかかるオーディオ復号装置の構成を示すブロック図である。図８は、コンピュータで各機能部を実現した場合のオーディオ符号化装置の構成例を示すブロック図である。図９は、コンピュータで各機能部を実現した場合のオーディオ復号装置の構成例を示すブロック図である。図１０は、従来のオーディオ符号化・復号装置の構成を示すブロック図である。

次に、本発明の実施形態について図面を参照して説明する。
［第１の実施形態］
まず、図１を参照して、本発明の第１の実施形態にかかるオーディオ符号化装置について説明する。図１は、本発明の第１の実施形態にかかるオーディオ符号化装置の構成を示すブロック図である。
このオーディオ符号化装置１Ａは、入力された入力オーディオ信号１００を符号化処理してビットストリーム１０８を出力する機能を有しており、主な機能部として、直交変換部１０、心理聴覚分析部１１、ゲイン計算部１２、量子化部１３、ゲイン符号化部１４、および多重化部１５を備えている。

本実施形態は、直交変換部１０により、入力オーディオ信号をフレーム単位で周波数信号に変換し、ゲイン計算部１２により、直交変換部１０で得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これらゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出し、量子化部１３により、ゲイン計算部１２で得られた修正ゲインを用いて周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成し、ゲイン符号化部１４により、ゲイン計算部１２で得られた修正ゲインとこれに対応する過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成し、多重化部１５により、量子化部１３で得られた量子化信号とゲイン符号化部１４で得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成している。

直交変換部１０は、フレーム毎に入力オーディオ信号１００（時間信号）を分割し、周波数信号１０２に変換する。直交変換方法として、例えば、ＭＤＣＴ（変形離散コサイン変換：Modified Discrete Cosine Transform）がある。他にも、ＤＣＴ（離散コサイン変換：Discrete Cosine Transform）やＤＦＴ（離散フーリエ変換：Discrete Fourie Transform）、サブバンド変換などの方法でも周波数信号を算出することができる。

心理聴覚分析部１１は、入力オーディオ信号１００の特性と人間の聴覚特性とビットレートとから、量子化の際に発生する量子化雑音が知覚されないように、許容できる量子化雑音（許容量子化雑音、マスキング閾値）１０１を算出する。ここで、大きい音に近い周波数の音は聞こえにくいマスキング効果を積極的に利用することにより、高品質な許容量子化雑音を算出することができる。許容量子化雑音１０１は、周波数信号を複数まとめたバンド単位で算出する。バンド幅は、人間の聴覚特性に応じて、低周波数帯域ほど細かく、高周波数帯域ほど粗くする。

ゲイン計算部１２は、上述した式（１）に示される周波数信号の量子化の際に、周波数信号をスケーリングするときに使用する修正ゲイン１０４を算出する。さらに、過去のある１フレーム分のゲインＧ_ｏｌｄと過去ゲインのフレーム番号情報とから構成される過去ゲイン情報１０５を出力する。
ゲイン符号化部１４は、過去のある１フレーム分のゲインＧ_ｏｌｄと該フレームで使用する修正ゲイン１０４の差分を符号化する。差分ゲインの算出は、バンド単位で行う。該フレームの量子化で使用したゲインをＧとすると、符号化する差分ゲインは、以下の式（５）で表される。ここで、ｉはバンド番号のインデックスを表す。

差分ゲインを算出する際に使用した過去ゲインＧ_ｏｌｄのフレーム番号Ｆ_ｏｌｄと、該フレーム番号Ｆとから以下の式（６）で表されるフレーム番号情報ｄ_ｆｒａｍｅを算出する。

差分ゲインやフレーム番号情報は、ハフマン符号などのエントロピー符号化を行うと、さらに情報量を削減することができる。ハフマン符号を用いる場合には、差分ゲインの絶対値が小さいほど、符号長が短くなるように設計したほうが符号量を削減できる。なぜなら、時間方向の信号変化はなだらかであることの方が多いためである。フレーム番号情報も同様で、ｄ_ｆｒａｍｅの値が小さいほど符号長が短くなるように設計したほうが符号量を削減できる。ゲイン符号化部１４は、上述した方法で差分ゲインとフレーム番号情報を符号化し、ゲイン情報１０７を出力する。

量子化部１３は、ゲイン計算部１２で算出したゲインＧを用いて、式（１）で表されるように、周波数信号Ｘをバンド単位でスケーリングし、スケーリング後の周波数信号をバンド単位で量子化し、量子化信号Ｘｑ（１０６）を算出する。量子化信号Ｘｑはハフマン符号などのエントロピー符号化を行い、情報量を削減する。
多重化部１５は、ゲイン情報１０７と量子化信号１０６とをバンド単位で多重化し、符号化オーディオデータすなわちビットストリーム１０８を出力する。

［ゲイン計算部］
ここで、ゲイン計算部１２の動作についてさらに詳細に説明する。
ゲイン計算部１２には、主な機能部として、初期ゲイン計算部２０、ゲイン修正部２１、およびゲイン記憶部２２が設けられている。
初期ゲイン計算部２０は、許容量子化雑音１０１と周波数信号１０２とから、周波数信号１０２をスケーリングする初期ゲイン１０３をバンド単位で算出する。ゲインは、式（１）を適用する周波数信号の量子化の際に周波数信号をスケーリングするときに使用する。初期ゲイン１０３の算出は、量子化雑音が許容量子化雑音内に収まるように複数回の繰り返し処理で算出してもよいし、予め定めた変換式で算出してもよい。

ゲイン記憶部２２は、過去のフレームで使用したゲインとフレーム番号を記憶しておき、ゲイン修正部２１とゲイン符号化部１４とに過去フレームのゲインとそのフレーム番号とから校正される過去ゲイン情報１０５を出力する。

ゲイン修正部２１は、量子化歪を増加させないでゲイン情報の符号量が少なくなるようにゲインの修正を行う。図２は、本発明の第１の実施形態にかかるオーディオ符号化装置におけるゲイン計算動作を示すフローチャートである。ゲイン修正部２１では、ある過去のフレームｋのゲインに対して、全バンドのゲインを修正する。

まず、修正するバンド番号ｉの初期値を０として（ステップS001)、以下の式（７）に示すように、バンドｉの量子化時の歪に関する評価関数ｆ_ｄｉｓｔｏｒｔｉｏｎと、ゲインの符号量に関する評価関数ｆ_ｇａｉｎとから評価値Ｅｖａｌを算出する（ステップS002)。ここで、Ｇ_１、Ｇは、それぞれ、初期ゲイン、更新後のゲインを表す。Ｇ_ｏｌｄ(ｋ,ｉ)は、過去のフレームｋのゲインを表し、ゲインの符号化時に使用する過去フレームのゲインである。Ｘは周波数信号を表す。Ｇ＝Ｇ_１のとき、評価値Ｅｖａｌは０となる。

この式（７）で得られた計算結果である評価値Ｅｖａｌと更新後のゲインＧは保持しておく（ステップS003)。とり得る可能性のある全てのゲインで評価値を算出したかどうかを判定し（ステップS004)、全てのゲインで評価値を算出していない場合は、ゲインを更新し（ステップS009)、新たなゲインで再度評価値を算出する。全てのゲインで評価値を算出した場合、ステップS003で保存してある評価値Ｅｖａｌの中で最小の評価値をもつゲインをバンドｉの修正後のゲインとする（ステップS005)。

ＭａｘＢａｎｄを計算する周波数バンドの最大値とすると、ｉ＜ＭａｘＢａｎｄの場合（ステップS006)、バンド番号ｉの値を更新し（ステップS010)、次の周波数バンドのゲインを修正する。全バンドで修正後のゲインを算出した場合、過去フレームｋの評価値を、全バンドの修正後のゲインを用いたときの評価値の和とする。計算可能な過去フレーム全てで評価値を算出したかどうかを判定し（ステップS007)、計算可能な過去フレームがある場合は、過去フレームｋの値を更新し（ステップS011)、新たな過去フレームの評価値を算出する。

全ての過去フレームの評価値を算出した場合、過去フレームの評価値が最小であるフレームを過去フレームとして選択し、そのフレームｋと修正後のゲインを出力する（ステップS008)。
例えば、式（７）の関数Ｆは、量子化の歪に関する評価関数ｆ_ｄｉｓｔｏｒｔｉｏｎとゲインの符号量に関する評価関数ｆ_ｇａｉｎの和で表すことができる。また、線形変換や複雑な非線形変換をすることにより、精度の高い評価値を算出することもできる。

量子化の歪に関する評価関数ｆ_ｄｉｓｔｏｒｔｉｏｎは、ゲインをＧ_１(ｉ)からＧ(ｉ)に変更することによって増加または減少する歪量から算出される。例えば、実際に量子化を行って量子化歪を算出することで歪量の増減を算出することができる。量子化の歪量から評価関数ｆ_ｄｉｓｔｏｒｔｉｏｎの出力値への変換は、変換係数を加算または乗算することにより変換する。また、線形変換や複雑な非線形変換をすることにより、精度の高い評価値を算出することもできる。他の例として、演算量削減のために、実際の量子化歪の増減を算出せずに、近似式を用いて評価値を算出することもできる。

ゲインの符号量に関する評価関数ｆ_ｇａｉｎは、ゲインをＧ_１(ｉ)からＧ(ｉ)に変更することによって増加または減少するゲインの符号量から算出される。例えば、実際にゲインを符号化し、ゲインの符号量の増減を算出することができる。ゲイン符号量から評価関数ｆ_ｇａｉｎの出力値への変換は、変換係数を加算または乗算することにより変換する。また、線形変換や複雑な非線形変換をすることにより、精度の高い評価値を算出することもできる。他の例として、演算量削減のために、実際のゲイン符号量の増減を算出せずに、近似式を用いて評価値を算出することもできる。

上述した評価値は、量子化時の歪に関する評価関数ｆ_ｄｉｓｔｏｒｔｉｏｎと、ゲインの符号量に関する評価関数ｆ_ｇａｉｎとから算出されているが、他にも、量子化時の符号量から算出される評価関数ｆ_ｑｕａｎｔｉｚｅを用いて評価値を算出することもできる。量子化時の符号量から算出される評価関数ｆ_ｑｕａｎｔｉｚｅは、ゲインをＧ_１(ｉ)からＧ(ｉ)に変更することによって増加または減少する量子化信号を符号化したときの符号量から算出される。例えば、実際に量子化を行って符号化したときの符号量の増減から算出することができる。

量子化信号の符号量から評価関数ｆ_ｑｕａｎｔｉｚｅの出力値への変換は、変換係数を加算または乗算することにより変換する。また、線形変換や複雑な非線形変換をすることにより、精度の高い評価値を算出することもできる。他の例として、演算量削減のために、量子化信号の符号量の増減を算出せずに、近似式を用いて評価値を算出することもできる。

量子化時の符号量から算出される評価関数ｆ_ｑｕａｎｔｉｚｅを用いると、Ｇ_１(ｉ)からＧ(ｉ)に変更しても量子化時の符号量が変化しないように、または符号量が増加しないようにゲインの修正が可能となる。このように、量子化時の符号量から算出される評価関数ｆ_ｑｕａｎｔｉｚｅを用いると、高品質な評価値を算出することもできる。

これら３つの評価関数から評価値Ｅｖａｌを算出する際には、例えば、これら３つの評価関数の評価値の和としてもよいし、線形変換や複雑な非線形変換をすることにより評価値Ｅｖａｌを算出してもよい。また、これら３つの評価関数のうち１つまたは２つの評価関数を選択し、選択した評価関数の評価値から評価値Ｅｖａｌを算出してもよい。
さらに、とり得るゲインの範囲や、過去フレームの範囲を制限することにより、演算量およびメモリ量を削減できる。

量子化の歪に関する評価関数ｆ_ｄｉｓｔｏｒｔｉｏｎとゲインの符号量に関する評価関数ｆ_ｇａｉｎと量子化時の符号量から算出される評価関数ｆ_ｑｕａｎｔｉｚｅは、バンド番号ｉに応じて異なった式を用いてもよい。例えば、バンド番号が小さいとき、すなわち、周波数成分が低いときは、聴感上の印象に大きく影響を与えるため、高域周波数帯域よりも大きな評価値を出すように設計することで、品質を下げずにゲインを修正できる。

このように、本実施形態によれば、過去フレームのゲインと初期ゲインから、量子化歪量を増加させないでゲイン符号量を抑制するようにゲイン情報を修正しているため、最小単位のバンドでゲインを制御できると同時に、ゲイン情報の符号量を削減することができる。また、予め定めた変換式に従い、ゲインを算出することにより、低演算量で音質を向上することができる。
その結果、抑制したゲイン符号量を量子化信号の符号量に費やすことができるため、高品質で符号化することができる。

［第２の実施形態］
次に、図３を参照して、本発明の第２の実施形態にかかるオーディオ復号装置について説明する。図３は、本発明の第２の実施形態にかかるオーディオ復号装置の構成を示すブロック図である。
オーディオ復号装置３Ａは、上述したオーディオ符号化装置が出力したビットストリームを復号して復号信号を出力する機能を有しており、主な機能部として、分離部３０、ゲイン記憶部３１、ゲイン復号部３２、逆量子化部３３、および直交変換部３４を備えている。このオーディオ復号装置３Ａは、本発明の第１の実施形態にかかるオーディオ符号化装置１Ａと組として使用される。

本実施形態では、分離部３０により、フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離し、ゲイン記憶部３１により、過去のフレームで用いたゲインをバンド単位で記憶し、ゲイン復号部３２により、ゲイン記憶部３１から取得した過去のフレームのゲインと分離部３０で分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号し、逆量子化部３３により、ゲイン復号部３２で得られたゲインに基づいて、分離部３０で分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成し、直交変換部３４により、逆量子化部３３で得られた周波数信号を直交変換して復号オーディオ信号を生成している。

分離部３０は、フレームごとに入力されるビットストリーム３００から、フレーム番号情報３０１を分離するとともに、複数の周波数信号をまとめたバンド単位で、差分ゲイン情報３０２と量子化信号３０３を分離する。
ゲイン記憶部３１は、過去のフレームで使用したゲインをバンド単位で保持しておき、フレーム番号情報３０１に含まれるフレーム番号情報に従い、該当するフレームのゲインＧ_ｏｌｄを過去ゲイン３０８としてゲイン復号部３２に出力する。

ゲイン復号部３２は、ゲイン記憶部３１から出力された過去フレームのゲインＧ_ｏｌｄ（３０８）とゲイン情報に含まれる差分ゲイン情報ｄ_ｓｃｆ（３０２）から、以下の式（８）に従い、バンド単位でゲインＧ（３０４）を復号する。ここで、ｉはバンド番号のインデックスを表す。

逆量子化部３３は、量子化信号Ｘｑ（３０３）と、ゲインＧ（３０４）から、以下の式（９）に従い逆量子化を行い、周波数信号Ｘ（３０５）を出力する。

直交変換部３４は、周波数信号Ｘを直交変換し、復号オーディオ信号３０６を出力する。ここで用いる直交変換は、符号化装置内の直交変換部で使用する直交変換の逆変換に相当する。
本実施形態によれば、ゲイン記憶部３１を備えることにより、過去フレームで使用したゲインを利用できるため、ビットストリーム３００に含まれる差分ゲイン情報３０２の符号量を削減できる。

このように、本実施形態によれば、過去フレームのゲインと初期ゲインから、量子化歪量を増加させないでゲイン符号量を抑制するようにゲイン情報を修正している、最小単位のバンドでゲインを制御できると同時に、ゲイン情報の符号量を削減することができる。また、予め定めた変換式に従い、ゲインを算出しているため、低演算量で音質を向上することができる。
その結果、抑制したゲイン符号量を量子化信号の符号量に費やすことができるため、高品質で復号することができる。

［第３の実施形態］
次に、本発明の第３の実施形態にかかるオーディオ符号化装置およびオーディオ復号装置について説明する。
第１および第２の実施形態で説明したオーディオ符号化装置１Ａおよびオーディオ復号装置３Ａでは、上述した式（５），式（８）を用いて差分ゲインの符号化・復号を行っているが、本実施形態では、差分の平均値μを用いて符号化・復号を行う。本実施形態にかかるオーディオ符号化装置およびオーディオ復号装置は、互いに組として使用される。

まず、本実施形態にかかるオーディオ符号化装置について説明する。本実施形態にかかるオーディオ符号化装置は、図１に示すように、入力された入力オーディオ信号１００を符号化処理してビットストリーム１０８を出力する機能を有しており、主な機能部として、直交変換部１０、心理聴覚分析部１１、ゲイン計算部１２、量子化部１３、ゲイン符号化部１４、および多重化部１５を備えている。

このうち、ゲイン符号化部１４は、次の式（１０）で表されるように、ゲイン符号化部１４において、各バンドのゲインＧ(ｉ)から過去フレームのゲインＧ_ｏｌｄ(ｉ)と全バンドまたは複数バンドで共通の平均値μを減算したものをバンドｉの差分ゲインｄ_ｓｃｆ(ｉ)とする。

ゲイン符号化部１４は、差分ゲインｄ_ｓｃｆとどの過去フレームのゲインを使用したかを表すフレーム番号情報に加えて、平均値μも符号化する。平均値μは、ハフマン符号などのエントロピー符号化を行うと、さらに情報量を削減することができる。ハフマン符号を用いる場合には、平均値μの絶対値が小さいほど、符号長が短くなるように設計したほうが符号量を削減できる。なぜなら、時間方向の信号変化はなだらかであることの方が多いためである。
なお、本実施形態にかかるオーディオ符号化装置における上記以外の構成については、上述したオーディオ符号化装置１Ａと同等であり、ここでの詳細な説明は省略する。

次に、本実施形態にかかるオーディオ復号装置について説明する。本実施形態にかかるオーディオ復号装置は、図３に示すように、上述したオーディオ符号化装置が出力したビットストリームを復号して復号信号を出力する機能を有しており、主な機能部として、分離部３０、ゲイン記憶部３１、ゲイン復号部３２、逆量子化部３３、および直交変換部３４を備えている。

このうち、ゲイン復号部３２は、次の式（１１）で表されるように、ゲイン復号部３２において全バンドで共通の平均値μと差分ゲインｄ_ｓｃｆ(ｉ)と過去フレームのゲインＧ_ｏｌｄ(ｉ)との和からバンド単位でゲインＧ(ｉ)とする。ここで、ｉはバンドのインデックスを表す。

このように、信号全体の大きさが変わる場合に、平均値μを用いることで、バンド単位で算出する差分ゲインｄ_ｓｃｆの符号量を減らすことができ、ゲイン符号量を削減できる。
上述した平均値μを符号化する方法は、全周波数帯域で共通の値を用いていたが、複数のバンドをまとめた単位で複数算出してもよい。例えば、量子化部１３、逆量子化部３３において周波数信号Ｘを量子化、逆量子化する際には、複数のバンドで共通の符号帳を使用することがあり、量子化・逆量子化において共通の符号帳を使用するバンド単位で平均値μを符号化することができる。
なお、本実施形態にかかるオーディオ符号化装置における上記以外の構成については、上述したオーディオ符号化装置１Ａと同等であり、ここでの詳細な説明は省略する。

［第４の実施形態］
次に、図４を参照して、本発明の第４の実施形態にかかるオーディオ符号化装置について説明する。図４は、本発明の第４の実施形態にかかるオーディオ符号化装置におけるゲイン計算動作を示すフローチャートである。

本実施形態にかかるオーディオ符号化装置は、図１に示すように、入力された入力オーディオ信号１００を符号化処理してビットストリーム１０８を出力する機能を有しており、主な機能部として、直交変換部１０、心理聴覚分析部１１、ゲイン計算部１２、量子化部１３、ゲイン符号化部１４、および多重化部１５を備えており、ゲイン計算部１２には、主な機能部として、初期ゲイン計算部２０、ゲイン修正部２１、およびゲイン記憶部２２が設けられている。このオーディオ符号化装置は、本発明の第２の実施形態にかかるオーディオ復号装置３Ａと組として使用される。

ゲイン修正部２１では、ある過去のフレームｋのゲインに対して、全バンドのゲインを修正する。
まず、修正するバンド番号ｉの初期値を０として（ステップS101)、バンドｉの初期ゲインと過去ゲインの差分から補正ゲインを算出する（ステップS102)。算出した補正ゲインを初期ゲインに加算し、更新したゲインを修正後のゲインとする（ステップS103)。

ＭａｘＢａｎｄを計算する周波数バンドの最大値とすると、ｉ＜ＭａｘＢａｎｄの場合（ステップS106)、バンド番号ｉの値を更新し（ステップS107)、次の周波数バンドのゲインを修正する。全バンドで修正後のゲインを算出したあと、過去フレームｋの評価値を算出する。計算可能な過去フレーム全てで評価値を算出したかどうかを判定し（ステップS105)、計算可能な過去フレームがある場合は、過去フレームｋの値を更新し（ステップS108)、新たな過去フレームの評価値を算出する。全ての過去フレームの評価値を算出したら、過去フレームの評価値が最小であるフレームを過去フレームとして選択し、そのフレームｋと修正後のゲインを出力する（ステップS106)。

補正ゲインは、初期ゲインと過去ゲインの差分と同じまたは、この差分の絶対値よりも小さくなるようにする。図５は、初期ゲインと過去ゲインの差分と補正ゲインの関係を示すグラフである。例えば、図５に示すように、横軸を以下の式（１２）で定義すると、Ｇｘの絶対値が小さいときには、補正ゲインの絶対値がＧｘの絶対値よりも小さくなるようにする。

この結果、ゲイン符号化部において補正ゲインを適用した修正ゲインと過去ゲインとの差分が小さくなり、ゲインの符号量を削減することができる。一方、Ｇｘの絶対値が大きいときには、Ｇｘの値を補正ゲインとする。この結果、音が急に大きくなったり小さくなったりして、ゲインが変わったときに音質を劣化させずにゲインを符号化することが可能となる。

さらに、Ｇｘの符号によって変換式を変更すると音質が向上する場合がある。Ｇｘの符号が負の場合、つまり、過去ゲインよりも該フレームのゲインのほうが小さい場合、補正ゲインを０とするよりも、初期ゲインに近づくように補正すると音質が向上する。
図５の例では、Ｇｘの値により補正ゲインを一意に決めているが、ビットレートや該フレームで使用できるビット数に応じて変換式を変更することにより、高品質な補正ゲインを算出することができる。他にも、Ｇｘの値を入力として線形変換や複雑な非線形変換をすることにより、精度の高い評価値を算出することもできる。

ある過去フレームの評価値は、例えば、ある過去フレームの過去ゲインを用いて修正したゲインを符号化したときの符号量から算出することができる。この場合、符号量が一番小さい過去フレームを選択する。他の評価値の例として、量子化時の歪量とゲインの符号量から算出する評価値を用いてもよい。
ゲイン修正部の第１の例と比較すると、ゲインの更新（ステップS009)を複数回行わなくてよいため、低演算量でゲインを修正できる。

また、上述した各実施形態のオーディオ符号化装置やオーディオ復号装置では、過去のフレームを用いてゲインの符号化や復号を行っている。この際、予め、フレーム番号情報ｄ_ｆｒａｍｅの最大値を制限しておくことで、演算量やメモリ量を削減することができる。また、常に１フレーム前のゲインを使用することにすると、過去のフレームを選択する必要がなくなり演算量が削減できるとともに、過去のフレーム番号情報を符号化しなくてよいため符号量を削減できる。
なお、本実施形態にかかるオーディオ符号化装置における上記以外の構成については、上述したオーディオ符号化装置１Ａと同等であり、ここでの詳細な説明は省略する。

［第５の実施形態］
次に、図６を参照して、本発明の第５の実施形態にかかるオーディオ符号化装置について説明する。図６は、本発明の第５の実施形態にかかるオーディオ符号化装置の構成を示すブロック図であり、図１と同じまたは同等部分には同一符号を付してある。

本実施形態にかかるオーディオ符号化装置１Ｂは、図１に示すように、入力された入力オーディオ信号１００を符号化処理してビットストリーム１０８を出力する機能を有しており、主な機能部として、直交変換部１０、心理聴覚分析部１１、ゲイン計算部１６、量子化部１３、ゲイン符号化部１４、および多重化部１５を備えており、ゲイン計算部１６には、主な機能部として、初期ゲイン計算部２０、ゲイン修正部２１、ゲイン記憶部２２、およびゲイン符号化方向判定部２３が設けられている。
第１の実施形態のオーディオ符号化装置１Ａと比較して、本実施形態にかかるオーディオ符号化装置１Ｂには、ゲイン符号化方向判定部２３が追加されている。

オーディオ符号化装置１Ｂのゲイン符号化方向判定部２３は、初期ゲイン計算部２０で算出した初期ゲイン１０３と、ゲイン修正部２１で修正した修正ゲイン１０４を用いて、符号化するゲインを決定する。初期ゲイン１０３を、上述した式（２）を用いて周波数差分符号化した場合と、修正ゲインを、上述した式（５）を用いて時間差分符号化した場合の符号量を算出し、符号量が少なくなる差分方式を選択する。

選択した差分方式に応じて、周波数差分符号化の場合は初期ゲイン、時間差分符号化の場合は修正ゲインを最終ゲイン１０９として出力し、選択した差分方式の情報も最終ゲイン１０９に含める。周波数差分符号化の符号量の算出には、初期値を符号化するのに必要な符号量を含めて算出する。時間差分符号化の符号量の算出には、過去のフレーム番号を表す符号量なども含めて算出する。

上述のゲイン符号化方向判定部２３では、差分符号化方式を選択する際に、初期ゲインを周波数差分符号化、修正ゲインを時間差分符号化したときの符号量から選択したが、初期ゲインを時間差分符号化、修正ゲインを周波数差分符号化したときなど、複数の組み合わせの中から最も符号量が少なくなる組み合わせを選択することで、さらに符号量を削減できる場合がある。

ゲイン符号化部１４は、ゲイン符号化方向判定部２３で判定した差分方式を用いてゲインの符号化を行う。ゲイン符号化部１４の出力であるゲイン情報１０７は、どちらの差分符号化方式を選択したかを表す情報を付加し、周波数差分符号化の場合は、式（２）を用いて差分ゲイン情報と初期値を符号化した情報を、時間差分符号化の場合は、式（５）を用いて差分ゲイン情報と過去フレーム番号情報を符号化した情報を含む。
この結果、音の周波数変化が少ないときは、周波数差分符号化方式を選択することでゲイン符号量を削減できる。一方、音の時間変化が少ないときは、時間差分符号化方式を選択することでゲイン符号量を削減できる。
なお、本実施形態にかかるオーディオ符号化装置における上記以外の構成については、上述したオーディオ符号化装置１Ａと同等であり、ここでの詳細な説明は省略する。

［第６の実施形態］
次に、図７を参照して、本発明の第６の実施形態にかかるオーディオ復号装置について説明する。図７は、本発明の第６の実施形態にかかるオーディオ復号装置の構成を示すブロック図であり、図３と同じまたは同等部分には同一符号を付してある。

本実施形態にかかるオーディオ復号装置３Ｂは、図７に示すように、上述したオーディオ符号化装置が出力したビットストリームを復号して復号信号を出力する機能を有しており、主な機能部として、分離部３０、ゲイン記憶部３１、ゲイン復号部３２、逆量子化部３３、および直交変換部３４を備えている。第２の実施形態のオーディオ復号装置３Ａと比較して、本実施形態にかかるオーディオ復号装置３Ｂには、ゲイン符号化方向復号部３５が追加されている。このオーディオ復号装置３Ｂは、本発明の第５の実施形態にかかるオーディオ符号化装置１Ｂと組として使用される。

オーディオ復号装置３Ｂのゲイン符号化方向復号部３５は、ビットストリーム分離部３０で分離されたゲイン情報３０９に含まれる選択した差分方式から、差分ゲインが時間方向または周波数方向のどちらに差分符号化されているか決定する。ゲイン復号部３２は、ゲイン符号化方向復号部３５が出力した当該差分方式を示す差分方式情報と差分ゲインとから構成される差分ゲイン情報３０７からゲインを復号する。差分方式が時間方向の場合、上述した式（３）で表されるように、隣接のバンドのゲインと差分ゲインと初期値を用いて該フレームのゲインを算出する。一方、差分方式が周波数方向の場合、上述した式（７）で表されるように、過去フレーム番号情報３０１に基づいてゲイン記憶部３１が出力した過去フレームのゲインと差分ゲインを用いて該フレームのゲインを算出する。

上述した第５の実施形態にかかるオーディオ符号化装置１Ｂや第６の実施形態にかかるオーディオ復号装置３Ｂでは、時間方向にゲインを差分符号化する場合、過去のフレームを用いてゲインの符号化・復号を行っている。この際、予め、フレーム番号情報ｄ_ｆｒａｍｅの最大値を制限しておくことで、演算量やメモリ量を削減することができる。また、常に１フレーム前のゲインを使用することにすると、過去のフレームを選択する必要がなくなり演算量が削減できるとともに、過去のフレーム番号情報を符号化しなくてよいため符号量を削減できる。
なお、本実施形態にかかるオーディオ復号装置における上記以外の構成については、上述したオーディオ復号装置３Ａと同等であり、ここでの詳細な説明は省略する。

［実施形態の拡張］
以上の各実施形態では、オーディオ符号化装置やオーディオ復号装置について、それぞれ個別の装置として構成した場合を例として説明したが、これに限定されるものではなく、オーディオ符号化装置およびオーディオ復号装置を１つの装置に実装して、オーディオ符号化・復号装置を構成してもよく、それぞれ前述した各実施の構成と同様の作用効果を得ることができる。

また、各実施形態にかかるオーディオ符号化装置やオーディオ復号装置を構成する各機能部については、それぞれ専用の信号処理回路や演算回路で実現してもよいが、これらをデジタル信号演算処理を行うコンピュータで実現してもよい。

図８は、コンピュータで各機能部を実現した場合のオーディオ符号化装置の構成例を示すブロック図である。このオーディオ符号化装置１Ｃには、コンピュータ６００と記憶装置６０１が設けられている。
コンピュータ６００は、ＣＰＵなどのマイクロプロセッサとその周辺回路を有し、記憶装置６０１に記憶されているプログラム６０２を読み込んで実行することにより、上記ハードウェアとプログラム６０２とを協動させて、上記各実施形態にかかるオーディオ符号化装置の各機能部、具体的には、前述した図１の直交変換部１０、心理聴覚分析部１１、ゲイン計算部１２、量子化部１３、ゲイン符号化部１４、および多重化部１５を実現する。これにより、入力オーディオ信号１００を符号化してビットストリーム１０８を出力する。

図９は、コンピュータで各機能部を実現した場合のオーディオ復号装置の構成例を示すブロック図である。このオーディオ復号装置３Ｃには、コンピュータ６１０と記憶装置６１１が設けられている。
コンピュータ６１０は、ＣＰＵなどのマイクロプロセッサとその周辺回路を有し、記憶装置６１１に記憶されているプログラム６１２を読み込んで実行することにより、上記ハードウェアとプログラム６１２とを協動させて、上記各実施形態にかかるオーディオ復号装置の各機能部、具体的には、前述した図３の分離部３０、ゲイン記憶部３１、ゲイン復号部３２、逆量子化部３３、および直交変換部３４を実現する。これにより、ビットストリーム３００を復号して復号オーディオ信号３０６を出力する。

なお、ここでは、符号化側と復号側とで異なったコンピュータを用いた例を説明したが、符号化側と復号側とで同一のコンピュータを用いて処理を実行してもよい。

また、各実施形態にかかるオーディオ符号化装置とオーディオ復号装置は、本発明にかかるオーディオ符号化・復号システムを構成する。
この際、オーディオ符号化装置は、入力オーディオ信号を符号化して符号化オーディオデータを生成する。この符号化オーディオデータは、通信ネットワークや通信回線、あるいは信号線を介して、あるいは記録媒体を介して、オーディオ復号装置へ入力される。オーディオ復号装置は、上記オーディオ符号化装置で生成された符号化オーディオデータを復号して、復号オーディオ信号を生成する。

したがって、本発明にかかるオーディオ符号化・復号システムによれば、過去フレームのゲインと初期ゲインから、量子化歪量を増加させないでゲイン符号量を抑制するようにゲイン情報を修正するため、最小単位のバンドでゲインを制御できると同時に、ゲイン情報の符号量を削減することができる。また、予め定めた変換式に従い、ゲインを算出することにより、低演算量で音質を向上することができる。その結果、抑制したゲイン符号量を量子化信号の符号量に費やすことができるため、高品質なオーディオ符号化復号方法、装置およびプログラムを実現することが可能となる。また、ゲイン符号量を抑制するため、従来よりも低ビットレートで、高品質なオーディオ符号化復号方法、装置およびプログラムを実現することが可能となる。

オーディオ信号（音響／音声信号）を符号化してやり取りする、一般的なオーディオ装置として有用であり、特に、少ない情報量で符号化でき、かつ高品質な再生信号を得る場合に適している。

Claims

入力オーディオ信号をフレーム単位で周波数信号に変換する直交変換ステップと、
前記直交変換ステップで得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これら初期ゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出するゲイン計算ステップと、
前記ゲイン計算ステップで得られた修正ゲインを用いて前記周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成する量子化ステップと、
前記ゲイン計算ステップで得られた修正ゲインとこれに対応する前記過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成するゲイン符号化ステップと、
前記量子化ステップで得られた量子化信号と前記ゲイン符号化ステップで得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成する多重化ステップと
を備えることを特徴とするオーディオ符号化方法。
請求項１に記載のオーディオ符号化方法において、
前記ゲイン計算ステップは、前記修正ゲインを算出する際、量子化時の歪を評価する評価関数と前記過去ゲインを用いてゲインの符号量を評価する評価関数とから算出される評価値に基づいて前記修正ゲインを算出するステップから構成されることを特徴とするオーディオ符号化方法。
請求項１に記載のオーディオ符号化方法において、
前記ゲイン計算ステップは、前記修正ゲインを算出する際、前記過去ゲインと修正後のゲインの差の絶対値が、前記過去ゲインと前記初期ゲインとの差の絶対値より同じまたは小さくなるように前記修正ゲインを算出するステップから構成されることを特徴とするオーディオ符号化方法。
請求項１に記載のオーディオ符号化方法において、
前記ゲイン符号化ステップは、前記修正ゲインと前記過去ゲインとの差からバンド単位で算出する差分ゲインを複数のバンドで平均し、得られた差分平均値と差分ゲインとの差分を各バンドごとに算出し、これら差分と差分平均値とをゲイン情報として符号化するステップから構成されることを特徴とするオーディオ符号化方法。
請求項１に記載のオーディオ符号化方法において、
前記ゲイン符号化ステップは、所定数フレーム前までの過去のゲインの中から選択したゲインを前記過去ゲインとして使用し、当該過去ゲインが使用されたフレームのフレーム番号情報を符号化するステップから構成されることを特徴とするオーディオ符号化方法。
請求項１に記載のオーディオ符号化方法において、
前記ゲイン計算ステップは、前記過去ゲインとして常に１フレーム前のゲインを使用するステップから構成されることを特徴とするオーディオ符号化方法。
請求項１に記載のオーディオ符号化方法において、
前記ゲイン計算ステップは、修正前のゲインと修正後のゲインとから該フレームのゲインを時間方向に差分符号化するか周波数方向に差分符号化するかを選択するステップから構成され、
前記ゲイン符号化ステップは、前記ゲイン計算ステップで選択した差分符号化方向に従って、ゲインを差分符号化するステップから構成される
ことを特徴とするオーディオ符号化方法。
フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離ステップと、
過去のフレームで用いたゲインをバンド単位で記憶部により記憶する記憶ステップと、
前記記憶部から取得した過去のフレームのゲインと前記分離ステップで分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号ステップと、
前記ゲイン復号ステップで得られたゲインに基づいて、前記分離ステップで分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化ステップと、
前記逆量子化ステップで得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換ステップとを備え、
前記ゲイン情報は、任意の過去フレームを示すフレーム番号情報と、この過去フレームのゲインと当該フレームのゲインとの差分ゲインとを、バンド単位でそれぞれ含み、
前記ゲイン復号ステップは、前記ゲイン情報のフレーム番号情報に対応する過去フレームのゲインを前記記憶部からバンド単位で取得し、この過去フレームのゲインと前記ゲイン情報の差分ゲインとから、当該フレームのゲインをバンド単位で算出するステップから構成される
ことを特徴とするオーディオ復号方法。
フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離ステップと、
過去のフレームで用いたゲインをバンド単位で記憶部により記憶する記憶ステップと、
前記記憶部から取得した過去のフレームのゲインと前記分離ステップで分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号ステップと、
前記ゲイン復号ステップで得られたゲインに基づいて、前記分離ステップで分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化ステップと、
前記逆量子化ステップで得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換ステップとを備え、
前記ゲイン情報は、当該フレームの差分ゲインが時間方向または周波数方向のいずれかの差分符号化方法で差分符号化されているかを表す差分方式情報をそれぞれ含み、
前記ゲイン復号ステップは、前記ゲイン情報の差分方式情報に対応する差分符号化方法に従ってゲインを算出するステップから構成される
ことを特徴とするオーディオ復号方法。
入力オーディオ信号をフレーム単位で周波数信号に変換する直交変換部と、
前記直交変換部で得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これら初期ゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出するゲイン計算部と、
前記ゲイン計算部で得られた修正ゲインを用いて前記周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成する量子化部と、
前記ゲイン計算部で得られた修正ゲインとこれに対応する前記過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成するゲイン符号化部と、
前記量子化部で得られた量子化信号と前記ゲイン符号化部で得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成する多重化部と
を備えることを特徴とするオーディオ符号化装置。
請求項１０に記載のオーディオ符号化装置において、
前記ゲイン計算部は、前記修正ゲインを算出する際、量子化時の歪を評価する評価関数と前記過去ゲインを用いてゲインの符号量を評価する評価関数とから算出される評価値に基づいて前記修正ゲインを算出することを特徴とするオーディオ符号化装置。
請求項１０に記載のオーディオ符号化装置において、
前記ゲイン計算部は、前記修正ゲインを算出する際、前記過去ゲインと修正後のゲインの差の絶対値が、前記過去ゲインと前記初期ゲインとの差の絶対値より同じまたは小さくなるように前記修正ゲインを算出することを特徴とするオーディオ符号化装置。
請求項１０に記載のオーディオ符号化装置において、
前記ゲイン符号化部は、前記修正ゲインと前記過去ゲインとの差からバンド単位で算出する差分ゲインを複数のバンドで平均し、得られた差分平均値と差分ゲインとの差分を各バンドごとに算出し、これら差分と差分平均値とをゲイン情報として符号化することを特徴とするオーディオ符号化装置。
請求項１０に記載のオーディオ符号化装置において、
前記ゲイン符号化部は、所定数フレーム前までの過去のゲインの中から選択したゲインを前記過去ゲインとして使用し、当該過去ゲインが使用されたフレームのフレーム番号情報を符号化することを特徴とするオーディオ符号化装置。
請求項１０に記載のオーディオ符号化装置において、
前記ゲイン計算部は、前記過去ゲインとして常に１フレーム前のゲインを使用することを特徴とするオーディオ符号化装置。
請求項１０に記載のオーディオ符号化装置において、
前記ゲイン計算部は、修正前のゲインと修正後のゲインとから該フレームのゲインを時間方向に差分符号化するか周波数方向に差分符号化するかを選択し、
前記ゲイン符号化部は、前記ゲイン計算部で選択した差分符号化方向に従って、ゲインを差分符号化する
ことを特徴とするオーディオ符号化装置。
フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離部と、
過去のフレームで用いたゲインをバンド単位で記憶する記憶部と、
前記記憶部から取得した過去のフレームのゲインと前記分離部で分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号部と、
前記ゲイン復号部で得られたゲインに基づいて、前記分離部で分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化部と、
前記逆量子化部で得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換部とを備え、
前記ゲイン情報は、任意の過去フレームを示すフレーム番号情報と、この過去フレームのゲインと当該フレームのゲインとの差分ゲインとを、バンド単位でそれぞれ含み、
前記ゲイン復号部は、前記ゲイン情報のフレーム番号情報に対応する過去フレームのゲインを前記記憶部からバンド単位で取得し、この過去フレームのゲインと前記ゲイン情報の差分ゲインとから、当該フレームのゲインをバンド単位で算出する
ことを特徴とするオーディオ復号装置。
フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離部と、
過去のフレームで用いたゲインをバンド単位で記憶する記憶部と、
前記記憶部から取得した過去のフレームのゲインと前記分離部で分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号部と、
前記ゲイン復号部で得られたゲインに基づいて、前記分離部で分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化部と、
前記逆量子化部で得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換部とを備え、
前記ゲイン情報は、当該フレームの差分ゲインが時間方向または周波数方向のいずれかの差分符号化方法で差分符号化されているかを表す差分方式情報をそれぞれ含み、
前記ゲイン復号部は、前記ゲイン情報の差分方式情報に対応する差分符号化方法に従って、ゲインを算出する
ことを特徴とするオーディオ復号装置。
オーディオ符号化装置のコンピュータで、請求項１〜請求項７のいずれか１つに記載のオーディオ符号化方法を実行させるためのプログラム。
オーディオ復号装置のコンピュータで、請求項８または請求項９に記載のオーディオ復号方法を実行させるためのプログラム。
入力オーディオ信号を符号化して符号化オーディオデータを生成するオーディオ符号化装置と、このオーディオ符号化装置で生成された符号化オーディオデータを復号して、復号オーディオ信号を生成するオーディオ復号装置とから構成され、
前記オーディオ符号化装置は、
入力オーディオ信号をフレーム単位で周波数信号に変換する直交変換部と、
前記直交変換部で得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これらゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出するゲイン計算部と、
前記ゲイン計算部で得られた修正ゲインを用いて前記周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成する量子化部と、
前記ゲイン計算部で得られた修正ゲインとこれに対応する前記過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成するゲイン符号化部と、
前記量子化部で得られた量子化信号と前記ゲイン符号化部で得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成する多重化部と
を備え、
前記オーディオ復号装置は、
フレームごとに入力される、前記オーディオ符号化装置で生成された符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離部と、
過去のフレームで用いたゲインをバンド単位で記憶する記憶部と、
前記記憶部から取得した過去のフレームのゲインと前記分離部で分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号部と、
前記ゲイン復号部で得られたゲインに基づいて、前記分離部で分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化部と、
前記逆量子化部で得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換部と
を備える
ことを特徴とするオーディオ符号化・復号システム。