JP5434592B2 - オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム - Google Patents
オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム Download PDFInfo
- Publication number
- JP5434592B2 JP5434592B2 JP2009520622A JP2009520622A JP5434592B2 JP 5434592 B2 JP5434592 B2 JP 5434592B2 JP 2009520622 A JP2009520622 A JP 2009520622A JP 2009520622 A JP2009520622 A JP 2009520622A JP 5434592 B2 JP5434592 B2 JP 5434592B2
- Authority
- JP
- Japan
- Prior art keywords
- gain
- unit
- audio
- past
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Description
AAC方式では、符号化の際に、時間信号を周波数変換した信号Xを複数まとめたバンド単位で、次の式(1)に表されるスケーリングと量子化を行う。ここで、abs(X)はXの絶対値を表し、Gはゲイン情報、αは適当な定数値である。
量子化信号Xqとゲイン情報Gは符号化され、符号化情報をビットストリームに書き込む。ゲイン情報Gは、初期値Aと次の式(2)で表される隣接バンドとのゲイン差分d_scfとから表す。ここで、iはバンド番号のインデックスを表し、G(−1)を初期値Aとする。
復号側では、初期値Aとハフマン復号したゲイン差分d_scfからゲイン情報Gを次の式(3)に従い生成する。ここで、iはバンド番号のインデックスを表し、G(−1)を初期値Aとする。
本発明はこのような課題を解決するためのものであり、ゲイン情報の符号量を効率よく削減でき、高品質に符号化・復号できるオーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システムを提供することを目的としている。
また、本発明にかかるプログラムは、オーディオ復号装置のコンピュータで、上述したいずれかのオーディオ復号方法を実行させるためのプログラムである。
[第1の実施形態]
まず、図1を参照して、本発明の第1の実施形態にかかるオーディオ符号化装置について説明する。図1は、本発明の第1の実施形態にかかるオーディオ符号化装置の構成を示すブロック図である。
このオーディオ符号化装置1Aは、入力された入力オーディオ信号100を符号化処理してビットストリーム108を出力する機能を有しており、主な機能部として、直交変換部10、心理聴覚分析部11、ゲイン計算部12、量子化部13、ゲイン符号化部14、および多重化部15を備えている。
ゲイン符号化部14は、過去のある1フレーム分のゲインG_oldと該フレームで使用する修正ゲイン104の差分を符号化する。差分ゲインの算出は、バンド単位で行う。該フレームの量子化で使用したゲインをGとすると、符号化する差分ゲインは、以下の式(5)で表される。ここで、iはバンド番号のインデックスを表す。
多重化部15は、ゲイン情報107と量子化信号106とをバンド単位で多重化し、符号化オーディオデータすなわちビットストリーム108を出力する。
ここで、ゲイン計算部12の動作についてさらに詳細に説明する。
ゲイン計算部12には、主な機能部として、初期ゲイン計算部20、ゲイン修正部21、およびゲイン記憶部22が設けられている。
初期ゲイン計算部20は、許容量子化雑音101と周波数信号102とから、周波数信号102をスケーリングする初期ゲイン103をバンド単位で算出する。ゲインは、式(1)を適用する周波数信号の量子化の際に周波数信号をスケーリングするときに使用する。初期ゲイン103の算出は、量子化雑音が許容量子化雑音内に収まるように複数回の繰り返し処理で算出してもよいし、予め定めた変換式で算出してもよい。
例えば、式(7)の関数Fは、量子化の歪に関する評価関数f_distortionとゲインの符号量に関する評価関数f_gainの和で表すことができる。また、線形変換や複雑な非線形変換をすることにより、精度の高い評価値を算出することもできる。
さらに、とり得るゲインの範囲や、過去フレームの範囲を制限することにより、演算量およびメモリ量を削減できる。
その結果、抑制したゲイン符号量を量子化信号の符号量に費やすことができるため、高品質で符号化することができる。
次に、図3を参照して、本発明の第2の実施形態にかかるオーディオ復号装置について説明する。図3は、本発明の第2の実施形態にかかるオーディオ復号装置の構成を示すブロック図である。
オーディオ復号装置3Aは、上述したオーディオ符号化装置が出力したビットストリームを復号して復号信号を出力する機能を有しており、主な機能部として、分離部30、ゲイン記憶部31、ゲイン復号部32、逆量子化部33、および直交変換部34を備えている。このオーディオ復号装置3Aは、本発明の第1の実施形態にかかるオーディオ符号化装置1Aと組として使用される。
ゲイン記憶部31は、過去のフレームで使用したゲインをバンド単位で保持しておき、フレーム番号情報301に含まれるフレーム番号情報に従い、該当するフレームのゲインG_oldを過去ゲイン308としてゲイン復号部32に出力する。
本実施形態によれば、ゲイン記憶部31を備えることにより、過去フレームで使用したゲインを利用できるため、ビットストリーム300に含まれる差分ゲイン情報302の符号量を削減できる。
その結果、抑制したゲイン符号量を量子化信号の符号量に費やすことができるため、高品質で復号することができる。
次に、本発明の第3の実施形態にかかるオーディオ符号化装置およびオーディオ復号装置について説明する。
第1および第2の実施形態で説明したオーディオ符号化装置1Aおよびオーディオ復号装置3Aでは、上述した式(5),式(8)を用いて差分ゲインの符号化・復号を行っているが、本実施形態では、差分の平均値μを用いて符号化・復号を行う。本実施形態にかかるオーディオ符号化装置およびオーディオ復号装置は、互いに組として使用される。
なお、本実施形態にかかるオーディオ符号化装置における上記以外の構成については、上述したオーディオ符号化装置1Aと同等であり、ここでの詳細な説明は省略する。
上述した平均値μを符号化する方法は、全周波数帯域で共通の値を用いていたが、複数のバンドをまとめた単位で複数算出してもよい。例えば、量子化部13、逆量子化部33において周波数信号Xを量子化、逆量子化する際には、複数のバンドで共通の符号帳を使用することがあり、量子化・逆量子化において共通の符号帳を使用するバンド単位で平均値μを符号化することができる。
なお、本実施形態にかかるオーディオ符号化装置における上記以外の構成については、上述したオーディオ符号化装置1Aと同等であり、ここでの詳細な説明は省略する。
次に、図4を参照して、本発明の第4の実施形態にかかるオーディオ符号化装置について説明する。図4は、本発明の第4の実施形態にかかるオーディオ符号化装置におけるゲイン計算動作を示すフローチャートである。
まず、修正するバンド番号iの初期値を0として(ステップS101)、バンドiの初期ゲインと過去ゲインの差分から補正ゲインを算出する(ステップS102)。算出した補正ゲインを初期ゲインに加算し、更新したゲインを修正後のゲインとする(ステップS103)。
図5の例では、Gxの値により補正ゲインを一意に決めているが、ビットレートや該フレームで使用できるビット数に応じて変換式を変更することにより、高品質な補正ゲインを算出することができる。他にも、Gxの値を入力として線形変換や複雑な非線形変換をすることにより、精度の高い評価値を算出することもできる。
ゲイン修正部の第1の例と比較すると、ゲインの更新(ステップS009)を複数回行わなくてよいため、低演算量でゲインを修正できる。
なお、本実施形態にかかるオーディオ符号化装置における上記以外の構成については、上述したオーディオ符号化装置1Aと同等であり、ここでの詳細な説明は省略する。
次に、図6を参照して、本発明の第5の実施形態にかかるオーディオ符号化装置について説明する。図6は、本発明の第5の実施形態にかかるオーディオ符号化装置の構成を示すブロック図であり、図1と同じまたは同等部分には同一符号を付してある。
第1の実施形態のオーディオ符号化装置1Aと比較して、本実施形態にかかるオーディオ符号化装置1Bには、ゲイン符号化方向判定部23が追加されている。
この結果、音の周波数変化が少ないときは、周波数差分符号化方式を選択することでゲイン符号量を削減できる。一方、音の時間変化が少ないときは、時間差分符号化方式を選択することでゲイン符号量を削減できる。
なお、本実施形態にかかるオーディオ符号化装置における上記以外の構成については、上述したオーディオ符号化装置1Aと同等であり、ここでの詳細な説明は省略する。
次に、図7を参照して、本発明の第6の実施形態にかかるオーディオ復号装置について説明する。図7は、本発明の第6の実施形態にかかるオーディオ復号装置の構成を示すブロック図であり、図3と同じまたは同等部分には同一符号を付してある。
なお、本実施形態にかかるオーディオ復号装置における上記以外の構成については、上述したオーディオ復号装置3Aと同等であり、ここでの詳細な説明は省略する。
以上の各実施形態では、オーディオ符号化装置やオーディオ復号装置について、それぞれ個別の装置として構成した場合を例として説明したが、これに限定されるものではなく、オーディオ符号化装置およびオーディオ復号装置を1つの装置に実装して、オーディオ符号化・復号装置を構成してもよく、それぞれ前述した各実施の構成と同様の作用効果を得ることができる。
コンピュータ600は、CPUなどのマイクロプロセッサとその周辺回路を有し、記憶装置601に記憶されているプログラム602を読み込んで実行することにより、上記ハードウェアとプログラム602とを協動させて、上記各実施形態にかかるオーディオ符号化装置の各機能部、具体的には、前述した図1の直交変換部10、心理聴覚分析部11、ゲイン計算部12、量子化部13、ゲイン符号化部14、および多重化部15を実現する。これにより、入力オーディオ信号100を符号化してビットストリーム108を出力する。
コンピュータ610は、CPUなどのマイクロプロセッサとその周辺回路を有し、記憶装置611に記憶されているプログラム612を読み込んで実行することにより、上記ハードウェアとプログラム612とを協動させて、上記各実施形態にかかるオーディオ復号装置の各機能部、具体的には、前述した図3の分離部30、ゲイン記憶部31、ゲイン復号部32、逆量子化部33、および直交変換部34を実現する。これにより、ビットストリーム300を復号して復号オーディオ信号306を出力する。
この際、オーディオ符号化装置は、入力オーディオ信号を符号化して符号化オーディオデータを生成する。この符号化オーディオデータは、通信ネットワークや通信回線、あるいは信号線を介して、あるいは記録媒体を介して、オーディオ復号装置へ入力される。オーディオ復号装置は、上記オーディオ符号化装置で生成された符号化オーディオデータを復号して、復号オーディオ信号を生成する。
Claims (21)
- 入力オーディオ信号をフレーム単位で周波数信号に変換する直交変換ステップと、
前記直交変換ステップで得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これら初期ゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出するゲイン計算ステップと、
前記ゲイン計算ステップで得られた修正ゲインを用いて前記周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成する量子化ステップと、
前記ゲイン計算ステップで得られた修正ゲインとこれに対応する前記過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成するゲイン符号化ステップと、
前記量子化ステップで得られた量子化信号と前記ゲイン符号化ステップで得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成する多重化ステップと
を備えることを特徴とするオーディオ符号化方法。 - 請求項1に記載のオーディオ符号化方法において、
前記ゲイン計算ステップは、前記修正ゲインを算出する際、量子化時の歪を評価する評価関数と前記過去ゲインを用いてゲインの符号量を評価する評価関数とから算出される評価値に基づいて前記修正ゲインを算出するステップから構成されることを特徴とするオーディオ符号化方法。 - 請求項1に記載のオーディオ符号化方法において、
前記ゲイン計算ステップは、前記修正ゲインを算出する際、前記過去ゲインと修正後のゲインの差の絶対値が、前記過去ゲインと前記初期ゲインとの差の絶対値より同じまたは小さくなるように前記修正ゲインを算出するステップから構成されることを特徴とするオーディオ符号化方法。 - 請求項1に記載のオーディオ符号化方法において、
前記ゲイン符号化ステップは、前記修正ゲインと前記過去ゲインとの差からバンド単位で算出する差分ゲインを複数のバンドで平均し、得られた差分平均値と差分ゲインとの差分を各バンドごとに算出し、これら差分と差分平均値とをゲイン情報として符号化するステップから構成されることを特徴とするオーディオ符号化方法。 - 請求項1に記載のオーディオ符号化方法において、
前記ゲイン符号化ステップは、所定数フレーム前までの過去のゲインの中から選択したゲインを前記過去ゲインとして使用し、当該過去ゲインが使用されたフレームのフレーム番号情報を符号化するステップから構成されることを特徴とするオーディオ符号化方法。 - 請求項1に記載のオーディオ符号化方法において、
前記ゲイン計算ステップは、前記過去ゲインとして常に1フレーム前のゲインを使用するステップから構成されることを特徴とするオーディオ符号化方法。 - 請求項1に記載のオーディオ符号化方法において、
前記ゲイン計算ステップは、修正前のゲインと修正後のゲインとから該フレームのゲインを時間方向に差分符号化するか周波数方向に差分符号化するかを選択するステップから構成され、
前記ゲイン符号化ステップは、前記ゲイン計算ステップで選択した差分符号化方向に従って、ゲインを差分符号化するステップから構成される
ことを特徴とするオーディオ符号化方法。 - フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離ステップと、
過去のフレームで用いたゲインをバンド単位で記憶部により記憶する記憶ステップと、
前記記憶部から取得した過去のフレームのゲインと前記分離ステップで分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号ステップと、
前記ゲイン復号ステップで得られたゲインに基づいて、前記分離ステップで分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化ステップと、
前記逆量子化ステップで得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換ステップとを備え、
前記ゲイン情報は、任意の過去フレームを示すフレーム番号情報と、この過去フレームのゲインと当該フレームのゲインとの差分ゲインとを、バンド単位でそれぞれ含み、
前記ゲイン復号ステップは、前記ゲイン情報のフレーム番号情報に対応する過去フレームのゲインを前記記憶部からバンド単位で取得し、この過去フレームのゲインと前記ゲイン情報の差分ゲインとから、当該フレームのゲインをバンド単位で算出するステップから構成される
ことを特徴とするオーディオ復号方法。 - フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離ステップと、
過去のフレームで用いたゲインをバンド単位で記憶部により記憶する記憶ステップと、
前記記憶部から取得した過去のフレームのゲインと前記分離ステップで分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号ステップと、
前記ゲイン復号ステップで得られたゲインに基づいて、前記分離ステップで分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化ステップと、
前記逆量子化ステップで得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換ステップとを備え、
前記ゲイン情報は、当該フレームの差分ゲインが時間方向または周波数方向のいずれかの差分符号化方法で差分符号化されているかを表す差分方式情報をそれぞれ含み、
前記ゲイン復号ステップは、前記ゲイン情報の差分方式情報に対応する差分符号化方法に従ってゲインを算出するステップから構成される
ことを特徴とするオーディオ復号方法。 - 入力オーディオ信号をフレーム単位で周波数信号に変換する直交変換部と、
前記直交変換部で得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これら初期ゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出するゲイン計算部と、
前記ゲイン計算部で得られた修正ゲインを用いて前記周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成する量子化部と、
前記ゲイン計算部で得られた修正ゲインとこれに対応する前記過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成するゲイン符号化部と、
前記量子化部で得られた量子化信号と前記ゲイン符号化部で得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成する多重化部と
を備えることを特徴とするオーディオ符号化装置。 - 請求項10に記載のオーディオ符号化装置において、
前記ゲイン計算部は、前記修正ゲインを算出する際、量子化時の歪を評価する評価関数と前記過去ゲインを用いてゲインの符号量を評価する評価関数とから算出される評価値に基づいて前記修正ゲインを算出することを特徴とするオーディオ符号化装置。 - 請求項10に記載のオーディオ符号化装置において、
前記ゲイン計算部は、前記修正ゲインを算出する際、前記過去ゲインと修正後のゲインの差の絶対値が、前記過去ゲインと前記初期ゲインとの差の絶対値より同じまたは小さくなるように前記修正ゲインを算出することを特徴とするオーディオ符号化装置。 - 請求項10に記載のオーディオ符号化装置において、
前記ゲイン符号化部は、前記修正ゲインと前記過去ゲインとの差からバンド単位で算出する差分ゲインを複数のバンドで平均し、得られた差分平均値と差分ゲインとの差分を各バンドごとに算出し、これら差分と差分平均値とをゲイン情報として符号化することを特徴とするオーディオ符号化装置。 - 請求項10に記載のオーディオ符号化装置において、
前記ゲイン符号化部は、所定数フレーム前までの過去のゲインの中から選択したゲインを前記過去ゲインとして使用し、当該過去ゲインが使用されたフレームのフレーム番号情報を符号化することを特徴とするオーディオ符号化装置。 - 請求項10に記載のオーディオ符号化装置において、
前記ゲイン計算部は、前記過去ゲインとして常に1フレーム前のゲインを使用することを特徴とするオーディオ符号化装置。 - 請求項10に記載のオーディオ符号化装置において、
前記ゲイン計算部は、修正前のゲインと修正後のゲインとから該フレームのゲインを時間方向に差分符号化するか周波数方向に差分符号化するかを選択し、
前記ゲイン符号化部は、前記ゲイン計算部で選択した差分符号化方向に従って、ゲインを差分符号化する
ことを特徴とするオーディオ符号化装置。 - フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離部と、
過去のフレームで用いたゲインをバンド単位で記憶する記憶部と、
前記記憶部から取得した過去のフレームのゲインと前記分離部で分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号部と、
前記ゲイン復号部で得られたゲインに基づいて、前記分離部で分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化部と、
前記逆量子化部で得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換部とを備え、
前記ゲイン情報は、任意の過去フレームを示すフレーム番号情報と、この過去フレームのゲインと当該フレームのゲインとの差分ゲインとを、バンド単位でそれぞれ含み、
前記ゲイン復号部は、前記ゲイン情報のフレーム番号情報に対応する過去フレームのゲインを前記記憶部からバンド単位で取得し、この過去フレームのゲインと前記ゲイン情報の差分ゲインとから、当該フレームのゲインをバンド単位で算出する
ことを特徴とするオーディオ復号装置。 - フレームごとに入力される符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離部と、
過去のフレームで用いたゲインをバンド単位で記憶する記憶部と、
前記記憶部から取得した過去のフレームのゲインと前記分離部で分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号部と、
前記ゲイン復号部で得られたゲインに基づいて、前記分離部で分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化部と、
前記逆量子化部で得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換部とを備え、
前記ゲイン情報は、当該フレームの差分ゲインが時間方向または周波数方向のいずれかの差分符号化方法で差分符号化されているかを表す差分方式情報をそれぞれ含み、
前記ゲイン復号部は、前記ゲイン情報の差分方式情報に対応する差分符号化方法に従って、ゲインを算出する
ことを特徴とするオーディオ復号装置。 - オーディオ符号化装置のコンピュータで、請求項1〜請求項7のいずれか1つに記載のオーディオ符号化方法を実行させるためのプログラム。
- オーディオ復号装置のコンピュータで、請求項8または請求項9に記載のオーディオ復号方法を実行させるためのプログラム。
- 入力オーディオ信号を符号化して符号化オーディオデータを生成するオーディオ符号化装置と、このオーディオ符号化装置で生成された符号化オーディオデータを復号して、復号オーディオ信号を生成するオーディオ復号装置とから構成され、
前記オーディオ符号化装置は、
入力オーディオ信号をフレーム単位で周波数信号に変換する直交変換部と、
前記直交変換部で得られた周波数信号をスケーリングするためのゲインを、複数の周波数信号をまとめたバンド単位で算出し、これらゲインを過去のフレームで使用した過去ゲインを用いてそれぞれ修正して修正ゲインを算出するゲイン計算部と、
前記ゲイン計算部で得られた修正ゲインを用いて前記周波数信号をバンド単位でスケーリングするとともに量子化して量子化信号を生成する量子化部と、
前記ゲイン計算部で得られた修正ゲインとこれに対応する前記過去ゲインの差分をゲイン情報としてバンド単位で符号化してゲイン情報を生成するゲイン符号化部と、
前記量子化部で得られた量子化信号と前記ゲイン符号化部で得られたゲイン情報とをバンド単位で多重して符号化オーディオデータを生成する多重化部と
を備え、
前記オーディオ復号装置は、
フレームごとに入力される、前記オーディオ符号化装置で生成された符号化オーディオデータから、複数の周波数信号をまとめたバンド単位で、量子化信号情報と当該量子化信号をスケーリングするためのゲイン情報とを分離する分離部と、
過去のフレームで用いたゲインをバンド単位で記憶する記憶部と、
前記記憶部から取得した過去のフレームのゲインと前記分離部で分離されたゲイン情報に含まれる差分ゲインを用いて当該フレームのゲインをバンド単位で復号するゲイン復号部と、
前記ゲイン復号部で得られたゲインに基づいて、前記分離部で分離された量子化信号情報をバンド単位で逆量子化するとともにスケーリングして周波数信号を生成する逆量子化部と、
前記逆量子化部で得られた周波数信号を直交変換して復号オーディオ信号を生成する直交変換部と
を備える
ことを特徴とするオーディオ符号化・復号システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009520622A JP5434592B2 (ja) | 2007-06-27 | 2008-06-25 | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007169058 | 2007-06-27 | ||
JP2007169058 | 2007-06-27 | ||
PCT/JP2008/061580 WO2009001874A1 (ja) | 2007-06-27 | 2008-06-25 | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
JP2009520622A JP5434592B2 (ja) | 2007-06-27 | 2008-06-25 | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009001874A1 JPWO2009001874A1 (ja) | 2010-08-26 |
JP5434592B2 true JP5434592B2 (ja) | 2014-03-05 |
Family
ID=40185686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009520622A Active JP5434592B2 (ja) | 2007-06-27 | 2008-06-25 | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8788264B2 (ja) |
EP (1) | EP2159790B1 (ja) |
JP (1) | JP5434592B2 (ja) |
WO (1) | WO2009001874A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2454208A (en) * | 2007-10-31 | 2009-05-06 | Cambridge Silicon Radio Ltd | Compression using a perceptual model and a signal-to-mask ratio (SMR) parameter tuned based on target bitrate and previously encoded data |
KR101078378B1 (ko) * | 2009-03-04 | 2011-10-31 | 주식회사 코아로직 | 오디오 부호화기의 양자화 방법 및 장치 |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
CN103443856B (zh) | 2011-03-04 | 2015-09-09 | 瑞典爱立信有限公司 | 音频编码中的后量化增益校正 |
EP3534367B1 (en) * | 2012-05-30 | 2020-05-13 | Nippon Telegraph and Telephone Corporation | Encoding method, encoder, program and recording medium |
WO2013187498A1 (ja) * | 2012-06-15 | 2013-12-19 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
US9460729B2 (en) * | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
JP6531649B2 (ja) * | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
KR101913241B1 (ko) * | 2013-12-02 | 2019-01-14 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인코딩 방법 및 장치 |
RU2764260C2 (ru) | 2013-12-27 | 2022-01-14 | Сони Корпорейшн | Устройство и способ декодирования |
EP3162086B1 (en) * | 2014-06-27 | 2021-04-07 | Dolby International AB | Apparatus for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values |
EP3489953B8 (en) | 2014-06-27 | 2022-06-15 | Dolby International AB | Determining a lowest integer number of bits required for representing non-differential gain values for the compression of an hoa data frame representation |
EP2960903A1 (en) | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
WO2015197517A1 (en) | 2014-06-27 | 2015-12-30 | Thomson Licensing | Coded hoa data frame representation that includes non-differential gain values associated with channel signals of specific ones of the data frames of an hoa data frame representation |
CN106663435A (zh) * | 2014-09-08 | 2017-05-10 | 索尼公司 | 编码装置和方法、解码装置和方法、以及程序 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001094433A (ja) * | 1999-09-17 | 2001-04-06 | Matsushita Electric Ind Co Ltd | サブバンド符号化・復号方法 |
JP2001094432A (ja) * | 1999-09-17 | 2001-04-06 | Matsushita Electric Ind Co Ltd | サブバンド符号化・復号方法 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2834260B2 (ja) * | 1990-03-07 | 1998-12-09 | 三菱電機株式会社 | 音声のスペクトル包絡パラメータ符号化装置 |
US5517595A (en) * | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
US5960390A (en) * | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
GB2318029B (en) * | 1996-10-01 | 2000-11-08 | Nokia Mobile Phones Ltd | Audio coding method and apparatus |
US6154499A (en) * | 1996-10-21 | 2000-11-28 | Comsat Corporation | Communication systems using nested coder and compatible channel coding |
KR100335611B1 (ko) * | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
FI113571B (fi) * | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
US6704705B1 (en) * | 1998-09-04 | 2004-03-09 | Nortel Networks Limited | Perceptual audio coding |
US6453287B1 (en) * | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US7558391B2 (en) * | 1999-11-29 | 2009-07-07 | Bizjak Karl L | Compander architecture and methods |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
EP1345331B1 (en) | 2000-12-22 | 2008-08-20 | Sony Corporation | Encoder |
JP2002268693A (ja) | 2001-03-12 | 2002-09-20 | Mitsubishi Electric Corp | オーディオ符号化装置 |
JP4263412B2 (ja) * | 2002-01-29 | 2009-05-13 | 富士通株式会社 | 音声符号変換方法 |
JP4153220B2 (ja) * | 2002-02-28 | 2008-09-24 | ヤマハ株式会社 | 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム |
US7272566B2 (en) * | 2003-01-02 | 2007-09-18 | Dolby Laboratories Licensing Corporation | Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
JP4771674B2 (ja) | 2004-09-02 | 2011-09-14 | パナソニック株式会社 | 音声符号化装置、音声復号化装置及びこれらの方法 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
TWI317933B (en) * | 2005-04-22 | 2009-12-01 | Qualcomm Inc | Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
EP3985873A1 (en) * | 2006-07-04 | 2022-04-20 | Dolby International AB | Filter system comprising a filter converter and a filter compressor and method for operating the filter system |
JP4823001B2 (ja) * | 2006-09-27 | 2011-11-24 | 富士通セミコンダクター株式会社 | オーディオ符号化装置 |
JP4439579B1 (ja) * | 2008-12-24 | 2010-03-24 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
-
2008
- 2008-06-25 WO PCT/JP2008/061580 patent/WO2009001874A1/ja active Application Filing
- 2008-06-25 EP EP08777596.1A patent/EP2159790B1/en active Active
- 2008-06-25 US US12/452,213 patent/US8788264B2/en active Active
- 2008-06-25 JP JP2009520622A patent/JP5434592B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001094433A (ja) * | 1999-09-17 | 2001-04-06 | Matsushita Electric Ind Co Ltd | サブバンド符号化・復号方法 |
JP2001094432A (ja) * | 1999-09-17 | 2001-04-06 | Matsushita Electric Ind Co Ltd | サブバンド符号化・復号方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2159790A1 (en) | 2010-03-03 |
WO2009001874A1 (ja) | 2008-12-31 |
JPWO2009001874A1 (ja) | 2010-08-26 |
US8788264B2 (en) | 2014-07-22 |
EP2159790B1 (en) | 2019-11-13 |
US20100106509A1 (en) | 2010-04-29 |
EP2159790A4 (en) | 2016-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5434592B2 (ja) | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム | |
KR102115358B1 (ko) | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 | |
JP5038138B2 (ja) | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 | |
KR101162275B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
JP4212591B2 (ja) | オーディオ符号化装置 | |
US8032371B2 (en) | Determining scale factor values in encoding audio data with AAC | |
KR100840439B1 (ko) | 음성부호화장치 및 음성복호장치 | |
KR100904605B1 (ko) | 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법 | |
JP4063508B2 (ja) | ビットレート変換装置およびビットレート変換方法 | |
JP5609591B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
KR101103004B1 (ko) | 오디오 인코딩 시의 레이트-왜곡 제어 구조 | |
CN112992159B (zh) | 一种lc3音频编解码方法、装置、设备及存储介质 | |
KR20130109793A (ko) | 잡음 감쇄를 위한 오디오 신호 부호화 방법 및 장치 | |
KR20170047361A (ko) | 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치 | |
JPH0969781A (ja) | オーディオデータ符号化装置 | |
JP5379871B2 (ja) | オーディオ符号化のための量子化 | |
JP5019437B2 (ja) | オーディオビットレート変換方法および装置 | |
JP2016206244A (ja) | 符号化装置、符号化方法、及びプログラム | |
JPWO2009087923A1 (ja) | 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム | |
KR102243217B1 (ko) | 오디오 신호 부호화 방법 및 장치 | |
JP2001148632A (ja) | 符号化装置、符号化方法、及びその記録媒体 | |
JP2007004050A (ja) | ステレオ信号の符号化装置及び符号化プログラム | |
WO2008072524A1 (ja) | オーディオ信号符号化方法及び復号化方法 | |
JP2004021153A (ja) | オーディオ信号符号化装置 | |
JP6552986B2 (ja) | 音声符号化装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110511 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130723 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130903 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131008 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131021 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5434592 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |