JP3597077B2 - Audio signal decoding device - Google Patents
Audio signal decoding device Download PDFInfo
- Publication number
- JP3597077B2 JP3597077B2 JP12749899A JP12749899A JP3597077B2 JP 3597077 B2 JP3597077 B2 JP 3597077B2 JP 12749899 A JP12749899 A JP 12749899A JP 12749899 A JP12749899 A JP 12749899A JP 3597077 B2 JP3597077 B2 JP 3597077B2
- Authority
- JP
- Japan
- Prior art keywords
- filter bank
- equation
- decoding
- audio signal
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、オーディオ信号の復号化装置、特にサブバンド合成フィルタバンクにおける演算処理を高能率化したオーディオ信号復号化装置に関する。
【0002】
【従来の技術】
オーディオ信号の符号化は、近年のISDNおよびVLSI技術の発展によって急速に注目を集めている。特に、ディジタルオーデイオ、ディジタル衛星放送(DSB)、オーディオ信号の蓄積、遠隔会議、マルチメディア応用等でその重要性が増加している。
【0003】
MPEG(Moving Picture Expert Group)において、ビデオ信号とともにオーディオ信号を圧縮する世界標準符号化方式が検討され、オーディオ信号の符号化技術については、MPEG/オーディオ(国際規格ISO/IEC 11172−3)に代表される符号化アルゴリズムが決定され、公開されている。MPEGオーディオ符号化技術については、社団法人 テレビジョン学会編、オーム社発行の「MPEG」に詳しく説明されている。また、IEEE マルチメディアジャーナル1995年夏号には、デイビス・パン著「MPEG/オーディオデータ圧縮チュートリアル」にMPEGオーディオ圧縮理論が解説されている。
【0004】
MPEG/オーディオのアルゴリズムはレイヤ1,レイヤ2,レイヤ3の3種類のアルゴリズムから構成され、レイヤ1からレイヤ3の順で複雑になるが、アルゴリズムが32帯域のサブバンド符号化に基づいており、チャンネル数が2、サンプリング周波数が32,44.1,48kHzのいずれかである点で共通している(以下、MPEG/オーディオ・レイヤ3のアルゴリズムを特にMP3と呼ぶ)。ここで、サブバンド符号化とは、聴覚特性を利用して信号を複数のサブバンドに分割して、それぞれのバンドを異なる量子化特性で量子化する符号化方式である。
【0005】図10に、サブバンド符号化方式に基づいたMPEG/オーディオアルゴリズムの基本ブロック図を示す。入力されたオーディオ信号は、入力を複数のサブバンドに分けるフィルタバンク11を通る。同時に、入力されたオーディオ信号は、各サブバンドのマスキング閾値に対する信号エネルギーの比率を決定する心理聴覚モデル12を通る。心理聴覚モデル12に基づいたビット割当てに従って量子化・符号化手段13により量子化および符号化した後、必要に応じ図示しないアンシラリデータ(利用者が任意に定義できるデータ)を合わせて、フォーマット手段14によりビットストリーム中にフォーマットする。このように符号化されたビットストリームは、CD−ROM等の蓄積媒体に格納されたり、通信回線等の伝送路で伝送される。復号は、フレーム分解手段21においてまず付加されたアンシラリデータを分離してビットストリームを分解する。次いで、サイド情報として送られたビット割当てに基づいて復号・逆量子化手段22により復号、逆量子化を行いサブバンド値を復元する。最後に、サブバンド合成フィルタバンク23によりサブバンド値を合成しオーディオ信号を再現する。
【0006】
ところで、復号化におけるサブバンド合成フィルタバンクは、周波数成分に分割された信号をもとの時系列オーディオ信号にもどす機能を有しており、この機能を実現するために、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)といった三角関数で記述される変換処理を行っている。
【0007】
【発明が解決しようとする課題】
しかしながら、MP3の規格書に規定された変換処理をそのまま実行すると、角度の計算に要する加算・乗算も考慮に入れた場合の演算処理量は、64個の出力を得るために6144回の乗算と6080回の加算が必要であり、計算負荷が大きかった。このため、従来のMP3復号化による機器、例えばMP3プレーヤでは、低価格で実用的な性能を得ることが困難であった。
【0008】
そこで本発明の目的は、こうした従来技術の欠点を解決し、サブバンド合成フィルタバンクにおける演算量を大幅に削減でき、もって復号化処理をより高速化できるオーディオ信号の復号化装置を提供すること
にある。
【0009】
【課題を解決するための手段】
上記課題を解決するために、本発明は、符号化されたビットストリームを分解するフレーム分解手段と、ビット割当てに基づいて復号、逆量子化を行いn個のサブバンド値を復元する復号・逆量子化手段と、得られたサブバンド値を合成しオーディオ信号を再現するサブバンド合成フィルタバンクとからなり、サブバンド合成フィルタバンクは、n/4個のサブバンド入力を離散コサイン変換(DCT)し出力する第1及び第2のフィルタバンクと、n/4個のサブバンド入力を離散サイン変換(DST)し出力する第3及び第4のフィルタバンクを備え、n個のサブバンド値を4分割して第1のフィルタバンク、第2のフィルタバンク、第3のフィルタバンクおよび第4のフィルタバンクへそれぞれ入力し、第1のフィルタバンクの出力Q1(n/4,k)(k=0,1,2,...,n/2−1。以下同じ)と第2のフィルタバンクの出力Q2(n/4,k)との差P1(k)を求める第1の処理と、第3のフィルタバンクの出力Q3(n/4,k)と第4のフィルタバンクの出力Q4(n/4,k)との和をとり所定の係数を乗じP2(k)を求める第2の処理と、P1(k)及びP2(k)に基づきn×2個の合成フィルタ出力X(n,p)(p=0,1, ... ,63)を求める第3の処理とを行うことを特徴とするオーディオ信号復号化装置を提供する。
【0010】
この場合において、前記復号・逆量子化手段がn=32個のサブバンド値を復元するものであり、第1の処理が、
【0011】
【数4】
【0012】
であり、第2の処理が、
【0013】
【数5】
【0014】
であり、第3の処理が、次のフィルタ出力X(32,p)(p=0,1, ... ,63)
【0015】
【数6】
【0016】
を求めるものであることが好ましい。
【0017】
【発明の実施の形態】
本発明に係るオーディオ信号復号化装置について実施の形態の全体構成を説明する前に、まずその主要部をなすサブバンド合成フィルタバンクにおけるアルゴリズムを詳細に説明する。
【0018】
今、MPEG/オーディオのレイヤ3(MP3)におけるサブバンド合成フィルタバンクを高速化することを例にとり、そのための高速DCTアルゴリズムの適用を検討する。
【0019】
[サブバンド合成フィルタバンクを4つの項で記述する]
MP3のサブバンド合成フィルタバンクでは入力の個数が32で出力の個数が64である。入力の個数をn(=32)と表記したときの変換式は次式で表される。
【0020】
【数7】
【0021】
ここで、次の記号を定義する。
【0022】
【数8】
【0023】
式(2)を式(1)に適用すると、次式の様に表すことができる。
【0024】
【数9】
【0025】
式(3)はサイズ32のいわゆるタイプIIのDCTに類似しているので、高速DCTのアルゴリズムを用いることで、サイズ2まで縮小して演算を高速化することが可能と推定される。
【0026】
そこで、式(1)を偶数項と奇数項に分割する。
【0027】
【数10】
【0028】
式(4)は、式(2)の定義及び三角関数の公式に従い、かつ、xn=0およびx−1=0の関係より、次式のように変形できる。
【0029】
【数11】
【0030】
式(5)に着目し、(−1)mを削除するために、mが偶数の項と奇数の項に分割して表すと次の通りである。
【0031】
【数12】
【0032】
次に、式(6)における最後の2項に着目すると、三角関数の公式に従い、かつ、x−2=0およびx−1=0より、次式の様に変形できる。
【0033】
【数13】
【0034】
ここで、次のように定義を行う。
【0035】
【数14】
【0036】
【数15】
【0037】
【数16】
【0038】
【数17】
【0039】
式(8)から式(11)を用いると、式(6)のMP3の合成フィルタバンクは次のように表せる。
【0040】
【数18】
【0041】
式(12)の4つの項は、それぞれ、サイズ8のDCTまたはDSTである。以下、4項それぞれについて、本発明に従い計算負荷がどのように削減されるかを説明する。
【0042】
[タイプIのDCT]
タイプIのDCTは次の通り定義される。
【0043】
【数19】
【0044】
ここで、式(13)の2つの項を次のように定義する。
【0045】
【数20】
【0046】
【数21】
【0047】
そうすると、式(13)は次のように表すことができる。
【0048】
【数22】
【0049】
式(16)をk=0,1,...,2n−1に対して計算するときには、三角関数の周期性を利用して式(15),(16)をk=0,1,...,n/2について計算した結果を用いることで計算負荷を削減することができる。
【0050】
すなわち、(16)は、次のように表すことができる。
【0051】
【数23】
【0052】
式(14),(15)はサイズn/2のタイプIのDCTであるので、再帰的に繰り返してサイズ2のDCTまで縮約することができる。また、式(17)を用いて、サイズ8のDCTをk=0,1,...,16まで計算することができる。
【0053】
式(8)にもどって、式(8)のQ1(n/4,k)は、サイズ8のDCTである。k=0,1,...16に対するQ1(n/4,k)を用いてQ1(n/4,0)からQ1(n/4,63)までを計算する方法を以下説明する。
【0054】
ここでは、n=32となるが、式(17)によってk=0,1,...,16までが計算済みである。式(12)の4つの項すべてに掛けられる係数とQ1(n/4,k)について、三角関数の周期性を利用すると、次のように表すことができる。
【0055】
【数24】
【0056】
すなわち、Q1(n/4,k)に関しては、k=0,1,...,16に対する値を計算すればk=0,1,...,63に対応する値が得られるので計算負荷が4分の1で済むことを示している。しかも、これらの値はk=0,1,...,8に対するG1(8、k)とH1(8、k)によって求めることができ、最終的にはこれらはk=0,1に対するG1(2、k)とH1(2、k)によって求めることができるので、相当量の計算負荷を削減できることを示している。
【0057】
[タイプIIのDCT]
タイプIIのDCTは次の通り定義される。
【0058】
【数25】
【0059】
ここで、式(19)の2つの項を次のように定義する。
【0060】
【数26】
【0061】
【数27】
【0062】
そうすると、式(19)は次のように表すことができる。
【0063】
【数28】
【0064】
式(22)をk=0,1,...,2n−1に対して計算するときには、三角関数の周期性を利用して式(20),(21)をk=0,1,...,n/2について計算した結果を用いることで計算負荷を削減することができる。すなわち、式(22)は、次のように表すことができる。
【0065】
【数29】
【0066】
式(20),(21)はそれぞれサイズn/2のタイプIとタイプIIのDCTであるので、再帰的に繰り返してサイズ2のDCTまで縮約することができる。また、式(23)を用いて、サイズ8のDCTをk=0,1,...,16まで計算することができる。
【0067】
式(9)にもどって、式(9)のQ2(n/4,k)は、サイズ8のタイプIIのDCTである。k=0,1,...16に対するQ2(n/4,k)を用いてQ2(n/4,0)からQ2(n/4,63)までを計算する方法を以下説明する。
【0068】
ここでは、n=32となるが、式(17)によってk=0,1,...,16までが計算済みであり、式(12)の4つの項すべてに掛けられる係数についても計算済みである。Q2(n/4,k)について、三角関数の周期性を利用すると、次のように表すことができる。
【0069】
【数30】
【0070】
すなわち、Q2(n/4,k)に関しても、最終的にはこれらはk=0,1に対するG2(2、k)とH2(2、k)によって求めることができるので、相当量の計算負荷を削減できることを示している。
【0071】
[タイプIのDST]
タイプIのDSTは次の通り定義される。
【0072】
【数31】
【0073】
ここで、式(25)の2つの項を次のように定義する。
【0074】
【数32】
【0075】
【数33】
【0076】
そうすると、式(25)は次のように表すことができる。
【0077】
【数34】
【0078】
式(28)をk=0,1,...,2n−1に対して計算するときには、三角関数の周期性を利用して式(26),(27)をk=0,1,...,n/2について計算した結果を用いることで計算負荷を削減することができる。すなわち、式(28)は、次のように表すことができる。
【0079】
【数35】
【0080】
式(26),(27)はサイズn/2のタイプIのDSTであるので、再帰的に繰り返してサイズ2のDSTまで縮約することができる。また、式(29)を用いて、サイズ8のDSTをk=0,1,...,16まで計算することができる。
【0081】
式(10)にもどって、式(10)のQ3(n/4,k)は、サイズ8のDSTである。k=0,1,...16に対するQ3(n/4,k)を用いてQ3(n/4,0)からQ3(n/4,63)までを計算する方法を以下説明する。
【0082】
ここでは、n=32となるが、式(29)によってk=0,1,...,16までが計算済みであり、式(12)の4つの項すべてに掛けられる係数についても計算済みである。Q3(n/4,k)について、三角関数の周期性を利用すると、次のように表すことができる。
【0083】
【数36】
【0084】
すなわち、Q3(n/4,k)に関しても、最終的にはこれらはk=0,1,2に対するG3(2、k)とH3(2、k)によって求めることができるので、相当量の計算負荷を削減できることを示している。
【0085】
[タイプIIのDST]
タイプIIのDSTは次の通り定義される。
【0086】
【数37】
【0087】
ここで、式(31)の2つの項を次のように定義する。
【0088】
【数38】
【0089】
【数39】
【0090】
そうすると、式(31)は次のように表すことができる。
【0091】
【数40】
【0092】
式(34)をk=0,1,...,2n−1に対して計算するときには、三角関数の周期性を利用して式(32),(33)をk=0,1,...,n/2について計算した結果を用いることで計算負荷を削減することができる。すなわち、式(34)は、次のように表すことができる。
【0093】
【数41】
【0094】
式(32),(33)はそれぞれサイズn/2のタイプIIとタイプIのDSTであるので、再帰的に繰り返してサイズ2のDSTまで縮約することができる。また、式(35)を用いて、サイズ8のDSTをk=0,1,...,16まで計算することができる。
【0095】
式(11)にもどって、式(11)のQ4(n/4,k)は、サイズ8のタイプIIのDSTである。k=0,1,...16に対するQ4(n/4,k)を用いてQ4(n/4,0)からQ4(n/4,63)までを計算する方法を以下説明する。
【0096】
ここでは、n=32となるが、式(35)によってk=0,1,...,16までが計算済みであり、式(12)の4つの項すべてに掛けられる係数についても計算済みである。Q4(n/4,k)について、三角関数の周期性を利用すると、次のように表すことができる。
【0097】
【数42】
【0098】
すなわち、Q4(n/4,k)に関しても、最終的にはこれらはk=0,1に対するG4(2、k)とH4(2、k)によって求めることができるので、相当量の計算負荷を削減できることを示している。
【0099】
以上の演算処理をまとめると、MP3のサブバンド合成フィルタバンクの各出力を計算する方法は次のように簡略表記ができる。
【0100】
1.2つの式を定義する。
【0101】
【数43】
【0102】
2.サブバンド合成フィルタバンクの出力X(32,k)は、次の通りである。
【0103】
【数44】
【0104】
次に、本発明に係るオーディオ信号復号化装置について好ましい実施の形態を図面を参照しつつ説明する。
【0105】
本実施の形態の全体構成は、図10に示す従来の装置と同様であり、符号化されたビットストリームを分解するフレーム分解手段21と、ビット割当てに基づいて復号、逆量子化を行いn個のサブバンド値を復元する復号・逆量子化手段22と、得られたサブバンド値を合成しオーディオ信号を再現するサブバンド合成フィルタバンク23を有している。
【0106】
図1に本実施の形態における主要部であるサブバンド合成フィルタバンクのシグナルフロー図を示す。図1に示すようにサブバンド合成フィルタバンクは第1のフィルタバンクQ1、第2のフィルタバンクQ2、第3のフィルタバンクQ3及び第4のフィルタバンクQ4を備えている。第1のフィルタバンクQ1及び第2のフィルタバンクQ2は、n/4=8個(n=32)のサブバンド入力を離散コサイン変換(DCT)し16個の出力をする。また、第3のフィルタバンクQ3及び第4のフイルタバンクQ4は、n/4=8個のサブバンド入力を離散サイン変換(DST)し16個の出力をする。
【0107】
ここで、n=32個のサブバンド値を4分割して第1のフィルタバンクQ1、第2のフィルタバンクQ2、第3のフィルタバンクQ3および第4のフィルタバンクQ4へそれぞれ入力するデータは、次式に従い前処理を行ったものである。
【0108】
【0109】
図2から図5は、フィルタバンクQ1からQ4までのシグナルフロー図である。
【0110】
ここで、図1から図5のシグナルフロー図の表記方法を補足する。
【0111】
まずデータの表示は、図6に示すように、数字と丸印と直線で表しており、数字はデータの番号を表し、処理の流れは左から右に進む。
【0112】
データの処理として、加算は図7のように示される。図7例では、データkはデータiとデータjを加算することを意味する。
【0113】
符号の付加は、図8に示すように2つのデータの丸印を接続する直線の下もしくは横に付された符号で表しており、図8の例ではj=−iとなる。
【0114】
乗算は、図9に示すように、2つのデータの丸印を接続する直線の下または上に付された数式(1/2,C64−2等)で表しており、左側の丸印のデータにその数式の値を掛ける。図9の例ではj=a*iとなる。
【0115】
最後に、C64−2,C4−1等で表した数式を一般的にCa−bと表記すると、
Ca−b=1/[2cos〔(b/a)*π)〕]
を意味している。
【0116】
図1から図5に示す本実施の形態のシグナルフローから明らかな通り、本実施の形態の処理によれば、79回の乗算と223回の加算により64個のMP3サブバンド合成フィルタバンクの出力を得ることができる。
【0117】
従来のサブバンド合成フィルタバンクの処理は、図11に示すように64個の処理R(k)(k=0,1,...63)により構成されており、64個の処理R(k)の入力データは共通であった。このときの処理R(k)のシグナルフローは、図12に示した通りであり、64個の出力を得るためには、6144回の乗算と6080回の加算が必要であった。
【0118】
これに対し、本実施の形態によれば、従来のR(k)に相当する処理を4個しか使用せず、必要とされる計算量も少ない。したがって、サブバンド合成フィルタバンクにおける計算負荷を大幅に軽減することができる。
【0119】
本発明は、上記した実施の形態に限定されるものではなく、特許請求の範囲に記載した技術的思想の範囲内において、種々の変更が可能なのはいうまでもない。
【0120】
【発明の効果】
以上説明したように、本発明によるオーディオ信号の復号化装置によれば、サブバンド合成フィルタバンクにおける演算量を大幅に削減でき、もって復号化処理をより高速化できるので、低価格で実用的な性能を有するMP3プレーヤ等の機器に利用できる工業的意義は極めて大である。
【図面の簡単な説明】
【図1】本発明の主要部であるサブバンド合成フィルタバンクのシグナルフロー図。
【図2】フィルタバンクQ1のシグナルフロー図。
【図3】フィルタバンクQ2のシグナルフロー図。
【図4】フィルタバンクQ3のシグナルフロー図。
【図5】フィルタバンクQ4のシグナルフロー図。
【図6】データの表示を表記するシグナルフローの説明図。
【図7】加算のデータの処理を表記するシグナルフローの説明図。
【図8】符号の付加の処理を表記するシグナルフローの説明図。
【図9】乗算の処理を表記するシグナルフローの説明図。
【図10】サブバンド符号化方式に基づいたMPEG/オーディオアルゴリズムの基本ブロック図。
【図11】従来のサブバンド合成フィルタバンクの処理を示す説明図。
【図12】従来のフィルタバンク処理R(k)のシグナルフロー図。
【符号の説明】
21 フレーム分解手段
22 復号・逆量子化手段
23 サブバンド合成フィルタバンク[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an audio signal decoding device, and more particularly to an audio signal decoding device in which arithmetic processing in a sub-band synthesis filter bank is highly efficient.
[0002]
[Prior art]
Coding of audio signals has been rapidly receiving attention due to the recent development of ISDN and VLSI technologies. In particular, its importance is increasing in digital audio, digital satellite broadcasting (DSB), storage of audio signals, teleconferencing, multimedia applications, and the like.
[0003]
In MPEG (Moving Picture Expert Group), a global standard encoding method for compressing an audio signal together with a video signal has been studied, and the encoding technique of an audio signal is represented by MPEG / audio (international standard ISO / IEC 11172-3). The coding algorithm used is determined and published. The MPEG audio encoding technology is described in detail in “MPEG” published by Ohmsha, edited by The Institute of Television Engineers of Japan. Also, the IEEE Multimedia Journal, Summer 1995, describes MPEG audio compression theory in the "MPEG / Audio Data Compression Tutorial" by Davis Pan.
[0004]
The MPEG / audio algorithm is composed of three types of algorithms,
FIG. 10 shows a basic block diagram of an MPEG / audio algorithm based on a subband encoding method. The input audio signal passes through a
[0006]
Incidentally, the sub-band synthesis filter bank in decoding has a function of returning a signal divided into frequency components to an original time-series audio signal. In order to realize this function, a discrete cosine transform (DCT) is used. , A modified discrete cosine transform (MDCT).
[0007]
[Problems to be solved by the invention]
However, if the conversion processing specified in the MP3 standard is executed as it is, the amount of calculation processing in consideration of addition and multiplication required for the angle calculation is 6144 multiplications to obtain 64 outputs. 6080 additions were required, and the calculation load was heavy. For this reason, it has been difficult for a conventional device using MP3 decoding, for example, an MP3 player, to obtain practical performance at low cost.
[0008]
Accordingly, an object of the present invention is to provide an audio signal decoding device which can solve the above-mentioned drawbacks of the conventional technology, can greatly reduce the amount of calculation in the subband synthesis filter bank, and can thereby speed up the decoding process. is there.
[0009]
[Means for Solving the Problems]
In order to solve the above-mentioned problem, the present invention provides a frame decomposing unit that decomposes an encoded bit stream, and a decoding and inverse decoding unit that performs decoding and inverse quantization based on bit allocation to restore n subband values. It comprises a quantizing means and a sub-band synthesis filter bank for synthesizing the obtained sub-band values and reproducing an audio signal. The sub-band synthesis filter bank converts n / 4 sub-band inputs into discrete cosine transform (DCT). And first and second filter banks for performing output and n / 4 sub-band inputs, and third and fourth filter banks for performing discrete sine transform (DST) on and outputting n sub-band inputs. Divided and input to a first filter bank, a second filter bank, a third filter bank, and a fourth filter bank, respectively, and output Q of the first filter bank 1 (n / 4, k) (k = 0, 1, 2,..., N / 2−1; the same applies hereinafter) and the output Q 2 (n / 4, k) of the second filter bank The first processing for obtaining P 1 (k) and the sum of the output Q 3 (n / 4, k) of the third filter bank and the output Q 4 (n / 4, k) of the fourth filter bank are A second coefficient multiplication by a predetermined coefficient to obtain P 2 (k), and n × 2 synthesis filter outputs X (n, p) (p = 0) based on P 1 (k) and P 2 (k). , 1, ... , 63) .
[0010]
In this case, the decoding / inverse quantization means restores n = 32 subband values, and the first processing is as follows .
[0011]
(Equation 4)
[0012]
And the second processing is
[0013]
(Equation 5)
[0014]
And the third processing is the next filter output X (32, p) (p = 0, 1, ... , 63)
[0015]
(Equation 6)
[0016]
Is preferably obtained.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
Before describing the overall configuration of the embodiment of the audio signal decoding apparatus according to the present invention, first, an algorithm in a subband synthesis filter bank which is a main part thereof will be described in detail.
[0018]
Now, taking an example of speeding up the subband synthesis filter bank in the layer 3 (MP3) of MPEG / audio, an application of a high-speed DCT algorithm for that purpose will be considered.
[0019]
[Describe subband synthesis filter bank in four terms]
In the MP3 subband synthesis filter bank, the number of inputs is 32 and the number of outputs is 64. The conversion equation when the number of inputs is represented by n (= 32) is represented by the following equation.
[0020]
(Equation 7)
[0021]
Here, the following symbols are defined.
[0022]
(Equation 8)
[0023]
When equation (2) is applied to equation (1), it can be expressed as the following equation.
[0024]
(Equation 9)
[0025]
Since equation (3) is similar to a so-called type II DCT of
[0026]
Therefore, equation (1) is divided into even and odd terms.
[0027]
(Equation 10)
[0028]
Equation (4) can be transformed into the following equation according to the definition of equation (2) and the formula of trigonometric function, and from the relationship of x n = 0 and x −1 = 0.
[0029]
(Equation 11)
[0030]
Focusing on equation (5), (-1) In order to eliminate m , m is divided into an even term and an odd term as follows.
[0031]
(Equation 12)
[0032]
Next, paying attention to the last two terms in the equation (6), the following equation can be used according to the formula of the trigonometric function, and from x −2 = 0 and x −1 = 0.
[0033]
(Equation 13)
[0034]
Here, the definition is made as follows.
[0035]
[Equation 14]
[0036]
[Equation 15]
[0037]
(Equation 16)
[0038]
[Equation 17]
[0039]
Using Expressions (8) to (11), the synthesis filter bank of MP3 in Expression (6) can be expressed as follows.
[0040]
(Equation 18)
[0041]
Each of the four terms in equation (12) is a DCT or DST of
[0042]
[Type I DCT]
Type I DCT is defined as follows.
[0043]
[Equation 19]
[0044]
Here, two terms of the equation (13) are defined as follows.
[0045]
(Equation 20)
[0046]
[Equation 21]
[0047]
Then, equation (13) can be expressed as follows.
[0048]
(Equation 22)
[0049]
Equation (16) is calculated using k = 0, 1,. . . , 2n−1, the equations (15) and (16) are calculated using k = 0, 1,. . . , N / 2, the calculation load can be reduced.
[0050]
That is, (16) can be expressed as follows.
[0051]
(Equation 23)
[0052]
Equations (14) and (15) are Type I DCTs of size n / 2 and can be reduced recursively to
[0053]
Returning to equation (8), Q 1 (n / 4, k) in equation (8) is a
[0054]
Here, n = 32. However, according to equation (17), k = 0, 1,. . . , 16 have already been calculated. Using the periodicity of the trigonometric function for the coefficient and Q 1 (n / 4, k) to be applied to all four terms of equation (12), it can be expressed as follows.
[0055]
(Equation 24)
[0056]
That is, for Q 1 (n / 4, k), k = 0, 1,. . . , 16 yields k = 0, 1,. . . , 63, the calculation load can be reduced to one fourth. Moreover, these values are k = 0, 1,. . . , 8 by G 1 (8, k) and H 1 (8, k), which are ultimately determined by G 1 (2, k) and H 1 (2, k) for k = 0,1. ) Indicates that a considerable amount of calculation load can be reduced.
[0057]
[Type II DCT]
Type II DCT is defined as follows.
[0058]
(Equation 25)
[0059]
Here, two terms of the equation (19) are defined as follows.
[0060]
(Equation 26)
[0061]
[Equation 27]
[0062]
Then, equation (19) can be expressed as follows.
[0063]
[Equation 28]
[0064]
Equation (22) is calculated using k = 0, 1,. . . , 2n−1, the equations (20) and (21) are calculated using k = 0, 1,. . . , N / 2, the calculation load can be reduced. That is, equation (22) can be expressed as follows.
[0065]
(Equation 29)
[0066]
Equations (20) and (21) are Type I and Type II DCTs of size n / 2, respectively, and can be recursively repeated to reduce to
[0067]
Returning to equation (9), Q 2 (n / 4, k) in equation (9) is a
[0068]
Here, n = 32. However, according to equation (17), k = 0, 1,. . . , 16 have already been calculated, and the coefficients multiplied by all four terms of equation (12) have also been calculated. Q 2 (n / 4, k) can be expressed as follows by using the periodicity of the trigonometric function.
[0069]
[Equation 30]
[0070]
That is, Q 2 (n / 4, k) can be finally obtained by G 2 (2, k) and H 2 (2, k) for k = 0, 1, so that a considerable amount It can be shown that the calculation load of can be reduced.
[0071]
[Type I DST]
Type I DST is defined as follows.
[0072]
[Equation 31]
[0073]
Here, two terms of the equation (25) are defined as follows.
[0074]
(Equation 32)
[0075]
[Equation 33]
[0076]
Then, equation (25) can be expressed as follows.
[0077]
(Equation 34)
[0078]
Equation (28) is converted to k = 0, 1,. . . , 2n−1, the equations (26) and (27) are calculated using k = 0, 1,. . . , N / 2, the calculation load can be reduced. That is, equation (28) can be expressed as follows.
[0079]
(Equation 35)
[0080]
Since equations (26) and (27) are type I DSTs of size n / 2, they can be reduced recursively to
[0081]
Returning to equation (10), Q 3 (n / 4, k) in equation (10) is a
[0082]
Here, n = 32. However, according to equation (29), k = 0, 1,. . . , 16 have already been calculated, and the coefficients multiplied by all four terms of equation (12) have also been calculated. Q 3 (n / 4, k) can be expressed as follows by using the periodicity of the trigonometric function.
[0083]
[Equation 36]
[0084]
That is, Q 3 (n / 4, k) can be finally obtained by G 3 (2, k) and H3 (2, k) for k = 0, 1, 2, so that This shows that the amount of computational load can be reduced.
[0085]
[Type II DST]
Type II DST is defined as follows.
[0086]
(37)
[0087]
Here, two terms of the equation (31) are defined as follows.
[0088]
[Equation 38]
[0089]
[Equation 39]
[0090]
Then, equation (31) can be expressed as follows.
[0091]
(Equation 40)
[0092]
Equation (34) is calculated using k = 0, 1,. . . , 2n−1, the equations (32) and (33) are calculated using k = 0, 1,. . . , N / 2, the calculation load can be reduced. That is, equation (34) can be expressed as follows.
[0093]
(Equation 41)
[0094]
Equations (32) and (33) are type II and type I DSTs of size n / 2, respectively, and can be reduced recursively to
[0095]
Returning to equation (11), Q 4 (n / 4, k) in equation (11) is a
[0096]
Here, n = 32. However, according to equation (35), k = 0, 1,. . . , 16 have already been calculated, and the coefficients multiplied by all four terms of equation (12) have also been calculated. Q 4 (n / 4, k) can be expressed as follows by using the periodicity of the trigonometric function.
[0097]
(Equation 42)
[0098]
That is, Q 4 (n / 4, k) can be finally obtained by G 4 (2, k) and H 4 (2, k) for k = 0,1. It can be shown that the calculation load of can be reduced.
[0099]
To summarize the above arithmetic processing, the method of calculating each output of the subband synthesis filter bank of MP3 can be simply described as follows.
[0100]
1. Define two expressions.
[0101]
[Equation 43]
[0102]
2. The output X (32, k) of the sub-band synthesis filter bank is as follows.
[0103]
[Equation 44]
[0104]
Next, a preferred embodiment of an audio signal decoding device according to the present invention will be described with reference to the drawings.
[0105]
The overall configuration of the present embodiment is the same as that of the conventional apparatus shown in FIG. 10, and includes a
[0106]
FIG. 1 shows a signal flow diagram of a subband synthesis filter bank which is a main part in the present embodiment. As shown in FIG. 1, the sub-band synthesis filter bank includes a first filter bank Q1, a second filter bank Q2, a third filter bank Q3, and a fourth filter bank Q4. The first filter bank Q1 and the second filter bank Q2 perform discrete cosine transform (DCT) on n / 4 = 8 (n = 32) subband inputs and
[0107]
Here, data which is obtained by dividing n = 32 subband values into four and inputting them to the first filter bank Q1, the second filter bank Q2, the third filter bank Q3, and the fourth filter bank Q4 are as follows: The pre-processing is performed according to the following equation.
[0108]
[0109]
2 to 5 are signal flow diagrams of the filter banks Q1 to Q4.
[0110]
Here, the notation method of the signal flow diagrams of FIGS. 1 to 5 will be supplemented.
[0111]
First, as shown in FIG. 6, the display of data is represented by a number, a circle, and a straight line, the number represents a data number, and the flow of processing proceeds from left to right.
[0112]
As a processing of data, the addition is shown as in FIG. In the example of FIG. 7, data k means that data i and data j are added.
[0113]
The addition of the code is represented by a code attached below or beside the straight line connecting the circles of the two data as shown in FIG. 8, and j = −i in the example of FIG.
[0114]
The multiplication is represented by an equation (1/2, C64-2, etc.) below or above a straight line connecting two data circles, as shown in FIG. Times the value of that formula. In the example of FIG. 9, j = a * i.
[0115]
Finally, when the mathematical expressions represented by C64-2, C4-1, etc. are generally expressed as Ca-b,
Ca-b = 1 / [2 cos [(b / a) * π)]]
Means
[0116]
As is clear from the signal flow of the present embodiment shown in FIGS. 1 to 5, according to the processing of the present embodiment, the outputs of 64 MP3 subband synthesis filter banks are obtained by 79 multiplications and 223 additions. Can be obtained.
[0117]
The processing of the conventional subband synthesis filter bank is composed of 64 processes R (k) (k = 0, 1,... 63) as shown in FIG. ) Were common. The signal flow of the processing R (k) at this time is as shown in FIG. 12, and in order to obtain 64 outputs, 6144 multiplications and 6080 additions were required.
[0118]
On the other hand, according to the present embodiment, only four processes corresponding to the conventional R (k) are used, and the required amount of calculation is small. Therefore, the calculation load on the subband synthesis filter bank can be significantly reduced.
[0119]
The present invention is not limited to the above-described embodiment, and it goes without saying that various changes can be made within the scope of the technical idea described in the claims.
[0120]
【The invention's effect】
As described above, according to the audio signal decoding apparatus of the present invention, the amount of calculation in the subband synthesis filter bank can be significantly reduced, and the decoding process can be further speeded up. The industrial significance that can be used for high-performance devices such as MP3 players is extremely large.
[Brief description of the drawings]
FIG. 1 is a signal flow diagram of a subband synthesis filter bank which is a main part of the present invention.
FIG. 2 is a signal flow diagram of a filter bank Q1.
FIG. 3 is a signal flow diagram of a filter bank Q2.
FIG. 4 is a signal flow diagram of a filter bank Q3.
FIG. 5 is a signal flow diagram of a filter bank Q4.
FIG. 6 is an explanatory diagram of a signal flow for displaying data.
FIG. 7 is an explanatory diagram of a signal flow showing processing of addition data.
FIG. 8 is an explanatory diagram of a signal flow showing a process of adding a code.
FIG. 9 is an explanatory diagram of a signal flow representing multiplication processing.
FIG. 10 is a basic block diagram of an MPEG / audio algorithm based on a subband encoding scheme.
FIG. 11 is an explanatory diagram showing processing of a conventional subband synthesis filter bank.
FIG. 12 is a signal flow diagram of conventional filter bank processing R (k).
[Explanation of symbols]
21 frame decomposition means 22 decoding / dequantization means 23 subband synthesis filter bank
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12749899A JP3597077B2 (en) | 1999-03-31 | 1999-03-31 | Audio signal decoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12749899A JP3597077B2 (en) | 1999-03-31 | 1999-03-31 | Audio signal decoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000286713A JP2000286713A (en) | 2000-10-13 |
JP3597077B2 true JP3597077B2 (en) | 2004-12-02 |
Family
ID=14961464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP12749899A Expired - Fee Related JP3597077B2 (en) | 1999-03-31 | 1999-03-31 | Audio signal decoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3597077B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002245027A (en) | 2001-02-15 | 2002-08-30 | Seiko Epson Corp | Filtering processing method and filtering processor |
-
1999
- 1999-03-31 JP JP12749899A patent/JP3597077B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000286713A (en) | 2000-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102150207B (en) | Compression of audio scale-factors by two-dimensional transformation | |
CN101223821B (en) | audio decoder | |
US5508949A (en) | Fast subband filtering in digital signal coding | |
JP4850837B2 (en) | Data processing method by passing between different subband regions | |
JP4439522B2 (en) | Apparatus and method for processing a signal having a sequence of discrete values | |
JP3814611B2 (en) | Method and apparatus for processing time discrete audio sample values | |
KR100804053B1 (en) | Device and method for processing at least two input values | |
TW200529548A (en) | Adaptive hybrid transform for signal analysis and synthesis | |
US7636660B2 (en) | Subband synthesis filtering process and apparatus | |
JP2005530206A (en) | Audio coding system that uses the characteristics of the decoded signal to fit the synthesized spectral components | |
EP0590790A2 (en) | Modified DCT signal transforming system | |
KR100346734B1 (en) | Audio coder and decoder having high speed analyzing filter and composite filter | |
JP3597077B2 (en) | Audio signal decoding device | |
US20100082717A1 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
US7512536B2 (en) | Efficient filter bank computation for audio coding | |
US8301282B2 (en) | Fast synthesis sub-band filtering method for digital signal decoding | |
Hans | Optimization of digital audio for internet transmission | |
JP3593201B2 (en) | Audio decoding equipment | |
Touimi et al. | Efficient method for multiple compressed audio streams spatialization | |
JP4033906B2 (en) | Analytical / synthetic filtering system with efficient odd stacked single sideband filter banks using time domain aliasing cancellation | |
CN100486332C (en) | Synthon frequency band filtering method and apparatus | |
Mazzola et al. | Finite Fourier | |
KR100322703B1 (en) | Audio encoder/decoder | |
JP3292228B2 (en) | Signal encoding device and signal decoding device | |
Ashida et al. | Audio signal compression via sampled-data control theory |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040521 Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040521 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20040708 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20040708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040824 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040907 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |