JP3597077B2 - Audio signal decoding device - Google Patents

Audio signal decoding device Download PDF

Info

Publication number
JP3597077B2
JP3597077B2 JP12749899A JP12749899A JP3597077B2 JP 3597077 B2 JP3597077 B2 JP 3597077B2 JP 12749899 A JP12749899 A JP 12749899A JP 12749899 A JP12749899 A JP 12749899A JP 3597077 B2 JP3597077 B2 JP 3597077B2
Authority
JP
Japan
Prior art keywords
filter bank
equation
decoding
audio signal
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP12749899A
Other languages
Japanese (ja)
Other versions
JP2000286713A (en
Inventor
高志 三浦
Original Assignee
株式会社ハドソン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ハドソン filed Critical 株式会社ハドソン
Priority to JP12749899A priority Critical patent/JP3597077B2/en
Publication of JP2000286713A publication Critical patent/JP2000286713A/en
Application granted granted Critical
Publication of JP3597077B2 publication Critical patent/JP3597077B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、オーディオ信号の復号化装置、特にサブバンド合成フィルタバンクにおける演算処理を高能率化したオーディオ信号復号化装置に関する。
【0002】
【従来の技術】
オーディオ信号の符号化は、近年のISDNおよびVLSI技術の発展によって急速に注目を集めている。特に、ディジタルオーデイオ、ディジタル衛星放送(DSB)、オーディオ信号の蓄積、遠隔会議、マルチメディア応用等でその重要性が増加している。
【0003】
MPEG(Moving Picture Expert Group)において、ビデオ信号とともにオーディオ信号を圧縮する世界標準符号化方式が検討され、オーディオ信号の符号化技術については、MPEG/オーディオ(国際規格ISO/IEC 11172−3)に代表される符号化アルゴリズムが決定され、公開されている。MPEGオーディオ符号化技術については、社団法人 テレビジョン学会編、オーム社発行の「MPEG」に詳しく説明されている。また、IEEE マルチメディアジャーナル1995年夏号には、デイビス・パン著「MPEG/オーディオデータ圧縮チュートリアル」にMPEGオーディオ圧縮理論が解説されている。
【0004】
MPEG/オーディオのアルゴリズムはレイヤ1,レイヤ2,レイヤ3の3種類のアルゴリズムから構成され、レイヤ1からレイヤ3の順で複雑になるが、アルゴリズムが32帯域のサブバンド符号化に基づいており、チャンネル数が2、サンプリング周波数が32,44.1,48kHzのいずれかである点で共通している(以下、MPEG/オーディオ・レイヤ3のアルゴリズムを特にMP3と呼ぶ)。ここで、サブバンド符号化とは、聴覚特性を利用して信号を複数のサブバンドに分割して、それぞれのバンドを異なる量子化特性で量子化する符号化方式である。
【0005】図10に、サブバンド符号化方式に基づいたMPEG/オーディオアルゴリズムの基本ブロック図を示す。入力されたオーディオ信号は、入力を複数のサブバンドに分けるフィルタバンク11を通る。同時に、入力されたオーディオ信号は、各サブバンドのマスキング閾値に対する信号エネルギーの比率を決定する心理聴覚モデル12を通る。心理聴覚モデル12に基づいたビット割当てに従って量子化・符号化手段13により量子化および符号化した後、必要に応じ図示しないアンシラリデータ(利用者が任意に定義できるデータ)を合わせて、フォーマット手段14によりビットストリーム中にフォーマットする。このように符号化されたビットストリームは、CD−ROM等の蓄積媒体に格納されたり、通信回線等の伝送路で伝送される。復号は、フレーム分解手段21においてまず付加されたアンシラリデータを分離してビットストリームを分解する。次いで、サイド情報として送られたビット割当てに基づいて復号・逆量子化手段22により復号、逆量子化を行いサブバンド値を復元する。最後に、サブバンド合成フィルタバンク23によりサブバンド値を合成しオーディオ信号を再現する。
【0006】
ところで、復号化におけるサブバンド合成フィルタバンクは、周波数成分に分割された信号をもとの時系列オーディオ信号にもどす機能を有しており、この機能を実現するために、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)といった三角関数で記述される変換処理を行っている。
【0007】
【発明が解決しようとする課題】
しかしながら、MP3の規格書に規定された変換処理をそのまま実行すると、角度の計算に要する加算・乗算も考慮に入れた場合の演算処理量は、64個の出力を得るために6144回の乗算と6080回の加算が必要であり、計算負荷が大きかった。このため、従来のMP3復号化による機器、例えばMP3プレーヤでは、低価格で実用的な性能を得ることが困難であった。
【0008】
そこで本発明の目的は、こうした従来技術の欠点を解決し、サブバンド合成フィルタバンクにおける演算量を大幅に削減でき、もって復号化処理をより高速化できるオーディオ信号の復号化装置を提供すること
にある。
【0009】
【課題を解決するための手段】
上記課題を解決するために、本発明は、符号化されたビットストリームを分解するフレーム分解手段と、ビット割当てに基づいて復号、逆量子化を行いn個のサブバンド値を復元する復号・逆量子化手段と、得られたサブバンド値を合成しオーディオ信号を再現するサブバンド合成フィルタバンクとからなり、サブバンド合成フィルタバンクは、n/4個のサブバンド入力を離散コサイン変換(DCT)し出力する第1及び第2のフィルタバンクと、n/4個のサブバンド入力を離散サイン変換(DST)し出力する第3及び第4のフィルタバンクを備え、n個のサブバンド値を4分割して第1のフィルタバンク、第2のフィルタバンク、第3のフィルタバンクおよび第4のフィルタバンクへそれぞれ入力し、第1のフィルタバンクの出力Q(n/4,k)(k=0,1,2,...,n/2−1。以下同じ)と第2のフィルタバンクの出力Q(n/4,k)との差P(k)を求める第1の処理と、第3のフィルタバンクの出力Q(n/4,k)と第4のフィルタバンクの出力Q(n/4,k)との和をとり所定の係数を乗じP(k)を求める第2の処理と、P(k)及びP(k)に基づきn×2個の合成フィルタ出力X(n,p)(p=0,1, ... ,63)を求める第3の処理とを行うことを特徴とするオーディオ信号復号化装置を提供する。
【0010】
この場合において、前記復号・逆量子化手段がn=32個のサブバンド値を復元するものであり、第1の処理が、
【0011】
【数4】

Figure 0003597077
【0012】
であり、第2の処理が、
【0013】
【数5】
Figure 0003597077
【0014】
であり、第3の処理が、次のフィルタ出力X(32,p)(p=0,1, ... ,63)
【0015】
【数6】
Figure 0003597077
【0016】
を求めるものであることが好ましい。
【0017】
【発明の実施の形態】
本発明に係るオーディオ信号復号化装置について実施の形態の全体構成を説明する前に、まずその主要部をなすサブバンド合成フィルタバンクにおけるアルゴリズムを詳細に説明する。
【0018】
今、MPEG/オーディオのレイヤ3(MP3)におけるサブバンド合成フィルタバンクを高速化することを例にとり、そのための高速DCTアルゴリズムの適用を検討する。
【0019】
[サブバンド合成フィルタバンクを4つの項で記述する]
MP3のサブバンド合成フィルタバンクでは入力の個数が32で出力の個数が64である。入力の個数をn(=32)と表記したときの変換式は次式で表される。
【0020】
【数7】
Figure 0003597077
【0021】
ここで、次の記号を定義する。
【0022】
【数8】
Figure 0003597077
【0023】
式(2)を式(1)に適用すると、次式の様に表すことができる。
【0024】
【数9】
Figure 0003597077
【0025】
式(3)はサイズ32のいわゆるタイプIIのDCTに類似しているので、高速DCTのアルゴリズムを用いることで、サイズ2まで縮小して演算を高速化することが可能と推定される。
【0026】
そこで、式(1)を偶数項と奇数項に分割する。
【0027】
【数10】
Figure 0003597077
【0028】
式(4)は、式(2)の定義及び三角関数の公式に従い、かつ、x=0およびx−1=0の関係より、次式のように変形できる。
【0029】
【数11】
Figure 0003597077
【0030】
式(5)に着目し、(−1)を削除するために、mが偶数の項と奇数の項に分割して表すと次の通りである。
【0031】
【数12】
Figure 0003597077
【0032】
次に、式(6)における最後の2項に着目すると、三角関数の公式に従い、かつ、x−2=0およびx−1=0より、次式の様に変形できる。
【0033】
【数13】
Figure 0003597077
【0034】
ここで、次のように定義を行う。
【0035】
【数14】
Figure 0003597077
【0036】
【数15】
Figure 0003597077
【0037】
【数16】
Figure 0003597077
【0038】
【数17】
Figure 0003597077
【0039】
式(8)から式(11)を用いると、式(6)のMP3の合成フィルタバンクは次のように表せる。
【0040】
【数18】
Figure 0003597077
【0041】
式(12)の4つの項は、それぞれ、サイズ8のDCTまたはDSTである。以下、4項それぞれについて、本発明に従い計算負荷がどのように削減されるかを説明する。
【0042】
[タイプIのDCT]
タイプIのDCTは次の通り定義される。
【0043】
【数19】
Figure 0003597077
【0044】
ここで、式(13)の2つの項を次のように定義する。
【0045】
【数20】
Figure 0003597077
【0046】
【数21】
Figure 0003597077
【0047】
そうすると、式(13)は次のように表すことができる。
【0048】
【数22】
Figure 0003597077
【0049】
式(16)をk=0,1,...,2n−1に対して計算するときには、三角関数の周期性を利用して式(15),(16)をk=0,1,...,n/2について計算した結果を用いることで計算負荷を削減することができる。
【0050】
すなわち、(16)は、次のように表すことができる。
【0051】
【数23】
Figure 0003597077
【0052】
式(14),(15)はサイズn/2のタイプIのDCTであるので、再帰的に繰り返してサイズ2のDCTまで縮約することができる。また、式(17)を用いて、サイズ8のDCTをk=0,1,...,16まで計算することができる。
【0053】
式(8)にもどって、式(8)のQ(n/4,k)は、サイズ8のDCTである。k=0,1,...16に対するQ(n/4,k)を用いてQ(n/4,0)からQ(n/4,63)までを計算する方法を以下説明する。
【0054】
ここでは、n=32となるが、式(17)によってk=0,1,...,16までが計算済みである。式(12)の4つの項すべてに掛けられる係数とQ(n/4,k)について、三角関数の周期性を利用すると、次のように表すことができる。
【0055】
【数24】
Figure 0003597077
【0056】
すなわち、Q(n/4,k)に関しては、k=0,1,...,16に対する値を計算すればk=0,1,...,63に対応する値が得られるので計算負荷が4分の1で済むことを示している。しかも、これらの値はk=0,1,...,8に対するG(8、k)とH(8、k)によって求めることができ、最終的にはこれらはk=0,1に対するG(2、k)とH(2、k)によって求めることができるので、相当量の計算負荷を削減できることを示している。
【0057】
[タイプIIのDCT]
タイプIIのDCTは次の通り定義される。
【0058】
【数25】
Figure 0003597077
【0059】
ここで、式(19)の2つの項を次のように定義する。
【0060】
【数26】
Figure 0003597077
【0061】
【数27】
Figure 0003597077
【0062】
そうすると、式(19)は次のように表すことができる。
【0063】
【数28】
Figure 0003597077
【0064】
式(22)をk=0,1,...,2n−1に対して計算するときには、三角関数の周期性を利用して式(20),(21)をk=0,1,...,n/2について計算した結果を用いることで計算負荷を削減することができる。すなわち、式(22)は、次のように表すことができる。
【0065】
【数29】
Figure 0003597077
【0066】
式(20),(21)はそれぞれサイズn/2のタイプIとタイプIIのDCTであるので、再帰的に繰り返してサイズ2のDCTまで縮約することができる。また、式(23)を用いて、サイズ8のDCTをk=0,1,...,16まで計算することができる。
【0067】
式(9)にもどって、式(9)のQ(n/4,k)は、サイズ8のタイプIIのDCTである。k=0,1,...16に対するQ(n/4,k)を用いてQ(n/4,0)からQ(n/4,63)までを計算する方法を以下説明する。
【0068】
ここでは、n=32となるが、式(17)によってk=0,1,...,16までが計算済みであり、式(12)の4つの項すべてに掛けられる係数についても計算済みである。Q(n/4,k)について、三角関数の周期性を利用すると、次のように表すことができる。
【0069】
【数30】
Figure 0003597077
【0070】
すなわち、Q(n/4,k)に関しても、最終的にはこれらはk=0,1に対するG(2、k)とH(2、k)によって求めることができるので、相当量の計算負荷を削減できることを示している。
【0071】
[タイプIのDST]
タイプIのDSTは次の通り定義される。
【0072】
【数31】
Figure 0003597077
【0073】
ここで、式(25)の2つの項を次のように定義する。
【0074】
【数32】
Figure 0003597077
【0075】
【数33】
Figure 0003597077
【0076】
そうすると、式(25)は次のように表すことができる。
【0077】
【数34】
Figure 0003597077
【0078】
式(28)をk=0,1,...,2n−1に対して計算するときには、三角関数の周期性を利用して式(26),(27)をk=0,1,...,n/2について計算した結果を用いることで計算負荷を削減することができる。すなわち、式(28)は、次のように表すことができる。
【0079】
【数35】
Figure 0003597077
【0080】
式(26),(27)はサイズn/2のタイプIのDSTであるので、再帰的に繰り返してサイズ2のDSTまで縮約することができる。また、式(29)を用いて、サイズ8のDSTをk=0,1,...,16まで計算することができる。
【0081】
式(10)にもどって、式(10)のQ(n/4,k)は、サイズ8のDSTである。k=0,1,...16に対するQ(n/4,k)を用いてQ(n/4,0)からQ(n/4,63)までを計算する方法を以下説明する。
【0082】
ここでは、n=32となるが、式(29)によってk=0,1,...,16までが計算済みであり、式(12)の4つの項すべてに掛けられる係数についても計算済みである。Q(n/4,k)について、三角関数の周期性を利用すると、次のように表すことができる。
【0083】
【数36】
Figure 0003597077
【0084】
すなわち、Q(n/4,k)に関しても、最終的にはこれらはk=0,1,2に対するG(2、k)とH3(2、k)によって求めることができるので、相当量の計算負荷を削減できることを示している。
【0085】
[タイプIIのDST]
タイプIIのDSTは次の通り定義される。
【0086】
【数37】
Figure 0003597077
【0087】
ここで、式(31)の2つの項を次のように定義する。
【0088】
【数38】
Figure 0003597077
【0089】
【数39】
Figure 0003597077
【0090】
そうすると、式(31)は次のように表すことができる。
【0091】
【数40】
Figure 0003597077
【0092】
式(34)をk=0,1,...,2n−1に対して計算するときには、三角関数の周期性を利用して式(32),(33)をk=0,1,...,n/2について計算した結果を用いることで計算負荷を削減することができる。すなわち、式(34)は、次のように表すことができる。
【0093】
【数41】
Figure 0003597077
【0094】
式(32),(33)はそれぞれサイズn/2のタイプIIとタイプIのDSTであるので、再帰的に繰り返してサイズ2のDSTまで縮約することができる。また、式(35)を用いて、サイズ8のDSTをk=0,1,...,16まで計算することができる。
【0095】
式(11)にもどって、式(11)のQ(n/4,k)は、サイズ8のタイプIIのDSTである。k=0,1,...16に対するQ(n/4,k)を用いてQ(n/4,0)からQ(n/4,63)までを計算する方法を以下説明する。
【0096】
ここでは、n=32となるが、式(35)によってk=0,1,...,16までが計算済みであり、式(12)の4つの項すべてに掛けられる係数についても計算済みである。Q(n/4,k)について、三角関数の周期性を利用すると、次のように表すことができる。
【0097】
【数42】
Figure 0003597077
【0098】
すなわち、Q(n/4,k)に関しても、最終的にはこれらはk=0,1に対するG(2、k)とH(2、k)によって求めることができるので、相当量の計算負荷を削減できることを示している。
【0099】
以上の演算処理をまとめると、MP3のサブバンド合成フィルタバンクの各出力を計算する方法は次のように簡略表記ができる。
【0100】
1.2つの式を定義する。
【0101】
【数43】
Figure 0003597077
【0102】
2.サブバンド合成フィルタバンクの出力X(32,k)は、次の通りである。
【0103】
【数44】
Figure 0003597077
【0104】
次に、本発明に係るオーディオ信号復号化装置について好ましい実施の形態を図面を参照しつつ説明する。
【0105】
本実施の形態の全体構成は、図10に示す従来の装置と同様であり、符号化されたビットストリームを分解するフレーム分解手段21と、ビット割当てに基づいて復号、逆量子化を行いn個のサブバンド値を復元する復号・逆量子化手段22と、得られたサブバンド値を合成しオーディオ信号を再現するサブバンド合成フィルタバンク23を有している。
【0106】
図1に本実施の形態における主要部であるサブバンド合成フィルタバンクのシグナルフロー図を示す。図1に示すようにサブバンド合成フィルタバンクは第1のフィルタバンクQ1、第2のフィルタバンクQ2、第3のフィルタバンクQ3及び第4のフィルタバンクQ4を備えている。第1のフィルタバンクQ1及び第2のフィルタバンクQ2は、n/4=8個(n=32)のサブバンド入力を離散コサイン変換(DCT)し16個の出力をする。また、第3のフィルタバンクQ3及び第4のフイルタバンクQ4は、n/4=8個のサブバンド入力を離散サイン変換(DST)し16個の出力をする。
【0107】
ここで、n=32個のサブバンド値を4分割して第1のフィルタバンクQ1、第2のフィルタバンクQ2、第3のフィルタバンクQ3および第4のフィルタバンクQ4へそれぞれ入力するデータは、次式に従い前処理を行ったものである。
【0108】
Figure 0003597077
【0109】
図2から図5は、フィルタバンクQ1からQ4までのシグナルフロー図である。
【0110】
ここで、図1から図5のシグナルフロー図の表記方法を補足する。
【0111】
まずデータの表示は、図6に示すように、数字と丸印と直線で表しており、数字はデータの番号を表し、処理の流れは左から右に進む。
【0112】
データの処理として、加算は図7のように示される。図7例では、データkはデータiとデータjを加算することを意味する。
【0113】
符号の付加は、図8に示すように2つのデータの丸印を接続する直線の下もしくは横に付された符号で表しており、図8の例ではj=−iとなる。
【0114】
乗算は、図9に示すように、2つのデータの丸印を接続する直線の下または上に付された数式(1/2,C64−2等)で表しており、左側の丸印のデータにその数式の値を掛ける。図9の例ではj=a*iとなる。
【0115】
最後に、C64−2,C4−1等で表した数式を一般的にCa−bと表記すると、
Ca−b=1/[2cos〔(b/a)*π)〕]
を意味している。
【0116】
図1から図5に示す本実施の形態のシグナルフローから明らかな通り、本実施の形態の処理によれば、79回の乗算と223回の加算により64個のMP3サブバンド合成フィルタバンクの出力を得ることができる。
【0117】
従来のサブバンド合成フィルタバンクの処理は、図11に示すように64個の処理R(k)(k=0,1,...63)により構成されており、64個の処理R(k)の入力データは共通であった。このときの処理R(k)のシグナルフローは、図12に示した通りであり、64個の出力を得るためには、6144回の乗算と6080回の加算が必要であった。
【0118】
これに対し、本実施の形態によれば、従来のR(k)に相当する処理を4個しか使用せず、必要とされる計算量も少ない。したがって、サブバンド合成フィルタバンクにおける計算負荷を大幅に軽減することができる。
【0119】
本発明は、上記した実施の形態に限定されるものではなく、特許請求の範囲に記載した技術的思想の範囲内において、種々の変更が可能なのはいうまでもない。
【0120】
【発明の効果】
以上説明したように、本発明によるオーディオ信号の復号化装置によれば、サブバンド合成フィルタバンクにおける演算量を大幅に削減でき、もって復号化処理をより高速化できるので、低価格で実用的な性能を有するMP3プレーヤ等の機器に利用できる工業的意義は極めて大である。
【図面の簡単な説明】
【図1】本発明の主要部であるサブバンド合成フィルタバンクのシグナルフロー図。
【図2】フィルタバンクQ1のシグナルフロー図。
【図3】フィルタバンクQ2のシグナルフロー図。
【図4】フィルタバンクQ3のシグナルフロー図。
【図5】フィルタバンクQ4のシグナルフロー図。
【図6】データの表示を表記するシグナルフローの説明図。
【図7】加算のデータの処理を表記するシグナルフローの説明図。
【図8】符号の付加の処理を表記するシグナルフローの説明図。
【図9】乗算の処理を表記するシグナルフローの説明図。
【図10】サブバンド符号化方式に基づいたMPEG/オーディオアルゴリズムの基本ブロック図。
【図11】従来のサブバンド合成フィルタバンクの処理を示す説明図。
【図12】従来のフィルタバンク処理R(k)のシグナルフロー図。
【符号の説明】
21 フレーム分解手段
22 復号・逆量子化手段
23 サブバンド合成フィルタバンク[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an audio signal decoding device, and more particularly to an audio signal decoding device in which arithmetic processing in a sub-band synthesis filter bank is highly efficient.
[0002]
[Prior art]
Coding of audio signals has been rapidly receiving attention due to the recent development of ISDN and VLSI technologies. In particular, its importance is increasing in digital audio, digital satellite broadcasting (DSB), storage of audio signals, teleconferencing, multimedia applications, and the like.
[0003]
In MPEG (Moving Picture Expert Group), a global standard encoding method for compressing an audio signal together with a video signal has been studied, and the encoding technique of an audio signal is represented by MPEG / audio (international standard ISO / IEC 11172-3). The coding algorithm used is determined and published. The MPEG audio encoding technology is described in detail in “MPEG” published by Ohmsha, edited by The Institute of Television Engineers of Japan. Also, the IEEE Multimedia Journal, Summer 1995, describes MPEG audio compression theory in the "MPEG / Audio Data Compression Tutorial" by Davis Pan.
[0004]
The MPEG / audio algorithm is composed of three types of algorithms, Layer 1, Layer 2 and Layer 3, and becomes complicated in the order of Layer 1 to Layer 3. However, the algorithm is based on subband coding of 32 bands, They are common in that the number of channels is 2, and the sampling frequency is any of 32, 44.1, and 48 kHz (hereinafter, the MPEG / audio layer 3 algorithm is particularly called MP3). Here, the sub-band coding is a coding scheme in which a signal is divided into a plurality of sub-bands using auditory characteristics, and each band is quantized with different quantization characteristics.
FIG. 10 shows a basic block diagram of an MPEG / audio algorithm based on a subband encoding method. The input audio signal passes through a filter bank 11 that divides the input into a plurality of subbands. At the same time, the input audio signal passes through a psychoacoustic model 12, which determines the ratio of signal energy to the masking threshold for each subband. After quantizing and encoding by the quantizing / encoding means 13 in accordance with the bit allocation based on the psychological auditory model 12, ancillary data (data that can be arbitrarily defined by the user) (not shown) is added as necessary to the formatting means. 14 to format into a bit stream. The bit stream encoded in this manner is stored in a storage medium such as a CD-ROM or transmitted through a transmission path such as a communication line. In decoding, first, the ancillary data added is separated by the frame decomposing means 21 to decompose the bit stream. Next, decoding and inverse quantization are performed by the decoding / inverse quantization means 22 based on the bit allocation transmitted as side information, and the subband value is restored. Finally, the sub-band synthesis filter bank 23 combines the sub-band values to reproduce the audio signal.
[0006]
Incidentally, the sub-band synthesis filter bank in decoding has a function of returning a signal divided into frequency components to an original time-series audio signal. In order to realize this function, a discrete cosine transform (DCT) is used. , A modified discrete cosine transform (MDCT).
[0007]
[Problems to be solved by the invention]
However, if the conversion processing specified in the MP3 standard is executed as it is, the amount of calculation processing in consideration of addition and multiplication required for the angle calculation is 6144 multiplications to obtain 64 outputs. 6080 additions were required, and the calculation load was heavy. For this reason, it has been difficult for a conventional device using MP3 decoding, for example, an MP3 player, to obtain practical performance at low cost.
[0008]
Accordingly, an object of the present invention is to provide an audio signal decoding device which can solve the above-mentioned drawbacks of the conventional technology, can greatly reduce the amount of calculation in the subband synthesis filter bank, and can thereby speed up the decoding process. is there.
[0009]
[Means for Solving the Problems]
In order to solve the above-mentioned problem, the present invention provides a frame decomposing unit that decomposes an encoded bit stream, and a decoding and inverse decoding unit that performs decoding and inverse quantization based on bit allocation to restore n subband values. It comprises a quantizing means and a sub-band synthesis filter bank for synthesizing the obtained sub-band values and reproducing an audio signal. The sub-band synthesis filter bank converts n / 4 sub-band inputs into discrete cosine transform (DCT). And first and second filter banks for performing output and n / 4 sub-band inputs, and third and fourth filter banks for performing discrete sine transform (DST) on and outputting n sub-band inputs. Divided and input to a first filter bank, a second filter bank, a third filter bank, and a fourth filter bank, respectively, and output Q of the first filter bank 1 (n / 4, k) (k = 0, 1, 2,..., N / 2−1; the same applies hereinafter) and the output Q 2 (n / 4, k) of the second filter bank The first processing for obtaining P 1 (k) and the sum of the output Q 3 (n / 4, k) of the third filter bank and the output Q 4 (n / 4, k) of the fourth filter bank are A second coefficient multiplication by a predetermined coefficient to obtain P 2 (k), and n × 2 synthesis filter outputs X (n, p) (p = 0) based on P 1 (k) and P 2 (k). , 1, ... , 63) .
[0010]
In this case, the decoding / inverse quantization means restores n = 32 subband values, and the first processing is as follows .
[0011]
(Equation 4)
Figure 0003597077
[0012]
And the second processing is
[0013]
(Equation 5)
Figure 0003597077
[0014]
And the third processing is the next filter output X (32, p) (p = 0, 1, ... , 63)
[0015]
(Equation 6)
Figure 0003597077
[0016]
Is preferably obtained.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
Before describing the overall configuration of the embodiment of the audio signal decoding apparatus according to the present invention, first, an algorithm in a subband synthesis filter bank which is a main part thereof will be described in detail.
[0018]
Now, taking an example of speeding up the subband synthesis filter bank in the layer 3 (MP3) of MPEG / audio, an application of a high-speed DCT algorithm for that purpose will be considered.
[0019]
[Describe subband synthesis filter bank in four terms]
In the MP3 subband synthesis filter bank, the number of inputs is 32 and the number of outputs is 64. The conversion equation when the number of inputs is represented by n (= 32) is represented by the following equation.
[0020]
(Equation 7)
Figure 0003597077
[0021]
Here, the following symbols are defined.
[0022]
(Equation 8)
Figure 0003597077
[0023]
When equation (2) is applied to equation (1), it can be expressed as the following equation.
[0024]
(Equation 9)
Figure 0003597077
[0025]
Since equation (3) is similar to a so-called type II DCT of size 32, it is presumed that by using an algorithm of high-speed DCT, it is possible to reduce the size to size 2 and speed up the operation.
[0026]
Therefore, equation (1) is divided into even and odd terms.
[0027]
(Equation 10)
Figure 0003597077
[0028]
Equation (4) can be transformed into the following equation according to the definition of equation (2) and the formula of trigonometric function, and from the relationship of x n = 0 and x −1 = 0.
[0029]
(Equation 11)
Figure 0003597077
[0030]
Focusing on equation (5), (-1) In order to eliminate m , m is divided into an even term and an odd term as follows.
[0031]
(Equation 12)
Figure 0003597077
[0032]
Next, paying attention to the last two terms in the equation (6), the following equation can be used according to the formula of the trigonometric function, and from x −2 = 0 and x −1 = 0.
[0033]
(Equation 13)
Figure 0003597077
[0034]
Here, the definition is made as follows.
[0035]
[Equation 14]
Figure 0003597077
[0036]
[Equation 15]
Figure 0003597077
[0037]
(Equation 16)
Figure 0003597077
[0038]
[Equation 17]
Figure 0003597077
[0039]
Using Expressions (8) to (11), the synthesis filter bank of MP3 in Expression (6) can be expressed as follows.
[0040]
(Equation 18)
Figure 0003597077
[0041]
Each of the four terms in equation (12) is a DCT or DST of size 8. The following describes how the computational load is reduced according to the present invention for each of the four terms.
[0042]
[Type I DCT]
Type I DCT is defined as follows.
[0043]
[Equation 19]
Figure 0003597077
[0044]
Here, two terms of the equation (13) are defined as follows.
[0045]
(Equation 20)
Figure 0003597077
[0046]
[Equation 21]
Figure 0003597077
[0047]
Then, equation (13) can be expressed as follows.
[0048]
(Equation 22)
Figure 0003597077
[0049]
Equation (16) is calculated using k = 0, 1,. . . , 2n−1, the equations (15) and (16) are calculated using k = 0, 1,. . . , N / 2, the calculation load can be reduced.
[0050]
That is, (16) can be expressed as follows.
[0051]
(Equation 23)
Figure 0003597077
[0052]
Equations (14) and (15) are Type I DCTs of size n / 2 and can be reduced recursively to size 2 DCTs. In addition, using the equation (17), the DCT of size 8 is defined as k = 0, 1,. . . , 16 can be calculated.
[0053]
Returning to equation (8), Q 1 (n / 4, k) in equation (8) is a size 8 DCT. k = 0, 1,. . . A method of calculating Q 1 (n / 4, 0) to Q 1 (n / 4, 63) using Q 1 (n / 4, k) for 16 will be described below.
[0054]
Here, n = 32. However, according to equation (17), k = 0, 1,. . . , 16 have already been calculated. Using the periodicity of the trigonometric function for the coefficient and Q 1 (n / 4, k) to be applied to all four terms of equation (12), it can be expressed as follows.
[0055]
(Equation 24)
Figure 0003597077
[0056]
That is, for Q 1 (n / 4, k), k = 0, 1,. . . , 16 yields k = 0, 1,. . . , 63, the calculation load can be reduced to one fourth. Moreover, these values are k = 0, 1,. . . , 8 by G 1 (8, k) and H 1 (8, k), which are ultimately determined by G 1 (2, k) and H 1 (2, k) for k = 0,1. ) Indicates that a considerable amount of calculation load can be reduced.
[0057]
[Type II DCT]
Type II DCT is defined as follows.
[0058]
(Equation 25)
Figure 0003597077
[0059]
Here, two terms of the equation (19) are defined as follows.
[0060]
(Equation 26)
Figure 0003597077
[0061]
[Equation 27]
Figure 0003597077
[0062]
Then, equation (19) can be expressed as follows.
[0063]
[Equation 28]
Figure 0003597077
[0064]
Equation (22) is calculated using k = 0, 1,. . . , 2n−1, the equations (20) and (21) are calculated using k = 0, 1,. . . , N / 2, the calculation load can be reduced. That is, equation (22) can be expressed as follows.
[0065]
(Equation 29)
Figure 0003597077
[0066]
Equations (20) and (21) are Type I and Type II DCTs of size n / 2, respectively, and can be recursively repeated to reduce to size 2 DCTs. Also, using the equation (23), the DCT of size 8 is defined as k = 0, 1,. . . , 16 can be calculated.
[0067]
Returning to equation (9), Q 2 (n / 4, k) in equation (9) is a size 8 type II DCT. k = 0, 1,. . . The method of calculating the Q 2 (n / 4,0) to Q 2 (n / 4,63) will be described below with reference to Q 2 (n / 4, k ) for 16.
[0068]
Here, n = 32. However, according to equation (17), k = 0, 1,. . . , 16 have already been calculated, and the coefficients multiplied by all four terms of equation (12) have also been calculated. Q 2 (n / 4, k) can be expressed as follows by using the periodicity of the trigonometric function.
[0069]
[Equation 30]
Figure 0003597077
[0070]
That is, Q 2 (n / 4, k) can be finally obtained by G 2 (2, k) and H 2 (2, k) for k = 0, 1, so that a considerable amount It can be shown that the calculation load of can be reduced.
[0071]
[Type I DST]
Type I DST is defined as follows.
[0072]
[Equation 31]
Figure 0003597077
[0073]
Here, two terms of the equation (25) are defined as follows.
[0074]
(Equation 32)
Figure 0003597077
[0075]
[Equation 33]
Figure 0003597077
[0076]
Then, equation (25) can be expressed as follows.
[0077]
(Equation 34)
Figure 0003597077
[0078]
Equation (28) is converted to k = 0, 1,. . . , 2n−1, the equations (26) and (27) are calculated using k = 0, 1,. . . , N / 2, the calculation load can be reduced. That is, equation (28) can be expressed as follows.
[0079]
(Equation 35)
Figure 0003597077
[0080]
Since equations (26) and (27) are type I DSTs of size n / 2, they can be reduced recursively to size 2 DSTs. Also, using the equation (29), the DST of size 8 is defined as k = 0, 1,. . . , 16 can be calculated.
[0081]
Returning to equation (10), Q 3 (n / 4, k) in equation (10) is a size 8 DST. k = 0, 1,. . . The method of calculating the Q 3 (n / 4,0) to Q 3 (n / 4,63) will be described below with reference to Q 3 (n / 4, k ) for 16.
[0082]
Here, n = 32. However, according to equation (29), k = 0, 1,. . . , 16 have already been calculated, and the coefficients multiplied by all four terms of equation (12) have also been calculated. Q 3 (n / 4, k) can be expressed as follows by using the periodicity of the trigonometric function.
[0083]
[Equation 36]
Figure 0003597077
[0084]
That is, Q 3 (n / 4, k) can be finally obtained by G 3 (2, k) and H3 (2, k) for k = 0, 1, 2, so that This shows that the amount of computational load can be reduced.
[0085]
[Type II DST]
Type II DST is defined as follows.
[0086]
(37)
Figure 0003597077
[0087]
Here, two terms of the equation (31) are defined as follows.
[0088]
[Equation 38]
Figure 0003597077
[0089]
[Equation 39]
Figure 0003597077
[0090]
Then, equation (31) can be expressed as follows.
[0091]
(Equation 40)
Figure 0003597077
[0092]
Equation (34) is calculated using k = 0, 1,. . . , 2n−1, the equations (32) and (33) are calculated using k = 0, 1,. . . , N / 2, the calculation load can be reduced. That is, equation (34) can be expressed as follows.
[0093]
(Equation 41)
Figure 0003597077
[0094]
Equations (32) and (33) are type II and type I DSTs of size n / 2, respectively, and can be reduced recursively to size 2 DSTs. Further, using the equation (35), the DST of size 8 is defined as k = 0, 1,. . . , 16 can be calculated.
[0095]
Returning to equation (11), Q 4 (n / 4, k) in equation (11) is a size 8 type II DST. k = 0, 1,. . . The method of calculating the Q 4 (n / 4,0) to Q 4 (n / 4,63) will be described below with reference to Q 4 (n / 4, k ) for 16.
[0096]
Here, n = 32. However, according to equation (35), k = 0, 1,. . . , 16 have already been calculated, and the coefficients multiplied by all four terms of equation (12) have also been calculated. Q 4 (n / 4, k) can be expressed as follows by using the periodicity of the trigonometric function.
[0097]
(Equation 42)
Figure 0003597077
[0098]
That is, Q 4 (n / 4, k) can be finally obtained by G 4 (2, k) and H 4 (2, k) for k = 0,1. It can be shown that the calculation load of can be reduced.
[0099]
To summarize the above arithmetic processing, the method of calculating each output of the subband synthesis filter bank of MP3 can be simply described as follows.
[0100]
1. Define two expressions.
[0101]
[Equation 43]
Figure 0003597077
[0102]
2. The output X (32, k) of the sub-band synthesis filter bank is as follows.
[0103]
[Equation 44]
Figure 0003597077
[0104]
Next, a preferred embodiment of an audio signal decoding device according to the present invention will be described with reference to the drawings.
[0105]
The overall configuration of the present embodiment is the same as that of the conventional apparatus shown in FIG. 10, and includes a frame decomposing unit 21 for decomposing an encoded bit stream, and decoding and dequantization based on bit allocation to perform n decoding. And a sub-band synthesis filter bank 23 that synthesizes the obtained sub-band values and reproduces the audio signal.
[0106]
FIG. 1 shows a signal flow diagram of a subband synthesis filter bank which is a main part in the present embodiment. As shown in FIG. 1, the sub-band synthesis filter bank includes a first filter bank Q1, a second filter bank Q2, a third filter bank Q3, and a fourth filter bank Q4. The first filter bank Q1 and the second filter bank Q2 perform discrete cosine transform (DCT) on n / 4 = 8 (n = 32) subband inputs and output 16 outputs. Further, the third filter bank Q3 and the fourth filter bank Q4 perform discrete sine transform (DST) on n / 4 = 8 subband inputs and output 16 outputs.
[0107]
Here, data which is obtained by dividing n = 32 subband values into four and inputting them to the first filter bank Q1, the second filter bank Q2, the third filter bank Q3, and the fourth filter bank Q4 are as follows: The pre-processing is performed according to the following equation.
[0108]
Figure 0003597077
[0109]
2 to 5 are signal flow diagrams of the filter banks Q1 to Q4.
[0110]
Here, the notation method of the signal flow diagrams of FIGS. 1 to 5 will be supplemented.
[0111]
First, as shown in FIG. 6, the display of data is represented by a number, a circle, and a straight line, the number represents a data number, and the flow of processing proceeds from left to right.
[0112]
As a processing of data, the addition is shown as in FIG. In the example of FIG. 7, data k means that data i and data j are added.
[0113]
The addition of the code is represented by a code attached below or beside the straight line connecting the circles of the two data as shown in FIG. 8, and j = −i in the example of FIG.
[0114]
The multiplication is represented by an equation (1/2, C64-2, etc.) below or above a straight line connecting two data circles, as shown in FIG. Times the value of that formula. In the example of FIG. 9, j = a * i.
[0115]
Finally, when the mathematical expressions represented by C64-2, C4-1, etc. are generally expressed as Ca-b,
Ca-b = 1 / [2 cos [(b / a) * π)]]
Means
[0116]
As is clear from the signal flow of the present embodiment shown in FIGS. 1 to 5, according to the processing of the present embodiment, the outputs of 64 MP3 subband synthesis filter banks are obtained by 79 multiplications and 223 additions. Can be obtained.
[0117]
The processing of the conventional subband synthesis filter bank is composed of 64 processes R (k) (k = 0, 1,... 63) as shown in FIG. ) Were common. The signal flow of the processing R (k) at this time is as shown in FIG. 12, and in order to obtain 64 outputs, 6144 multiplications and 6080 additions were required.
[0118]
On the other hand, according to the present embodiment, only four processes corresponding to the conventional R (k) are used, and the required amount of calculation is small. Therefore, the calculation load on the subband synthesis filter bank can be significantly reduced.
[0119]
The present invention is not limited to the above-described embodiment, and it goes without saying that various changes can be made within the scope of the technical idea described in the claims.
[0120]
【The invention's effect】
As described above, according to the audio signal decoding apparatus of the present invention, the amount of calculation in the subband synthesis filter bank can be significantly reduced, and the decoding process can be further speeded up. The industrial significance that can be used for high-performance devices such as MP3 players is extremely large.
[Brief description of the drawings]
FIG. 1 is a signal flow diagram of a subband synthesis filter bank which is a main part of the present invention.
FIG. 2 is a signal flow diagram of a filter bank Q1.
FIG. 3 is a signal flow diagram of a filter bank Q2.
FIG. 4 is a signal flow diagram of a filter bank Q3.
FIG. 5 is a signal flow diagram of a filter bank Q4.
FIG. 6 is an explanatory diagram of a signal flow for displaying data.
FIG. 7 is an explanatory diagram of a signal flow showing processing of addition data.
FIG. 8 is an explanatory diagram of a signal flow showing a process of adding a code.
FIG. 9 is an explanatory diagram of a signal flow representing multiplication processing.
FIG. 10 is a basic block diagram of an MPEG / audio algorithm based on a subband encoding scheme.
FIG. 11 is an explanatory diagram showing processing of a conventional subband synthesis filter bank.
FIG. 12 is a signal flow diagram of conventional filter bank processing R (k).
[Explanation of symbols]
21 frame decomposition means 22 decoding / dequantization means 23 subband synthesis filter bank

Claims (2)

符号化されたビットストリームを分解するフレーム分解手段と、ビット割当てに基づいて復号、逆量子化を行いn個のサブバンド値を復元する復号・逆量子化手段と、得られたサブバンド値を合成しオーディオ信号を再現するサブバンド合成フィルタバンクとからなり、前記サブバンド合成フィルタバンクは、n/4個のサブバンド入力を離散コサイン変換(DCT)し出力する第1及び第2のフィルタバンクと、n/4個のサブバンド入力を離散サイン変換(DST)し出力する第3及び第4のフィルタバンクを備え、n個のサブバンド値を4分割して前記第1のフィルタバンク、第2のフィルタバンク、第3のフィルタバンクおよび第4のフィルタバンクへそれぞれ入力し、前記第1のフィルタバンクの出力Q(n/4,k)(k=0,1,2,...,n/2−1。以下同じ)と前記第2のフィルタバンクの出力Q(n/4,k)との差P(k)を求める第1の処理と、前記第3のフィルタバンクの出力Q(n/4,k)と前記第4のフィルタバンクの出力Q(n/4,k)との和をとり所定の係数を乗じP(k)を求める第2の処理と、前記P(k)及び前記P(k)に基づきn×2個の合成フィルタ出力X(n,p)(p=0,1, ... ,63)を求める第3の処理とを行うことを特徴とするオーディオ信号復号化装置。Frame decomposing means for decomposing an encoded bit stream; decoding / dequantization means for decoding and dequantizing based on bit allocation to restore n subband values; A sub-band synthesis filter bank for synthesizing and reproducing an audio signal, wherein the sub-band synthesis filter bank performs a discrete cosine transform (DCT) on n / 4 sub-band inputs and outputs the first and second filter banks And a third and a fourth filter bank for performing discrete sine transform (DST) of n / 4 subband inputs and outputting the same, and dividing the n subband values into four to divide the n subband values into four. second filter bank, the third filter bank and a fourth filter bank respectively input, output to Q 1 the first filter bank (n / 4, k) ( k = , 1,2, ..., n / 2-1 . Hereinafter the same) and the first process for obtaining the difference P 1 (k) and the output Q 2 of the second filter bank (n / 4, k) When the output Q 3 of the third filter bank (n / 4, k) and multiplied by a predetermined coefficient taking the sum of the output Q 4 (n / 4, k ) of the fourth filter bank P 2 ( k) and n × 2 synthesis filter outputs X (n, p) (p = 0,1, ... , based on the P 1 (k) and the P 2 (k) . 63) performing a third process for obtaining the audio signal. 前記復号・逆量子化手段がn=32個のサブバンド値を復元するものであり、前記第1の処理が、
Figure 0003597077
であり、前記第2の処理が、
Figure 0003597077
であり、前記第3の処理が、次のフィルタ出力X(32,p)(p=0,1, ... ,63)
Figure 0003597077
を求めるものであることを特徴とする請求項1に記載のオーディオ信号復号化装置。
The decoding / inverse quantization means restores n = 32 subband values, and the first processing includes:
Figure 0003597077
And the second processing is:
Figure 0003597077
, And the third processing is the next filter output X (32, p) (p = 0, 1, ... , 63)
Figure 0003597077
2. The audio signal decoding apparatus according to claim 1, wherein
JP12749899A 1999-03-31 1999-03-31 Audio signal decoding device Expired - Fee Related JP3597077B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12749899A JP3597077B2 (en) 1999-03-31 1999-03-31 Audio signal decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12749899A JP3597077B2 (en) 1999-03-31 1999-03-31 Audio signal decoding device

Publications (2)

Publication Number Publication Date
JP2000286713A JP2000286713A (en) 2000-10-13
JP3597077B2 true JP3597077B2 (en) 2004-12-02

Family

ID=14961464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12749899A Expired - Fee Related JP3597077B2 (en) 1999-03-31 1999-03-31 Audio signal decoding device

Country Status (1)

Country Link
JP (1) JP3597077B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002245027A (en) 2001-02-15 2002-08-30 Seiko Epson Corp Filtering processing method and filtering processor

Also Published As

Publication number Publication date
JP2000286713A (en) 2000-10-13

Similar Documents

Publication Publication Date Title
CN102150207B (en) Compression of audio scale-factors by two-dimensional transformation
CN101223821B (en) audio decoder
US5508949A (en) Fast subband filtering in digital signal coding
JP4850837B2 (en) Data processing method by passing between different subband regions
JP4439522B2 (en) Apparatus and method for processing a signal having a sequence of discrete values
JP3814611B2 (en) Method and apparatus for processing time discrete audio sample values
KR100804053B1 (en) Device and method for processing at least two input values
TW200529548A (en) Adaptive hybrid transform for signal analysis and synthesis
US7636660B2 (en) Subband synthesis filtering process and apparatus
JP2005530206A (en) Audio coding system that uses the characteristics of the decoded signal to fit the synthesized spectral components
EP0590790A2 (en) Modified DCT signal transforming system
KR100346734B1 (en) Audio coder and decoder having high speed analyzing filter and composite filter
JP3597077B2 (en) Audio signal decoding device
US20100082717A1 (en) Computation apparatus and method, quantization apparatus and method, and program
US7512536B2 (en) Efficient filter bank computation for audio coding
US8301282B2 (en) Fast synthesis sub-band filtering method for digital signal decoding
Hans Optimization of digital audio for internet transmission
JP3593201B2 (en) Audio decoding equipment
Touimi et al. Efficient method for multiple compressed audio streams spatialization
JP4033906B2 (en) Analytical / synthetic filtering system with efficient odd stacked single sideband filter banks using time domain aliasing cancellation
CN100486332C (en) Synthon frequency band filtering method and apparatus
Mazzola et al. Finite Fourier
KR100322703B1 (en) Audio encoder/decoder
JP3292228B2 (en) Signal encoding device and signal decoding device
Ashida et al. Audio signal compression via sampled-data control theory

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040521

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040521

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20040708

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040907

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees