JP3927627B2 - ディジタル・オーディオ符号化方法 - Google Patents
ディジタル・オーディオ符号化方法 Download PDFInfo
- Publication number
- JP3927627B2 JP3927627B2 JP25188196A JP25188196A JP3927627B2 JP 3927627 B2 JP3927627 B2 JP 3927627B2 JP 25188196 A JP25188196 A JP 25188196A JP 25188196 A JP25188196 A JP 25188196A JP 3927627 B2 JP3927627 B2 JP 3927627B2
- Authority
- JP
- Japan
- Prior art keywords
- bits
- bit
- band
- address
- assigned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Description
【発明の属する技術分野】
本発明はディジタル・オーディオ符号化方法及びその装置に係り、特にルックアップ・テーブル(Look-Up Table; 以下、LUTという)を用いたディジタル・オーディオ符号化方法及びその装置に関する。
【0002】
【従来の技術】
現在の通信技術においては、アナログ・データをディジタル・データに変換することが多い。この傾向に伴い、全てのオーディオ機器またはオーディオ・データ伝送システムにおいて、ディジタル伝送は不可欠になった。このディジタル・オーディオ・データの伝送は、既存のアナログ伝送方式より周囲の雑音に強く、かつ、音質もコンパクト・ディスクのように極めて良好に再生することができる。しかしながら、伝送するデータの量が増えるにつれて、メモリ容量または伝送線路容量などについて各種の問題が生じる。
【0003】
この問題を解決するため、圧縮技術が求められている。オーディオ圧縮技術の目標は、原音を圧縮して伝送した後、その伝送されたデータを伸長して聞くとき、原音と殆ど一致するように再生することである。
【0004】
現在、このような技術は世界的に使用されているが、その出発点は、1992年の日本のSONY社によるミニディスク(MD)及びPhilps社によるディジタル・コンパクト・カセット(DCC)である。MDの場合は、CD水準の音質で再生でき、既存のCDより大きさが小さいが、圧縮率を約5:1としてCDより多量のデータを貯蔵することができ、外部の衝撃にも強いという特性を有している。
【0005】
一方、ディジタル圧縮符号化技術に対する国際標準化機構、すなわち、MPEG(Moving Picture Experts Group) が設立された。MPEGは、システム、ビデオ、オーディオの三つに大別される。そのうち、オーディオ部分は、更に三つのレイヤに分けられる。
【0006】
MPEGは、動画像とこれに係るオーディオ信号の符号化されたビット・ストリームに対する国際標準案を作成するため、提案された多数の低伝送率の符号化技術を比較、分析及びテストを行う。このような国際標準案が作成されると、今後の全てのディジタル貯蔵媒体ではこの規格を満たすようにデータを符号化して貯蔵するようになる。ディジタル貯蔵媒体には、CD−ROM、ディジタル・オーディオ・テープ(DAT)、光磁気ディスク(MOD)及びコンピュータ・ディスク(例えば、HDD)が含まれる。
【0007】
オーディオ信号の圧縮符号化においては、人の聴覚心理モデルが広く用いられる。この場合、聴覚特性のうちマスキング現象と臨界帯域とを利用して聞き取れない信号は取り除き、必須の信号のみを符号化してビットを割当てることにより、元の信号より少量のビットで符号化しても、原音と殆ど同じ水準の音質を得ることができる。
【0008】
ここで、マスキング現象とは、オーディオ信号間の干渉により、一つの信号が他の信号によりマスキングされて、全く聞き取れない現象である。また、臨界帯域とは、人が音の周波数を区分する一種の単位であって、一般に24個の帯域に分けられる。高周波数であるほど、この帯域の幅はログ・スケールに大きくなる。したがって、低周波数信号よりは高周波数信号を区分しにくい。
【0009】
この聴覚特性を用いてビットを割当てるため、信号対雑音比(SNR)と信号対マスク・レベル比(SMR)を求め、この値から更にマスク・レベル対雑音比(MNR)を計算する。ここで、マスク・レベルとは、聞き取れない最小の信号レベルである。したがって、このマスク・レベル以下の信号にはビットを割当てなくてもよい。
【0010】
上述した過程から最終のMNRを求めた後、この値に基づいてビットを繰り返し割当てる。しかしながら、かかる一連の過程には長時間の演算を必要とし、符号化器における実時間の遅延を増加させる。従って、演算の複雑度を解決する必要があった。
【0011】
次に、一般のMPEGオーディオ符号化器について図14を参照して簡単に説明する。図14に示すように、一般のMPEGオーディオ符号化器は、周波数マッピング部11、聴覚心理モデル13、ビット割当て/量子化部15、及びフレーム・パッキング部17とから構成される。
【0012】
周波数マッピング部11は、帯域分解フィルタを用いて時間領域のオーディオ・データを32個の均等な帯域の周波数領域に変換する。この際、各帯域は、12個(レイヤIの場合)、又は36個(レイヤIIの場合)のサンプルを含む。一方、スケール・ファクタの個数が全部で64個なので、この情報の符号化に必要なビット数は6ビットである。符号化方法は各レイヤによって異なり、レイヤIでは、各帯域に存在する12個のサンプルのうち最大値を求めて、この値と一致するか、やや大きい値を該当帯域のスケール・ファクタとする。一方、レイヤIIでは、各帯域に三つのスケール・ファクタが存在するため、各スケール・ファクタの類似性を検討して三つのスケール・ファクタのうち、何個を符号化するかを決める。すなわち、符号化するスケール・ファクタの数は隣接するスケール・ファクタとの差値の範囲に応じて異なる。したがって、レイヤIとは異なり、スケール・ファクタを選択する付加情報が求められるが、この場合、情報を2ビットで符号化する。
【0013】
聴覚心理モデル13は、符号化器で最大の演算複雑度を有する部分である。この聴覚心理モデル13の最終出力値はビット割当ての基準として各帯域のSMRである。SMR値は次のような一連の段階により計算される。第1段階では高速フーリエ変換(FFT)により時間領域のオーディオ信号を周波数領域に変換し、第2段階では各帯域の音圧レベルを計算する。第3段階では絶対マスキング・スレショルド値を計算し、第4段階ではオーディオ信号の有声音と無声音成分を決める。第5段階ではマスカー(masker) を決め、第6段階では各帯域のマスキング・スレショルド値を計算する。第7段階では全ての帯域のマスキング・スレショルド値を計算し、第8段階では各帯域の最小マスキング・スレショルド値を計算する。そして、第9段階では各帯域のSMR値を計算する。
【0014】
ビット割当て/量子化部15は、先ずビット割当て過程において、聴覚心理モデル13で得られたSMR値に基づいて次のような一連の段階を繰り返し行い、各帯域のビット割当て量を求める。第1段階では初期の割当てビットを0とし、第2段階では各帯域についてMNR値を求める。この際のMNR値はSNR値からSMR値を減算した値となる。第3段階では各帯域に求められたMNR値のうち最小のNMR値の帯域を探し出して割当てビット数を1ほど増やし、第4段階では求められるビット数を超えないときは、残り帯域について第2及び第3段階を繰り返し行う。
【0015】
また、量子化過程は次のような一連の段階により行われる。第1段階では、各帯域内のサンプルをスケール・ファクタで割ってXとする。第2段階では、A*X+B(ここで、A、Bは所定のテーブル値)を計算する。第3段階では、計算された値のうちビット割当て過程から得られた割当てビット数を得て、第4段階では、最上位ビット(MSB)を反転させる。
【0016】
上述したように、従来のディジタル・オーディオ符号化器は聴覚心理モデルを用いるので、SMR値を求めるために9段階の処理過程を必要とする。したがって、演算が複雑になり、全体実行時間にも大きな影響を及ぼす。また、得られたSMR値を用いてMNRを計算し、MNRに基づいて再びビット割当てループを繰り返し行うので、この過程でも時間の遅れが発生する。表1に示すように、実際のテストの結果では、全体符号化過程の実行時間のうち、聴覚心理モデル生成過程とビット割当て過程が約49.9%を占め、演算の複雑度が高いということが判る。
【0017】
【表1】
【0018】
【発明が解決しようとする課題】
したがって、本発明の目的は、オーディオ圧縮符号化時に必要とされる時間を短縮するため、既存のMPEGと交換可能であり、入力オーディオ信号の特性に応じるビット割当て量を予めルックアップ・テーブルを用いて作成した後、作成されたルックアップ・テーブルを用いてビットを割当てるディジタル・オーディオ符号化方法を提供することである。
【0019】
本発明の他の目的は、前記ディジタル・オーディオ符号化方法の実現に最適の装置を提供することである。
【0020】
【課題を解決するための手段】
本発明に係るディジタル・オーディオ符号化方法は、入力されるオーディオ信号の分散、平均自乗根及びスケール・ファクタの特性組合せに応じて各周波数帯域に対する割当てビットをルックアップ・テーブルを用いて作成する過程と、前記入力される時間領域のオーディオ信号を所定の数の均等な周波数帯域に分割する過程と、該分割された各周波数帯域に対して得られたオーディオ信号の特性の大きさの順位に応じて前記ルックアップ・テーブルのアドレスを決める過程と、該決められたアドレスに該当する割当てビットを前記各周波数帯域に対して割当てた後に量子化する過程と、該量子化されたオーディオ信号をビット・ストリームとして形成する過程とからなることを特徴とする。
【0021】
また、本発明に係るディジタル・オーディオ符号化装置は、入力されるオーディオ信号の特性に応じる各周波数帯域に対する割当てビットの関係を作成するルックアップ・テーブルと、前記入力される時間領域のオーディオ信号を所定の数の均等な周波数帯域に分割する周波数マッピング部と、該分割された各周波数帯域に対して得られたオーディオ信号の特性の大きさの順位に応じて前記ルックアップ・テーブルのアドレスを決める特性獲得部と、該決められたアドレスに該当する割当てビットを前記各周波数帯域に対して割当てた後に量子化するビット割当て/量子化部と、該量子化されたオーディオ・データをビット・ストリームとして形成するフレーム・パッキング部とを含むことを特徴とする。
【0022】
【発明の実施の形態】
以下、添付した図面に基づき本発明の実施の形態について詳しく説明する。
【0023】
本発明の核心となるLUTによるビット割当て方式では、図14の聴覚心理モデル部分13とビット割当て量子化部15の代わりに、予め求められたLUTを用いてビット割当てを行う。本発明によるディジタル・オーディオ符号化装置は、図1に示されているが、先ず、ビット割当てに必要なLUTの生成過程を説明する。
【0024】
LUTは、各帯域についてビット割当て量を決めるテーブルであって、ビット割当てに必要とされる時間を最小とするために用いられる。そのため、聴覚心理モデルに用いられるFFTまたは電力分布を求める過程等のような周波数領域で入力信号を分析する過程を取り除くことにより全体の実行時間を減らせるので、入力信号に対する時間領域の特性に鑑みる。言い換えれば、入力信号を周波数領域で解析することなく、時間領域でその特性を直接探して、その特性値をLUT作成の基にする。
【0025】
まず、本発明の第1実施形態では、この特性を分散、スケール・ファクタ及び平均自乗根として規定する。この特性は、図14に示された周波数マッピング部11の帯域分解フィルタにより求められて、LUTアドレスの決めに用いられる。先ず、この特性について簡単に説明し、次いで、この特性を符号化アルゴリズムに適用する方法を説明する。
【0026】
分散特性とは、入力信号の分布が平均にある程度近く分布されているかどうかを知らせる要素である。すなわち、図2(A)に示されるように、分散が大きいときは、入力信号に対する動的領域も大きくなるので、量子化雑音を減らすためにはビット割当て量を多くしなければならない。一方、図2(B)に示されるように、分散が小さいときは、ビット割当て量を小さくしてもよい。一般に32個の帯域のうち実際に多量のビットが割り当てられる帯域は低周波数領域(0〜7帯域)なので、分散度もこの帯域では大体に大きい値を有する。分散を求めるため、本発明では入力信号が帯域分解フィルタを通過すると、32個の各帯域ごとに12個のサンプルが存在する。先ず、この12個のサンプルに対する平均m(sb)と自乗平均ms(sb)を求めた後、次の式1により各帯域の分散v(sb)を求める。
【0027】
【数1】
v(sb)=ms(sb)−m(sb)2 ・・・(1)
次に、平均自乗根rms(sb)特性とは、平均と類似した概念である。一般に入力信号に対する平均を求めると、サイン、コサイン波の場合は0となるため、そのまま平均を求めても意味がない。それで、入力信号の自乗を求めて平均した後、再び自乗根を求める平均自乗根が一つの特性となる。すなわち、これは分散を求めるときに得られた自乗平均の自乗根と同様である。平均自乗根rms(sb)を数式で示すと、式2のようになる。
【0028】
【数2】
rms(sb)=√ms(sb) ・・・(2)
ここで、平均自乗根と分散との相関関係を類推する。一つの帯域の平均がほぼ0に近づく場合、前記式1により分散は自乗平均と同一になるため、二つの特性は一定の線形性を有する。また、一般に信号の平均が大きければ、平均自乗値および電力も大きいため、ビット割当て量との関連性も探すことができる。
【0029】
次に、スケール・ファクタの特性について説明する。スケール・ファクタは、聴覚心理モデルで各帯域の電力を求めて、その帯域のマスク・レベルを計算するのに用いられる。一般に入力信号の電力が大きければ、ビットを多く割当てる。これを時間領域から類推すると、周波数領域の電力は主として時間領域における入力信号値の大きさにより決められる。この特性に鑑みると、各帯域に最大のサンプル値をその帯域の電力とする。この際、サンプル値をスケール・ファクタという。任意の帯域のスケール・ファクタが大きければ、その帯域の電力が大きいと見なす。スケール・ファクタは、量子化過程において各帯域の値を正規化するのにも用いられる。
【0030】
このオーディオ信号の特性を用いたLUTの作成においては、LUTのアドレスを探し出す方法が重要である。すなわち、この特性に鑑みてLUTのアドレスを探し出して該当する帯域のビット割当て量を決めるべきである。そのため、本発明ではこの三つの特性より構成され得る全ての場合の数を同時に考慮した。この特性を各帯域の大きさの順位に整列し、その順位に応じてLUTを作成する方法を採用する。この場合には、一つの帯域について三つの特性の順位が0から31までの場合があるため、全部で32768(=323)種が存在する。これは各帯域に同じく適用されるべきなので、各帯域に32768の場合について考慮すべきである。
【0031】
そして、32768の場合に番号を与えてそれぞれの該当する場合についてビット割当て量を調べて、最大の頻度値を有する値をその帯域のビット割当て量として決める。この方式は、あるオーディオ・データについて、その最大、最小値の範囲を問わず、単に大きさの順位によるものなので信頼性が得られる。
【0032】
次に、前記方式によりLUTを作成する方法について説明する。
【0033】
図3は、LUTを作成するための方法を説明する図である。先ず、入力されたオーディオ・データを周波数マッピング部31内の帯域分解フィルタを通過させた後に各帯域の最大値を求めて、これを各帯域のスケール・ファクタsfとする。そして、式1及び式2により各帯域の分散及び平均自乗値を求めた後、この三つの特性を大きさの順位に整列させる。一方、入力オーディオ・データについて聴覚心理モデル33を適用してSMRを求めた後、これに基づいて各帯域のビット割当て量を求める。各帯域についてビット割当て量と三つの特性に対する順位を基にしてLUTを作成する。帯域0で聴覚心理モデルによるビット割当て量が4であり、この帯域の三つの特性の順位が2,3,1の場合、該当するアドレスの4ビット領域に頻度数1を増やせる。このような過程を本発明では12個のオーディオ・データについて繰り返し行い、最高頻度のビット量をその帯域のビット割当て量として指定する。統計に用いられるオーディオ・データの数を増やすほど、より精巧なLUTが作成される。
【0034】
また、各帯域について三つの特性の順位としてのアドレスaddrを求める方法は式3のとおりである。
【0035】
【数3】
addr=v×322+rms×321+sf×320 ・・・(3)
ここで、v、rms、sfは三つの特性、すなわち、分散、平均自乗根、スケール・ファクタの各順位である。次の表2は各帯域の三つの特性の順位とLUTのアドレスとの関係を示す。
【0036】
【表2】
また、次の表3はLUTの中間生成段階を示す。
【0037】
【表3】
表3の下線付き数字は頻度の高いことを示す。例えば、0帯域の場合には、分散、平均自乗根及びスケール・ファクタの順位が0であれば、4ビット割当てられた場合の頻度数が最も高い。この場合、4ビットがアドレス1と共にLUTに貯蔵される。アドレスをLUTに貯蔵するのは、LUTの最適化過程において0ビットの貯蔵されたアドレスは取り除かれるため、そのアドレス情報を必要とする。また、順位が、分散:3、平均自乗根:4、スケール・ファクタ:12の場合、ビットライン・プリチャージ回路で3ビットが最高の頻度を占める。この際、3ビットをアドレス3212と共にLUTに貯蔵する。最高の頻度数を有する帯域が二つ以上あるときは、高いビットの帯域を選択する。実験の結果、このように処理することが所望のビット量と実際に割当てられたビット量との差を減らせる。
【0038】
また、表3のように低い帯域では三つの特性が全体として低いアドレスに分布する。高い帯域に行くほど、高いアドレスにその分布が移ることが判る。すなわち、低周波数であるほど、この三つの特性の大きさは大体に大きくなる。したがって、この特性のみをオーディオの符号化に適用することができる。
【0039】
図4〜図10は、数個の帯域についてLUTのアドレスに対する割当てビットの分布の実験結果を示すものである。これは、MPEGレイヤIIの96kbit/sに対する統計分布の結果の例である。全ての帯域に対する統計分布でないが、著しい特徴として、レイヤIIでは帯域3,4,5部分に対するビット割当てが低いアドレスに対して大きくなることが判る。ここで、低いアドレスとは、三つの特性の大きさが全体として大きいものである。全ての帯域を調べると、この三つの特性の大きさが小さいほど、ビット割当ても小さくなる。特に帯域3,4,5ではこの現象が著しい。
【0040】
図11は、人間の聴覚心理モデルから得られた絶対スレショルド値と32個の帯域との関係を示すグラフである。最も敏感に聞き取れる領域、すなわち、絶対スレショルド値が最低の部分、2kHz〜4kHzに該当する帯域3,4,5に多量のビットを割当てることにより、良好な音質を提供することができる。
【0041】
更に、本発明では、このように求められたLUTの全体の大きさを減らして効率よくメモリを使用するため、LUTの最適化過程を加える。すなわち、LUTの入力として貯蔵されたビット割当て量が0であるアドレスはLUTから取り除くことにより、全体LUTの大きさを大幅に縮める。例えば、表3の帯域31の場合、アドレス0とアドレス32767には0ビット割当てが最高の頻度を占めるので、この帯域のテーブルにはアドレス0と32767は入力しない。このように最適化されたLUTを用いて符号化に適用する場合、前記三つの特性により決められるアドレスが、LUTに存在しないときは、その帯域に0ビットを割当てる。したがって、LUTはビット割当て量と共に三つの特性により得られるアドレスも貯蔵する。
【0042】
次に、作成されたLUTを用いたオーディオ符号化について説明する。
【0043】
図1は、本発明によるディジタル・オーディオ符号化装置を示すブロック図である。同図に示すように、本発明によるディジタル・オーディオ符号化装置は、周波数マッピング部121、特性獲得部123、LUT125、ビット割当て/量子化部127、フレーム・パッキング部129とから構成される。
【0044】
図1の構成の動作を説明すると、周波数マッピング部121では、先ずオーディオ・データを帯域分解フィルタを通過させて32個の周波数帯域に分ける。この際、レイヤIの場合は12個のサンプル、レイヤIIの場合は36個のサンプルが存在する。
【0045】
特性獲得部123は、LUT125のアドレスを求めるため、各帯域について上述した方法で入力信号に対する分散、平均自乗値、スケール・ファクタの三つの特性値を計算して大きさの順序に整列させた後、前記式3によりアドレスを求める。
【0046】
ビット割当て/量子化部127は、上述した方法により求めたLUT125を用いて各帯域にビットを割当てた後、割り当てられたビット数と求められるビット数を比べて、残るビットがあるかどうかを確かめる。もちろん、LUT125によりビットを割当てるとき、所望のビット数を満たすようにビットを割当てることが望ましい。これにより、付加的な調整作業が不要となり、処理速度を速くすることができる。
【0047】
先ず、LUT125によりビットを割当てる。その後、割当てられたビット数が求められるビット数を超えると、最多のビットが割当てられた帯域のビット数を1ビットほど減らし、再び求められるビット数と比べて、割当てられたビット数が求められるビット数を超えないまで繰り返して行う。
【0048】
次に、LUT125によりビットを割当てた後、割り当てられたビット数が求められるビット数より少なくて余りビットが割り当てられる場合について、一連の処理段階を説明する。ここで、増加帯域はビットを増やせる帯域であり、セットはこの増加帯域を別途に貯蔵する目録である。そして、このアルゴリズムはレイヤIを例えたものである。第1段階では、フラグの初期値を0とし、セットの内容を−1に初期化する。第2段階では、最大のスケール・ファクタを有する帯域を探し出す。この帯域がセットに含まれなければ、増加帯域として指定してフラグを1とする。第3段階では、フラグが1であれば、この増加帯域をセットに貯蔵する。また、前記フラグが0であれば、全ての帯域がセットに貯蔵されており、これは全ての帯域が一回ずつ増加帯域となることを意味する。この場合、セットに貯蔵されている順序に再び増加帯域を指定する。すなわち、スケール・ファクタの大きさの順位に再び増加帯域を指定して、求められるビット数を満たすまで繰り返す。第4段階では増加帯域のビット数を1ほど増やす。第5段階では、現在の増加帯域の割当てビット数が1の場合、再び求められるビット数と割当てられたビット数を比べて30を超えないと、増加帯域のビットを再び1ほど減らした後、第1段階に戻る。現在の増加帯域の割当てビット数が30を超えると、増加帯域の割当てビット数を再び1ほど増やしてビット使用量を計算した後、第1段階に戻る。現在の増加帯域の割当てビットが1でなければ、ビット使用量のみを計算した後、第1段階に戻る。ここで、30を基準とするのは、全部で30ビットを必要とするからである。すなわち、最初にビットが割当られる帯域に1ビットでなく2ビットを増やすべきなので、スケール・ファクタ情報6ビットと12サンプルに対するビット割当て量24ビットが加えられる。一方、第2段階で増やせる帯域の基準としてスケール・ファクタを用いる。しかしながら、他の特性、すなわち、分散または平均自乗値を用いることもできる。レイヤIIの場合は、各帯域に三つのスケール・ファクタが存在するため、最大のものを用いる。
【0049】
一方、このようにビット調整過程は、オーディオ符号化に要する全体実行時間の短縮に大きな影響を及ぼす。すなわち、LUT125によるビット割当て量が求められるビット量と正確に一致するかに応じて、ビット調整過程の繰り返し回数を減らすことができるため、正確でかつ信頼性のあるLUT125を作成する必要がある。
【0050】
実際に本発明の性能を試すため、12個のオーディオ・データを用いて全体実行時間を測定した。実験環境としてはUNIXシステムのSUN SPARC−10を用い、オーディオ・データはCDから得られたデータである。
【0051】
表4は符号化器における実行時間を示すものであり、本発明のLUTを用いた符号化方式と既存のMPEGアルゴリズムによる符号化方式とで、その性能を比べた実験結果を示している。
【0052】
【表4】
表4において、12個のオーディオ・データは任意の名称を与えたものであり、数字は実際の実行時間を示す。また、性能改善は、次の式4により求められたものである。
【0053】
【数4】
式4において、Eimpは性能改善、TMPEGはMPEGアルゴリズムによる実行時間、TLUTは本発明のアルゴリズムによる実行時間を示す。
【0054】
次に、本発明の第2実施形態について説明する。本発明の第2実施形態においては、聴覚心理モデルに基づく特性をスケール・ファクタ及び自乗平均として規定する。
【0055】
聴覚心理モデル33の最終出力値はSMRであって、各帯域の信号レベルとマスキング・レベルとの差を示す。この値を求めるため、先ず信号レベルを計算する。聴覚心理モデル33では、各帯域の電力とスケール・ファクタの電力スペクトルsfmaxのうち、大きい値をその帯域の信号レベルとする。これを数式で示すと、次の式5のとおりである。ここで、Lsb(n)は帯域nの音圧レベルであって、SMRのSレベルと同様である。
【0056】
【数5】
Lsb(n)=MAX〔power(n),20 log(sfmax(n)*32768)−10〕dB ・・・(5)
この式5において、各帯域の信号レベルを決める要素は各帯域のスケール・ファクタと電力値である。聴覚心理モデルではこの電力を周波数変換を通して求めたが、これを時間領域から類推すると、帯域分解フィルタを通過した後の各帯域のサンプル値の自乗平均として求めることができる。スケール・ファクタは、各帯域で最大のサンプル値なので、時間領域で直接求めることができる。
【0057】
一般にオーディオ信号の電力が大きければ、多量のビットを割当てなければならない。したがって、周波数領域における電力は時間領域におけるサンプル値の大きさにより決められると言える。これに鑑みると、各帯域で最大のスケール・ファクタは電力と関連性があり、ビット割当て量を決める。
【0058】
このようにオーディオ信号の特性によるLUTの作成において、最も重要な考慮事項は、この特性を用いてLUTのアドレスを探し出す方法である。次に、この二つの特性、すなわち、スケール・ファクタと自乗平均を用いてLUTを作成する方法を説明する。
【0059】
LUTには各帯域のアドレスとビット割当て量が貯蔵されており、ビット割当てにかかる時間を最小とするために用いられる。すなわち、前記二つのパラメータにより決められるアドレスをLUTから探し出して該当する帯域にビットを割当てる。MPEGのビット割当て方式によれば、聴覚心理モデルから求められた帯域に対する最大のSMR値を有する帯域から1ビットずつ増やせる。これは各帯域の相互連関性を考慮して1フレーム内で相対的なSMR値を処理する方式である。これにより、本発明においては、LUTのアドレスを求めるとき、スケール・ファクタと自乗平均との各帯域の相対的な値を求めるため、占有率SR(n)の概念を導入する。
【0060】
帯域nのスケール・ファクタに対する占有率SRsf(n) は、帯域nのスケール・ファクタsf(n)を全ての帯域のスケール・ファクタsfの和で割った値であって、式6のように示すことができる。
【0061】
【数6】
一方、帯域nの自乗平均に対する占有率SRpwr(n)は、帯域nの自乗平均pwr(n)を全ての帯域の自乗平均の和で割った値であって、式7のように示すことができる。
【0062】
【数7】
ここで、全ての帯域は二つのチャネルを指すが、これはジョイント・ステレオ・モードとの関連性のためである。この占有率は一つの帯域の値が全ての帯域である程度を占めるかを示す指標である。占有率は全ての値を考慮する相対的な値であって、MPEGの繰り返しビット割当てループと類似した概念となる。
【0063】
このように求めた各帯域のスケール・ファクタと自乗平均との占有率のうち、大きい値を選択してその帯域のアドレスを求めるのに用いる。このように処理する理由は、二つの特性の両方をLUTのアドレス計算に用いてもよいが、そうするとアドレスが大きくなり、全体LUTの大型化をもたらすからである。式5から判るように、二つの聴覚心理モデルのうち大きいものをその帯域の信号レベルとして決めるように、本発明でもこれと類似した処理を行う。
【0064】
占有率は1より小さい値であるが、本発明においてはこの値をスケール・ファクタ63段階のマッピングデータを用いて整数値に変換した後、次のLUTのアドレスを指定する。この場合、各帯域で最大値を有するアドレスは62となる。
【0065】
各帯域の最終占有率を求めた後、その値に対応するビット割当て量を出来る限り多いオーディオ・データを用いて調べてLUTに貯蔵する。言い換えれば、聴覚心理モデルを用いるMPEGアルゴリズムにより選択されたオーディオ・データを通してビット割当て量を調べる。この際、各帯域の占有率を求めて最高の頻度を占めるビットをその占有率に該当するビットとして決める。図3は上述したようにLUTを作成するための方法を説明する図である。
【0066】
一つの帯域について、例えば、帯域0で聴覚心理モデルによるビット割当て量が7であり、その占有率が5であれば、アドレス5の7ビット領域に頻度数を1増やせる。この過程を多数のオーディオ・データについて繰り返し行い、最高の頻度値をその帯域のビット割当て量として決める。次の表5のように、アドレス5には8、アドレス30には7、アドレス61,62には0ビットがそれぞれ最終のビット割当て量として決められる。最高の頻度数を有する帯域が二つであれば、高いビットの方を選択する。
【0067】
【表5】
一方、このように求められたLUTは、各帯域に62個ずつで、32帯域が存在するため、1984個の情報となる。これは25kbytes程度の大容量なので、全体の大きさを減らしてさらに効率良くメモリを使用するため、最適化過程を加える。すなわち、表5のアドレス61及び62のように最終のビット割当て量が0の場合にはLUTに貯蔵しない。しかしながら、連続的なアドレスのビット割当て量が同じであれば、小さい値を有するアドレスのビット割当て量のみを貯蔵するように処理することにより、ビット値の変わる境界のアドレスのみが情報として用いられる。この最適化過程はLUTを貯蔵するためのメモリの容量を大幅に減らすことができる。
【0068】
なお、このように作成されたLUTを用いたオーディオ符号化について図1を参照して説明すると、次のとおりである。
【0069】
特性獲得部123は、LUT125のアドレスを求めるため、各帯域について上述した方法で入力信号に対するスケール・ファクタと自乗平均に対する占有率を計算した後、そのうち大きい値を選択してLUT125のアドレスとして指定する。
【0070】
ビット割当て/量子化部127は、上述した方法により求めたLUT125を用いて各帯域にビットを割当てた後、この割当てられたビット数と求められるビット数とを比べて、残るビットがあるかを確かめて全体のビット使用量を調整する。もちろん、LUT125によりビットを割当てるときは、求められるビット数を満たすように割当てることが望ましい。その理由は、他の調整作業が不要となり、それだけ処理速度を速めることができるからである。
【0071】
先ず、LUT125によりビットを割当てるとき、求められるビット数を超える場合の処理過程を調べると、二つのチャネルについて高い帯域から調べて最小の占有率を有しながら1ビット以上が割当てられた帯域から1ビットずつ減らせる。この過程を前記割当てられたビット数が求められるビット数を超えないまで繰り返し行う。この際、一度減少された帯域は優先順位を最終に指定して、全ての帯域について均一に減らせるように処理する。高い帯域から減らせるのは、一般に重要な情報が低周波数側に集まっているからである。
【0072】
一方、LUT125を用いてビットを割当てた後、割当てられたビット数が求められるビット数より少なくて割当て可能なビットがあるときは、低い帯域から調べて最大の占有率を有しながら各帯域の最大のビット割当て量を超えない帯域から1ビットずつ増やして求められるビット数を超えないまで繰り返し行う。
【0073】
このようなビット調整過程はオーディオ符号化にかかる全体の実行時間の短縮に大きな影響を及ぼす。すなわち、LUT125によるビット割当て量が求められるビット量と正確に一致するか否かに応じて、このビット調整過程の繰り返し回数を減らすことができるため、正確でかつ信頼性のあるLUT125を作成する必要がある。
【0074】
一方、ジョイント・ステレオ・モードは人間の聴覚心理特性から誘導されたものであって、一般に高周波数に行くほど、オーディオ・ソースの正確な位置検知能力が低下するということを用いる。一般に、ジョイント・ステレオ・モードのハードウェアの複雑度はステレオ符号化モードのものと殆ど同じであり、符号化器の遅延時間もほぼ変わらない。このモードの主目的はオーディオの音質を向上させて符号化することにあり、ビット伝送率は約10〜30kbps程度に低めることができる。
【0075】
MPEGオーディオで標準化されたジョイント・ステレオ符号化方式を説明すると、特定な帯域を決め、その帯域以上ではサンプルをそれぞれ符号化せず、その和を求めて一つのサンプルだけを符号化する。そして、ジョイント・ステレオ・モードで符号化する特定の帯域の範囲は、各帯域の雑音をマスク・レベル以下とするためのビット割当て量の決めにより決められ、割当てられたビットが求められるビット数より多いかを確かめて四種類の帯域(4,8,12,16)のうち、一つを選択する。このように決められたジョイント・ステレオ帯域では左、右チャネルのうち大きいビット割当て量を選択して量子化する。
【0076】
この概念を本発明におけるLUTに適用して符号化するとき、問題となるのは、ジョイント・ステレオ・モードで符号化する帯域の範囲を決めることである。本発明においては、各帯域の占有率を調べて全体帯域のうち占有率の和が99.9%を超える帯域を検知して範囲を決める。そして、ジョイント・ステレオ・モードで符号化する帯域では左、右チャネルのスケール・ファクタと自乗平均が大きい値をそれぞれ選択し、これを占有率を求めるときに用いる。各占有率を求めるとき、全体帯域の和はステレオ・モードによるものより小さくなるため、各占有率はステレオ・モードによるものより大きくなる。その故、ジョイント・ステレオ・モードで符号化する場合には、他のアドレスが計算されるので、ビット割合量も異なる。したがって、一つのLUTを用いてステレオ・モードとジョイント・ステレオ・モードとの両方で符号化することができる。
【0077】
実際に本発明の性能を試すため、12個のオーディオ・データを用いて全体の実行時間を測定した。実験環境としてはUNIXシステムのSUN SPARC−10を使用し、オーディオ・データはCDから得られたデータである。
【0078】
表6は、符号化器における実行時間を示すものであって、本発明のLUTを用いた符号化方式と既存のMPEGアルゴリズムとで、その性能を比べた実験結果を示している。
【0079】
【表6】
表6において、12個のオーディオ・データは任意の名称を与えたものであり、数字は実際の実行時間を示す。そして、性能改善は前記式4から得られるものである。
【0080】
まず、本発明のアルゴリズムによる実行速度を調べると、第1実施形態では表4のようにオーディオ・データに応じて多少異なるが、従来の方式より平均41.4%程度の速度改善がなされた。第2実施形態では表6のように平均44.3%の速度改善がなされた。これは、符号化器の実時間処理速度の向上を示すので、ハードウェアで具現するとき、符号化器における処理遅延が減ることになる。しかしながら、本発明によるビット割当て過程はLUTだけにより行われるのでなく、この過程後の余分のビットまたは不足分のビットを処理する過程がある。このビット割当て調整過程に応じて全体の実行時間を速めることができる。また、オーディオ信号の音質においても、従来のMPEGアルゴリズムの音質水準と殆ど同じである。すなわち、レイヤIでは128kbps、レイヤIIでは96kbpsまで原音と殆ど同じCD音質が得られる。
【0081】
一方、本発明によるアルゴリズムの性能と従来のMPEGとの差を調べるため、Karlheinz Brandenburg により提案された聴覚心理特性を用いた性能評価方法を用いた。この方法はNMRを基準として用いる。このNMR値がネガティブであれば、雑音はマスク・レベル以下に位置する。これにより、雑音が少なく聞こえてオーディオ信号を鮮明な音質として再生することができる。
【0082】
図12及び図13は、各チャネルに対する二つのアルゴリズムの評価結果を比べたグラフである。同図からわかるように、LUTを用いる方式が低周波数領域についてMPEG方式によるものより比較的雑音に強い特性を示す。言い換えれば、要求ビット量が同じ場合でも、LUTを用いる符号化方式では、さらに効率よくビット使用が行われている。
【0083】
【発明の効果】
上述したように、本発明によるルックアップ・テーブルを用いたディジタル・オーディオ符号化方法及びその装置では、符号化器における演算時間を大幅に減らすことができ、ハードウェアで具現するとき、実時間処理の可能性を高めることができる。実際の応用例としてはコンピュータ娯楽用のハードウェアがある。この場合に音質はさほど重要ではなく、実時間の迅速な処理が求められるため、本発明によるルックアップ・テーブルを用いるディジタル・オーディオ符号化方法及びその装置は非常に有用である。
【0084】
また、聴覚心理モデルはその複雑なアルゴリズムのため、実際のハードウェアで具現しにくい。さらに、本発明においては、符号化器の値を決めるのに最も重要な影響を及ぼすものとして聴覚心理モデルの代わりにLUTを用いる。従って、メモリのみを加えることにより容易にハードウェアで具現することができ、低コストも達成し得る。
【0085】
更に、本発明によれば、従来のMPEG符号化器に比べて非常に縮小されたチップが得られるため、携帯用カメラなどの小型機器に応用することができる。現在では、コンピュータにMPEGチップを搭載することが普通になっている。本発明による装置はMPEGと完璧な互換性を保つため、コンピュータの内部に設けられたボードの大きさを縮めることにより、軽薄短小型の製品を作ることができる。
【図面の簡単な説明】
【図1】本発明によるルックアップ・テーブルを用いたディジタル・オーディオ符号化装置を示すブロック図である。
【図2】入力されたオーディオ信号の分布を示すグラフであって、(A)は分散の大きい場合を、(B)は分散の小さい場合を示すグラフである。
【図3】本発明で用いられるルックアップ・テーブルを生成する過程を説明するための図である。
【図4】帯域0に対するルックアップ・テーブルの割当てビットの分布をそのアドレスに応じて示す図である。
【図5】帯域1に対するルックアップ・テーブルの割当てビットの分布をそのアドレスに応じて示す図である。
【図6】帯域2に対するルックアップ・テーブルの割当ビットの分布をそのアドレスに応じて示す図である。
【図7】帯域3に対するルックアップ・テーブルの割当ビットの分布をそのアドレスに応じて示す図である。
【図8】帯域4に対するルックアップ・テーブルの割当ビットの分布をそのアドレスに応じて示す図である。
【図9】帯域5に対するルックアップ・テーブルの割当ビットの分布をそのアドレスに応じて示す図である。
【図10】帯域28に対するルックアップ・テーブルの割当ビットの分布をそのアドレスに応じて示す図である。
【図11】絶対スレショルド値と32個の帯域との関係を周波数領域で示すグラフである。
【図12】左側チャネルのNMRについてMPEGと本発明による符号化装置との性能を比べたグラフである。
【図13】右側チャネルのNMRについてMPEGと本発明による符号化装置との性能を比べたグラフである。
【図14】一般のMPEGオーディオ符号化器を示すブロック図である。
【符号の説明】
121 周波数マッピング部
123 特性獲得部
125 LUT
127 ビット割当て/量子化部
129 フレーム・パッキング部
Claims (9)
- 入力されるオーディオ信号の分散、平均自乗根及びスケール・ファクタの特性組合せに応じて各周波数帯域に対する割当てビットをルックアップ・テーブルを用いて作成する過程と、
前記入力される時間領域のオーディオ信号を所定の数の均等な周波数帯域に分割する過程と、
該分割された各周波数帯域に対して得られたオーディオ信号の特性の大きさの順位に応じて前記ルックアップ・テーブルのアドレスを決める過程と、
該決められたアドレスに該当する割当てビットを前記各周波数帯域に対して割当てた後に量子化する過程と、
該量子化されたオーディオ信号をビット・ストリームとして形成する過程と、
前記ルックアップ・テーブルから割当てビットが0のアドレスは取り除き、前記ルックアップ・テーブルに存在しないアドレスに0ビットを割当て、ビットを割当てた後、求められるビット数と実際のビット割当て量とを比べて、前記実際のビット割当て量が求められるビット数より少なく割り当てられるときは、低い周波数帯域から最大占有率を有する帯域を探し出して1ビットずつ増やし、前記実際のビット割当て量が求められるビット数より多く割り当てられるときは、高い周波数帯域から最少占有率を有する帯域を探し出して1ビットずつ減らす過程を含むことを特徴とするディジタル・オーディオ符号化方法。 - 入力されるステレオ・オーディオ信号のスケール・ファクタと自乗平均との特性組合せに応じて各周波数帯域に対する割当てビットをルックアップ・テーブルを用いて作成する過程と、
前記入力される時間領域のオーディオ信号を所定の数の均等な周波数帯域に分割する過程と、
該分割された各周波数帯域に対して得られたオーディオ信号の特性の大きさの順位に応じて前記ルックアップ・テーブルのアドレスを決める過程と、
該決められたアドレスに該当する割当てビットを前記各周波数帯域に対して割当てた後に量子化する過程と、
該量子化されたオーディオ・データをビット・ストリームとして形成する過程と、
前記ルックアップ・テーブルから割当てビットが0のアドレスは取り除き、ビット値の変わる境界部分のみを貯蔵し、ビットを割当てた後、求められるビット数と実際のビット割当て量とを比べて、前記実際のビット割当て量が求められるビット数より少なく割り当てられるときは、低い周波数帯域から最大占有率を有する帯域を探し出して1ビットずつ増やし、前記実際のビット割当て量が求められるビット数より多く割り当てられるときは、高い周波数帯域から最少占有率を有する帯域を探し出して1ビットずつ減らす過程を含むことを特徴とするディジタル・オーディオ符号化方法。 - 前記ルックアップ・テーブルのアドレスは全ての帯域に対する各周波数帯域におけるスケール・ファクタと自乗平均との占有率を用いて計算することを特徴とする請求項2に記載のディジタル・オーディオ符号化方法。
- ジョイント・ステレオ・モードの場合には、ステレオ・モードで用いられるルックアップ・テーブルをそのまま適用することを特徴とする請求項2に記載のディジタル・オーディオ符号化方法。
- 各帯域の占有率を求めてジョイント・ステレオ・モードで符号化する帯域の境界を探し出すことを特徴とする請求項4に記載のディジタル・オーディオ符号化方法。
- 入力されるオーディオ信号の特定に応じた各周波数帯域に対する割当てビットの関係を作成するルックアップ・テーブルと、
前記入力される時間領域のオーディオ信号を所定の数の均等な周波数帯域に分割する周波数マッピング部と、
該分割された各周波数帯域に対して得られたオーディオ信号の特性の大きさの順位に応じて前記ルックアップ・テーブルのアドレスを決める特性獲得部と、
該決められたアドレスに該当する割当てビットを前記各周波数帯域に対して割当てた後に量子化するビット割当て/量子化部と、
該量子化されたオーディオ・データをビット・ストリームとして形成するフレーム・パッキング部とから構成され、
前記ビット割当て/量子化部は、
前記ルックアップ・テーブルから割当てビットが0のアドレスは取り除き、
前記ルックアップ・テーブルに存在しないアドレスに0ビットを割当て、ビットを割当てた後、求められるビット数と実際のビット割当て量とを比べて、前記実際のビット割当て量が求められるビット数より少なく割り当てられるときは、低い周波数帯域から最大占有率を有する帯域を探し出して1ビットずつ増やし、前記実際のビット割当て量が求められるビット数より多く割り当てられるときは、高い周波数帯域から最少占有率を有する帯域を探し出して1ビットずつ減らすことを特徴とするディジタル・オーディオ符号化装置。 - 前記オーディオ信号の特性は、分散、平均自乗根及びスケール・ファクタであることを特徴とする請求項6に記載のディジタル・オーディオ符号化装置。
- 前記オーディオ信号の特性は、スケール・ファクタと自乗平均であることを特徴とする請求項6に記載のディジタル・オーディオ符号化装置。
- 前記ルックアップ・テーブルのアドレスは、全ての帯域に対する各周波数帯域におけるスケール・ファクタと自乗平均との占有率を用いて計算することを特徴とする請求項8に記載のディジタル・オーディオ符号化装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950031355A KR100300957B1 (ko) | 1995-09-22 | 1995-09-22 | 룩업테이블을이용한디지탈오디오부호화방법및장치 |
KR1995-31355 | 1995-09-22 | ||
KR1995-31352 | 1995-09-22 | ||
KR1019950031352A KR100300956B1 (ko) | 1995-09-22 | 1995-09-22 | 룩업테이블을이용한디지탈오디오부호화방법및장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09134200A JPH09134200A (ja) | 1997-05-20 |
JP3927627B2 true JP3927627B2 (ja) | 2007-06-13 |
Family
ID=26631281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25188196A Expired - Lifetime JP3927627B2 (ja) | 1995-09-22 | 1996-09-24 | ディジタル・オーディオ符号化方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5864802A (ja) |
JP (1) | JP3927627B2 (ja) |
DE (1) | DE19638997B4 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19628292B4 (de) * | 1996-07-12 | 2007-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten |
US6195633B1 (en) * | 1998-09-09 | 2001-02-27 | Sony Corporation | System and method for efficiently implementing a masking function in a psycho-acoustic modeler |
TW477119B (en) * | 1999-01-28 | 2002-02-21 | Winbond Electronics Corp | Byte allocation method and device for speech synthesis |
US6735561B1 (en) * | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US7099830B1 (en) | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6678648B1 (en) * | 2000-06-14 | 2004-01-13 | Intervideo, Inc. | Fast loop iteration and bitstream formatting method for MPEG audio encoding |
US6882976B1 (en) * | 2001-02-28 | 2005-04-19 | Advanced Micro Devices, Inc. | Efficient finite length POW10 calculation for MPEG audio encoding |
US7283968B2 (en) | 2003-09-29 | 2007-10-16 | Sony Corporation | Method for grouping short windows in audio encoding |
US7426462B2 (en) * | 2003-09-29 | 2008-09-16 | Sony Corporation | Fast codebook selection method in audio encoding |
US7349842B2 (en) * | 2003-09-29 | 2008-03-25 | Sony Corporation | Rate-distortion control scheme in audio encoding |
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
KR100723400B1 (ko) * | 2004-05-12 | 2007-05-30 | 삼성전자주식회사 | 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치 |
KR100695125B1 (ko) | 2004-05-28 | 2007-03-14 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
US7725313B2 (en) * | 2004-09-13 | 2010-05-25 | Ittiam Systems (P) Ltd. | Method, system and apparatus for allocating bits in perceptual audio coders |
DE102004059979B4 (de) * | 2004-12-13 | 2007-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals |
CN101192410B (zh) * | 2006-12-01 | 2010-05-19 | 华为技术有限公司 | 一种在编解码中调整量化质量的方法和装置 |
JP4708446B2 (ja) * | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
US8924207B2 (en) * | 2009-07-23 | 2014-12-30 | Texas Instruments Incorporated | Method and apparatus for transcoding audio data |
RU2648595C2 (ru) | 2011-05-13 | 2018-03-26 | Самсунг Электроникс Ко., Лтд. | Распределение битов, кодирование и декодирование аудио |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US4926482A (en) * | 1987-06-26 | 1990-05-15 | Unisys Corp. | Apparatus and method for real time data compressor |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
US5042069A (en) * | 1989-04-18 | 1991-08-20 | Pacific Communications Sciences, Inc. | Methods and apparatus for reconstructing non-quantized adaptively transformed voice signals |
JP2841765B2 (ja) * | 1990-07-13 | 1998-12-24 | 日本電気株式会社 | 適応ビット割当て方法及び装置 |
EP0520068B1 (en) * | 1991-01-08 | 1996-05-15 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
DE69217590T2 (de) * | 1991-07-31 | 1997-06-12 | Matsushita Electric Ind Co Ltd | Verfahren und Einrichtung zur Kodierung eines digitalen Audiosignals |
KR100269213B1 (ko) * | 1993-10-30 | 2000-10-16 | 윤종용 | 오디오신호의부호화방법 |
-
1996
- 1996-09-23 US US08/717,610 patent/US5864802A/en not_active Expired - Lifetime
- 1996-09-23 DE DE19638997A patent/DE19638997B4/de not_active Expired - Lifetime
- 1996-09-24 JP JP25188196A patent/JP3927627B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE19638997B4 (de) | 2009-12-10 |
US5864802A (en) | 1999-01-26 |
JPH09134200A (ja) | 1997-05-20 |
DE19638997A1 (de) | 1997-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3927627B2 (ja) | ディジタル・オーディオ符号化方法 | |
US5649053A (en) | Method for encoding audio signals | |
KR960012475B1 (ko) | 디지탈 오디오 부호화장치의 채널별 비트 할당 장치 | |
CA2027136C (en) | Perceptual coding of audio signals | |
KR100288460B1 (ko) | 신호가중된 양자화비트할당을 사용하는 데이타 압축 장치 및 방법 | |
US5664056A (en) | Digital encoder with dynamic quantization bit allocation | |
JP2904472B2 (ja) | ディジタル・オーディオ信号を効率的に圧縮するための方法、データ処理システムおよび装置 | |
US6697775B2 (en) | Audio coding method, audio coding apparatus, and data storage medium | |
JP5175028B2 (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
KR100388730B1 (ko) | 고능률부호화및복호화장치 | |
US7650278B2 (en) | Digital signal encoding method and apparatus using plural lookup tables | |
KR0137472B1 (ko) | 오디오 신호 코딩 방법 | |
JP3395001B2 (ja) | ディジタルオーディオ信号の適応的符号化方法 | |
KR100300957B1 (ko) | 룩업테이블을이용한디지탈오디오부호화방법및장치 | |
US6754618B1 (en) | Fast implementation of MPEG audio coding | |
KR100300956B1 (ko) | 룩업테이블을이용한디지탈오디오부호화방법및장치 | |
JP3465341B2 (ja) | オーディオ信号符号化方法 | |
KR0155823B1 (ko) | 서브밴드코딩의 비트할당방법 | |
KR100351772B1 (ko) | 디지털부호화장치,디지털기록신호도출장치및디지털신호데이터도출방법 | |
JPH08204575A (ja) | 適応的符号化システム及びビット割当方法 | |
KR100224812B1 (ko) | 오디오 신호의 부호화에 있어서 비트 할당방법 | |
KR100590340B1 (ko) | 디지털 오디오 부호화 방법 및 장치 | |
KR100340368B1 (ko) | 고능률부호화장치,복호화장치및디지털데이터도출방법 | |
KR960012472B1 (ko) | 적응적인 비트할당에 의한 대역분할 부호화장치 | |
JP2000148191A (ja) | ディジタルオーディオ信号の符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050802 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20051102 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20051108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070305 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110309 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110309 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120309 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130309 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140309 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |