JP3643735B2 - オーディオ信号符号化装置およびオーディオ信号符号化方法 - Google Patents
オーディオ信号符号化装置およびオーディオ信号符号化方法 Download PDFInfo
- Publication number
- JP3643735B2 JP3643735B2 JP27248599A JP27248599A JP3643735B2 JP 3643735 B2 JP3643735 B2 JP 3643735B2 JP 27248599 A JP27248599 A JP 27248599A JP 27248599 A JP27248599 A JP 27248599A JP 3643735 B2 JP3643735 B2 JP 3643735B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation amount
- bit allocation
- quantization
- frequency band
- frequency bands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は、オーディオ信号を符号化する装置に関する。
【0002】
【従来の技術】
従来から、オーディオ信号を符号化する技術として、オーディオ信号をいくつかのサブバンドと呼ばれる帯域に分割して符号化するサブバンド符号化や、周波数変換等の変換を行って符号化する変換符号化の手法が知られている。
【0003】
サブバンド符号化で用いられる帯域分割手法としては、QMFバンク(Quadrature Mirror Filter)などを用いる手法がある。
【0004】
また、変換符号化で用いられる変換手法としては、FFT(Fast Fourier Transform)、DCT(Discrete Cosine Transform)MDCT(Modified Discrete Cosine Transform)などが知られている.
また、近年、聴覚マスキングなどの聴覚的性質を利用して圧縮率を高める符号化の手法が用いられることが一般的になってきている。
【0005】
聴覚マスキングとは、ある音が存在する場合、その音の周辺の周波数や時間的前後において、他の音が知覚できなくなったり、本来より小さく聞こえる現象である。周辺の周波数に対して働く現象を同時マスキングといい、時間的に働く現象を継時マスキングという。また、静寂時においても、音の大きさがある値以下になる知覚できなくなり、その音の大きさは周波数に依存している。これを最小可聴値といい、一種の聴覚マスキングと捉えることができる。
【0006】
符号化においては、この聴覚マスキングを利用して情報圧縮が行われる。例えば、オーディオ信号をいくつかの帯域に分割し、それぞれの帯域に異なる長のビットを割り当てる。
【0007】
その際、聴覚マスキングにより聞こえない帯域にはビットを割り当てなくする。あるいは、強いマスキングがかかり聴覚的に感知されにくい帯域には少ないビット量を割り当て、マスキングが弱く聴覚的に感知されやすい帯域には多くのビット量を割り当てる。このような方法をとれば、少ないビット量でも聴覚的な音質の劣化を少なくできる.
これらの技術を用いた符号化方式としては、MPEG1−Audio(lSO/IEC11172-3)などがある。そして、こうした符号化方式に基づいて符号化・復号化を行う装置が既に存在している。
【0008】
以下、従来の一般的なオーディオ信号符号化装置の説明のため、MPEG1-Audioに基づいた符号化装置のハードウェア構成、処理手続き、その中でも特に聴覚マスキングを用いたビット割当方法について説明する。
【0009】
図7は、従来のオーディオ信号符号化装置101の構成を示すブロック図である。
【0010】
図7を参照して、オーディオ信号符号化装置101は、ディジタル化されたオーディオ信号の時系列データを受けサブバンド分割を行うサブバンド分割部102と、サブバンド分割部から出力されるサブバンドデータを受け、スケーリング処理を行なうスケーリング部104と、時系列のオーディオデータを処理して各サブバンドのビット割当量を求めるビット割当部106と、スケーリング部104から出力されるサブバンドデータおよびスケール情報をビット割当部106で求めた割当てに従い量子化を行う量子化部108と、量子化部の出力を受けてMPEGフォーマットのデータに変換するフォーマット変換部110とを含む。
【0011】
図8は、図7に示したオーディオ信号符号化装置101が行なう処理の大きな流れを示すフローチャートである。
【0012】
図7、図8を参照して、オーディオ信号符号化装置101で符号化処理が開始される(ステップS101)。オーディオ信号符号化装置101は、MPEGデータとしてフレームという単位でデータを出力する。オーディオ信号符号化装置101に入力されるデータは、ディジタル化されたオーディオ信号の時系列データである。オーディオ信号符号化装置101は、1フレーム分のデータが入力されると(ステップS102)、MPEGデータの1フレーム分の符号化処理を行う(ステップS103)。
【0013】
図9は、オーディオ信号符号化装置101に入力されるデータを説明するための図である。
【0014】
図9を参照して、この時系列データは、ディジタル化されたオーディオデータである。サンプリングは、たとえば44.1kHzで行われており、データD0、D1、D2、D3…が入力される。
【0015】
図10は、図7におけるサブバンド分割部102が時系列データから生成するサブバンドデータを説明するための図である。
【0016】
図10を参照して、図9にしめした時系列データは、オーディオ信号の所定の帯域を32帯域に分割したサブバンドsb0〜sb31に分割される。サブバンド分割された後、各サブバンドにおいて帯域通過信号成分は1/32に間引き処理されサンプルSS0〜SS35が生成される。
【0017】
図11は、時系列データからサブバンドデータを生成する説明のための図である。
【0018】
図11を参照して、D0〜D1631は、時系列データである。時系列データの最初の512サンプルであるデータD0〜D511から図10に示したサンプルSS0が生成される。
【0019】
次いで、32サンプル後ろにシフトしたデータD32〜D543から次の図10に示したサンプルSS1が生成される。
【0020】
以降、32サンプルずつ後ろにシフトしながら時系列データの512サンプルからサブバンドデータの1サンプルが生成され、1フレームあたり合計でSS0〜SS35の36サンプルが生成される。
【0021】
1フレーム分のサブバンドデータを作るためにはD0〜D1631の1632サンプルが必要である。しかし、次のフレームのサブバンドデータを作るために最後の480サンプルは重複して使用されるため、割合的には1152サンプルの時系列データから1フレーム分のサブバンドデータが生成されることになる。サブバンドデータの1サンプルは32個のサブバンドのデータを含んでいるので、サブバンドデータには、32×36つまり、1152のデータを含んでおり、サブバンド分割の前後ではデータ数は変わっていない。
【0022】
このサブバンドデータは、図7におけるスケーリング部でスケーリングという正規化処理をされた後、量子化部108で量子化される。
【0023】
図12は、量子化の説明をするための概念図である。
図7、図12を参照して、スケーリング部104では、サブバンド毎に含まれるデータがすべて−1〜+1の間になるようにスケール情報が決定され、サブバンドデータのスケーリングが行われる。
【0024】
スケーリング時には量子化されるデータは、波形と倍率に分離される。波形は、最大振幅が±1に収まるように正規化される。この正規化時の倍率に応じた値をスケールファクタという。つまり、スケールファクタとは、量子化データがとりうる範囲を示す値である。上述のスケール情報には、このスケールファクタが含まれている。
【0025】
ここで、たとえば、n番めのサブバンドsb(n)のサンプルSS1がスケーリング後に0.70であったとする。ビット割り当て部106は、サブバンドsb(n)の量子化ビットの割当量を3ビットに決定したとする。
【0026】
割当量が3ビットの場合は、000〜110が使用される仕様であるとする。このとき、スケーリング後のデータ−1〜+1が000〜110に量子化される。サンプルSS1は、量子化部108によって101に量子化されることになる。
【0027】
量子化前のデータと量子化後のデータの差の2乗を量子化誤差あるいは物理的誤差Nとよぶ。この量子化誤差Nは、ビット割り当て部106が各サブバンドにビットを割り当てるのに関係がある。
【0028】
図13は、MPEGの1フレームのデータを説明するための図である。
図13を参照して、MPEGのデータは、先頭からヘッダ、CRC、ビットアロケーション、スケール情報、サンプルデータ、アンシラリデータ(Ancillary Data)の順で図7に示したフォーマット変換部110から出力される。
【0029】
ヘッダには、同期ワードやサンプリング周波数、プロテクション等の情報が含まれている。CRCは、エラーチェックするための情報である。
【0030】
続くビットアロケーション、スケール情報、サンプルデータは、時系列に入力されたオーディオデータが変換された情報である。ビットアロケーションには、32の各サブバンドにいくつのビットが割り当てられるかのビット情報が入っている。スケール情報には、各サブバンドの信号がスケーリングされた際のスケールファクタ等が含まれている。サンプルデータにはアロケーションビットにしたがって正規化後に量子化された情報が含まれている。
【0031】
図14は、図7に示したビット割当部106の構成を示すブロック図である。
図14を参照して、ビット割当部106は、オーディオ信号の時系列データを受け、FFTなどにより周波数軸上の周波数データSに変換する周波数分析部112と、周波数分析部112の出力を受けて周波数帯域ごとのマスキング量Mを算出するマスキング算出部114と、周波数データSとマスキング算出部114によって求められたマスキング量Mとを受けて各サブバンドごとにSMR(シグナル・マスキング比)を算出するSMR算出部116と、SMR算出部116の出力を受けて各サブバンドの量子化ビットの割当量を決定して出力するビット割当決定部118とを含む。
【0032】
ここで、マスキング量Mとは、そのサブバンドの周波数における先に説明した聴覚マスキングの大きさである。
【0033】
周波数分析部112では、図7に示したサブバンド分割部102において生じるフィルタ遅延などを考慮したタイミングで周波数分析が行なわれている。
【0034】
ビット割当決定部118は、サブバンドごとにマスキング量Mと図12で説明した量子化誤差Nとの比を算出するMNR算出部120と、MNR算出部120によって求められた各サブバンドのMNR(マスキング・ノイズ比)が最小であるサブバンドを検出するMNR最小サブバンド検出部124と、MNR最小サブバンド検出部124の出力を受けて各サブバンドに割当てられるビットを更新するビット割当更新部126と、ビット割当処理の終了を判定しビット割当量を図7の量子化部108に対して出力する終了判定部128とを含む。
【0035】
MNRは、おおまかにいえば、ある音を聴いたときに人間がノイズとして認識する量の逆数を表わしており、各サブバンドのMNRの総和を最大とすることが、最適な量子化ビットを各サブバンドに割当てる方法の一つといえる。
【0036】
ビット割当更新部126は、MNRが最小となるサブバンドにビット割当が可能であれば量子化ビットをさらに割当てる。終了判定部128は、ビット割当可能なサブバンドがなくなった場合に、ビット割当処理を終了してその時点のビット割当量を出力する。ビット割当可能なサブバンドがまだ存在する場合には、MNR算出部120にビット割当処理を再度実行するように指示する。そして、再び、MNR最小サブバンド検出部124とビット割当更新部126とによるビット割当処理が行なわれる。
【0037】
図15は、図7に示したビット割当部106の処理フローを示すフローチャートである。
【0038】
図15を参照して、従来のビット割当処理がスタートする(ステップS122)と、FFTなどによりオーディオ信号が周波数軸上のデータに変換される(ステップS123)。その際には、サブバンド分割で生じるフィルタ遅延などを考慮したタイミングで処理が行なわれ、サブバンド分割処理に実際に使用されているデータを用いて周波数分析が行なわれる。
【0039】
次に、周波数分析したデータを用いてマスキング量の周波数分布を算出する(ステップS124)。基本的な方法としては、ある周波数成分が存在するときに他の周波数成分がマスキングされる大きさをプロットしたマスキングパターンを用いる。このマスキングパターンをステップS123で分析された周波数データに畳み込む演算を行なって求める。
【0040】
他には、精度や計算効率を高めるために、臨界帯域幅などの聴覚的性質に合った周波数軸上に変換して行なう処理や、同様の聴覚的性質を考慮して周波数分解能を変える処理や、純音か広帯域音かに応じてマスキングパターンを変える処理や、音の大きさによってマスキングパターンを変える処理などが行なわれる。
【0041】
ステップS123で行なわれる周波数分析やステップS124で行なわれるマスキング算出で使用されるFFTや畳み込みなどの処理は、一般にある程度高い分解能で行なう必要があるため、処理量が多くなってしまう。
【0042】
続いて、SMR算出処理が行なわれる(ステップS125)。SMR算出処理では、各サブバンドに対しSMR(シグナル・マスキング比)を算出する。算出にはシグナルとして周波数分析したデータ、または、図7のスケーリング部104で算出されたスケールファクタを用い、マスキング量としてはステップS124で算出したマスキング量を用いる。
【0043】
続いて、初期設定が行なわれる(ステップS126)。初期設定では、各サブバンドに対し用意された変数である「ビット割当量」、「割当状態」の初期設定を行なう。「ビット割当量」は、そのサブバンドに割当てられたビット量に対応する符号を保存しており、最初はすべてのサブバンドに対しビット量0が設定される。「割当状態」は、そのサブバンドにさらにビットが割当可能かどうかを示すフラグであり、最初はすべて可能状態に設定される。
【0044】
続いて、MNR算出が行なわれる(ステップS127)。MNR算出処理においては、「割当状態」が割当可能である各サブバンドに対しMNR(マスキング・ノイズ比)を算出する。この算出には、ステップS125で求めたSMRとSNR(シグナル・ノイズ比)を用いて行なわれる。両者の単位がデシベル(dB)であれば、MNR=SNR−SMRとなる。
【0045】
ここで、SNRは量子化誤差と信号との比であり、量子化を行なうビット数に依存する。したがって、「ビット割当量」に依存する定数的なテーブルとして予め用意されている。
【0046】
続いて、「割当状態」が割当可能であるサブバンドの中から、MNRが最小であるサブバンドを選び出す(ステップS128)。つまり、この選び出されたサブバンドは、新たに追加してビット割当を行なうと、聴感ノイズが減少するのにもっとも効果的と期待されるサブバンドである。
【0047】
次に、選び出されたサブバンドに対し、さらにビット割当が可能かどうかを判断する(ステップS129)。ここで、割当不可能な場合とは、新たにビットを割当てたときに、図13に示した1フレームに含むことができるビット量を超える場合、または、各サブバンドに許容されている最大ビット数を超える場合である。
【0048】
ビット割当が可能であった場合には、ビット割当更新の処理を行なう(ステップS130)。ここでは、選択されたサブバンドに対し可能な最小のビット量を新たに付加し、そのサブバンドの「ビット割当量」を更新する。
【0049】
ビット割当が不可能であった場合には、そのサブバンドの「割当状態」を不可能状態に設定する(ステップS131)。
【0050】
続いて、すべてのサブバンドの「割当状態」が不可能であるかどうかが判断される(ステップS132)。不可能である場合には、ステップS133に進みビット割当処理が終了する。
【0051】
「割当状態」が不可能でないサブバンドが存在する場合には、ステップS127に戻り、MNR算出処理を繰返す。
【0052】
このようにして、MNRを逐次計算しながら、現時点でMNR最小のサブバンドに順にビットを割当てていくことを繰返す。結果として、1フレームで使用できるビット量の範囲内で、全体のMNRを最大にするようにビットが割当てられる。つまり、最も聴感ノイズが少なくなるように最適なビット割当がなされる。
【0053】
【発明が解決しようとする課題】
以上説明したような従来のオーディオ信号符号化装置では、聴覚マスキング等の性質を用いて聴感上必要な部分に多くのビットを割当てる。このようにして聴感上の音質を劣化させることなく高能率の情報圧縮を行なっている。
【0054】
しかし、聴感マスキング量の算出には、高分解能の周波数分析やマスキングパターンの畳み込み演算等が用いられる。これらの演算には多くの処理量が必要とされる。その場合には、低コストのハードウェア上で高速な処理を実現することが難しい。
【0055】
また、その処理を簡略化することで処理量を削減することも可能であるが、一般によい音質が得られない。
【0056】
本発明は、このような問題点を解決するためのものであり、新たな評価手法によって簡易な処理で聴感特性に合ったビット割当を可能にする。その結果、低処理量で音質の良い音響信号の圧縮を可能にするものである。
【0057】
【課題を解決するための手段】
請求項1に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの2乗和をS、量子化誤差をN、0<k<1となる定数をkとすると、評価量算出手段は、評価量を式F=(S+N) k −S k によって算出される数値Fに応じて求める。
【0061】
請求項2に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの2乗和をS、量子化誤差をN、0<k<1となる定数をkとすると、評価量算出手段は、評価量を式F=N×S(k-1)によって算出される数値Fに応じて求める。
【0062】
請求項3に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの2乗和をS、量子化誤差をN、シグナル・ノイズ比をSNR、0<k<1となる定数をkとすると、評価量算出手段は、評価量を式F=(1/SNR)×Skによって算出される数値Fに応じて求める。
【0063】
請求項4に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの2乗和をS、量子化誤差をN、0<k<1となる定数をkとすると、評価量算出手段は、評価量を式F=logN+(k−1)×logSによって算出される数値Fに応じて求める。
【0064】
請求項5に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの2乗和をS、量子化誤差をN、シグナル・ノイズ比をSNR、0<k<1となる定数をkとすると、評価量算出手段は、評価量を式F=log(SNR)+k×logSによって算出される数値Fに応じて求める。
【0065】
請求項6に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの2乗和をS、量子化誤差をN、0<k<1となる定数をkとすると、評価量算出手段は、評価量を式F=log(S+N)−logSによって算出される数値Fに応じて求める。
【0066】
請求項7に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの2乗和をS、スケールファクタの2乗をSc、シグナル・ノイズ比をSNR、0<k<1となる定数をkとすると、評価量算出手段は、評価量を式F=log(S+Sc/SNR)−logSによって算出される数値Fに応じて求める。
【0067】
請求項8に記載のオーディオ信号符号化装置は、請求項1〜7のいずれか1項に記載のオーディオ信号符号化装置の構成において、評価量算出手段は、周波数帯域の臨界帯域幅にさらに応じて評価量を各周波数帯域ごとに求める。
【0068】
請求項10に記載のオーディオ信号符号化方法は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力するステップと、所定の時間間隔ごとに信号成分の大きさおよび周波数帯域の臨界帯域幅に応じて、各周波数帯域に量子化ビットの割当てを行なうステップと、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なうステップとを備える。量子化ビットの割当てを行なうステップは、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさと周波数帯域の臨界帯域幅とに応じた評価量を各周波数帯域ごとに求めるステップと、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出するステップと、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるステップと、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力するステップとを含む。
【0070】
【発明の実施の形態】
以下において、本発明の実施の形態について図面を参照して詳しく説明する。なお、図中同一符号は同一または相当部分を示す。
【0071】
[実施の形態1]
図1は、本発明の実施の形態1のオーディオ信号符号化装置1の構成を示すブロック図である。
【0072】
図1を参照して、オーディオ信号符号化装置1は、ディジタル化された時系列のオーディオデータを受けサブバンド分割を行なうサブバンド分割部2と、サブバンド分割部から出力されるサブバンドデータを受け、スケーリング処理を行なうスケーリング部4と、サブバンド分割部2から出力されるサブバンドデータとスケーリング部4から出力されるスケール情報とに基づいて各サブバンドのビット割当量を求めるビット割当部6と、スケーリング部4から出力されるサブバンドデータおよびスケール情報をビット割当部6で求めたビット割当に従い量子化を行なう量子化部8と、量子化部8の出力を受けてMPEGフォーマットのデータに変換するフォーマット変換部10とを含む。
【0073】
オーディオ信号符号化装置1においては、ビット割当部6がサブバンドデータとスケール情報とに基づきビット割当を行なう点が図7に示した従来のオーディオ信号符号化装置101と異なっている。
【0074】
図2は、図1におけるビット割当部6の構成を示すブロック図である。
図2を参照して、ビット割当部6は、図1におけるサブバンド分割部2から出力されるサブバンドデータおよびスケーリング部4から出力されるスケール情報を受けてサブバンドごとに信号とスケール情報のパワー値を算出するパワー算出部12と、パワー算出部12の出力を受けてビット割当を決定するビット割当決定部14とを含む。
【0075】
パワー算出部12では、具体的には、サブバンドごとにそのサブバンド内の各信号の2乗和を求め、その求めた値を各サブバンドのパワー値とする。ここで、各サブバンドの信号はサブバンド分割部2において求めたデータを使用するため、新たに必要となる処理量は少ない。
【0076】
ビット割当決定部14は、パワー算出部12の出力を受けてサブバンドごとに後に説明する方法で聴感的ノイズを算出する聴感的ノイズ算出部16と、聴感的ノイズ算出部16によってサブバンドごとに求められた聴感的ノイズを受けて聴感的ノイズが最大となるサブバンドを検出する聴感的ノイズ最大サブバンド検出部18と、聴感的ノイズ最大サブバンド検出部18で求めたサブバンドにビットの割当てが可能な場合にビット割当をするビット割当更新部20と、ビット割当更新部20の出力に応じてビット割当処理を終了するかどうかの判定を行なう終了判定部22とを含む。
【0077】
聴感的ノイズ算出部16では、従来の場合と異なり聴感的ノイズに対して新しい評価量が導入されている。この新評価量をFとすると、Fは次式で算出される。
【0078】
F=β×((S+Sc/SNR)k−Sk) …(1)
ここで、kは定数、βは各サブバンドごとに決められた重み付け係数、Sはそのサブバンドの信号のパワー、Scはスケールファクタの2乗、SNRはシグナル・ノイズ比である。
【0079】
SNRは、量子化誤差と信号との比であり、量子化を行なうビット数に依存する。したがって、ビット割当量に依存する定数的なテーブルとして予め用意されている。
【0080】
kは、好ましくは0.27にされる。βは次式で表わすことができる。
β=(そのサブバンドの臨界帯域幅/4)(-(1-k)/3.15) …(2)
臨界帯域幅とは、サブバンドの中心周波数に依存する帯域幅であって、臨界帯域幅より外では、2つの音のエネルギーは相互作用しなくなる。臨界帯域幅については、たとえば、「リンゼイノーマン著、情報処理心理学入門I、p175〜177」に説明されている。
【0081】
このように評価量Fを定めると、評価量Fが大きいと聴感的ノイズが大きいことになる。したがって、サブバンドごとに求めたこの評価量Fの総和を小さくすることで、量子化ビットの割当ての最適化を図る。
【0082】
聴感的ノイズ最大サブバンド検出部18では、「割当状態」が割当可能であるサブバンドの中から、先に説明した新評価量Fが最大であるサブバンドを選び出す。ビット割当更新部20では聴感的ノイズが最大となったサブバンドにビットの割当てが可能であればビットを割当てる。終了判定部22は、ビット割当可能なサブバンドがなくなった場合にビット割当決定部の処理を終了し、その時点のビット割当量を出力する。ビット割当可能なサブバンドがまだ存在する場合には、聴感的ノイズ算出部16に対して処理を繰返すように指示する。
【0083】
尚、上述の評価量Fに代えて以下の評価量F1〜F6を用いても同様なビット割当が可能である。
【0084】
F1=β×N×S(k-1) …(3)
F2=β×(1/SNR)×Sk …(4)
F3=logβ+logN+(k−1)×logS …(5)
F4=logβ−log(SNR)+k×logS …(6)
F5=β×(log(S+N)−logS) …(7)
F6=β×(log(S+Sc/SNR)−logS) …(8)
但し、0x(x<0)、log0といった計算が必要な場合は、適当な大きな定数で置き換えるものとする。
【0085】
以上説明したように、実施の形態1のオーディオ信号符号化装置は、多くの処理量が必要な周波数分析や畳み込み演算を必要とする聴覚マスキング量を使用する代りに、サブバンドの信号のパワーとスケール情報から求められる新たな評価量に基づきビット割当をするため、少ない処理量で音質の良い音響信号の圧縮が可能になる。
【0086】
[実施の形態2]
図3は、実施の形態2のオーディオ信号符号化装置30の構成を示すブロック図である。
【0087】
図3を参照して、オーディオ信号符号化装置30は、オーディオ信号を受ける入力インターフェイス32と、入力インターフェイス32を通じて入力されたオーディオデータを一時的に蓄積する入力データバッファメモリ34と、所定の符号化処理手続に従い入力データバッファメモリからオーディオ信号を読出して符号化するマイクロプロセッサ36とを備える。
【0088】
オーディオ信号符号化装置30は、さらに、マイクロプロセッサ36が行なう符号化処理手続が保存されているプログラム用メモリ40とマイクロプロセッサ36の符号化処理中に生じる一時的なデータを保存するためのワークメモリ38と、マイクロプロセッサ36から符号化後のデータを受けて蓄積する出力データバッファメモリ42と、出力データバッファメモリ42に蓄積されたデータを外部に対して出力する出力インタフェース44とを含む。
【0089】
マイクロプロセッサ36と入力データバッファメモリ34、出力データバッファメモリ42、ワークメモリ38およびプログラム用メモリ40との間のデータ転送はデータバス46を通じて行なわれる。
【0090】
図4は、図3に示したオーディオ信号符号化装置30で行なわれるオーディオ信号符号化処理の手続例を示すフローチャートである。
【0091】
図4を参照して、このフローチャートは、連続したオーディオ信号を所定のサンプル数で区切った単位であるフレームごとに一括して符号化処理を行なう様子を示している。
【0092】
符号化処理が開始されると(ステップS1)、まず図3における入力データバッファメモリ34に1フレーム分のオーディオ信号が蓄積されるのを待つ(ステップS2)。
【0093】
1フレーム分の入力があると、フレーム処理(ステップS3)が行なわれる。
フレーム処理の開始時には、入力データバッファメモリ34から1フレーム分のオーディオ信号が読出され、終了時には、符号化された1フレーム分のデータが出力データバッファメモリ42に書込まれる。
【0094】
再び図3を参照して、外部から入力データバッファメモリ34へのデータの入力は入力インターフェイス32を通じて所定のタイミングで順次行なわれる。また出力データバッファメモリ42から外部に対しての出力は出力インタフェース44を通じて所定のタイミングで順次行なわれる。
【0095】
図4におけるステップS3で示したフレーム処理は、外部とのデータ入出力に十分間に合う時間内で実行される。入力データバッファメモリ34および出力データバッファメモリ42の記憶容量は、外部やマイクロプロセッサ36とのやり取りに支障がないように、十分な大きさが確保されている。たとえば、2フレーム分のデータサイズを確保し、循環的なバッファメモリとして使用することで処理に支障がないようにすることかできる。
【0096】
図5は、図4に示したフレーム処理のステップS3の詳細を説明するためのフローチャートである。
【0097】
図5を参照して、まず入力データバッファメモリ34から1フレーム分のオーディオ信号を取得する(ステップS11)。たとえば、ワークメモリ38の一部に保存用の領域を設けその領域にオーディオ信号のデータを保存する(ステップS12)。その後サブバンド分割が行なわれる(ステップS13)。サブバンド分割では、所定のフィルタバンクを用いてオーディオ信号を32の帯域、すなわちサブバンドに分割し、その後各帯域通過信号を32分の1に間引き処理する。
【0098】
スケーリングでは、そのサブバンド内に属するすべての信号の絶対値の最大値をサブバンドごとに求める。そして、予め用意された所定の数値群の中から、このサブバンドごとに求めた最大値より大きな値を抽出する。そしてこの抽出された値のうちから最小値を選ぶ。この値を、サブバンドのスケールファクタと呼ぶ。
【0099】
さらに、サブバンド内の各信号をスケールファクタで正規化する。このとき、各信号の絶対値はすべて1以下となる。さらに、方式によっては連続するスケールファクタの相関を利用してスケールファクタの情報圧縮を行なう。その場合には、情報圧縮状態を示す付加情報が加えられる。
【0100】
続いてビット割当では、各サブバンドに割当てるビット量を決める(ステップS15)。この決め方の詳細については後に説明する。
【0101】
次に、各サブバンドへのビット割当に応じ、スケールファクタで正規化された信号を量子化する(ステップS16)。そして、MPEGフォーマットに変換される(ステップS17)。
【0102】
1フレーム分の出力データが生成されると、そのデータを図3の出力データバッファメモリ42に書込み(ステップS18)、フレーム処理を終了する(ステップS19)。
【0103】
図6は、図5におけるビット割当を行なうステップS15の詳細を示すフローチャートである。
【0104】
図6を参照して、ビット割当が開始されると(ステップS22)、サブバンドごとの信号のパワーを算出する(ステップS23)。具体的には、サブバンドごとにそのサブバンド内の各信号の2乗和を求め、その求めた値を各サブバンドのパワーとする。各サブバンドの信号は、図5のステップS13において求めた信号を用いることができるので、パワー算出のために必要となる処理量は少ない。
【0105】
次に、各サブバンドに対して用意された変数である「ビット割当量」、「割当状態」の初期設定を行なう。「ビット割当量」は、そのサブバンドに割当てられた量子化ビット量に対応する符号を保存している。「ビット割当量」は、最初はすべてのサブバンドに対してビット量0が設定される。「割当状態」は、そのサブバンドにさらにビットが割当て可能かどうかを示すフラグであり、最初はすべてビット割当が可能であるという状態に設定される。
【0106】
次に、「割当状態」が割当て可能である各サブバンドに対し本発明で導入する新たな評価量を算出する(ステップS25)。この評価量をFとすると、Fは実施の形態1で示した式(1)で算出することができる。また、評価量Fに代えて実施の形態1で示した式(3)〜(8)で表わされる評価量F1〜F6を用いてもよい。
【0107】
次に、この評価量が最大となるサブバンドの検出が行なわれる(ステップS26)。ステップS26では、「割当状態」が割当て可能であるサブバンドの中から、評価量Fが最大であるサブバンドを選び出す。
【0108】
次に、選び出されたサブバンドに対し、さらにビット割当が可能かどうかを判断する(ステップS27)。割当て不可能な場合とは、新たにビットを割当てたときに1フレームで使用することができるビット量を超えてしまった場合、または各サブバンドに許容されている最大ビット数を超えてしまう場合である。
【0109】
ビット割当が可能であった場合には、そのサブバンドに対しビット量を新たに付加し、ビット割当量を更新する(ステップS28)。
【0110】
ビット割当が不可能であった場合には、そのサブバンドの割当て状態を不可能状態に設定する(ステップS29)。
【0111】
次に、すべてのサブバンドの「割当状態」が不可能であるかどうかを判断する(ステップS30)。不可能である場合には、ビット割当の処理を終了する(ステップS31)。
【0112】
「割当状態」が可能な場合には、ステップS25の評価量算出を再び行なう。
このようにして、評価量Fを逐次計算しながら、各時点で新評価量が最大となるサブバンドに順にビットを割当てていくことを繰返す。結果として、1フレームで使用することができるビット量の範囲内で、全体の評価量Fの和を最小にするようにビットが割当てられる。
【0113】
以上説明したように、実施の形態2に示したオーディオ信号符号化装置では、マイクロプロセッサを用いた場合に、簡易な処理で聴感特性に合ったビット割当を可能にし、音質の良い音響信号の圧縮を少ない処理量で行なうことが可能になる。
【0114】
実施の形態1、2では、信号の大きさを表わす量Sとして、各サブバンド内の信号の2乗和すなわちパワーを用いた。しかし、代りにSとして信号の絶対値和、各サブバンドの信号中の最大値(スケールファクタ)、連続する数個の信号の2乗和の最大値などを用いても新評価量を算出することができる。
【0115】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【0116】
【発明の効果】
本発明によれば、新たな評価量を導入し、簡易な処理で聴感特性にあったビット割当を可能にするため、少ない処理量で音質の劣化が少ない音響信号の圧縮が可能になる。
【図面の簡単な説明】
【図1】 本発明の実施の形態1のオーディオ信号符号化装置1の構成を示すブロック図である。
【図2】 図1におけるビット割当部6の構成を示すブロック図である。
【図3】 実施の形態2のオーディオ信号符号化装置30の構成を示すブロック図である。
【図4】 図3に示したオーディオ信号符号化装置30で行なわれるオーディオ信号符号化処理の手続例を示すフローチャートである。
【図5】 図4に示したフレーム処理のステップS3の詳細を説明するためのフローチャートである。
【図6】 図5におけるビット割当を行なうステップS15の詳細を示すフローチャートである。
【図7】 従来のオーディオ信号符号化装置101の構成を示すブロック図である。
【図8】 図7に示したオーディオ信号符号化装置101が行なう処理の大きな流れを示すフローチャートである。
【図9】 オーディオ信号符号化装置101に入力されるデータを説明するための図である。
【図10】 図7におけるサブバンド分割部102が時系列データから生成するサブバンドデータを説明するための図である。
【図11】 時系列データからサブバンドデータを生成する説明のための図である。
【図12】 量子化の説明をするための概念図である。
【図13】 MPEGの1フレームのデータを説明するための図である。
【図14】 図7に示したビット割当部106の構成を示すブロック図である。
【図15】 図7に示したビット割当部106の処理フローを示すフローチャートである。
【符号の説明】
1,30 オーディオ信号符号化装置、2 サブバンド分割部、4 スケーリング部、6 ビット割当部、8 量子化部、10 フォーマット部、12 パワー算出部、14 ビット割当決定部、16 聴感的ノイズ算出部、18 聴感的ノイズ最大サブバンド検出部、20 ビット割当更新部、22 終了判定部、S1〜S31 ステップ。
Claims (8)
- ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの2乗和をS、量子化誤差をN、0<k<1となる定数をkとすると、前記評価量算出手段は、前記評価量を式F=(S+N)k−Skによって算出される数値Fに応じて求める、オーディオ信号符号化装置。 - ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの2乗和をS、量子化誤差をN、0<k<1となる定数をkとすると、前記評価量算出手段は、前記評価量を式F=N×S(k-1)によって算出される数値Fに応じて求める、オーディオ信号符号化装置。 - ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行な う量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの2乗和をS、量子化誤差をN、シグナル・ノイズ比をSNR、0<k<1となる定数をkとすると、前記評価量算出手段は、前記評価量を式F=(1/SNR)×Skによって算出される数値Fに応じて求める、オーディオ信号符号化装置。 - ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの2乗和をS、量子化誤差をN、0<k<1となる定数をkとすると、前記評価量算出手段は、前記評価量を式F=logN+(k−1)×logSによって算出される数値Fに応じて求める、オーディオ信号符号化装置。 - ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの2乗和をS、量子化誤差をN、シグナル・ノイズ比をSNR、0<k<1となる定数をkとすると、前記評価量算出手段は、前記評価量を式F=−log(SNR)+k×logSによって算出される数値Fに応じて求める、オーディオ信号符号化装置。 - ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの2乗和をS、量子化誤差をN、0<k<1となる定数をkとすると、前記評価量算出手段は、前記評価量を式F=log(S+N)−logSによって算出される数値Fに応じて求める、オーディオ信号符号化装置。 - ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波 数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの2乗和をS、スケールファクタの2乗をSc、シグナル・ノイズ比をSNR、0<k<1となる定数をkとすると、前記評価量算出手段は、前記評価量を式F=log(S+Sc/SNR)−logSによって算出される数値Fに応じて求める、オーディオ信号符号化装置。 - 前記評価量算出手段は、前記周波数帯域の臨界帯域幅にさらに応じて前記評価量を各前記周波数帯域ごとに求める、請求項1〜7のいずれか1項に記載のオーディオ信号符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27248599A JP3643735B2 (ja) | 1999-09-27 | 1999-09-27 | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27248599A JP3643735B2 (ja) | 1999-09-27 | 1999-09-27 | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001092499A JP2001092499A (ja) | 2001-04-06 |
JP3643735B2 true JP3643735B2 (ja) | 2005-04-27 |
Family
ID=17514589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27248599A Expired - Fee Related JP3643735B2 (ja) | 1999-09-27 | 1999-09-27 | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3643735B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
JP5775006B2 (ja) * | 2012-01-23 | 2015-09-09 | ルネサスエレクトロニクス株式会社 | 情報処理装置、情報処理方法及び半導体装置 |
-
1999
- 1999-09-27 JP JP27248599A patent/JP3643735B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001092499A (ja) | 2001-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8615391B2 (en) | Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same | |
US8612215B2 (en) | Method and apparatus to extract important frequency component of audio signal and method and apparatus to encode and/or decode audio signal using the same | |
CN101305423B (zh) | 自适应的基于时间/频率的音频编码和解码设备和方法 | |
CN101965612B (zh) | 用于处理音频信号的方法和装置 | |
US7181404B2 (en) | Method and apparatus for audio compression | |
WO2013027630A1 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
JP2009515212A (ja) | オーディオ圧縮 | |
US7650278B2 (en) | Digital signal encoding method and apparatus using plural lookup tables | |
JP2005338850A (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
US6772111B2 (en) | Digital audio coding apparatus, method and computer readable medium | |
CN105679325B (zh) | 解码设备以及解码方法 | |
CN114550732B (zh) | 一种高频音频信号的编解码方法和相关装置 | |
US20020169601A1 (en) | Encoding device, decoding device, and broadcast system | |
JP3643735B2 (ja) | オーディオ信号符号化装置およびオーディオ信号符号化方法 | |
JP4281131B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
RU2409874C9 (ru) | Сжатие звуковых сигналов | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
JP4573670B2 (ja) | 符号化装置、符号化方法、復号化装置及び復号化方法 | |
JP3504485B2 (ja) | 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体 | |
Liu | The perceptual impact of different quantization schemes in G. 719 | |
JP2002189500A (ja) | オーディオ信号符号化方法及びオーディオ信号符号化装置及びオーディオ信号符号化プログラムが記録された記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050131 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090204 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |