JP3643735B2

JP3643735B2 - オーディオ信号符号化装置およびオーディオ信号符号化方法

Info

Publication number: JP3643735B2
Application number: JP27248599A
Authority: JP
Inventors: 康治田中
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1999-09-27
Filing date: 1999-09-27
Publication date: 2005-04-27
Anticipated expiration: 2019-09-27
Also published as: JP2001092499A

Description

【０００１】
【発明の属する技術分野】
本発明は、オーディオ信号を符号化する装置に関する。
【０００２】
【従来の技術】
従来から、オーディオ信号を符号化する技術として、オーディオ信号をいくつかのサブバンドと呼ばれる帯域に分割して符号化するサブバンド符号化や、周波数変換等の変換を行って符号化する変換符号化の手法が知られている。
【０００３】
サブバンド符号化で用いられる帯域分割手法としては、ＱＭＦバンク（Quadrature Mirror Filter）などを用いる手法がある。
【０００４】
また、変換符号化で用いられる変換手法としては、ＦＦＴ（Fast Fourier Transform）、ＤＣＴ（Discrete Cosine Transform）ＭＤＣＴ（Modified Discrete Cosine Transform）などが知られている.
また、近年、聴覚マスキングなどの聴覚的性質を利用して圧縮率を高める符号化の手法が用いられることが一般的になってきている。
【０００５】
聴覚マスキングとは、ある音が存在する場合、その音の周辺の周波数や時間的前後において、他の音が知覚できなくなったり、本来より小さく聞こえる現象である。周辺の周波数に対して働く現象を同時マスキングといい、時間的に働く現象を継時マスキングという。また、静寂時においても、音の大きさがある値以下になる知覚できなくなり、その音の大きさは周波数に依存している。これを最小可聴値といい、一種の聴覚マスキングと捉えることができる。
【０００６】
符号化においては、この聴覚マスキングを利用して情報圧縮が行われる。例えば、オーディオ信号をいくつかの帯域に分割し、それぞれの帯域に異なる長のビットを割り当てる。
【０００７】
その際、聴覚マスキングにより聞こえない帯域にはビットを割り当てなくする。あるいは、強いマスキングがかかり聴覚的に感知されにくい帯域には少ないビット量を割り当て、マスキングが弱く聴覚的に感知されやすい帯域には多くのビット量を割り当てる。このような方法をとれば、少ないビット量でも聴覚的な音質の劣化を少なくできる.
これらの技術を用いた符号化方式としては、ＭＰＥＧ１−Ａｕｄｉｏ（lSO/IEC11172-3）などがある。そして、こうした符号化方式に基づいて符号化・復号化を行う装置が既に存在している。
【０００８】
以下、従来の一般的なオーディオ信号符号化装置の説明のため、MPEG1-Audioに基づいた符号化装置のハードウェア構成、処理手続き、その中でも特に聴覚マスキングを用いたビット割当方法について説明する。
【０００９】
図７は、従来のオーディオ信号符号化装置１０１の構成を示すブロック図である。
【００１０】
図７を参照して、オーディオ信号符号化装置１０１は、ディジタル化されたオーディオ信号の時系列データを受けサブバンド分割を行うサブバンド分割部１０２と、サブバンド分割部から出力されるサブバンドデータを受け、スケーリング処理を行なうスケーリング部１０４と、時系列のオーディオデータを処理して各サブバンドのビット割当量を求めるビット割当部１０６と、スケーリング部１０４から出力されるサブバンドデータおよびスケール情報をビット割当部１０６で求めた割当てに従い量子化を行う量子化部１０８と、量子化部の出力を受けてＭＰＥＧフォーマットのデータに変換するフォーマット変換部１１０とを含む。
【００１１】
図８は、図７に示したオーディオ信号符号化装置１０１が行なう処理の大きな流れを示すフローチャートである。
【００１２】
図７、図８を参照して、オーディオ信号符号化装置１０１で符号化処理が開始される（ステップＳ１０１）。オーディオ信号符号化装置１０１は、ＭＰＥＧデータとしてフレームという単位でデータを出力する。オーディオ信号符号化装置１０１に入力されるデータは、ディジタル化されたオーディオ信号の時系列データである。オーディオ信号符号化装置１０１は、１フレーム分のデータが入力されると（ステップＳ１０２）、ＭＰＥＧデータの１フレーム分の符号化処理を行う（ステップＳ１０３）。
【００１３】
図９は、オーディオ信号符号化装置１０１に入力されるデータを説明するための図である。
【００１４】
図９を参照して、この時系列データは、ディジタル化されたオーディオデータである。サンプリングは、たとえば４４．１ｋＨｚで行われており、データＤ０、Ｄ１、Ｄ２、Ｄ３…が入力される。
【００１５】
図１０は、図７におけるサブバンド分割部１０２が時系列データから生成するサブバンドデータを説明するための図である。
【００１６】
図１０を参照して、図９にしめした時系列データは、オーディオ信号の所定の帯域を３２帯域に分割したサブバンドｓｂ０〜ｓｂ３１に分割される。サブバンド分割された後、各サブバンドにおいて帯域通過信号成分は１／３２に間引き処理されサンプルＳＳ０〜ＳＳ３５が生成される。
【００１７】
図１１は、時系列データからサブバンドデータを生成する説明のための図である。
【００１８】
図１１を参照して、Ｄ０〜Ｄ１６３１は、時系列データである。時系列データの最初の５１２サンプルであるデータＤ０〜Ｄ５１１から図１０に示したサンプルＳＳ０が生成される。
【００１９】
次いで、３２サンプル後ろにシフトしたデータＤ３２〜Ｄ５４３から次の図１０に示したサンプルＳＳ１が生成される。
【００２０】
以降、３２サンプルずつ後ろにシフトしながら時系列データの５１２サンプルからサブバンドデータの１サンプルが生成され、１フレームあたり合計でＳＳ０〜ＳＳ３５の３６サンプルが生成される。
【００２１】
１フレーム分のサブバンドデータを作るためにはＤ０〜Ｄ１６３１の１６３２サンプルが必要である。しかし、次のフレームのサブバンドデータを作るために最後の４８０サンプルは重複して使用されるため、割合的には１１５２サンプルの時系列データから１フレーム分のサブバンドデータが生成されることになる。サブバンドデータの１サンプルは３２個のサブバンドのデータを含んでいるので、サブバンドデータには、３２×３６つまり、１１５２のデータを含んでおり、サブバンド分割の前後ではデータ数は変わっていない。
【００２２】
このサブバンドデータは、図７におけるスケーリング部でスケーリングという正規化処理をされた後、量子化部１０８で量子化される。
【００２３】
図１２は、量子化の説明をするための概念図である。
図７、図１２を参照して、スケーリング部１０４では、サブバンド毎に含まれるデータがすべて−１〜＋１の間になるようにスケール情報が決定され、サブバンドデータのスケーリングが行われる。
【００２４】
スケーリング時には量子化されるデータは、波形と倍率に分離される。波形は、最大振幅が±１に収まるように正規化される。この正規化時の倍率に応じた値をスケールファクタという。つまり、スケールファクタとは、量子化データがとりうる範囲を示す値である。上述のスケール情報には、このスケールファクタが含まれている。
【００２５】
ここで、たとえば、ｎ番めのサブバンドｓｂ（ｎ）のサンプルＳＳ１がスケーリング後に0.70であったとする。ビット割り当て部１０６は、サブバンドｓｂ（ｎ）の量子化ビットの割当量を３ビットに決定したとする。
【００２６】
割当量が３ビットの場合は、０００〜１１０が使用される仕様であるとする。このとき、スケーリング後のデータ−１〜＋１が０００〜１１０に量子化される。サンプルＳＳ１は、量子化部１０８によって１０１に量子化されることになる。
【００２７】
量子化前のデータと量子化後のデータの差の２乗を量子化誤差あるいは物理的誤差Ｎとよぶ。この量子化誤差Ｎは、ビット割り当て部１０６が各サブバンドにビットを割り当てるのに関係がある。
【００２８】
図１３は、ＭＰＥＧの１フレームのデータを説明するための図である。
図１３を参照して、ＭＰＥＧのデータは、先頭からヘッダ、ＣＲＣ、ビットアロケーション、スケール情報、サンプルデータ、アンシラリデータ（Ancillary Data）の順で図７に示したフォーマット変換部１１０から出力される。
【００２９】
ヘッダには、同期ワードやサンプリング周波数、プロテクション等の情報が含まれている。ＣＲＣは、エラーチェックするための情報である。
【００３０】
続くビットアロケーション、スケール情報、サンプルデータは、時系列に入力されたオーディオデータが変換された情報である。ビットアロケーションには、３２の各サブバンドにいくつのビットが割り当てられるかのビット情報が入っている。スケール情報には、各サブバンドの信号がスケーリングされた際のスケールファクタ等が含まれている。サンプルデータにはアロケーションビットにしたがって正規化後に量子化された情報が含まれている。
【００３１】
図１４は、図７に示したビット割当部１０６の構成を示すブロック図である。
図１４を参照して、ビット割当部１０６は、オーディオ信号の時系列データを受け、ＦＦＴなどにより周波数軸上の周波数データＳに変換する周波数分析部１１２と、周波数分析部１１２の出力を受けて周波数帯域ごとのマスキング量Ｍを算出するマスキング算出部１１４と、周波数データＳとマスキング算出部１１４によって求められたマスキング量Ｍとを受けて各サブバンドごとにＳＭＲ（シグナル・マスキング比）を算出するＳＭＲ算出部１１６と、ＳＭＲ算出部１１６の出力を受けて各サブバンドの量子化ビットの割当量を決定して出力するビット割当決定部１１８とを含む。
【００３２】
ここで、マスキング量Ｍとは、そのサブバンドの周波数における先に説明した聴覚マスキングの大きさである。
【００３３】
周波数分析部１１２では、図７に示したサブバンド分割部１０２において生じるフィルタ遅延などを考慮したタイミングで周波数分析が行なわれている。
【００３４】
ビット割当決定部１１８は、サブバンドごとにマスキング量Ｍと図１２で説明した量子化誤差Ｎとの比を算出するＭＮＲ算出部１２０と、ＭＮＲ算出部１２０によって求められた各サブバンドのＭＮＲ（マスキング・ノイズ比）が最小であるサブバンドを検出するＭＮＲ最小サブバンド検出部１２４と、ＭＮＲ最小サブバンド検出部１２４の出力を受けて各サブバンドに割当てられるビットを更新するビット割当更新部１２６と、ビット割当処理の終了を判定しビット割当量を図７の量子化部１０８に対して出力する終了判定部１２８とを含む。
【００３５】
ＭＮＲは、おおまかにいえば、ある音を聴いたときに人間がノイズとして認識する量の逆数を表わしており、各サブバンドのＭＮＲの総和を最大とすることが、最適な量子化ビットを各サブバンドに割当てる方法の一つといえる。
【００３６】
ビット割当更新部１２６は、ＭＮＲが最小となるサブバンドにビット割当が可能であれば量子化ビットをさらに割当てる。終了判定部１２８は、ビット割当可能なサブバンドがなくなった場合に、ビット割当処理を終了してその時点のビット割当量を出力する。ビット割当可能なサブバンドがまだ存在する場合には、ＭＮＲ算出部１２０にビット割当処理を再度実行するように指示する。そして、再び、ＭＮＲ最小サブバンド検出部１２４とビット割当更新部１２６とによるビット割当処理が行なわれる。
【００３７】
図１５は、図７に示したビット割当部１０６の処理フローを示すフローチャートである。
【００３８】
図１５を参照して、従来のビット割当処理がスタートする（ステップＳ１２２）と、ＦＦＴなどによりオーディオ信号が周波数軸上のデータに変換される（ステップＳ１２３）。その際には、サブバンド分割で生じるフィルタ遅延などを考慮したタイミングで処理が行なわれ、サブバンド分割処理に実際に使用されているデータを用いて周波数分析が行なわれる。
【００３９】
次に、周波数分析したデータを用いてマスキング量の周波数分布を算出する（ステップＳ１２４）。基本的な方法としては、ある周波数成分が存在するときに他の周波数成分がマスキングされる大きさをプロットしたマスキングパターンを用いる。このマスキングパターンをステップＳ１２３で分析された周波数データに畳み込む演算を行なって求める。
【００４０】
他には、精度や計算効率を高めるために、臨界帯域幅などの聴覚的性質に合った周波数軸上に変換して行なう処理や、同様の聴覚的性質を考慮して周波数分解能を変える処理や、純音か広帯域音かに応じてマスキングパターンを変える処理や、音の大きさによってマスキングパターンを変える処理などが行なわれる。
【００４１】
ステップＳ１２３で行なわれる周波数分析やステップＳ１２４で行なわれるマスキング算出で使用されるＦＦＴや畳み込みなどの処理は、一般にある程度高い分解能で行なう必要があるため、処理量が多くなってしまう。
【００４２】
続いて、ＳＭＲ算出処理が行なわれる（ステップＳ１２５）。ＳＭＲ算出処理では、各サブバンドに対しＳＭＲ（シグナル・マスキング比）を算出する。算出にはシグナルとして周波数分析したデータ、または、図７のスケーリング部１０４で算出されたスケールファクタを用い、マスキング量としてはステップＳ１２４で算出したマスキング量を用いる。
【００４３】
続いて、初期設定が行なわれる（ステップＳ１２６）。初期設定では、各サブバンドに対し用意された変数である「ビット割当量」、「割当状態」の初期設定を行なう。「ビット割当量」は、そのサブバンドに割当てられたビット量に対応する符号を保存しており、最初はすべてのサブバンドに対しビット量０が設定される。「割当状態」は、そのサブバンドにさらにビットが割当可能かどうかを示すフラグであり、最初はすべて可能状態に設定される。
【００４４】
続いて、ＭＮＲ算出が行なわれる（ステップＳ１２７）。ＭＮＲ算出処理においては、「割当状態」が割当可能である各サブバンドに対しＭＮＲ（マスキング・ノイズ比）を算出する。この算出には、ステップＳ１２５で求めたＳＭＲとＳＮＲ（シグナル・ノイズ比）を用いて行なわれる。両者の単位がデシベル（ｄＢ）であれば、ＭＮＲ＝ＳＮＲ−ＳＭＲとなる。
【００４５】
ここで、ＳＮＲは量子化誤差と信号との比であり、量子化を行なうビット数に依存する。したがって、「ビット割当量」に依存する定数的なテーブルとして予め用意されている。
【００４６】
続いて、「割当状態」が割当可能であるサブバンドの中から、ＭＮＲが最小であるサブバンドを選び出す（ステップＳ１２８）。つまり、この選び出されたサブバンドは、新たに追加してビット割当を行なうと、聴感ノイズが減少するのにもっとも効果的と期待されるサブバンドである。
【００４７】
次に、選び出されたサブバンドに対し、さらにビット割当が可能かどうかを判断する（ステップＳ１２９）。ここで、割当不可能な場合とは、新たにビットを割当てたときに、図１３に示した１フレームに含むことができるビット量を超える場合、または、各サブバンドに許容されている最大ビット数を超える場合である。
【００４８】
ビット割当が可能であった場合には、ビット割当更新の処理を行なう（ステップＳ１３０）。ここでは、選択されたサブバンドに対し可能な最小のビット量を新たに付加し、そのサブバンドの「ビット割当量」を更新する。
【００４９】
ビット割当が不可能であった場合には、そのサブバンドの「割当状態」を不可能状態に設定する（ステップＳ１３１）。
【００５０】
続いて、すべてのサブバンドの「割当状態」が不可能であるかどうかが判断される（ステップＳ１３２）。不可能である場合には、ステップＳ１３３に進みビット割当処理が終了する。
【００５１】
「割当状態」が不可能でないサブバンドが存在する場合には、ステップＳ１２７に戻り、ＭＮＲ算出処理を繰返す。
【００５２】
このようにして、ＭＮＲを逐次計算しながら、現時点でＭＮＲ最小のサブバンドに順にビットを割当てていくことを繰返す。結果として、１フレームで使用できるビット量の範囲内で、全体のＭＮＲを最大にするようにビットが割当てられる。つまり、最も聴感ノイズが少なくなるように最適なビット割当がなされる。
【００５３】
【発明が解決しようとする課題】
以上説明したような従来のオーディオ信号符号化装置では、聴覚マスキング等の性質を用いて聴感上必要な部分に多くのビットを割当てる。このようにして聴感上の音質を劣化させることなく高能率の情報圧縮を行なっている。
【００５４】
しかし、聴感マスキング量の算出には、高分解能の周波数分析やマスキングパターンの畳み込み演算等が用いられる。これらの演算には多くの処理量が必要とされる。その場合には、低コストのハードウェア上で高速な処理を実現することが難しい。
【００５５】
また、その処理を簡略化することで処理量を削減することも可能であるが、一般によい音質が得られない。
【００５６】
本発明は、このような問題点を解決するためのものであり、新たな評価手法によって簡易な処理で聴感特性に合ったビット割当を可能にする。その結果、低処理量で音質の良い音響信号の圧縮を可能にするものである。
【００５７】
【課題を解決するための手段】
請求項１に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの２乗和をＳ、量子化誤差をＮ、０＜ｋ＜１となる定数をｋとすると、評価量算出手段は、評価量を式Ｆ＝（Ｓ＋Ｎ） ^k −Ｓ ^k によって算出される数値Ｆに応じて求める。
【００６１】
請求項２に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの２乗和をＳ、量子化誤差をＮ、０＜ｋ＜１となる定数をｋとすると、評価量算出手段は、評価量を式Ｆ＝Ｎ×Ｓ^(k-1)によって算出される数値Ｆに応じて求める。
【００６２】
請求項３に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの２乗和をＳ、量子化誤差をＮ、シグナル・ノイズ比をＳＮＲ、０＜ｋ＜１となる定数をｋとすると、評価量算出手段は、評価量を式Ｆ＝（１／ＳＮＲ）×Ｓ^kによって算出される数値Ｆに応じて求める。
【００６３】
請求項４に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの２乗和をＳ、量子化誤差をＮ、０＜ｋ＜１となる定数をｋとすると、評価量算出手段は、評価量を式Ｆ＝ｌｏｇＮ＋（ｋ−１）×ｌｏｇＳによって算出される数値Ｆに応じて求める。
【００６４】
請求項５に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの２乗和をＳ、量子化誤差をＮ、シグナル・ノイズ比をＳＮＲ、０＜ｋ＜１となる定数をｋとすると、評価量算出手段は、評価量を式Ｆ＝ｌｏｇ（ＳＮＲ）＋ｋ×ｌｏｇＳによって算出される数値Ｆに応じて求める。
【００６５】
請求項６に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの２乗和をＳ、量子化誤差をＮ、０＜ｋ＜１となる定数をｋとすると、評価量算出手段は、評価量を式Ｆ＝ｌｏｇ（Ｓ＋Ｎ）−ｌｏｇＳによって算出される数値Ｆに応じて求める。
【００６６】
請求項７に記載のオーディオ信号符号化装置は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力する分割手段と、所定の時間間隔ごとに信号成分の大きさに応じて、各周波数帯域に量子化ビットの割当てを行なうビット割当手段と、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なう量子化手段とを備える。ビット割当手段は、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさに応じた評価量を各周波数帯域ごとに求める評価量算出手段と、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出する検出手段と、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力する判定手段とを含む。各周波数帯域の信号成分の大きさの２乗和をＳ、スケールファクタの２乗をＳｃ、シグナル・ノイズ比をＳＮＲ、０＜ｋ＜１となる定数をｋとすると、評価量算出手段は、評価量を式Ｆ＝ｌｏｇ（Ｓ＋Ｓｃ／ＳＮＲ）−ｌｏｇＳによって算出される数値Ｆに応じて求める。
【００６７】
請求項８に記載のオーディオ信号符号化装置は、請求項１〜７のいずれか１項に記載のオーディオ信号符号化装置の構成において、評価量算出手段は、周波数帯域の臨界帯域幅にさらに応じて評価量を各周波数帯域ごとに求める。
【００６８】
請求項１０に記載のオーディオ信号符号化方法は、ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各周波数帯域ごとに信号成分を出力するステップと、所定の時間間隔ごとに信号成分の大きさおよび周波数帯域の臨界帯域幅に応じて、各周波数帯域に量子化ビットの割当てを行なうステップと、ビット割当手段が割当てた量子化ビットに応じて信号成分の量子化を行なうステップとを備える。量子化ビットの割当てを行なうステップは、暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の信号成分の量子化誤差と信号成分の大きさと周波数帯域の臨界帯域幅とに応じた評価量を各周波数帯域ごとに求めるステップと、評価量算出手段の出力を受けて、複数の周波数帯域のうち評価量が最大となる最大周波数帯域を検出するステップと、最大周波数帯域に対する暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるステップと、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、評価量算出手段に再度評価量を算出させビット割当処理の開始を指示し、複数の周波数帯域のうち、暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして暫定量子化ビットを出力するステップとを含む。
【００７０】
【発明の実施の形態】
以下において、本発明の実施の形態について図面を参照して詳しく説明する。なお、図中同一符号は同一または相当部分を示す。
【００７１】
［実施の形態１］
図１は、本発明の実施の形態１のオーディオ信号符号化装置１の構成を示すブロック図である。
【００７２】
図１を参照して、オーディオ信号符号化装置１は、ディジタル化された時系列のオーディオデータを受けサブバンド分割を行なうサブバンド分割部２と、サブバンド分割部から出力されるサブバンドデータを受け、スケーリング処理を行なうスケーリング部４と、サブバンド分割部２から出力されるサブバンドデータとスケーリング部４から出力されるスケール情報とに基づいて各サブバンドのビット割当量を求めるビット割当部６と、スケーリング部４から出力されるサブバンドデータおよびスケール情報をビット割当部６で求めたビット割当に従い量子化を行なう量子化部８と、量子化部８の出力を受けてＭＰＥＧフォーマットのデータに変換するフォーマット変換部１０とを含む。
【００７３】
オーディオ信号符号化装置１においては、ビット割当部６がサブバンドデータとスケール情報とに基づきビット割当を行なう点が図７に示した従来のオーディオ信号符号化装置１０１と異なっている。
【００７４】
図２は、図１におけるビット割当部６の構成を示すブロック図である。
図２を参照して、ビット割当部６は、図１におけるサブバンド分割部２から出力されるサブバンドデータおよびスケーリング部４から出力されるスケール情報を受けてサブバンドごとに信号とスケール情報のパワー値を算出するパワー算出部１２と、パワー算出部１２の出力を受けてビット割当を決定するビット割当決定部１４とを含む。
【００７５】
パワー算出部１２では、具体的には、サブバンドごとにそのサブバンド内の各信号の２乗和を求め、その求めた値を各サブバンドのパワー値とする。ここで、各サブバンドの信号はサブバンド分割部２において求めたデータを使用するため、新たに必要となる処理量は少ない。
【００７６】
ビット割当決定部１４は、パワー算出部１２の出力を受けてサブバンドごとに後に説明する方法で聴感的ノイズを算出する聴感的ノイズ算出部１６と、聴感的ノイズ算出部１６によってサブバンドごとに求められた聴感的ノイズを受けて聴感的ノイズが最大となるサブバンドを検出する聴感的ノイズ最大サブバンド検出部１８と、聴感的ノイズ最大サブバンド検出部１８で求めたサブバンドにビットの割当てが可能な場合にビット割当をするビット割当更新部２０と、ビット割当更新部２０の出力に応じてビット割当処理を終了するかどうかの判定を行なう終了判定部２２とを含む。
【００７７】
聴感的ノイズ算出部１６では、従来の場合と異なり聴感的ノイズに対して新しい評価量が導入されている。この新評価量をＦとすると、Ｆは次式で算出される。
【００７８】
Ｆ＝β×（（Ｓ＋Ｓｃ／ＳＮＲ）^k−Ｓ^k） …（１）
ここで、ｋは定数、βは各サブバンドごとに決められた重み付け係数、Ｓはそのサブバンドの信号のパワー、Ｓｃはスケールファクタの２乗、ＳＮＲはシグナル・ノイズ比である。
【００７９】
ＳＮＲは、量子化誤差と信号との比であり、量子化を行なうビット数に依存する。したがって、ビット割当量に依存する定数的なテーブルとして予め用意されている。
【００８０】
ｋは、好ましくは０．２７にされる。βは次式で表わすことができる。
β＝（そのサブバンドの臨界帯域幅／４）^{(-(1-k)/3.15)} …（２）
臨界帯域幅とは、サブバンドの中心周波数に依存する帯域幅であって、臨界帯域幅より外では、２つの音のエネルギーは相互作用しなくなる。臨界帯域幅については、たとえば、「リンゼイノーマン著、情報処理心理学入門Ｉ、p175〜177」に説明されている。
【００８１】
このように評価量Ｆを定めると、評価量Ｆが大きいと聴感的ノイズが大きいことになる。したがって、サブバンドごとに求めたこの評価量Ｆの総和を小さくすることで、量子化ビットの割当ての最適化を図る。
【００８２】
聴感的ノイズ最大サブバンド検出部１８では、「割当状態」が割当可能であるサブバンドの中から、先に説明した新評価量Ｆが最大であるサブバンドを選び出す。ビット割当更新部２０では聴感的ノイズが最大となったサブバンドにビットの割当てが可能であればビットを割当てる。終了判定部２２は、ビット割当可能なサブバンドがなくなった場合にビット割当決定部の処理を終了し、その時点のビット割当量を出力する。ビット割当可能なサブバンドがまだ存在する場合には、聴感的ノイズ算出部１６に対して処理を繰返すように指示する。
【００８３】
尚、上述の評価量Ｆに代えて以下の評価量Ｆ１〜Ｆ６を用いても同様なビット割当が可能である。
【００８４】
Ｆ１＝β×Ｎ×Ｓ^(k-1) …（３）
Ｆ２＝β×（１／ＳＮＲ）×Ｓ^k …（４）
Ｆ３＝ｌｏｇβ＋ｌｏｇＮ＋（ｋ−１）×ｌｏｇＳ …（５）
Ｆ４＝ｌｏｇβ−ｌｏｇ（ＳＮＲ）＋ｋ×ｌｏｇＳ …（６）
Ｆ５＝β×（ｌｏｇ（Ｓ＋Ｎ）−ｌｏｇＳ） …（７）
Ｆ６＝β×（ｌｏｇ（Ｓ＋Ｓｃ／ＳＮＲ）−ｌｏｇＳ） …（８）
但し、０^x（ｘ＜０）、ｌｏｇ０といった計算が必要な場合は、適当な大きな定数で置き換えるものとする。
【００８５】
以上説明したように、実施の形態１のオーディオ信号符号化装置は、多くの処理量が必要な周波数分析や畳み込み演算を必要とする聴覚マスキング量を使用する代りに、サブバンドの信号のパワーとスケール情報から求められる新たな評価量に基づきビット割当をするため、少ない処理量で音質の良い音響信号の圧縮が可能になる。
【００８６】
［実施の形態２］
図３は、実施の形態２のオーディオ信号符号化装置３０の構成を示すブロック図である。
【００８７】
図３を参照して、オーディオ信号符号化装置３０は、オーディオ信号を受ける入力インターフェイス３２と、入力インターフェイス３２を通じて入力されたオーディオデータを一時的に蓄積する入力データバッファメモリ３４と、所定の符号化処理手続に従い入力データバッファメモリからオーディオ信号を読出して符号化するマイクロプロセッサ３６とを備える。
【００８８】
オーディオ信号符号化装置３０は、さらに、マイクロプロセッサ３６が行なう符号化処理手続が保存されているプログラム用メモリ４０とマイクロプロセッサ３６の符号化処理中に生じる一時的なデータを保存するためのワークメモリ３８と、マイクロプロセッサ３６から符号化後のデータを受けて蓄積する出力データバッファメモリ４２と、出力データバッファメモリ４２に蓄積されたデータを外部に対して出力する出力インタフェース４４とを含む。
【００８９】
マイクロプロセッサ３６と入力データバッファメモリ３４、出力データバッファメモリ４２、ワークメモリ３８およびプログラム用メモリ４０との間のデータ転送はデータバス４６を通じて行なわれる。
【００９０】
図４は、図３に示したオーディオ信号符号化装置３０で行なわれるオーディオ信号符号化処理の手続例を示すフローチャートである。
【００９１】
図４を参照して、このフローチャートは、連続したオーディオ信号を所定のサンプル数で区切った単位であるフレームごとに一括して符号化処理を行なう様子を示している。
【００９２】
符号化処理が開始されると（ステップＳ１）、まず図３における入力データバッファメモリ３４に１フレーム分のオーディオ信号が蓄積されるのを待つ（ステップＳ２）。
【００９３】
１フレーム分の入力があると、フレーム処理（ステップＳ３）が行なわれる。
フレーム処理の開始時には、入力データバッファメモリ３４から１フレーム分のオーディオ信号が読出され、終了時には、符号化された１フレーム分のデータが出力データバッファメモリ４２に書込まれる。
【００９４】
再び図３を参照して、外部から入力データバッファメモリ３４へのデータの入力は入力インターフェイス３２を通じて所定のタイミングで順次行なわれる。また出力データバッファメモリ４２から外部に対しての出力は出力インタフェース４４を通じて所定のタイミングで順次行なわれる。
【００９５】
図４におけるステップＳ３で示したフレーム処理は、外部とのデータ入出力に十分間に合う時間内で実行される。入力データバッファメモリ３４および出力データバッファメモリ４２の記憶容量は、外部やマイクロプロセッサ３６とのやり取りに支障がないように、十分な大きさが確保されている。たとえば、２フレーム分のデータサイズを確保し、循環的なバッファメモリとして使用することで処理に支障がないようにすることかできる。
【００９６】
図５は、図４に示したフレーム処理のステップＳ３の詳細を説明するためのフローチャートである。
【００９７】
図５を参照して、まず入力データバッファメモリ３４から１フレーム分のオーディオ信号を取得する（ステップＳ１１）。たとえば、ワークメモリ３８の一部に保存用の領域を設けその領域にオーディオ信号のデータを保存する（ステップＳ１２）。その後サブバンド分割が行なわれる（ステップＳ１３）。サブバンド分割では、所定のフィルタバンクを用いてオーディオ信号を３２の帯域、すなわちサブバンドに分割し、その後各帯域通過信号を３２分の１に間引き処理する。
【００９８】
スケーリングでは、そのサブバンド内に属するすべての信号の絶対値の最大値をサブバンドごとに求める。そして、予め用意された所定の数値群の中から、このサブバンドごとに求めた最大値より大きな値を抽出する。そしてこの抽出された値のうちから最小値を選ぶ。この値を、サブバンドのスケールファクタと呼ぶ。
【００９９】
さらに、サブバンド内の各信号をスケールファクタで正規化する。このとき、各信号の絶対値はすべて１以下となる。さらに、方式によっては連続するスケールファクタの相関を利用してスケールファクタの情報圧縮を行なう。その場合には、情報圧縮状態を示す付加情報が加えられる。
【０１００】
続いてビット割当では、各サブバンドに割当てるビット量を決める（ステップＳ１５）。この決め方の詳細については後に説明する。
【０１０１】
次に、各サブバンドへのビット割当に応じ、スケールファクタで正規化された信号を量子化する（ステップＳ１６）。そして、ＭＰＥＧフォーマットに変換される（ステップＳ１７）。
【０１０２】
１フレーム分の出力データが生成されると、そのデータを図３の出力データバッファメモリ４２に書込み（ステップＳ１８）、フレーム処理を終了する（ステップＳ１９）。
【０１０３】
図６は、図５におけるビット割当を行なうステップＳ１５の詳細を示すフローチャートである。
【０１０４】
図６を参照して、ビット割当が開始されると（ステップＳ２２）、サブバンドごとの信号のパワーを算出する（ステップＳ２３）。具体的には、サブバンドごとにそのサブバンド内の各信号の２乗和を求め、その求めた値を各サブバンドのパワーとする。各サブバンドの信号は、図５のステップＳ１３において求めた信号を用いることができるので、パワー算出のために必要となる処理量は少ない。
【０１０５】
次に、各サブバンドに対して用意された変数である「ビット割当量」、「割当状態」の初期設定を行なう。「ビット割当量」は、そのサブバンドに割当てられた量子化ビット量に対応する符号を保存している。「ビット割当量」は、最初はすべてのサブバンドに対してビット量０が設定される。「割当状態」は、そのサブバンドにさらにビットが割当て可能かどうかを示すフラグであり、最初はすべてビット割当が可能であるという状態に設定される。
【０１０６】
次に、「割当状態」が割当て可能である各サブバンドに対し本発明で導入する新たな評価量を算出する（ステップＳ２５）。この評価量をＦとすると、Ｆは実施の形態１で示した式（１）で算出することができる。また、評価量Ｆに代えて実施の形態１で示した式（３）〜（８）で表わされる評価量Ｆ１〜Ｆ６を用いてもよい。
【０１０７】
次に、この評価量が最大となるサブバンドの検出が行なわれる（ステップＳ２６）。ステップＳ２６では、「割当状態」が割当て可能であるサブバンドの中から、評価量Ｆが最大であるサブバンドを選び出す。
【０１０８】
次に、選び出されたサブバンドに対し、さらにビット割当が可能かどうかを判断する（ステップＳ２７）。割当て不可能な場合とは、新たにビットを割当てたときに１フレームで使用することができるビット量を超えてしまった場合、または各サブバンドに許容されている最大ビット数を超えてしまう場合である。
【０１０９】
ビット割当が可能であった場合には、そのサブバンドに対しビット量を新たに付加し、ビット割当量を更新する（ステップＳ２８）。
【０１１０】
ビット割当が不可能であった場合には、そのサブバンドの割当て状態を不可能状態に設定する（ステップＳ２９）。
【０１１１】
次に、すべてのサブバンドの「割当状態」が不可能であるかどうかを判断する（ステップＳ３０）。不可能である場合には、ビット割当の処理を終了する（ステップＳ３１）。
【０１１２】
「割当状態」が可能な場合には、ステップＳ２５の評価量算出を再び行なう。
このようにして、評価量Ｆを逐次計算しながら、各時点で新評価量が最大となるサブバンドに順にビットを割当てていくことを繰返す。結果として、１フレームで使用することができるビット量の範囲内で、全体の評価量Ｆの和を最小にするようにビットが割当てられる。
【０１１３】
以上説明したように、実施の形態２に示したオーディオ信号符号化装置では、マイクロプロセッサを用いた場合に、簡易な処理で聴感特性に合ったビット割当を可能にし、音質の良い音響信号の圧縮を少ない処理量で行なうことが可能になる。
【０１１４】
実施の形態１、２では、信号の大きさを表わす量Ｓとして、各サブバンド内の信号の２乗和すなわちパワーを用いた。しかし、代りにＳとして信号の絶対値和、各サブバンドの信号中の最大値（スケールファクタ）、連続する数個の信号の２乗和の最大値などを用いても新評価量を算出することができる。
【０１１５】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【０１１６】
【発明の効果】
本発明によれば、新たな評価量を導入し、簡易な処理で聴感特性にあったビット割当を可能にするため、少ない処理量で音質の劣化が少ない音響信号の圧縮が可能になる。
【図面の簡単な説明】
【図１】本発明の実施の形態１のオーディオ信号符号化装置１の構成を示すブロック図である。
【図２】図１におけるビット割当部６の構成を示すブロック図である。
【図３】実施の形態２のオーディオ信号符号化装置３０の構成を示すブロック図である。
【図４】図３に示したオーディオ信号符号化装置３０で行なわれるオーディオ信号符号化処理の手続例を示すフローチャートである。
【図５】図４に示したフレーム処理のステップＳ３の詳細を説明するためのフローチャートである。
【図６】図５におけるビット割当を行なうステップＳ１５の詳細を示すフローチャートである。
【図７】従来のオーディオ信号符号化装置１０１の構成を示すブロック図である。
【図８】図７に示したオーディオ信号符号化装置１０１が行なう処理の大きな流れを示すフローチャートである。
【図９】オーディオ信号符号化装置１０１に入力されるデータを説明するための図である。
【図１０】図７におけるサブバンド分割部１０２が時系列データから生成するサブバンドデータを説明するための図である。
【図１１】時系列データからサブバンドデータを生成する説明のための図である。
【図１２】量子化の説明をするための概念図である。
【図１３】ＭＰＥＧの１フレームのデータを説明するための図である。
【図１４】図７に示したビット割当部１０６の構成を示すブロック図である。
【図１５】図７に示したビット割当部１０６の処理フローを示すフローチャートである。
【符号の説明】
１，３０オーディオ信号符号化装置、２サブバンド分割部、４スケーリング部、６ビット割当部、８量子化部、１０フォーマット部、１２パワー算出部、１４ビット割当決定部、１６聴感的ノイズ算出部、１８聴感的ノイズ最大サブバンド検出部、２０ビット割当更新部、２２終了判定部、Ｓ１〜Ｓ３１ステップ。

Claims

ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの２乗和をＳ、量子化誤差をＮ、０＜ｋ＜１となる定数をｋとすると、前記評価量算出手段は、前記評価量を式Ｆ＝（Ｓ＋Ｎ）^k−Ｓ^kによって算出される数値Ｆに応じて求める、オーディオ信号符号化装置。
ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの２乗和をＳ、量子化誤差をＮ、０＜ｋ＜１となる定数をｋとすると、前記評価量算出手段は、前記評価量を式Ｆ＝Ｎ×Ｓ^(k-1)によって算出される数値Ｆに応じて求める、オーディオ信号符号化装置。
ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの２乗和をＳ、量子化誤差をＮ、シグナル・ノイズ比をＳＮＲ、０＜ｋ＜１となる定数をｋとすると、前記評価量算出手段は、前記評価量を式Ｆ＝（１／ＳＮＲ）×Ｓ^kによって算出される数値Ｆに応じて求める、オーディオ信号符号化装置。
ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの２乗和をＳ、量子化誤差をＮ、０＜ｋ＜１となる定数をｋとすると、前記評価量算出手段は、前記評価量を式Ｆ＝ｌｏｇＮ＋（ｋ−１）×ｌｏｇＳによって算出される数値Ｆに応じて求める、オーディオ信号符号化装置。
ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの２乗和をＳ、量子化誤差をＮ、シグナル・ノイズ比をＳＮＲ、０＜ｋ＜１となる定数をｋとすると、前記評価量算出手段は、前記評価量を式Ｆ＝−ｌｏｇ（ＳＮＲ）＋ｋ×ｌｏｇＳによって算出される数値Ｆに応じて求める、オーディオ信号符号化装置。
ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの２乗和をＳ、量子化誤差をＮ、０＜ｋ＜１となる定数をｋとすると、前記評価量算出手段は、前記評価量を式Ｆ＝ｌｏｇ（Ｓ＋Ｎ）−ｌｏｇＳによって算出される数値Ｆに応じて求める、オーディオ信号符号化装置。
ディジタル化されたオーディオ信号を受けて複数の周波数帯域に分割し、各前記周波数帯域ごとに信号成分を出力する分割手段と、
所定の時間間隔ごとに前記信号成分の大きさに応じて、各前記周波数帯域に量子化ビットの割当てを行なうビット割当手段と、
前記ビット割当手段が割当てた前記量子化ビットに応じて前記信号成分の量子化を行なう量子化手段とを備え、
前記ビット割当手段は、
暫定的に割当てられた暫定量子化ビットによって量子化を行なった際の前記信号成分の量子化誤差と前記信号成分の大きさに応じた評価量を各前記周波数帯域ごとに求める評価量算出手段と、
前記評価量算出手段の出力を受けて、前記複数の周波数帯域のうち前記評価量が最大となる最大周波数帯域を検出する検出手段と、
前記最大周波数帯域に対する前記暫定量子化ビットの割当てをさらに増加することが可能なときは増加させるビット割当更新手段と、
前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域が有るときは、前記評価量算出手段に再度前記評価量を算出させビット割当処理の開始を指示し、前記複数の周波数帯域のうち、前記暫定量子化ビットの割当てをさらに増加できる周波数帯域がないときは、前記複数の周波数帯域に対してそれぞれ割当てる量子化ビットとして前記暫定量子化ビットを出力する判定手段とを含み、
各前記周波数帯域の前記信号成分の大きさの２乗和をＳ、スケールファクタの２乗をＳｃ、シグナル・ノイズ比をＳＮＲ、０＜ｋ＜１となる定数をｋとすると、前記評価量算出手段は、前記評価量を式Ｆ＝ｌｏｇ（Ｓ＋Ｓｃ／ＳＮＲ）−ｌｏｇＳによって算出される数値Ｆに応じて求める、オーディオ信号符号化装置。
前記評価量算出手段は、前記周波数帯域の臨界帯域幅にさらに応じて前記評価量を各前記周波数帯域ごとに求める、請求項１〜７のいずれか１項に記載のオーディオ信号符号化装置。