JPH07225598A - 動的に決定された臨界帯域を用いる音響コード化の方法および装置 - Google Patents

動的に決定された臨界帯域を用いる音響コード化の方法および装置

Info

Publication number
JPH07225598A
JPH07225598A JP6226454A JP22645494A JPH07225598A JP H07225598 A JPH07225598 A JP H07225598A JP 6226454 A JP6226454 A JP 6226454A JP 22645494 A JP22645494 A JP 22645494A JP H07225598 A JPH07225598 A JP H07225598A
Authority
JP
Japan
Prior art keywords
critical band
band
spectral
critical
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6226454A
Other languages
English (en)
Inventor
V J Magrion Thomas
トーマス・ヴィー・ジェイ・マグリオン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Original Assignee
Massachusetts Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology filed Critical Massachusetts Institute of Technology
Publication of JPH07225598A publication Critical patent/JPH07225598A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 音響信号の時間的に重なるブロックをそのス
ペクトル成分としてコード化する音響信号エンコーダを
提供する。 【構成】 スペクトルはスペクトル成分の「臨界帯域」
に分けられ、各スペクトル成分が表わされる分解能は帰
属する臨界帯域に含まれるパワーに依存する(50)。
臨界帯域の帯域限度は一定ではない代わりに動的に変化
させられて、入力音響信号のスペクトルのピークが常に
1つの臨界帯域の略々中心に該当するようにする(3
6、38)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音響情報のコード化に
関する。本発明は、特に「臨界帯域(critical
bands)」に従って変化する分解能による音響デ
ータの圧縮に関する。
【0002】
【従来の技術】データが「臨界帯域マスキング」として
知られる心理音響学的効果を勘定に入れることにより低
減されるならば、音響信号をコード化するため使用され
るデータ量は、結果として得る音の品質にほとんどイン
パクトを与えずに大幅に低減することができる。聴取す
る人が狭帯域の大きな音源からの音を聴くとき、この聴
取者はより大きな(マスキング)音が存在しない時に聴
くことができるであろう他のより静かな(マスキング)
音が聴こえない傾向がある。マスキングが生じる程度
は、マスクされる信号がどれだけ周波数においてマスキ
ング信号に近いかに依存し、低い周波数のマスキング音
は、その周波数がより高かった場合にその振幅が明瞭に
検出可能である如きものである別の低い周波数の信号の
人間の聴取を完全にマスクする、即ち妨げることがあ
る。同様に、高い周波数のマスキング信号は、低周波信
号のマスキングにおけるよりも他の高周波音をマスキン
グにおける方がより有効的であることになる。位相の臨
界帯域は、マスクされるべき信号の周波数がマスキング
信号前後の「臨界帯域」の外側になる時にのみに周波数
に対するマスキング有効の依存性が現れる事実を指すた
めに用いられる。
【0003】この効果は、音響信号のコード化において
は重要である。音響信号は、しばしば信号のスペクトル
成分に関してコード化され、これらの成分は、離散的フ
ーリエ変換(DFT)、離散的余弦変換(DCT)、そ
の他の同様な操作を用いることによって決定される。信
号を復元するためには、コード化されたバージョンを逆
変換する。ここで、ある周波数成分が高い振幅を持つこ
とが観察されるならば、結果として得る量子化ノイズが
高い振幅信号により大きくマスクされる故に、高い振幅
のスペクトル成分のみでなくこれら周波数成分に近いス
ペクトル成分をも表わす比較的粗い分解能を用いること
ができる。同時に、より粗な分解能から結果として生じ
る量子化ノイズをマスクするに充分に高い振幅を含まな
い他の帯域において比較的微な分解能を維持することが
できる。
【0004】
【発明が解決しようとする課題】このような試みを用い
るコード化法は、典型的に可聴スペクトルを24または
25の臨界帯域に分けるが、これは臨界帯域幅の研究が
可聴スペクトルを網羅する略々正しい数であるであるこ
とを示唆するためである。各臨界帯域における総パワー
が決定され、1つの帯域内のスペクトル成分が記録され
る分解能がこの帯域の総パワーに従って決定され、この
パワーが大きくなるほど分解能は粗くなる。
【0005】このような試みは少ない音質の低下で著し
いデータの減少を生じる結果となるが、音楽の如き音響
情報の記録は依然として大量の記憶域を消費し、これに
従って記憶効率の向上が望まれる。この目的のために
は、所与のスペクトル成分における量子化ノイズの検出
可能性がこれが帰属する臨界帯域における総音響パワー
によってのみでなく、それほどではないが隣接帯域にお
ける音響パワーによっても決定される事実を勘案するよ
うに、「臨界帯域」の方法が修正されてきた。このよう
な改善によれば、所与の臨界帯域に対する分解能を決定
するため用いられるレベルは、単に1つの帯域における
総パワーではなく、この総パワーと他の帯域におけるパ
ワーの一部の和であり、このパワーの一部は特定の帯域
がその分解能が決定される帯域から周波数においてどれ
だけ離れているかによって決定される。
【0006】
【課題を解決するための手段】可能なデータ減少を更に
向上する1つの方法を発見した。臨界帯域法の従前の実
施態様はその上限および下限がDFTブロック間で同じ
ものであった臨界帯域を用いるものであったが、ピーク
・スペクトル密度が一般にDFTブロック間で同じ周波
数に止まらなくとも、例えば少なくとも最も大きなパワ
ーのスペクトル密度が常に1つの帯域内の略々中心とな
り得るように、この帯域限度を変化するものである。従
って、ピーク・スペクトル密度の帯域パワーに対する隣
接帯域の分解能の調整が、実際の心理音響学的なマスキ
ング効果に更に一貫して対応する。その結果、このよう
な方法は、所与の音質に対するより大きな圧縮あるいは
所与の圧縮に対するより優れた音質を獲得する傾向を有
する。
【0007】
【実施例】本発明の上記および他の特徴および利点につ
いては、添付図面に関して以下に記載する。図1、図2
および図3は、本発明の教示を採用する装置によって行
われる信号処理をブロック図形態で示している。図面は
幾つかの機能を説明のため個々に示しているが、当業者
は共通のハードウエアが機能の多くに対して典型的に用
いられることが判るであろう。
【0008】最初に、入力音響信号x(t)がブロック
12により示される操作においてサンプルされて一連の
実数値サンプルxkを生じる。具体性のために、図面は
図示された装置を16ビットの2つの補完的不動点の実
数値を生じるため44.1KHzのコンパクト・ディス
ク速度でx(t)をサンプリングするものとして示す。
次に、音響信号のスペクトル成分がこのサンプルから取
出される。再び具体性を持たせるため、図面は、各ブロ
ックが1920の新しいサンプルを持つように128サ
ンプルだけ相互に重なる2048のサンプル・ブロック
の高速フーリエ変換(FFT)によりこれを行うことを
示している。
【0009】当業者は判るように、ブロック限界におけ
るシーケンスの切捨ては、結果として生じるスペクトル
表示を2048のサンプル・ブロックが取出される信号
に存在しないスペクトル成分を含むように現れさせる傾
向を有し、このようなシーケンスの切捨ての望ましから
ざる効果を低減するためフーリエ変換前にサンプル・ブ
ロックに対して「ウインドウ操作(windowin
g)」がしばしば行われる。このような特定の場合には
当該装置は「余弦−矩形状」ウインドウを用い、これに
おいては前後のブロックと重なるブロックの初めと終り
におけるサンプルがそれぞれいわゆるハニング(Han
ning)ウインドウ係数の平方根であるステップ14
におけるウインドウ操作係数の支配下に置かれるが、他
のサンプルは変更されない。更に、2048点のサンプ
ル・ブロックのウインドウ操作の結果生じる値が(0≦
k<2048)なるx′kで表わされるならば、値x′k
は下式により与えられる。即ち、
【数1】 図面のブロック16は、FFTアルゴリズムを実行して
一連のスペクトル値X′nを生じることを示す。204
8点のシーケンスの離散的フーリエ変換は理論的に20
48の異なるスペクトル成分を含むが、xkが全て実数
値であるという事実がX′n=X′N-n*を意味し、ここ
で*は複素共役を表わし、Nは変換における成分数であ
り、従って(N/2)+1即ち、1025の冗長でない
スペクトル成分のみが存在し、そのX0およびX1024
除く全てが複素数である。
【0010】FFT操作16により生じる全てのスペク
トル値は32ビットの不動点複素数、即ち、16ビット
の実数と16ビットの虚数である。(用いたFFTアル
ゴリズムによる完全16ビットの分解能の利点を取るた
め、操作16はまた図面が示すようにその出力を2の因
数でスケールする。)しかし、マスキング効果はあるス
ペクトル値に対するこのような分解能を不要にし、従っ
てデータ低減ステップ18は各スペクトル値X′n
ら、以下に述べる方法で各ブロック毎に決定される各量
子化レベル値Qnにより表わされる多数の最下位ビット
を取除く。コード化ステップ20において、次にデータ
低減スペクトル成分が、必要に応じて、種々のスペクト
ル値の分解能の表示と共に記録されあるいは伝達され
る。
【0011】コード化された音を復元するために、ゼロ
充填操作22(図2)として考え得ることは音響信号の
このようなデータ低減表示をその入力ポートで受取り、
これが最下位ビットとして各スペクトル値に、低減ステ
ップ18が取除いたビット数に等しいゼロの数を加算
し、逆フーリエ変換ステップ24(値が因数1/2で再
びスケールされる)が各ブロックから2048のリアル
タイム領域値ykを生じることである。これら出力値yk
はステップ25において再びウインドウ操作されて修正
値y′kを生じる。重複加算操作26においては、これ
らのy′k値の最初の128の各々が前の逆フーリエ変
換操作において生じた最後の128の値の各々に加算さ
れ、その結果が典型的にディジタル/アナログ変換とフ
ィルタ操作を受けて最終出力(t)を生じる長さが19
20の最終サンプル・シーケンスy′kである。
【0012】これまで述べたように、コード化および復
号は大半が周知のものである。また、図3に関して次に
述べる方法における量子化レベルQnが決定される方法
の多くは大半が周知である。
【0013】各スペクトル成分のコード化において用い
られる振幅の分解能を確立するために、種々のスペクト
ル成分のパワー・レベルが決定されなければならず、ま
たこの目的のためにFFT操作16の出力を用いること
もできる。しかし、時間領域から周波数領域への変換、
および望ましくない人為的処置を過剰に生じることなく
逆方向の変換の目的のため望ましいが、前記のフーリエ
変換のため用いられたウインドウ操作14は、周波数領
域におけるマスキング閾値の決定のためには行われず、
結果として生じるスペクトル値の周波数応答は充分に狭
くない。従って、分解能の決定目的のためには異なるウ
インドウ操作30が用いられる。この操作は、カイザー
−ベッセル・ウインドウ関数を用いる。即ち、
【数2】 但し、I0は変形零次ベッセル関数:I0(x)=J
0(jx)であり、ここでj=√(−1)、J0は第1種
の零次ベッセル関数である。(実際には、x2048はな
く、このためx″2048がないが、カイザー−ベッセル関
数が従来のように奇数の点に対して定義されるので、こ
れを定義に含める。) ウインドウ操作14が演算するものと同じように重なる
ブロックについて演算するこのウインドウ操作の出力
x″kは、高速フーリエ変換と演算32における2のス
ケーリングの対象となってスペクトル値X″nを生じ、
その2乗された大きさはステップ34において決定され
てスペクトルのパワー値Pnを生じる。
【0014】これらスペクトル・パワー値は次に臨界帯
域に分けられる。各スペクトル・パワー値Pnはその指
数、サンプリング率およびブロック・サイズによって決
定される周波数と関連させられる。サンプリング率は4
4,100Hzでありブロック・サイズは2048サン
プルである場合、パワー・スペクトル値Pnと関連する
周波数は(44,100/2048)n、即ち、21.
53nHzである。以下に述べる方法で、周波数の上限
および下限が、例えば24または25の臨界帯域の各々
に対して決定され、周波数の上限および下限hiおよび
iに該当する周波数と関連する全てのスペクトル・パ
ワー値Pnは、ステップ36において臨界帯域のパワー
値Biに達するように一つに合算される。
【0015】このBi値は、周波数帯域ないの周波数と
関連する成分の全パワーを表わし、従ってこれはこの帯
域内のスペクトル値に対する表示に要する分解能のある
表示を与える。しかし、この範囲外では、近傍帯域にお
ける音のパワーのマスキング効果を反映することがな
い。他の臨界帯域におけるパワー効果を勘案するには、
各i番目の帯域のスペクトル・パワー値Biに他の帯域
におけるパワーのそれぞれの小数を加算し、この小数は
より近い帯域に対しては高くなり、より遠い帯域に対し
ては低くなる。Iの臨界帯域があり、帯域パワー・ベク
トルB=[B0,B1,...BI-1Tを形成するなら
ば、この「拡張」演算38は下記の如くマトリックスで
表わすことができる。即ち、 C=SB 但し、Cは拡張が生じた後のスペクトル・パワー・ベク
トルと対応するI元ベクトルであり、Sはその元Slm
下式により与えられる(I×I)拡張マトリックスであ
る。即ち、
【数3】 但し、lは拡張される臨界帯域の数であり、mはマスキ
ングを生じる臨界帯域の数である。ここで用いた特定の
拡張マトリックスは、提案された運動画像エキスパート
・グループ(MPEG)規格において用いられるもので
あるが、当業者は他の拡張関数もまた本発明において用
いることができることを認識しよう。
【0016】反射は、均一なスペクトル内容、即ち、周
波数成分の全てにおけるパワーが同じであるものを持つ
ブロックに対して結果として得る値Cは、臨界帯域の全
てに対して同じではないが、これは音響スペクトルの中
心寄りの帯域が終端におけるよりも更に近い他の帯域で
あるためである。周波数の関数としてのパワー密度が平
坦である時に等しい値を生じるようにCi値を「再正規
化」するためには、ステップ38は正規化値C′i=Ci
/Niの計算を含み、ここで
【数4】 臨界帯域間にパワーを拡張して、帯域パワー値C′i
得るためこれらを再正規化すると、帯域におけるスペク
トル値に対して用いられる量子化レベルを決定するため
結果として得るパワーの分数を用いることができる。典
型的には、この目的のため用いられる分数は、一方では
「調性(tonality)」の測定に依存し、あるい
は他方では検出された音のパワーの「ノイズの多さ」に
依存する。種々の調性の測定が開発され本発明の実施例
における目的に対して用いることができるが、励磁した
実施例のステップ40は、大域的なスペクトル平坦性の
測定値Fを用い、この値はパワー・スペクトル密度の算
術平均に対するパワー・スペクトル密度の幾何学平均の
比である。
【0017】
【数5】 但し、DCの項P0が計算から省かれ、Fがデシベル単
位で表わされることが判るであろう。このスペクトルの
平坦性の測定から、調性の係数が下式に従って決定され
る。即ち、
【数6】 即ち、完全に平坦なスペクトルは、平坦性の測定値Fと
調性係数αの両方に対してゼロ値を生じるが、−60d
Bに等しいかあるいはこれより更に負であるスペクトル
平坦性測定値は単位の調性係数αを生じ、これは信号が
完全にトーンライク(tonelike)であることの
表示として取られる。
【0018】この値は、ノイズ状信号のマスキング能力
が比較的小さく、また(明らかに低くなる方向におい
て)所与のパワーに対して周波数依存であるが、トーン
ライクな信号のマスキング能力はより大きくなり周波数
と共に増加する。調性の係数は、スペクトル値の分解能
が決定される拡張パワーC′iの分数に達する際にこの
事実を勘定に入れるために用いられる。閾値Tiは、下
式により各帯域毎に決定される。即ち、
【数7】 但し、Kαはデータの低減と音質との間の望ましい妥協
に到達するため用いられる「仮の係数」であり、Ai
下式によるステップ42において計算される信号の調性
に対する(帯域に依存する)調整である。即ち、 10 log10i = (α)(14.5+i)+(1−α)(5.
5) Kαに対する妥当値は略々30である。特に、31.6
の値(即ち、15dB)で満足し得る結果を得た。ブロ
ック44は、閾値Tiの計算を示している。
【0019】結果として得る値Tiは、人間の知覚に必
要とされる種々の帯域における最小パワー・レベルの推
定値を表わし、マスキングの故に、そのパワーがTi
り小さければ、i番目の帯域におけるスペクトル成分は
知覚し得ず、そのため「透過性の」量子化は、Tiより
小さい量子化ノイズ・パワーのレベルを結果として生じ
る帯域iにおけるスペクトル値に対する量子化レベルか
ら結果として得なければならない。更にまた、結果とし
て得る閾値Tiの一部は人間の聴覚の絶対的な限度より
低いパワー・レベルを表わすため、臨界帯域法のある実
行は絶対的な聴覚閾値より著しく小さい閾値Tiを聴覚
閾値のすぐ下に引上げることにより更なるデータの低減
さえ得る。このような調整は好むところではないが、図
面はブロック46によるこのようなステップを示し、こ
れが調整された閾値T′iを生じる。このようなステッ
プが用いられる構成においては、全ての結果として生じ
る絶対聴取レベルの調整閾値をKαとは別の「仮の係
数」により乗じることが更に望ましいが、典型的にはこ
のような調整は用いなかった。
【0020】bビットに量子化されたデータは量子化レ
ベルQ=2-bを用いる。従って、均一な量子化ノイズの
パワーNQは下式により与えられる。即ち、
【数8】 これは、i番目の帯域に対して要求される量子化レベル
iが下式により与えられることを意味する。
【0021】
【数9】 ブロック48は、このレベルの計算を示している。
【0022】先に述べたブロック18のデータ低減ステ
ップは、値-log2iの切上げの結果得るビットbの数を
持つi番目の臨界帯域内の周波数と関連させられる各ス
ペクトル成分X′nの表示を打切る。これまでは、その
実数部と虚数部とが共にQiより小さいこれらのXn値に
対する例外設定により更なるデータ低減もまた得られ
る。単にゼロとしてコード化を終わるこれらのスペクト
ル値に対して、表示は「ゼロ・ビット」であり得る、即
ち、ブロックに対するコード化は、例えば、その値がゼ
ロであり従ってこれらの成分に対する別の表示を省く成
分のリストを含み得る。
【0023】これまで述べたように、図1および図3の
装置は、全く周知のものである。しかし、本発明によれ
ば、スペクトル成分を帯域間に分けるためステップ18
および36において用いられる帯域限度hi、liは固定
されるものではないが、その代わり動的に決定される。
このような決定は、ブロック50により表わされる演算
を含み、これはスペクトルのパワー成分Pnにおけるピ
ーク値を識別する。この動的な臨界帯域の決定は、パワ
ー−スペクトルのピーク値が臨界帯域の中心に置かれる
ならば、臨界帯域の効果が更に一貫したものとなるとい
う概念に基いている。この概念を、パワー・スペクトル
における局部的な最大値を多くの臨界帯域の中心とする
ことにより実現することもでき、またこの方法により著
しい利点を生じるものと信じる。しかし、用いられた本
発明の特定の実施例は、1つのピーク値、即ち最も高い
パワー・スペクトルのピーク値を唯一つの臨界帯域の中
心とし、残りの臨界帯域に対する限界は、単に残りの臨
界帯域を各々が適正な帯域幅を持ち相互に隣接するよう
に置くことにより決定される。
【0024】しかし、このような限界の決定を詳細に考
察する前に、「seed」臨界帯域が中心に置かれるピ
ーク値が選択される方法について論述する。このピーク
値は、単に最大のパワー−スペクトル値Pnを見出すこ
とによって選択することができ、このような方法は本発
明の幾つかの実施例において用いられる。しかし、下記
の考察を勘案するやや異なる方法を選好する。
【0025】パワー−スペクトル値Pnをパワー・スペ
クトル密度の事例として考えることができ、実際のスペ
クトル・ピーク値が正確に離散的な「サンプル」周波数
の1つにおいて生じないことが多い。このような場合、
大域的なパワー−スペクトル最大値を挟むサンプル周波
数が実際に、略々正確に局部的な最大値においてたまた
ま生じるあるPn値より低い値を持つ。ピーク値が最大
値Pnのみを見出すことにより決定されるならば、従っ
て、「seed」臨界帯域が大域的な最大値ではなく局
部的な最大値によって決定されることになる。更にま
た、最大値Pnが実際のパワー−スペクトルのピーク値
を挟む対の一方である場合でさえ、これはより低い値の
隣接値Pnほど周波数においてパワー−スペクトル・ピ
ーク値に近くはない。
【0026】従って、大域的ピーク値の決定をできるだ
け正確にするため、励磁された装置は、Pn値のセット
の低い周波数終端における3値のウインドウから始めて
これをピーク値に遭遇するまで、即ち、3値ウインドウ
がPn-1<Pn>Pn+1となるように値Pnを中心とするま
でこれを1つの値だけずらせる。このようなウインドウ
における3つの点は、パワー−周波数面内の3つの点と
して取扱われ、これらが定義する放物線の最大値のパワ
ーが計算されて記憶される。このウインドウは次に、ピ
ーク値が計算されたウインドウと重ならないように3だ
け進められ、全てのPn値が考察されてピーク値が必要
に応じて計算されるまで、更に他のピーク値に対して探
索が再開される。全てのPn値が考察されると、最大値
を持つ計算されたピーク値の周波数が、「seed」臨
界帯域が中心とされる点となる。
【0027】次のステップは、このi番目の臨界帯域に
対する上限hiと下限liを決定することである(まだこ
の臨界帯域に対する値iを知る必要はないが)。この
時、臨界帯域の幅が周波数と共に増加すること、および
図示した実施例が用いて「seed」帯域に対する帯域
幅を見出すこの幅の良好な推定が下式により与えられる
ことが判る。即ち、
【数10】 但し、hseedおよびlseedは、大域的ピーク値の周波数
seedを中心とする臨界帯域の上限および下限である。
【0028】これらの値が一旦決定されると、スペクト
ルの残りが、おの帯域幅がhseed−lseedに対する前の
式で与えられた変形と類似する状態で周波数と共に変化
する1組の隣接する臨界帯域で分布させられる。臨界帯
域の全てに対する帯域幅は、hseedおよびlseedがそれ
ぞれhiおよびliにより置換された前記式と、問題とな
るi番目の臨界帯域に対する中心周波数fiとを用いる
ことによって決定することができる。しかし、周波数ス
ペクトルを適当に変化する帯域幅の臨界帯域で分布させ
問題に対するより簡単な近い形態の解決法は、その代わ
りに前述の帯域幅式に対する下記の近似を用いることに
より達成可能である。即ち、
【数11】 先に述べたように、結果として得る帯域限度を帯域−パ
ワー計算の演算36において用いて、各帯域のパワーB
iの計算のための加数Pnを決定し、これらは分解能低減
演算18において用いられて各スペクトル値の臨界帯域
を決定し、従ってコード化される分解能を決定する。更
に、これらの限度はまた、ゼロ充填演算22がコード化
されたデータを正確に解釈するように、即ち、コード化
データが配置されるフォーマットが値Qi、hiおよびl
iのある表示を含むように帯域の構成を示す。無論、値
iおよびliを含むことは余分なオーバーヘッドを表わ
すが、コード化信号フォーマットは必ずしもこれらの値
を全て明確に含むことを必要としない。例えば、唯一つ
の臨界帯域が中心とされる本発明の上記の実施例におい
ては、例えば限度の1つの下限のみを明瞭に識別するこ
とによって帯域限度の全てを表示することができる。
【0029】このような方法を用いることにより、同じ
データ圧縮率を持つ従来の臨界帯域圧縮法の結果得るも
のに勝る品質で音響情報を記録し再生することができ
た。作業は専ら図面に示される形式の装置に制限された
が、準拠する原理がより広い応用性を有することは明白
である。例えば、スペクトル成分の抽出のために単純な
高速フーリエ変換を用いたが、本方法の応用性は一般に
FFTタイプの方法あるいはDFT法にのみ限定される
ものでないことは明らかである。周波数と関連する出力
をも生じる離散状余弦変換法は、本発明の実施例におい
ても用いることができる。実際に、初期のスペクトル値
の抽出における時間および(または)周波数の分解能が
周波数と共に変化する如き他の種類の臨界帯域構成を用
いることができる。本方法は、その変換が臨界帯域のコ
ード化において現在用いられる種類のものであるシステ
ムのみならず、例えばウエーブレット(wavele
t)変換を用いる将来の構成に対しても適用可能であ
る。
【0030】更に、図示された実施例は唯一の大域的ピ
ーク値を唯一の臨界帯域の中心とするものであったが、
他の実施例では他の局部ピーク値もまた更に他の臨界帯
域の中心とすることもできる。
【0031】このように、本発明は広範囲の実施例に適
用でい、このため技術における著しい進歩を構成するこ
とが明らかである。
【図面の簡単な説明】
【図1】本発明による音響信号をコード化する装置の一
部を示すブロック図である。
【図2】図1の装置によりコード化された信号を復号す
るための装置を示すブロック図である。
【図3】コード化装置の残部を示すブロック図である。
【符号の説明】
12 44.1KHzアナログ/ディジタル変換 14 ハニング(Hanning)ウインドウ係数の平
方根 16 出力を2の因数でスケール 18 データの低減 20 コード化 22 ゼロ充填 24 逆フーリエ変換ステップ24(値が因数1/2で
再びスケール) 25 ハニング(Hanning)ウインドウ係数の平
方根 26 重複加算操作 30 カイザー−ベッセル・ウインドウ関数を用いるウ
インドウ操作 32 高速フーリエ変換(出力を2の因数でスケール) 34 2乗演算 40 調性係数の計算 42 オフセットの計算 44 閾値の計算 46 絶対値の計算 48 量子化レベルの計算 50 ピーク値を識別 52 臨界帯域の決定

Claims (28)

    【特許請求の範囲】
  1. 【請求項1】 音響信号をそのデータ低減表示にコード
    化する方法であって、音響信号をサンプリングして逐次
    入力サンプルのブロックを生じるステップと、各周波数
    と関連するスペクトル値を各ブロックから抽出するステ
    ップと、1つの記録のスペクトル値を臨界帯域とそれぞ
    れ関連する帯域限度に該当する周波数と関連する臨界帯
    域に分けるステップと、各臨界帯域に含まれるパワーか
    ら前記臨界帯域におけるスペクトル値をコード化する際
    に使用される分解能を決定するステップと、前記臨界帯
    域に対して決定された分解能に従って各臨界帯域におけ
    るスペクトル値を量子化することにより、前記音響信号
    のデータ低減表示を生成するステップとを含む方法にお
    いて、前記音響信号のスペクトル内容に従って臨界帯域
    限度を変更するステップを含むことを特徴とする方法。
  2. 【請求項2】 入力サンプルのブロックからスペクトル
    値を決定する前記ステップが、入力サンプルの当該ブロ
    ックの離散的フーリエ変換を計算するステップを含むこ
    とを特徴とする請求項1記載の方法。
  3. 【請求項3】 前記臨界帯域限度を変更する前記ステッ
    プが、前記スペクトル値におけるパワー・ピークを検出
    するステップと、1つのこのように検出されたピークを
    実質的に前記臨界帯域の中心とするように該臨界帯域の
    少なくとも1つの限度を調整するステップとを含むこと
    を特徴とする請求項1記載の方法。
  4. 【請求項4】 前記スペクトル値により表わされるスペ
    クトルの大域的最大値を前記臨界帯域の1つの中心とす
    るステップを含むことを特徴とする請求項3記載の方
    法。
  5. 【請求項5】 音響信号から得た情報を含む信号を伝送
    する方法であって、前記音響信号をサンプリングして逐
    次入力サンプルのブロックを生じるステップと、各周波
    数と関連するスペクトル値を各ブロックから抽出するス
    テップと、1つの記録のスペクトル値を、臨界帯域とそ
    れぞれ関連する帯域限度に該当する周波数と関連する臨
    界帯域に分けるステップと、各臨界帯域に含まれるパワ
    ーから該臨界帯域におけるスペクトル値をコード化する
    際に使用される分解能を決定するステップと、臨界帯域
    に対して決定された分解能に従って各臨界帯域における
    スペクトル値を量子化することにより音響信号のデータ
    低減表示を生成するステップと、該データ低減表示を伝
    送するステップとを含む方法において、前記音響信号の
    スペクトル内容に従って前記臨界帯域限度を変更するス
    テップを含むことを特徴とする方法。
  6. 【請求項6】 入力サンプルのブロックからスペクトル
    値を決定する前記ステップが、該入力サンプル・ブロッ
    クの離散的フーリエ変換を計算するステップを含むこと
    を特徴とする請求項5記載の方法。
  7. 【請求項7】 前記臨界帯域限度を変更する前記ステッ
    プが、前記スペクトル値により表わされるスペクトルに
    おけるパワーのピーク値を検出するステップと、1つの
    このように検出されたピーク値を実質的に前記臨界帯域
    の中心とするように該臨界帯域の少なくとも1つの限度
    を調整するステップとを含むことを特徴とする請求項5
    記載の方法。
  8. 【請求項8】 前記スペクトル値により表わされるスペ
    クトルの大域的最大値を前記臨界帯域の1つの中心とす
    るステップを含むことを特徴とする請求項7記載の方
    法。
  9. 【請求項9】 音響信号から得た情報を記録する方法で
    あって、音響信号をサンプリングして逐次入力サンプル
    のブロックを生じるステップと、各周波数と関連するス
    ペクトル値を各ブロックから抽出するステップと、1つ
    の記録のスペクトル値を、臨界帯域とそれぞれ関連する
    帯域限度に該当する周波数と関連する臨界帯域に分ける
    ステップと、各臨界帯域に含まれるパワーから該臨界帯
    域におけるスペクトル値をコード化する際に使用される
    分解能を決定するステップと、前記臨界帯域に対して決
    定された分解能に従って各臨界帯域におけるスペクトル
    値を量子化することにより前記音響信号のデータ低減表
    示を生成するステップと、前記音響信号のスペクトル内
    容に従って臨界帯域限度を変更するステップを含むこと
    を特徴とする方法。
  10. 【請求項10】 入力サンプルのブロックからスペクト
    ル値を決定する前記ステップが、前記入力サンプル・ブ
    ロックの離散的フーリエ変換を計算するステップを含む
    ことを特徴とする請求項9記載の方法。
  11. 【請求項11】 前記臨界帯域限度を変更する前記ステ
    ップが、前記スペクトル値により表わされるスペクトル
    におけるパワーのピーク値を検出するステップと、1つ
    のこのように検出されたピーク値を実質的に前記臨界帯
    域の中心とするように前記臨界帯域の少なくとも1つの
    限度を調整するステップとを含むことを特徴とする請求
    項9記載の方法。
  12. 【請求項12】 前記スペクトル値により表わされるス
    ペクトルの大域的最大値を前記臨界帯域の1つの中心と
    するステップを含むことを特徴とする請求項11記載の
    方法。
  13. 【請求項13】 音響信号から得た情報を表わすデータ
    低減信号を伝送する方法であって、前記データ低減信号
    に、臨界帯域とそれぞれ関連する帯域限度に該当する周
    波数と関連する臨界帯域に分けられた各周波数と関連す
    るスペクトル値を含めるステップと、前記データ低減信
    号に、信号が各臨界帯域におけるスペクトル値を表わす
    分解能の表示を含めるステップとを含む方法において、
    前記臨界帯域の帯域限度の表示をデータ低減信号に組込
    むステップを含むことを特徴とする方法。
  14. 【請求項14】 音響信号を生成する方法において、 A)臨界帯域とそれぞれ関連する帯域限度に該当する周
    波数と関連する臨界帯域に分けられた各周波数と関連す
    るスペクトル値を含み、かつ信号が各臨界帯域における
    スペクトル値を表わす分解能を表わす分解能表示を含
    み、かつ前記臨界帯域の帯域限度を表わす帯域限度表示
    を更に含む、データ低減信号を受取るステップと、 B)分解能および帯域限度の表示に従って、前記スペク
    トル値をスペクトル成分の大きさとして解釈することに
    より、かつその大きさがこのように解釈されたスペクト
    ル値により表示される大きさであるスペクトル成分を生
    成することによって音響信号を生成するステップとを含
    むことを特徴とする方法。
  15. 【請求項15】 音響信号をそのデータ低減表示にコー
    ド化する装置であって、前記音響信号をサンプリングし
    て逐次入力サンプルのブロックを生じるサンプラを含
    み、更に、各周波数と関連するスペクトル値を各ブロッ
    クから抽出し、1つの記録のスペクトル値を臨界帯域と
    それぞれ関連する帯域限度に該当する周波数と関連する
    臨界帯域に分け、各臨界帯域に含まれるパワーから、該
    臨界帯域におけるスペクトル値をコード化する際に使用
    される分解能を決定し、かつ臨界帯域に対して決定され
    た分解能に従って各臨界帯域におけるスペクトル値を量
    子化することにより、前記音響信号のデータ低減表示を
    生成する分析回路とを備えた装置において、前記分析回
    路が前記音響信号のスペクトル成分に従って臨界帯域の
    限度を変更する手段を含むことを特徴とする装置。
  16. 【請求項16】 前記分析回路が、前記入力サンプル・
    ブロックの離散的フーリエ変換を計算することにより、
    該入力サンプル・ブロックからスペクトル値を決定する
    ことを特徴とする請求項15記載の装置。
  17. 【請求項17】 前記スペクトル値により表わされるス
    ペクトルにおけるパワーのピーク値を検出することによ
    り、かつこのように検出された1つのピーク値を実質的
    に前記臨界帯域の中心とするように、該臨界帯域の少な
    くとも1つの限度を調整することによって、前記分析回
    路が前記臨界帯域限度を変更することを特徴とする請求
    項15記載の装置。
  18. 【請求項18】 前記分析回路が、前記スペクトル値に
    より表わされるスペクトルの大域的最大値を該臨界帯域
    の1つの中心とすることを特徴とする請求項17記載の
    装置。
  19. 【請求項19】 音響信号から得た情報を含むデータ低
    減信号を伝送する装置であって、前記音響信号をサンプ
    リングして逐次入力サンプルのブロックを生じるサンプ
    ラを含み、更に、各周波数と関連するスペクトル値を各
    ブロックから抽出し、1つの記録のスペクトル値を臨界
    帯域とそれぞれ関連する帯域限度に該当する周波数と関
    連する臨界帯域に分け、各臨界帯域に含まれるパワーか
    ら該臨界帯域におけるスペクトル値をコード化する際に
    使用される分解能を決定し、臨界帯域に対して決定され
    た分解能に従って各臨界帯域におけるスペクトル値を量
    子化することにより前記音響信号のデータ低減表示を生
    成し、かつ該データ低減表示を含む信号を伝送する分析
    および伝送回路を含む装置において、前記分析および伝
    送回路が、前記音響信号のスペクトル成分に従って臨界
    帯域限度を変更する回路を含むことを特徴とする装置。
  20. 【請求項20】 前記分析および伝送回路が、前記入力
    サンプル・ブロックの離散的フーリエ変換を計算するこ
    とにより、1つの入力サンプル・ブロックからスペクト
    ル値を決定することを特徴とする請求項19記載の装
    置。
  21. 【請求項21】 前記スペクトル値により表わされるス
    ペクトルにおけるパワーのピーク値を検出することによ
    り、かつ1つのこのように検出されたピーク値を実質的
    に前記臨界帯域の中心とするように該臨界帯域の少なく
    とも1つの限度を調整することによって、前記分析およ
    び伝送回路が、前記臨界帯域の限度を変更することを特
    徴とする請求項19記載の装置。
  22. 【請求項22】 前記分析および伝送回路が、前記スペ
    クトル値により表わされるスペクトルの大域的最大値を
    前記臨界帯域の1つの中心とすることを特徴とする請求
    項21記載の装置。
  23. 【請求項23】 音響信号における情報を記録する装置
    であって、前記音響信号をサンプリングして逐次入力サ
    ンプルのブロックを生じるサンプラを含み、かつ更に、
    各周波数と関連するスペクトル値を各ブロックから抽出
    し、1つの記録のスペクトル値を臨界帯域とそれぞれ関
    連する帯域限度に該当する周波数と関連する臨界帯域に
    分け、各臨界帯域に含まれるパワーから、該臨界帯域に
    おけるスペクトル値をコード化する際に使用される分解
    能を決定し、臨界帯域に対して決定された分解能に従っ
    て各臨界帯域におけるスペクトル値を量子化することに
    より前記音響信号のデータ低減表示を生成し、かつ該デ
    ータ低減表示を記録する分析および記録回路を含む装置
    において、前記分析および記録回路が、前記音響信号の
    スペクトル成分に従って臨界帯域の限度を変更する回路
    を含むことを特徴とする装置。
  24. 【請求項24】 前記分析および記録回路が、1つの入
    力サンプル・ブロックの離散的フーリエ変換を計算する
    ことにより、該バイアス電流からスペクトル値を決定す
    ることを特徴とする請求項23記載の装置。
  25. 【請求項25】 前記スペクトル値により表わされるス
    ペクトルにおけるパワーのピーク値を検出することによ
    り、かつ1つのこのように検出されたピーク値を実質的
    に臨界帯域の少なくとも1つの中心とするように、該1
    つの臨界帯域の限度を調整することによって、前記分析
    および記録回路が臨界帯域の限度を変更することを特徴
    とする請求項23記載の装置。
  26. 【請求項26】 前記分析および記録回路が、前記スペ
    クトル値により表わされるスペクトルの大域的最大値を
    前記1つの臨界帯域の中心とすることを特徴とする請求
    項25記載の装置。
  27. 【請求項27】 音響信号から得た情報を表わすデータ
    低減信号を伝送する装置であって、臨界帯域とそれぞれ
    関連する帯域の限度に該当する周波数と関連する臨界帯
    域に分けられた各周波数と関連するスペクトル値をデー
    タ低減信号に組込み、かつ更に、前記信号が各臨界帯域
    におけるスペクトル値を表わす分解能の表示を信号に組
    込む回路を含む装置において、前記臨界帯域の帯域限度
    の表示をデータ低減信号に組込む回路を備えることを特
    徴とする装置。
  28. 【請求項28】 音響信号を生成する装置において、 A)臨界帯域とそれぞれ関連する帯域限度に該当する周
    波数と関連する臨界帯域に分けられた各周波数と関連す
    るスペクトル値を含み、かつ信号が各臨界帯域における
    スペクトル値を表わす分解能を表わす分解能表示を含
    み、かつ更に前記臨界帯域の帯域限度を表わす帯域限度
    表示を含むデータ低減信号を受取る入力ポートと、 B)前記分解能および帯域限度の表示に従って、スペク
    トル値からスペクトル成分の大きさを決定するゼロ充填
    回路と、 C)このように決定されたスペクトル成分の大きさを持
    つスペクトル成分を生成することにより、前記音響信号
    を生成する信号生成回路とを備えることを特徴とする装
    置。
JP6226454A 1993-09-22 1994-09-21 動的に決定された臨界帯域を用いる音響コード化の方法および装置 Pending JPH07225598A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12545393A 1993-09-22 1993-09-22
US125453 1993-09-22

Publications (1)

Publication Number Publication Date
JPH07225598A true JPH07225598A (ja) 1995-08-22

Family

ID=22419800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6226454A Pending JPH07225598A (ja) 1993-09-22 1994-09-21 動的に決定された臨界帯域を用いる音響コード化の方法および装置

Country Status (1)

Country Link
JP (1) JPH07225598A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005530206A (ja) * 2002-06-17 2005-10-06 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
JP2007525716A (ja) * 2004-03-01 2007-09-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 量子化器のステップサイズを求める装置および方法
US8032387B2 (en) 2002-06-17 2011-10-04 Dolby Laboratories Licensing Corporation Audio coding system using temporal shape of a decoded signal to adapt synthesized spectral components

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005530206A (ja) * 2002-06-17 2005-10-06 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
US8032387B2 (en) 2002-06-17 2011-10-04 Dolby Laboratories Licensing Corporation Audio coding system using temporal shape of a decoded signal to adapt synthesized spectral components
US8050933B2 (en) 2002-06-17 2011-11-01 Dolby Laboratories Licensing Corporation Audio coding system using temporal shape of a decoded signal to adapt synthesized spectral components
JP2007525716A (ja) * 2004-03-01 2007-09-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 量子化器のステップサイズを求める装置および方法
US8756056B2 (en) 2004-03-01 2014-06-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for determining a quantizer step size

Similar Documents

Publication Publication Date Title
Viswanathan et al. Quantization properties of transmission parameters in linear predictive systems
KR101213840B1 (ko) 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
JP5101579B2 (ja) 空間的オーディオのパラメータ表示
US6681204B2 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
EP2207170B1 (en) System for audio decoding with filling of spectral holes
US7564978B2 (en) Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US8155954B2 (en) Device and method for generating a complex spectral representation of a discrete-time signal
KR100467617B1 (ko) 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
US20050149324A1 (en) Quantization matrices for digital audio
JPH04177300A (ja) 音声帯域分割符号化装置
MXPA05002628A (es) Metodo para la reduccion de duplicacion introducida por ajuste de envolvente espectral en bancos de filtros de valor real.
JP2000276197A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
KR101035104B1 (ko) 다중-채널 신호들의 처리
JPH07261800A (ja) 変換符号化方法、復号化方法
EP1672619A2 (en) Speech coding apparatus and method therefor
US8788277B2 (en) Apparatus and methods for processing a signal using a fixed-point operation
KR19980080742A (ko) 신호 부호화방법 및 장치
JPH07225598A (ja) 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JP3353266B2 (ja) 音響信号変換符号化方法
JP3264679B2 (ja) コード励振線形予測符号化装置及び復号化装置
JP2000259190A (ja) オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置
JP4618823B2 (ja) 信号符号化装置及び方法
JP2002182695A (ja) 高能率符号化方法及び装置
Makhoul Methods for nonlinear spectral distortion of speech signals
JP2993324B2 (ja) 音声高能率符号化装置