JP3093178B2 - 高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ - Google Patents

高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ

Info

Publication number
JP3093178B2
JP3093178B2 JP10158415A JP15841598A JP3093178B2 JP 3093178 B2 JP3093178 B2 JP 3093178B2 JP 10158415 A JP10158415 A JP 10158415A JP 15841598 A JP15841598 A JP 15841598A JP 3093178 B2 JP3093178 B2 JP 3093178B2
Authority
JP
Japan
Prior art keywords
subband
information
bits
signal
codeword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP10158415A
Other languages
English (en)
Other versions
JPH11145844A (ja
Inventor
ルイス・ダン・フィルダー
グラント・アレン・デビットソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JPH11145844A publication Critical patent/JPH11145844A/ja
Application granted granted Critical
Publication of JP3093178B2 publication Critical patent/JP3093178B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、概して、音楽のような
オーディオ信号を高品質低ビットレートでディジタル処
理することに関する。
【0002】
【従来の技術】信号処理の分野では、所与の信号を十分
に表現するのに必要な情報の量を最小化する方法を発見
するために大きな関心が払われている。必要な情報を低
減させることによって、信号をより狭い帯域で伝送した
り、より少ない空間内に記憶することができる。ディジ
タル技法に関して、最小情報要件とは、最小2進ビット
要件と同義である。
【0003】ビットの削減要件は、2つの因子によって
制限される。すなわち、(1) 帯域幅Wの信号は、2
×Wより低くない周波数で標本化された一連のサンプル
によって、正確に表現される。これが、いわゆるナイキ
ストのサンプリング・レートである。したがって、帯域
幅Wを有する、T秒間の長さの信号を正確に表現するた
めには、少なくとも2×WXTの数のサンプルが必要で
あり、(2) 信号サンプルの量子化には連続する範囲
のどのような数値をも取り得るが、この数値によって
は、量子化段の規模又は分解能力に比例する、不正確な
信号の表現を生じる。この不正確さは量子化誤りと呼ば
れる。この誤りは、信号サンプル量子化の表現に利用で
きるビットの数に反比例することである。
【0004】もし全帯域幅に対して符号化技法が適用さ
れると、総ての量子化誤りは、雑音として顕われるが、
帯域幅全体にわたって均等に拡散する。スペクトルの選
択された部分に適用できる技法によって、量子化雑音の
スペクトルの拡散を制限することができる。このような
技法としては、サブバンド符号化、及び変換符号化の2
種がある。これらの技法を用いることによって、量子化
雑音が特に耳障りな特定の周波数帯において当該周波数
帯を小さい段で量子化することにより、量子化誤りを低
減させることができる。
【0005】サブバンド符号化は、一連のディジタル帯
域フィルタのバンク(列)によって実現することができ
る。変換符号化は、ディジタル帯域フィルタバンクをシ
ミュレートする幾つかの時間領域対周波数領域変換を任
意に行うことによって実現することができる。変換は、
ディジタル・フィルタよりも実現が容易であり、計算処
理及びハードウエアも少なくて済むが、変換係数で表わ
される帯域フィルタの「周波数ビン」の各々が均一な帯
域幅を有する点で設計上の柔軟性に欠ける。これと対照
的に、ディジタル帯域フィルタバンクは、種々のサブバ
ンド帯域幅を持つように設計することができる。しか
し、変換係数は、単一の変換係数帯域幅の乗数である帯
域幅を有する「サブバンド」を決定すべく、共にグルー
プ化することができる。以下、当明細書では、「サブバ
ンド」という用語は、サブバンド・コーダ、又は変換コ
ーダの何れで実現されるにせよ、全信号帯域幅の選択さ
れた部分を指すものとして用いる。変換コーダで実現さ
れるサブバンドは、1っ又は2っ以上の隣接する変換係
数又は周波数ビンの1組によって決定される。変換コー
ダの周波数ビンの帯域幅は、変換コーダのサンプリング
・レートと、各信号サンプル・ブロック(変換長)中の
サンプル数とに依存する。
【0006】音楽用信号用の高品質処理系の性能に対し
ては、サブバンド帯域フィルタの2つの特性は特に重大
である。その第1は、フィルタ通過帯域及び阻止帯域間
の領域の帯域幅(遷移帯域)である。第2は、阻止帯域
での減衰レベルである。本明細書中で用いているよう
に、フィルタの「選択度」の尺度は、遷移帯域内のフィ
ルタ応答特性曲線の鋭さ(遷移帯域ロールオフの鋭さ)
と、阻止帯域での減衰レベル(阻止帯域の深さ)とであ
る。
【0007】耳には、可変中心周波数を持つ、極度に非
対称に同調されたフィルタの特性と類似の周波数分析特
性があるので、これらの2つのフィルタ特性は重大であ
る。耳の同調フィルタの周波数分解能力は、オーディオ
スペクトル全体にわたって周波数につれて変わる。約5
00Hz以下の周波数においては、共に接近して存在す
る複数の信号を耳は識別することができるが、可聴限界
へと周波数が上昇するにつれて、識別可能な信号間の周
波数の幅は拡がる。このような聴覚上のフィルタの有効
帯域幅は、臨界帯域と呼ばれる。この臨界帯域の重要な
特質は、音響心理学的マスキング効果が臨界帯域内で最
も強く顕れること、すなわち、臨界帯域内の何処でも他
のあらゆる周波数の信号に対する可聴性が、臨界帯域内
の支配的な信号によって抑制されることである。臨界帯
域の外側にある信号はそれ程強くは掩蔽されない。この
概要については、サン・フランシスコのマッグロウヒル
社1988年出版の、K.ブレア・ベンソン編、「オー
ディオ.エンジニアリング・ハンドブック」の1.40
ぺージから1.42ぺージまでと、4.8ぺージから
4.10ぺージまでと(Audio Engineering Handbook,
K. Balir Benson ed.,McGraw-Hill, San Fransisco, 19
88)を参照のこと。
【0008】音響心理学的マスキングは、もし可聴スペ
クトル全体を通してサブバンド帯域幅がこのスペクトル
の同一部分における耳の臨界帯域幅の約半分であるなら
ば、サブバンド及び変換コーダによって更に容易に達成
される。何故ならば、耳の臨界帯域には聴覚上の刺激に
順応する可変の中心周波数があるのに対して、サブバン
ド及び変換コーダは典型的に固定の中心周波数を具えて
いるからである。音響心理学的マスキング効果を利用す
る機会を最適化するために、支配的信号の存在によって
生じる総ての人工的ひずみは、支配的信号を含むサブバ
ンドに制限されなければならない。もしサブバンド帯域
が臨界帯域の約半分又はそれより小さければ(また、も
し、遷移帯域ロールオフが十分に鋭く、阻止帯域排除が
十分に深ければ)、サブバンド通過帯域の帯域幅の縁の
近くに周波数がある信号に対してさえも、望ましくない
ひずみに対する最も効果的なマスキング効果が生じる可
能性がある。もしサブバンド帯域幅が臨界帯域の半分よ
り大きければ、支配的信号によって耳の臨界帯域がコー
ダのサブバンドから偏位させられて、耳の臨界帯域の外
側にある望ましくないひずみの幾分かが掩蔽されない可
能性がある。これらの効果は、耳の臨界帯域が狭くなる
低い周波数においては、最も耳障りである。
【0009】文書、W0 88/01811では、音響
信号、とりわけ音楽信号の伝送、記憶のためのディジタ
ル符号化が開示されている。この中で、音響信号のNピ
ックアップ値のブロックは、離散正弦変換、TDAC変
換、又は高速フーリェ変換を用いて、Mのスペクトル係
数のブロックに変形される、この過程では、量子化装置
の初期段の大きさが選ばれ、エントロピー符号化が適用
され、Mスペクトル係数が所定数のビットで符号化され
るまで、異なる段の規模で符号化が反復される。未使用
のビットは、後続のブロック中への割当てのために使用
可能である。音響心理学的マスキング効果を利用するた
めに、各ブロックのスペクトル係数は、周波数グループ
に分割され、これらの周波数グループは、個別の各々の
周波数グループ内の信号のエネルギーが同グループ内の
雑音のエネルギーよりも実質的に高ければ、音響心理学
的マスキングに従って、雑音が感受されないように選択
される。符号化の後に、係数は再構築され、再構築され
た値の周波数グループ内の信号エネルギーは、それぞれ
の最小基準値と比較される。もし1又は2個以上の周波
数グループ内の信号エネルギーがそれぞれの最小基準値
よりも低ければ、スペクトル係数は、所与の因数で乗じ
られ、反復する形で量子化および符号化が行われる。内
側及び外側の反復ループは、副次情報として伝送されな
ければならない。
【0010】
【発明が解決しようとする課題】変換符号化の性能は、
信号サンプル・ブロック長と、変換符号誤りと、エイリ
アシング相殺とを含む、幾つかの要因に依存する。
【0011】ブロック長 ブロック長が短くなるにつれて、変換エンコーダ及びデ
コーダの性能は、結果的に周波数ビンが拡がることによ
るばかりではなく、帯域フィルタの周波数ビンの応答特
性の劣化、すなわち、(1)遷移帯域ロールオフ率の減
少と、(2)阻止帯域排除の水準の減少とによっても、
不利な影響を受ける。帯域フィルタのこの特性劣化によ
って、隣接する周波数ビンにおいて望ましい信号に応答
して生じる望ましくない変換係数の生成、若しくは、変
換係数に対する望ましくない寄与に帰着する。これらの
望ましくない寄与は、サイドローブ漏洩と呼ばれる。
【0012】従って、サンプリング・レートによって
は、ブロック長を短くすることにより、或る周波数又は
全周波数、特に低い周波数において、名目上のフィルタ
帯域幅が耳の臨界帯域幅を超えることになる。たとえこ
の名目上のサブバンド帯域幅が耳の臨界帯域幅よりも狭
くとも、広がった遷移帯域、貧弱な阻止帯域排除の形で
顕れる劣化したフィルタ特性によって、耳の臨界帯域幅
の外側に顕著な信号成分が現れる。このような場合に
は、この系の他の側面、特に量子化精度面で、通常、よ
り大幅な制約を受ける。
【0013】短いブロック長によって生じるもう1つの
不利益は、次の節に述べる変換符号化誤りの悪化であ
る。
【0014】変換符号化誤り 離散変換は信号の有限のセグメントにしか作用しないの
で、離散変換では完全に正確な1組の周波数係数は生み
出されない。厳密に言うと、離散変換では、入力時間領
域信号の表現について、無限の変換長が必要になる真正
の周波数領域表現ではなく、時間・周波数表現が作り出
される。しかしながら、ここでの議論の便宜上、離散変
換の出力を周波数領域表現と呼ぶこととしよう。実際に
は、離散変換では、標本化信号は周期が有限のサンプル
期間の約数である周波数成分を持つのみであると仮定し
ている。これは、有限長の信号が周期性のものであると
仮定することに等しい。この仮定は一般的に正しくな
い。この仮定された周期性によって、有限時間期間の縁
において不連続性が生じ、これにより変換において擬似
の高い周波数が生じる。
【0015】この効果を最小化する1つの技法は、期間
の縁の近くのサンプルが0に近くなるように信号サンプ
ルを重み付けることによって、変換を行う前に非連続性
を低減することである。期間の中心にあるサンプルは一
般的に変更せずに、すなわち、係数1で重み付けて通過
させる。この重み付け関数は、「分析ウインドウ」と呼
ばれ、どのような形状でも良いが、幾つかのウインドウ
はサブバンドのフィルタ性能に一層有利に寄与する。
【0016】本明細書で用いているように、「分析ウイ
ンドウ」という用語は、順方向変換を適用する前に行わ
れるウインドウ処理関数を指しているに過ぎない。下で
論考するように、本発明中で用いる分析ウインドウの設
計は、合成ウインドウ設計要件によって制約される。し
たがって、広く同じ用語が用いられている当分野の「分
析ウインドウ」の設計及び性能特性は、本発明で実施さ
れている分析ウインドウとは異なる。
【0017】ウインドウの質を評価するのに用いること
ができる単一の条件はないが、他方、一般的な条件に
は、遷移帯域ロールオフの鋭さと阻止帯域の深さとが含
まれる。或る種の用途においては、鋭いロールオフと深
い阻止レベルとを兼ね合わせる能力が有益な特質とな
る。
【0018】分析ウインドウは時間領域関数である。も
し他の補償が行われなければ、復元若しくは「合成」さ
れる信号は、分析ウインドウの形状に従ってのひずみを
受ける。補償方法には幾つかあるが、例えば、以下のと
おりである。
【0019】(a) 復元された信号期間又はブロック
を、逆ウインドウ、すなわち、その重み付け係数が分析
ウインドウの重み付け係数の逆数であるウインドウで、
乗じる。この技法の短所は、分析ウインドウがその縁で
0にならないことを明確に必要とすることである。
【0020】(b) 連続的な入力信号ブロックを重複
させる。2つの隣接するウインドウが重複部分を横切っ
て一体的に合算されるように分析ウインドウを注意深く
設計することによって、このウインドウの効果は正確に
補償される。(しかし、次の節を参照のこと)。離散フ
ーリエ変換(DFT:Discrete Fourier Transform)の
ような或る形式の変換と共に用いる時には、この技法で
は、重複期間中の信号の一部を変換し、かっ2度伝送し
なければならないので、当該信号を表わすのに必要なビ
ット数が増加する。これらの形式の変換に対しては、可
能な限り小さい重複期間を有するウインドウを設計する
ことが望ましい。
【0021】(C) 逆変換からの合成出力にもウイン
ドウ処理を行う必要がある。本発明で用いている変換を
含む、幾つかの変換では、このウインドウ処理を要す
る。更に、量子化誤りによって、有限時間期間の縁にお
いて0とならない時間領域信号が逆変換に生じる。これ
をそのままにして置くと、この誤りによって、復元され
る時間領域信号はウインドウ重複期間内で最も強く歪ま
される。縁で各合成信号ブロックを整形するために、合
成ウインドウを用いることもできる。この場合、当該信
号は分析及び合成ウインドウで処理される。すなわち、
当該信号はこれら2つのウインドウの積によって重み付
けられる。したがって、この2つのウインドウの積が重
複部分を横切って一体的に合算されるように、両方のウ
インドウが設計されなければならない。これについて
は、前節における論考を参照のこと。
【0022】短い変換サンプル・ブロックでは、上記の
分析及び合成ウインドウに対してより大きな補償要件が
課される。変換サンプル・ブロックが短くなるにつれ
て、フィルタの遷移帯域及び阻止帯域を通してのサイド
ローブ漏洩が一層多くなる。良く整形された分析ウイン
ドウではこの漏洩が低減される。
【0023】サイドローブ漏洩は望ましくない。何故な
らば、サイドローブ漏洩によって、変換においてフィル
タの通過帯域の外側の信号成分の周波数を誤って表現す
るスペクトル係数が生じるからである。この表現誤りが
エイリアシングと呼ばれるひずみである。
【0024】エイリアシング相殺 ナイキストの理論では、サンプル間の期間が信号の最高
周波数成分の期間の半分より短ければ、離散サンプルか
ら信号を正確に復元できると考える。サンプリング・レ
ートがこのナイキスト・レートよりも小さければ、高い
周波数成分は低い周波数成分として誤って表わされる。
この低い周波数成分が真正成分に対する誤差である。
【0025】サブバンド・フィルタ及び有限ディジタル
変換は、完全な通過帯域フィルタではない。通過帯域と
阻止帯域との間の遷移は無限に鋭いものではなく、阻止
帯域中における信号減衰は無限に大きくはない。その結
果、通過帯域で濾波された入力信号が通過帯域遮断周波
数によって示されるナイキスト・レートで標本化される
としても、この遮断周波数よりも高い遷移帯域中の周波
数は忠実には表現されない。
【0026】エイリアシングひずみが逆変換によって自
動的に相殺されるように分析及び合成フィルタを設計す
ることは可能である。時間領域内の直角位相ミラー・フ
ィルタにはこの特性がある。本発明で用いている変換コ
ーダ技法を含めて、或る種の変換コーダ技法でも、エイ
リアシングひずみを相殺する。
【0027】サンプル・ブロック長を短くすればする
程、その結果として発生する聴取可能な変換コーダ中の
エイリアシングひずみを抑制するのが一層困難になる。
上で説明したように、短いサンプル・ブロック長によっ
てフィルタ特性が劣化する。すなわち、通過帯域幅が広
がり、通過帯域対阻止帯域の遷移がより鋭さを失い、阻
止帯域排除特性が劣化する。その結果、エイリアシング
がより一層目立つようになる。もしエイリアス成分が不
十分な正確さで符号化され復号されると、これらの符号
化誤りによって、エイリアシングひずみを逆変換で完全
に相殺することが妨げられる。残留エイリアシングひず
みは、音響心理学的に掩蔽されない限り聴取可能なもの
となろう、しかし、サンプル・ブロックを短くすること
によって、変換周波数ビンの幾つかは、特に聴覚上の臨
界帯域が最大の分解能力を有する低い周波数において、
聴覚上の臨界帯域よりも広い通過帯域を具えることにな
る。この結果として、エイリアシングひずみを掩蔽する
ことができない。このひずみを極少化する1つの方法
は、問題のサブバンド中での量子化精度を向上させるこ
とであるが、それによって必要なビットレートは増加す
る。
【0028】ビットレート低減技法 上で挙げた2つの要因(ナイキスト・サンプル・レート
及び量子化誤り)によって、特定品質の信号伝送又は記
憶に対するビットレート要件を決定すべきである。しか
し、各種技法を利用して、所与の信号品質に必要なビッ
トレートを低減することができる。これらの技法では、
信号の冗長性と無関係性を利用する。信号が予見できる
ものであるか、若しくは他の方法で受信機から得られる
ものであるならば、その信号成分には冗長性がある。も
し或る信号成分が特定品質の表現を達成するために不要
ならば、その信号成分は無関係である、当技術で用いら
れる幾つかの技法には、以下の事柄が含まれる。
【0029】(1) 予測:信号の周期的乃至は予知可
能な特性によって、現在の信号又は先行する信号の特性
に基づいて、幾つかの成分を受信機に予期させることが
できる。
【0030】(2) エントロピー符号化:省略符号に
よって、高い発生確率の成分を表現することができる。
この場合、送信機及び受信機の両方とも、同一のコード
・ブックを備えていなければならない。エントロピー符
号化及び予知には、計算の複雑さと処理による遅延とが
増大する短所がある。また、エントロピー符号化及び予
知では、本来、可変伝送速度の出力が与えられるので、
もし一定ビットレート系で用いるのであれば緩衝する必
要がある。
【0031】(3) 不均一符号化:対数又は不均一量
子化段による表現によって、量子化誤りが大きくなると
いう犠牲の下で、より少ないビットで大信号値の符号化
を行うことが可能になる。
【0032】(4) 浮動小数点:浮動小数点表現によ
って、精度が下がるという犠牲の下で、ビット要件を低
減することができる。ブロック浮動小数点表現では、1
ブロックの浮動小数点仮数に対して1つの位取り因子又
は指数を用いる。また、ブロック浮動小数点表現は、時
間領域信号を符号化する際に広く用いられる。浮動小数
点は、不均一符号化の特異例である。
【0033】(5) ビット割当て:正確さに対する受
信機への要求は、時間、信号内容、強さ、又は周波数に
伴って変化する。例えば、話し声のより低い周波数成分
は、通常、話し言葉を理解し話者を認識する上で一層重
要であるので、より高い周波数成分よりも一層高い精度
で伝送されなければならない、音楽信号に関しては、別
の基準が適用する。ビット割当てについての幾つかの一
般基準は、以下のとおりである。
【0034】(a) 成分変動:最大レベルの交流電力
を持っ変換係数に対しては、より多くのビットを割り当
てる。
【0035】(b) 成分値:最大振幅又はエネルギー
を持っ周波数帯を表現する変換係数に対しては、より多
くのビットを割り当てる。
【0036】(C) 音響心理学的マスキング:他の信
号成分によって量子化誤りが掩蔽される(聴取不能にさ
れ)信号成分に対しては、より少ないビットを割り当て
る。この方法は、可聴信号が人の聴覚を意図している用
途において独特である。マスキングは、音楽信号のよう
な多重音信号及び複号波形よりも、単音信号に関して最
も良く認識される。
【0037】音響心理学的マスキングと共に適応ビット
割当てを用いる変換に基づくエンコーダ及びデコーダの
例は、ノース・ホランドのエルゼフィア科学出版社の話
声通信、1897年第6巻の299ぺージから308ぺ
ージの、ジョンソンとブラットレイによる論文、「時間
領域エイリアシング相殺に関する適応変換符号化」(Jo
hnson, Bradley, "Adaptive Transform Coding Incorpo
rat-ing Time DomainAliasing Cancellation", Speech
Communications, Vol. 6, North-Holland, Elsevier Sc
ience Publishers, 1987, 00.299-308)中に叙述されて
いる。
【0038】
【課題を解決するための手段】本発明の目的は、主観的
な高音質を毎秒128kビット(kbs)程度の低ビッ
トレートで提供する、符号化及び複号化の装置と方法と
を用いて、広帯域のオーディオ情報、とりわけ、音楽の
ディジタル処理を行うことである。
【0039】本発明の更なる目的は、再生の品質が高品
質の伝送又は記憶及び再生に適する、例えば放送用オー
ディオ網のような高品質の再生に適する符号化及び復号
装置と方法を提供することである。
【0040】本発明の更なる目的は、コンパクト・ディ
スクで得られる品質程度に主観的に良好な、再生の品質
を提供することである。
【0041】本発明の更なる目的は、ディジタル処理系
中で実現される、伝送通路による信号の悪化に対して高
度の耐性を有する符号化及び復号化の装置と方法を提供
することである。
【0042】本発明の更なる目的は、符号化された信号
を記憶するのに少量の空間しか必要としない、ディジタ
ル処理系中で実現される符号化及び復号化の装置と方法
を提供することである。
【0043】本発明のもう1つの目的は、音楽信号を処
理する変換コーダ中に、改良された音響心理学的マスキ
ング技法を提供することである。
【0044】加えて、本発明のもう1つの目的は、変換
コーダ中の聴取可能なひずみ人工物に関して音響心理学
的に補償する技法を提供することである。
【0045】上記の本発明の目的の詳細については、当
明細書の全体を通して説明するが、以下の「発明を実施
するための望ましい形態」を叙述する節で特に詳しく説
明する。
【0046】本発明の教示に従って、エンコーダによっ
て広帯域オーディオ情報のディジタル符号化が行われ
る。この広帯域オーディオ信号は、標本化され、時間領
域サンプル・ブロックに量子化される。その後、各サン
プル・ブロックは分析ウインドウによって変調される。
その後、周波数領域のスペクトル成分が、分析ウインド
ウによって重み付けられた時間領域サンプル・ブロック
に応答して発生される。適応ビットの割当てを行う変換
コーダによって、各変換係数が、不均一に量子化され、
これらの係数の記憶又は伝送に適するフォーマットを有
するディジタル出力に組み立て、すなわち、アセンブル
される。伝送信号が通信線路の雑音又はその他の悪化の
影響を受ける用途においては、誤り訂正符号を用いても
良い。
【0047】更に本発明の教示に従って、本発明のエン
コーダによって符号化されたディジタル符号化広帯域オ
ーディオ信号の高品質の再生が、本発明のデコーダによ
って行われる。エンコーダのディジタル出力が、記憶要
素又は伝送線路を経由してデコーダに受け取られる。デ
コーダによって、不均一に符号化されたスペクトル成分
がフォーマット化されたディジタル信号から誘導され、
この成分から周波数領域スペクトル成分が再構築され
る。この時間領域のスペクトル成分を発生したエンコー
ダ中の要素に対して逆の特性を具える要素によって、周
波数領域のスペクトル成分に応答して時間領域信号サン
プル・ブロックが発生される。これらのサンプル・ブロ
ックは合成ウインドウによって変調される。この合成ウ
インドウは、この合成ウインドウの応答特性とエンコー
ダ中の分析ウインドウの応答特性との積によって、隣接
する2つの重複サンプル・ブロックに関して一体的に合
算するような複合応答特性を作り出す特性を具えてい
る。隣接するサンプル・ブロックは、重複、加算され
て、分析及び合成ウインドウの重み付け効果が相殺さ
れ、その後、高品質のアナログ出力に変換される時間領
域信号のディジタル化された表現が復元される。
【0048】更に本発明の教示に従って、エンコーダ・
デコーダ系によって、広帯域オーディオ情報のディジタ
ル符号化と高品質の再生とが行われる。この系のエンコ
ーダ部分においては、アナログ広帯域オーディオ信号が
時間領域サンプル・ブロックに標本化され、量子化され
る。その後、各サンプル・ブロックは、分析ウインドウ
によって変調される。その後、周波数領域のスペクトル
成分が、分析ウインドウによって重み付けられた時間領
域サンプル・ブロックに応答して、発生される。適応ビ
ット割当てを含む不均一スペクトル符号化によって各ス
ペクトル成分が量子化され、これらの成分は、信号の悪
化を受け易い記憶、又は通信通路を通しての伝送に適す
るディジタル・フォーマットを有する、ディジタル出力
にアセンブルされる。この系のデコーダ部分によって、
エンコーダ部分のディジタル出力が、記憶要素又は伝送
線路を経由して受け取られる。このデコーダ部分によっ
て、フォーマット化ディジタル信号から不均一に符号化
されたスペクトル成分が誘導され、この成分から周波数
領域のスペクトル成分が再構築される。時間領域サンプ
ル・ブロックが、周波数領域変換係数に応答して、周波
数領域変換係数を発生したエンコーダ部分中の要素に対
して逆の特性を具える要素によって、発生される。この
サンプル・ブロックは、合成ウインドウによって変調さ
れる、この合成ウインドウは、この合成ウインドウの応
答特性とエンコーダ部中の分析ウインドウの応答特性と
の積によって隣接する2つの重複サンプル・ブロックに
関して一体的に合算する複合応答特性を作り出すような
特性を具えている。隣接するサンプル・ブロックは、重
複され、加算されて分析及び合成ウインドウの重み付け
効果を相殺し、その後高品質のアナログ出力に変換され
る時間領域信号のディジタル化された表現が復元され
る。
【0049】本発明のエンコーダの実施例においては、
離散変換によって、周波数領域スペクトル成分が、分析
ウインドウで重み付けられた時間領域サンプル・ブロッ
クに応答して発生される。この離散変換には、改良型の
離散余弦変換(DCT:Discrete Cosine Transform)
と、改良型の離散正弦変換(DST:Discrete Sine Tra
nsform)と等価の関数を具えていることが好ましい。代
替的な実施例においては、この離散変換は、単一の改良
型の離散余弦変換(DCT)によって実施されるが、実
質的に総ての時間領域対周波数領域変換を用いることが
できる。
【0050】エンコーダに関する本発明の好ましい実施
例においては、単一のFFTを利用して、単一チャネル
系では隣接する2つの信号サンプル・ブロックに関し
て、若しくは、2チャネル系では各チャネルの1つの信
号サンプル・ブロックに関して、順方向変換を同時に計
算する。デコーダに関する本発明の好ましい実施例にお
いては、単一のFFTを利用して、2つの変換ブロック
に関して逆変換を同時に計算する。
【0051】エンコーダ及びデコーダのこれらの好まし
い実施例においては、サンプリング・レートは44.1
kHzである。このサンプリング・レートは、決定的な
ものではないが、この44.1kHzは、適切なサンプ
リング・レートであり、また、コンパクト・ディスクに
用いられているサンプリング・レートでもあるので、便
利である。この44へ1kHzのサンプリング・レート
を用いている好ましい実施例においては、名目周波数応
答特性は15kHzまで延びており、時間領域サンプル
・ブロックは512サンプルの長さを具えている。本発
明の好ましい実施例においては、職業用放送局用途に適
する主観的な品質水準での音楽の符号化は、毎秒128
kビット(誤り訂正符号のような余分な情報を含めて)
程度の低いビットレートで達成される。本発明の基本的
な神髄から逸脱せずに、信号品質の異なる水準をもたら
す、これ以外のビットレートを用いることもできる。
【0052】このエンコーダの好ましい実施例において
は、不均一変換コーダによって、可変長のコード・ワー
ドが各変換係数について計算される。各変換係数のコー
ド・ワードのビット長は、固定ビット数と、現状の信号
内容のためにサブバンド中の雑音が他のサブバンド中の
雑音よりも音響心理学的にマスクされ易いかどうかに基
づく適応ビット割当てによって決定される可変ビット数
との合計である。この固定ビット数は、対象のサブバン
ド中での単音についての音響心理学的マスキング効果に
関する経験的観察に基づいて、各サブバンドに対して割
り当てられる。この固定ビット割当てでは、低い周波数
における耳の選択度がより大きいことによって、低い周
波数においでは系の性能が主観的に低下することについ
て考慮を払っている。複合信号が存在する際のマスキン
グ性能は、通常・単音信号が存在する際のマスキング性
能よりも良好であるが、複合信号が存在する際のマスキ
ング効果は、良く理解されておらず、また予測できるも
のでもない。この系では、ビットの多くが固定ビットで
あり、比較的僅かのビットしか適応的に割り当てないと
いう点で、積極的なものとは言えない。この方法には、
幾つかの長所がある。その第1は、必要な固定ビットの
割当てを行った経験的手続には逆変換過程を含んでいた
ので、この固定ビット割当てでは逆変換によって作り出
される望ましくないひずみを本来的に補償することであ
る。第2に、適応ビット割当てのアルゴリズムを比較的
単純に維持することができることである。これに加え
て、エンコーダとデコーダとの間で生じる信号伝送誤り
は、デコーダ中のビットに対する値となると同時に不正
確な割当てともなるので、適応的に割り当てられたビッ
トはこのような誤りに対して一層敏感であることであ
る。
【0053】本発明によるビット割当てに関する経験的
技法については、図13を参照することによって、より
良く理解できるであろう。図13では、500Hzの信
号音(正弦波)から生じる、出力雑音及びひずみの重要
な臨界帯域スペクトル(すなわち、ここに示してある雑
音及びひずみは、聴覚上の臨界帯域に関するものであ
る)を、3つの異なるビット割当てに関して、聴覚上の
マスキングと比較して示している。この図では、特定の
データを示すことよりむしろ、経験的な方法を示すこと
を企図している。
【0054】割当てA(実線)は基準であり、任意の数
のビットを各変換係数に対して割り当てた時の、500
Hzの正弦波によって作り出される雑音及びひずみの積
を示している。割当てB(短い線の点線)は、割当てA
と同じ相対的割当てであるが、変換係数当たり2っ少な
いビットを音する雑音及びひずみの積を示している。割
当てC(鎖線)は、オーディオ帯域の1500Hzまで
の低い周波数部分に対して、割当てAと同じ割当てを与
えた場合を示している。割当てCは、約1500Hzか
ら上の高い周波数部分に対しては、割当てBと同じであ
る。点線は、500Hzについての聴覚上のマスキング
を示している。
【0055】以上の3つのビット割当て事例の総てにつ
いて、マスキング曲線の急激な低下による聴取可能な雑
音が500Hzの信号音以下の周波数において存在する
こと、すなわち、約100Hzから300乃至400H
zにかけて、雑音及びひずみの積がマスキングしきい値
より上にあることが観察されるであろう。ビットを2つ
少なくしたこと(割当てAに対する割当てB)によっ
て、聴取可能な雑音及びひずみが悪化するが、割当てC
に示すように、500Hzの信号音以下の領域を含むス
ペクトルにこの2ビットを加え戻すことによって、元の
聴取可能な雑音反びひずみの水準を回復する。聴取可能
な雑音は、高い周波数においても存在するが、オーディ
オ・スペクトルの極めて高い部分において500Hzの
信号音によって作り出される雑音及びひずみの積は比較
的低いことから、ビットを滅らしたり追加した際にも、
実質的に変化しない。
【0056】種々の周波数の信号音に応答して作り出さ
れる雑音及びひずみを、種々のビット割当てについて観
察することによって、オーディオ・スペクトル全体にわ
たって聴取可能なマスキングに関して受容できる雑音及
びひずみの水準となる、種々の変換係数に対するビット
長を割り当てることができる。図13の例に関しては、
約100Hzから300乃至400Hzまでの領域中の
マスキングしきい値以下の雑音及びひずみの積の水準を
低減するために、雑音及びひずみがマスキングしきい値
より低くなるまで、500Hzの信号音を含む変換係数
及びそれと至近の変換係数に関する基準割当てに対して
追加ビットを加えても良い。他の信号音に対しても、オ
ーディオ・スペクトル全体にわたって、信号音が存在す
る際に総合的変換係数ビット長割当てが受容できる雑音
となるまで、同様な段階を一度に1つずつ踏むことがで
きよう。これは、コンピュータ・シミュレーションによ
って、最も容易に行われる。スペクトル全体を通して各
変換係数から1っ又は2っ以上のビットを取り除くこと
によって、固定ビット割当て(割当てBのように)が行
われる。必要に応じて、適応割当てビットが加えられて
(割当てCのように)、問題の領域において聴取可能な
雑音が受容できる水準まで低減される。かくして、図1
3に示す例のようなビットの割当てに対する聴取可能な
雑音の増減に関する経験的観察によって、本発明の固定
及び適応ビット割当て構想の基盤が形成される。
【0057】このエンコーダの好ましい実施例において
は、不均一量子化変換係数は、ブロック指数と可変長コ
ード・ワードとから成る、ブロック浮動小数点表現によ
って表される。上で述べたように、この可変長コード・
ワードは、更に、適応割当てビットの固定ビット長部分
と可変長部分とから成る。1組の変換ブロックに対する
符号化信号は、指数と、総ての適応割当てビットの1群
が続くコード・ワードの固定長部分とによって構成され
るフレームに組み立てられる。コード・ワードの指数及
び可変長部分は、適応割当てビットから別個に組み立て
られて、突発雑音誤りに対する脆弱性が低減される。
【0058】先行技術でのエンコーダとは異なり、本発
明によるエンコーダでは、各フレーム中の適応割当てビ
ットの割当てに関する副次的な情報を伝送する必要がな
い。本発明のデコーダでは、エンコーダで用いられた割
当てアルゴリズムと同一の割当てアルゴリズムを用いる
ことによって、正しい割当てを誘導することができる。
【0059】フレーム同期を必要とする用途において
は、本発明のエンコーダ部分によって、フォーマット化
されたデータが同期ビットに対して補足される。このフ
ォーマット化データ・ビットは、最初に無作為化され、
それにより1又は0のビットの長い列が生じる確率が低
減される。これは、特定の長さを超える長い連続を許容
しない、T−1搬送のような多くの環境において必要な
ことである。非同期の用途では、無作為化によって、フ
レーム内の有効データがブロック同期列と誤認される確
率もまた低減される。本発明によるデコーダ部分では、
フレーム同期データ・ビットを取り除き、逆無作為化を
適用することによって、フォーマット化データが復元さ
れる。
【0060】符号化信号が悪化する可能性のある用途に
おいては、誤り訂正符号を用いて、最重要情報、すなわ
ち、指数、及び有り得る低い周波数の係数コード・ワー
ドの部分が保護される。フォーマット化されたフレーム
全体に誤り符号、及び上記の保護されたデータが分散さ
れて、突発雑音に対する感度が低減され、必要とされる
突発雑音の長さが重要データの訂正ができるまで増加さ
れる。
【0061】本発明の種々の特長及び本発明の実施例に
ついては、「発明を実施するための望ましい形態」を述
べる以下の節、及び添付図面中で、より詳細に説明す
る。
【0062】
【実施例】1.本発明の望ましい実施例 図1a及び図1bには、本発明の基本的な構造が示され
ている。図1aに示す本発明のコーダ部分は、時間領域
信号入力100、信号標本化及び量子化要素101、信
号サンプル・バッファ102、各ディジタル化時間領域
信号ブロックを変調する分析ウインドウ乗算要素(マル
チプレクサ)103、量子化信号を周波数係数に変換す
るディジタル・フィルタバンク104、整数値の変換係
数の各々を浮動小数点表現に転換するフロック浮動小数
点エンコーダ105、総合的信号のスペクトル構成に従
って各変換係数の表現に対してビットを割り当てる適応
ビット割当て要素106、割り当てられたビット長に各
変換係数を丸める均一量子化装置107及び符号化され
た周波数係数を伝送又は記憶のためにビット・ストリー
ムにアセンブルするフォーマッタ (フォーマット化要
素)109である。図1aは伝送通路110を示すが、
後で使用するために被符号化信号が直ちに記憶され得る
ことは理解されるべきであろう。
【0063】図1bに示す本発明のデコーダ部分は、以
下の部分から成る。すなわち、符号化されたビット・ス
トリーム信号入力111、符号化された周波数係数の各
々を組み立てられたビット・ストリームから抽出するデ
フォーマッタ112、各変換係数を整数値の変換係数に
転換する線形化要素113、変換係数を時間領域信号ブ
ロックに転換する逆ディジタル・フィルタバンク11
4、時間領域信号ブロックを変調する合成ウインドウ乗
算要素115、時間領域信号のディジタル表現を復元す
る信号ブロック重複・加算要素116、アナログ・デジ
タル変換要素117、及びアナログ信号出力118であ
る。
【0064】A.演算ハードウエア 本発明の基本的なハードウエアの構成は、図2a及び図
2b、図3、図4a及び図4b並びに図5a及び図5b
に示され。所与の性能目標を達成するためには、経験的
研究から、在来の整数変換計算は少なくとも20有効ビ
ットの精度で行われなければならないことが分かってい
る。
【0065】44.1kHz又は48kHzの何れかの
サンプル・レートを用いる、本発明の単一チャネル版の
好ましい実施例の実現においては、時間領域入力信号を
20μs以下の周期時間で量子化する、16ビットのア
ナログ対ディジタル・コンバータ(ADC)を利用して
いる。16ビットのディジタル化されたサンプルの各々
を用いて、後続の計算で用いられる24ビットのワード
の有意16ビットが形成される。待ち時間なしの、2
0.5MHzで動作するモトローラ(Motorola)社製D
SP56001型ディジタル信号プロセッサ(DSP)
を用いて、必要な計算が行われ、符号化・複号化過程が
制御される。スタティック等速呼出記憶要素(RAM)
によって、DSPに対するプログラム化とデータ記憶と
が行われる。周期時間20μs以下の16ビットのディ
ジタル対アナログ・コンバータ(DAC)を用いて、複
合されたディジタル信号からアナログ信号が発生され
る。
【0066】図2aに示すエンコーダのハードウエアの
構成は、以下のものから成る。すなわち、アナログ信号
入力200、低域フィルタ(LPF)200A,ADC
201,DSP 202、スタティックRAM 20
3、消去可能固定記憶要素(EPROM)204、及び
符号化されたシリアル信号出力206である。LPF2
00A20(図1aに示されていない低域フィルタ)に
よって、入力信号が帯域幅制限されることが保証され
る。ADC 201によって、入力信号がシリアルの1
6ビットのワードにディジタル化(標本化及び量子化)
される。DSP 202によって、ディジタル化された
サンプルのシリアル・ストリームが受け取られ、緩衝さ
れ、サシプルがブロックにグループ化され、ブロックを
周波数領域に変換するために必要な計算が行われ、変換
係数が符号化され、コード・ワードがデータ・ストリー
ムにフォーマット化され、符号化信号がシリアル・デー
タ通路206を通して伝送される。このDSPのための
プログラミング及びデータ作業領域は、2組の8,19
2個の24ビット・ワードに秩序立てられているスタテ
ィックRAM 203の2つの24kBバンク中に記憶
される、このDSPには、RAM中ではプログラマブル
ROM中で実現されるよりも一層安価に実現される、短
呼出時間プログラム記憶要素が必要である。その結果、
EPROM 204では、エンコーダが最初に起動され
る時にDSPによってRAM 203で使用できる形式
で中身が取り出される圧縮フォーマット中に、プログラ
ミング及びスタティック・データが記憶される。
【0067】図2b及び図3では、2つのDSPインタ
ーフェイスについて更に詳細に示されている、図2bに
は、DSP 202及びADC 201のためのシリア
ル通信インターフェイスと、ADC 201と、シリア
ル・データ通路206とが示されている。タイミング発
生要素202Aによって、エンコーダのための、受取り
クロック、フレーム同期クロック、及び伝送クロック信
号が発生される。線路SCOによって、ADC 201
からDSP 202へと、線路SRDに沿ってディジタ
ル化人力信号サンプルのシリアル・ビット・ストリーム
にクロック同期が掛けられる。線路SC1によって、各
16ビット・ワードの始まりを標識するフレーム同期信
号が、ADC及びDSPに対して与えられる。線路SC
Kによって、DSPからシリアル・データ線路206へ
と、線路STDに沿って符号化信号のシリアル・ビット
・ストリームにクロック同期が掛けられる。
【0068】図3には、メモリをアドレスするインター
フェイスが示されている。前記のモトローラ社のDSP
56001のためのメモリは、プログラム、Xデータ、
及びYデータの3つのセグメントに分割されている。R
AMのバンクの1つにはプログラム・メモリが含まれて
いるが、DSPによって線路PSが低電位にされると何
時でもこれが選択される。第2のバンクにはデータ・メ
モリが含まれているが、線路DSが低電位にされると何
時でもこれが選択される。線路XYを高電位にしたり、
低電位にしたりすることにより、それぞれXデータ・メ
モリとYデータ・メモリとがDSPによって選択され
る。線路XYをアドレス線路A12に取り付けることに
よって、Xデータ・メモリとYデータ・メモリとは別の
アドレス空間に位置付けされる。したがって、Yデータ
・メモリの4kワード(4096又は24ビット・ワー
ドの100016)がワード・アドレス0000から0
FFF16に位置付けされ、Xデータ・メモリの4kワ
ードがワード・アドレス100016から1FFF16
に位置付けされ、プログラム・メモリは8kワードの自
身の空間中にあり、ワード・アドレス0000から0F
FF16から成る。
【0069】プログラム・データRAM 203及びE
PROM 204は、別のアドレス空間に位置付けされ
る。インバ一夕205Cによって、DSP 202が、
アドレス線路A15の状態に従ってRAM又はEPRO
Mの何れかを選ぶことが可能になる。DSP 202に
よってA15が高電位に設定されると、インバータ20
5CによってRAM203及びEPROM 204のチ
ップ選択(CS)線路は低電位に設定される。DSP
202によってA15が低電位に設定されると、インバ
ータ205CによってRAM 203及びEPROM
204のCS線路は高電位に設定される。CS線路が高
電位に設定されると、スタティックRAMのみが選択さ
れる。
【0070】図4aに示されるデコーダのハードウェア
の構成は、符号化シリアル信号入力通路207、DSP
208、スタティックRAM 209、EPROM
210、DAC 212、LPF 213A、及びアナ
ログ信号入力213から成る。DSP 208によっ
て、符号化信号が受け取られ、緩衝され、この信号のフ
ォーマットが符号化変換係数に分解され、この係数を時
間領域に変換するのに必要な計算が行われ、この係数が
時間領域ブロックにグループ化され、このブロックが重
複・加算されてディジタル・サンプルの時間領域別にさ
れ、このディジタル・サンプルがシリアル・ビット・ス
トリームの形でDAC 212に伝送される。DSPに
関するプログラミング及びデータ作業領域は、2つの
8,192個の24ビット・ワードに順序立てられてい
るスタティックRAM 209の2つの24kBバンク
に記憶される。EPROM 210によって、エンコー
ダが最初に起動する時にRAM 209に対して使用で
きる形式でDSPによって中身が取り出される圧縮フォ
ーマットで、プログラミング及びスタティック・データ
が記憶される。DAC 212によって、DSPから受
け取られるシリアル・データ・ストリームに対応するア
ナログ信号が発生される。LPF 213A(図1bに
は示されていない低域フィルタ)によって、出力信号2
13がこの符号化・復号過程で作り出されるあらゆる高
域擬似信号から免れることが保証される。
【0071】図4bには、DSP 208のためのシリ
アル通信インターフェイスと、シリアル信号入力通路2
07と、DAC 212とが示されている。フェーズ・
ロック・ルーフを用いて符号化シリアル・ビット入力信
号からタイミング基準を抽出するタイミング発生器20
8Aによって、このデコーダのための、受取りクロッ
ク、フレーム同期クロック、及び伝送信号が発生され
る。線路SC0によって、DSP 208へ、線路SR
Dに沿って符号化シリアル・ビット信号のクロック同期
が掛けられる。線路SCKによって、DSP 208か
らDAC 212へと、線路STDに沿って複号ディジ
タル化信号のシリアル・ビット・ストリームのクロック
同期が掛けられる。線路SC2によって、DACと、D
SPとに対してフレーム同期信号が与えられ、これによ
って、各16ビット・ワードの始まりが標識される。D
SP 208とメモリ・アドレス・バスとの間のインタ
ーフェイスは、エンコーダについて上に述べたのと同様
な方法で実現される。図4bを参照して欲しい。
【0072】2チャネルのエンコーダでは、図5aに示
すように結合された、LPF 200A及び200B
と、ADC 201A及び201Bとが必要である。D
SP及びADCの構成要素間のインターフェイスは、1
チャネルのエンコーダについて上に述べたのと類似の方
法で動作する・タイミング発生器202Aによって、フ
レーム同期信号の半分の伝送速度でDSPの線路SC2
に対して付加的な信号が与えられて、マルチプレクサ2
02Bが制御され、2つのADCの何れがディジタル化
データを現在送っているかがDSPに対して指示され
る。
【0073】2チャネルのデコーダでは、図5bに示す
ように結合されたDAC212A及び212Bと、LP
F22013A及び213Bとが必要である。DSP及
びDACの構成要素間のインターフェイスは、1チャネ
ルのデコーダについて上に述べたのと類似の方法で動作
する。タイミング発生器208Aによって、フレーム同
期信号の半分の伝送速度でDSPの線路SC1に対して
付加的な信号が与えられて、デマルチップレクサ208
Bが制御され、2つのDACの何れがディジタル化デー
タを現在受け取っているかがDSPに対して指示され
る。
【0074】この基本的なハードウエア構成を改変する
ことができる。例えば、待ち時間なしの、27MHzで
動作するモトローラ社のDSP65001 1個によっ
て、2チャネルのエンコーダ又はデコーダを実現でき
る。この場合、追加のRAMが必要となるかもしれな
い。
【0075】特別のハードウェアを用いて、ウインドウ
変調又は高速フーリェ変換(FFT:Fast Fourier Tra
nsform)のような幾つかの機能を行うこともできる。こ
の総合的なエンコーダ・デコーダを特別仕立ての集積回
路中で実現することもできる。これ以外にも数多くの実
施方法があることは、当業者にとっては明白であろう。
【0076】B.入力信号の標本化とウインドウ処理 本発明の現在の実施例において、信号標本化及び量子化
要素101は、引き続いて右側に8個の0ビットが引き
当てられて24ビットの整数表現を形成する16ビット
に入力信号を量子化する、アナログ対ディジタル・コン
バータである。後続の変換計算は総て、24ビットの整
数計算で行われる。アナログ入力信号は、最高でも15
kHz(20kHz帯域幅コーダに関しては、20kH
z)に帯域幅を制限しなければならない。これは、図1
aには示されていない低域フィルタによって達成され
る。
【0077】他の品質に加えて、少なくともコンパクト
・ディスク(CD)が具える品質の音楽信号は、15k
Hzを超える帯域幅を有する。ナイキストの理論から、
15kHzの帯域の信号は30kHz以上で標本化され
なければならないことは周知のことである。44.1k
Hz のサンプル・レートがCD用途に用いられてお
り、このサンプル・レートを選択することによって本発
明をこのような用途に用いる要素が単純化されるので、
現在の実施例に対しては44.1kHzのサンプル・レ
ートが選ばれている。(このサンプル・レートによっ
て、本発明の20kHz帯域幅の代替的実施例をも実施
できる)。
【0078】別のサンプル・レート、つまり、多くの職
業用オーディオ用途に一般的となっている48kHzの
ようなサンプル・レートを用いることもできる。もし異
なるサンプル・レートが選ばれると、隣接する変換係数
間の周波数分離が変化し、望ましい信号帯域幅を表現す
るために必要な係数の数が変化する。サンプル・レート
を変えた際に本発明の実施例が受ける総ての影響につい
ては、当業者にとっては明白であろう。
【0079】入力信号が複素数でない、すなわち、虚数
成分の総てが0であると仮定すると、512サンプル・
ブロックの周波数領域変換によって、最大256の非0
の特異変換係数が作り出される。したがって、図1a及
び図1bに示す本発明は、256の周波数ビンから成
る。この実施例において、各ビンの帯域幅は86.1H
z(又は44.1kHz/512)に等しい。(幾つか
の離散変換に関しては、ビン0、すなわち直流又は0周
波数は、この量の半分に等しい帯域幅を有する)。1
5.6kHzの信号を通過させるために、0から182
までの係数のみが用いられる。(20kHzの信号を通
過させるためには、0から233までの係数が用いられ
る)。入力信号の帯域幅を超える追加の高い周波数係数
は、エイリアシング消去を行った際の設計帯域幅内での
量子化誤りの悪効果を最小化するために用いられる。入
力信号が15kHz(又は20kHz)に帯域幅制限さ
れ、最終的出力信号もまた帯域幅制限されて、最高係数
中を通過するあらゆるエイリアシングが相殺されている
ことに注意して欲しい。
【0080】変換では、サンプル・ブロック中の信号は
周期性のものであると仮定しているので、サンプル・ブ
ロックが改変、すなわち、修正されない限り、存在しな
いスペクトル成分を誤って作り出す。図6aを参照のこ
と。この変換誤りは、図6bに示すようにブロックの縁
の不連続性に起因している。これらの不連続性を緩和し
て、この効果を最小化することもできる。ブロックの縁
の近くにあるサンプルを0に近付けるように、ブロック
をどのようにして改変又は重み付けするかについて図7
aから図7dまでに示してある。図7a図に示すマルチ
プレクサの回路によって、図7bに示す標本化入力信号
x(t)が図7cに示す重み付け機能により変調され
る。この結果生じる信号を図7dに示す。この過程は図
1aのボックス103で表される。分析ウインドウと呼
ばれるこの重み付け関数は、信号サンプル・ブロックの
サンプルごとの乗算であるが、この形状によってディジ
タル・フィルタの性能に強い影響を与えるので、数多く
の研究の主題となってきた。その例として、ハリスによ
るIEEE学会誌1978年66巻51ぺージから83
ページまでの論文、「離散フーリェ変換を用いた高調波
分析のためのウインドウの使用について」(Harris,“0
n the Use of Win-dows for Harmonic Analysis with t
he Discrete Fourier Transform”, Proc.IEEE, vol. 6
6, 1978, pp. 51-83)を参照のこと。要約すると、良好
なウインドウによって、阻止帯域幅の深さの所与の水準
に対する遷移帯域ロールオフの鋭さが増大され、隣接す
るブロックを重複・加算することによりウインドウの変
調効果を修正することが可能になるということである。
ウインドウの設計については、以下で更に詳しく論考す
る。
【0081】C.分析フィルタバンク、順方向変換 離散変換によって、図1aに示すディジタル・フィルタ
バンク104が実現される。フィルタ作用は、時間領域
信号サンプル・ブロックを時間変化スペクトル係数に転
換することによって行われる。本発明の1つの実施例で
用いられているこの変換技法は、IEEEの音響、音
声、信号処理に関する学会誌1986年ASSP−34
巻1153ぺージから1161ぺージまでの、プリンセ
ンとブラッドリーによる論文、「時間領域エイリアシシ
グ相殺に基づく分析・合成フィルタバンクの設計」(Pr
incen and Bradley, “Analysis/Synthesis Filter Ban
k Design Based on Time Domain Aliasing Can-cellati
on”,IEEET Trans. on Acoust., Speech, Sig-nal Pro
c., vol. ASSP-34, 1986, pp. 1153-161)中で初めて叙
述された。この技法は、偶数に重ねられ、厳密に標本化
された単側波帯分析・合成系の時間領域等価である。本
出願では、この変換を、偶数に重ねられた時間領域エイ
リアシング相殺(Evenly-Stacked Time-D0-main Aliasi
ng Cancellatlon: E−TDAC)と呼ぶ。この技法
は、1987年ICASSP会議報告、1987年5月
号の2161ページから2164ページまでのブリンセ
ン、ジョンソン、とブラッドリーによる論文、「時間領
域エイリアシング相殺に基づく分析・合成フイルタ・バ
ンクの設計を用いてのサブバンド・変換符号化」(Prin
cen,Johnson, and Brsdley, “Subband/Trans-form Cod
ing Using Analysis/Synthesis Filter Bank Design Ba
sed on Time Domain Aliasing Cancella-tion”, ICASS
P 1987 Conf. Proc., May 1987, PP. 2161-64)中に叙
述されている。この代替的変換は、奇数に重ねられ、厳
密に標本化された単側波帯分析・合成系の時間領域等価
である。本出願では、この変換を、奇数に重ねられた時
間領域エイリアシング相殺(0ddly-Stacked Time-Domai
n Aliasing Cancellation:O−TDAC)と呼ぶ。0−
TDAC変換を用いる本発明の実施例については、E−
TDACの実施例について十分叙述した後に論考する。
【0082】E−TDACでは、改変された離散正弦変
換(Dis-crete Sine Transform:DST)を伴う改変さ
れた離散余弦変換(Discrete Cosine Transform:DC
T)の代替的応用に等価の変換関数を利用する。DCT
は以下の式1、DSTは以下の式2に示される。すなわ
ち、
【0083】
【式1】 ここで、 k=周波数係数番号 n=入力信号サンプル番号 N=サンプル・ブロック長 m=E−TADCに関する位相項 X(n)=サンプルnにおける入力信号X(t)の量子
化数 C(k)=DCT係数k S(k)=DST係数kである。
【0084】E−TDAC変換では、2組のスペクトル
係数又は変換ブロックの1つが各信号サンプル・ブロッ
クに対して交互に作り出される。これらの変換ブロック
は、次式の形を取る。すなわち、
【0085】
【式2】 ここで、 i=信号サンプル・ブロック番号 C(k)=DCT係数(式1を参照のこと) S(k)=DST係数(式2を参照のこと) である。
【0086】ここで用いられる計算アルゴリズムは、高
速フーリエ変換(FFT)である。クーリーとテューキ
ーによる数学計算誌1965年19巻、297ページか
ら301ぺージまでの論文、「複体フーリエ・シリーズ
の機械計算のためのアルゴリズム」(Cooley and Tuke
y, “An Al-gorithm for the Machine Calculation ofC
omplex Fourier Series”, Math. Comp., vol. 19, 196
5, PP. 297-301)を参照のこと。単一のFFTを用いて
単一複素変換の実数及び虚数成分としてDCT及びDS
Tをそれそれ決定することによって、DCT及びDST
を同時に行うことができる。この技法では、FFTは複
素変換であるが、両方の入力信号サンプル・ブロックは
実数値のサンプルのみから成るという事実を利用してい
る。これらの変換を1つのFFTと一連の複素定数との
積に因数分解することによって、DCT係数が1組の実
数値として変換から出現し、DST係数が1組の虚数と
して表される。したがって、1つの信号サンプル・ブロ
ックのDCTを、もう1つの信号サンプル・ブロックの
DSTと共に、複体アレイの乗算及び加算が後に続くた
だ1つのFFTによって、同時発生的に計算することが
できる。
【0087】1つのFFTを用いて2つの変換を同時発
生的に計算するこの基本的な技法は、当分野では周知の
ものであり、ニュー・ジャージイ州イングルウッド・ク
リフズのプレンティス・ホール社1974年出版の、ブ
リガムによる「高速フーリェ変換」(Brigham, TheFast
Fourier Transform, Englewood Cliffs, NJ: Prentice
-Hall, Inc.,1974)に叙述されている。E−TDACに
対する改変DCT及びDSTの同時発生的な計算に関す
る追加的な情報は、カリフォルニア州スタンフォードの
スタンフォード大学の、ルッカボウによる1988年6
月の博士学位論文、「音声の可変レート及び適応周波数
領域ベクトル量子化」(Lookabaugh,“Variable Rate a
nd Adaptive Frequency Domain Vector Quantization o
f SPeech”, Stanford, CA: Stanford University, PhD
Thesis, June, 1988)中に見ることができる。
【0088】本発明の1チャネル版の好ましい実施例で
は、2つの隣接する信号サンプル・フロックは、バッフ
ァに記憶され、共にDCT・DSTペアに変換される。
このブロック・ペアは、続いて伝送と記憶のために量子
化され、フォーマット化される。
【0089】2チャネル系では、2チャネルの各々から
の信号サンプル・ブロックを処理すること、すなわち、
DSTブロックをユつのチャネルに対して発生し、DC
Tブロックを第2のチャネルに対して発生することによ
って、同時発生的な処理が達成される。所定のチャネル
に対する符号化ブロックは、DCTとDSTとの間を交
互し(式5及び29を参照のこと)、それぞれのチャネ
ルの形式とは常に逆の形式になる。
【0090】プリンセンは、適正な位相成分m、及び注
意深く設計された1組の分析・合成ウインドウを用いる
ことによって、E−TDAC技法では以下の形式の余弦
及び正弦変換の交互する列から正確に入力信号を復元で
きることを示している。すなわち、 {C(k)}0, {S(k)}1, {C(k)}2, {S(k)}3,・・・ (5) である。ここで、各変換ブロックは、1つの時間領域信
号サンプル・ブロックを表す。この過程は、図14aか
ら図14eまでと、図15aから図15dまでと、図1
6aから図16gまでに示されている。
【0091】図14aを参照すると、1組の量子化され
た入力信号x(t)がブロックにグループ化されている
ことが分かる、図14bに示すウインドウ関数Wで変
調された1組のブロックによって、図14dに示す信号
(t)が作り出される。信号x(t)はDCTに
対する入力である。標本化された入力信号x(t)のブ
ロックの別の1組は、第1の組とブロック長の半分だけ
重複されるが、図14cに示すウインドウ関数W(こ
れのウインドウ関数はWと同等であるが、時間的にブ
ロック長の半分だけずれている)によってウインドウ処
理されて図14eに示す信号x(t)を作り出し、次
にDSTに受け渡される。
【0092】DCT及びDSTの交互の変換ブロックの
みを用いることによって、これらの変換ブロックの廃棄
された半分に含まれる情報が失われることになる。この
損失によって時間領域エイリアシング成分が作り出され
るが、式1及び式2について適切な位相項mを選び、重
複された時間領域信号サンプル・ブロックに対して前向
き変換を適周し、逆変換で復元される隣接する時間領域
信号サンプル・ブロックを重複・加算することによっ
て、このひずみを相殺することができる。
【0093】式1及び式2における位相項mによって、
この時間領域エイリアシングひずみの位相転移が制御さ
れる。図15aから図15dまでと、図16aから図1
6gまでに、このひずみが説明されている。逆DCTか
ら復元される信号x′(t)が、図15aに示されて
いる。図15bでは、この復元信号が2つの成分、すな
わち、元のウインドウ処理された信号(実線)と、時間
領域エイリアシングひずみ(点線)とから成ることが示
されている。図15c及び図15dには、逆DSTから
復元される信号x′(t)についての類似の情報が示
されている。このエイリアシングひずみを相殺し、元の
時間領域信号を正確に復元するために、E−TDACで
はこのエイリアシングが次のようであることが必要であ
る。すなわち、DCTについては、時間領域エイリアス
成分は、サンプル・ブロックの約1/4の点の時間以内
で反転される標本化信号の第1半部と、サンプル・ブロ
ックの約3/4の点の時間以内で反転される標本化信号
の第2半部とから成ることである。DSTについては、
このエイリアス成分は振幅の記号が逆になっていること
以外は、DCTについての場合と類似であることであ
る。図15b及び図15dを参照のこと。エイリアス相
殺に必要な位相項は、次式のとおりである。すなわち、
【0094】
【式3】 ここで、 N=サンプル・ブロック長 である。
【0095】E−TDACにもまた、重複された信号サ
ンプル・ブロックに対して、注意深く設計された1組の
分析・合成ウインドウを適用することが必要である。こ
の信号サンプル・ブロックは100%の重複、すなわ
ち、所与のブロックの50%が前のブロックによって重
複され、同ブロックの残りの50%が後のブロックによ
って重複されている形で、重複されていなければならな
い。図16aから図16gまで、信号サンプル・ブロッ
クの重複と、その結果のエイリアス消去とについて示し
てある。図16a及び図16dに示す、逆DCT及びD
STから復元される信号y(t)及びy(t)は、
それそれウインドウ関数W(t)及びW (t)によ
って変調されて、これにより図16c及び図16fに示
す信号y(t)及びy(t)が作り出される。これ
らのウインドウ処理された信号の重複されたブロックが
加算されると、エイリアス成分は消去され、図16gに
示すその結果の信号y(t)は元の入力X信号(t)を
正確に再構成したものとなる。
【0096】この分析・合成過程巾に用いられるウイン
ドウの設計と重複・加算については、以下で更に詳しく
論考する。この時点では、変換ブロックの半分を省略す
ることによって必要なビットレートは半減されるが、信
号合成中にE−TDACに必要な100%重複を行うこ
とによりビツトレートが倍加されることを注意して置く
ことで十分である。その結果、E−TDACは必要なビ
ットレートに対しては中立的な効果を持つ。
【0097】D.不均一量子化 フィルタ・バンク104から誘導される各変換係数は、
不均一量子化要素108によって、符号化され、サブバ
ンドにグループ化される(表I及びIIにサブバンドに対
する変換係数の割当てを示す)。この不均一量子化要素
は、図1aに示す、ブロック浮動小数点エンコーダ10
5と、適応ビット割当て要素106と、均一量子化要素
107とによって構成されている。量子化は、変換ブロ
ック・ペア、すなわち、1チャネル系における2つの隣
接するブロックの何れか、若しくは、2チャネルの各チ
ャネルからの1つのブロックに対して行われる。第7図
に示すように、不均一量子化は、5つの主要な部分から
成る。すなわち、(1)サブバンド指数を計算し、
(2)主指数を決定し、(3)係数の周波数の関数とし
ての各係数コード・ワードのビット長を初期設定し、
(4)特定のコード・ワードに対して追加ビットを適応
的に割り当て、及び(5)適応ビット割当てと、係数の
周波数に基づく最小ビット長との合計から計算されるビ
ット長に従ってコード・ワードの丸めと打切りを行うこ
とである。
【0098】数値量の浮動小数点表現は、ディジタル・
データ表現の分野では周知であり、整数表現で可能な範
囲より一層広い範囲の値を表現するために用いられる。
浮動小数点数は、仮数及び指数で構成される。本発明の
実施例において、仮数は、2の補数形式で表現される記
号化された整数値表現である。
【0099】この対応する指数は、表現されている数の
量の真値にこの仮数を転換(正規化又は非正規化の何れ
かに)するのに必要な、2のべきの乗数に等しい非記号
化値である。この表現は、次式で表される。 F=M・2−E (7) ここで、F=浮動小数点の値 M=記号化整数値仮数 E=非記号化整数値指数
【0100】例えば、指数3では、この浮動小数点の値
が、この整数値仮数に2−3を乗じることにより得られ
ることを指示する。これは、仮数の二進表現を右へ3桁
移動することと等価である。
【0101】正の非0仮数は、最も有意のビットが非0
である時、正規化されていると言われる。負の値を持っ
仮数は、最も育意のビットが0である時、正規化され
る。正規化された仮数によって、数量に対する有意のビ
ットの最大値が仮数の制限ビット長内に含まれることが
保証される。
【0102】ブロック浮動小数点表現もまた、当分野で
は周知であり、従来の浮動小数点表現で可能なビット数
より少ないビットで1組の浮動小数点数を表現するため
に用いられる。この技法では、仮数の群に対して1つの
指数を用いる。この群中の幾つかの仮数は、正規化する
ことができない。この群中で最も大きい量に対する仮数
は、その量が小さ過ぎる、すなわち、正規化するのに必
要な倍数を指数が表現することが不可能ということがな
いという条件下で、正規化される。しかし、仮数が正規
化されるかされないかに拘らず、指数は、浮動小数点量
の真値を得るためにこの群中の各整数値仮数を右に転移
しなければならない桁数を常に表現する。
【0103】1.サブバンド指数 ブロック浮動小数点エンコーダは、部分1及び2の不均
一量子化要素から成る。第1部分によって演じられる機
能を、図8のボックス701に示す。この部分によっ
て、幾つかのサブバンド周波数係数の各々に対するサプ
バンド指数が計算される。これらのサブバンドは表Iに
示されている。この過程は、3つの段階から成る。第1
段階では、1つの変換ブロック内で各サブバンド中の最
大の変換係数を見付け、これらの24ビットの係数を正
規化するために必要な左への転移の桁数を決定する。第
2段階では、第2の変換ブロックに関して対応する転移
値を決定する。第3段階では、第1の変換ブロック中の
各サブバンドの転移値とこれに対応する第2の変換ブロ
ックの転移値とを比較し、この2つの中の小さい方の値
を選び、この値を両ブロック中の適切なサブバンドに対
する指数として保存する。
【0104】2.主指数 不均一量子化要素部分の第2部分によって、2つのサブ
バンド群の各々に対する1ビットの主指数の値が決定さ
れる。この主指数は、コーダのダイナミック・レンジを
広げるために用いられる。表Iを参照すると、主指数M
EXPOによって、低周波数サブバンド0から18まで
が表現されていることが分かる。主指数MEXP1によ
って、19から36までの高いサブバンド周波数が表現
される。(20kHzコーダに関しては、表IIに示され
ているように、3つの追加的サブバンドが必要であ
る)。もし群の中の総てのサブバンド指数が3であるか
若しくはそれ以上であれば、この群に対する主指数は1
に設定され、群中の総てのサブバンド指数は3まで滅ら
される、主指数が1に設定されると、群中の総てのサブ
バンド内の総ての符号化された主指数が、サブバンド指
数値によって指示される桁よりも3桁左に転移されるこ
とが指示される。主指数が0である時には、群中の各サ
ブバンド指数によって、このサプバンド中での各変換係
数に関する左への転移の合計桁数が正確に表現される。
これらの主指数によって、十分なダイナミック・レンジ
を持たせながら、より短いサブバンド指数を用いること
が可能になる。過程中のこの段階は、図8のボックス7
02a及び702bに示されている。
【0105】符号化信号を表現するのに必要な総合的な
ビットを減少させる、追加的な段階を取ることもでき
る。1つの指数によって単一の係数が表現されている総
てのサブバンドにおいて、正規化された仮数の記号ビッ
トは過分なものである。上で論考したように、正規化さ
れた仮数中では、記号ビットと最も有意なデータ・ビッ
トとは、常に逆の値である。したがって、記号ビットを
エンコーダによって脱落させることができ、デコーダに
よって復活させることができる。この脱落されたビット
を当出願では「隠れビット」と呼ぶ。
【0106】仮数が正規化されているかどうかを、指数
を調べることによって判断できる。もし指数が最大値
(本発明の好ましい実施例で用いている浮動小数点系中
では主指数を調整した後に15になる)よりも小さけれ
ば、この仮数は正規化されている。もし指数が最大値に
等しければ、結論を引き出すことができないので、仮数
は正規化されておらず、隠れビットはないものと仮定さ
れる。
【0107】この技法は、仮数が自身の独特の指数を1
つしか含んでいない仮数に関してのみ用いることができ
る。本発明の好ましい実施例においては、DCTサブバ
ンドOのみがこの要件に合致する。すなわち、DCTサ
ブバンド0は、ただ1つの係数から成り、組み合わせの
DSTブロック中のサブバンドとは指数を分けあってい
ない。変換ブロックのペアの間で指数を分けあっていな
いコーダにおいては、1つの係数のみを含むサブバンド
の総てに対して隠れビット技法を用いることができる。
【0108】ビット要件の低減は、DCT係数0に対す
る固定ビット長に反映される。表Iに示すように、係数
C(0)に対する「最小」ビット長は8ビットである。
隠れビット技法を用いなかったとすれば、C(O)に対
する固定ビット長は、係数S(O)に対するビット長と
等価、若しくは9ビットとなったであろう。係数C
(0)が正規化されていない状況下では、周波数成分の
大きさが非常に低いので、ビット長が低減されることに
よって聴取可能な量子化雑音が生成される可能性はな
い。
【0109】3.固定ビット長 不均一量子化要素の第3部分によって、左に転移された
変換係数の各々に対する初期最小ビット長が設定され
る。このビット長は、係数の周波数に従って設定され
る。図8のボックス703にはこの過程のこの部分が表
され、表Iには各係数のコード・ワードに対して固定さ
れるビットの最小数が示されている。この最小ビット長
は、代表的なフィルタバンクの応答特性曲線を音響心理
学的マスキングしきい値曲線と比較することによって誘
導されたものである。フィルタの性能は信号及び係数周
波数間の周波数差のみの関数であるので、このフィルタ
バンクの応答特性を表すのにどのような周波数係数を用
いても良い。図10に示す応答特性曲線は、フィルタ通
過帯域内の周波数の範囲に対するフィルタの応答特性の
実効値から得られる。上で論じたように、フィルタの選
択度は、分析ウインドウの形状と、各時間領域信号ブロ
ック中のサンプルの数とによって影響される。信号合成
過程中に付加的な選択度の損失が生じるので、総合的コ
ーダの応答特性は図10に示す程には良好ではないこと
に注意して置きたい。この効果については以下で論考す
るが、図17a及び図17bにもまた示されている。
【0110】2つの音響心理学的マスキング曲線が図1
0に示されている。これらの曲線は、オーディオ技術協
会誌1988年第35巻の517ページ乃至534ペー
ジのフィールダーによる論文、「ディジタル・オーディ
オ・コンバータによって作り出される聴取可能なひずみ
と雑音の評価」(Fielder,“Evaluationof the Audible
Distortion and Noise Produced by Digital Audio Co
nverters”, J. Aud-io Eng. Soc., vol. 35, 1988, p
p. 517-534)から誘導されたものである。耳の聴覚上の
選択度は周波数と共に大きく変化するが、500Hzか
ら2kHzの間の周波数に対しては1kHzの曲線が耳
の特性を代表し、より高い周波数に対しては4kHzの
曲線が耳の特性を代表する。低いビット・レートを達成
するためには、変換コーダに関しての遷移帯域ロールオ
フと阻止帯域排除の割合は、音響心理学的マスキング曲
線の割合と同じ程度に大きくなければならない。とりわ
け、1kHz以下のマスキング信号音に対する耳の聴覚
上の選択度は極めて高いことに注意して欲しい。
【0111】フィルタ選択度の不十分さは、低い周波数
の係数に対して追加ビットを確保することによって部分
的に補償される。図11aでは、フィルタの応答特性を
4kHzの音響心理学的マスキング曲線に対して比較し
ている。周波数が上がるにつれてコーダの帯域幅と選択
度が音響心理学的マスキング曲線に対して向上するの
で、高い周波数の係数を表すために必要なビット数は少
なくなる。この関係は、表Iに示す最小ビット長の値に
反映されている。
【0112】図11bでは、1kHzのマスキング曲線
を、この音響心理学的マスキング曲線が常に上になるよ
うに漏らせてあるフィルタ応答特性に対して比較してい
る。このフィルタ応答特性に関する偏りは、低い周波数
の係数に対して磯保してある追加ビットによって得られ
る、精度の増加に負うものである。各追加ビットによっ
て、信号対雑音比が約6dB向上する。図11bでは、
もしマスキシグに寄与する別の信号音が存在しなけれ
ば、低い周波数の変換係数を符号化するために8dBの
相殺(又は約1.3の追加ビットの精度)を必要とする
ことが示されている。
【0113】しかし、図10、図11a、及び図11b
に示されている曲線は、単音又は非常に狭い帯域の雑音
によって作り出される音響心理学的マスキング効果を表
しているので、これらの図によって示唆されている最小
ビット長は控え目なものである。図12には、3つの音
の個々のマスキング曲線を単純に重ね合わせることによ
って誘導された複合マスキング曲線が示されている。経
験的な証拠によって、重合音の実際のマスキング効果を
理解すると、この複合マスキング曲線さえもまた、非常
に控え目なものであることが示されている。更に、一般
的に音楽は幾つかの個別の周波数よりも数等複雑な信号
であり、その結果、マスキングの水準が増大することに
よって、変換係数コード・ワードに必要な精度を下げる
ことが可能になる。結果として、表Iに示される、DC
T係数C(0)及びDST係数S(1)以外の総てに関
する最小ビット長は、図11a、及び図11bのマスキ
ング曲線によって示唆される各係数コード・ワードのビ
ット長から3ビットを控除することで得られる。上記の
2つの低い周波数の係数以外は、特定の係数の精度を増
加するために必要なところでは、適応ビット割当てによ
って追加ビットが供給される。
【0114】もし係数0及び1を適応ビット割当て過程
に含めるとしたら、入力信号チャネルにサンプル・ブロ
ック長と比較して周期の長い低い周波数スペクトル成分
が含まれる時には何時でも、サンプル・ブロック・レー
トに等しい周波数において量子化雑音がE−TDACコ
ーダによって発生されるであろう。この雑音は、低い周
波数成分を含むチャネル内で、2つの機構の相互作用に
よって生成される。第1に、E−TDAC変換によって
低い周波数成分が係数0[DCT C(0)及びDST
S(O)]に関する非O及び0の値の交互の繋がりに転
換される。係数C(0)はDCT変換ブロック中では非
0であるが、係数S(0)はDST変換ブロック中では
常に0である。係数1[DCT C(1)及びDST
S(1)]は、フィルタバンクのサイドローブ効果のた
めにより少ない影響しか受けない。第2に、これら2つ
の低い周波数の係数を適応ビット割当て過程に含めるこ
とによって、チャネルに対する割当てアルゴリズムは2
つのビット割当てパターン、すなわち、1つがDCTブ
ロック用、もう1つがDCTブロック用のビット割当て
パターンの間を行き来する。適応的に割り当てられるビ
ットの数は固定されているので、DCTブロック中で係
数C(0)に割り当てられるビットはDSTブロック中
のような他の変換係数に割り当てられる余裕はない。
[係数S(0)の値は常に0であるので、どのような適
応割当てビットを割り当てられることもない]。この交
互のパターン割当ては、86.1Hz(又は44.1k
Hz/512)のサンプル・ブロック・レートに等しい
周波数の聴取可能な量子化雑音となって顕れる。
【0115】本発明の現在の実施例では、DCT係数C
(0)に対して8ビットの固定ビット長、DST係数S
(0)に対して9ビットを割り当て(表Iを参照)、こ
れらを適応ビット割当てから除外する。この除外によっ
て、前文節で述べた、この適応ビット割当て構想での量
子化雑音の発生が避けられる。
【0116】4.適応ビット割当て a.大要 不均一量子化要素の第4部分によって、適応ビット割当
てが行われる。図8のボックス704には、この割当て
過程の大要が提示されている。大まかに書って、各変換
ブロックについて、ビット割当てによって、固定の数の
追加ビットが特定の係数に対して4つの相で割り当てら
れる。このビットの数は、信号符号化品質とビット伝送
速度との平衡を取るべく選ぶことができる。本発明の好
ましい実施例では、毎秒128kビットの総合的ビット
レートを達成するために、この割当ての制限値を変換ブ
ロック当たり133ビットに設定している。誤り訂正符
号(下で論考する)を用いる用途では、同じ総合ビット
レートを維持するために、この制限値をブロック当たり
124ビットに低音しなければならない。当出願では、
この制限を割当て最大値又は割当て可能数と呼ぶ。
【0117】現状の実施例では、係数当たり4ビットの
最大値を割り当てている。この最大値は、符号化精度と
総合的ビットレートとの間の設計上の妥協を表してい
る。当業者には、本発明の概念又は基本的目的を変更せ
ずに、この適応的に割当て可能なビットの最大値と数を
変えることができることが分かるであろう。
【0118】相0は、残りの相に対する初期化の過程で
ある。相1では、係数当たり4ビットの最大値までが、
最大のスペクトル・エネルギーを有する周波数成分の同
一の臨界周波数帯域内にある係数に対して、割り当てら
れる。もし割当て可能なビットの総てが相1の期間中に
割り当てられたならば、この割当て過程は停止される。
もしそうでなければ、相2によって、総合的な適応割当
ビットが各係数に対して4ビットになるように、相1の
期間中に割り当てられた変換係数に対して、追加ビット
が割り当てられる。もし割当て可能なビットの総てが相
2の期間中に割り当てられるならば、この割当て過程は
停止される。もしビットが幾らかでも残っているなら
ば、相3によって、相1及び相2の期間中に割り当てら
れた係数に隣接する係数に対して、ビットが割り当てら
れる。この手順の更に詳細な概念については、以下の文
節で叙述する。この手順の諭理の実施については、その
後で論考する。
【0119】図9は、特定の変換係数に対してビットを
割り当てる概念上の過程の図である。相0の初期化段階
がボックス800中に示されている。第1段階では、ア
レイA()の要素が0に設定される。次の段階では、最
大のスペクトル成分を有するサブバンドに対する指数で
ある、最小のサブバンド指数が識別され、この値がX
MINとして保存される。総てのサブバンド指数がX
MINから控除され、差がアレイM()中に記憶され
る。有り得る最小のサブバンド指数は0であり、有り得
る最大のサブバンドの指数は4ビットの高い周波数サブ
バンド指数に対する最大値15に主指数MEXP1に対
する値3を加えた、18であることに注意して欲しい。
これについては、表Iを参照して欲しい。したがって、
アレイM()中の有り得る値の範囲は、負の18から0
までである。次のスナッブで、アレイM()の各要素に
4が加えられ、0以下の総ての要素は0に設定される。
相0の最後において、アレイM()は、各サブバンドに
ついて1つの、値が0から4までの範囲の要素の組から
成る。4の値を有する要素は、サブバンド中の少なくと
も1つの係数が全信号中で最大のスペクトル係数を有す
るサブバンドを表す。
【0120】相1では、図9のボックス801に示す過
程を用いて、各サブバンド中の係数に対して割り当てら
れるべきビットを表す、もう1つのアレイA()が構築
される。このアレイA()中の各要素は、1つのサブバ
ンドに対応する。表Iから、最高のサブバンド指数は重
合する変換係数を表すので、A()の各要素は対応する
サブバンド中で総ての変換係数に割り当てられるビット
数を表すことを思い出して欲しい。例えば、表Iを参照
すると、サブバンド13は、係数13から14を表す。
もし要素A(13)が値1を有するならば、変換係数1
3及び14に対して1ビットずつの、2ビットが割り当
てられることを示している。この例について続けると、
もし要素A(36)が値2を有するならば、係数168
から182までに対して2ビットずつの、30ビットが
割り当てられる。この割当て過程の間中、A()の各要
素が増分されるにつれて、割当てのために残されている
ビットの数から割り当てられたビットの数が控除され
る。
【0121】この相又は後続の何れかの相の間中に割当
て可能なビットの総てが割り当てられると、その相は直
ちに終結し、後続の相は省かれる。割当て限界に達する
最終段階中に、この段階中にサブバンドに割り当てられ
るビットの数は、割当てのために残されているビットの
数を超えない。2っ以上の係数を有するサブバンドの処
理が行われている間に、割当て可能なビットの最後のも
のが割り当てられると、このサブバンド中の係数の総て
に同じ数のビットが割り当てられないこともあり得る。
【0122】最も低い周波数係数を表すM()アレイ要
素[DCTブロックに関してはM(1)、DSTブロッ
クに関してはM(2)]から始めて、M()の各要素が
次々に検査される。M()アレイ全体を通して、若しく
は割当て可能なビット総てが割り当てられるまで、4回
もの検査が行われる。第1回の検査で、アレイA()中
の各要素は、もしアレイM()巾の対応する要素が4に
等しい値であれば、1だけ増分される。第2回の検査に
よって、3団は4の値を有するM()中の各要素に対応
するアレイA()中の各要素が、1だけ増分される。第
3回の検査で、アレイA()要素は、対応するM()要
素が2から4までの範囲内の値を有するならば、増分さ
れる。最後の検査によって、1から4までの範囲内の値
を有するM()要素に対応するアレイA()中の要素が
増分される。アレイM()中の要素の合計が割当て制限
値に達するか、若しくはそれよりも少なければ、この時
点でのアレイM()及びA()の内容は等価であること
に注意したい。もし割り当てられたビットの数が割当て
限界に達したならば、このビット割当て過程は相1の最
後で完結する。
【0123】もし割当て可能なビットが幾つかでも残っ
ているならば、図9のボックス802に示す相2の割当
てが続行される。この相では、A()アレイ全体にわた
って3回もの検査が行われ、もし、最大数の割当て可能
なビットが割り当てられると、早々に停止される。各検
査は、最も低い周波数要素[DCTブロックに関しては
A(1)、DSTブロックに関してはA(2)コで開始
され、周波数を上げながら進められる。アレイA()全
体にわたる第1回の検査で、1と3との間の値を有する
各要素が1だけ増分される。第2回の検査で、2又は3
の値を有する要素が増分される。第3回の検査で、3に
等しい要素が増分される。割当て制限値を超えることな
くこの相が完結するならば、A()アレイ中の各要素の
値は、4または0の何れかである。
【0124】もし割当て可能なビットが残っているなら
ば、図9のボックス803に示す相3の割当てが続行さ
れる。前の相と同じように、割当て制限値に達すると直
ちに相3の割当では終了する。この最後の相によって、
高いエネルギーを持つ係数のサブバンドに隣接する、低
いスペクトル・エネルギーを持つ変換係数に対して、追
加ビットが割り当てられる。この割当ては、3段階で達
成される。第1段階によって、値{0,4}を持っ2つ
の隣接要素の群を探索するための、最も高い周波数要素
A(36)[20kHz帯域幅コーダでは要素A(3
9)が開始要素]から始まる、アレイA()の走査が行
われる。もしこれが見付かれば、この群の値が{1,
4}になるように、値が0である要素が1に設定され
る。
【0125】もし割当て限界に達していなければ、値
{4,0}を持つ2つの隣接要素の組を探索するため
に、最も高い周波数サブバンドから始め、低い周波数に
向けてアレイA()を走査することで、相3の段階2が
開始される。もしこれが見付かれば、0の値を有する要
素が1に設定されて{4,1}の値が作り出される。
【0126】相3の第3及び最終段階によって、この相
の段階1及び段階2の中でビットを割り当てられたサブ
バンドの中の係数に対して、追加ビットが割り当てられ
る。アレイA()の最も高い周波数要素で始めて、段階
1中で改変された各要素が増分される。最後に、段階2
中で改変された要素が、最も高い周波数サブバンドから
始め、増分される。この第3の段階によって、上で論じ
たのと同じ順序で、割当て可能なビットが総て割り当て
られるまで、若しくは段階1及び段階2の中で改変され
た要素の総てに合計4ビットずつが割り当てられるま
で、アレイ要素が反復的に増分される。もし後者の条件
に一致し、割当て可能なビットが幾つかでも残っている
ならば、相3が、段階1から始まり、繰り返される。
【0127】b.適応ビット割当て諭理 適応ビット割当ての概念については、図9に表現し、上
で述べた。このアルゴリズムの概念を理解することは、
適応ビット割当てルーチンの実際の論理を理解するのに
役立つ。
【0128】相0は、0に等しいアレイA()の総ての
要素を初期化し、TからTまでの4つの表を構築するこ
とから12始まる。これらの表の構築は、以下の段階を
通して達成される。すなわち、(1)最小のサブバンド
指数を識別し、この値をXとして保存し、(2)最も低
い周MIN波数サブバンド(DCTブロックについては
サブバンド1、又は、DSTブロックについてはサブバ
ンド2)から始めて、サブバンド指数(表I参照)をX
MINから控除し、(3)もしこの差が0であれば、こ
のサブバンド数を表T、T、T、及びTに挿入
し、(4)もしこの差が負の1であれば、このサブバン
ド数を表T、T、及びTに挿入し、(5)もしこ
の差が負の2であれば・このサブバンド数を表T、及
びTに挿入し、(6)もしこの差が負の3であれば、
このサブバンド数を表Tに挿入し、(7)総てのサブ
バンドが処現されるまで、各サプバンドに対して段階3
から段階6までを続行する、段階である。この段階の最
後において、表TにはXMIN−3からXMINま
の範囲の指数を有する総てのサブバンドの数、表T
はXMIN−2からXMINまでの指数を有するサブバ
ンド、表TにはXMIN−1からXMINまでの指数
を有するサブバンド、表TにはXMINに等しい指数
を有するサブバンドが含まれる。ここで重要なことは、
各表へのサブバンド書込みが周波数の上がる順序で行わ
れることである。
【0129】相1によって、最大のサブバンド指数を有
するサブバンド中の変換係数に対して、ビットが割り当
てられる。最初の表Tへの書込み(最も低い周波数)
から始めて、この表で表される各サブバンド内の各変換
係数に対して1ビットが割り当てられる。割当ては、表
、T、最後にTへと、次々に反復される。この
過程は、割当て可能なビットが総て割り当てられるま
で、若しくはTからTまでの表への総ての書込みが
処理され終わるまで、続行される。サブバンド中の総て
の係数に対してビットが割り当てられると、A()中の
要素が各サブバンド中の各変換係数に対して割り当てら
れる全ビットを反映するように、アレイA()のサブバ
ンドに対応してアレイA()中での書込みが1だけ増分
される。
【0130】前に注意したように、割当て可能なビット
が総て割り当てられると割当ては直ちに終結する。各表
への書込みによって、一般的に重合変換係数を含むサプ
バンドが表される。したがって、もし割当て可能ビット
の最後のものが2っ以上の係数を持っサブバンドを表す
表書込みに割り当てられるならば、そのサブバンド中の
係数の総てには同じ数のビットが割り当てられないこと
が起こり得る。そのような状況下では、この割当て過程
によって、継続してアレイA()中に記憶されるサブバ
ンド割当ての合計から、サブバンド中のどの係数が控除
しなければならないビットを持っているのかが表示され
る。
【0131】相2によって、表TからTまでの4つ
の新しい表が、相0で用いられたのと類似の手順を用い
て構築される。すなわち、この手順は、(1)Xによっ
て最MIN小のサブバンド指数が依然保持され、(2)
最も低い周波数サブバンド(DCTブロックについては
サブバンド1、又は、DSTブロックについてはサブバ
ンド2)に関して、サブバンド指数をXMINから控除
し、(3)もしこの差が0であれば、このサブバンド数
を表Tに挿入し、(4)もしこの差が負の1であれ
ば、このサブバンド数を表Tに挿入し、(5)もしこ
の差が負の2であれば、このサブバンド数を表丁に挿入
し、(6)2もしこの差が負の3であれば、このサブバ
ンド数を表Tに挿入し、(7)総てのサブバンドが処
理されるまで、各サブバンドに対して段階3から段階6
までを続行することである。この段階の最後において・
表TにはXMIN−3に等しい指数を有する総てのサ
ブバンドの数、表TにはXMIN−2に等しい指数を
有するサブバンド、表TにはXMIN−1に等しい指
数を有するサブバンド、表TにはXMINに等しい指
数を有するサブバンドが含まれる。総ての表へのサブバ
ンド書込みは、変換係数の周波数の上がる順序で行われ
る。
【0132】相2によって、表TからTまでの中の
サブバンドで表される総ての係数に対して、各係数が合
計4つの追加ビットを受け取るまで、若しくは割当て限
界に達するまで、ビットが割り当てられる。表T中の
最初の書込み(最も低い周波数)から始めて、この表中
に表される各サブバンド内に含まれる各係数に対して、
1ビットが割り当てられる。各サブバンドが処理される
につれて、書込みは、表Tから取り除かれて、表T
に挿入される。次に、追加ビットが割り当てられるにつ
れて、各書込みを表Tから表Tに移動させながら、
表T中の書込みに関連する係数に対して、追加ビット
が割り当てられる。その後、書込みを表Tから表T
に移動させながら・表T中の書込みが処理される.も
し割当て可能なビットが幾らかでも残っているならば、
表Tに対する処理、その後、表Tに対する処理を反復
しながら、割当てが続行される。もし割り当てられるべ
きビットが残っているならば、表T中の書込みを通し
て最後の処理が行われる。もし相2によって割当て可能
なビットの総てが割り当てられなければ、表Tには各
々が受け取った4ビットを持つ総ての係数を含み、表T
から表Tまでは空である。もし割当て可能なビット
の総てが割り当てられたならば、各変換係数に割り当て
られた全ビットを反映すべく、表Tから表Tまでに
含まれる情報からアレイA()が再構築される。表T
中の書込みに対応するアレイA()中の各要素には値4
が割り当てられる。表T中の書込みに対応する各
A()要素には値3が割り当てられ、表Tについては
値2、表Tについては値1が割り当てられる。A()
の他の総ての要素、すなわち表Tから表Tまでの書
込みで表されないサブバンドは0である。
【0133】もし割当て可能なビットが幾つかでも残っ
ているならば、相3での割当てが続行される。サブバン
ドの数を周波数の下がる向きに順序付けることによっ
て、表Tが4並び替えられる。第1段階によって、表T
にはない、低い周波数で、表T中にあるサブバンド
に隣接するサブバンドが表Tに対して追加される。表
中の最初の書込み(最も高い周波数)から始めて、
表T中での隣接書込みが1っであるのか、若しくは2
っ以上のサブバンドに分離されていないかにっいて検査
される。もし分離されているならば、高い周波数の直ぐ
下にあるサブバンドの数が表Tに挿入される・例えば
・表T中の2つの隣接する書込みによってサブバンド
16及び12が表されるとしよう。これらのサブバンド
は3つのサブバンドに分離されている。したがって、サ
ブバンド16の下のサブバンドを表す数15が表T
挿入されることになろう。
【0134】第2段階によって、表Tにはない、高い
周波数で、表T中にあるサブバンドに隣接するサブバ
ンドが表Tに対して追加される。表T中の最初の書
込み(最も高い周波数)から始めて、表T中での隣接
書込みが1つであるのか、若しくは2っ以上のサブバン
ドに分離されていないかについて判定すべく検査され
る。もし分離されているならば、低い周波数の直ぐ上に
あるサブバンドの数が表Tに挿入される。例えば、表
中の2つの隣接する書込みによってサブバンド16
及び12が表されるとしよう。上で論じたように、これ
らのサブバンドは3つのサブバンドに分離されている。
したがって、サブバンド12の上のサブバンドを表す数
13が表Tに挿入されることになろう。
【0135】表T中の最初の書込みから始めて、表T
中の書込みによって表される各サブバンドに関連する
各変換係数に対して追加ビットが割り当てられる。各サ
ブバンドの警込みは、処理されるにつれて、表Tから
表Tへと移される。表Tの処理の最後で割当て可能
なビットが幾つかでも残っているならば、各書込みを表
から表Tへと移しながら、表Tの書込みに関し
て類似の過程が反復される。もし割り当てられるべきビ
ットが幾つかでも残っているならば、表Tの書込みを
表Tから表Tへと移しながら、表Tの過程が続行
される。もしこの過程の後にビットが幾つかでも残って
いるならば、最初に表Tの書込みが未だ並び替えられ
た状態にあるがどうかを判定し、もしそうでなければ、
表Tの書込みを周波数の下がる向きの順序に並び欝え
る、始めの段階から相3が繰り返される。割当て可能な
ビットの総てが割り当てられると、上で相2に関して述
べたように、4つの表からアレイA()が構築される。
【0136】ビットの総てが割り当てられた後、各変換
係数コード・ワードは、この係数がグループ化されるサ
ブバンドをその中で表すアレイA()の要素の値に等し
い、ビット長に丸められる。しかし、1つのサブバンド
中の幾つかの係数では、割当てビットの合計数を割当て
最大数に等しく保つために必要なビット長から1つ控除
した、ビット長を具えることもある。
【0137】5.コード・ワード省略 図8のボックス705に示す不均一量子化要素の第5部
分は、適応ビット割当てルーチンに従う。前節で決定さ
れたサブバンド及び主指数を用いて、変換ブロック中の
各変換係数は、もしその関連する主指数が0に設定され
ているならば、変換係数が中でグループ化されるサブバ
ンドに対する指数の値に等しい桁数に更に3桁加えた桁
数だけ、左に移動される。その後、アレイA()中で見
出たされる各サブバンドに対して割り当てられる適応割
当てビットの数に最小ビット長(表Iを参照)を加える
ことによって、各係数の合計ビット長が計算される。各
変換係数のコード・ワードは、このビット長に丸められ
る。
【0138】上で述べたように、アレイA()の各要素
によって、サブバンド内の総ての係数に割り当てられる
ビットの数が表される。1つのサブバンド中の幾つかの
係数では、割当てビットの合計数を割当て最大数に等し
く保つために必要なビット長から1っ控除したビット長
を具えることもある。
【0139】E.フォーマット化 フォーマット化過程によって、伝送又は記憶のための符
号化された1組の変換ブロックが用意される。この過程
は、図1aのボックス109に示されている。以下の叙
述では、1チャネル系中の2つの隣接する変換ブロック
のフォーマット化について論考する。同じ技法を用い、
ステレオ音響の用途に用いられる技法のように信号を処
理して、2チャネル系の各チャネルから1つの変換ブロ
ックがフォーマット化される。
【0140】各変換係数のコード・ワードの固定長表現
は、丸められたコード・ワードを、表Iに示す最小ビッ
ト長に等しい長さにまで省略することによって形成され
る。このコード・ワードに対して割り当てられるあらゆ
る追加ビットは、適応ビット・ブロック中で個別にフォ
ーマット化される。その後、主指数と、サブバンド指数
と、省略されたコード・ワードと、適応ビット・ブロッ
クとが図20aに示すグループ化によって組み立てられ
る。1組の主及びサブバンド指数は、ブロック・ペア中
の両方の変換ブロックに適用されることに注意して欲し
い。(不均一量子化要素についての上述の論考を参照の
こと)。ブロックの各ペアの間で指数を分け合うことに
よって、両変換ブロックの指数を表現するために必要な
ビットの数は50%まで低減される。
【0141】図20aの変換ブロックのフォーマット化
されたフレームでは、変換ブロックAがDCTブロッ
ク、変換ブロックBがDSTブロックの形での、構造が
説明されている。このフレームが、伝送中の雑音によっ
て生じるようなビット誤りを受けるのであれば、図20
bに示すようにデータに誤り訂正符号が混交される。も
しこのディジタル信号が放送用に企図されたものなら
ば、フレーム同期ビットのような、また、もしこのフレ
ームが記憶用に企図されたものならば、データベース・
ポインタ又はレコードキーのような、追加の付帯的なビ
ットが必要になることもある。フレーム同期ビットが必
要であれば、フォーマット化されたフレームは、ニュー
・ヨーク州ニュー・ヨークのヴァン・ノストランド・ラ
インホールド社1985年出版の、スミスによる「ディ
ジタル伝送系」の228ページから236ページまで
(Smith, Digi-tal Transmission System, New York, N
Y: Van Nost-rand Reinhold Co., 1985, pp. 228-236)
に叙述されている技法を用いて、無作為化される。無作
為化は、フレーム内の有効データが同期パターンと誤認
される確率を下げるために行われる。その後、この無作
為化されたフレームは、フレーム同期ビットに対して付
加される。
【0142】各変換係数を2つの別個の部分又はセグメ
ントで表現することができることに注意して欲しい。第
1の部分は係数の最小の長さを表しかつ固定数のビット
で構成される。表Iを参照のこと。この表現の第2部分
は、もしそれがあるとすれれば、長さが変わり、適応的
に割当てられるビットで構成される。可変長のワードと
して各係数を表す表現構想では雑音による悪化があるの
に対して、この2部分構成による表現構想はより優れた
免疫性があるので、これが選ばれる。好ましい実施例の
構成を用いるフレーム中でもし突発雑音が発生すると、
この雑音の影響は、指数の値、コード・ワード、又はこ
の雑音によって直接影響を受ける割当てビットに限られ
る。可変長コード・ワードを利用するフレーム中で突発
雑音が発生すると、この雑音の影響は、残りのフレーム
全体に伝播することが有り得る。突発雑音は、指数の値
及び雑音に直接当てられるコード・ワードのみならず、
各可変長のコード・ワードの長さを決定するのに必要な
情報をも変えるので、この伝播が生じ得る。1つのコー
ド・フードの長さに誤りを生じるなら、フレームの残り
の部分も誤って解釈される。
【0143】DCT変換ブロックには、537ビットか
ら成る183の係数仮数(表Iを参照)と133の適応
割当ビットとの合計、670ビットが含まれる。DST
係数S(0)は常に0であるので(表I及び表現4を参
照のこと)、これを伝送する必要はない。2つの主指数
ビット及び148ビットの37サブバンド指数によっ
て、DCT.DSTブロック・ペアの長さは1486ビ
ットになる。(本発明の20kHz版では、全ブロック
・ペアの長さは1702ビットになる)。
【0144】追加ビットが割り当てられている係数を指
示するのに、付帯的情報は必要ではない。フォーマット
を解除する過程では、符号化過程で用いられるのと同一
の割当てアルゴリズムを実行することによって、伝送さ
れたサブバンド指数から適正な割当てを決定することが
可能である。
【0145】データの悪化が問題ではない時には、変換
ブロックのフレームをフォーマット化するための好まし
い構造は、指数を最初に、係数コード・ワードを2番目
に、適応割当てビットを最後に配置する構造である。こ
の構造では、総てのサブバンド指数が受け取られた後
に、適応ビット・ブロックが受け取られる間に、フォー
マットを解除する過程によって各変換係数に対するビッ
ト割当てを決定することが可能であるので、処理による
遅延が低減される。本発明の好ましい実施例において用
いられるフォーマット化構造は、図20aに示されてい
る。ビット・ストリームは、主及びサブバンド指数と共
に、周波数の上向きの順序にフォーマット化される。そ
の後、変換ブロックAに関する係数コード・ワードの固
定長部分が周波数の上昇する順序で組み立てられ、ブロ
ックBに関する係数コード・ワードがそれに続く。最後
に、ブロックAに関する適応ビット・ブロックがビット
・ストリームに付加され、ブロックBに関する適応ビッ
ト・ブロックがそれに続く。
【0146】データ悪化の可能性が心配な用途において
は、誤り訂正構想が必要である。サブバンド指数中の誤
りと、それよりも程度は低いが、低い周波数係数コード
・ワード中の誤りとによって、聴感上の最大の歪みが生
じる。この情報は、保護すべき最重要のデータである。
好ましい構成では、これらの値を誤り検出及び訂正符号
を用いて保護するが、突発雑音誤差に対する免疫性を向
上させるために、これらの値をできるだけ隔置する。図
20bにこのような構想が示されている。
【0147】当業者にとって、本基本発明から逸脱せず
に、別のフレーム・フォーマット及び訂正符号を利用で
きることは明白であろう。
【0148】誤り訂正符号を用いる際には、全ビットレ
ートを同一に維持するために、適応割当てビットを少な
くする。DCT・DSTブロック・ペアの1フレームに
関する指数及び仮数ビットの合計数は、1220ビット
である。この長さについて、150ビットはサブバンド
指数及び主指数である。このビット・ストリームに1
(21,19)リード・ソロモン(Reed-Solomon)誤り訂
正符号が付加される。この符号は長さ16ビットである
が、これによって、19個の8ビット記号(バイト:byt
es)又は152ビット期間にわたって、単一記号誤り検
出・訂正が行われる。この例として、マサチューセッツ
州ケンブリッジのM.I.T。ブレス社1986年出版
の、ピーターソンとウェルドンによる、「誤り訂正符
号」の269ぺー5ジから309ページまでと、361
ページから362ページまで(Peterson and Weldon, E
rror-Correcting Codes, Cambridge, Mass: The M.I.T.
Press, 1986, pp. 269-309, 361-362)を参照のこと。
【0149】符号によって保護されるこれらの152ビ
ットについて、150は主指数及びサブバンド指数から
成る(15kHz版)。残りの誤り訂正能力は、2つの
主指数に対して冗長保護を与えることに利用される。1
6ビットの誤り符号及び冗長指数を表現するには、全部
で18ビットが必要である。これらのビットは、適応ビ
ット割当てに割当て可能なビットを減らすことによっ
て、総合的データレートを増加させずに、フォーマット
化されたデータ・ストリームに付加される。その結果、
変換ブロック・ペア中で各ブロックに対する総合的に割
当て可能なビットは133から124に減る。
【0150】リード・ソロモン・コードによってバイト
の中のデータが処理されるので、処理を容易にするため
に、誤り符号と、保護されたデータと、保護されていな
いデータとは、8ビットのバイトにグループ化される。
各ブロック・ペア・フレーム中での保護されたデータに
対する保護されていないデータの比率は、約9対1であ
る。これによって、フォーマット化されたフレーム全体
にわたって、保護されたデータを、保護されたデータの
8ビットのバイトの各々を保護されていないデータの8
バイトに分離する形で、分散することが可能になる。こ
れについては図20bを参照のこと。この技法を用いる
と、65ビットにも及ぶ単一の突発雑音誤りがフレーム
中のどの位置に生じても、保護データの2バイト以上が
悪化させられることはない。したがって、65ビット以
上に及ばない、あらゆる単一の突発雑音に対しては、保
護されたデータを復元することができる。
【0151】上で論じた制約の下で、指数及び変換係数
コード・ワードは周波数の上昇する順序にアセンブルさ
れ、その後に適応的ビット・ブロックが続く。
【0152】F.伝送又は記憶 今や、フォーマット化されたフレームの伝送又は記憶の
ための準備が整えられた。図1aには、伝送要素110
が示されている。伝送媒体としては、放送のような公共
頒布系と、スタジオでのモニタや信号ミキシングのよう
な内部用途と、内部施設又は地上系や衛星系電波を経由
する電話用途とが含まれる。記憶媒体には、磁気デーブ
と、磁気又は光ディスクとが含まれる。
【0153】G.フォーマット解除 伝送信号の受信が、もしくは記憶からの取り出しの何れ
かによって、ディジタル化され符号化された信号が伝送
要素111から受け取られると、フォーマット解除過程
が始まる。この過程は、図1bのボックス112に表現
されている。もしコード・ワードのフォーマット化され
たフレームが、伝送の前に無作為化されていたものであ
れば、逆無作為化過程によって復元される。その後、こ
のフレームは、各変換ブロックの成分、すなわち、主指
数と、サブバンドに指数と、変換指数コード・ワード
と、適応的割当てビットとに分割される。誤り訂正符号
がもしあれば、これを用いて、伝送又は記憶の間に引き
起こされた誤りが取り除かれる。
【0154】各主指数ビットは、その対応する冗長ビッ
トを用いて点検され、精度が磯認される。もしこの点検
で落第ならば、つまり、主指数とその相手の冗長とが等
しくなければ、この主指数は1であると仮定される。も
しこの主指数の正しい値が実際には0であるならば、こ
の仮定によって、この間違った主指数の下でグループ化
されるサブバンド内の、総ての変換係数の振幅は低減さ
れる。
【0155】主指数を0(1であるべきところで)に誤
って設定すると、影響を受ける係数の総ての振幅が増加
するので、この仮定を用いる方が、不都合なひずみの発
生をより少なくてきる。
【0156】DCT係数C(0)に対する指数も点検さ
れ、隠れビットに対する調整が必要かどうかが判定され
る。
【0157】上で述べた適応ビット割当てルーチンを用
いて、受信信号から抽出される指数が処理され、この処
理結果を用いて、変換係数に対する適応ビット・ブロッ
クの適正な割当てが決定される。最大ビット長とあらゆ
る適応割当てビットとを加えたビット長にその長さが等
しい、各変換係数の部分は、24ビット・ワードに負荷
され、その後、もし関連する主指数が1に設定されてい
るならば、適切なサブバンド指数の値と3桁の追加移動
桁とを加えた数に等しい度数だけ右に移行される。この
過程は、図1bのボックス113に表現されている。
【0158】H.合成フィルタバンク、逆変換 図1bのボックス114には、フォーマット解除及び直
線化手順から復元された周波数領域係数の各組を時間領
域信号サンプルのブロックに変換する、合成フィルタの
バンクが表現されている。図1aの分析フィルタバンク
で用いられる変換とは逆の変換によって、合成フィルタ
バンク114が実現される。本発明の実施例で用いられ
るE−TDAC技法のための逆変換は、改変された逆D
CT及び逆DSTの交互的な適用である。変換ブロック
の半分が伝送又は記憶から除去されているので(表現5
及び29を参照のこと)、逆変換のためにこれらのブロ
ックを再生しなければならない。式8に示されるよう
に、失われたDCTブロックを入手可能なDCTブロッ
クから再生することができる。この逆DCTブロックは
式10で表現されており、逆DSTブロックは式11で
表現されている。すなわち、
【0159】
【式4】 ここで、k=変換係数 n=信号サンプル数 K=変換係数の数 N=サンプル・ブロック長 m=E−TDACに関する相期間
【0160】
【式5】 である。
【0161】計算は、FFTアルゴリズムを用いて行わ
れる。逆変換において、順方向変換で用いられた技法と
同じ技法を用いて、FFTを用いてDCT及びDSTの
両方の同時発生的計算が可能になる。
【0162】図14aから図14eまでと、図16aか
ら図16gまでに、分析・合成フィルタバンクの変換過
程が示されている。分析フィルタバンクによって、時間
領域信号が、DCT及びDSTブロックの交互列に変換
される。逆変換によって、逆DCTが別のブロックの各
々に適用され、逆DSTがブロックの別の半分に適用さ
れる。図15aから図15dまでに示すように、復元信
号には、エイリアシングひずみが含まれている。このひ
ずみは、図1bのボックス116に表されている後続の
時間領域ブロック重複・加算過程の間に、相殺される。
この重複・加算過程については、以下に述べる。
【0163】I.合成ウインドウ 図16aから図16gまでには、隣接する時間領域信号
サンプル・ブロックの重複・加算による時間領域エイリ
アシングの相殺が示されている。ブリンセンによって誘
導されているように、時間領域エイリアシングひずみを
相殺するには、E−TDAC変換で分析ウインドウと同
等の合成ウインドウを適用し、隣接するブロックを重複
・加算することが必要である。各ブロックは、100
%、すなわち、先行ブロックによって50%、後続ブロ
ックによって50%が重複される。合成ウインドウ変調
は、図1bのボックス115によって表現されている。
【0164】合成・分析ウインドウの設計では、フィル
タバンクの性能について考慮しなければならない。両方
のウインドウとも時間領域信号を変調すべく用いられる
ので、フィルタ性能に係る総合的効果は、これら2つの
ウインドウの積から形成される単一のウインドウによっ
て生じる効果と類似している。したがって、合成・分析
ウインドウ・ペアの設計は、合成、及び分析ウインドウ
の点ごとの乗算を表す適切な積ウインドウを設計するこ
とにより達成される。この設計は非常に制約されてい
て、遷移帯域ロールオフの鋭さと阻止帯域排除の深さと
を交換する融通性を低下させる。その結果、フィルタ性
能は、この制約のない分析専用ウインドウにおけるより
も大幅に劣化する。この例については、図17a及び図
17bを参照のこと。
【0165】先行技術では、分析ウインドウに関して多
大な注意が払われているが、合成ウインドウについては
教示するところが少ない。以下に叙述する技法では、周
知の良好な分析ウインドウの設計から良好な合成・分析
ウインドウ・ペアを誘導している。どのような分析ウイ
ンドウをも出発点として用いることができるが、幾つか
のウインドウでは良好な選択度を有するフィルタバンク
の設計が可能となり、遷移帯域ロールオフの鋭さを阻止
帯域排除の深さと交換する手段が提供される。3つの例
として、カイザー・ベッセル・ウィンドウ(Kaiser-Bes
sel window)と、ドルフ・チェビシェフ・ウインドウ(D
olph-Chebychev window)と、パークス・マックレラン
法(Parks-McClellan method)を用いて有限インパルス
・フイルタ係数から誘導されるウインドウとが挙げられ
る。1972年3月のIEEE学会誌、回路理論、CT
−19巻の189ページから194ページまでの、パー
クスとマックレランによる論文、「リニア相を有する非
回帰型ディジタル・フィルタのチェビシェフ近似法」
(Parks and McClellan,“Chebychev Approximationfor
Nonrecursive Digital Filters with Linear Phas
e”,IEEE Trans. Circuit Theory, vol. CT-19, March
1972, pp. 189-94)を参照のこと。ここでは、カイザ
ー・ベッセル・ウインドウのみにっいて論考している。
このウインドウによって、単一のパラメータ・アルファ
値の選択を通して、上述の交換が可能になる。一般的法
則として、低いアルファ値によって遷移帯域ロールオフ
が改善され、高いアルファ値によって阻止帯域排除の深
さが増加させられる。上で引用したハリスの論文を参照
のこと。
【0166】本発明の好ましい実施例では、4から7ま
での範囲のアルファ値が使用できる。この範囲では、中
間周波数領域(1kHzから2kHz)での倦移帯域ロ
ールオフの鋭さと、低い周波数領域(500Hz以下)
及び高い周波数領域(7kHz以上)での阻止帯域排除
の深さとの間の良好な妥協が得られる。この受容できる
アルファ値の範囲は、量子化雑音を音響心理学的マスキ
ングしきい値以下に維持するために十分な阻止帯域排除
を具える最低のアルファ値を、コンピュータ・シミュレ
ーションで識別することによって決定された。
【0167】カイザー・ベッセル・ウインドウ関数は以
下の通りである。すなわち、
【0168】
【式6】 ここで、 α=カイザー・ベッセル・アルファ因数 n=ウインドウのサンプル数 N=ウインドウのサンプル数中のウインドウ長
【0169】
【式7】 である。
【0170】この重複・加算条件を満足させるために、
長さv+1のウインドウW(n)を長さN−vの長方形
ウインドウでたたみ込むことによって、長さNの分析・
合成績ウインドウWP(n)が誘導される。値vは、ウ
インドウ重複・加算期間である。この重複・加算過程に
よって、エイリアスひずみと分析・合成ウインドウの変
調効果とが消去される。積ウインドウを誘導するたたみ
込みは、式13に示される。ここでは、表現の分母によ
って、最大値が単位1に近付くが1を超えないようにウ
インドウが測定される。この表現を式14に示されるよ
うに単純化することもできる。すなわち、
【0171】
【式8】 ここで、 n=積ウインドウのサンプル数 V=ウインドウ重複期間内のサンプル数 N=積ウインドウの望ましい長さ W(n)=畏さv+1のウインドウ関数の開始 WP(n)=長さNの誘導された積ウインドウ
【0172】
【式9】 式(15)及び式(16)に示される分析及び合成ウイ
ンドウは、誘導された積ウインドウWP(n)をそれぞ
れS及びAで累乗することによって得られる。すなわ
ち、 WA(n)=WP(n)A 0≦n<Nに対して (15) WS(n)=WP(n)S 0≦n<Nに対して (16) ここで、 WP(n)=誘導された積ウインドウ(式14及び式1
4を参照) WA(n)=分析ウインドウ WS(n)=合成ウインドウ N=積ウインドウの長さ A+S=1 である。
【0173】本発明の現在の実施例では、分析及び合成
ウインドウは、100%のウインドウ重複、又は256
サンプルの重複期間を有する、512サンプルの長さで
ある。S及びAの値は各々、E−TDAC変換に必要な
1組の同等な分析合成ウインドウ及び合成ウインドウを
作り出す真半分に設定される。これらの値を式14に代
入することによって、結果としての分析ウインドウは以
下のようになる。すなわち、
【0174】
【式10】 ここで、W(n)=畏さ257のカイザー・ベッセル関
数で、アルファ因数は4から7までの範囲である。
【0175】J.重複・加算 ウインドウの設計には・更に追加の要件が課される・す
なわち、分析及び合成ウインドウは、隣接する2つの分
析及び合成ウインドウが重複された時に、分析・合成績
ウインドウが一体的に合算されるように設計されなけれ
ばならない。重複・加算過程は、分析ウインドウ及び合
成ウインドウの時間領域効果を相殺すべく用いられるの
で、この要件が課される。この過程は、図1bのボック
ス116によって表現され、図16aから図16gまで
によって説明されている。逆DCT及びDSTからそれ
ぞれ復元される信号y(t)及びy(t)は、図1
6a及び第16d図に示されている。各信号ブロック
は、1連のブロックにグループ化される。各信号ブロッ
クは、図16b及び図16eに示される分析・合成ウイ
ンドウ関数によって変調される。結果として得られる信
号y′(t)及びy′(t)のブッロクが、図16
c及び図16fに示されている。ブロック長の半分ずつ
が重複されている2つの信号は加算されて図16gに示
される信号y(t)が作り出される。信号y(t)は、
元の入力信号を正確に再構築したものである。
【0176】図18に示されるように、フロックkとブ
ロックk+1との間の重複期間内の或る時刻ntにあ
る信号サンブルは、2つのブロックの各々の中のサンプ
ルによって表現される。ウインドウ処理された2つのブ
ロックの重複・加算に続いて、時刻ntにある復元さ
れた信号サンプルは、ウインドウ処理されたブロックk
及びk+1からのサンプルの合計であることが分かる。
これは、以下の式で表することができる。すなわち、 X(n0t)=WPk(nOt)・x(nOt)+ WPk+1(nOt)・x(nOt) (18) ここで、WPk(nOt)=WAk(nOt)・WSk(nOt)={WAk(nOt)}2 WAk(nOt)=時刻nOtにおけるブロックk中の分析ウインド
ウ WSk(nOt)=時刻nOtにおけるブロックk中の合成ウイ
ンドウ WAk(nOt)=E−TDAC変換に必要なWSk(nOt) である。
【0177】もしウインドウの重複期間を横切る2つの
山ウインドウの合計が単位1に等しければ、山ウインド
ウの変調効果は相殺される。したがって、信号x(n
t)は、ブロックk及びブロックk+1の間の重複期間
内の時間サンプルの総てについて以下のようであれば、
正確に復元される。
【0178】すなわち、 WPk(nt) + WPk+1(nt)=1 0≦n<Nに関して (19) である。
【0179】時間の関数として山ウインドウで作業する
のは困難であるので、式19に示されている要求をウイ
ンドウのサンプル数の関数に翻訳することが望ましい。
式20から式23まででは、100%重複している51
2サンプルの分析及び合成ウインドウのペアの積から作
り出される積ウインドウについてのこの要件を表してい
る。式20では、ウインドウWPの前半部とウインド
ウWPk−1の後半部との重複が表されている。式21
では、ウインドウWPの後半部とウインドウWP
k+1の前半部との重複が表されている。式22及び式
23では、分析山ウインドウに関して等価の表現が示さ
れている。すなわち、 WPk-1(n+256) + WPk(n)=1 0≦n<256に関して (20) WPk(n) + WPk+1(n-256)=1 256≦n<512に関して (21) {WAk-1(n+256)}2 + {WAk(n)}2=1 0≦n<256に関して (22) {WAk(n)}2 + {WAk+1(n-256)}2=1 256≦n<512に関して (23) ここで、 WPk(n)=WAk(n)・WSk(n)={WAk(n)}2 WAk(n)=ブロックk中のサンプルnに対する分析ウイン
ドウの値 WSk(n)=ブロックk中のサンプルnに対する合成ウイン
ドウの値 WAk(n)=E−TDAC変換に必要なWSk(n) である。
【0180】K.信号出力 図1bのボックス117には、ディジタル入力に応答し
て電圧が変化するアナログ信号を発生する、ディジタル
対アナログ・コンバータが示されている。このディジタ
ル入力は、重複・加算過程によって作り出される、24
整数ワードの16最上位ビットから得られる。このアナ
ログ出力は、擬似の高周波成分を取り除くために、15
kHz(20kHz版については20kHz)の通過帯
域を持つ低域フィルタで濾波されなければならない。図
1bでは、このフィルタは示されていない。
【0181】II.本発明の代替的O−TDAC実施例 本発明のもう1つの実施例では、本出願で奇数積み重ね
時間領域エイリアシング相殺(0−TDAC)と呼ぶ、
交互的な変換を利用している。以下の叙述では、本発明
でのE−TDAC方式と0−TDAC方式の間の実施上
の差について論考する。
【0182】A.順方向変換 0−TDACでは、以下の式24に示す改変された離散
余弦変換(DCT)を用いる。すなわち、
【0183】
【式11】 ここで、 k=周波数係数 n=入力信号サンプル数 N=サンプル・ブロック長 m=0−TDACに対する位相項(式6を参照) X(n)=サンプルnにおける入力信号X(t)の量子
化値 C(k)=DCT係数k である。
【0184】0−TDAC変換によって、以下の式の1
組のスペクトル係数又は変換ブロックが作り出される。
すなわち、
【0185】
【式12】 ここで、 i=信号サンプル・フロック数 C(k)=DCT係数k(式24を参照) である。
【0186】ここで用いる計算アルゴリズムは、高速フ
ーリエ変換(FFT)である、E−TDAC方式とは異
なり、0−TDACの実施例では、単一のFFTも用い
ないで、2つの信号サンプル・ブロックを同時発生的に
変換する。しかし、E−TDAC方式で用いられる前逓
倍・変換・後逓倍に類似の技法を用いることにより、変
換の計算上の複雑さは低減される。前逓倍段階では、信
号サンプルX(n)を以下の複素数関数で変調して、信号サ
ンプルの実数値列を複素数列に転換する。すなわち、
【0187】
【式13】 ここで、 j=√−1 n=入力信号サンプル・ブロック数 N=トサンプル・ブロック長 である。
【0188】FFTで実行される離散フーリエ変換によ
って、改変された信号サンプルは1組の変換係数に変換
される。FFTは複素数変換であるので、1組の改変さ
れた信号サンブルの実数部及び虚数部を同時発生的に変
換することができる。最後に、後逓信スナッブによって
真のDCT係数が得られる。この過程は、以下の式27
及び28に表現される。すなわち、
【0189】
【式14】 ここで、 j=√−1 n=入力信号サンプル・ブロック数 N=サンプル・ブロック長 k=周波数係数 n=入力信号サンプル数 m=0−TDACに対する位相項(式6を参照) R(k)=係数X(k)の実数部 Q(k)=係数X(k)の虚数部 C(k)=DCT係数k である。
【0190】本発明の1チャネル版のための好ましい実
施例において、2つの連続する重複信号サンプル・ブロ
ックはバッファ中に記憶され、2つのFFT過程を用い
て共にDCT・DCTブロック・ペアに変換され
る。2チャネル系においては、2チャネルの各々からの
信号サンプル・ブロックは2つのFFT過程を用いてD
CT・DSTブロック・ペアに変換される。
【0191】ブリンセンは、適正な位相成分m(式6を
参照)と、注意深く設計された分析・合成ウインドウと
を用いて、0−TDAC技法によって以下の形式の余弦
変換ブロツクの交互列から入力信号を正確に復元できる
ことを示している。すなわち、 {C1(k)}0,{C2(k)}1,{C1(k)}2,{C1(k)}3・・・ (29) ここで、 C1(k)=信号サンプル・ブロックのDCT
数 C2(k)=信号サンプル・ブロックのDCT
数 である。
【0192】変換ブロックの列は、実際には、2チャネ
ル系における各チャネルから相手の変換ブロックの各々
を、又は1チャネル系において用いられる両方のDCT
の各々から相手の変換ブロックの各々を廃棄することに
よって形成されることに注意して欲しい。
【0193】O−TDAC変換及びエイリアシング消去
過程は、E−TDACの過程と非常に類似しているが、
図21aから図21eまでと、図22aから図22dま
でと、図23aから図23gまでとに示されている。主
要な差異はエイリアシング成分の形式にある。標本化さ
れた信号ブロックの前半部に関して、エイリアシング成
分はサンプル・ブロックの約1/4の点で入力信号の時
間的に逆転したイメージであるが、その振幅の記号は入
力信号の記号と逆転している。標本化された信号ブロッ
クの後半部に関しては、エイリアシングはサンプル・ブ
ロックの約3/4の点で入力信号の時間的に逆転してい
るが、記号は変化していない。これについては、図22
b及び図22dを参照のこと。
【0194】分析及び合成ウインドウの設計法及び使用
法はE−TDACのそれと同等である。これについて
は、図24aから図24gまでを参照のこと。
【0195】B.不均一量子化要素 本発明のE−TDAC方式のための不均一量子化要素
は、DCTブロックが存在することにのみ起因する、ご
く僅かの差異がある点以外は、E−TDAC変換方式で
用いられる不均一量子化要素と同等である。各ブロック
・ペア中には、両変換ブロックには係数C(0)が含ま
れているので、総てのサブバンド指数は2つのブロック
によって共有される。その結果、隠れビットはそこには
なく、係数C(0)に関する「最小」ビット長は9ビッ
トに固定される(E−TDACでは8ビット)。表III
を参照のこと。
【0196】動的ビット割当ては実質的にE−TDAC
に対するそれと同じである。係数C(0)は各ペア中の
両ブロックに対する割当てから除外され、各変換ブロッ
ク・ペアの長さが増加していることから、以下に論じる
ように割当て限界は130ビットしかない。
【0197】C.フォーマット化とフォーマット解除 各符号化DCTブロックには、538ビット(表I及び
IIIを参照のこと)と適応的に割り当てられた130ビ
ットの合計668ビットから成る183の係数仮数が含
まれる。DCTブロックによって共有される2つの主指
数及び37のサブバンド指数によって、E−TDACの
実施例のDCT1・DCT2ブロック・ペアの長さと同
じく、その長さが1486ビットにされる。
【0198】誤り訂正符号を有しないフォーマット化さ
れたフレームの構造は、本発明のE−TDAC中で用い
られるそれと非常に類似しているが、これは図25に示
されている。誤り訂正符号を有するフレームの構造はE
−TDACのそれと同一であるが、これは図20bに示
されている。
【0199】フォーマット解除過程は、隠れビット対し
て点検が為されない点以外は上述の過程と同じである。
【0200】D.逆変換 DCTブロックの半分は、伝送又は記憶から除去されて
いるが、入手可能なDCTブロックから式30に示す関
係を用いて再生される。逆DCTは式31に示されてい
る。すなわち、
【0201】
【式15】 ここで、 k=変換係数 n=信号サンプル数 K=変換係数の番号 N=サンプル・ブロック長 m=E−TDACに対する位相項(式6を参照)
【0202】
【式16】 逆変換の0−TDAC実行で、順方向変換で用いたもの
と同様な前乗算変換・後乗算処理を用いることによって
計算上の複雑さが低減される。この処理では、実数DC
T係数が1組の改変された複素数の係数に転換され、同
時に改変された係数の実数及び虚数部分が変換され、単
一逆FFT(lFFT)を用いて下式に示すように、後
乗算から時間領域信号が得られる。
【0203】
【式17】 ここで、 m=0−TDACに対する位相項(式6を参照) N=サンプル・ブロック長 k=周波数係数番号 n=入力信号サンプル数 r(n)=サンプルX(n)の実数部 q(n)=サンプルx(n)の虚数部
【0204】
【式18】 である。
【0205】後続の、ウインドウ処理、重複・加算、及
び信号出力処理は、本発明のE−TDACの実施に関し
て上で述べた処理と同一である。
【0206】
【表1】
【0207】 表 II 20kHzE−TDACコーダのための周波数係数 主 サブバンド 係数 最小 指数 指数 指数Ln 番号 ビットLn サブバンド0から36までは15kHzコーダと同じで
ある。表Iを参照のこと。 MEXP1 EXP37 4ビット 183-199 2ビット EXP38 200-216 EXP39 217-233
【0208】 表 III 0−TDACコーダのための周波数係数 主 サブバンド 係数 最小 指数 指数 指数Ln 番号 ビットLn MEXP0 MXPO 4ビット 0 9ビット サブバンド1から36まではE−TDACに対するもの
と同じである(表I参照)。サブバンド37から39ま
ではE−TDACに対するものと同じである(表III参
照)。
【図面の簡単な説明】
【図1】図1a及び1bは、本発明の基本的構造を示す
概念図である。
【図2】図2a及び図2bは、本発明の1実施例のハー
ドウエア構成を示す概念図である。
【図3】図3は、本発明の1実施例のハードウエア構成
を示す概念図である。
【図4】図4a及び4bは、本発明の1実施例のハード
ウエア構成を示す概念図である。
【図5】図5a及び5bは、本発明の2チャンネルの実
施例に関する演算要素の直列通信インタフェースの詳細
を示す仮想表現図である。
【図6】図6aは、結果として関数Y(t)を得るため
の関数X(t)の関数W(t)による変調を示す概念図
で、図6bは、時間領域信号サンプルブロックの分析ウ
インドウによる変調を示す仮想図である。
【図7】図7a乃至7dは、時間領域信号サンプルブロ
ックの分析ウインドウによる変調を示す仮想図である。
【図8】図8は、本発明で用いられる非均一量子化要素
に関する高水準論理を示す流れ図である。
【図9】図8は、本発明で用いられる適応ビット割当て
過程に関する詳細な論理を示す流れ図である。
【図10】図10は、代表的フィルタ応答特性及び2つ
の代表的心理音響的マスキング曲線を示す表現図であ
る。
【図11】図11a及び11bは、それぞれ4kHz及
び1kHzの心理音響的マスキング曲線に関するフィル
タ応答特性を示す表現図である。
【図12】図12は、幾つかの信号音の音響心理学的マ
スキング曲線から誘導される複合マスキング曲線を説明
する表現図である。
【図13】図13は、500Hzの音に対する音響心理
学的マスキング曲線に関して、3つの異なるビット割当
てに対して符号化された500Hzの音の符号化雑音及
びひずみの、スペクトル・レベルを示す表現図である。
【図14】図14aから図14eまでは、重複され、ウ
インドウで処理された一連の時間領域信号サンプル・フ
ロックにグループ化される時間領域信号を説明する、仮
想表現図である。
【図15】図15aから図15dまでは、E−TDAC
変換によって作り出される時間領域エイリアシングひず
みを説明する、仮想表現図である。
【図16】図16aから図16gまでは、E−TDAC
変換信号合成の間の、時間領域エイリアシングの重複・
加算による相殺を説明する仮想表現図である。
【図17】図17a及び図17bは、分析専用ウインド
ウを用いるフィルタバンクのフィルタ遷移帯域ロールオ
フ及び阻止帯域排除を、本発明のために設計された分析
・合成ウインドウ・ペアを用いるフィルタバンクのフィ
ルタ遷移帯域ロールオフ及び阻止帯域排除と比較するグ
ラフ表示である。
【図18】図18は、ウインドウで処理された隣接ブロ
ックの重複・加算特性を示す仮想表現図である。
【図19】図19は、4から7までのアルファ値に対す
る幾つかのたたみ込みカイザー・ベッセル(Kaiser-Bes
sel)分析ウインドウの形状を正弦波傾斜ウインドウと
比較する仮想表現図である。
【図20】図20a及びbは、それぞれ誤り符号を有し
ないもの及び有するものにつき、符号化された2つの変
換ブロックのフレームのフォーマットを示す概要図であ
る。
【図21】図21a乃至21eは、本発明のO−TDA
C変換のために実施される、重複されたウインドウで処
理された一連の時間領域信号サンプルブロックにグルー
プ化される時間領域信号を示す仮想表現図である。
【図22】図22a乃至22cは、O−TDAC変換に
よって作り出される時間領域エイリアシングを示す仮想
表現図である。
【図23】図23a乃至23gは、O−TDAC信号合
成間における時間領域エイリアシングの重複・加算によ
る相殺を示す仮想表現図である。
【図24】図24は、誤り訂正を有しない、本発明のO
−TDAC変換実施のために符号化された2つの変換ブ
ロックのフレームのフォーマットを示す概要図である。
【符号の説明】
101 標本化・量子化要素 103 分析ウインドウ乗算要素 104 フィルターバンク 105 浮動小数点エンコーダ 108 非均一量子化要素 109 フォーマッタ 110 デフォーマッタ 113 直線化要素 114 逆フィルターバンク 115 合成ウインドウ 116 重複・加算要素 117 アナログ・デジタル変換要素
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI H04B 14/04 G10L 9/18 C (72)発明者 グラント・アレン・デビットソン アメリカ合衆国、94618 カリフォルニ ア州オークランド、カルデコット・レー ン 182、アパートメント 222 (56)参考文献 特開 昭61−201526(JP,A) 特開 昭63−201700(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G10L 19/00 G11B 20/10 301 H04B 14/04

Claims (14)

    (57)【特許請求の範囲】
  1. 【請求項1】 オーディオ情報を高品質でデジタル符号
    化するエンコーダであって、 前記オーディオ情報のサブバンドを表すサブバンド情報
    を発生させる要素と、 仮数にビットを割当ることによって指数と関連する前記
    仮数を含む浮動小数点形式で前記サブバンド情報を表す
    コードワードを発生させる要素であって、前記仮数の少
    なくとも幾つかが正規化され、前記正規化された1以上
    の仮数に記号ビットではない最上位データビットを割当
    るか又は最上位データビットではない記号ビットを割当
    ることによって前記正規化された仮数の1以上が発生さ
    れるコードワード発生要素と、 前記コードワードを含むデジタル情報を、伝送又は記憶
    に適したフォーマットを有するデジタル出力にアセンブ
    ルする要素とから成るエンコーダ。
  2. 【請求項2】 分析ウインドウ加重された信号サンプル
    ブロックを形成するために前記信号サンプルのブロック
    を分析ウインドウで重み付けし、前記分析ウインドウ加
    重された信号サンプルブロックに離散変換を適用するこ
    とによって前記サブバンド情報が発生される、請求項1
    のエンコーダ。
  3. 【請求項3】 符号化された信号からオーディオ情報を
    高品質で再生するデコーダであって、 仮数にビットを割当ることによって指数と関連する前記
    仮数を含む浮動小数点形式で表されるコードワードを得
    るために前記符号化された信号をデフォーマットする要
    素であって、記号ビットではない最上位データビットを
    割当るか又は最上位データビットではない記号ビットを
    割当ることによって1以上の正規化された仮数が得られ
    るデフォーマット要素と、 任意のミッシング記号ビット又は最上位データビットを
    再構成することによって前記コードワードからサブバン
    ド情報を再構成する要素と、 前記再構成されたサブバンド情報に応答して前記オーデ
    ィオ情報を再生する要素とからなるデコーダ。
  4. 【請求項4】 前記得られたサブバンド情報に逆離散変
    換を適用することによって前記信号サンプルが発生され
    る、請求項3のデコーダ。
  5. 【請求項5】 オーディオ情報を高品質で符号化するエ
    ンコーダであって、 前記オーディオ情報のサブバンドを表すサブバンド情報
    を発生させる要素と、 コードワードにビットを適応的に割当ることによって前
    記オーディオ情報のサブバンドを表すサブバンド情報を
    発生させる要素であって、前記それぞれのサブバンドの
    エネルギーレベルに基づいてビットが、それぞれのサブ
    バンドに対するサブバンド情報を表すコードワードに適
    応的に割当られ、前記それぞれのサブバンドのエネルギ
    ーレベルに基づいて追加のビットが、隣接サブバンドに
    対するサブバンド情報を表すコードワードに割当られ、
    前記隣接サブバンドが前記それぞれのサブバンドに隣接
    し、該それぞれのサブバンドより低いエネルギーネベル
    を有するコードワード発生要素と、 前記コードワードを含むデジタル情報を、伝送又は記憶
    に適したフォーマットを有するデジタル出力にアセンブ
    ルする要素とから成るエンコーダ。
  6. 【請求項6】 前記サブバンド情報が、分析ウインドウ
    加重された信号サンプルブロックを形成するために前記
    オーディオ情報の信号サンプルのブロックを分析ウイン
    ドウで重み付けし、前記分析ウインドウ加重された時間
    領域信号サンプルブロックに離散変換を適用することに
    よって発生される変換係数を含む、請求項5のエンコー
    ダ。
  7. 【請求項7】 前記コードワードが、 各サブバンドの相対的エネルギーレベルを評価し、 最大相対エネルギーレベルを有するサブバンドの第1グ
    ループに対するサブバンド情報を表すコードワードにビ
    ットを割当て、一定数のビットがサブバンドの前記第1
    グループに対するサブバンド情報を表すコードワードの
    各々に割当られてしまった時前記割当を停止し、 該コードワードの各々が前記一定数のビットに割当られ
    てしまっているサブバンドに隣接するサブバンドに対す
    るサブバンド情報を表すコードワードに前記追加ビット
    を割当ることによって発生される、請求項5又は6のエ
    ンコーダ。
  8. 【請求項8】 デジタル情報を含む符号化された信号か
    らオーディオ情報を高品質で再生するデコーダであっ
    て、 前記デジタル情報からコードワードを得る要素であっ
    て、前記コードワードが前記オーディオ情報のサブバン
    ドに対するサブバンド情報を表すコードワード要素と、 ビットを前記コードワードに適応的に割当ることによっ
    て前記サブバンド情報を発生させる要素であって、前記
    それぞれのサブバンドのエネルギーレベルに基づいてビ
    ットが、それぞれのサブバンドに対するサブバンド情報
    を表すコードワードに適応的に割当られ、前記それぞれ
    のサブバンドのエネルギーレベルに基づいて追加のビッ
    トが、隣接サブバンドに対するサブバンド情報を表すコ
    ードワードに割当られ、前記隣接サブバンドが前記それ
    ぞれのサブバンドに隣接し、該それぞれのサブバンドよ
    り低いエネルギーネベルを有するコードワード発生要素
    と、 前記サブバンド情報に応答して前記オーディオ情報を再
    生する要素とから成るデコーダ。
  9. 【請求項9】 前記サブバンド情報に逆離散変換を適用
    することによってオーディオ情報が再生される、請求項
    8のデコーダ。
  10. 【請求項10】 前記サブバンド情報が、 各サブバンドの相対的エネルギーレベルを評価し、 最大相対エネルギーレベルを有するサブバンドの第1グ
    ループに対するサブバンド情報を表すコードワードにビ
    ットを割当て、一定数のビットがサブバンドの前記第1
    グループに対するサブバンド情報を表すコードワードの
    各々に割当られてしまった時前記割当を停止し、 該コードワードの各々が前記一定数のビットに割当られ
    てしまっているサブバンドに隣接するサブバンドに対す
    るサブバンド情報を表すコードワードに前記追加ビット
    を割当ることによって発生される、請求項8又は9のエ
    ンコーダ。
  11. 【請求項11】 オーディオ情報を高品質でデジタル符
    号化する方法であって、 前記オーディオ情報のサブバンドを表すサブバンド情報
    を発生させ、 仮数にビットを割当ることによって指数と関連する前記
    仮数を含む浮動小数点形式で前記サブバンド情報を表す
    コードワードを発生させ、前記仮数の少なくとも幾つか
    が正規化され、前記正規化された1以上の仮数に記号ビ
    ットではない最上位データビットを割当るか又は最上位
    データビットではない記号ビットを割当ることによって
    前記正規化された仮数の1以上が発生されるようにし、 前記コードワードを含むデジタル情報を、伝送又は記憶
    に適したフォーマットを有するデジタル出力にアセンブ
    ルすることとから成る符号化方法。
  12. 【請求項12】 符号化された信号からオーディオ情報
    を高品質で再生する復号方法であって、 仮数にビットを割当ることによって指数と関連する前記
    仮数を含む浮動小数点形式で表されるコードワードを得
    るために前記符号化された信号をデフォーマットし、記
    号ビットではない最上位データビットを割当るか又は最
    上位データビットではない記号ビットを割当ることによ
    って1以上の正規化された仮数が得られるようにし、 任意のミッシング記号ビット又は最上位データビットを
    再構成することによって前記コードワードからサブバン
    ド情報を再構成し、 前記再構成されたサブバンド情報に応答して前記オーデ
    ィオ情報を再生することからなる復号方法。
  13. 【請求項13】 オーディオ情報を高品質で符号化する
    方法であって、 前記オーディオ情報のサブバンドを表すサブバンド情報
    を発生させ、 コードワードにビットを適応的に割当ることによって前
    記オーディオ情報のサブバンドを表すサブバンド情報を
    発生させ、前記それぞれのサブバンドのエネルギーレベ
    ルに基づいてビットが、それぞれのサブバンドに対する
    サブバンド情報を表すコードワードに適応的に割当ら
    れ、前記それぞれのサブバンドのエネルギーレベルに基
    づいて追加のビットが、隣接サブバンドに対するサブバ
    ンド情報を表すコードワードに割当られ、前記隣接サブ
    バンドが前記それぞれのサブバンドに隣接し、該それぞ
    れのサブバンドより低いエネルギーネベルを有するよう
    にし、 前記コードワードを含むデジタル情報を、伝送又は記憶
    に適したフォーマットを有するデジタル出力にアセンブ
    ルすることから成る符号化方法。
  14. 【請求項14】 デジタル情報を含む符号化された信号
    からオーディオ情報を高品質で再生する復号方法であっ
    て、 前記デジタル情報からコードワードを導出し、前記コー
    ドワードが前記オーディオ情報のサブバンドに対するサ
    ブバンド情報を表すようにし、 ビットを前記コードワードに適応的に割当ることによっ
    て前記サブバンド情報を発生させ、前記それぞれのサブ
    バンドのエネルギーレベルに基づいてビットが、それぞ
    れのサブバンドに対するサブバンド情報を表すコードワ
    ードに適応的に割当られ、前記それぞれのサブバンドの
    エネルギーレベルに基づいて追加のビットが、隣接サブ
    バンドに対するサブバンド情報を表すコードワードに割
    当られ、前記隣接サブバンドが前記それぞれのサブバン
    ドに隣接し、該それぞれのサブバンドより低いエネルギ
    ーネベルを有するようにし、 前記サブバンド情報に応答して前記オーディオ情報を再
    生することから成る復号方法。
JP10158415A 1989-01-27 1998-05-21 高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ Expired - Lifetime JP3093178B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US30371489A 1989-01-27 1989-01-27
US303,714 1989-01-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2503825A Division JP2821713B2 (ja) 1989-01-27 1990-01-29 高品質オーディオ用低ビット伝送速度変換コーダ、デコーダ、及びエンコーダ・デコーダ

Publications (2)

Publication Number Publication Date
JPH11145844A JPH11145844A (ja) 1999-05-28
JP3093178B2 true JP3093178B2 (ja) 2000-10-03

Family

ID=23173354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10158415A Expired - Lifetime JP3093178B2 (ja) 1989-01-27 1998-05-21 高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ

Country Status (1)

Country Link
JP (1) JP3093178B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111971901A (zh) * 2018-03-27 2020-11-20 皇家飞利浦有限公司 用于跨多个空间上分开的阶段执行模数转换的系统和方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009081003A1 (fr) * 2007-12-21 2009-07-02 France Telecom Codage/decodage par transformee, a fenetres adaptatives
EP2351024A1 (en) 2008-10-01 2011-08-03 GVBB Holdings S.A.R.L Decoding apparatus, decoding method, encoding apparatus, encoding method, and editing apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111971901A (zh) * 2018-03-27 2020-11-20 皇家飞利浦有限公司 用于跨多个空间上分开的阶段执行模数转换的系统和方法

Also Published As

Publication number Publication date
JPH11145844A (ja) 1999-05-28

Similar Documents

Publication Publication Date Title
JP2821713B2 (ja) 高品質オーディオ用低ビット伝送速度変換コーダ、デコーダ、及びエンコーダ・デコーダ
JP3093179B2 (ja) 高品質オーディオ用短時間遅延変換エンコーダ及びデコーダ
US5230038A (en) Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5222189A (en) Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5479562A (en) Method and apparatus for encoding and decoding audio information
US5357594A (en) Encoding and decoding using specially designed pairs of analysis and synthesis windows
US5752225A (en) Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
JP3224130B2 (ja) 高品質オーディオ用符号器・復号器
Shlien Guide to MPEG-1 audio standard
PL183092B1 (pl) Produkt akustyczny wielokanałowy
JP3093178B2 (ja) 高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 10