JPH04504192A - 高品質オーディオ用低ビットレート変換コーダ、デコーダ、及びエンコーダ・デコーダ - Google Patents

高品質オーディオ用低ビットレート変換コーダ、デコーダ、及びエンコーダ・デコーダ

Info

Publication number
JPH04504192A
JPH04504192A JP2503825A JP50382590A JPH04504192A JP H04504192 A JPH04504192 A JP H04504192A JP 2503825 A JP2503825 A JP 2503825A JP 50382590 A JP50382590 A JP 50382590A JP H04504192 A JPH04504192 A JP H04504192A
Authority
JP
Japan
Prior art keywords
transform
block
time
domain
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2503825A
Other languages
English (en)
Other versions
JP2821713B2 (ja
Inventor
フィルダー、ルイス・ダン
デビッドソン、グラント・アレン
Original Assignee
ドルビー・ラボラトリーズ・ランセンシング・コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26973611&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JPH04504192(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ドルビー・ラボラトリーズ・ランセンシング・コーポレーション filed Critical ドルビー・ラボラトリーズ・ランセンシング・コーポレーション
Publication of JPH04504192A publication Critical patent/JPH04504192A/ja
Application granted granted Critical
Publication of JP2821713B2 publication Critical patent/JP2821713B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1806Pulse code modulation systems for audio signals
    • G11B20/1809Pulse code modulation systems for audio signals by interleaving
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M5/00Conversion of the form of the representation of individual digits
    • H03M5/02Conversion to or from representation by pulses
    • H03M5/04Conversion to or from representation by pulses the pulses having two levels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 高品質オーディオ用低ビットレート変換コーダ、デコーダ、及びエンコーダ・デ コーダ 逍」し虹! 本発明は概して、音楽信号のようなオーディオ信号を低ビツトレートで高品質の ディジタル信号処理を行うことに関する。
背景技術 信号処理の分野では、所与の信号を十分に表現するために必要な情報の量を最小 化する方法を発見することに大きな関心が払われている。必要な情報を低減する ことによって、信号をより狭い帯域で伝送したり、より少ない空間に記憶するこ とができる。ディジタル技法に関して、より少ない情報とは、必要な2値ビツト がより少ないことと同義である。
ビットの削減は、2つの因子によって制限される。すなわち、 (1)帯域Wの信号は、2・Wより低くない周波数で標本化された一連のサンプ ルによって、正確に表現される。
これがナイキストのサンプリング・レートである。したがって、帯域Wの1秒間 の長さの信号を正確に表現するには、少なくとも2・W−Tの数のサンプルが必 要である。
(2)信号サンプルの量子化には連続する範囲のどのような数値をも取り得るが 、この数値によっては、量子化ステップ規模又は解像力に比例する不正確な信号 表現を生じる。この不正確さは量子化エラーと呼ばれる。このエラーは、信号サ ンプル量子化の表現に用いることのできるビット数に反比例する。
である。
もし全帯域に対してコーディング技法が適用されると、総ての量子化エラーは、 雑音として現れ、帯域全般にわたって均等に拡散する。スペクトルの選択された 部分に適用できる技法によって、量子化雑音のスペクトル上の拡散を制限できる 。このような技法としては、サブバンド・コーディングと変換コーディングの2 種がある。これらの技法を用いることによって、量子化雑音が特に許容し難い特 定の周波数帯において当該周波数帯を少ないステップ数で量子化することにより 量子化エラーを低減できる。
ディジタル帯域フィルタの傾斜面によって、サブバンド・コーディングを実現す ることができる。ディジタル帯域フィルタの傾斜面をシミュレートする幾つかの 時間領域対周波数領域変換によって、変換コーディングを実現することができる 。変換はディジタル・フィルタよりも実現が容易であり、計算処理も少な(て済 むが、変換係数で表わされる各帯域フィルタの「周波数容器」が均等なサブバン ド帯域を存する点で設計の柔軟性に欠ける。
これと対照的に、ディジタル帯域フィルタの傾斜面は種々のサブバンド帯域を有 するようにこれを設計できる。
しかし、変換係数をグループ化して単一変換係数帯域の多重の帯域を有する「サ ブバンド」を決定できる。以下、「サブバンド」という用語は、全信号帯域の選 択された部分がサブバンド・ローブで実現されたものであれ、変換ローブで実現 されたものであれ、全信号帯域の選択された部分を指すものとして用いられる。
変換ローブで実現されるサブバンドは、隣接する変換係数又は周波数容器の1つ 又は2つ以上の組によって決定される。変換ローブの周波数容器の帯域は、各信 号サンプル・ブロックにおける変換ローブのサンプリング・レート及びサンプル 数(変換長)に依存する。
サブバンド帯域フィルタの2つの特性は、音楽用信号を高品質で処理する際に特 に重要である。その第1は、フィルタの通過帯域と阻止帯域との間の領域(41 1移帯切の帯域幅である。第2は、阻止帯域での減衰レベルである。本出願で用 いているように、フィルタの「選択性」の尺度は、遷移帯域内のフィルタ応答特 性曲線の鋭さく遷移帯域ロールオフの鋭さ)及び阻止帯域での減衰レベル(阻止 帯域の深さ)である。
人の耳には可変中心周波数を持つ極度に非対象に同調されたフィルタの周波数分 析性と類似の特性があるので、これらの2つのフィルタ特性は重要である。人の 耳の同調されたフィルタの周波数分解力はオーディオのスペクトル全体にわたっ て周波数につれて変わる。約500H2以下の周波数においては共に接近して存 在する信号を識別することができ、可聴限界に至るまで周波数が上昇するにつれ て識別可能な信号間の幅が拡がる。このような聴覚上のフィルタの有効帯域は臨 界帯域と呼ばれる。
臨界帯域の重要な特質は、音響心理学的マスキング効果が臨界帯域内で最も強く 現れること、すなわち、臨界帯域内の支配的な信号によって臨界帯域内の如何な る周波数の他の信号に対してもそれへの聴取力が抑制されることである。臨界帯 域の外側にある信号に対してはこのマスキング効果はそれ根強くは現れない。こ の概要については、マッグロウヒル社1988年出版(McGrav−Hill 。
San Fransisco、 1988)の、K、フレア・ベンソン編(!。
Ba1ir Ben5on ed、)の「オーディオ・エンジニアリングa ハ ンドブック(Audio Engineering Hand−book) J の1゜40ページから1.42ページまでと、4.8ページから4.10ページ までとを参照されたい。
音響心理学的マスキングは、もしオーディオのスペクトル全体にわたるサブバン ド帯域幅がこのスペクトルの同一部分における人の耳の臨界帯域幅の約半分であ るならば、サブバンド及び変換ローブによって更に容易に達成される。これは、 人の耳の臨界帯域には聴覚上の刺激に順応する可変の中心周波数があるのに対し て、サブバンド及び変換ローブは典型的に固定の中心周波数を具えているからで ある。音響心理学的マスキング効果を利用する機会を適正化するために、支配的 信号の存在によって生じる総ての人工的ひずみは支配的信号を含むサブバンドに 制限されなければならない。もしサブバンド帯域が臨界帯域の約半分又はそれよ り小さければ(また、もし、遷移帯域ロールオフが+万に鋭く、阻止帯域排除が 十分に深ければ)、サブバンド通過帯域の帯域幅の縁の近傍に周波数がある信号 についてさえも望ましくないひずみに対する最も効果的なマスキング効果を生じ る可能性がある。もしサブバンド帯域が臨界帯域の半分より大きければ、支配的 信号によってローブのサブバンドから人の耳の臨界帯域が偏位させられて、人の 耳の臨界帯域の外側にある望ましくないひずみの幾分かがマスクされない可能性 がある。これらの効果は、人の耳の臨界帯域が狭い低い周波数においては極めて 許容し難い。
ブロック長 ブロック長が短くなるにつれて、変換エンコーダ及びデコーダは周波数容器を連 続して拡げなければならなくなるのみならず、帯域フィルタの周波数容器の応答 特性をも劣化させること、すなわち、(1,)am移帯域ロールオフ・レートの 減少、(2)阻止帯域のレベルの減少という不利益が生じる。この帯域フィルタ の特性劣化によって、望ましい信号に応じて周波数容器の近傍において変換係数 への望ましくない発生又は寄与が生じる。これらの望ましくない寄与は、サイド ローブ漏洩と呼ばれる。
したがって、サンプリング・レートによっては、ブロック長を短くすることによ って、幾つか又は総ての周波数、特に低い周波数において人の耳の臨界帯域を超 える満足すべきフィルタ帯域となる。たとえこの満足すべきサブバンド帯域が人 の耳の臨界帯域よりも狭くとも、広い遷移帯域及び貧弱な阻止帯域排除として現 れる劣化したフィルタ特性によって人の耳の臨界帯域の外側に顕著な信号成分が 現れる。このような場合には、この系の他の面、特に量子化精度に一層大きな制 約を与えるのが通例である。
ブロック長を短くすることから生じるもう1つの不利益は、次の節に述べる変換 コーディング・エラーが悪化することである。
変換コーディング・エラー 個別分散変換は信号の有限のセグメントを用いる場合にのみ機能するので、個別 分散変換によっては完全に正確な周波数係数の組は生み出されない。厳密に言え ば、個別分散変換によって、無限の変換長を必要とする真の周波数領域の表現よ りむしろ入力周波数領域の表現が生み出される。しかしながら、ここでの議論の 便宜上、個別分散変換の出力を周波数領域の表現とすることにしよう。実際には 、個別分散変換では、サンプルされた信号は周期が有限のサンプル期間の整数分 の1の周波数成分を持つのみであると仮定している。これは、有限長の信号が周 期性のものであると仮定することに等しい。一般的に、この仮定は正しくない。
この仮定された周期性によって、有限時間期間の縁において不連続を生じ、それ によってこの変換で擬似の高い周波数を生じる。
この効果を低減する1つの技法は、期間の縁の近傍の信号サンプルを0に近付く ように評価することによって変換を行う前にこの非連続を低減することである。
期間の中心にあるサンプルは一般的に変更されずに、すなわち、係数1で重み付 けられて通過される。この重み付は機能は、「分析ウィンドウ」と呼ばれ、どの ような形状でも良いが、幾つかのウィンドウはサブバンドのフィルタ特性として 寄与することが更に好ましい。
本出願で用いているように、「分析ウィンドウ」という用語は、前方変換を適用 する前に行われるウィンドウ機能処理を単に指している。下で議論するように、 本発明中で用いられている分析ウィンドウの設計は、合成ウィンドウ設計につい て統合的に考慮することによって制約される。したがって、その用語が用いられ ている当分野の「分析ウィンドウ」の設計と動作の性質とは、本発明で実施され ている分析ウィンドウは異なっている。
ウィンドウの質を評価すべく用いることのできる単一の条件はないが、他方、一 般的な条件には、遷移帯域ロールオフの鋭さと阻止帯域の深さとが含まれる。幾 つかの用途では、鋭いロールオフと深い阻止レベルとを取り引きすることは有益 な特質である。
分析ウィンドウは時間領域機能である。もし他の補償が行われなければ、復元若 しくは「合成」された信号は分析ウィンドウの形状に従ってひずみを生じる。補 償方法には幾つかあるが、例えば、以下のとおりである。
(a)復元された信号期間又はブロックを、逆ウィンドウ、すなわち、重み付は 係数が分析ウィンドウの評価係数の逆数であるウィンドウで乗じることができる 。この技法の短所は、分析ウィンドウがその縁で0にならないことが必要なこと である。
(b)前後につながりのある入力信号ブロックを重複させることができる。2つ の隣接するウィンドウがこの重複で合計が単位1になるように分析ウィンドウを 注意深く設計することによって、このウィンドウ効果が正確に補償される。(し かし、次の節を見て欲しい)。個別分散フーリエ変換(D F T :Disc rete Fourier Transformのような成る種の変換と共に用 いられる時には、この技法では、重複期間中の信号の一部を2度変換し伝送しな ければならないので、当該信号を表わすのに必要なビット数が増加する。これら の形式の変換に関しては、重複期間を有するウィンドウを可能な限り小さく設計 することが望ましい。
(c)逆変換からの合成出力にもウィンドウ処理を行う必要がある。本発明で用 いている変換を含めて、幾つかの変換ではこのウィンドウ処理を要する。更に、 量子化エラーによって、有限時間期間の縁においてOとならない時間領域信号が 逆変換に生じる。これをそのままにして置くと、復元された時間領域信号はこの エラーによってウィンドウ重複期間内で最も強く歪まされる。各合成信号ブロッ クをその縁で整形するために、合成ウィンドウを用いることもできる。この場合 、当該信号は分析及び合成ウィンドウで処理される。すなわち、当該信号はこれ ら2つのウィンドウの積によって重み付けられる。
したがって、両方のウィンドウとも、この2つのウィンドウの積が重複部分で合 計が単位lになるように設計されなければならない。前節における議論を参照し て欲しい。
短い変換サンプル・ブロックでは、上記の分析及び合成ウィンドウに対してより 大きな補償が必要となる。変換サンプル・ブロックが短くなればなる程、フィル タの遷移帯域及び阻止帯域を通してのサイドローブ漏洩が一層多くなる。
サイドローブ漏洩によってフィルタの通過帯域の外側の信号成分の周波数を誤っ て表現するスペクトル係数を変換に生じさせるので、サイドローブ漏洩は望まし くない。この表現誤りがエイリアシングと呼ばれるひずみでナイキスト理論では 、サンプル間の期間が信号の最高周波数成分の期間の半分より短ければ個別分散 のサンプルから正確に信号を復元できると考える。サンプリング・レートがこの ナイキスト・レートよりも小さければ、高い周波数成分は低い周波数成分として 誤って表わされる。この低い周波数成分が真の成分に対する「エイリアス」であ る。
サブバンド会フィルタ及び有限ディジタル変換は、完全な帯域通過フィルタでは ない。通過帯域と阻止帯域との間の遷移は無限に鋭いものではな(、阻止帯域中 における信号減衰は無限に大きくはない。その結果、通過帯域で濾波された入力 信号が通過帯域遮断周波数によって指定されるナイキスト・レートでサンプルさ れると、この遮断周波数より高い遷移帯域中の周波数は忠実には表現されない。
エイリアシングひずみが逆変換によって自動的に消去されるように分析及び合成 フィルタを設計することが可能である。時間領域中の直角ミラー・フィルタには この特性がある。本発明で用いている変換コーグを含めて成る種の変換コーグで も、エイリアシングひずみを消去する。
サンプル・ブロック長を短くすればする程、変換ニーダ中でエイリアシングひず みが聴取可能になるのを抑制するのが一層困難になる。上で説明したように、サ ンプル・ブロック長を短くすることによってフィルタ特性が劣化する。すなわち 、通過帯域幅が拡がり、通過帯域対阻止帯域の遷移がより鋭さを失い、阻止帯域 排除特性が悪化する。その結果、エイリアシングがより一層目立つようになる。
もしエイリス成分が不十分な正確さで符号化され復号されると、これらの符号化 エラーによって、エイリアシングひずみを逆変換で完全に消去することが妨げら れる。この残留エイリアシングひずみは、音響心理学的にマスキングされない限 り聴取可能なものとなる。
しかし、サンプル・ブロック長を短くすることによって、周波数容器の幾つかは 、特に聴覚上の臨界帯域がより大きな分解力を有する低い周波数で、聴覚上の臨 界帯域よりも広い通過帯域を具えることになる。この結果として、エイリアシン グひずみをマスクすることができない。このひずみを極少化する1つの方法は、 問題のサブバンド中での量子化精度を向上させることであるが、それによって必 要なビット・レートは増加する。
ビット・レート低減 法 上で挙げた2つの要因(ナイキスト・サンプル・レート及び量子化エラー)によ って、信号の伝送及び記憶の特定の品質に対するビット・レートは決定される。
しかし、所与の信号品質に対して必要なビット・レートを低減する技法を用いる ことができる。これらの技法では、信号の冗長性と非関連性を利用する。信号が 予見できるか、若しくは受信機から供給されるものであるならば、その信号成分 には冗長性がある。特定の表現品質を達成する必要がなければ、その信号成分に は非関連性がある。
この技術分野に用いられる幾つかの技法には、以下の事柄が含まれる。すなわち 、 (1)予測 信号の周期的乃至は予測可能な特性によって現在又は先行する信号特性に基づく 成る成分を受信機に予期させることができる。
(2)エントロピー・コーディング 省略されたコードで、高い発生確率の成分を表現する。
送信機及び受信機の両方とも同一のコード・ブックを備えていなければならない 。エントロピー・コーディング及び予測には、計算の複雑さと処理による遅延が 増えることの短所がある。しかも、これらによって可変レート出力が与えられる ので、もし一定ビット・レート系で用いるのであればバッファに入れる必要があ る。
(3)非均等コーディング 対数又は非均等量子化による表現によって、量子化エラーが大きくなる犠牲の下 で、大信号値のコーディングを少ないビットで行うことを可能にする。
(4)フローティングポイント 70−ティングポイント表現によって、精度を下げる犠牲の下で、ビット数を減 らすことができる。ブロック・フローティングポイント表現ではブロック・フロ ーティングポイント仮数に対して1つの尺度因子又は指数を用い、これは時間領 域信号を符号化するために用いられる。
フローティングポイントは、非均質符号化の特異例である。
(5)ビット割当て 正確さに関する受信機の要求は、時間、信号内容、強さ又周波数と共に変化する 。例えば、話し声の低い周波数成分は、話し言葉を理解し話者を認識する上で一 層重要であるので、高い周波数成分より一層高い精度で伝送されなければならな い。音楽信号に関しては、別の条件が課せられる。ビット割当てについての幾つ かの条件は、以下のとおりである。すなわち、 (a)成分変数 最大レベルの交流電力を持つ変換係数に対しては、より多くのビットを割り当て る。
(b)成分値 最大振幅又はエネルギーを持つ周波数帯を表現する変換係数に対しては、より多 くのビットを割り当てる。
(C)音響心理学的マスキング 他の信号成分によって量子化エラーがマスクされる(分裂聴感)信号成分により 少ないビットを割り当てる。この技法は、聴取可能な信号が人が知覚することを 目的として企図されている用途でその特質を発揮する。マスキングは、音楽信号 のような多重信号及び復号波形よりも単音に関してよく認識される。
発明の開示 毎秒128にビット(jbs)程度の低いビットレートで主観的に高品質の音を 提供するエンコーダ及びデコーダ装置と方法とを用いて、広帯域のオーディオ情 報、特に音楽のディジタル処理を行うことが本発明の目的である。
再生の品質が例えば放送用オーディオ網のような高品質の伝送又は記憶及び再生 に適する、符号化及び復号化の装置と方法を提供することが本発明の更なる目的 である。
コンパクト・ディスクで得られる程度に主観的に良好な再生の品質を提供するこ とが本発明の更なる目的である。
伝送線路による信号の悪化に対して高度の耐性を有するディジタル処理系中で実 現される、符号化及び復号化の装置と方法を提供することが本発明の更なる目的 である。
符号化された信号を少ない空間しか必要とせずに記憶するディジタル処理系中で 実現される、符号化及び復号化の装置と方法を提供することが本発明の更なる目 的である。
本発明のもう1つの目的は、音楽信号を処理する変換ニーダ中に改良された音響 心理学的マスキング技法を提供することである。
加えて、本発明のもう1つの目的は、変換ニーダ中の聴取可能なひずみ人工物に 対して音響心理学的に補償する技法を提供することである。
上記の本発明の目的の詳細については、当明細書の全体をとおして説明するが、 以下の「発明を実施するための望ましい形態」を叙述する節で特に詳しく説明す る。
本発明の教えるところにより、エンコーダによって広帯域オーディオ情報のディ ジタル符号化が行われる。この広帯域オーディオ信号は、標本化され、時間領域 サンプル・ブロックに量子化される。その後、各サンプル・ブロックは分析ウィ ンドウによって変調される。周波数領域のスペクトル成分がその後、分析ウィン ドウによって重み付けられた時間領域サンプル・ブロックに応じて発生される。
適応的ビットの割当てを行う変換コーグによって、各変換係数が量子化され、こ れらの係数記憶又は伝送に適するフォーマットを有するディジタル出力に組み立 てられる。伝送信号が通信線路の雑音又はその他の妨害にさらされる用途におい ては、エラー修正コードを用いても良い。
更に本発明の教えるところにより、本発明のエンコーダによって符号化されるデ ィジタル符号化広帯域オーディオ信号の高品質の再生が、本発明のデコーダによ って行われる。デコーダによって、エンコーダのディジタル出力が記憶装置又は 伝送線路を経由して受け取られる。
デコーダによって、フォーマット化されたディジタル信号からの符号化スペクト ル成分が誘導され、この成分から時間領域スペクトル成分が再構築される。この 時間領域のスペクトル成分を発生したエンコーダ中の装置に対して逆の特性を具 える装置によって、周波数領域のスペクトル成分に応じて時間領域信号サンプル ・ブロックが発生される。このサンプル・ブロックは合成ウィンドウによって変 調される。この合成ウィンドウは、この合成ウィンドウの応答特性とエンコーダ 中の分析ウィンドウの応答特性との積によって2つの隣接する重複サンプル・ブ ロックに関して合計が単位1になる複合応答特性が作り出されるような特性を具 えている。隣接するサンプル・ブロックは、分析及び合成ウィンドウの重み付は 効果を消去し高品質のアナログ出力にその後変換される時間領域信号のディジタ ル化された表現を復元すべく重複され、加算される。
更に本発明の教えるところにより、エンコーダ・デコーダ系によって、広帯域オ ーディオ情報の高品質のディジタル符号化と再生が行われる。この系のエンコー ダ部分中では、アナログの広帯域オーディオ信号が時間領域サンプル・ブロック に量子化される。その後、各サンプル・ブロックは分析ウィンドウによって変調 される。その後、分析ウィンドウによって重み付けられた時間領域サンプル・ブ ロックに応じて、周波数領域のスペクトル成分が発生される。適応的ビット割当 てを含む非均質スペクトル符号化によって各スペクトル成分が量子化さ瓢これら の成分は、信号の悪化を受け易い記憶又は通信線路をとおしての伝送に適するフ ォーマットを有するディジタル出力に組み立てられる。この系のデコーダ部分に よって、エンコーダ部分のディジタル出力が記憶装置又は伝送線路を経由して受 け取られる。このデコーダ部分によって、フォーマット化されたディジタル信号 から非均質に符号化されたスペクトル成分が誘導され、この成分から周波数領域 のスペクトル成分が再構築される。周波数領域変換係数を発生したエンコーダ部 分中の装置に対して逆の特性を具える装置によって、周波数領域変換係数に応じ て時間領域サンプル・ブロックが発生される。
このサンプル・ブロックは合成ウィンドウによって変調される。この合成ウィン ドウは、この合成ウィンドウの応答特性とエンコーダ部中の分析ウィンドウの応 答特性との積によって2つの隣接する重複サンプル・ブロックに関して合計が単 位1になる複合応答特性が作り出されるような特性を具えている。隣接するサン プル・ブロックは、分析及び合成ウィンドウの重み付は効果を消去し高品質のア ナログ出力にその後変換される時間領域信号のディジタル化された表現を復元す べ(重複され、加算される。
本発明のエンコーダの実施例において、個別分散変換によって、周波数領域のス ペクトル成分が、分析ウィンドウで重み付けられた時間領域サンプル・ブロック に応じて発生される。この個別分散変換には、改良型の個別分散余弦変換(D  CT :Discrete Co51ne Trans−form)及び改良型 の個別分散正弦変換(D S T :DiscreteSine Transf or菖)を具えていることが好ましい。代替的な実施例においては、この個別分 散変換は改良型の個別分散余弦変換(D CT :Discrete Co51 ne Trans−form)によって実施されるが、実買的に総ての時間領域 対周波数領域変換を用いることができる。
エンコーダに関する本発明の好ましい実施例においては、1チヤネル系では2つ の隣接する信号サンプル・ブロック、又は2チヤネル系では各チャネルの1つの 信号サンプル・ブロックに関して先行変換を同時に計算するために単一のFFT を利用する。デコーダに関する本発明の好ましい実施例においては、2つの変換 ブロックに関して逆変換を同時に計算するために単一のFFTを利用する。
エンコーダ及びデコーダの好ましい実施例においては、サンプリング・レートは 44.1kHzである。このサンプリング・レートは決定的なものではないが、 適切であり、コンパクト・ディスクに用いられているサンプリング・レートであ るので便利である。この44.1kH2のサンプリング・レートを用いている好 ましい実施例においては、名目上の周波数応答特性は15kHzまで延びており 、時間領域サンプル・ブロックは512サンプルの長さを具えている。
本発明の好ましい実施例においては、職業用放送局に適する主観的な品質での音 楽の符号化は、毎秒128にビット(エラー訂正コードのような付加的情報を含 めて)程度の低いビットレートを用いて達成される。本発明の基本的な神髄から 逸脱せずに、種々の信号品質をもたらす、これ以外のビット・レートを用いるこ ともできる。
このエンコーダの好ましい実施例においては、非均質変W4コーダによって、可 変長のコード・ワードが各変換係数について計算される。このコード・ワードの ビット長は、固定ビット数と、現状の信号内容からサブバンド中の雑音が他のサ ブバンド中の雑音よりも音響心理学的にマスクされ易いかどうかに基づく適応的 なビット割当てによって決定される、可変ビット数との合計である。
この固定ビット数は、単音についての音響心理学的マスキング効果に関する経験 的観察に基づいて、対象のサブバンド中で各サブバンドに指定される。この固定 ビット指定では、低い周波数における人の耳の選択性がより大きいことから、低 い周波数においては系の性能が主観的に低下することについて考慮を払っている 。複合信号が存在する際のマスキング効果は、通常、単音信号が存在する際のマ スキング効果よりも良好であるが、複合信号が存在する際のマスキング効果は予 測でき図、またよく理解されてもいない。この系では、ビットの多くを固定ビッ トとし、残り僅かを適応的に割り当てる点に関しては積極的ではない。この方法 には、幾つかの長所がある。
その第1は、必要な固定ビットの指定を行った経験的手続には逆変換過程を含ん でいたので、この固定ビット指定には逆変換によって作り出される望ましくない ひずみを本来的に補償することである。第2に、適応的なビット指定のアルゴリ ズムを比較的単純に維持することができることである。これに加えて、エンコー ダとデコーダとの間で生じる信号伝送エラーはこのデコーダ中のビットに対する 値となると同時に不正確な指定ともなるので、適応的に指定されたビットはこの ようなエラーに対して一層敏感であることである。
本発明によるビット割当てに関する経験的技法については、第13図を参照する ことによってより良く理解できるであろう。第13図では、500Hzの信号音 (正弦波)から生じる、出力雑音及びひずみの重要な臨界帯域スペクトル(すな わち、聴覚による雑音及びひずみの知覚可能な臨界帯域に関して示しである)を 3つの異なるビット割当てに関して聴覚上のマスキングと比較して示している。
この図では、特定のデータよりむしろ、経験的な方法を示すことを企図している 。
割当てA(実線)は基準で、任意の数のビットを各変換係数に対して割り当てた 時の500Hzの正弦波によって作り出される雑音及びひずみの積を示している 。割当てB(短い線の点線)は、割当てのAと同じ相対的割当ての雑音及びひず みの積に変換係数当たり2つ少ないビットを与えた場合を示している。割当てC (鎖線)は、オーディオ帯域の1500Hzまでの低い周波数部分に対して割当 てAと同じ割当てを与えた場合を示している。
ここで、割当てCは、約1500H2から上の高い周波数部分に対しては割当て Bと同じである。点線は500Hzについて°の聴覚によるマスキングを示して いる。
以上の3つのビット割当ての総てについて、マスキング曲線の急激な低下による 聴取可能な雑音が500Hzの信号音以下の周波数において存在すること、すな わち雑音及びひずみの積が約100Hzから300乃至400Hzのマスキング しきい値より上にあることが観察されるであろう。ビットを2つ少なくしたこと (割当てAに対する割当てB)によって、聴取可能な雑音及びひずみが悪化する が、割当てCに示すように500Hzの信号音以下の周波数を含めての領域にこ の2ビツトを追加することによって、元の聴取可能な雑音及びひずみの水準を回 復する。聴取可能な雑音は、高い周波数においても存在するが、この極めて高い オーディオ・スペクトル部分において500Hzの信号音によって作り出される 雑音及びひずみの積が非常に低いことから、ビットを減らしたり追加した際に実 質的に変化しない。
種々の周波数の信号音に応じて作り出される雑音及びひずみを種々のビット割当 てについて観察することによって、聴取可能なマスキングに関してオーディオ・ スペクトル全体にわたって許容できる雑音及びひずみの水準となる、種々の変換 係数に対するビット長を割り当てることができる。第13図の例に関して言えば 、約100Hzから300乃至400Hzの領域中のマスキングしきい値以下の 雑音及びひずみの積を低減するために、雑音及びひずみがマスキングしきい値よ り低くなるまで、500Hzの信号音を含む変換係数及びそれと至近の変換係数 に関する基準割当てに対して追加ビットを加えても良い。オーディオ・スペクト ル全体にわたる他の信号音に対しても、信号音が一度に1つだけ存在する際に総 合的変換係数ビット長割当てがオーディオ・スペクトル全体にわたって許容でき る雑音となるまで、同様な段階を踏むことができよう。これは、コンピュータ・ シミュレーションによって容易に行える。スペクトル全体をとおして各変換係数 から1つ又は2つ以上のビットを取り除くことによって固定ビット指定の低減( 割当てBのように)が行われる。必要に応じて、問題の領域において聴取可能な 雑音を許容できる水準まで低減すべく、適応的割当てビットが加えられる(割当 てCのように)。かくして、聴取可能な雑音を増減させることについての、第1 3図に示す例のようなビットの割当てに関する経験的観察によって、本発明の固 定及び適応的ビット割当て構想の基盤が形成される。
このエンコーダの好ましい実施例においては、非均質量子化変換係数は、ブロッ ク指数及び可変長コード・ワードから成るブロック・フローティング・ポイント 表現によって表される。上で述べたように、この可変長コード・ワードは、更に 、適応的指定ビットの固定ビット長部分と可変長部分とから成る。1組の変換ブ ロックに対する符号化信号は、指数と、総ての適応的割当てビットの1群を後に 従えるコード・ワードの固定長部分とによって構成されるフレームに組み立てら れる。コード・ワードの指数及び可変長部分は、突発雑音エラーに対する脆弱性 を低減すべく、適応的割当てビットから別個に組み立てられる。
先行技術でのエンコーダとは異なり、本発明によるエンコーダでは各フレーム中 の適応的割当てビットの指定に関する副次的な情報を伝送する必要がない。本発 明のデコーダでは、エンコーダで用いた割当てアルゴリズムと同一の割当てアル ゴリズムを用いることによって正しい指定を引き出すことができる。
フレーム同期を必要とする用途においては、本発明のエンコーダ部分によって、 フォーマット化されたデータが同期ビットに対して補足される。このフォーマッ ト化されたデータ・ビットは、最初に無作為化され、それにより1又は0のビッ トの長い連続が生じる確率が低減される。これは、特定の長さを超える長い連続 を許容しない、T−1搬送のような多くの環境において必要なことである。非同 期の用途では、無作為化によって、フレーム内の有効データがブロック同期列と 誤って取られる確率もまた低減される。本発明によるデコーダ部分では、フレー ム同期データ・ビットを取り除き、逆無作為化を適用することによって、フォー マット化されたデータが復元される。
符号化信号が悪化する可能性のある用途においては、エラー訂正データを用いて 、最重要情報、すなわち、指数及び低い周波数の係数コード・ワードの部分が保 護される。エラー・コード及び上記の保護されたデータがフォーマット化された フレーム全体に分散されることによって、突発雑音に対する感度が低減され、重 要データの訂正ができるまで必要とされる突発雑音の長さを増加される。
本発明の種々の特長及び本発明の実施例については、「発明を実施するための望 ましい形態」を述べる以下の節、及び添付図面中で、より詳細に説明する。
の 単な H 第1a図及び第1b図は、本発明の基本的な構造を示す機能概念図である。
第2a図から第2e図までは、本発明の1実施例のハードウェア構成を示す概念 図である。
第3a図及び第3b図は、本発明の2チヤネルの実施例に関する演算装置のシリ アル通信をより詳細に示す概念図である。
第4図は、時間領域信号サンプル・ブロックを示す仮想表現図である。
第5図は、信号が時間領域信号サンプル・ブロック内で周期性を有すると仮定し ての、個別分散変換によって生じる時間領域信号サンプル・ブロックの縁の不連 続性を示す時間領域信号サンプル・ブロンの仮想表現図である。
第6a図は、結果としての関数Y (t)を得るための、関数W(t)による関 数X (t)の変調を示す機能概念図である。
第6b図から第6d図までは、分析ウィンドウによる時間領域信号サンプル・ブ ロックの変調を示す仮想表現図である。
第7図は、本発明中で利用される非均質量子化装置に関する高級論理を示す流れ 図である。
第8図は、適応的ビット割当て過程に関する一層詳細な論理を示す流れ図である 。
第9図は、代表的なフィルタ応答特性及び2つの音響心理学的マスキング曲線を 示す表現図である。
第10図は、4 k Hzの音響心理学的マスキング曲線に関するフィルタ応答 特性を示す表現図である。
第11図は、1kHzの音響心理学的マスキング曲線に関するフィルタ応答特性 を示す表現図である。
第12図は、幾つかの信号音の音響心理学的マスキング曲線から誘導される複合 マスキング曲線を説明する表現図である。
第13図は、500Hzの信号音の音響心理学的マスキング曲線に関する3つの 異なるビット割当てに関する符号化された5 00 Hzの信号音の、符号化雑 音及びひずみのスペクトル・レベルを示す表現図である。
第14a図から第14e図までは、重複されてウィンドウで処理された一連の時 間領域信号サンプル・ブロックにグループ化される時間領域信号を説明する仮想 表現図である。
第15a図から第15d図までは、E−TDAC変換によって作り出される時間 領域エイリアシングひずみを説明する仮想表現図である。
第16a図から第16g図までは、E−TDAC変換信号合成の間の時間領域エ イリアシングの重複加算による消去を説明する仮想表現図である。
第17a図及び第17b図は、分析専用ウィンドウを用いるフィルタ・バンクの フィルタ遷移帯域ロールオフ及び阻止帯域排除を、本発明のために設計された分 析・合成ウィンドウ・ペアを用いるフィルタ・バンクのフィルタ遷移帯域ロール オフ及び阻止帯域排除と比較する表現図である。
第18図は、ウィンドウで処理された隣接ブロックの重複・加算特性を示す仮想 表現図である。
第19図は、4から7までのアルファ値に対する幾つかのたたみ込みカイザー・ ベッセル(Kaiser−Bessel)分析ウィンドウの形状を正弦波傾斜ウ ィンドウと比較する仮想表現図である。
第20図は、エラー訂正を有しない、符号化された2つの変換ブロックのフレー ムのフォーマットを説明する概要図である。
第21図は、エラー訂正コードを有する、符号化された2つの変換ブロックのフ レームのフォーマットを説明する概要図である。
第22a図から第22e図までは、特に本発明の〇−TDAC変換のために実現 される、重複されてウィンドウで処理された一連の時間領域信号サンプル・ブロ ックにグループ化される時間領域信号を説明する仮想表現図である。
第23a図から第23d図までは、0−TDAC変換によって作り出される時間 領域エイリアシングを説明する仮想表現図である。
第24a図から第24g図までは、0−TDAC信号合成の間の時間領域エイリ アシングの重複加算による消去を説明する仮想表現図である。
第25図は、エラー訂正を有しない、本発明の0−TDAC変換の実施例のため の、符号化された2つの変換ブロックのフレームのフォーマットを説明する概要 図で〜ある。
表1は、本発明の15kHzの0−TDAC変換実施例のための、主指数、サブ バンドのグループ化、及び係数ビット長を示す。
表■は、本発明の20kHzの0−TDAC変換実施例において必要なサブバン ドのグループ化、及び追加変換係数のための係数ビット長を示す。
表■は、本発明の0−TDAC変換実施例において必発明を実施するための望ま しい形態 第1a図及び第1b図に本発明の基本的な構造が示されている。第1a図に示す 本発明のローダ部分は、以下の部分から成る。すなわちこれらは、時間領域信号 入力100、信号標本化及び量子化装置101、信号標本化バッファ102、各 ディジタル化時間領域信号ブロックを変調する分析ウィンドウ逓倍装置103、 量子化信号を周波数に変換するディジタル・フィルタ・バンク104、整数値の 変換係数をフローティングポイント表現に転換スるブロック・フローティングポ イント・エンコーダ105、信号のスペクトル構成に従って各変換係数の表現に 対してビットを指定する適応的ビット割当装置1106、各変換係数を指定され たビット長に丸める均質量子化袋!!107、符号化された周波数係数を伝送又 は記憶のためにビット・ストリームに組み立てるフォーマツタ109である。第 1a図によって伝送線路110が示されているが、符号化された信号を後に使用 すべく直ちに記憶することもできることを理解して置くべきであろう。
第1b図に示す本発明のデコーダ部分は、以下の部分から成る。すなわちこれら は、符号化されたビット・ストリーム信号人力111、各符号化された周波数係 数を組み立てられたビット・ストリームから抽出するデフオーマツタ112、各 変換係数を整数値の変換係数に転換する線形化装置113、変換係数を時間領域 信号ブロックに変換するディジタル・フィルタ・バンク114、時間領域信号ブ ロックを変調する合成ウィンドウ逓倍装置115、時間領域信号のディジタル表 現を復元する信号ブロック重複・加算装置116、アナログ信号発生器117、 及びアナログ信号出力118である。
A、演 ハードウェア 本発明のT D、A C変換方式のための基本的なハードウェアの構成を第2a 図から第2C図までと、第3a図及び第3b図に示す。所与の目的を達成するた めには、在来の整数変換計算は少なくとも20有意ビツトの精度で行われなけれ ばならないことが経験的研究から分かっている。
44.1kHz又は48kHzサンプル・レートを用いる、本発明の単一チャネ ル方式の好ましい実施例の実現においては、時間領域入力信号を20μs以下の 周期時間で量子化する、16ピツトのアナログ対ディジタル・コンバータ(A  D C)を利用している。16ビツトのディジタル化されたサンプルの各々は、 次の計算で用いられる24ビツトのワードの有意16ビツトを形成すべく用いら れる。20 / 5 M Hzで待ち時間なしで動作するモトローラ(Ilot orola)社製DSP56001型ディジタル信号プロセッサ(D S P) を用いて、必要な計算を行い、符号化・復号化過程を制御する。スタティック等 速呼出記憶装置1 (RAM)によって、DSPに対するプログラム及びデータ 記憶が与えられる。周期時間20μS以下の16ビツトのディジタル対アナログ ・コンバータ(DAC)を、符号化されたディジタル信号からアナログ信号を発 生するために用いている。
第2a図に示すエンコーダのハードウェアの構成は以下のものから成る。すなわ ちこれらは、アナログ信号入力200、低域フィルタ(LPF)200A、AD C201、DSP 202、スタティックRAM 203、消去可能固定記憶装 置(EPROM)204、及び符号化されたシリアル信号出力206である。L PF 200A(この低域フィルタは第1a図に示されていない)によって、入 力信号が帯域制限されることが保証される。
ADC201によって、入力信号がシリアルの16ビツトのワードにディジタル 化(標本化及び量子化)される。DSP 202によって、ディジタル化された サンプルのシリアル・ストリームが受け取られ緩衝され、サンプルがブロックに グループ化され、ブロックを周波数領域に変換するために必要な計算が行われ、 変換係数が符号化され、コード・ワードがデータ・ストリームにフォーマット化 され、符号化された信号がシリアル・データ線路206を通して伝送される。こ のDSPのためのプログラミング及びデータ作業領域は、2組の8.192の2 4ビツト・ワードに秩序室てられているスタティックRAM 203の2つの2 4kBバンク中に記憶される。このDSPには、RAM中ではプログラマブルR OM中で実現されるよりも一層安価に実現される、短呼出時間記憶装置が必要で ある。その結果、EFROM204では、エンコーダが最初に起動される時にD SPによってRAM 203で使用できる形式で中身が取り出される圧縮フォー マット中に、プログラミング及びスタティック・データを記憶する。
第2b図及び第2c図では、2つのDSPインターフェイスについて更に詳細に 示す。第2b図には、DSP202のためのシリアル通信インターフェイスと、 ADC201と、シリアル・データ線路206とが示されている。タイミング発 生装置202Aによって、エンコーダのための、受取りクロック、フレーム同期 、及び伝送りロック信号が発生される。線路SCoによって、線路SRDに沿っ てADC201からDSP 202へと、ディジタル化入力信号サンプルのシリ アル・ビット・ストリームにクロック同期が掛けられる。線路s01によって、 各16ビツト・ワードの始まりを標識する、ADC及びDSPに対するフレーム 同期信号が与えられる。線路SCKによって、線路STDに沿ってDSPからシ リアル・データ線路206へと符号化信号のシリアル・ビット・ストリームにク ロック同期が掛けられる。
第2C図には、メモリをアドレスするインターフェイスが示されている。前記の モトローラ社のDSP56001のためのメモリは、プログラム、Xデータ、及 びYデータの3つのセグメントに分割される。
RAMの1つのバンクにはプログラム・メモリが含まれているが、DSPによっ て線路PSが低電位にされると何時でもこれが選択される。第2のバンクにはデ ータ・メモリが含まれているが、線路PSが低電位にされると何時でもこれが選 択される。線路XYを高電位にしたり、低電位にしたりすることによって、それ ぞれXデータ・メモリとYデータ・メモリとがDSPで選択される。線路XYを アドレス線路ア12に取り付けることによって、Xデータ・メモリとYデータ・ メモリとは別のアドレス空間に位置付けされる。したがって、Yデータ・メモリ の4にワード(4096又は24ビツト・ワードの100016)がアドレス0 0ooからoFFF16に位置付けされ、Xデータ・メモリの4にワードがアド レス100016からl F F F 16に位置付けされ、プログラム・メモ リは8にワードの自身の空間中にあり、アドレス0000からOF F F 1 6から成る。
プログラム・データRAM 203とEPROM 204は、別のアドレス空間 に位置付けされる。インバータ205Cによって、線路A15の状態に従ってD S、P2O2がRAM又はEPROMの何れかを選ぶことが可能になる。DSP  202によってA15が高電位に設定されると、インバータ205Cによって RAM 203及びEPROM 204(7)+ツブ選択(CS)線路は低電位 に設定される。DSP 202によってA15が低電位に設定されると、インバ ータ205CによってRAM 、203及びEPROM 204のcs線路は高 電位に設定される。C8線路が高電位に設定されると、スタティックRAMのみ が選択される。
第2d図に示されるデコーダの構成は、符号化シリアル信号入力線路207、D SP 208、スタティックRAM 209、EPROM 210、DAC21 2、LPF 213A、及びアナログ信号人力213から成る。DSP 208 によって、符号化信号が受け取られ緩衝され、この信号のフォーマットが符号化 変換係数に分解され、この係数を時間領域に変換するのに必要な計算が行われ、 この係数が時間領域ブロックにグループ化され、このブロックがディジタル・サ ンプルの時間領域順序に重複・加算され、このディジタル・サンプルがシリアル ・ビット中ストリームの形でDAC212に伝送される。DSPに対するプログ ラミング及びデータ作業領域は、2つの8.192の24ビツト・ワードに順序 室てられているスタティックRAM 209の2つの24kBバンクに記憶され る。EPROM 210によって、エンコーダが最初に起動される時にDSPに よってRAM 209で使用できる形式で中身が取り出される圧縮フォーマット で、プログラミング及びスタティック・データを記憶する。DAC212によっ て、DSPから受け取られるシリアル・データ・ストリームに対応するアナログ 信号が発生される。LPF 213A(第1b図には示されていない低域フィル タ)によって、出力信号213がこの符号化・復号化過程で作り出されるあらゆ る高域擬似信号から免れることが保証される。
第2C図には、DSP 208のためのシリアル通信インターフェイスと、シリ アル信号入力線路207と、DAC212とが示されている。フェーズ・ロック ・ループを用いて符号化シリアル・ビット入力信号からタイミング基準を抽出す るタイミング発生器208Aによって、このデコーダのための、受取りクロック 、フレーム同期、及び伝送りロック信号が発生される。線路SCOによって、線 路SRDに沿ってDSP 208へと符号化シリアル・ビット信号がクロック同 期される。線路SCKによって、線路STDに沿ってDSP 208からDAC 212へと復号されたディジタル化信号のシリアル・ビット・ストリームがクロ ック同期される。線路SC2によって、各16ビツト・ワードの始まりが標識さ れるフレーム同期信号が、DACと、DSPとに対して与えられる。DSP 2 08とメモリ・アドレス・バスとの間のインターフェイスは、エンコーダについ て上に述べたのと同様な方法で実現される。第2C図を参照して欲しい。
2チヤネルのエンコーダでは、第3a図に示すように結合されたLPF 20O A、ADC201A及び201Bが必要である。DSP及びADCの部品の間の インターフェイスは、1チヤネルのエンコーダについて上に述べたのと類似の方 法で動作する。タイミング発生器202Aによって、フレーム同期信号の半分の レートでDSPの線路SC2に付加的な信号が与えられて、マルチプレクサ20 2Bが制御され、2つのADCの何れがディジタル化されたデータを現在送って いるかがDSPに対して指示される。
2チヤネルのデコーダでは、第3b図に示すように結合されたDAC212A及 び212B%LPF 213A及び213Bが必要である。DSP及びDACの 部品の間のインターフェイスは、1チヤネルのデコーダについて上に述べたのと 類似の方法で動作する。タイミング発生器208Aによって、フレーム同期信号 の半分ので、逓減装置1208Bが制御され、2つのDACの何れがディジタル 化されたデータを現在量は取っているかがDSPに対して指示される。
この基本的なハードウェア構成を改変することができる。例えば、27MH2で 動作するモトローラ社の待ち時間なしのDSP65001 1個によって、2チ ヤネルのエンコーダ又はデコーダを実現できる。この場合、追加のRAMが必要 であるかもしれない。プログラム・メモリには、24kBバンクを利用する。
特別なハードウェアを用いて、ウィンドウ変調又は高速フーリエ変換(F F  T : FastFourierTransfors)のような幾つかの機能を 行うこともできる。この総合的なエンコーダ・デコーダを特別仕立ての集積回路 で実現することもできる。これ以外にも数多(の実施方法があることは、当業者 にとっては明白であろう。
B、入力信号の 本化とウィンドウ処理本発明の現在の実施例において、信号標 本化及び量子化装置101は、24ビツトの整数表現を形成すべく引き続いて右 側に8個のOビットを引き当てる、16ビツトに信号を量子化するアナログ対デ ィジタル・コンバータである。引き続く変換計算は総て、24ビツトの整数計算 で行われる。アナログ入力信号は、最高でも15kHz (20kHzコーダで あれば、20 k I(z )に帯域を制限しなければならない。これは、第1 a図には示されていない低域フィルタによって達成される。
コンパクト・ディスク(CD)と同じ品質を有する音楽信号は、他の品質に加え て、15kHzを超える帯域を具えている。ナイキストの理論から、15 k  Hzの帯域の信号は30kHz以上で標本化されなければならないことは周知の ことである。44.1kHzのサンプル・レートがCDに用いられており、この サンプル・レートを選択することによって本発明をこのような用途に用いる装置 が単純化されるので、現在の実施例に対しては44.1kHzのサンプル・レー トが選択されている。
(このサンプル・レートによって、本発明の20kHz帯域の実施例をも実施で きる)。
別のサンプル・レート、つまり、職業用オーディオの多くの用途に一般的となっ ている4 8 k Hzのサンプル◆レートを用いることもできる。もし異なる サンプル・レートが選択されると、隣接する変換係数間の周波数分離が変化し、 望ましい帯域幅を表現するために必要な係数の数が変化する。サンプル・レート を変えた際に本発明の実施例が受ける総ての影響については、当業者にとっては 明白であろう。
入力信号が複合性のものでない、すなわち、虚数成分の総てが0であると仮定す ると、512ブロツクの周波数領域変換によって、最大256の非Oの特異変換 係数が作り出される。したがって、第1a図及び第1b図に示す本発明は、25 6の周波数容器から成る。この実施例において、各容器の帯域幅は86.1Hz  (又は44゜1 k Hz / 512 )に等しい。(幾つかの個別分散変 換については、容器0、すなわち直流又は0周波数は、この量の半分に等しい帯 域幅を有する)。15.6kHzの信号を通過させるために、0から182まで の係数のみが用いられる。(20kHzの信号を通過させるためには、0から2 33までの係数が用いられる)。入力信号の帯域幅を超える追加の高い周波数係 数は、エイリアシング消去を行った際の量子化エラーの逆効果を設計帯域幅内で 最小化するために用いられる。入力信号が15kHz (又は20kHz)帯域 幅制限され、最終的出力信号もまた最高係数中を通過する総てのエイリアシング を取り除くために帯域幅制限されていることに注意して欲しい。
個別分散変換では、サンプル・ブロック中の信号は周期性のものであると仮定し ているので、サンプ、ル・ブロックが改変されない限り、存在しないスペクトル 成分を誤って作り出す。第4図を参照して欲しい。この変換エラーは、第5図に 示すようにブロックの縁の不連続に起因している。この効果を最小化すべくこれ らの不連続を緩和することもできる。ブロックの縁の近傍にあるサンプルを0に 近付けるように、ブロックをどのようにして改変又は重み付けするかについて第 6a図から第6d図までに示しである。第6a図に示す逓倍装置の回路によって 、第6b図に示す標本化された入力信号x (t)が第6C図に示す重み付は機 能により変調される。この結果生じる信号を第6d図に示す。この過程は第1a 図の箱103で表される。分析ウィンドウと呼ばれるこの重み付は機能は、信号 サンプル・ブロッークをサンプルごとに逓倍することであるが、この形状によっ てディジタル・フィルタの性能に強い影響を与えるので、数多くの研究の主題と なってきた。その例として、ハリス(■arrisによるI EEE学会誌19 78年66巻51ページから83ページ(Proc、IEEE、 vol、 6 6、1978. I)I)、 5l−83)の論文、「個別分散フーリエ変換を 用いた高調波分析のためのウィンドウの使用について(”On the Use  of Wtn−dows for Harmonic Analysis w ith the Discrete Fou−rier Transfor+w ℃」を参照されたい。端的に言って、良好なウィンドウによって、阻止帯域幅の 深さの所与の水準に対する遷移帯域ロールオフの鋭さが増大され、隣接するブロ ックを重複・加算することによりウィンドウの変調効果を修正することが可能に なるということである。
ウィンドウの設計については、以下に更に詳しく述べる。
C1分析フィルタ・バンク、前方変換 個別分散変換によって、第1a図に示すディジタル・フィルタ・バンク104が 実現される。フィルタ作用は、時間領域信号ブロックを時間変化スペクトル係数 に転換することによって行われる。本発明の1つの実施例で用いられているこの 変換技法は、IEEEの音響、音声、信号処理に関する学会誌1986年ASS P−34巻1153ページから1161ページまでのプリンセン及びブラッドリ ーによる論文、「時間領域エイリアシング消去に基づく分析・合成フィルタ・バ ンクの設計J (Princen and Bradley、 ”Analys is/5ynthesis Filter BankDesign Ba5ed  on Time Domain Aliasing Cancell−ati on”、 IEEE Trans、 on Acoust、、 5peech、  SignalProc、、 vol、^5sp−34,1986,pp、 1 153−H61)中に最初に叙述された。この技法は、偶数に重ねられた厳密に 標本化された単側波帯分析・合成系の時間領域と等価である。本出願では、この 変換を、偶数に重ねられた時間領域エイリアシング消去(Evenly−3ta cked Time−DomainAliasing Cancellatio n: E −T D A C)と呼ぶ。この技法は、1987年ICASSP会 議報告、1987年5月号の2161ページから2164ページまでのプリンセ ン、ジョンソン、及びブラッドリーによる論文、「時間領域エイリアシング消去 に基づく分析・合成フィルタ・バンクの設計を用いてのサブバンド変換符号化」 (Princen、 Johnson、 and Bradley、”5ubb and/Transfor+*Coding Using Analysis/ 5ynthesis Filter Bank DesigBased on  Time Domain Aliasing Cancellation”。
ICASSP 1987 Conf、 Proc、、 May 1987.1) I)、 2161−64)中に叙述されている。この代替的変換は、奇数に重ね られた厳密に標本化された単側波帯分析・合成系の時間領域と等価である。本出 願では、この変換を、奇数に重ねられた時間領域エイリアシング消去(Oddl y−3tackedTime−Domain Aliasing Cancel lation:O−T D A C)と呼ぶ。0−TDAC変換を用いる本発明 の実施例については、E−TDACの実施例について十分叙述した後に論じる。
E−TDACでは、改変された個別分散正弦変換(Discrete 5ine  Transfor+m: D S T )を伴う改変された個別分散余弦変換 (Discrete Co51ne Transform: DCT)の代替的 応用に等価の変換機能を利用する。DCTは以下の式1、DSTは以下の式2に 示される。
N−1n+■ C(k)−Σ x(n) ・cos C2yr k(−)コ O≦ k <N  (1)n!0N N−1n+m 5(k)=Σ x(n) ・ sin[2π k(−)コ 0≦ k <N(2 )n=ON ここで、 k=周波数係数番号 n=入力信号サンプル番号 N−サンプル・ブロック長 ■■E−TADCに関する位相項 x(n)lIサンプルnにおける入力信号x(t)の量子化数C(k)−OCT 係数k S(k)藁DST係数に である。
E−TDAC変換では、2組のスペクトル係数又は変換ブロックの1つが各信号 サンプル・ブロックに対して交互に作り出される。これらの変換ブロックは、次 式の形を取る。すなわち、 i・信号サンプル・ブロック番号 C(k)−D (T係数(式1を参照のこと)S(k)−D S T係数(式2 を参照のこと)である。
ここで用いられる計算アルゴリズムは、高速フーリエ変換(FFT)である。ク ーリー及びチューキーによる数学計算誌1965年19巻、297ページから3 01ページまでの論文、[複合フーリエ・シリーズの機械計算のためのアルゴリ ズムJ (Cooley and Tukey、 ”AnAlgorithm  for the Machine Ca1culation of Compl exCourier 5eries″、 1lath、 Cow 、、 vol 、 19.1965. pp、 27−301)を参照して欲しい。それぞれ単 一複合変換の実数及び虚数成分としてDOT及びDSTをFFTを用いて同時に 決定することによって、DCT及びDSTを行うことができる。この技法では、 FFTは複合変換であるが、両方の入力信号サンプル・ブロックは実数値のサン プルのみから成るという事実を利用している。これらの変換を1つのFFTと複 合定数の配列との積に因数分解することによって、DCT係数が実数値の組とし て変換から出現し、DST係数が虚数の組として表される。したがって、1つの 信号サンプル・ブロックを、もう1つの信号サンプル・ブロックのDSTを用い て、複合配列の積及び加算によって同時発生的に計算することができる。
1つのFFTを用いて2つの変換を同時発生的に計算するこの基本的な技法は、 当分野では周知のものであり、プレンティス・ホール社1974年出版のブリガ ムによる「高速フーリエ変換J (Brigham、 The Fast Fo urferTransform、 Englevood Ctiffs、 NJ : Prentice−flail。
Inc、、 1974)に叙述されている。E−TDACに対する改変DCT及 びDSTの同時発生的な計算に関する追加的な情報は、ルッカボウによるスタッ フォード大学の1988年6月の博士学位論文、「音声の可変レート及び適応的 周波数領域ベクトル量子化J (Lookabaugh、”Variable  Rate and Adaptive Frequency Domain V ectorQuantization of 5peech”、 5tanfo rd、 C^: 5tanfordUniversity、 PhD Thes is、 June、1988)中に見ることができる。
本発明の1チャネル方式の好ましい実施例では、2つの隣接する信号サンプル・ ブロックは、バッファに記憶され、共にDCT−DSTペアに変換される。この ブロック・ペアは、次に伝送と記憶のために量子化され、フォーマット化される 。
2チャネル方式では、2チヤネルの各々からの信号サンプル・ブロックを処理す ること、すなわち、DSTブロックを1つのチャネルに発生し、DCTブロック を第2のチャネルに発生することによって、同時発生的な処理が達成される。所 定のチャネルに対する符号化ブロック(表現5及び29参照)はDCTとDST との間を交互し、それぞれのチャネルの形式に対して常に逆の形式になる。
適正な位相成分m1および注意深(設計された1組の分析・合成ウィンドウを用 いることによって、E−TDAC技法では以下の形式の余弦および正弦変換の交 互数列から正確に入力信号を復元できることをプリンセンは示している。すなわ ち、 fc(k)) 、(S(k)l 、(C(k)l 、(S(k)) 、、、 ( 5)Ol 2 3 ここで、各変換ブロックは、1つの時間領域信号サンプル・ブロックを表す。こ の過程は、第14a図から第14e図までと、第15a図から第15d図までと 、第16a図から第16g図までに示されている。
第14a図を参照すると、1組の量子化された入力信号x (t)がブロックに グループ化されていることが分かる。第14b図に示すウィンドウ機能W で変 調された1組のブロックによって、第14d図に示す信号X(1)が作り出され る。信号x (t)はOCTへの入力である。標本化された入力信号X(【)の 別の1組は、第1の組とブロック長の半分だけ重複されるが、第14C図に示す ウィンドウ機能W (このウィンドウ機能はW と同等であるが、時間的にブロ ック長の半分だけずれている)によってウィンドウ処理されて第14e図に示す 信号x (t)を作り出し、次にDSTに受け渡される。
DCT及びDSTの交互の変換ブロックのみを用いることによって、これらの変 換ブロックの廃棄された半分に含まれる情報が失われることになる。この損失に よって時間領域エイリアシング成分が作り出されるが、式1及び式2について適 切な位相項mを選び、重複された時間領域信号サンプル・ブロックに対して前方 変換を適用し、逆変換で復元される隣接する時間領域信号サンプル・ブロックを 重複・加算することによって、このひずみを消去することができる。
式l及び式2における位相項mによって、時間領域工イリアシングひずみの位相 転移が制御される。第15a図から第15d図までと、第16a図から第16g 図まれる信号y (t)が第15a図に示されている。第15b図では、この復 元信号が2つの成分、すなわち元のウィンドウ処理された信号(実線)、及び時 間領域エイリアシングひずみ(点線)から成ることが示されている。
第15c図及び第15d図には、逆DSTから復元される信号y (t)につい ての類似の情報が示されている。
このエイリアシングひずみを消去し、元の時間領域信号を正確に復元するために 、E−TDACではこのエイリアシングが次のようであることが必要である。す なわち、DCTについては、時間領域エイリアス成分は、サンプル・ブロックの 約1/4の点の時間以内で反転される標本化信号の第1半部と、サンプル・ブロ ックの約3/4の点の時間以内で反転される標本化信号の第2半部とから成るこ と。DSTについては、このエイリアス成分は振幅の記号が逆になっていること 以外はDCTについての場合と類似であることである。第15b図及び第15d 図を参照して欲しい。エイリアス消去に必要な位相項は、次式のとおりである。
すなわち、 ここで、 トサンプル・ブロック長 である。
E−TDACにもまた、重複された信号サンプル・ブロックに対して、注意深く 設計された1組の分析・合成ウィンドウを適用することが必要である。この信号 サンプル・ブロックは100%のffi複で、すなわち、所与のブロックの50 %が先行ブロックによって重複され、同ブロックの残りの50%が次のブロック によって重複されている形で、重複されていなければならない。第16a図から 第16g図まで、信号サンプル・ブロックの重複とその結果のエイリアス消去に ついて示しである。第16b図及び第16e図に示す、逆DCT及びDSTから 復元される信号y (t)及びy (t)は、それぞCS れウィンドウ機能W (【)及びW (【)によって変調されて、これにより第 16c図及び第16f図に示す信号9 (t)及び9 (【)が作り出される。
これらのウィンドウ処理された信号の重複された信号が加算されると、エイリア ス成分は消去され、第16g図に示すその結果の信号y (t)は元の入力X信 号(1)を正確に再構成したものとなる。
この分析・合成過程中に用いられるウィンドウの設計と重複・加算については、 以下で更に詳しく論じる。この時点では、変換ブロックの半分を省略することに よって必要なビットレートは半減されるが、信号合成中にE−TDACに必要な 100%重複を行うことによりビットレートが倍加されることを注意して置くこ とで十分である。その結果、E−TDACは必要などットレートに対しては中立 的な効果を持つ。
D、非 量化 フィルタ・バンク104から誘導される各変換係数は、非均質量子化装置108 によって符号化されサブバンドにグループ化される(表■及び■にサブバンドへ に対する変換係数の指定を示す)。この非均質量子化装置は、第1a図に示す、 ブロック・フローティングポイント・エンコーダ105と、適応的ビット割当て 装置106と、均質量子化装置107とによって構成されている。量子化は変換 ベア、すなわち、1チヤネル系では2つの隣接するブロックの両方、又は2チヤ ネルの各チャネルからの1つのブロックに対して行われる。第7図に示すように 、非均質量子化は、5つの主要な部分から成る。すなわち、これらは、(1)サ ブバンド指数を計算し、(2)主指数を決定し、(3)係数の周波数の関数とし ての各係数コード・ワードのビット長を初期設定し、(4)特定のコード・ワー ドに対する追加ビットを適応的に割り当て、及び(5)適応的ビット割当てと係 数の周波数に基づく最小ビット長との合計から計算されるビット長に従ってコー ド・ワードの丸めと打切りを行うことである。
数値のフローティングポイント表現は、ディジタル・データ表現の分野では周知 であり、整数表現で可能な範囲より一層広い範囲の値を表現するために用いられ る。
フローティングポイント数は、仮数及び指数で構成される。本発明の実施例にお いて、仮数は、2の補数形式で表現される記号化された整数値表現である。
これに対応する指数は、表現されている数の量の真値にこの仮数を転換(正規化 又は非正規化の何れかに)するのに必要な2つの倍数のべきに等しい非記号化値 である。この表現は、以下のように表現できる。すなわち、F−フローティング ポイント数の値 蓋−記号化整数値仮数 E−非記号化整数値指数 である。
例えば、3の指数によって、この整数値仮数に2−3を乗じることによりこのフ ローティングポイント数の値が得られることが示される。これは、仮数の二進表 現を右へ3桁移動することと等価である。
正の非O仮数は、最も有意のビットが非0である時、正規化されていると言われ る。負の値を持つ仮数は、最も有意のビットが0である時、正規化される。正規 化された仮数によって、数の量に対する有意のビットの最大値が仮数の制限され たビット長内に収まることが保証される。
ブロック・フローティングポイント表現もまた、当分野では周知であり、在来の フローティングポイント表現で可能なビット数より少ないビットで1組のフロー ティングポイント数を表現するために用いられる。この技法では、仮数の群に対 して1つの指数を用いる。この群中の幾つかの仮数は、正規化することができな い。この群中で最も大きい量に対する仮数は、その量が小さ過ぎる、すなわち、 正規化するのに必要な倍数を指数が表現することが不可能ということがないとい う条件下で、正規化される。しかし、仮数が正規化されるかされないかに拘らず 、指数は、フローティングポイント量の真値を得るためにこの群中の各整数値仮 数を右に転移しなければならない桁数を常に表現する。
1、サブバンド指数 ブロック・フローティングポイント・エンコーダは、1つ及び2つの非均質量子 化装置部分から成る。この第1の部分によって演じられる機能を、第7図の箱7 01に示す。この部分によって、幾つかのサブバンド周波数係数に対するサブバ ンド指数が計算される。これらのサブバンドは表1に示されている。この過程は 、3つの段階から成る。第1の段階では、1つの変換ブロック内で各サブバンド 中の最大の変換係数を見付け、これらの24ビツトの係数を正規化するために必 要な左への転移の桁数を決定する。第2の段階では、第2の変換ブロックに対応 する転移の数を決定する。第3の段階では、第1の変換ブロック中の各サブバン ドの転移の桁数とこれに対応する第2の変換ブロックの桁数とを比較し、この2 つの中の小さい方の値を選び、この値を量ブロック中の適切なサブバンドに対す る指数として保存する。
2、主指数 非均質量子化装置部分の第2の部分によって、2つのサブバンド郡の各々に対す る1ビツトの主指数の値が決定される。この主指数は、コーグのダイナミック・ レンジを広げるために用いられる。表!を参照すると、主指数MEXPOによっ て低いサブバンド周波数0から18までが表現されていることが分かる。主指数 MEXPIによって、19から36までの高いサブバンド周波数が表現される。
(20kHzエンコーダに関しては、表■に示されているように、3つの追加的 サブバンドが必要であ゛る)。もし群の中の総てのサブバンド指数が3であるか 若しくは4以上であれば、この群に対する主指数は1に設定され、群中の総ての サブバンド指数は3まで減らされる。主指数が1に設定されると、群中の総ての サブバンド内の総ての符号化された主指数が、サブバンド指数値によって指示さ れる桁よりも3桁左に転移されることが指示される。主指数が0である時には、 群中の各サブバンド指数によって、このサブバンド中での各変換係数に関する左 への転移の合計桁数が正確に表現される。
これらの主指数によって、十分なダイナミック・レンジを持たせながら、より短 いサブバンド指数を用いることが可能になる。この過程のステップは、第7図の 箱702a及び702bに示されている。
追加的な段階を取ることによって、符号化信号を表現するのに必要な総合的なビ ットを減少させることもできる。1つの指数によって単一の係数が表現される総 てのサブバンドにおいて、正規化された仮数の記号ビットは過剰なものである。
上で論じたように、正規化された仮数中の記号ビットと最も有意なデータ・ビッ トとは、常に逆向きの値である。したがって、記号ビットをエンコーダによって 脱落させることができ、デコーダによって復活させることができる。この脱落さ れたビットを当出願では「隠れビット」と呼ぶ。
仮数が正規化されているかどうかは、指数を調べることによって判断できる。も し指数が最大値(本発明の好ましい実施例で用いているフローティングポイント 系中では主指数を調整した後に15になる)よりも小さければ、この仮数は正規 化されている。もし指数が最大値に等しければ、結論を引き出すことができない ので、仮数は正規化されておらず、隠れビットはないものと仮定される。
この技法は、係数を1つしか含んでいないサブバンド中で変換係数を表現する仮 数に対してのみ用いることができる。本発明の好ましい実施例においては、DC Tサブバンド0のみがこの要求に合致する。すなわち、DCTサブバンド0は、 ただ1つの係数から成り、組み合わせのDSTSロブク中のサブバンドとは指数 を分けあっていない。変換ブロックのペアの間で指数を分けあっていないコーグ においては、1つの係数のみを含むサブバンドの総てに対して隠れビット技法を 用いることができる。
必要なビットの削減は、DCT係数0に対する固定ビット長に反映する。表■に 示すように、係数C(0)に対する「最小」ビット長は8ビツトである。隠れビ ット技法を用いないとすれば、C(0)に対する固定ビット長は係数5(0)に 対するビット長と等価、若しくは9ビツトとなろう。係数C(0)が正規化され ていない状況下では、周波数成分が非常に低い振幅であるので、削減されたビッ ト長によって聴取可能な量子化雑音が生成される可能性はない。
3、固定ビット長 非均質量子化装置の第3の部分によって、左に転移された変換係数の各々に対す る初期最小ビット長が設定される。この長さは、係数の周波数に従って設定され る。
第7図の箱703にこの過程のこの部分が表され、表Iに各係数のコード・ワー ドに対して固定されるビットの最小数が示されている。この最小ビット長は、代 表的なフィルタ・バンクの応答特性曲線を音響心理学的マスキングしきい値曲線 と比較することによって引き出されたものである。フィルタの性能は信号及び係 数の周波数の間の周波数差のみの関数であるので、このフィルタ・バンクの応答 特性を表すのにどのような周波数係数を用いても良い。第9図に示す応答特性曲 線は、フィルタの通過帯域内の周波数範囲に対するフィルタの応答特性の実効値 から得られる。上で論じたように、フィルタの選択度は分析ウィンドウの形状と 、各時間、領域信号ブロック中のサンプルの数によって影響される。信号合成過 程中に付加的な選択性損失が生じるので、総合的コーグの応答特性は第9図に示 す程には良好ではないことに注意して置きたい。この効果については以下で論じ るが、第17a図及び第17b図にも示されている。
2つの音響心理学的マスキング曲線が第9図に示されている。これらの曲線は、 オーディオ技術協会誌1988年第35巻の517ページから534ページまで のフィールダーによる論文、「ディジタル・オーディオ・コンバータによって作 り出される聴取可能なひずみと雑音の評価J (Fielder、 ”Eval uation of the Audible Dis−tortion an d No1se Produced by Digital Audio Co n−vertera”、 J−Aud−to Eng、Soc、、 vol、  35,1988. I)l;l。
1?−534)から誘導されたものである。人の耳の聴覚的選択性は周波数とと もに大きく変化するが、500Hzから2kHzの間の周波数に対しては1kH zの曲線が人の耳の特性を代表し、より高い周波数に対しては4kH2の曲線が 人の耳の特性を代表する。最小ビット・レートを達成するためには、変換ローブ に関しての遷移帯域ロールオフと阻止帯域排除の割合は音響心理学的マスキング 曲線の割合と同じ程度に大きくなければならない。
特に、1kHz以下のマスキング信号音に対する人の耳の聴覚的選択性は極めて 高いことに注意して欲しい。
フィルタ選択度の不十分さは、低い周波数の係数に対して追加ビットを確保する ことによって部分的に補償される。第10図では、フィルタの応答特性を4kH zの音響心理学的マスキング曲線に対して比較している。周。
波数が上がるにつれてコーグの帯域幅と選択度が音響心理学的マスキング曲線に 対して向上するので、高い周波数の係数を表すために必要なビット数は少なくな る。この関係は、表1に示す最小ビット長の値に反映されている。
第11図では、1kHzのマスキング曲線を、この音響心理学的マスキング曲線 が常に上になるように偏らせであるフィルタ応答特性に対して比較している。こ のフィルタ応答特性に対する偏りは、低い周波数について確保しである追加ビッ トによって得られる精度の増加によるものである。各追加ビットによって、信号 対雑音比が約6dB向上している。第11図では、もしマスキングに寄与する別 の信号音が存在しなければ、低い周波数の変換係数を符号化するために8dBの 偏り(又は約1゜3の追加ビットの精度)を必要とすることが示されている。
しかし、第9図、第10図、及び第11図に示されている曲線は単音又は非常に 狭い帯域の雑音によって作り出される音響心理学的マスキング効果を表している ので、これらの図によって示唆されている最小ビット長は控え目なものである。
第12図には、3つの音の個々のマスキング曲線を単純に重ね合わせることによ って誘導された複合マスキング曲線が示されている。この複合マスキング曲線は 、重合量の実際のマスキング効果を理解した、非常に控え目なものであることが 経験的な証拠によって示されている。更に、一般的に音楽は幾つかの個別の音よ りも数等複雑な信号であり、その結果、マスキングの水準が増加するので、変換 係数コード・ワードに必要な精度を下げることが可能になる。結果として、表工 に示される最小ビット長は、DCT係数C(0)及びDST係数5(1)を除い て総て、第10図、及び第11図のマスキング曲線によって示唆されている各係 数コード・ワードのビット長から3ビツトを控除することで得られる。上記の2 つの低い周波数の係数以外に対しては、特定の係数の精度を増加するのに必要な ところでは、適応的ビット割当てによって追加ビットが供給される。
もし係数0及び1を適応的ビット割当て過程に含めるとしたら、入力信号チャネ ルにサンプル・ブロック長と比較して周期の長い低い周波数スペクトル成分が含 まれる時には何時でも、E−TDACコーダローってサンプル・ブロック・レー トに等しい量子化雑音が発生されるであろう。この雑音は、低い周波数成分を含 むチャネル内で2つの機構の相互作用によって生み出される。第1に、E−TD AC変換によって低い周波数成分が係数0[DCT C(0)及びDST 5( 0)]に関する非0及びOの値の交互の繋がりに転換される。係数C(0)はD CT変換ブロック中では非0であるが、係数5(0)はDST変換変換クロック 中常にOである。係数1 [DCT C(1)及びDST S (1)コは、フ ィルタ・バンクのサイドローブ効果のためにより少ない影響しか受けない。第2 に、これら2つの低い周波数の係数を適応的ビット割当て過程に含めることによ って、チャネルに対する割当てアルゴリズムは2つの指定パターン、すなわち1 つがOCTブロック用、もう1つがDCTブロック用の指定パターンの間を行き 来する。適応的に指定されるビットの数は固定されているので、DCTCロブク 中で係数C(0)に指定されるビットはDSTブロツり中のような他の変換係数 に割当てられる余裕はない。
[係数5(0)の値は常に0であるので、どのような適応的割当てビットを指定 されることもない)。この交互のパターン割当ては、周波数が86.1Hz ( 又は44゜1、 k Hz / 512 )のサンプル・ブロック・レートに等 しくなると聴取可能な雑音となって現れる。
本発明の現在の実施例では、DCT係数C(0)に対しては8ピ、トの固定ビッ ト長、DST係数S (0)に対しては9ビツトを指定しく表Iを参照)、これ らを適応的ビット割当てから除外する。この除外によって、この適応的ビット割 当て構想で前節で述べた量子化雑音を発生するのが避けられる。
4、適応的ビット 当て a、大要 非均質量子化装置の第4の部分によって、適応的ビット割当てが行われる。第7 図の箱704には、この割当て過程の大要が提示されている。大まかに言って、 各変換ブロックについて、ビット割当てによって、4つの相で特定の係数に対す る固定の数の追加ビットが指定される。このビットの数は、信号符号化品質と伝 送ビットレートの平衡を取るべく選ぶことができる。本発明の好ましい実施例で は、毎秒128にビットの総合的ビットレートを達成するために、この割当ての 制限値を変換ブロック当たり133ビツトに設定している。エラー訂正コード( 下で論じる)を用いる用途では、同じ総合ビットレートを達成するために、この 制限値をブロック当たり124ビツトに低減しなければならない。当出願では、 この制限を割当て最大値又は割当て可能数と呼ぶ。
現状の実施例では、係数当たり4ビツトの最大値を割り当てている。この最大値 は、符号化精度と総合的ビットレートとの間の設計上の妥協を表している。当業 者には、本発明の概念又は基本的目的を変更せずに、この適応的に割当て可能な ビットの最大値と数を変えることができることが分かるであろう。
相0は、残りの相に対する初期化の過程である。相1では、係数当たり4ビツト の最大値までが、最大のスペクトル・エネルギーを有する周波数成分の同一の重 要な周波数帯域内にある係数に対して指定される。もし割当て可能なビットの総 てが相1の期間中に指定されているならば、この割当て過程は停止される。もし そうでなければ、相2によって、全適応的割当ビットが各係数に対して4ビツト になるように、相1の期間中に割り当てられた変換係数に対して追加ビットが割 り当てられる。もし割当て可能なビットの総てが相2の期間中に割り当てられて いるならば、この割当て過程は停止される。もしビットが幾らかでも残っている ならば、相3によって、相1及び相2の期間中に割り当てられた係数に隣接する 係数に対してビットが割り当てられる。この手順の更に詳細な概念については、 以下の文節で叙述する。この手順の論理の実施については、その後輪じる。
第8図は、特定の変換係数に対してビットを割り当てる概念上の過程の図である 。相0の初期化ステップが箱800中に示されている。第1段階では、アレイA Oの要素が0に設定される。次の段階では、最大のスペクトル成分を有するサブ バンドに対する指数である、最小のサブバンドの指数が識別され、この値がX  としIN で保存される。総てのサブバンドの指数がX からIN 差し引かれ、差がアレイM C)中に記憶される。有り得る最小のサブバンドの 指数は0であり、をり得る最大のサブバンドの指数は4ビツトの高い周波数サブ バンド指数に対する最大値15に主指数MEXP 1に対する値3を加えた、1 8であることに注意して欲しい。表工を参照して欲しい。したがって、アレイM  U中の有り得る値の範囲は。負の18から0までである。次のステップで、ア レイM Oの各要素に4が加えられ、0以下の総ての要素は0に設定される。相 0の最後に、アレイMOは、各サブバンドについて1つの、値が0から4までの 範囲の要素の組から成る。4の値を有する要素は、サブバンド中の少なくとも1 つの係数が全信号中で最大のスペクトル係数を有するサブバンドを表す。
相0では、第8図の箱801に示す過程を用いて、もう1つのアレイA Oが構 築される。このアレイA O中の各要素は、サブバンドに対応する。最高のサブ バンド指数は重合する変換係数を表すので、A Oの各要素は対応するサブバン ド中で総ての変換係数に指定されるビット数を表すことを表1から思い出して欲 しい。例えば、表Iを参照すると、サブバンド13は、係数13から14を表す 。もし要素A(13)が値1を有するならば、変換係数13及び14に対して1 ビツトずつの、2ビツトが割り当てられることを示している。この例について続 けると、もし要素A(36)が値2を有するならば、係数168から182まで に対して2ビツトずつの、30ビツトが割り当てられる。この割当て過程の間中 、A Oの各要素が増分されるにつれて、割当てのために残されているビットの 数から割り当てられたビットの数が差し引かれる。
この相又は続く何れかの相の間中に割当て可能なビット総てが指定されると、そ の相は直ちに終結し、次の相は省かれる。割当て限界に達する最後の段階中に、 この段階中にサブバンドに指定されるビットの数は、割当てのために残されてい るビットの数を超えない。1つ以上の係数を存するサブバンドの処理が行われて いる間に、割当て可能なビットの最後のものが指定されると、このサブバンド中 の係数総てには同じ数のビットが割り当てられないこともあり得る。
最も低い周波数係数を表すM Oアレイ要素[DCTブロックに関してはM ( 1) 、DSTブロックに関してはM (2) ]から始めて、次々にM Oの 各要素が検査される。MOアレイ全体にわたって、若しくは割当て可能なビット 総てが割り当てられるまで、4回もの検査が行われる。第1回の検査で、アレイ A O中の各要素は、もしアレイMO中の対応する要素が4に等しい値であれば 、1だけ増分される。第2回の検査によって、3又は4の値を有するMO中の各 要素に対応するアレイA O中の各要素が、1だけ増分される。第3回の検査で 、アレイA O要素は、対応するM O要素が2から4までの範囲内の値を有す るならば、増分される。最後の検査によって、1から4までの範囲内の値を有す るMO要素に対応するアレイ中の要素が増分される。
アレイMO中の要素の合計が割当て制限値に達するか若しくはそれよりも少なけ れば、この時点でのアレイMO及びA Dの内容は等価であることに注意したい 。
もし指定されたビットの数が割当て限界に達したならば、このビット割当て過程 は相1の最後で完結する。
もし割当て可能なビットが幾つかでも残っているならば、第8図の箱802に示 す相2の割当てが続行される。
この相では、A Oアレイ全体にわたって3回もの検査が行われ、もし、又は最 大数の割当て可能なビットが指定されると、早々に停止される。各検査は最も低 い周波数要素[OCTブロックに関してはA (1) 、DSTブロックに関し てはA (2) ]で開始され、周波数を上げながら進められる。アレイA O 全体にわたる第1回の検査で、1と3との間の値を有する各要素が1だけ増分さ れる。第2回の検査で、2又は3の値を有する要素が増分される。第3回の検査 で、3に等しい要素が増分される。割当て制限値を超えることなくこの相が完結 するならば、A Dアレイ中の各要素の値は、4または0の何れかである。
もし割当て可能なビットが残っているならば、第8図の箱803に示す相3の割 当てが続行される。前の相と同じように、割当て制限値に達すると直ちに相3の 割当ては終了する。この最後の相によって、高いエネルギーを持つ係数のサブバ ンドに隣接する低いスペクトル・エネルギーを持つ変換係数に対して追加ビット が指定される。この指定は、3段階で達成される。第1段階によって、値(0, 4)を持つ2つの隣接要素の群を探索するための、最も高い周波数要素A(36 )[要素A(39)は20kHz帯域幅コーダでの開始要素]から始まる、アレ イA C)の走査が行われる。もしこれが見付かれば、この群の値が(1,,4 )になるように、値が0の要素が1に設定される。
もし割当て限界に達していなければ、値(4,0)を持つ2つの隣接要素の組を 探索するために、最も高い周波数サブバンドから始め、低い周波数に向けてアレ イAOを走査することで、相3のステップ2が開始される。
もしこれが見付かれば、(4,1)の値を作り出すべく、0の値を有する要素が 1に設定される。
相3の第3及び最終ステップによって、この相のステップ1及びステップ2の中 でビットを割り当てられたサブバンドの中の係数に対して、追加ビットが割り当 てられる。アレイA Oの最も高い周波数要素で始めて、ステップ1中で改変さ れた各要素が増分される。最後に、ステップ2中で改変された要素が、最も高い 周波数サブバンドから始め、増分される。この第3のステップによって、上で論 じたのと同じ順序で、割当て可能なビットが総て指定されるまで、若しくはステ ップ1及びステップ2の中で改変された要素の総てに合計4ビツトずつが指定さ れるまで、アレイ要素が反復的に増分される。もし後者の条件に一致し、割当て 可能なビットが幾つかでも残っているならば、相3が、ステップ1から始まり、 繰り返される。
b、適応的ビット割当て論理 適応的ビット割当ての概念については、第8図に表現し、上で述べた。そのアル ゴリズムの概念を理解することは、適応的ビット割当てルーチンの実際の論理を 理解するのに役立つ。
相Oは、0に等しいアレイA Oの総ての要素を初期化し、T からT2までの 4つの表を構築することから始まる。これらの表の構築は以下のステップを通し て達成される。すなわちこれらは、(1)最小のサブバンド指数を識別し、これ をX として保存し、(2)最IN も低い周波数サブバンド(DCTブロックについてはサブバンド−1又は、DS Tブロックについてはサブバンド2)から始めて、サブバンド指数(表1参照) をXMlNから差し引き、(3)もしこの差が0であれば、このサブバンド数を 表T1、T2、T3、及びT4に挿入し、(4)もしこの差が負の1であれば、 このサブバンド数を表T工、T2、及びT3に挿入し、(5)もしこの差が負の 2であれば、このサブバンド数を表T1、及びT2に挿入し、(6)もしこの差 が負の3であれば、このサブバンド数を表T1に挿入し、(7)総てのサブバン ドが処理されるまで、各サブバンドに対してステップ3からステップ6までを継 続する、ステップである。
このステップの最後において、表T にはX −31MIN からX までの範囲の指数を有する総てのサブパンIN を有するサブバンド、表T3にはXMI−1からXMINまでの指数を有するサ ブバンド、表T4にはXMINに等しい指数を有するサブバンドが含まれる。こ こで重要なことは、各表へのサブバンド書込みが周波数の上がる順序で行われる ことである。
相1によって、最大のサブバンド指数を有するサブバンド中の変換係数に対して ビットが割り当てられる。最初の表T4への書込み(最も低い周波数)から始め て、この表で表されるサブバンド内の各変換係数に対して1ビツトが割り当てら れる。割当ては、表T3、T2、最後にT1へと、次々に反復される。この過程 は、割当て可能なビットが総て指定されるまで、若しくはT4からT1までの表 への総ての書込みが処理され終わるまで、続行される。サブバンド中の総ての係 数に対してビットが指定されると、A O中の要素が各サブバンド中の各変換係 数に対して割り当てられる全ビットを反映するように、アレイA Oのサブバン ドに対応するアレイAO中での書込みが1だけ増分される。
前に注意したように、割当て可能なビットが総て指定されると割当ては直ちに終 結する。各表への書込みによって、一般的に重合変換係数を含むサブバンドが表 される。したがって、もし割当て可能ビットの最後のものが2つ以上の係数を持 つサブバンドを表す表書込みに指定されるならば、そのサブバンド中の係数の総 てには同じ数のビットが割り当てられないことが起こり得る。そのような状況下 では、割当て過程によって、次にアレイAO中に記憶されるサブバンド割当ての 合計からサブバンド中のどの係数が差し引かれなければならないビットを持って いるのかが表示される。
相2によって、T からT4までの4つの新しい表が相0で用いられたのと類似 の手順を用いて構築される。
すなわち、この手順は、(1)x によって最小のMIN サブバンド指数が依然保持され、(2)最も低い周波数サブバンド(DCTブロ ックについてはサブバンド−1又は、DSTブロックについてはサブバンド2) に関して、サブバンド指数をX から差し引き、(3)もMIN しこの差が0であれば、このサブバンド数を表T4に挿入し、(4)もしこの差 が負の1であれば、このサブバンド数を表T3に挿入し、(5)もしこの差が負 の2であれば、このサブバンド数を表T2に挿入し、(6)もしこの差が負の3 であれば、このサブバンド数を表T1に挿入し、(7)総てのサブバンドが処理 されるまで、各サブバンドに対してステップ3からステップ6までを継続するこ とである。このステップの最後において、表T にはX −3に等しい指数を有 する総てのサブl MIN バンドの数、表T にはXMI−2に等しい指数を有するサブバンド、表T に はXMI−1に等しい指数を有するサブバンド、表T にはX に等しい指数を 有4 MIN するサブバンドが含まれる。各表へのサブバンド書込みは変換係数の周波数の上 がる順序で行われる。
相2によって、表T からT までの中のサブバンドで表される総ての係数に対 して、各係数が合計4つの追加ビットを受け取るまで、若しくは割当て限界に達 するまで、ビットが割り当てられる。表T3中の最初の書込み(最も低い周波数 )から始めて、この表中に表される各サブバンド内に含まれる各係数に対して1 ビツトが割り当てられる。各サブバンドが処理されるにつれて、書込みは、表T  から取り除かれて、表T4に挿入される。
次に、追加ビットが割り当てられるにつれて各書込みを表T から表T に移動 させながら、表T2中の書込みに関連する係数に対して追加ビットが割り当てら れる。
その後、書込みを表T から表T2に移動させながら、表T 中の書込みが処理 される。もし割当て可能なピットが幾らかでも残っているならば、表T3に対す る処理、その後表T2に対する処理を反復しながら、割当てが続行される。もし 指定されるべきビットが残っているならば、表T3中の書込みを通して最後の処 理が行われる。
もし相2によって割当て可能なビットの総てが指定されなければ、表T4には各 々が受け取った4ビツトを持つ総ての係数を含み、表T から表T1までは空で ある。
もし割当て可能なビットの総てが指定されたならば、各変換係数に割り当てられ た全ビットを反映すべく、表T1から表T までに含まれる情報からアレイA  C’)が再構築される。表T4中の書込みに対応するアレイA O中の各要素に は値4が指定される。表T3中の書込みに対応する各A O要素には値3が指定 され、表T2については値2、表T1については値1が指定される。AOの他の 総ての要素、すなわち表T から表T4までの書込みで表されないサブバンドは 0である。
もし割当て可能なビットが幾つかでも残っているならば、相3での割当てが続行 される。サブバンドの数を周波数の下がる向きに順序付けることによって、表T 4が並び替えられる。第1ステツプによって、表T4にはない、低い周波数で、 表T4中にあるサブバンドに隣接するサブバンドが表T に対して追加される。
表T4中の最初の書込み(最も高い周波数)から始めて、表T4中での隣接書込 みが1つであるのか、若しくは2つ以上のサブバンドに分離されていないかにつ いて検査される。
もし分離されているならば、高い周波数の直ぐ下にあるサブバンドの数が表T1 に挿入される。例えば、表T4中の2つの隣接する書込みによってサブバンド1 6及び12が表されるとしよう。これらのサブバンドは3つのサブバンドに分離 されている。したがって、サブバンド16の下のサブバンドを表す数15が表T 1に挿入されることになろう。
第2ステツプによって、表T4にはない、高い周波数で、表T4中にあるサブバ ンドに隣接するサブバンドが表T に対して追加される。表T4中の最初の書込 み(最も高い周波数)から始めて、表T 中での隣接書込みが1つであるのか、 若しくは2つ以上のサブバンドに分離されていないかについて検査される。もし 分離されているならば、低い周波数の直ぐ上にあるサブバンドの数が表T に挿 入される。例えば、表T4中の2つの隣接する書込みによってサブバンド−6及 び12が表されるとしよう。上で論じたように、これらのサブバンドは3つのサ ブバンドに分離されている。したがって、サブバンド12の上のサブバンドを表 す数13が表T1に挿入されることになろう。
表T1中の最初の書込みから始めて、表T□中の書込みによって表される各サブ バンドに関連する各変換係数に対して追加ビットが指定される。各サブバンドの 書込みは、処理されるにつれて、表T1から表T2へと移される。表T1の処理 の最後で割当て可能なビットが幾つかでも残っているならば、各書込みを表T2 から表T3へと移しながら、表T2の書込みに関して類似の過程が反復される。
もし割り当てられるべきビットが幾つかでも残っているならば、表T3の書込み を表T3から表T4へと移しながら、表T3の過程が続行される。もしこの過程 の後にビットが幾つかでも残っているならば、最初に表T4の書込みが未だ並び 替えられた状態にあるかどうかを判定し、もし層でなければ、表T4の書込みを 周波数の下がる向きの順序に並び替える始めのステップから相3が繰り返される 。割当て可能なビットの総てが指定されると、上で相2に関して述べたように、 4つの表からアレイA Uが構築される。
ビットの総てが割り当てられた後、各変換係数コード・ワードは、この係数がグ ループ化されるサブバンドをその中で表すアレイA Oの要素の値に等しいビッ ト長に丸められる。しかし、1つのサブバンド中の幾つかの係数では、割当てビ ットの合計数を割当て最大数に等しく保つために必要なビット長から1つ差し引 いたビット長を具えることもある。
5、コード・ワード省略 第7図の箱705に示す非均質量子化装置は、適応的ビット割当てルーチンに従 う。前節で決定されたサブバンド及び主指数を用いて、変換ブロック中の各変換 係数は、もし関連する主指数がOに設定されているならば、その中で係数がグル ープ化されるサブバンドに対する指数の値に等しい桁数に更に3桁加えた桁数だ け左に移動される。その後、アレイA O中で見出だされる各サブバンドに対し て割り当てられる適応的割当てビットの数に最小ビット長(表Iを参照)を加え ることによって、各係数の合計ビット長が計算される。各変換係数のコード・ワ ードは、このビット長に丸められる。
上で述べたように、アレイA Oの各要素によって、サブバンド内の総ての係数 に指定されるビットの数が表される。1つのサブバンド中の幾つかの係数では、 割当てビットの合計数を割当て最大数に等しく保つために必要なビット長から1 つ差し引いたビット長を具えることフォーマット化過程によって、伝送または記 憶のためのiwAの符号化変換ブロックが用意される。この過程は、ila図の 箱109に示されている。以下の叙述では、1チヤネル系中の2つの隣接する変 換ブロックのフォーマット化について論じる。ステレオ音響の用途に用いられる 技法と同じ技法を用いて信号を処理して、2チヤネル系の各チャネルからの1つ の変換係数がフォーマット化される。
各変換係数のコード・ワードの固定長表現は、丸められたコード・ワードを表1 に示す最小ビット長に等しい長さに省略することによって形成される。このコー ド・ワードに対して割り当てられる追加ビットは総て、適応的ビット・ブロック 中で個別にフォーマット化される。
その後、主指数と、サブバンド指数と、省略されたコード・ワードと、適応的ビ ット・ブロックとが第20図に示すグループ化によって組み立てられる。1組の 主及びサブバンド指数は、ブロック・ペア中の両方の変換ブロックに適用される ことに注意して欲しい。(非均質量子化装置についての上述の議論を参照のこと )。ブロックの各ペアの間で指数を分は合うことによって、両変換ブロックの指 数を表現するために必要なビットの数は50%低減される。
第20図の変換ブロックのフォーマット化されたフレームに、変換ブロックAが DCTブロックで、変換ブロックBがDSTブロックの構造が説明されている。
このフレームが伝送中の雑音によって生じるようなビット誤りを受けるのであれ ば、第21図に示すようにデータに誤り訂正コードが混交される。もしこのディ ジタル信号が放送のために意図されたものであればフレーム同期ビットのような ビット、また、もしこのフレームが記憶のために意図されたものであればデータ ベース・ポインタ又はレコードキーのようなビットの、追加の付帯的なビットが 必要になることもある。フレーム同期ビットが必要であれば、フォーマット化さ れたフレームは、ヴアン・ノストランド・ラインホールド社1985年出版のス ミスによる「ディジタル伝送系」の228ページから236ページまで(Smi th、 Di 1tal Transmission S stemNew Y ork、 NY: Van No5trand Re1nhold Co、、  1985. pp228−236)に叙述されている技法を用いて無作為化され る。
無作為化は、フレーム内の有効データが同期パターンと取り違えられる確率を下 げるために行われる。その後、この無作為化されたフレームは、フレーム同期ビ ットに対して付加される。
各変換係数を2つの別個の部分又はセグメントで表現できることに注意して欲し い。第1の部分によって係数の最小の長さが表現され、この部分は固定の数のバ スで構成される。表Iを参照して欲しい。この表現の第2の部分は、もしそれが あれば、長さが変わり、適応的に割当てられるビットで構成される。この2部分 構成による表現構想は、可変長のワードとして各係数を表す表現構想に比べて雑 音による悪化に対してより優れた免疫性があるので、これに替えて選ばれたもの である。好ましい実施例の構成を用いるフレーム中でもし突発雑音が発生すると 、この雑音の効果は、この雑音によって影響を受ける指数の値、コード・ワード 、又は割り当てられたビットに限られる。もし可変長コード・ワードを利用する フレーム中で突発雑音が発生すると、この雑音の効果は、残りのフレーム全体に 伝播することが有り得る。突発雑音によってこの雑音で直接的に打撃を受ける指 数の値及びコード・ワードのみならず、各可変長のコード・ワードの長さを決定 するのに必要な情報も変わってしまうので、この伝播が生じる。もし1つのコー ド・ワードの長さに誤りを生じると、フレームの残りの部分も誤って解釈される 。
OCT変換ブロックには、537ビツト(表1を参町及び133の適応的に割当 てられたビットの合計670ビツトから成る183の係数仮数が含まれる。DS T係数5(0)は常に0であるので(表工及び表現4を参町、これを伝送する必 要はない、2つの主指数ビット及び148ビツトの37サブバンド指数によって 、DCT・DSTブロック・ペアの長さは1486ビツトになる。
(本発明の20kHz方式では、全ブロック・ペアの長さは1702ビツトにな る)。
追加ビットが割り当てられている係数を指示するのに付帯的情報は必要ではない 。フォーマットを解除する過程では、符号化過程で用いられたのと同一の割当て アルゴリズムを実行することによって伝送されたサブバンド指数から適正な割当 てを決定することが可能である。
データの汚染が問題ではない時には、変換ブロックのフレームをフォーマット化 するための好ましい構造は、指数を最初に、係数コード・ワードを2番目に、適 応的割当てビットを最後に配置する構造である。この構造では、総てのサブバン ド指数が受け取られた後に、適応的ビット・ブロックが受け取られる間に、フォ ーマットを解除する過程によって各変換係数に対するビット割当てを決定するこ とが可能であるので、処理による遅延が低減される。本発明の好ましい実施例に おいて用いられるフォ−マット化構造を第20図に示す。ビット・ストリ7ムは 、主及びサブバンド指数で周波数の上向きの順序にフォーマット化される。その 後、変換ブロックAに関する係数コード・ワードの固定長部分が周波数の上向き の順序に組み立てられ、ブロックBに関する係数コード・ワードがそれに続く。
最後に、ブロックAに関する適応的ビット・ブロックがビット・ストリームに付 加さ瓢ブロックBに関する適応的ビット・ブロックがそれに続く。
データ悪化の可能性について心配される用途においては、エラー訂正構想が必要 である。サブバンド指数中のエラーと、それよりも程度は低いが、低い周波数係 数コード・ワード中のエラーとによって、聴感上の最大の歪みが生じる。この情 報は、保護されるべき最重要のデータである。好ましい構成では、これらの値を エラー検出及び訂正コードを用いて保護しているが、突発雑音エラーに対する免 疫性を向上させるために、これらの値をできるだけ隔置している。第21図にこ のような構想が示されている。
当業者にとって、本基本発明から逸脱せずに別のフレーム・フォーマット及び訂 正コードが利用できることは明瞭であろう。
エラー訂正コードを用いる際には、全ビットレートを同一に維持するために、適 応的割当てビットを少なくする。DCT−DSTブロック・ペアの1フレームに 関する指数及び仮数ビットの合計数は、1220ビツトである。この長さに関し て、150ビツトはサブバンド指数及び主指数である。このビット・ストリーム に1(21゜19)リード・ソロモン(Reed−3olomon)zラー訂正 コードが付加される。このコードは長さ16ビツトであるが、これによって、1 9の8ビット記号(バイト: bytea)又は152ビツト期間にわたって単 一記号エラー検出・訂正が行われる。この例として、M、r、T、プレス社19 86年出版のピーダーリン及びウェルトンによる、「エラー訂正コード」の26 9ページから309ページまでと、361ページから362ページまで(Pet ersonand 1eldon、 Error−Correcttn Cod es、 Cambridge。
11ass: The 11.1.T、 Press、 1986.1.269 −309. 361−32)を参照して欲しい。
コードによって保護されるこれらの152ビツトについて、150は主指数及び サブバンド指数から成る(15kHz方式)。2つの主指数に対して冗長保護を 与えることによって、残りのエラー訂正能カが利用される。
16ビツトのエラー・コード及び冗長指数を表現するには、全部で18ビツトが 必要である。これらのビットは、適応的ビット割当てに振当て可能なビットを減 らすことによって、総合的なデータ・レートを増加させずにフォーマット化され たデータ・ストリームに付加される。その結果、変換ブロック・ペア中で各ブロ ックに対する総合的に割当て可能なビットは133から124に減る。
リード・ソロモン・コードによってバイトの中のデータが処理されるので、エラ ー・コードと、保護されたデータと、保護されていないデータは、処理を容易に するために8ビツトのバイトにグループ化される。各ブロック・ベア・フレーム 中での保護されていないデータに対する保護されたデータの比率は、約9対1で ある。これによって、保護されたデータをフォーマット化されたフレーム全体に わたって分散して、保護されたデータの各8ビツトのバイトを保護されていない データの8バイトにより分離することが可能になる。これについては第21図を 参照して欲しい。この技法を用いると、各エラー・)−t’65ビットもの1つ の突発雑音がフレーム中のどの位置に生じても、各エラー・コードから1つ以上 のバイトを悪化させることがない。したがって、65ビツト以上の長さをもたな い突発雑音に対しては、保護されたデータを復元することができる。
上で論じた制約の下で、指数及び変換係数コード・ワードが周波数の上がる向き に組み立てられ、その後に適応的ビット・ブロックが続く。
F、伝送又は記憶 今や、伝送又は記憶に対して、フォーマット化されたフレームに準備が整えられ た。第1a図には、伝送装置110が示されている。伝送媒体としては、放送の ような公共頒布系、スタジオでのモニタや信号ミキシング、施設内又は地上や衛 星系電波を経由する電話用が含まれる。記憶媒体としては、磁気テープ、及び磁 気又は光ディスクが含まれる。
G、フォーマット解除 ディジタル化され符号化された信号が伝送信号の受信又は記憶からの取り出しに よって伝送装M111から受け取られると、フォーマット解除過程が始まる。こ の過程は、第1b図の箱112に表現されている。もしコード・ワードのフォー マット化されたフレームが伝送の前に無作為−化されていたものであれば、逆無 作為化過程によってこのフォーマット化されたフレームが復元される。
その後このフレームは、各変換ブロックの成分、すなわち、主指数と、サブバン ドに指数と、変換指数コード・ワードと、適応的割当てビットとに分けられる。
エラー訂正コードがもしあれば、伝送又は記憶の間に発生しるエラーを取り除く ためにこれが用いられる。
各主指数ビットは、その対応する冗長ビットを用いて点検され、精度が確認され る。もしこの点検で落第ならば、つまり、主指数とその相手の冗長とが等しくな ければ、この主指数は1であると仮定される。もしこの主指数の正しい値が実際 には0であるならば、この仮定によって、総ての変換係数の振幅はこの間違った 主指数の下でグループ化されるサブバンド内に低減される。主指数を(1である べきところで)0に誤って設定すると影響を受ける係数の総ての振幅を増加させ るので、この仮定を用いることによって行う方が不都合なひずみの発生をより少 なくできる。
DCT係数C(0)に対する指数も点検され、隠れビットに対する調整が必要か どうかについて判定される。
上で述べた適応的ビット割当てルーチンを用いて受信信号から抽出される指数が 処理され、この処理結果を用いて変換係数に対する適応的ビット・ブロックの適 正な割当てが決定される。最大ビット長と適応的に割り当てられたビットの何れ かとを加えたビット長にその長さが等しい各変換係数の部分は、24ビツト・ワ ードに負荷され、その後、もし関連する主指数が1に設定されているならば、適 正なサブバンド指数の値と3桁の追加移動桁とを加えた数に等しい桁数だけ右に 移行される。この過程は、第1b図の箱113に表現されている。
H9合合成フィルタバンク、逆変換 第1b図の箱114では、フォーマット解除及び直線化手順によって復元される 周波数領域係数の各組を時間領域信号サンプルのブロックに変換する合成フィル タのバンクが表現されている。第1a図の分析フィルタ・バンクとは逆の変換に よって、合成フィルタ・バンク114が実現される。本発明の実施例で用いられ るE−TDAC技法のための逆変換は、改変された逆DCT及び逆DSTの代替 的な応用である。変換ブロックの半分が伝送又は記憶では省略されるので(表現 5及び29を参照のこと)、逆変換のためにこれらのブロックが再生されなけれ ばならない。弐8に示されるように、失われたOCTブロックを入手可能なりC Tブロックから再生することができる。この逆DCTブロックは式10に表現さ れており、逆DSTブロックは式11に表現されている。
C(k)−−C(N−k) N/2≦k<N(8S(k)−5(N−k) N/ 2≦k<N(91k−1−nfs x(n)=−Σ C(k) ・cos[2yr k()]K k=OK O≦ n< N (10 1 k−1+ n+1 x(n)=□Σ 5(k) ・ sin[2yr k(−)]K k−OK O≦ n< N (11 ここで、 k=変換係数 n+1信号サンプル数 に=変換係数の数 N=サンプル・ブロック長 m−E−TDACに関する相期間 C(k)−量子化されたDCT係数k S(k)−量子化されたDST係数k x(n)=復元された量子化信号x (n)である。
計算は、FFTアルゴリズムを用いて行われる。逆変換において、FFTを用い てのDCT及びDSTの両方の同時発生的計算を可能にするために、前方変換で 用い第14a図から第14e図までと、第16a図から第16g図までに、分析 ・合成フィルタ・バンクの変換過程が示されている。分析フィルタ・バンクによ って、時間領域信号がDCT及びDSTブロックの交互列に変換される。逆変換 によって、逆DCTが別のブロックの各々に加えられ、逆DSTが残り半分の別 のブロックに加えられる。第15a図から第15d図までに示すように、復元さ れた信号には、エイリアシングひずみが含まれている。このひずみは、第1b図 の箱116に表されている次の時間領域ブロックが処理されている間に消去され る。重複・加算過程については、以下に述べる。
1、合成ウィンドウ 第1a図から第1g図までには、隣接する時間領域信号サンプル・ブロックの重 複・加算による時間領域エイリアシングの消去が示されている。プリンセンによ って誘導されているように、時間領域エイリアシングひずみを消去するには、E −TDAC変換で分析ウィンドウと同等の合成ウィンドウを適用し、隣接するブ ロックを重複・加算することが必要である。各ブロックは、100%、すなわち 、先行するブロックで50%、後続するブロックで50%が重複される。合成ウ ィンドウ変調は、第1b図の箱115によって表現されている。
合成・分析ウィンドウの設計では、フィルタ・バンクの性能について考慮しなけ ればならない。両方のウィンドウとも時間領域信号を変調すべく用いられるので 、フィルタ性能に係る総合的効果はこれら2つのウィンドウの積から形成される 単一のウィンドウによって生じる効果と類似している。したがって、合成・分析 ウィンドウ・ペアの設計は、合成及び分析ウィンドウの点ごとの掛は算を表す適 切な積ウィンドウを設計することにより達成される。この設計は非常に制約され ていて、遷移帯域ロールオフの鋭さと阻止帯域排除の深さの平衡を取る融通性を 低下させる。その結果、フィルタ性能は、この制約のない分析専用ウィンドウに おけるよりも数等劣化する。この例については、第17a図及び第17b図を参 照して欲しい。
この先行技術では、分析ウィンドウに関して多大な関心が払われている一方で、 合成ウィンドウについては教えるところが少ない。以下に叙述する技法では、周 知の良好な分析ウィンドウの設計から良好な合成・分析ウィンドウ・ペアを誘導 している。出発点としてどのような分析ウィンドウを用いることができるが、幾 つかのウィンドウでは良好な選択度を有するフィルタ・バンクの設計が可能とな り、遷移帯域ロールオフの鋭さを阻止帯域排除の深さと取り引きする手段が提供 される。3つの例として、カイザー・ベッセル・ウィンドウ(l[aiser− Bessel曹1ndov)と、ドルレフ・チェビシェフ・ウィンドウ(Dol ph−Chebychev window)と、バークスー7ックレラン法(P arks−11cclellan method)を用いてを限インパルス・フ ィルタ係数から誘導されるウィンドウとが挙げられる。1972年3月のI E EE学会誌、回路理論、CT−19巻の189ページから194ページまでのバ ークス及びマツフレランによる論文、「リニア相を有する非回帰型ディジタル・ フィルタのチェビシェフ近似法」(Parks and McClellan、 ”Chebychev Approximationfor Nonrecur sive Digital Filters with LinearPhas e−、IEEE Trans、C1rcuitTheory、vol、cT−1 9゜March 1972. +)り、 189−94))を参照して欲しい。
ここでは、カイザー・ベッセル・ウィンドウのみが論じられている。
このウィンドウによって、単一のパラメータ・アルファ値の選択を通して上述の 平衡を取ることが可能になる。
一般的法則として、低いアルファ値によって遷移帯域ロールオフが改善され、高 いアルファ値によって阻止帯域排除の深さが増加させられる。上で引用したハリ スの論文を参照して欲しい。
本発明の好ましい実施例では、4から7までの範囲のアルファ値が使用できる。
この範囲によって、中間周波数領域(1kHzから2kHz)での遷移帯域ロー ルオフの鋭さと、低い周波数領域(500Hz以下)及び高い周波数領域(7k Hz以上)での阻止帯域排除の深さとの間の良好な妥協が得られる。許容できる アルファ値の範囲は、量子化雑音を音響心理学的マスキングしきい値以下に維持 するために十分な阻止帯域排除を具える最低のアルファ値をコンピュータ・シミ ュレーションで識別することによって決定された。
カイザー・ベッセル・ウィンドウ関数は以下の通りである。すなわち、 α寡カイザー・ベッセル・アルファ因数1mウィンドウのサンプル数 N−ウィンドウのサンプル数中のウィンドウ長重複・加算条件を満足させるため に、長さv+lのウィンドウW(n)を長さN−vの長方形ウィンドウでたたみ 込むことによって、長さNの分析・合成積ウィンドウWP(n)が誘導される。
値Vは、ウィンドウ重複・加算期間である。この重複・加算過程によって、エイ リアスひずみと分析・合成ウィンドウの変゛調効果とが消去される。積ウィンド ウを誘導するたたみ込みは、式13に示される。ここでは、表現の分母によって 最大値が単位1に近付くが1を超えないようにウィンドウが測定される。この表 現を式14に示されるように単純化することもできる。
Σ 5(k)・ W(n−k) Σ f(k) k=O N−v−1 Σ W(n−k) ここで、 n本積ウィンドウのサンプル数 V−ウィンドウ重複期間内のサンプル数N−積ウイントウの望ましい長さ V(n)−長さv + lのウィンドウ関数の開始WP(n)−長さNの誘導さ れた積ウィンドウである。
式(15)及び式(16)に示される分析及び合成ウィンドウは、誘導された積 ウィンドウWP (n)をそれぞれS及びAで累乗することによって得られる。
W^(n)=lIP(n) AO≦ n< N (15WS(n)=WP(n)  SO≦ n< N (1にこで、 WP(n)=誘導された積ウィンドウ (式14及び式14を参照) W^(n)=分析ウィンドウ ?5(n)=合成ウィンドウ N11積ウインドウの長さ 本発明の現在の実施例では、分析及び合成ウィンドウは、ウィンドウ重複100 %を具える512サンプル、又は256サンプルの重複期間の長さを有する。S 及びへの値は、E−TDAC変換に必要な1組の同等な分析及び合成ウィンドウ を作り出す真半分に各々設定される。
これらの値を式14に代入することによって、結果としての分析ウィンドウは以 下のようになる。すなわち、Σ 賃(n−k) 冒A(n)□ν・ −上−o 、≦ n< N (17Σ f(k) k冨0 ここで、W(n)=を長さ257のカイザー・ベッセル関数で、アルファ因数は 4から7までの範囲である。
J1重複・加算 ウィンドウの設計には更に追加の要求が課される。すなわち、分析及び合成ウィ ンドウは、隣接する2つの分析及び合成ウィンドウが重複された時に、分析・合 成積ウィンドウの合計が単位1になるように設計されなければならない。重複・ 加算過程は分析ウィンドウ及び合成ウィンドウの時間領域効果を消去すべく用い られるので、この要求が課される。この過程は、第1b図の箱116によって表 現され、第16a図から第16g図までによって説明されている。逆DCT及び DSTからそれぞれ復元される信号yc (t)及びys (t)は、第16a 図及び第16d図に示されている。各信号ブロックは、1連のブロックにグルー プ化される。各信号ブロックは、第16b図及び第16e図に示される分析・合 成ウインドウ関数によって変調される。結果として得られる信号?c (t)及 び?s (t)のブッロクが、第16c図及び第16f図に示されている。ブロ ック長の半分ずつが重複されている2つの信号は加算されて第16g図に示され る信号y (t)が作り出される。信号y (t)は、元の入力信号を正確に再 構築したものである。
第18図に示されるように、ブロックにとブロックに+1との間の重複期間内の 成る時刻notにある信号サンプルは、2つのブロックの各々の中のサンプルに よって表現される。ウィンドウ処理された2つのブロックの重複・加算に続いて 、時刻notにある復元された信号サンプルは、ウィンドウ処理されたブロック k及びに十1からのサンプルの合計であることが分かる。これは、以下の式で表 現することができる。すなわち、x (no t) =wp k(no t )  ・x (no t)+vp (n t) @ x (no t) ’ (18 に+1 0 ここで、 vp (n t)=vx k(not)−vsk(not)−(IAk(not ))WAk(not)一時刻notにおけるブロックに中の分析ウィンドウ WS (n t)=時刻notにおけるブロックに中のO 合成ウィンドウ i^ (n t)=E−TDAC変換に必要なWSk(not)O である。
もしウィンドウの重複期間を跨ぐ2つの積ウィンドウの合計が単位1に等しけれ ば、積ウィンドウの変調効果は消去される。したがって、信号x(nt)は、ブ ロックk及びブロックに+]の間の重複期間内の時間サンプルの総てについて以 下のようであれば、正確に復元される。すなわち、 11Pk(nt) +fPk、 (nt)−10−≦ n< N (19時間の 関数として積ウィンドウで作業するのは困難であるので、式19に示されている 要求をウィンドウのサンプル数の関数に翻訳することが望ましい。式20から式 23まででは、100%重複している512サンプルの分析及び合成ウィンドウ のペアの積から作り出される積ウィンドウについてのこの要求を表現している。
式20では、ウィンドウWPkの前半部とウィンドウWPk−1の後半部との重 複が表されている。式21では、ウィンドウWP の後半部とウィンドウWP  の前半k k+1 部との重複が表されている。式22及び式23では、分析ウィンドウに関して等 価の表現が示されている。
WPk−1(n+256)+WP k (n)111 0 ≦ n< 256  (20WPk(n)+WPk、 (n−256)−1256≦ n< 512  (21(WA (n+256)) +(WA (n))24 0≦ n< 25 6 (22k −1k (’A (n)l ”(’Ak、t (n−25,6))l 256≦ n<5 12 (23に ここで、 WP (n)−fAk(n) ・”5k(n)= (”Ak(nNW A k( ’ )−ブロックに中のサンプルnに対する分析ウィンドウの値 ’5k(nEブロックに中のサンプルnに対する合成ウィンドウの値 fA (n)=E −T D A C変換に必要なWSk(n)K、信号出力 第1b図の箱117には、ディジタル入力に応じて電圧が変化するアナログ信号 を発生するディジタル対アナログ・コンバータが示されている。このディジタル 入力は、重複・加算過程によって作り出される、24整数ワードの16最上位ビ ットから得られる。このアナログ出力は、擬偏の高周波成分を取り除くために、 15kHz(20kHz方式については20kHz)の通過帯域を持つ低域フィ ルタで濾波されなければならない。第1b図では、このフィルタは示されていな い。
■0本発明の代替的0−TDAC実施例本発明のもう1つの実施例では、本出願 で奇数積み重ね時間領域エイリアシング消去(0−TDAC)と呼ぶ、代替的な 変換を利用している。以下の叙述では、本発明でのE−TDAC方式と0−TD AC方式の間の実施上の差について論じる。
Δ−重量 0−TDACは、以下の式24に示す改変された個別分散余弦変換(DCT)を 用いる。
N−1n+5 C(k)−Σ x(n) ・cos[2π(k+1/2) ()]n露ON O≦o<N (24 ここで、 k=周波数係数 n=入力信号サンプル数 N−サンプル・ブロック長 m−0−T D A Cに対する位相項(式6を参照)x(n)−サンプルnに おける入力信号x(t)の量子化値C(k)= D CT係数に である。
0−TDAC変換によって、以下の式の1組のスペクトル係数又は変換ブロック が作り出される。
iII信号サンプル・ブロック数 C(k)−D CT係数k (式24を参照)である。
ここで用いる計算アルゴリズムは、高速フーリエ変換(F F T)である。E −TDAC方式とは異なり、〇−TDACNO実施例では同時発生的に2つの信 号サンプル・ブロックを変換するために1つのFFTも用いない。
しかし、E−TDAC方式で用いられる前週倍・変換・後逓倍に類似の技法を用 いることにより、変換の計算上の複雑さは低減される。前週倍ステップでは、信 号サンプルx(n)を以下の複素数関数で変調して、信号サンプルの実数値列を 複素数列に転換する。すなわち、exp(−jπ−)(26 n−人力信号サンプル・ブロック数 N−サンプル・ブロック長 である。
FFTで実行される個別分散フーリエ変換によりて、改変された信号サンプルは 1組の変換係数に変換される。
FFTは複素数変換であるので、1組の改変された信号サンプルの実数部及び虚 数部を同時発生的に変換することができる。最後に、後逓倍ステップによって真 のDCT係数が得られる。この過程は、以下の式27及び28に表現される。
C(k)= R(k) −cos[2z (k+1/2)(−)]+Q(k)・ cos[2π(k + 1 / 2 ) (−) ] (28n−人力信号サン プル・ブロック数 N:サンプル・ブロック長 に−周波数係数 n−1入力信号サンプル数 ■−0−TDACに対する位相項(式6を参照)R(k)−係数X (k)の実 数部 Q(k)−係数X (k)の虚数部 C(k)−D CT係数に である。
本発明の1チャネル方式のための好ましい実施例において、2つの連続する重複 信号サンプル・ブロックはバッファ中に記憶され、2つのFFT過程を用いて共 にDCT −DCT2ブロック・ペアに変換される。2チャネル系においては、 2チヤネルの各々からの信号サンプル・ブロックは2つのFFT過程を用いてD CTl・DS T 2ブロツク・ペアに変換される。
プリンセンは、適正な位相成分m(式6を参照)と注意深く設計された分析・合 成ウィンドウとを用いて、0−TDAC技法によって以下の形式の余弦変換ブロ ックの交互列から入力信号を正確に復元できることを示している。
(C1(k)l 、(C2(k)l 、(CI(k)) 、(C2(k)) 、 、、 (29ここで、 CI(k)、 =信号サンプル・ブロック1のDCT1係数C2(k)、 =信 号サンプル・ブロックiのDCT2係数である。
変換ブロックの列は、実際には、2チヤネル系における各チャネルから相手の変 換ブロックの各々を、又は1チヤネル系において用いられる両方のDCTの各々 から相手の変換ブロックの各々を廃棄することによって形成されることに注意し て欲しい。
0−TDAC変換及びエイリアシング消去過程は、E−TDACの過程と類似し ているが、第22a図から第22e図までと、第23a図から第23d図までと 、第24a図から第24g図までとに示されている。主要な差異はエイリアシン グ成分の形式にある。標本化された信号ブロックの前半部に関してエイリアシン グ成分はサンプル・ブロックの約1/4の点で入力信号の時間的に逆転したイメ ージであるが、その振幅の記号は入力信号の記号と逆転している。標本化された 信号ブロックの後半部に関しては、エイリアシングはサンプル・ブロックの約3 /4の点で入力信号の時間的に逆転しているが、記号は変化していない。これに ついては、第23b図及び第23d図を参照して欲しい。
分析及び合成ウィンドウの設計法及び使用法はE−TDACのそれと同等である 。これについては、第24a図から第24g図までを参照して欲しい。
B、非 量子化装置 本発明のE−TDAC方式のための非均質量子化装置は、DCTブロックが存在 することにのみ起因するごく僅かの差異がある点以外は、E−TDAC変換方式 で用いられる非均質量子化装置と同等である。各ブロック・ペア中には、両変換 ブロックには係数C(0)が含まれているので、総てのサブバンド指数は2つの ブロックによって共存される。その結果、そこには隠れビットはなく、係数C( 0)に関する「最小」ビット長は9ビツトに固定される(E−TDACでは8ビ ツト)。表■を参照して欲しい。
動的ビット割当ては実質的にE−TDACに対するそれと同じである。係数C( 0)は各ペア中の両ブロックに対する割当てから除外され、各変換ブロック・ペ アの長さが増加していることから、以下に論じるように割当て限界は130ビツ トしかない。
C,フォーマット化とフォーマット解除各符号化DCTブロックには、538ビ ツト(表及びを参照のこと)と適応的に割り当てられた130ビツトの合計66 8ビツトから成る183の係数仮数が含まれる。DCTブロックによって共有さ れる2つの主指数及び37のサブバンド指数によって、E−TDACの実施例の DCTI・DCT2ブロック・ペアの長さと同じく、その長さが1486ビツト にされる。
エラー訂正コードを有しないフォーマット化されたフレームの構造は本発明のE −TDAC中で用いられるそれと非常に類似しているが、これは第25図に示さ れている。エラー訂正コードを有するフレームの構造はE−TDACのそれと同 一であるが、これは第21図に示されている。
フォーマット解除過程は、隠れビット対して点検が為されないてん以外は上述の 過程と同じである。
D、逆変換 DCTブロックの半分は伝送又は記憶で省略され、式30に示す関係を用いて入 手可能なりCTブロックから再生される。逆DCTは式31に示されている。
C(k)−C(N−k) N/2≦k < N(30)I K−1n+m x(n)禦−ΣC(k) ・ cos[2x (k÷1/2)(7)]K k− OK O≦n < N(31) ここで、 k−変換係数 n!信号サンプル数 に−変換係数の番号 N−サンプル・ブロック長 一−E−TDACに対する位相項(式6を参照)C(k)−量子化DCT係数k x(n)=復元量子化信号x 、(n )である。
逆変換の0−TDAC実行では、前方変換で用いられる前週倍・変換・後逓倍過 程のような過程によって計算上の複雑さが低減される。この過程によって、単一 の逆FFT (IFFT)を用いて実数のOCT係数が1組の改変された複素数 の係数に転換され、以下の式に示すように、後逓倍から時間領域信号が得られる 。
O≦n < N(32) 0 ≦n < N(33) ここで、 m−0−T D A Cに対する位相項(式6を参照)N・サンプル・ブロック 長 に=周波数係数番号 n=入力信号サンプル数 r(n)=サンプルx(n) の実数部q(n)−サンプルx(n) の虚数部 x(n)・復元量子化信号x(n) である。
15kHz方式E−TDACのための周波数係数上 サブバンド 係数 最小 指数 指数 指数Ln 番号 ビットLn、本0本 MEXPOEXPO4ヒツト 0 8ヒツト、+ EXPI 1 5ヒツト EXP2 2 2XP3 3 EXP4 4 EXP5 5 EXP6 6 EXP7 ? EXP8 g EXP9 9 EXPIO10 EXPII 11 EXP12 12 EXP13 13−14 4ビツト EXP14 15−16 EXP15 17−18 EXP16 19−20 EXP17 2l−22 EXP18 23−24 MEXPI EXPI9 25−27 EXP20 28−30 EXP21 3l−33 EXP22 34−37 EXP23 38−41 EXP24 42−46 EXP25 47−53 3ビツト EXP26 54−60 EXP27 6l−67 EXP28 68−77 EXP29 78−87 EXP30 88−97 EXP31 98−107 EXP32 108−122 2ビットF、XP33 123−137 EXP34 138−152 EXP35 153−167 EXP36 168−182 *DSTでは常に、係数5(0)に対して値0が作り出される。これはデコーダ によって先験的に認識されているので、5(0)に関する指数及び仮数は伝送又 は記憶される必要がない。
” DST係数5(1)に関するビット長は9ビツトである。DST係数C(1 )に関する長さは3表に見られるように、5ビツトである。
表■ 20kH2式のE−TDACコーダローめの周波数係数上 サブバンド 係数  最小 指数 指数 指数Ln 番号 ビットLn*サブバンド0から36までは15k Hzコーダと同じである。
表1を参照のこと。
EXPI EXP37 4ビア ト183−19L 2 ヒツトEXP38 200−21 6 EXP39 217−233 表■ 主 サブバンド 係数 最小 、ネ 指数 指数 指数Ln 番号 ヒツト上nサブバンド1から36まではE−TD ACに対するものと同じである。
(表工参照) サブバンド37から39まではE−TDACに対するものと同じである。
(表■参照) F骸−2e。
b旬−く F/G、−5 ≦ 20 kHzのコーグでは5819からRy+までのサブバンドをmいるF I6. 7 ” 20kHzのコーグでは、SR,ThらSB1までのサブバンドを用いる。
4 0S71:関しては、M外はサブバンド沼2である。
F/G−6! 周波数偏位(llz) フィルタ応答精性 −++ 4kllzl:おけるマスキング、、、、、、、、、、、、、、、l  kllzにおけるマスキングR峡敢傷位C&) 一−−−− イknt、におCするマスキングFIG−に 、、、、、、、、、、、、、、、、I knvにおけるマスキノグ周波敗(kl lz) R6−ヱ? 相7−1的スペクトル・レベル(dB)んυ−/6b、FIG、−ん鞭 FIG−16g り)析・合成ウィンドウ・ペアの5)析ウィンドウのフィルタ応答特性周波数側 位(111) 分析・0成ウインドウ・ベアの分析ウィンドウのフィルタ応答特性FIG、/7 b、□ 分析専用ウィンドウのフィルタ応答特性−一 −ノ N N −ヤ4 )− ンク(り FIG 24b、 ””−”” FIG、−24c、 FIG 24f FIG24(j。
平成3年 7月29日

Claims (38)

    【特許請求の範囲】
  1. 1.広帯域のアナログのオーディオ情報の高品質のディジタル符号化を行なうた めのエンコーダであって、該広帯域アナログ・オーディオ情報を時間領域信号の サンプル・ブロックに標本化し、量子化するための装置と、 重み付け関数を用いて各信号サンプル・ブロックを変調するための分析ウインド ウ装置と、 分析ウインドウで重み付けされた時間領域信号サンプル・ブロックに応答して周 波数領域変換係数を発生するための装置であって、該分析ウインドウで重み付け された時間領域信号サンプル・ブロックに対して個別分散変換関数を印加するた めの装置から成る装置と、各周波数領域変換係数を量子化し、該量子化変換係数 をサブバンドにグループ化するための、適応的ビット割当て装置を含む非均質サ ブバンド量子化装置と、非均質に量子化され、グループ化された該変換係数を伝 送又は記憶に適するフォーマットを有するディジタル出力信号に組み立てるため の装置 とから成る、エンコーダ。
  2. 2.前記個別分散変換関数印加装置が、前記分析ウインドウで重み付けされた時 間領域信号サンプル・ブロックに対して、改変された個別分散余弦変換関数と改 変された個別分散正弦変換関数とを交互に印加するのと実質的に等価の関数を奇 数重ね合わせ時間領域エイリアシング消去技法に従って印加するための装置から 成る、請求項1記載のエンコーダ。
  3. 3.隣接する時間領域信号サンプル・ブロックの組を記憶するための装置から更 に成る装置であって、個別分散余弦変換関数と個別分散正弦変換関数とを交互を 印加するのと実質的に等価の関数を印加するための前記装置が、記憶された隣接 する時間領域信号サンプル・ブロックの組に対して同時発生的に印加されている 単一の高速フーリエ変換関数によって実行され、記憶された隣接する時間領域信 号サンプル・ブロックの組の各々が該高速フーリエ変換関数によって分散余弦変 換・個別分散正弦変換ブロック・ペアに演算される、請求項2記載のエンコーダ 。
  4. 4.指数に関連する仮数から成るブロック・フローティングポイントの形式で時 間領域変換係数を表現するための装置が前記非均質サブバンド量子化装置に含ま れ、前記変換ブロック・ペア中のサブバンドに対応する各ペアによって単一の指 数が共有される、請求項3記載のエンコーダ。
  5. 5.隣接する時間領域信号サンプル・ブロックの組を記憶するための装置から更 に成る装置であって、記憶された隣接する時間領域信号サンプル・ブロックの組 に対して同時発生的に印加されている単一の高速フーリエ変換関数によって前記 個別分散変換関数印加装置が実行され、記憶された隣接する時間領域信号サンプ ル・ブロックの組の各々が該高速フーリエ変換関数によって変換ブロック・ベア に演算される、請求項1記載のエンコーダ。
  6. 6.コード・ワードのビット長が固定ビット数と前記適応的ビット割当て装置に より発生される可変ビット数との合計である各変換係数に対する可変ビット長の コード・ワードが前記非均質サブバンド量子化装置によって発生され、該適応的 ビット割当て装置では少なくとも前記変換関数によって作り出される量も低い周 波数の係数に対して適応的ビットが指定されないことによって、該係数に関する ビット長が固定され、前記信号サンプル・ブロックに比較して期間が長い低い周 波数のスペクトル成分が前記入力オーディオ情報に含まれる時に作り出される信 号サンプル・ブロック・レートに量子化雑音が低減される、請求項1記載のエン コーダ。
  7. 7.隣接する時間領域信号サンプル・ブロックを記憶する装置から更に成る装置 であって、隣接する時間領域信号サンプル・ブロック中の周波数領域変換係数が 前記非均質サブバンド量子化装置によって変換ブロック・ペアに量子化され、指 数に関連する仮数から成るブロックフローティングポイント形式で周波数領域変 換係数を表現するための装置が前記非均質サブバンド量子化装置に含まれ、前記 変換ブロック・ペア中のサブバンドに対応する各ペアによって単一の指数が共有 される、請求項1記載のエンコーダ。
  8. 8.指数に関連する仮数から成るブロック・フローティングポイント形式で周波 数領域変換係数を表現するための装置が前記非均質サブバンド量子化装置に含ま れる装置であって、該装置によって、正の非0の最有意データが0に設定され、 負の最有意データが0に設定されることで少なくとも幾つかの仮数が正規化され ることにより、正規化された仮数中の記号ビットと量有意ビットとが逆の値にな り、単一の周波数領域変換係数と特異指数とによって表現されるサブバンドに対 する冗長記号ビットが削除される、請求項1記載のエンコーダ。
  9. 9.請求項1記載のエンコーダであって、更に、前記広帯域アナログ・オーディ オ情報を時間領域信号サンプル・ブロックに標本化し、量子化するための第2の 装置と、 重み付け関数を用いて各信号サンプル・ブロックを変調するための第2の分析ウ インドウ装置と、分析ウインドウで重み付けされた時間領域信号サンプル・ブロ ックに応答して周波数領域変換係数を発生するための第2の装置であって、該分 析ウインドウで重み付けさ札た時間領域信号サンプル・ブロックに対して個別分 散変換関数を印加するための装置から成る装置と、各周波数領域変換係数を量子 化し、該量子化変換係数をサブバンドにグループ化するための、適応的ビット割 当て装置を含む第2の非均質サブバンド量子化装置と、とから成る、エンコーダ 。
  10. 10.前記分析ウインドウで重み付けされた時間領域信号サンプル・ブロックに 対して、個別分散余弦変換関数と個別分散正弦変換関数とを奇数重ね合わせ時間 領域エイリアシング消去技法に従って交互に印加することと実質的に等価の関数 を、周波数領域サブバンド成分を発生するための前記第2の装置中の個別分散変 換関数印加装置が有する、請求項9記載のエンコーダ。
  11. 11.1つのブロックが前記第1及び第2の標本化・量子化装置と前記第1及び 第2の分析ウインドウ装置との各々によってそれぞれ演算される、実質的に同時 の2つの時間領域信号サンプル・ブロックに対して同時発生的に印加されている 単一の高速フーリエ変換関数によって前記個別分散変換関数印加装置が実行され 、該変換関数によって該信号サンプル・ブロックが個別分散余弦変換・個別分散 正弦変換ブロック・ペアに演算され、前記第1及び第2の標本化及び量子化の各 々からの継続する量子化ブロックと第1及び第2の分析ウインドウ装置とが個別 分散余弦変換及び個別分散正弦変換の間を交互する、請求項10記載のエンコー ダ。
  12. 12.指数に関連する仮数から成るブロック・フローティングポイントの形式で 時間領域変換係数を表現するための装置が前記非均質サブバンド量子化装置に含 まれ、前記変換ブロック・ペア中の対応するサブバンドによって単一の指数が共 有される、請求項11記載のエンコーダ。
  13. 13.前記個別分散変換関数印加装置が、改変された個別分散余弦変換関数と実 質的に等価の関数を奇数重ね合わせ時間領域エイリアシング消去技法に従って印 加するための装置から成る、請求項1記載のエンコーダ。
  14. 14.前記分析ウインドウで重み付けられた時間領域信号サンプル・ブロック中 の信号サンプルの実数値列と複素数とを乗じて改変された信号サンプルの組を得 、改変された個別分散余弦変換関数と実質的に等価な関数を印加するための前記 装置を該改変された信号サンプルの組の実数部と虚数部とに同時発生的に印加さ れる高速フーリエ変換と共に実現することによって、変換の計算上の複雑さが低 減される、請求項13記載のエンコーダ。
  15. 15.請求項1記載のエンコーダによって符号化されたディジタル符号化広帯域 オーディオ情報を高品質で再生するためのデコーダであって、 該ディジタル出力を受け取り、該出力から前記非均質量子化変換係数を誘導する ためのフォーマット解除装置と、 該フォーマット解除された非均質量子化変換係数から複号化された周波数領域変 換係数を再構築するための直線化装置と、 周波数領域変換係数に応じて時間領域信号サンプル・ブロックを発生するための 装置であって、該周波数領域変換係数に対して逆個別分散変換関数を印加するた めの装置から成る装置と、 該時間領域信号サンプル・ブロックを変調して符号化・複号化の間で生成される ブロック境界における量子化エラーの効果を低減するための合成ウインドウ装置 であって、隣接する2つのサンプル・ブロックが重複され加算される時に、該合 成ウインドウ装置の応答特性と前記分析ウインドウ装置の応答特性との積が単位 1となるような特性を有する装置と、 前記分析ウインドウ装置及び合成ウインドウ装置の重み付け効果を消去するため の信号ブロック重複・加算装置と、 該時間領域信号をアナログ形式に転換するための時間領域信号出力装置 とから成る、デコーダ。
  16. 16.前記逆個別分散変換関数印加装置によって、前記属波数領域変換係数に対 して、改変された逆個別分散余弦変換関数と改変された逆個別分散正弦変換関数 とを交互に印加することと実質的に等価の関数が、偶数重ね合わせ時間領域エイ リアシング消去技法に従って交互に印加される、請求項15記載のデコーダ。
  17. 17.個別分散余弦変換・個別分散正弦変換ブロックペアを記憶するための装置 から更に成り、改変された逆個別分散余弦変換関数と改変された逆個別分散正弦 変換関数とを交互を印加するのと実質的に等価の逆個別分散変換関数を印加する ための前記装置が記憶された変換ブロック・ペアに対して印加されている単一の 逆高速フーリエ変換関数によって実行され、前記高速フーリエ変換関数によって 、記憶された変換ブロック・ペアの各々が隣接する時間信号サンプル・ブロック の組に演算される、請求項16記載のデコーダ。
  18. 18.個別分散余弦変換・個別分散正弦変換ブロック・ベアを記憶するための装 置から更に成り、前記逆個別分散変換関数印加装置が記憶された変換ブロック・ ペアに対して印加されている単一の逆高速フーリエ変換関数によって実行され、 前記高速フーリエ変換関数によって、記憶された変換ブロック・ペアの各々が隣 接する時間信号サンプル・ブロックの組に演算される、請求項15記載のデコー ダ。
  19. 19.前記逆個別分数変換関数印加装置によって、奇数重ね合わせ時間領域エイ リアシング消去技法に従って改変された逆個別分数余弦変換関数と実質的に等価 の関数と実質的に等価の関数が、交互に印加される、請求項15記載のデコーダ 。
  20. 20.広帯域オーディオ情報を周波数領域信号サンプル・ブロックに標本化、量 子化し、各信号サンプル・ブロックを重み付け関数を有する分析ウインドウ中で 変調し、分析ウインドウによって重み付けられた時間領域信号サンプル・ブロッ クに応じて周波数領域変換係数を発生し、各変換係数を非均質に量子化し、該非 均質量子化変換係数を伝送又は記憶に適するフォーマットを有する出力に組み立 てるエンコーダによって符号化された、ディジタル符号化広帯域オーディオ情報 を高品質で再生するためのデコーダであって、 該ディジタル出力を受け取り、該出力から前記非均質量子化変換係数を誘導する ためのフォーマット解除装置と、 該フォーマット解除された非均質量子化変換係数から複号化された周波数領域変 換係数を再構築するための直線化装置と、 周波数領域変換係数に応じて時間領域信号サンプル・ブロックを発生するための 装置であって、該周波数領域変換係数に対して逆個別分散変換関数を印加するた めの装置から成る装置と、 該時間領域信号サンプル・ブロックを変調して符号化・複号化の間で生成される ブロック境界における量子化エラーの効果を低減するための合成ウインドウ装置 であって、隣接する2つのサンプル・ブロックが重複され加算される時に、該合 成ウインドウ装置の応答特性と前記分析ウインドウ装置の応答特性との積が単位 1となるような特性を有する装置と、 前記分析ウインドウ装置及び合成ウインドウ装置の重み付け効果を消去するため の信号ブロック重複・加算装置と、 該時間領域信号をアナログ形式に転換するための時間領域信号出力装置 とから成る、デコーダ。
  21. 21.前記逆個別分散変換関数印加装置によって、前記周波数領域変換係数に対 して、改変された逆個別分散余弦変換関数と改変された逆個別分散正弦変換関数 とを交互に印加することと実質的に等価の関数が、偶数重ね合わせ時間領域エイ リアシング消去技法に従って交互に印加される、請求項20記載のデコーダ。
  22. 22.個別分散余弦変換・個別分数正弦変換ブロックベアを記憶するための装置 から更に成り、改変された逆個別分散余弦変換関数と改変された逆個別分散正弦 変換関数とを交互を印加するのと実質的に等価の逆個別分散変換関数を印加する ための前記装置が、記憶された変換ブロック・ペアに対して印加されている単一 の逆高速フーリエ変換関数によって雲行され、記憶された変換ブロック・ペアの 各々が、前記高速フーリエ変換関数によって隣接する時間信号サンプル・ブロッ クのペアに演算される、請求項21記載のデコーダ。
  23. 23.個別分散余弦変換・個別分散正弦変換ブロックベアを記憶するための装置 から更に成り、前記逆個別分散変換関数印加装置が記憶された変換ブロック・ベ アに対して印加されている単一の逆高速フーリエ変換関数によって実行され、記 憶された変換ブロック・ペアの各々が、前記高速フーリエ変換関数によって隣接 する時間信号サンプル・ブロックのペアに演算される、請求項20記載のデコー ダ。
  24. 24.前記逆個別分散変換関数印加装置によって、奇数重ね合わせ時間領域エイ リアシング消去技法に従って改変された逆個別分散余弦変換関数と実質的に等価 の関数と実費的に等価の関数が、交互に印加される、請求項20記載のデコーダ 。
  25. 25.広帯域のアナログのオーディオ情報を高品質で再生するためのエンコーダ ・デコーダであって、エンコーダ及びデコーダとから成り、該エンコーダが、該 広帯域アナログ・オーディオ情報を時間領域信号のサンプル・ブロックに標本化 し、量子化するための装置と、 重み付け関数を用いて各信号サンプル・ブロックを変調するための分析ウインド ウ装置と、 分析ウインドウで重み付けされた時間領域信号サンプル・ブロックに応答して周 波数領域変換係数を発生するための装置であって、該分析ウインドウで重み付け された時間領域信号サンプル・ブロックに対して個別分散変換関数を印加するた めの装置から成る装置と、各周波数領域変換係数を量子化し、該量子化変換係数 をサブバンドにグループ化するための、適応的ビット割当て装置を含む非均質サ ブバンド量子化装置と、非均質に量子化され、グループ化された該変換係数を伝 送又は記憶に適するフォーマットを有するディジタル出力信号に組み立てるため の装置 とから成り、該デコーダが、 該ディジタル出力を受け取り、該出力から前記非均質量子化変換係数を誘導する ためのフォーマット解除装置と、 該フォーマット解除された非均質量子化変換係数から複号化された周波数領域変 換係数を再構築するための直線化装置と、 周波数領域変換係数に応じて時間領域信号サンプル・ブロックを発生するための 装置であって、該周波数領域変換係数に対して逆個別分散変換関数を印加するた めの装置から成る装置と、 該時間領域信号サンプル・ブロックを変調して符号化・複号化の間で生成される ブロック境界における量子化エラーの効果を低減するための合成ウインドウ装置 であって、隣接する2つのサンプル・ブロックが重複され加算される時に、該合 成ウインドウ装置の応答特性と前記分析ウインドウ装置の応答特性との積が単位 1となるような特性を有する装置と、 前記分析ウインドウ装置及び合成ウインドウ装置の重み付け効果を消去するため の信号ブロック重複・加算装置と、 該時間領域信号をアナログ形式に転換するための時間領域信号出力装置 とから成るデコーダとから成る、エンコーダ・デコーダ。
  26. 26.広帯域のアナログのオーディオ情報を高品質でディジタル符号化するため の方法であって、該広帯域アナログ・オーディオ情報を時間領域信号のサンプル ・ブロックに標本化し、量子化し、分析ウインドウ中の重み付け関数を用いて各 信号サンプル・ブロックを変調し、 該分析ウインドウで重み付けされた時間領域信号サンプル・ブロックに対して個 別分散変換関数を印加することによって、分析ウインドウで重み付けされた時間 領域信号サンプル・ブロックに応答して周波数領域変換係数を発生し、 適応的割当てビットを含めて各周波数領域変換係数を非均質に量子化し、該量子 化変換係数をサブバンドにグループ化し、 非均質に量子化され、グループ化された該変換係数を伝送又は記憶に適するフォ ーマットを有するディジタル出力信号に組み立てる ことから成る、ディジタル符号化方法。
  27. 27.前記個別分散変換関数の印加が、前記分析ウインドウで重み付けされた時 間領域信号サンプル・ブロックに対して、改変された個別分散余弦変換関数と改 変された個別分散正弦変換関数とを交互に印加するのと実質的に等価の関数を奇 数重ね合わせ時間領域エイリアシング消去技法に従って印加することから成る、 請求項26記載の広帯域オーディオ情報高品質ディジタル符号化方法。
  28. 28.隣接する時間領域信号サンプル・ブロックの組を記憶することから更に成 り、改変された個別分散余弦変換関数と改変された個別分散正弦変換関数とを交 互を印加するのと実質的に等価の関数の印加が、記憶された隣接する時間領域信 号サンプル・ブロックの組に対して同時発生的に印加されている単一の高速フー リエ変換関数によって実行され、記憶された隣接する時間領域信号サンプル・ブ ロックのペアの各々が該高速フーリエ変換関数によって分散余弦変換・個別分散 正弦変換ブロック・ペアに演算される、請求項27記載の広帯域オーディオ情報 高品質ディジタル符号化方法。
  29. 29.指数に関連する仮数から成るブロック・フローティングポイントの形式で 前記変換係数が表現され、前記変換ブロック・ペア中のサブバンドに対応する各 ペアによって単一の指数が共有される、請求項28記載の広帯域オーディオ情報 高品質ディジタル符号化方法。
  30. 30.隣接する時間領域信号サンプル・ブロックの組を記憶することから更に成 り、記憶された隣接する時間領域信号サンプル・ブロックの組に対して同時発生 的に印加されている単一の高速フーリエ変換関数によって前記個別分散変換関数 印加が実行され、記憶された隣接する時間領域信号サンプル・ブロックの組の各 々が該高速フーリエ変換関数によって変換ブロック・ペアに演算される、請求項 26記載の広帯域オーディオ情報高品質デイジタル符号化方法。
  31. 31.コード・ワードのビット長が固定ビット数と前記適応的ビット割当てによ り発生される可変ビット数との合計である各変換係数に対する可変ビット長のコ ード・ワードが前記量子化によって発生され、該適応的ビット割当てでは少なく とも前記変換関数によって作り出される最も低い周波数の係数に対して適応的ビ ットが指定されないことによって、該係数に関するビット長が固定され、前記信 号サンプル・ブロックに比較して期間が長い低い周波数のスペクトル成分が前記 入力オーディオ情報に含まれる時に作り出される信号サンプル・ブロックレート に量子化雑音が低減される、請求項26記載の広帯域オーディオ情報高品質ディ ジタル符号化方法。
  32. 32.隣接する時間領域信号サンプル・ブロックを記憶することから更に成り、 前記量子化装置によって、該隣接する時間領域信号サンプル・ブロック中の周波 数領域変換係数が変換ブロック・ペアに量子化され、指数に関連する仮数から成 るブロック・フローティングポイント形式で周波数領域変換係数が表現され、前 記変換ブロック・ペア中のサブバンドに対応する各ペアによって単一の指数が共 有される、請求項26記載の広帯域オーディオ情報高品質ディジタル符号化方法 。
  33. 33.前記量子化によって、指数に関連する仮数から成るブロック・フローティ ングポイント形式で周波数領域変換係数が表現され、正の非0の最有意データが 0に設定され、負の最有意データが0に設定されることで少なくとも幾つかの仮 数が正規化されることにより、正規化された仮数中の記号ビットと最有意ビット とが逆の値になり、単一の周波数領域変換係数と特異指数とによって表現される サブバンドに対する冗長記号ビットが削除される、請求項26記載の広帯域オー ディオ情報高品質ディジタル符号化方法。
  34. 34.前記個別分数変換関数印加が、改変された個別分散余弦変換関数と実質的 に等価の関数を奇数重ね合わせ時間領域エイリアシング消去技法に従って印加す ることから成る、請求項26記載の広帯域オーディオ情報高品質ディジタル符号 化方法。
  35. 35.前記分析ウインドウで重み付けられた時間領域信号サンプル・ブロック中 の信号サンプルの実数値列と複素数とを乗じて改変された信号サンプルの組を得 、改変された個別分散余弦変換関数と実質的に等価な関数を印加するための前記 装置を該改変された信号サンプルの組の実数部と虚数部とに同時発生的に印加さ れる高速フーリエ変換と共に実現することによって、変換の計算上の複雑さが低 減される、請求項34記載の広帯域オーディオ情報高品質ディジタル符号化方法 。
  36. 36.請求項26記載の符号化方法によって符号化された符号化広帯域オーディ オ情報を高品質で再生するための複号化方法であって、 該ディジタル出力から前記非均質量子化変換係数を誘導し、 該フォーマット解除された非均質量子化変換係数から複号化された周波数領域変 換係数を再構築し、分析ウインドウで重み付けられた時間領域信号サンプル・ブ ロックに応じて時間領域信号サンプル・ブロックを発生する前記エンコーダ中の 過程の特性と逆の特性を有する過程によって、周波数領域変換係数に応じて時間 領域信号ブロックを発生し、 該時間領域信号サンプル・ブロックを変調して合成ウインドウ中での符号化・複 号化の間に生成されるブロック境界における量子化エラーの効果を低減し、隣接 する2つのサンプル・ブロックが重複され加算される時に、該合成ウインドウ装 置の応答特性と前記分析ウインドウ装置の応答特性との積が単位1となるような 特性を該合成ウインドウに持たせ、 該信号ブロックを重複し加算することによって、前記分析ウインドウ及び合成ウ インドウの重み付け効果を消去して該時間領域信号のディジタル表現を復元し、 該時間領域信号をアナログ形式に転換することから成る、複号化方法。
  37. 37.ディジタル符号化広帯域アナログ・オーディオ情報を高品質で再生するた めの複号化方法であって、該情報を周波数領域信号サンプル・ブロックに標本化 、量子化し、各信号サンプル・ブロックを重み付け関数を有する分析ウインドウ 中で変調し、分析ウインドウによって重み付けられた時間領域信号サンプル・ブ ロックに応じて周波数領域変換係数をディジタル・フィルタ・バンク中で発生し 、各変換係数を非均質に量子化し、該非均質量子化変換係数を伝送又は記憶に適 するフォーマットを有する出力にフォーマット化するエンコーダによって該情報 が符号化され、 該ディジタル出力から前記非均質量子化変換係数を誘導し、 該フォーマット解除された非均質量子化変換係数から複号化された周波数領域変 換係数を再構築し、分析ウインドウで重み付けられた時間領域信号サンプル・ブ ロックに応じて時間領域信号サンプル・ブロックを発生する前記エンコーダ中の 過程の特注と逆の特性を有する過程によって、周波数領域変換係数に応じて時間 領域信号ブロックを発生し、 該時間領域信号サンプル・ブロツクを変調して合成ウインドウ中での符号化・複 号化の間に生成されるブロック境界における量子化エラーの効果を低減し、隣接 する2つのサンプル・ブロックが重複され加算される時に、該合成ウインドウ装 置の応答特性と前記分析ウインドウ装置の応答特性との積が単位1となるような 特性を該合成ウインドウに持たせ、 該信号ブロックを重複し加算することによって、前記分析ウインドウ及び合成ウ インドウの重み付け効果を消去して該時間領域信号のディジタル表現を復元し、 該時間領域信号をアナログ形式に転換することから成る、複号化方法。
  38. 38.広帯域のアナログのオーディオ情報を高品質でディジタル符号化、複号化 するための方法であって、該アナログ信号符号化が、 該広帯域アナログ・オーディオ情報を時間領域信号のサンプル・ブロックに標本 化し、量子化し、分析ウインドウ中の重み付け関数を用いて各信号サンプル・ブ ロックを変調し、 該分析ウインドウで重み付けされた時間領域信号サンプル・ブロックに対して個 別分散変換関数を印加することによって、分析ウインドウで重み付けされた時間 領域信号サンプル・ブロックに応答して周波数領域変換係数を発生し、 適応的割当てビットを含めて各周波数領域変換係数を非均質に量子化し、該量子 化交換係数をサブバンドにグループ化し、 非均質に量子化され、グループ化された該変換係数を伝送又は記憶に適するフォ ーマットを有するディジタル出力信号に組み立てる ことで行われ、 該ディジタル出力復号化が、 該ディジタル出力から前記非均質量子化変換係数を誘導し、 該フォーマット解除された非均質量子化変換係数から複号化された周波数領域変 換係数を再構築し、分析ウインドウで重み付けられた時間領域信号サンプル・ブ ロックに応じて時間領域信号サンプル・ブロックを発生する前記エンコーダ中の 過程の特性と逆の特性を有する過程によって、周波数領域変換係数に応じて時間 領域信号ブロックを発生し、 該時間領域信号サンプル・ブロックを変調して合成ウインドウ中での符号化・複 号化の間に生成されるブロック境界における量子化エラーの効果を低減し、隣接 する2つのサンプル・ブロックが重複され加算される時に、該合成ウインドウ装 置の応答特性と前記分析ウインドウ装置の応答特性との積が単位1となるような 特性を該合成ウインドウに持たせ、 該信号ブロックを重複し加算することによって、前記分析ウインドウ及び合成ウ インドウの重み付け効果を消去して該時間領域信号のディジタル表現を復元し、 該時間領域信号をアナログ形式に転換することで行われる、符号化・複号化方法 。
JP2503825A 1989-01-27 1990-01-29 高品質オーディオ用低ビット伝送速度変換コーダ、デコーダ、及びエンコーダ・デコーダ Expired - Lifetime JP2821713B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US30371489A 1989-01-27 1989-01-27
US43986889A 1989-11-20 1989-11-20
US303,714 1989-12-29
US439,868 1989-12-29

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP10158415A Division JP3093178B2 (ja) 1989-01-27 1998-05-21 高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ

Publications (2)

Publication Number Publication Date
JPH04504192A true JPH04504192A (ja) 1992-07-23
JP2821713B2 JP2821713B2 (ja) 1998-11-05

Family

ID=26973611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2503825A Expired - Lifetime JP2821713B2 (ja) 1989-01-27 1990-01-29 高品質オーディオ用低ビット伝送速度変換コーダ、デコーダ、及びエンコーダ・デコーダ

Country Status (10)

Country Link
EP (5) EP0511692A3 (ja)
JP (1) JP2821713B2 (ja)
AT (4) ATE160464T1 (ja)
AU (2) AU631404B2 (ja)
BR (1) BR9007063A (ja)
DE (4) DE69026278T3 (ja)
DK (3) DK0560413T4 (ja)
ES (3) ES2085680T5 (ja)
SG (3) SG48247A1 (ja)
WO (1) WO1990009022A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002033831A1 (fr) * 2000-10-19 2002-04-25 Nec Corporation Codeur de signaux audio
US7016502B2 (en) 2000-12-22 2006-03-21 Sony Corporation Encoder and decoder
USRE42745E1 (en) 2001-08-09 2011-09-27 Sharp Kabushiki Kaisha Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583962A (en) * 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
US5463424A (en) * 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
JP3131542B2 (ja) * 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
JP3186413B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JP3521596B2 (ja) * 1996-01-30 2004-04-19 ソニー株式会社 信号符号化方法
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
KR100424036B1 (ko) * 1996-03-19 2004-07-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 시간영역얼라이싱소거를이용한효율적인기수스택단측대역필터뱅크를구비한분해/합성필터링시스템
KR100378790B1 (ko) * 1996-04-23 2003-05-01 엘지전자 주식회사 서브밴드양자화레벨디코딩장치
KR100223169B1 (ko) * 1996-06-14 1999-10-15 윤종용 펄스부호변조된 디지털 오디오신호의 기록 및 재생을 위한 시스템
US5892746A (en) * 1996-06-15 1999-04-06 Samsung Electronics Co., Ltd. System for recording and/or reproducing a pulse code modulation digital audio signal
JP3092653B2 (ja) * 1996-06-21 2000-09-25 日本電気株式会社 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
TW301103B (en) * 1996-09-07 1997-03-21 Nat Science Council The time domain alias cancellation device and its signal processing method
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US6081783A (en) * 1997-11-14 2000-06-27 Cirrus Logic, Inc. Dual processor digital audio decoder with shared memory data transfer and task partitioning for decompressing compressed audio data, and systems and methods using the same
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
US6665409B1 (en) 1999-04-12 2003-12-16 Cirrus Logic, Inc. Methods for surround sound simulation and circuits and systems using the same
US6356871B1 (en) 1999-06-14 2002-03-12 Cirrus Logic, Inc. Methods and circuits for synchronizing streaming data and systems using the same
US6349285B1 (en) 1999-06-28 2002-02-19 Cirrus Logic, Inc. Audio bass management methods and circuits and systems using the same
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CN101589623B (zh) 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
EP2260487B1 (en) * 2008-03-04 2019-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mixing of input data streams and generation of an output data stream therefrom
KR100940532B1 (ko) * 2009-09-28 2010-02-10 삼성전자주식회사 저비트율 복호화방법 및 장치
CN103548080B (zh) * 2012-05-11 2017-03-08 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
CN107403624B (zh) 2012-05-18 2021-02-12 杜比实验室特许公司 用于音频信号的动态范围调整及控制的方法和设备
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
US10438597B2 (en) 2017-08-31 2019-10-08 Dolby International Ab Decoder-provided time domain aliasing cancellation during lossy/lossless transitions

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3171990D1 (en) * 1981-04-30 1985-10-03 Ibm Speech coding methods and apparatus for carrying out the method
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
GB8330885D0 (en) * 1983-11-18 1983-12-29 British Telecomm Data transmission
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
DE3506912A1 (de) 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
IL76283A0 (en) * 1985-09-03 1986-01-31 Ibm Process and system for coding signals
DE3629434C2 (de) * 1986-08-29 1994-07-28 Karlheinz Dipl Ing Brandenburg Digitales Codierverfahren
DE3639753A1 (de) 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
IEEE TRANSACTIONS ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING=1979 *
IEEE TRANSACTIONS ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING=1986 *
SPEECH SOMMUNICATION=1987 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002033831A1 (fr) * 2000-10-19 2002-04-25 Nec Corporation Codeur de signaux audio
US7343292B2 (en) 2000-10-19 2008-03-11 Nec Corporation Audio encoder utilizing bandwidth-limiting processing based on code amount characteristics
US7016502B2 (en) 2000-12-22 2006-03-21 Sony Corporation Encoder and decoder
USRE42745E1 (en) 2001-08-09 2011-09-27 Sharp Kabushiki Kaisha Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices
USRE44138E1 (en) 2001-08-09 2013-04-09 Sharp Kabushiki Kaisha Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices
USRE44234E1 (en) 2001-08-09 2013-05-21 Sharp Kabushiki Kaisha Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices
USRE44285E1 (en) 2001-08-09 2013-06-11 Sharp Kabushiki Kaisha Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices
USRE44319E1 (en) 2001-08-09 2013-06-25 Sharp Kabushiki Kaisha Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices
USRE44891E1 (en) 2001-08-09 2014-05-13 Sharp Kabushiki Kaisha Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices
USRE46370E1 (en) 2001-08-09 2017-04-18 Dolby Laboratories Licensing Corporation Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices
USRE47258E1 (en) 2001-08-09 2019-02-26 Dolby Laboratories Licensing Corporation Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices
USRE47277E1 (en) 2001-08-09 2019-03-05 Dolby Laboratories Licensing Corporation Systems and methods for reduced bit-depth processing in video-related data with frequency weighting matrices

Also Published As

Publication number Publication date
EP0560413A3 (ja) 1994-05-04
AU3373693A (en) 1993-04-22
SG48247A1 (en) 1998-04-17
DK0560413T4 (da) 2002-06-17
EP0514949B1 (en) 1997-11-19
EP0511692A2 (en) 1992-11-04
ATE100235T1 (de) 1994-01-15
ATE150571T1 (de) 1997-04-15
ATE136147T1 (de) 1996-04-15
ES2109296T3 (es) 1998-01-16
DK0560413T3 (da) 1996-04-22
EP0455738B2 (en) 2007-04-04
DE69030266D1 (de) 1997-04-24
DE69006011T3 (de) 2007-08-23
AU655535B2 (en) 1994-12-22
DE69026278D1 (de) 1996-05-02
EP0455738B1 (en) 1994-01-12
EP0560413B1 (en) 1996-03-27
ES2085680T5 (es) 2002-10-16
DK0514949T3 (da) 1998-07-27
JP2821713B2 (ja) 1998-11-05
SG49891A1 (en) 1998-06-15
EP0511692A3 (en) 1993-01-27
ES2099185T3 (es) 1997-05-16
EP0514949A2 (en) 1992-11-25
DE69031737T2 (de) 1998-04-09
AU631404B2 (en) 1992-11-26
BR9007063A (pt) 1991-10-08
DE69030266T2 (de) 1997-08-14
SG47111A1 (en) 1998-03-20
DE69026278T3 (de) 2002-08-08
WO1990009022A1 (en) 1990-08-09
DE69031737D1 (de) 1998-01-02
EP0513860A2 (en) 1992-11-19
DE69026278T2 (de) 1996-11-14
EP0560413A2 (en) 1993-09-15
EP0514949A3 (en) 1993-02-03
EP0513860A3 (en) 1993-01-27
ATE160464T1 (de) 1997-12-15
EP0455738A1 (en) 1991-11-13
DE69006011T2 (de) 1994-08-18
EP0513860B1 (en) 1997-03-19
ES2085680T3 (es) 1996-06-01
EP0560413B2 (en) 2002-05-15
AU5159690A (en) 1990-08-24
DK0513860T3 (da) 1997-08-18
DE69006011D1 (de) 1994-02-24

Similar Documents

Publication Publication Date Title
JPH04504192A (ja) 高品質オーディオ用低ビットレート変換コーダ、デコーダ、及びエンコーダ・デコーダ
JP2811369B2 (ja) 高品質オーディオ用短時間遅延変換コーダ、デコーダ、及びエンコーダ・デコーダ
US5479562A (en) Method and apparatus for encoding and decoding audio information
US5222189A (en) Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5230038A (en) Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
KR100193353B1 (ko) 적응블록길이, 적응변환, 적응윈도우 변환코더, 디코더 및 고품질 오디오용 인코더/디코더
US5752225A (en) Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
Thiagarajan et al. Analysis of the MPEG-1 Layer III (MP3) algorithm using MATLAB
JP3093178B2 (ja) 高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ
Spanias et al. Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080904

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090904

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100904

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100904

Year of fee payment: 12