JP3297051B2 - 適応ビット配分符号化装置及び方法 - Google Patents

適応ビット配分符号化装置及び方法

Info

Publication number
JP3297051B2
JP3297051B2 JP50475395A JP50475395A JP3297051B2 JP 3297051 B2 JP3297051 B2 JP 3297051B2 JP 50475395 A JP50475395 A JP 50475395A JP 50475395 A JP50475395 A JP 50475395A JP 3297051 B2 JP3297051 B2 JP 3297051B2
Authority
JP
Japan
Prior art keywords
masking threshold
allocation
signal
bits
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP50475395A
Other languages
English (en)
Other versions
JPH09500503A (ja
Inventor
デビットソン、グランド・アレン
トッド、クレグ・キャンベル
ディビス、マーク・フランクリン
リンク、ブライアン・ディビット
フィルダー、ルイス・ダン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/145,975 external-priority patent/US5632003A/en
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JPH09500503A publication Critical patent/JPH09500503A/ja
Application granted granted Critical
Publication of JP3297051B2 publication Critical patent/JP3297051B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は概して、知覚モデルと、オーディオ信号のよ
うな情報の、知覚を基本とする低ビットレート符号化及
び復号に関する。更に詳しく言うと、本発明は、電算上
効率的な高性能知覚モデルに関する。同知覚モデルは、
高品質の低ビットレート符号化システムで有用な符号化
された情報の適応ビット配分及び量子化のための基礎を
提供することができる。
発明の背景 オーディオ及びビデオの信号処理分野の関係者の間で
は、信号を表すのに必要な情報の量を信号の知覚上の質
を損なわずに最少化することについて大きな関心があ
る。情報の要件を低減させることによって、信号から要
求される通信チャネル及び記憶媒体への情報容量要件は
低下する。
例えば、オーディオの振幅の圧縮又はダイナミックレ
ンジの低減を施したアナログ信号は、圧縮を施してない
信号に比べて低い情報容量要件しか要しない。より少な
い2進ビットで符号化されたディジタル信号は、同じ信
号をより多くの数のビットを用いて表す符号化信号より
も低い情報容量要件しか要しない。勿論、信号の知覚上
の質を劣化させずに実現できる情報の低減量には制約が
ある。以下の論考の大部分は特にディジタル技法に向け
られているが、対応する考察はアナログ技法にも同様に
適用されることを理解すべきである。
ディジタル信号の各サンプルを表すのに使用可能なビ
ットの数によってディジタル信号表現の精度が確定され
る。ビットレートが低いことは、各サンプルを表すのに
より少ないビットしか使用できないことを意味する。し
たがって、ビットレートが低いことは、量子化の精度が
低下するか或いは量子化エラーが増大することを意味す
る。多くの用途において、量子化エラーは量子化雑音と
して顕れ、もしエラーが十分な大きさになると、量子化
雑音が符号化信号の本質を劣化させることになる。
種々の「分割帯域」符号化技法では、種々の心理知覚
効果を利用することによって知覚上の質の劣化が一切な
い状態で情報要件を低減しようと試みている。例えば、
オーディオ用では、人の聴覚システムは、可変の中心周
波数と、中心周波数の関数として変化する帯域幅とを具
える高度に非対称に調整されたフィルタの特性に似た周
波数分析特性を示す。人の聴覚システムの別個の音を検
出する能力は、一般に、音と音との間の周波数の差が大
きくなるにつれて高まるが、人の聴覚システムの分解能
は、上述のフィルタの帯域幅よりも狭い周波数差に対し
ては実質的に一定である。したがって、人の聴覚システ
ムの周波数分解能は、オーディオスペクトル全体にわた
ってこれらのフィルタの帯域幅に従って変化する。かか
る聴覚フィルタの有効帯域幅は、「臨界帯域」と呼ばれ
る。臨界帯域内の優勢な信号で該臨界帯域内の他の信号
の可聴度が阻げられる度合いは、臨界帯域内の優勢な信
号で該臨界帯域外の周波数の他の信号の可聴度が阻げら
れる度合いよりも一層大きい。これについては、おおむ
ね、サン・フランシスコのマッグロウヒル社1988年発
行、K・ブレア・ベンソン編の「オーディオ・エンジニ
アリング・ハンドブック」の1.40ページから1.42ページ
までと、4.8ページから4.10ページまで(the Audio Eng
ineering Handbook,K.Blair Bensoned.,McGraw−Hill,S
an Francisco,1988,pages 1.40−1.42 and 4.8−4.10)
を参照のこと。
有用な信号帯域幅を人の聴覚システムの臨界帯域に近
似の帯域幅を具える周波数帯域に分割するオーディオ分
割帯域符号化技法は、広帯域技法よりも音響心理学的効
果を一層良く利用することができる。概念的には、この
ような分割帯域符号化技法は一般的に、信号帯域幅をフ
ィルタバンクで分割し、信号の劣化が丁度聴取不可能に
なる程度まで各フィルタバンクを通過する信号の情報要
件を低減し、逆の過程を通して原信号の複製を再構築す
ることから成る。このような技法として、サブバンド符
号化、及び変換符号化の2つがある。サブバンド符号器
及び変換符号化器では、結果の人工物が1つ又はそれ以
上のスペクトル成分で音響心理学的にマスキングされる
特定の周波数帯域で情報要件を低減することができるの
で、符号化信号の本質を劣化させない。
サブバンド符号器(コーダ)では、アナログ又はディ
ジタルフィルタでフィルタバンクを実行するのに種々の
技法の何れをも用いることができる。ディジタル・サブ
バンド符号器では、信号サンプルから成る入力信号はデ
ィジタルフィルタのバンクを通過する。フィルタバンク
のそれぞれのフィルタを通過した各サブバンド信号は、
該当するサブバンドフィルタの帯域幅に従ってさらにサ
ンプリングされる。符号器では、量子化雑音が聴取不可
能になるのに丁度足りる程度のビットを用いて各サブバ
ンド信号の量子化が行われる。各サブバンド信号は、入
力信号スペクトルの一部を表すサンプルから成る。
変換符号器では、アナログ又はディジタルフィルタの
フィルタバンクを実行するのに、いわゆる時間領域対周
波数領域変換の種々の技法の何れをも用いることができ
る。変換から得られる個別の係数、又はグループ化され
た2つ又はそれ以上の隣接する係数によって、個々の変
換係数帯域幅の合計である実効帯域幅を有する「サブバ
ンド(小帯域)」が決定される。サブバンドの中の係数
によって、それぞれのサブバンド信号が構成される。符
号器では、量子化雑音が聴取不可能になるのに丁度足り
る程度のビットを用いて各サブバンド信号の量子化が行
われる。
以下の論考の全体にわたって、「分割帯域符号器」と
いう術語は、サブバンド符号器、変換符号器、及び有用
な信号帯域幅の部分に動作するその他の分割帯域符号化
に関するものとする。「サブバンド」という術語は、真
正のサブバンド符号器、変換符号器、及びその他の技法
の何れで実行されるものであっても、有用な信号帯域幅
のこれらの部分に関するものとする。
上で論考したように、音響心理学原理を利用する多く
のディジタル分割帯域符号器では、フィルタバンクを入
力信号に適用してサブバンド情報を発生させ、サブバン
ド情報の各要素を、結果の量子化雑音が音響心理学的マ
スキング効果により聴取不可能になるように要素に割り
当てられる相当数のビットを用いて量子化し、量子化情
報を伝送又は記憶に適する形式にアセンブルすることに
よって、高品質の符号化が低いビットレートで行われ
る。
相補形のディジタル分割帯域復号器では、量子化情報
を符号化信号から抽出し、量子化情報を逆量子化してサ
ブバンド情報を得、逆フィルタバンクをサブバンド情報
に適用して原入力信号のレプリカを発生させることによ
って、原入力信号のレプリカが復元される。
サブバンド情報の各要素を量子化するのに割当てられ
るビットの数は、復号器でサブバンド情報を正確に逆量
子化できるために使用可能なものでなければならない。
「順方向適応」符号器では、配分関数を用いて配分値を
確定し、これらの配分値を「副次的情報」として復号器
に明示的に伝える。「逆方向適応」では、選択された情
報に配分関数を適用して配分値を確定し、配分値を明示
的に伝えるのではなく、符号化信号中の選択情報を伝え
る。逆方向適応復号器では、符号化信号から抽出される
選択情報に配分関数を適用することによって、配分値が
再確定される。
概して言えば、精巧な心理知覚モデルに基づく複合配
分関数では、より単純なモデルに基づく複合度の低い配
分関数で確定される配分値よりも低いビットレートで、
等価の本質を有する符号化の質を達成する配分値を確定
することができる。したがって、実際的に実行できる限
度一杯に精巧なモデルに基づく配分関数を使用すること
が望ましい。
人の聴覚機構のかなり精巧な1つのモデルは、1979年
12月のアメリカ音響学会誌の1647ページから1652ページ
のシュレーダ、アタル、及びホールの論文、「人の耳の
マスキング特性の利用によるディジタル音声符号器の適
正化」(Schroeder,Atal and Hall,“Optimizing Digit
al Speech Coder by Exploiting Masking Properties o
f Human Ear"J.Acoust.Soc.Am.,December 1979,pp.1647
−1652)に記述されている。このモデルは、(1)入力
信号の短時間スペクトル分析を短時間フーリエ変換を適
用して行い、(2)結果のスペクトル係数を臨界帯域x
にマッピングすることにより入力信号の臨界帯域密度を
得、(3)臨界帯域密度をバシラー膜の「拡散関数」で
たたみ込むことによりバシラー膜の「刺激パターン」を
発生させることから成る。このモデルは、入力信号と、
量子化エラーを表す雑音信号とに適用されて、「信号刺
激パターン」と「雑音刺激パターン」とが、それぞれ発
生される。入力信号と雑音信号の音の大きさは、それぞ
れの刺激パターンの積分関数によって計算される。マス
キングしきい値以下に刺激パターンが下がる入力信号及
び雑音信号の音の大きさはゼロ、すなわち聴取不可能で
ある。マスキング関数は、信号刺激パターンと、マスキ
ングのしきい値を決定する「感度関数」との積から得ら
れる。符号化性能の客観的尺度は、雑音信号の音の大き
さを入力信号の音の大きさで除して得られる比である。
この数学的モデルは、直截的であり、ほぼ5kHz以下のス
ペクトル・エネルギーに関してはかなりの良い結果を提
供するが、計算する上では力の集約を要する。
シュレーダのモデルに類似に精巧な知覚モデルに基づ
く複雑な配分関数を用いる変換符号器の例は、1988年2
月の電気・電子技術者学会誌の通信の選択された分野、
第6巻、第2号の314ページから323ページにジョンスト
ン(Johnston,IEEE J.Selected Areas in Comm.,vol.6,
no.2,February 1988,pp.314−323)によって叙述されて
いる。この例によれば、マスキングしきい値は、以下の
手順で計算される。すなわち、(1)入力信号の臨界帯
域分析を行い、(2)マトリックス乗算を用いて、シュ
レーダの拡散関数を臨界帯域スペクトルに適用し、
(3)音のマスキングしきい値と雑音のマスキングしき
い値の重み付け合計を計算することによって雑音のマス
キングしきい値を推定し、(4)推定しきい値を本質的
に逆たたみ込み又は「再正規化」することによってバー
ク領域のしきい値を得、(5)聴覚のしきい値を考慮す
ることで計算される。しきい値の重み付け合計は、入力
信号スペクトルの平坦さの尺度から計算される「音の係
数」αに基づく。マトリックス乗算、音の係数、及びし
きい値のバーク領域への再正規化は、総てこの開示され
ている符号器の計算の集約度に寄与している。
逆方向適応符号器・復号器システムの1つの実施例に
おいては、符号器によって、入力信号スペクトルの包絡
線の推定値が準備され、配分関数を包絡線推定値に適用
することによって配分値が推定され、包絡線推定値の要
素を拡大縮小因子として用いて信号情報が拡大縮小さ
れ、拡大縮小された信号情報が確定配分値に従って量子
化され、量子化情報及び包絡線推定値が符号化信号にア
センブルされる。逆方向適応復号器では、量子化情報及
び包絡線推定値が符号化信号から抽出され、符号器で用
いられたのと同じ配分関数を包絡線推定値に適用するこ
とによって配分値が確定され、量子化情報が逆量子化さ
れ、信号情報の拡大縮小が反転される。拡大縮小は、量
子化に使用可能な限られた数のビットで表すことのでき
る情報のダイナミックレンジを増大させるために用いら
れる。逆方向適応符号器・復号器システムの開示例とし
て、米国特許第4,790,016号及び米国特許第5,109,417号
の2つがある。これらの特許の全体は、本明細書に引照
されている。
逆方向適応技法は多くの低ビットレート符号化システ
ムにおいて魅力的である。何故ならば、明示的な配分値
を受け渡すのにビットを要しないからである。復号器で
は、符号化信号から抽出される情報に配分関数を適用す
ることによって配分値が再現される。
都合の悪いことに、逆方向適応復号器では、復号器で
用いられたのと同一、或いは少なくとも同等の配分関数
を用いなければならない。さもなければ、復号器での正
確な逆量子化は保証されない。その結果、復号器の複雑
さ又は実行費用は、符号器の複雑さと実行費用と似たも
のとなる。復号器の複雑さに係る制約は通常、総て、符
号器及び復号器の両方の配分関数の複雑さに係る制約と
なり、それにより、符号器・復号器システムの総合的性
能を制限することになる。復号器への実際的な考慮が原
因して、多くの逆方向適応符号化システムでは、シュレ
ーダらが叙述しているような計算集約型のモデルに基づ
く配分関数を利用することができない。
順方向適応技法は、多くの高品質符号化システムにお
いて魅力的である。何故ならば、復号器では、配分値を
確定するのに配分関数を動作させる必要がないからであ
る。順方向適応復号器では、計算上の複雑さがより少な
く、符号器で行われる配分関数への制約を一切課する必
要がない。これに加えて、改良型の配分関数を、現存の
復号器との両立性を維持しながら、順方向適応符号化シ
ステムの符号器に組み込むことができる。符号器で用い
る配分関数は、設計上の独自の選択の結果であっても構
わない。
符号器で配分関数を改良する能力を持つことは重要な
意味がある。信号符号化及び信号処理の技術が進歩する
につれて、ますます精巧な配分関数が経済的にも実際的
になってきている。配分関数の精巧さを増大させること
によって、所与の信号品質に対してビットレートを下げ
るか、或いはまた、所与のビットレートに対して信号品
質を上げることができる。
しかし、この利点にもかかわらず、順方向適応符号化
システムは多くの低ビットレート用途には適さないこと
がある。何故ならば、順方向適応符号化システムでは、
副次情報を伝達するのに極めて多数のビットを必要とす
るからである。概して、配分関数でより狭い帯域に、そ
の結果、より多数の帯域にスペクトルを分割することで
符号化性能を向上させようとすると、副次情報を伝達す
るのに一層多くのビットが必要となる。更に、この副次
情報を搬送するのに必要なビットの数で符号化情報の大
部分が表されることになり、改良された符号化技法で符
号化信号の残りの部分を搬送するのに必要なビットの数
が減ってしまう。
したがって、符号化システムを低い費用で実行するの
に適した効率的な配分関数の基礎を提供できる、計算を
効率的にする精巧な知覚モデルの開発が望まれている。
また、符号化信号中に多くのオーバーヘッドを生じさせ
ることなく明示的な配分値を搬送するように配分関数を
改良することについても望まれている。
効率的な知覚モデルはまた、例えば、上で論考したよ
うな分割帯域符号化システムを客観的に測定することの
ような他の用途にも用いることができる。
発明の概要 本発明の目的は、計算的に有効かつ精巧な知覚モデル
に備えることである。
本発明の目的は、低ビットレート高品質符号化・復号
のシステム及び方法で用いるのに適した、有効な高性能
配分関数に備えることである。
オーディオ符号器の第1実施例においては、サブバン
ド情報を発生させるために入力信号は複数のサブバンド
に分割され、サブバンド情報は配分関数で確定される配
分値に従って量子化され、量子化されたサブバンド情報
は伝送又は記憶に適する符号化された信号にアセンブル
される。配分関数は、マスキングしきい値に基づく音響
心理学的原理に従って配分値を確定する。マスキングし
きい値は、入力信号のパワースペクトル密度(PSD)を
推定し、拡散関数をPSDに適用することによって刺激パ
ターン、即ち、励起パターンを発生させ、音響心理学的
マスキングを達成するのに十分な周波数依存信号対雑音
比(SNR)オフセット(偏差)と等しい量だけ励起パタ
ーンを調整し、調整されたパターンのレベルを聴覚のし
きい値と比較し、2つのうち大きい方と等しいマスキン
グしきい値を発生させることによって確定される。拡散
関数は、1つ又はそれ以上の有限インパルス応答(FI
R)無限インパルス応答(IIR)フィルタを適用すること
によって実行される。
逆方向適応符号化システムにおいてPSDは、同様に符
号化された信号にアセンブルされる情報から推定され
る。例えば、PSDはスペクトル包絡線から得られるスケ
ーリング(縮尺)因子から推定することができる。順方
向適応符号化システムにおいてPSDは、符号化信号にア
センブルされる情報、符号化信号にアセンブルされない
情報から推定することができる。例えば、たとえ高解像
度包絡線が符号化された信号に含まれていなくとも、PS
Dは入力信号の高解像度包絡線から推定することができ
る。
特定の実行例においてサブバンド情報は、1組の量子
化器から選択される量子化器を用いて量子化される。当
該組の量子化器は、量子化レベルの数、対称又は非対称
量子化関数の用途、線形又は非線形量子化関数の用途、
予備量子化ディザーの用途及び振幅、極小振幅信号に対
する保留された「スモール・ゼロ」量子化レベルの用途
の面で互いに異なる。符号化システムは、例えば、ディ
ザー成分が信号の振幅と同等程度若しくはそれより大き
い振幅有するので予備量子化ディザーが用いられないこ
とを示すためにスモール・ゼロ量子化レベルを用いるこ
とができる。
別の実行例においてサブバンド情報の配分値は、サブ
バンド情報の振幅及びマスキングしきい値のそれぞれの
部分間の差に応答して確定される。サブバンド情報の配
分値は、この差に比例して確定されるか、ルックアップ
(参照用)テーブルから確定され得る。
符号器の第2実施例において配分関数の結果に影響す
る1つ又はそれ以上のパラメータは、入力信号、サブバ
ンド情報において検出される特性に応答して改変され
る。例えば、上記SNRオフセットは、総合的な符号化品
質に影響させるように改変され得る。改変されたパラメ
ータの指示を含む副次情報は、符号化された信号にアセ
ンブルされる。
第2実施例のもう1つの実行例において改変されたパ
ラメータを用いた結果生じる改変された配分値は、明示
的な配分値として符号化された信号にアセンブルされ
る。
符号器の更なる実施例が可能であり、それには上記2
実施例の組み合わせを組入れた実施例等が含まれる。更
に、上記特定実行例の各種の組み合わせが可能である。
オーディオ復号器の第1実施例においては、量子化さ
れたサブバンド情報は符号化された信号から抽出され、
量子化されたサブバンド情報は配分関数で確定される配
分値に従って逆量子化され、出力信号は逆量子化された
サブバンド情報に応答して発生される。配分関数は、マ
スキングしきい値に基づく音響心理学的原理に従って確
定される。マスキングしきい値は、符号化された信号で
表される原入力信号のPSD推定値を入手し、PSDに拡散関
数を適用することによって励起パターンを発生させ、音
響心理学的マスキングを達成するのに十分なSNRオフセ
ットと等しい量だけ励起パターンを調整し、調整された
パターンのレベルを聴覚しきい値と比較し、2つのうち
大きい方と等しいマスキングしきい値を発生させること
によって確定される。拡散関数は、1つ又はそれ以上の
FIRフィルタ又はIIRフィルタを適用することによって実
行される。
逆方向適応符号化システムにおいてPSDは、符号化さ
れた信号から抽出されるサブバンド情報の振幅、パワー
測定値から推定することができる。しかし、順方向適応
符号化システムにおいて復号器は、例示的な配分値が符
号化された信号で送られるので概して何らの配分関数も
用いられない。
オーディオ符号器の第1実施例につき論じられた上記
実行例の特徴は、復号器のこの第1実施例にも組入れら
れ得る。
復号器の第2の実施例においては、配分関数の結果に
影響する1つ又はそれ以上のパラメータは、符号化信号
から抽出される。もう1つの実行例においては、改変さ
れた配分値を表す明示的配分値は、符号化された信号か
ら抽出される。
復号器の更なる実施例が可能であり、それには上記2
つの実施例の組み合わせを組入れた実施例等が含まれ
る。更に、上記特定実行例の各種の組み合わせが可能で
ある。
ハイブリッド適応配分を用いる符号化システムにおい
て副次情報は、改変配分値、改変パラメータのみを伝送
し得る。符号器及び復号器にとって既知のすべての配分
関数は、復号器に基本的な配分値を与える。副次情報
は、符号器で用いられるものと同一配分値を得るために
要する基本的な配分値の調整を与える。このように、符
号器の配分関数は、既存の復号器との両立性を失うこと
なく変更することが可能で、符号器と復号器の間の両立
性を維持するために副次情報で必要とされるビット数が
低減され得る。
本発明は、幾つかの技法の任意のものでフィルタバン
クを実行する分割帯域符号器で用いることができる。人
の聴覚システムの臨界帯域幅に相応する帯域幅を有する
サブバンドの使用によって音響心理学的効果の大幅な利
用が可能になるが、本発明の多様な局面はそれに限定さ
れないことを理解すべきである。したがって、本明細書
で使用する「サブバンド」の術語等は、入力信号の有用
な帯域幅内の1つ又はそれ以上の周波数帯域に関するも
のであると理解すべきである。
本発明及びその好ましい実施例の種々の特徴は、以下
の論考及び添付図面を参照することによってより良く理
解されるであろう。論考及び添付図面においては、同じ
数字は多くの数字における同じ要素を示す。以下の論考
と図面の内容は、例として説明しているだけであり、本
発明の範囲に対する制約を表すものではないことを理解
すべきである。
図面の簡単な説明 図1は、順方向適応配分を組み込む符号器・復号器シ
ステムにおける符号器の1つの実施例を表す構成図であ
る。
図2は、順方向適応配分を組み込む符号器・復号器シ
ステムにおける復号器の1つの実施例を表す構成図であ
る。
図3は、順方向適応配分を組み込む符号器・復号器シ
ステムにおける符号器のもう1つの実施例を表す構成図
である。
図4は、逆方向適応配分を組み込む符号器・復号器シ
ステムにおける符号器の1つの実施例を表す構成図であ
る。
図5は、逆方向適応配分を組み込む符号器・復号器シ
ステムにおける復号器の1つの実施例を表す構成図であ
る。
図6は、ハイブリッド適応配分を組み込む符号器・復
号器システムにおける符号器の1つの実施例を表す構成
図である。
図7は、ハイブリッド適応配分を組み込む符号器・復
号器システムにおける復号器の1つの実施例を表す構成
図である。
図8は、刺激パターンを効率的に得ることのできる過
程の実施例を表す構成図である。
図9aから図9cまでは、図8に示す構造に組み込むこと
のできる単極フィルタのインパルス応答の仮想図であ
る。
図9dは、図9aから図9cまでに示すインパルス応答を有
するフィルタから成る図8の実施例の合成インパルス応
答の仮想図である。
図10aは、単極であって1つ又はそれ以上のゼロを有
するフィルタに関するインパルス応答の仮想図である。
図10bは、図8に示す実施例に類似であるが、2つの
フィルタのみから成り、2つのフィルタの1つが図10a
に示すインパルス応答を有する、実施例の合成インパル
ス応答の仮想図である。
発明の実行モード 順方向適応配分 図1には、順方向適応配分を組み込む符号器・復号器
システムで用いられる分割帯域符号器の1実施例の基本
的構造が示されている。フィルタバンク102によって、
通路100から受け取られる入力信号に応答してサブバン
ド情報が発生される。配分関数110によって、入力信号
に応答して配分値が確定され、配分値が通路111に沿っ
て量子化装置104及びフォーマッタ106に受け渡される。
量子化装置104によって、フィルタバンク102から受け取
られるサブバンド情報が、配分値に応答して適用される
量子化関数を用いて量子化され、フォーマッタ106によ
って、量子化サブバンド情報及び配分値が、伝送又は記
憶に適するフォーマットを有する符号化信号にアセンブ
ルされる。符号化信号は、通路108に沿って望みどおり
に伝送チャネル又は記憶装置に受け渡される。
図2には、順方向適応配分を組み込む符号器・復号器
システムで用いられる分割帯域復号器の1実施例の基本
的構造が示されている。デフォーマッタ202によって、
量子化情報及び配分値が、通路200で受け取られる符号
化信号から抽出される。配分値は、通路211に沿って逆
量子化装置204に受け渡される。逆量子化装置204によっ
て、サブバンド情報が、デフォーマッタ202から受け取
られる量子化情報を配分値に応答して適用される逆量子
化関数を用いて逆量子化することで発生される。逆フィ
ルタバンク206によって、出力信号が通路208に沿って、
逆量子化装置204から受け取られる逆量子化サブバンド
情報に応答して発生される。
符号器及び復号器の代替的な実施例が可能である。例
えば、図3に示すように、順方向適応符号器によって、
フィルタバンク102で発生されるサブバンド情報に応答
して配分値を確定することができる。図には示していな
いが、もう1つの実施例においては、配分値を、入力信
号及びサブバンド情報の両方に応答して確定することが
できる。
上で論考したように、配分値は符号化信号の中に明示
的に伝えられるので、順方向適応符号器の配分関数は、
現存の順方向適応復号器との両立性を犠牲にすることな
く変更することができる。符号化信号のフォーマットだ
けは保存されなければならない。
逆方向適応配分 図4には、逆方向適応配分を組み込む符号器・復号器
システムで用いられる分割帯域符号器の1実施例の基本
的構造が示されている。フィルタバンク102によって、
通路100から受け取られる入力信号に応答してサブバン
ド情報が発生される。変換器112によって、Xワード及
びYワードから成るサブバンド情報の表現が発生され
る。Xワードは、通路113に沿って、配分関数110とフォ
ーマッタ106とに入力として受け渡される。配分関数110
によって、配分値が、Xワードに応答して確定され、量
子化装置104に受け渡される。量子化装置104によって、
量子化情報が、通路115から受け取られるYワードを配
分値に応答して適用される量子化関数を用いて逆量子化
することで発生され、フォーマッタ106によって、量子
化及びXワードが、伝送又は記憶に適するフォーマット
を有する符号化信号にアセンブルされる。符号化信号
は、通路108に沿って望みどおりに伝送チャネル又は記
憶装置に伝えられれる。
図5には、逆方向適応配分を組み込む符号器・復号器
システムで用いられる分割帯域復号器の1実施例の基本
的構造が示されている。デフォーマッタ202によって、
量子化情報及びXワードが、通路200で受け取られる符
号化信号から抽出される。Xワードは、通路203に沿っ
て配分関数210に受け渡される。配分関数210によって、
配分値が、Xワードに応答して確定され逆量子化装置20
4に受け渡される。逆量子化装置204によって、ワード
が、デフォーマッタ202から受け取られる量子化情報を
配分値に応答して適用される逆量子化関数を用いて逆量
子化することで発生される。逆変換器212によって、サ
ブバンド情報が、Xワード及びワードに応答して発生
され、逆フィルタバンク206によって、出力信号が通路2
08に沿って、逆変換器212から受け取られるサブバンド
情報に応答して発生される。
逆方向適応符号化システムでは、符号化信号の中の副
次情報を搬送するのに必要なオーバーヘッドを避けるこ
とができる。何故ならば、配分値は、符号化信号の中に
アセンブルされるXワードで明示的に表現されているか
らである。逆方向適応復号器では、配分値を、直前に逆
方向適応符号器で動作したのと等価の配分関数を動作さ
せることによってXワードから復元することができる。
符号化信号を正確に復号することにおいて、符号器及び
復号器の配分関数それ自体は必ずしも等価である必要は
ないが、正確な復号は符号器及び復号器の配分関数が等
価の配分値を有する時にのみ保証されるということを理
解して置くべきである。
ハイブリッド適応配分 図6には、ハイブリッド適応配分を組み込む符号器・
復号器システムで用いられる分割帯域符号器の1実施例
の基本的構造が示されている。上で論考した図4の実施
例の中での種々の素子の関数は、図6に示される構造の
それぞれの素子の関数に対応する。これに加えて、アダ
プタ120によって、2つの基本的技法の片方若しくは両
方を用いて配分関数110で確定される1つ又はそれ以上
の配分値が改変される。両方の技法を実行するのに用い
られる構造が図6に示されているが、これら2つの技法
の何れも単独で用いることができるし、不必要な機能素
子は図6に示されている構造から除去しても良い。
第1の又は「パラメータ」技法においては、アダプタ
120によって、配分関数110の結果に影響する1つ又はそ
れ以上のパラメータが改変される。アダプタ120で与え
られる改変パラメータは、通路123に沿って配分関数110
とフォーマッタ106とに受け渡される。フォーマッタ106
によって、改変パラメータ及び量子化情報の指示が、伝
送又は記憶に適するフォーマットを有する符号化信号に
アセンブルされる。
第2の又は「値」技法においては、アダプタ120によ
って、1つ又はそれ以上の配分値が改変される。アダプ
タ120で与えられる改変値は、通路121に沿ってフォーマ
ッタ106とマージ118とに受け渡される。マージ118によ
って、改変値が配分関数110から受け取られる配分値と
併合され、併合された配分値が量子化装置104に受け渡
される。フォーマッタ106によって、改変値と量子化情
報の指示が、伝送又は記憶に適するフォーマットを有す
る符号化信号にアセンブルされる。
図6の実施例では、通路100から受け取られる入力信
号に応答するアダプタ120、通路103から受け取られるサ
ブバンド情報、及び通路113から受け取られるXワード
が示されている。ハイブリッド適応符号器の代替的な実
施例においては、アダプタ120は、3つの通路の何れか
の1つ、3つの通路の組み合わせの総て、その他の情
報、これらの何れに対しても応答する。
図7には、ハイブリッド適応配分を組み込む符号器・
復号器システムで用いられる分割帯域復号器の1実施例
の基本的構造が示されている。上で論考した図5の実施
例の中での種々の素子の機能は、図7に示される構造の
それぞれの素子の機能に対応する。これに加えて、1つ
又はそれ以上の配分値は、2つの基本的技法の一方若し
くは両方を用いて改変される。両方の技法を実行するの
に用いられる構造が図7に示されているが、これら2つ
の技法の何れも単独で用いることができるし、不必要な
機能素子は図7に示されている構造から除去しても良
い。
第1の又は「パラメータ」技法においては、デフォー
マッタ202によって、配分関数210の結果に影響する1つ
又はそれ以上の改変パラメータが、符号化信号から抽出
され、通路213に沿って配分関数210に伝えられる。
第2の又は「値」技法においては、デフォーマッタ20
2によって、符号化信号からの1つ又はそれ以上の改変
値が抽出され、改変値が通路205に沿ってマージ218に受
け渡される。マージ218によって、改変値が、配分関数2
10から受け取られる配分値と併合され、併合された改変
値が逆量子化装置204に渡される。
実行 フィルタバンク 図1から図7に示す実施例は、種々多様な実行によっ
て実現することができる。例えば、フィルタバンク102
及び逆フィルタバンク206は、以下の技法に限定はされ
ないが、直角ミラーフィルタ、多相フィルタ、及びフー
リエ変換を含む、当業界で既知の種々のディジタル濾波
技法で実行することができる。好ましい実施例では、プ
リンセン、ジョンソン、及びブラッドレイの音響・音声
・信号処理国際学会誌1987年5月号、2161ページから21
64ページまでの論文、「時間領域アライアジング消去に
基づくフィルタバンク設計を用いてのサブバンド・変換
符号化」(Princen,Johnson and Bradley,“Subband/Tr
ansform Coding Using Filter Bank Designs Based on
Time Domain Aliasing Cancellation",Proceedings In
t.Conf.Acoust.,Speech,and Signal Proc.,May 1987,p
p.2161−2164)に開示されている時間領域エイリアシン
グ相殺(TDAC)変換を用いている。TDAC変換でフィルタ
バンクを実行する変換符号器・復号器システムについて
は、前に引照した米国特許第5,109,417号に記述されて
いる。
本発明の実施にとって決定的となるような特定の実行
はない。これまで述べてきた本発明の叙述はディジタル
分割帯域符号化の実行に特に向けられていたが、本発明
の局面を組み込む符号器・復号器システムではアナログ
フィルタバンクも同様に用い得ることを理解して置くべ
きである。例えば、フィルタバンク102を、1つ又はそ
れ以上のアナログフィルタと、各サブバンド信号に対し
てディジタルサンプルを発生するアナログ・ディジタル
変換器(ADC)とで構成することができる。逆フィルタ
バンク206は、ディジタル・サンプルに応答してアナロ
グ・サブバンド信号を発生するディジタル・アナログ変
換器(DAC)と、アナログ・サブバンド信号を合成アナ
ログ出力に組み合わせるコンポーネント(成分)とで構
成することができる。
変換器 Xワード及びYワードを発生し、復元する変換器112
及び逆変換器212は、種々多様な実行で実現することが
できる。上で論考したように、Xワードは、符号器及び
復号器の両方で配分関数を報知するのに使用可能である
ことで特徴付けられる。Xワードを、一般に、拡大縮小
因子に対応させ、Yワードを、拡大縮小因子に従って拡
大縮小される値に対応させることができる。数量の種々
の浮動小数点表現を利用する実施例においては、Xワー
ドを浮動小数点指数に対応させ、Yワードを浮動小数点
小数部に対応させることができる。
幾つかの実施例においては、Yワードのグループ又は
ブロックは、共通のXワード成分と組み合わされて、ブ
ロック浮動小数点(BFP)表現を形成する。しかし、好
ましい実施例においては、各Yワード小数部をそれぞれ
のXワード指数の1つと組み合わせることによって、よ
り高解像のスペクトル包絡線がXワードから得られる。
量子化装置 量子化装置104及び逆量子化装置204で用いられる特定
の関数は本発明の実施にとって決定的ではないが、これ
らの2つの関数は相補的でなければならない。一般に、
配分値が同じであると仮定して、逆量子化関数d(x)
は、元の量xがほぼd[q(x)]であるように、量子
化関数q(x)の逆関数となる。厳密な等価性は期待さ
れない。何故ならば、量子化では、通常、或る程度の精
度の損失を生じるものであるからである。
配分値に応答して、量子化装置104では、量子化関数
を幾つかある方法の中の何れかで適用することができ
る。例えば、量子化装置104によって、量子化レベルの
数を配分値に従って設定することができる。8レベルの
量子化関数及び4レベルの量子化関数を、それぞれ、3
ビット及び2ビットの配分を指示する値に応答して用い
ることもできよう。もう1つの例を挙げると、量子化装
置104で、特定のレベルより大きいか或いは同等の配分
値、例えば6ビットの値に応答して対数量子化関数を用
い、それよりも小さい値に応答して線形量子化関数を用
いることもできよう。
量子化装置104では、対称関数と非対称関数との間を
切り替えることによって、或いは、1つ又はそれ以上の
量子化レベルを用いて振幅の特別な領域を表すことによ
って、量子化関数を適用することもできる。例えば、N
ビットの量子化関数によって、2N量子化レベルの1つを
前に論じた「スモール・ゼロ」量子化レベルとして保存
することができる、かかる量子化レベルは、さもなけれ
ば大きな振幅を表すところであるが、ここでは代わりに
非常に小さな振幅を表すために用いられる。かかる量子
化関数を用いることで、符号器で、復号器に、ゼロの値
に量子化される小振幅信号と、特別な「スモール・ゼ
ロ」量子化レベルに量子化される非常に小振幅の信号と
の間を容易に区別することが可能になる。
配分値に応答して、逆量子化装置204では、量子化装
置104で量子化関数を適用した方法に対して相補的な方
法で逆量子化関数を適用する。
併合 マージ118及びマージ218で用いられる方法は、本発明
の実施にとって決定的ではない。概念的には、マージ11
8及びマージ218によって、1組の配分値及び1組の改変
値からの対応する値が、1組の値に組み合わせられる。
これは種々の方法で行うことができる。例えば、配分値
を、対応する改変値で置換することができる。分割帯域
符号器においては、各配分値は、それぞれのサブバンド
の中でサブバンド情報を量子化するのに用いられる数値
ビットを表す。各改変値によって、対応する配分値が取
って代わられ、各改変値が代わりに量子化装置で用いら
れる。
もう1つの例を挙げると、これらの2組の値を改変値
を用いてることによって組み合わせ、対応する配分値を
調整することができる。例えば、改変値によって、対応
する配分値を変更する増分量を表すこともできる。分割
帯域符号器においては、特定のサブバンドの中のサブバ
ンド情報を量子化するのに用いられるビットの数は、も
し改変値が符号化信号の中にあるならば、それぞれの配
分値とそれぞれの改変値の代数的合計によって定義する
こともできよう。これに替えて、改変値によって、対応
する配分値を拡大縮小する因子を表すことができる。
フォーマッタ 符号化信号が直列ビットストリームで表される多くの
符号化システムにおいては、通路108及びデフォーマッ
タ202によって与えられる関数は、実質的にはそれぞ
れ、直列ビットストリームの多重化及び逆多重化に対応
する。フォーマット化及び逆フォーマット化の関数の実
行は特定の用途にとっては重要であるが、本発明の実施
にとって決定的ではない。その符号化信号を伝送又は記
憶に適する形式の中に収めることができ、その符号化信
号をフォーマット化された表現から復元できる過程は、
総て適切である。
配分関数 概要 配分関数110によって、配分値が心理知覚原理に従っ
て確定される。これらの配分値は、結果としての量子化
雑音が、もし可能ならば、マスキングしきい値を超えな
いように確定される。この過程に関しては、以下で更に
詳細に論考する。この論考は特にオーディオ符号化シス
テムに向けられているが、ここで提示される概念の多く
は、ビデオ符号化のような広範な用途においても用いる
ことができる。
マスキングしきい値は、ひとの知覚の数学モデルを適
用することによって確定される。種々多様なモデルを、
本発明の種々の局面と共に用いることができる。前に引
用したシュレーダらによれば、音響エネルギーに対する
ひとの耳の応答特性は、(1)入力信号のパワースペク
トル密度(PSD)を概算し、(2)PSDを臨界帯域にマッ
ピングすることで入力信号の臨界帯域密度を得、(3)
基底膜の拡散関数を臨界帯域密度情報に適用することで
基低膜の刺激パターンを発生させ、(4)音響心理学的
マスキングを達成するに足る信号対雑音比(SNR)に等
しい量だけ刺激パターンを調整することで暫定マスキン
グしきい値を発生させ、(5)暫定マスキングしきい値
をひとの知覚のしきい値と比較し、(6)これら2つの
中の大きい方に等しいマスキングしきい値を発生させる
ことによって、モデル化することができる。
これらの段階の幾つかは、組み合わせるか、或いは、
異なる順序で行っても良い。例えば、段階1及び段階2
を、最初に入力信号のスペクトル成分を臨界帯域の中に
マッピング(写像)し、その後、マッピングされた成分
から臨界帯域密度を直接発生させるように逆にすること
もできる。もう1つの例としては、段階2から段階4ま
でを単一の段階として組み合わせて、近似的に重みづけ
された拡散関数を入力信号PSDに直接適用することで暫
定マスキングしきい値を発生させることもできる。
以下の論考は、上に挙げた6つの段階の変形を組み込
む実施例に特に向けられている。これらの段階は、種々
の概念を説明するために用いられるもので、本発明を実
行するために必要なものではない。代替的な実施例で
は、他の段階から成る他の聴覚モデルを組み込んでいる
こともある。
パワースペクトル密度 順方向適応システムの符号器では、入力信号のPSD
を、通路100、通路103から受け取られる情報から概算す
ることができる。例えば、高速フーリエ変換(FFT)で
実行されるフィルタバンクを組み込むシステムにおいて
は、PSDを、結果の変換係数の各々の大きさの二乗から
得ることができる。しかし、逆方向適応システムの符号
器では、一般にPSDを、通路113から受け取られるXワー
ドから概算する。
指数X及び小数部Yから成る従来の2進浮動小数点形
式で各スペクトル成分Cの振幅が表される1つの実施例
においては、dBで表されるスペクトル成分のパワーは、
指数の値から直接概算することができる。各指数の値
は、組み合わされた小数部を正規化するのに用いられる
2のべき、或いは、C=Y・2-xである。この表現か
ら、各スペクトル成分のパワーを以下のような式から概
算することができる。すなわち、 −6(Xi+0.5)dB (1) ここで、は、スペクトル成分Ciのパワー、 Xiは、スペクトル成分Ciの浮動小数点指数の値
である。
好ましい実施例においては、各スペクトル成分Cは、
正規化された小数部Yと指数Xとから成る浮動小数点形
式で表される。PSDは、1つ又はそれ以上のスペクトル
成分を帯域にグループ化し、各帯域の中のスペクトル成
分の指数の「対数和」を取ることで概算される。対数和
を取る計算の1つの方法については、以下で論考する。
概念的には、本発明の実施にとって決定的となるよう
なPSD概算の特定の方法はない。しかし、実際的に事柄
として、方法の持つ精度によって符号化システムの性能
は著しく影響される。
臨界帯域密度 分割帯域符号化システムでは、一般に、臨界帯域の半
分以下の帯域幅を有するサブバンドに入力信号を分割す
ることによって音響心理学的効果を一層良く利用でき
る。これは通常必要なことである。何故ならば、符号化
システムのサブバンドは、可変の中心周波数を有するひ
との聴覚システムと異なり、固定の中心周波数を有する
からである。支配的なスペクトル成分によって、臨界帯
域幅を有する分割帯域符号器のサブバンド全体を通して
他の低レベルのスペクトル成分がマスキングされるとし
ばしば考え違いされている。この考えは正しくない。何
故ならば、支配的なスペクトル成分のマスキング効果
は、スペクトル成分両側の各々の上にある臨界帯域幅の
半分の周波数間隔の外側では消滅するからである。もし
この支配的なスペクトル成分が符号化システムのサブバ
ンドの縁に生じると、サブバンドの中の他のスペクトル
成分は、サブバンド帯域幅が臨界帯域幅の半分以下でな
い限り、実際の臨界帯域幅の外側に生じ得る。
1つの実施例においては、入力信号PSDは、ひとの聴
覚システムの臨界帯域幅のおよそ1つ分の帯域幅を各々
が有する帯域の中にマッピングされる。帯域の各々は1
バークの幅を有する。好ましい実施例においては、入力
信号PSDは、ひとの聴覚システムのおよそ半分の臨界帯
域幅、又は約1/2バークの幅の帯域幅を有する、「サブ
臨界帯域」の中にマッピングされる。この好ましいマッ
ピングは、表Iに示す項目で表現される。
代替的なマッピング関数及び帯域幅は、本発明の概念
から逸脱せずに用いることができる。例えば、シュレー
ダらによれば、約5kHz以下の周波数fは、以下の式によ
り、臨界帯域にマッピングすることができる。すなわ
ち、 ここで、xは、臨界帯域数である。
以下の論考を単純化するために、「臨界帯域密度」と
いう術語で、臨界帯域幅及びサブ臨界帯域幅を含む総て
の便宜な帯域幅の周波数帯域にマッピングされる入力信
号のPSDを指示することになる。入力信号の臨界帯域密
度は、以下の式による適切なマッピング関数から得るこ
とができる。すなわち、 ここで、(x)は、入力信号のパワースペクトル密度
であり、 S(x)は、入力信号の臨界帯域密度である。
刺激パターン 刺激パターンによって、入力信号の間隔で表される音
響パワーから生じる基低膜に沿うエネルギーの分布が近
似的に記述される。刺激パターンは、以下のたたみ込み
で計算することができる。すなわち、 E(x)=S(x)*B(x) (4) ここで、E(x)は、入力信号から生じる刺激パター
ン、 B(x)は、基底膜の拡散関数である。
シュレーダらは、臨界帯域幅を有する周波数帯域を横
切る拡散関数の便宜な分析的式を提示している。この式
によって、周波数帯域x0の中のスペクトル成分から生じ
る周波数帯域xの拡散のレベルが与えられるが、式は以
下のとおりである。すなわち、 ここで、Δx=x−x0である。
入力信号の臨界帯域密度S(x)及び拡散関数B
(x)のたたみ込みは、NをS(x)中の点の数、Mを
B(x)中の点の数として、N・Mの規模の計算の複雑
さを有し、集約的な計算を要する。その結果、多くの符
号化システム、特に逆方向適応符号化システムでは、シ
ュレーダのモデルを用いるのは実際的ではない。
実際的な方法では、刺激パターンを、入力信号のスペ
クトル表現を濾波することによって得る。この濾波は、
本明細書で論考した、マッピングされた周波数領域及び
マッピングされていない周波数領域のような「スペクト
ル領域」中で行われる。
図8には、刺激パターンを更に効率的に得ることので
きる、Nの規模の計算の複雑さを有する1つの実施例が
示されている。この実施例によれば、入力信号臨界帯域
密度を伝達する情報は、通路500から受け取られ、3つ
のフィルタを通して受け渡され、組み合わされて刺激パ
ターンを形成する。
PSDは、線形、対数、又は他のパワーの表現として拡
大・縮小することができる。もし、PSDが入力信号パワ
ーの線形表現であり、より高い周波数の帯域xが、実質
的に一定であるバークで表現される帯域幅を有するなら
ば、これらのフィルタは、以下の回帰表現によって表さ
れる変換関数を具える短極IIRとして実現することがで
きる。すなわち、 Fi(x)=ai(x)・S(x)+bi(x)・Fi(x−
1) (6) ここで、ai(x)は、フィルタiの利得因子、 bi(x)は、フィルタiの減衰率、 F1(x)は、周波数帯域xにおけるフィルタ50
2の出力、 F2(x)は、周波数帯域xにおけるフィルタ50
4の出力、 F3(x)は、周波数帯域xにおけるフィルタ51
0の出力 である。フィルタ502、フィルタ504、及びフィルタ510
の仮想インパルス応答特性は、それぞれ、図9aから9cに
示されている。
もしPSDが入力信号パワーの対数表現であるならば、
フィルタ計算は、対数パワー領域で一層効率的に行うこ
とができる。これらの計算を行う1つの方法について
は、以下で論考する。
もし、より高い周波数の帯域xが、実質的に一定であ
るバークで表現される帯域幅を有しないならば、一層複
雑な変換関数が1つ又はそれ以上のフィルタに対して必
要になる。例えば、もし周波数帯域が一定の帯域幅を有
するならば、フィルタ502では、以下の式のような変換
関数に1つ又はそれ以上のゼロを具えていることが望ま
しい。すなわち、 ここで、Mi(x)は、帯域xにおけるフィルタFiのゼロ
の数である。
式7の3項によって、実際には、インパルス応答にお
ける指数減衰が遅れる。1仮想インパルス応答特性は、
10a図に示されている。1つのゼロごとに、1周波数帯
域の「遅延」が加えられる。一般的に、より高い周波数
帯域に対してはより多くのゼロが用いられる。例えば、
20kHz帯域幅の入力信号のPSDの中の各要素がもし512点
の変換で発生される変換係数に相当するとすれば、その
結果、最高の周波数帯域に対しては恐らく10個にも達す
るゼロが必要になるが、約500Hz以下の帯域に対しては
まったくゼロを必要としない。
拡散関数の精度は、周波数帯域数xの関数であるフィ
ルタ係数を用いることによって、計算の複雑さを増大さ
せる犠牲を払いながら改善することができる。回帰項係
数bi(x))によって、周波数が高くなるにつれてスペ
クトル成分の拡散を一層多くすることが望ましい。しか
し、適切な帯域幅を有する1組の周波数帯域の中に入力
信号PSDをマッピングすることによって、妥当な精度の
拡散関数を、実質的に不変である回帰項係数biを用いて
得ることができる。低い周波数帯域のための多くの符号
化システムにおいては、係数biの中の幾分かの変動が必
要となる可能性が高い。何故ならば、そこでは臨界帯域
幅が一層狭いからである。
フィルタ特性は、符号化の用途の要求に従って確定す
ることができる。これらのフィルタはマッピングされた
周波数領域である周波数帯域領域の中で動作することを
強調して置くべきであろう。フィルタに関する減衰項に
よって、基底膜に沿う音響エネルギーの拡散が表され、
拡散関数を用いてのたたみ込みで与えられる効果と類似
の効果が与えられる。
図8を参照すると、リバース508によって、通路500か
ら受け取られる情報をフィルタ510で濾波する前に周波
数帯域の逆転が行われ、リバース512によって、濾波出
力の逆転が行われる。これらの2つの逆転素子及び介在
するフィルタによって、刺激周波数よりも低い周波数で
の基底膜に沿う拡散関数が表される。
コンポーネント506及びコンポーネント514によって、
それぞれの入力の合計が得られる。コンポーネント514
で生じる合計は、計算された興奮パターンであるが、通
路516に沿って受け渡される。図9dには、図9aから9cま
でに示される特性を有するフィルタを組み込む、図8に
示す構造体の合成応答特性が示されている。もし通路50
0から受け取られる臨界帯域密度の情報が対数パワー領
域で表現されるならば、コンポーネント506及びコンポ
ーネント514によって計算される合計は対数和になる。
対数和を計算できる1つの方法については、以下で論考
する。
多くの代替的実施例が可能である。例えば、計算の複
雑さが少ない1つの実施例では、フィルタ502、フィル
タ504、及びコンポーネント506だけで構成され、コンポ
ーネント506では、2つの濾波出力を、これら2つの中
で大きい方を単純に選択することで組み合わせることが
できる。このより単純な実施例によって得られる結果
は、多くの高品質符号化用途において受容できる。例え
ば、図10には、フィルタ502が図10aに示すインパルス応
答特性を有し、フィルタ504が図9bに示すインパルス応
答特性を有する、この実施例の仮想合成インパルス応答
特性が示されている。表IIには、表Iに示されるPSDマ
ッピングを用いる1つの実施例での使用に適する、フィ
ルタ502に関するフィルタ係数a1(x)及びb1(x)、
及びフィルタ504に関するフィルタ係数a2(x)及びb2
(x)が示されている。これらの係数は、対数パワー領
域での使用のためにdBで表現されているが、表の項目を
10で除し、商の逆対数を取ることによって、線形パワー
領域での使用のための係数に容易に変換することができ
る。
フィルタは、格子型フィルタを含むIIRフィルタ又はF
IRフィルタとして実行することができるが、一般にIIR
フィルタが好ましい。何故ならば、IIRフィルタは通
常、計算上の効率が良いからである。計算の複雑さは、
フィルタ計算を対数パワー領域で行うことによって更に
低減することができる。式6を対数パワー領域で計算す
るのに要する乗算は、対数パワー領域での加算として、
或いは以下の式で実行できる。すなわち、 logA=log[ai(x)・S(x)]=logai(x)+logS(x) (8) logB=log[bi(x)・Fi(x−1)]=logbi(x)+logFi(x−1)
(9) である。式6の2つの項を加算するのは対数パワー領域
では単純には行えない。「対数和」と呼ばれるこの加算
は、以下の恒等式を用いて行える。すなわち、 log(A+B)=max(logA,logB)+log[1+exp(−|logA−logB|)] (10) ここで、exp(y)は、量yの真数である。値|log A−l
og B|の適切な範囲に関して以下の式、 log[1+exp(−|logA−logB|)] (11) のルックアップ、すなわち、参照用テーブルを構築する
ことによって、式6における加算は、対数パワー領域に
おいて、(1)logAとlogBとの間の差の絶対値を見出だ
し、(2)参照用テーブルからの値をこの差を鍵として
得、(3)参照用テーブルから得られる値をlogAとlogB
の中の何れか大きい方に加算することで行うことができ
る。この実行は本発明の実施にとって決定的ではない
が、多くの実施例においては、計算の複雑さを更に低減
するのに有用である。
参照用テーブルは、妥当な程度に簡潔である。何故な
らば、より小さい項は、|logA−logB|における約24dBよ
りも大きい差に関しては基本的に無視できるからであ
る。言い換えると、対数和の妥当で正確な近似は、約24
dBよりも大きい差に関しては、表での項目がゼロに等し
いと仮定することによって得られる。
感度関数 音響心理学的マスキング効果の根本原理は、人の聴覚
システムが音響エネルギーの散在によって鈍感になると
いう事実に則っている。低いレベルの信号は、隔絶され
ている際には聴取可能であるが、より大きな信号が伴う
際には聴取可能でなくなる。シュレーダらによる「感度
関数」w(x)では、人の聴覚システムが鈍感になる程
度を近似している。この関数は、臨界帯域x内の音響心
理学的マスキングを保証するのに必要なSNRを与える
が、以下の式で表すことができる。
10log10w(x)=−(15.5+x)dB (12) 必要なSNRを単純に一定値20dBに設定する、より簡単な
方法では、w(x)=−20dBの感度関数を用いる。
最大ディジタル値で105dBのSPLを表す好ましい実施例
においては、再生システムの音量制御器を非常に高めに
設定しても低振幅スペクトル成分によるマスキングが保
証されるように、控え目なレベルを用いている。以下の
式で表されるこの感度関数は、表Iに示されるPSDマッ
ピングを用いる実施例での使用に適する。
暫定マスキングしきい値Z(x)は、感度関数w
(x)で特定される量だけオフセットされる刺激パター
ンE(x)に関連して定義される。暫定しきい値は、対
数電力領域においては、以下の式 Z(x)=w(x)+E(x) (14) 線形電力領域においては、以下の式 Z(x)=w(x)・E(x) (15) から得られる。
マスキングしきい値 その定義に由来して、聴覚のしきい値を下回る音響エ
ネルギーは聴取不可能である。したがって、量子化雑音
がマスキングされることを保証するのに必要なSNRで
は、聴覚のしきい値よりも低い一切の量子化雑音を抑制
する必要はない。聴覚のしきい値は、当分野では十分に
定義されている。例えば、ISO標準226を参照して欲し
い。ISO標準226では、1990年のISO標準ハンドブック、
音響編、20ページから25ページまで(ISO Standard Han
dbook,Acoustics,1990,pp.20−25)に、「最小可聴音
場」の大きさの等感曲線に関する情報を提示している。
本明細書では、関数Θ(x)を用いてこのしきい値の分
析的表現を表す。
音響心理学的マスキングしきい値M(x)は、聴覚の
しきい値を暫定マスキングしきい値と比較し、これら2
つのしきい値の大きい方を各点ごとに選ぶことによって
得ることができる。これは、以下の式、すなわち、 M(x)=max[Z(x),θ(x)] (16) で表すことができる。
配分値 1つの単純な実施例においては、要求SNRの6dBごとに
1ビットの割合、或いは以下の式によって、ビットを配
分ることができる。すなわち、 ここで、A(x)は、周波数帯域xにおける各スペクト
ル成分に対する配分値である。
好ましい実施例においては、表を索引することによっ
て、一層効率的な配分が行える。マスキングしきい値M
(x)に対する概算スペクトル電力S(x)の要求SNR
は、参照用テーブルへの鍵として用いられ、表の各項目
によって、要求SNRを達成するのに必要な量子化レベル
の数が表される。
ルックアップテーブルの項目は、当分野で既知の、種
々の先行技術の符号化システムで用いられている量子化
関係に基づくことができる。概念的には、本発明の実施
にとって決定的となるような特定の参照テーブルはない
が、参照用テーブルの中の項目は符号化システムの性能
に大きく影響する。
特定の符号化システムのために表の項目を誘導できる
1つの方法は、所与の数の量子化レベルにスペクトル情
報を量子化すべく強制される量子化関数を組み込む当該
符号化システムに生じるSNRを測定することである。例
えば、表IIIでは、8.21dB及び11.62dBのSNRがそれぞ
れ、3つの量子化レベル及び5つの量子化レベルを有す
る量子化関数を用いる符号化システムの特定の実施例で
得られることが示されている。この表の項目によれば、
8.21dB以上、11.62dB以下又は同等のSNRを要求するスペ
クトル成分は、5レベルに量子化されるのに十分なビッ
トを配分られなければならない。
この実行方法においては、表の低い限界は0dBでのゼ
ロ量子化レベルであり、表の高い限界は、当明細書で
「配分シーリング」と呼ぶ、ビットの或る最大数に設定
されている。表IIIに示す例によれば、配分シーリング
は65,536の量子化レベルに相当するが、これは16ビット
で表すことができる。
多くの符号化システムにおいては、配分関数によっ
て、特定数のビットを配分る配分値が確定される。この
数を当明細書では「ビット予算」と呼ぶ。もし配分関数
で配分られるビットの総数がビット予算を超過するなら
ば、配分関数ではこれに対応して配分値を改定しなけれ
ばならない。もし配分関数で配分られるビットの総数が
ビット予算よりも少なければ、配分値を改定して残留ビ
ットの使用を適正化することが好ましい。
幾つかの実施例においては、配分値は、マスキングし
きい値M(x)のレベルを調節し、配分値を再計算する
ことによって、精密化される。マスキングしきい値が上
下される際には、聴覚のしきい値を考慮することが好ま
しい。1つの実施例においては、配分られたビットの総
数がビット予算に十分接近するまで、暫定マスキングし
きい値Z(x)をスペクトルの一部又は全体で上下さ
せ、マスキングしきい値を式16に従って再確定すること
によって、これが達成される。論考を容易にするため
に、記号M0(x)を、配分値を精密化するための一切の
調節が行われる前に聴覚モデルから得られる、初期又は
「理想」マスキングしきい値を指示するのに用いる。
1つの実施例においては、マスキングしきい値は、M0
(x)のマスキングしきい値に対して、72dBまで下げら
れ、24dBまで上げられる。これらの調節は、それぞれ、
スペクトル成分当たりの配分での約12ビットの加増及び
4ビットの削減に相当する。初期には、マスキングしき
い値はM0(x)よりも24dB低く設定される。これは、2
つの局限値、72dB及び−24dBの丁度中間の値である。配
分値は、計算され、ビット予算と比較される。2進法探
索技法によって、マスキングしきい値に対する粗調節が
行われ、ビット予算と同等若しくは少ない値に全ビット
配分が収斂させられる。2進法探索は、全ビット配分が
ビット予算と同等になるまで、或いは、マスキングしき
い値への増分調節が1.5dB以下になるまで反復される。
これらの粗調節に続いて、2進法探索によって、マスキ
ングしきい値に対する微調節が行われ、全ビット配分が
ビット予算に更に接近して収斂するレベルの6dB低いレ
ベルが確定される。この2進法探索は、全ビット配分が
ビット予算と同等になるか、或いは、マスキングしきい
値への増分調節が0.375dB以下になるかの何れかになる
まで反復される。調節されたしきい値とM0(x)との間
の差は符号化信号に受け渡され、これにより、復号器で
収斂過程を繰り返すことなく配分値を直接確定すること
が可能になる。
上と同じ粗調節・微調節過程は、共通のビット溜めか
ら総てのチャネルのスペクトル成分にビットを配分する
多チャネル符号化システムにおいても用いることができ
る。代替的な実施例においては、粗調節は、総てのチャ
ネルに共通のマスキングしきい値に対してのみ行われ
る。総てのチャネルのための総合的配分によって十分に
収斂が行われた後、全配分ビットがビット予算と同等に
なるまで、或いは、ビット予算と十分に接近するまで、
個々のチャネルに関連するマスキングしきい値に対して
微調節が行われる。微調節は、(1)全チャネルにわた
って収斂するまで調節しながら、各チャネルのそれぞれ
のマスキングしきい値に対する1つの調節を代わる代わ
る完結することか、或いは、(2)優先度の高いチャネ
ルから始め優先度の低いチャネルに進めながら、各チャ
ネルのそれぞれのマスキングしきい値を収斂するまで代
わる代わる調節することによって、行うことができる。
多チャネル符号化システムに関して上で叙述した過程
に類似の過程を、1つ又はそれ以上のチャネルを具える
他の符号化システムで用いることができる。ビットは、
共通のビット溜めからスペクトル成分に或る時間の期間
にわたって配分ることができる。例えば、変換符号化シ
ステムにおいては、粗調節は、多重ブロックのための全
配分がビット予算と十分に接近して収斂するまで、変換
係数の多重ブロック全体にわたる配分に対して行われ
る。微調節は、ブロック全体にわたって収斂するまで調
節しながら、各チャネルのそれぞれのマスキングしきい
値を代わる代わる調節することによって行うことができ
る。この過程は、サブバンド符号化システムのような他
の分割帯域符号化システムに対しても適用可能である。
この過程はまた、多チャネル符号化システムでの使用に
対しても適合することができる。
これらの例に示されるように、収斂過程の種々の変形
が可能である。もし特定の実行において配分シーリング
が用いられるならば、収斂過程で配分値がこのシーリン
グを超えることは許されない。
もしマスキングしきい値が上げられても全ビット配分
がビット予算内に押さえられるならば、1つ又はそれ以
上の「中間的」スペクトル成分は、初期のM0(x)を超
えても良いが、調節されたしきい値M(x)を超えては
ならない。式17によれば、これらの中間的スペクトル成
分は、ビットが全く配分られていないので、符号化信号
から除外される。この除外は、特にもし除外が間欠的で
あると、聴取可能となることがある。例えば、接続音の
高調波は、スペクトルの中のどこかに際立った音響エネ
ルギーを有する時間区間で、間欠的に除外され得る。
もしビットがこれらの中間的スペクトル成分に配分ら
れると、ビット予算はより大きなスペクトル成分への配
分を低減することで均衡することができる。しかし、そ
の結果として生じる、より大きなスペクトル成分の符号
化品質の劣化は、聴取可能になる可能性が高い。ビット
を、中間的スペクトル成分を除外することにより聴取可
能になる一方の効果と、より大きなスペクトル成分の符
号化品質を劣化させるもう一方の効果との間の均衡を取
るように、配分るべきであろう。
1つの実施例においては、中間的スペクトル成分の総
てに最少数のビットしか配分ないことによって、かかる
均衡を達成する試みが為されている。特定の実行におい
ては、この試みを、最少数の量子化レベルを有する量子
化関数を用いて総ての中間的スペクトル成分を量子化す
ることで達成している。
もう1つの実施例においては、限定された周波数範囲
内の中間的スペクトル成分にのみ最少数のビットを配分
ることによって、均衡を取ることが試みられている。こ
の範囲は、調節されたマスキングしきい値を超える最高
周波数のスペクトル成分から、符号化信号帯域幅の上限
まで広がる。
更にもう1つの実施例においては、或る一定のレベ
ル、例えば9dB以下というようなレベルだけ調節された
マスキングしきい値よりも低い、中間的スペクトル成分
にのみビットを配分ることによって、均衡を取ることが
できる。この実施例の変形においては、調節されたしき
い値よりも低いレベルは、中間的スペクトル成分に配分
られるビットの数がビット予算の或る割合を超えないこ
とを保証するように改変されている。もう1つの例で
は、これらの中間的スペクトル成分に配分られるビット
の数を、これらの配分が行われる周波数範囲の帯域幅を
制御することによって、均衡を取ることができる。
これらの中間的スペクトル成分へのビット配分の聴取
可能性は、これらの配分を変化させる速度を制御するこ
とによって、低めることができる。例えば、配分帯域幅
を数百msecの時間の間減少させることによって、中間的
スペクトル成分を配分から除外することができる。実際
には、中間的スペクトル成分を除外するのに用いられる
条件を改変するには、低域通過フィルタが必要となる。
残留ビット配分 もし一杯に配分られたビットの数がビット予算よりも
少なければ、残留ビットはどのような方法で配分して良
い。1つの実施例においては、2段階の過程が用いられ
る。2段階は、(1)最低周波数帯域から始めて周波数
の高い方へと進め、もし、(a)それぞれの配分値がゼ
ロよりも大きく、配分シーリングよりも小さいか、或い
は、(b)配分値がゼロであり、隣接する両側の周波数
帯域に対する配分値が段階1の開始時点でゼロよりも大
きかったかの何れかであるならば、周波数帯域に対する
配分を増大させ、(2)ビットが少しでも残っている間
に、最低周波数帯域から始めて周波数の高い方へと進
め、もし、それぞれの配分値が配分シーリングよりも小
さければ、各周波数帯域に対する配分を増大させる、過
程である。段階2は、残留ビットがなくなるまで反復さ
れる。
残留ビットの配分は、収斂過程で、もし残留ビットが
少しあるとしても極く僅かでしかないように、ビット予
算に十分に接近して収斂できるようにすることで、回避
するか、若しくは最少化することができる。
アダプタ 種々の心理知覚効果に基づく配分関数を用いる分割帯
域符号化システムにおいては、基盤となる心理知覚モデ
ルに影響する総てのパラメータは、配分関数に適合する
ように改変することができる。オーディオ符号化用途で
は、例えば、かかるパラメータには、以下の要素が含ま
れる。すなわち、(1)マスキング音よりも大きいか或
いは小さい音響心理学的マスキングのレベルをモデル化
する式6又は式7のフィルタ係数、(2)SNRオフセッ
トを刺激パターンから与える感度関数の特性、(3)多
チャネル・システムにおけるチャネル間マスキングのレ
ベル、(4)入力信号の帯域幅、(5)周波数の関数と
してサブバンド情報に配分られるビットの最少数、
(6)周波数の関数でもあり得る、配分シーリング、及
び(7)スペクトル振幅の関数として振幅の各増分ごと
にスペクトル成分に配分られる付加ビットの数である。
経験によれば、より大きな振幅におけるマスキングを達
成するにはより高いSNRが必要であることが分かってい
る。したがって、大きな振幅では振幅6dBの増加ごとに
1つの付加ビットの配分が必要であるが、小さな振幅で
は振幅12dBの増加ごとに1ビットだけの配分で十分であ
る。
アダプタ120では、「パタメータ」技法及び「値」技
法の片方又は両方を利用して配分関数の結果を適応させ
ることができる。「パラメータ」技法では、上で論考し
たような1つ又はそれ以上のパラメータを改変すること
を伴う。「値」技法では、配分関数から得られる配分値
と併合される1つ又はそれ以上の改変値を発生させるこ
とを伴う。
両方の技法を実行するのに用いられる特定の過程は、
本発明の実施にとって決定的ではない。1つの方法は、
代替的な配分関数を働かせ、代替的な配分関数の結果を
基本的な配分関数110から得られる「基本値」と比較
し、各代替的な値とそれぞれの基本値との間の差が顕著
な点で、各代替的な値に対する改変値を形成することか
ら成る。基本的な配分関数の複雑さを制約して復号器を
単純化することができるが、代替的な配分関数は好きな
だけ複雑にしても良い。例えば、オーディオ符号化用途
においては、代替的な関数では、入力信号スペクトルが
どれ程平坦であるか、入力信号が平均であるか又はピー
ク振幅であるか、また、マスキング成分が音状であるか
雑音状であるかというような信号特性に関する考慮を含
む、一層精巧な音響心理学的モデルを用いることができ
る。
もう1つの例証的な適合過程では、基本的な配分値に
対する調節を種々の信号特性の検出に応答して行わせる
だけで、完全な配分関数を動作させることを回避してい
る。例えば、基本的な配分値を音状のマスキング成分の
検出に応答して増加させたり、或いは、基本的な配分値
を、入力信号スペクトルが基本的に平坦であることを検
出することに応答して減少させたりできる。
前に論考したように、アダプタ120を、入力信号、フ
ィルタバンク102から得られるサブバンド情報、変換器1
12から得られるXワード、又は特定の用途で意味のある
他のあらゆる情報に応答させることができる。長距離電
話ネットワークのための符号化システムにおいては、例
えば、アダプタ120を、日付、時刻、週の日に関する情
報に応答させて、ビット配分を低減する配分関数を提供
させることによって、ネットワークの交信量の予想され
る増加を予期して、低い情報要件と高い忠実度の符号化
とを交換することができる。
例えば、ディジタルビデオ表示システムにおいては、
アダタ120に、オペレータ入力に応答する配分関数を提
供させることによって、応答時間の短縮と高い画像解像
度とをオペレータが交換できるようにすることができ
る。
これらの例に示されるように、アダプタ120を、特定
用途で望まれるあらゆる情報に応答するようにすること
ができる。この情報の選択は、本発明の実施にとって決
定的ではない。
本発明を種々多様な技法で実行される多数の実施例で
実施できることを理解して置くべきである。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 トッド、クレグ・キャンベル アメリカ合衆国、カリフォルニア州 94941、ミル・バレー、ドゥラン・ウェ イ 304 (72)発明者 ディビス、マーク・フランクリン アメリカ合衆国、カリフォルニア州 94044、パスィフィカ、マンザニタ・ド ライブ 1110 (72)発明者 リンク、ブライアン・ディビット アメリカ合衆国、カリフォルニア州 94602、オークランド、コーリッジ・ア ベニュー 4109 (72)発明者 フィルダー、ルイス・ダン アメリカ合衆国、カリフォルニア州 94030、ミルブロー、トゥールーン・ロ ード 1210 (56)参考文献 特開 平3−263925(JP,A) 特開 平4−104617(JP,A) 特開 平4−304031(JP,A) 特開 平4−302532(JP,A) 特開 平3−121633(JP,A) 特表 平4−504192(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G10L 19/02

Claims (27)

    (57)【特許請求の範囲】
  1. 【請求項1】入力信号を符号化する装置であって、 前記入力信号の周波数サブバンドを表すサブバンド信号
    を発生させると共に該入力信号のスペクトル表現を発生
    させるサブバンド装置(102)と、 前記スペクトル表現に拡散関数を適用することによって
    励起パターンを発生させる励起装置(502−514)であっ
    て、前記拡散関数が、1つ又はそれ以上の無限インパル
    ス応答フィルタによって実行される励起装置と、 前記励起パターンに応答して初期マスキングしきい値を
    確定するしきい値装置と、 前記初期マスキングしきい値に関して前記サブバンド信
    号のレベルに従って、それぞれの数のビットを該サブバ
    ンド信号に配分する配分装置と、 前記サブバンド信号に配分される前記それぞれの数のビ
    ットに従って該サブバンド信号を量子化することによっ
    て量子化情報を発生させる量子化装置(104)と、 前記量子化情報を伝送又は記憶に適した符号化された信
    号にアセンブルするフォーマット装置(106)とから成
    る符号化装置。
  2. 【請求項2】前記配分装置の結果に影響する1つ又はそ
    れ以上のパラメータを改変する装置(120)をさらに含
    み、前記フォーマット装置は前記改変されたパラメータ
    の表示を前記符号化された信号にアセンブルする、請求
    項1の装置。
  3. 【請求項3】1つ又はそれ以上の前記それぞれのビット
    数を改変する装置(120)をさらに含み、前記フォーマ
    ット装置は前記改変されたビット数の表示を前記符号化
    された信号にアセンブルする、請求項1又は2のいずれ
    か1つの装置。
  4. 【請求項4】入力信号の符号化された表現を復号する装
    置であって、 前記符号化された表現から量子化されたサブバンド情報
    を抽出すると共に前記入力信号のスペクトル表現を発生
    させるデフォーマット装置(202)と、 前記スペクトル表現に拡散関数を適用することによって
    励起パターンを発生させる励起装置(502−514)であっ
    て、前記拡散関数が1つ又はそれ以上の無限インパルス
    応答フィルタによって実行される励起装置と、 前記励起パターンに応答して初期マスキングしきい値を
    確定するしきい値装置と、 前記初期マスキングしきい値に関して前記量子化された
    サブバンド情報のレベルに従って該量子化されたサブバ
    ンド情報にそれぞれのビット数を配分する配分装置と、 前記それぞれのビット数に従って前記量子化されたサブ
    バンド情報を逆量子化することによってサブバンド信号
    を発生させる逆量子化装置(204)と、 前記サブバンド信号に応答して前記入力信号のレプリカ
    を発生させる逆サブバンド装置(206)とから成る復号
    器。
  5. 【請求項5】前記デフォーマット装置は、前記符号化さ
    れた表現から前記配分装置の結果に影響する1つ又はそ
    れ以上のパラメータを得る、請求項4の装置。
  6. 【請求項6】前記逆フォーマット装置は、前記符号化さ
    れた表現から1つ又はそれ以上の改変されたビット数を
    入手し、前記配分装置は前記1つ又はそれ以上の改変さ
    れたビット数を前記それぞれのビット数と併合する、請
    求項4又は5の装置。
  7. 【請求項7】前記デフォーマット装置は、前記符号化さ
    れた表現に応答して、調節されたマスキングしきい値を
    確定する装置を含み、前記配分装置が、前記初期マスキ
    ングしきい値は超えるが前記調節されたマスキングしき
    い値未満のレベルを有する中間スペクトル成分を確定す
    る装置と、それぞれのビット数を前記中間スペクトル成
    分の少なくとも幾つかに配分する中間配分装置とを含
    む、請求項4乃至6のいずれか1つの装置。
  8. 【請求項8】前記配分装置が、前記初期マスキングしき
    い値のレベルを調節することによって調節されたマスキ
    ングしきい値を確定する装置と、該初期マスキングしき
    い値は超えるが該調節されたマスキングしきい値未満の
    レベルを有する中間スペクトル成分を確定する装置と、
    前記中間スペクトル成分の少なくとも幾つかにそれぞれ
    のビット数を配分する中間配分装置とを含む、請求項1
    乃至6のいずれか1の装置。
  9. 【請求項9】前記中間配分装置が、前記調節されたマス
    キングしきい値を超える最高周波数のスペクトル成分か
    ら上限周波数までの範囲内の周波数、前記初期マスキン
    グしきい値及び前記調節されたマスキングしきい値間の
    中間しきい値を超えるレベルを有するような中間スペク
    トル成分への配分を制限する装置を含む、請求項7又は
    8のいずれか1つの装置。
  10. 【請求項10】前記配分装置は、配分されるビット総数
    が限られたビット供給と実質的に等しくなるように前記
    初期マスキングしきい値のレベルを調節する装置を含
    む、請求項1乃至6のいずれか1つの装置。
  11. 【請求項11】前記配分装置が、 前記初期マスキングしきい値のレベルを調節することに
    よって調節されたマスキングしきい値を確定する装置
    と、 前記初期マスキングしきい値は超えるが前記調節された
    マスキングしきい値未満のレベルを有する中間スペクト
    ル成分を確定する装置と、 それぞれのビット数を前記中間スペクトル成分の少なく
    とも幾つかに配分する中間配分装置であって、中間スペ
    クトル成分に配分される前記それぞれのビットの合計が
    最大で前記限られたビット供給の特定された割合になる
    ようにされる中間配分装置とを含む、請求項10の装置。
  12. 【請求項12】入力信号の聴覚知覚モデルを作る装置で
    あって、 前記入力信号のスペクトル表現を発生させる装置と、 拡散関数を前記スペクトル表現に適用することによって
    聴覚励起信号を発生させる装置(502−514)であって、
    前記拡散関数が1つ又はそれ以上の無限インパルス応答
    フィルタで実行される装置とから成るモデル作成装置。
  13. 【請求項13】臨界帯域又は副臨界帯域マッピング関数
    を前記入力信号の電力スペクトル密度の推定値に適用す
    ることによって前記スペクトル表現が発生される、請求
    項1乃至12のいずれか1つの装置。
  14. 【請求項14】前記1つ又はそれ以上のフィルタが、周
    波数の関数として変化する多数のゼロを有する、請求項
    1乃至12のいずれか1つの装置。
  15. 【請求項15】前記ゼロの数がより高い周波数につき多
    くなる、請求項14の装置。
  16. 【請求項16】前記スペクトル表現は、前記入力信号の
    パワースペクトル密度の推定値にマッピング関数を適用
    することによって発生され、前記マッピング関数がエン
    トリのルックアップテーブルとして実行され、そこでは
    前記テーブルエントリの帯域周波数に対する帯域幅の対
    数対対数関数が、該テーブルの低周波数端に近い第1エ
    ントリ及び該テーブルの高周波数端に近い第2エントリ
    間で実質的に線形である、請求項1乃至13いずれか1つ
    の装置。
  17. 【請求項17】入力信号を符号化する方法であって、 前記入力信号の周波数サブバンドを表すサブバンド信号
    を発生させると共に該入力信号のスペクトル表現を発生
    させ、 前記スペクトル表現に1つ又はそれ以上のフィルタを適
    用することによって励起パターンを発生させ、前記1つ
    又はそれ以上のフィルタが無限インパルス応答フィルタ
    であるようにし、 前記励起パターンに応答して初期マスキングしきい値を
    発生させ、 前記初期マスキングしきい値に関して前記サブバンド信
    号のレベルに従ってそれぞれのビット数を該サブバンド
    信号に配分し、 前記サブバンド信号に配分される前記それぞれのビット
    数に従って該サブバンド信号を量子化することによって
    量子化された情報を発生させ、 前記量子化情報を伝送又は記憶に適した符号化された信
    号にアセンブルすることから成る符号化方法。
  18. 【請求項18】入力信号の符号化された表現を復号する
    方法であって、 前記符号化された表現を量子化されたサブバンド情報に
    逆アセンブルすると共に前記入力信号のスペクトル表現
    を発生させ、 前記スペクトル表現に1つ又はそれ以上のフィルタを適
    用することによって励起パターンを発生させ、前記1つ
    又はそれ以上のフィルタが無限インパルス応答フィルタ
    であるようにし、 前記励起パターンに応答して初期マスキングしきい値を
    確定し、 前記初期マスキングしきい値に関して前記量子化サブバ
    ンド情報のレベルに従って前記量子化されたサブバンド
    情報にそれぞれのビット数を配分し、 前記それぞれのビット数に従って前記量子化されたサブ
    バンド情報を逆量子化することによってサブバンド信号
    を発生させ、 前記サブバンド信号に応答して前記入力信号のレプリカ
    を発生させることから成る復号方法。
  19. 【請求項19】前記逆アセンブルは、前記符号化された
    表現に応答して調節されたマスキングしきい値を確定す
    ることを含み、前記配分は、前記初期マスキングしきい
    値は超えるが前記調節されたマスキングしきい値未満の
    レベルを有する中間スペクトル成分を確定すると共にそ
    れぞれのビット数を前記中間スペクトル成分の少なくと
    も幾つかに配分することを含む、請求項18の方法。
  20. 【請求項20】前記配分は、前記初期マスキングしきい
    値のレベルを調節することによって調節されたマスキン
    グしきい値を確定し、該初期マスキングしきい値は超え
    るが前記調節されたマスキングしきい値未満の低いレベ
    ルを有する中間スペクトル成分を確定し、それぞれのビ
    ット数を前記中間的スペクトル成分の少なくとも幾つか
    に配分することを含む、請求項17又は18のいずれか1つ
    の方法。
  21. 【請求項21】前記中間スペクトル成分の少なくとも幾
    つかへの前記配分が、前記調節されたマスキングしきい
    値を超える最高周波数のスペクトル成分から上限周波数
    までの範囲内の周波数、前記初期マスキングしきい値及
    び前記調節されたマスキングしきい値間の中間しきい値
    を超えるレベルを有するような中間スペクトル成分への
    配分を制限することを含む、請求項20の方法。
  22. 【請求項22】前記配分は、配分されるビット総数が限
    られたビット供給と実質的に等しくなるように前記初期
    マスキングしきい値のレベルを調節することを含む、請
    求項17乃至21のいずれか1つの方法。
  23. 【請求項23】前記配分が、 前記初期マスキングしきい値のレベルを調節することに
    よって調節されたマスキングしきい値を確定し、 前記初期マスキングしきい値は超えるが前記調節された
    マスキングしきい値未満のレベルを有する中間スペクト
    ル成分を確定し、 それぞれのビット数を前記中間スペクトル成分の少なく
    とも幾つかに配分し、中間スペクトル成分に配分される
    前記それぞれのビット数の合計が、最大で前記限られた
    ビット供給の特定された割合になるようにされることを
    含む、請求項22の方法。
  24. 【請求項24】前記スペクトル表現が、臨界帯域又は副
    臨界帯域マッピング関数を前記入力信号のパワースペク
    トル密度の推定値に適用することによって発生される、
    請求項17乃至23のいずれか1つの方法。
  25. 【請求項25】前記1つ又はそれ以上のフィルタが、周
    波数の関数として変化する多数のゼロを有する、請求項
    17から23までの何れか1つの方法。
  26. 【請求項26】前記ゼロの数がより高い周波数につき多
    くなる、請求項25の方法。
  27. 【請求項27】前記スペクトル表現が、前記入力信号の
    パワースペクトル密度の推定値にマッピング関数を適用
    することによって発生され、前記マッピング関数がエン
    トリのルックアップテーブルを用いて適用され、そこで
    は前記テーブルエントリの帯域周波数に対する帯域幅の
    対数/対数関数が、該テーブルの低周波数端に近い第1
    エントリ及び該テーブルの高周波数端に近い第2エント
    リ間で実質的に線形である、請求項17乃至24いずれか1
    つの方法。
JP50475395A 1993-07-16 1994-07-18 適応ビット配分符号化装置及び方法 Expired - Lifetime JP3297051B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US9226993A 1993-07-16 1993-07-16
US08/092,269 1993-07-16
US08/145,975 1993-11-01
US08/145,975 US5632003A (en) 1993-07-16 1993-11-01 Computationally efficient adaptive bit allocation for coding method and apparatus
PCT/US1994/008015 WO1995002930A1 (en) 1993-07-16 1994-07-18 Computationally efficient adaptive bit allocation for coding method and apparatus

Publications (2)

Publication Number Publication Date
JPH09500503A JPH09500503A (ja) 1997-01-14
JP3297051B2 true JP3297051B2 (ja) 2002-07-02

Family

ID=26785469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50475395A Expired - Lifetime JP3297051B2 (ja) 1993-07-16 1994-07-18 適応ビット配分符号化装置及び方法

Country Status (10)

Country Link
US (1) US5623577A (ja)
EP (1) EP0709005B1 (ja)
JP (1) JP3297051B2 (ja)
AT (1) ATE147909T1 (ja)
AU (1) AU694131B2 (ja)
CA (1) CA2166551C (ja)
DE (1) DE69401514T2 (ja)
DK (1) DK0709005T3 (ja)
ES (1) ES2096481T3 (ja)
WO (1) WO1995002930A1 (ja)

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3307138B2 (ja) * 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
US6263307B1 (en) 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
EP0772925B1 (en) * 1995-05-03 2004-07-14 Sony Corporation Non-linearly quantizing an information signal
US5960390A (en) * 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
JPH09148937A (ja) * 1995-11-21 1997-06-06 Sony Corp 符号化処理方法、復号化処理方法、符号化処理装置および復号化処理装置
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
GB9700854D0 (en) * 1997-01-16 1997-03-05 Scient Generics Ltd Sub-audible acoustic data transmission mechanism
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
US5899969A (en) * 1997-10-17 1999-05-04 Dolby Laboratories Licensing Corporation Frame-based audio coding with gain-control words
US5913191A (en) * 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6092040A (en) * 1997-11-21 2000-07-18 Voran; Stephen Audio signal time offset estimation algorithm and measuring normalizing block algorithms for the perceptually-consistent comparison of speech signals
WO1999035758A1 (en) * 1998-01-12 1999-07-15 Sgs-Thomson Microelectronics Asia Pacific (Pte.)_Ltd. Method and apparatus for spectral exponent reshaping in a transform coder for high quality audio
JPH11234136A (ja) * 1998-02-19 1999-08-27 Sanyo Electric Co Ltd デジタルデータの符号化方法及び符号化装置
US6128593A (en) * 1998-08-04 2000-10-03 Sony Corporation System and method for implementing a refined psycho-acoustic modeler
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US7003449B1 (en) 1999-10-30 2006-02-21 Stmicroelectronics Asia Pacific Pte Ltd. Method of encoding an audio signal using a quality value for bit allocation
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
US6647365B1 (en) * 2000-06-02 2003-11-11 Lucent Technologies Inc. Method and apparatus for detecting noise-like signal components
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
JP3576935B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
US6915264B2 (en) * 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
AUPR433901A0 (en) * 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
JP2002330075A (ja) * 2001-05-07 2002-11-15 Matsushita Electric Ind Co Ltd サブバンドadpcm符号化方法、復号方法、サブバンドadpcm符号化装置、復号装置およびワイヤレスマイクロホン送信システム、受信システム
KR100464369B1 (ko) * 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
US7177803B2 (en) * 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7197083B2 (en) * 2001-12-21 2007-03-27 Intel Corporation Creation of spectral windows through the use of high rate code words
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7617100B1 (en) * 2003-01-10 2009-11-10 Nvidia Corporation Method and system for providing an excitation-pattern based audio coding scheme
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004009949B4 (de) * 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
JP4734859B2 (ja) 2004-06-28 2011-07-27 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
CN101006496B (zh) * 2004-08-17 2012-03-21 皇家飞利浦电子股份有限公司 可分级音频编码
TWI497485B (zh) * 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
JP4800645B2 (ja) * 2005-03-18 2011-10-26 カシオ計算機株式会社 音声符号化装置、及び音声符号化方法
TWI397903B (zh) * 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7797155B2 (en) * 2006-07-26 2010-09-14 Ittiam Systems (P) Ltd. System and method for measurement of perceivable quantization noise in perceptual audio coders
ATE496365T1 (de) * 2006-08-15 2011-02-15 Dolby Lab Licensing Corp Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8315398B2 (en) 2007-12-21 2012-11-20 Dts Llc System for adjusting perceived loudness of audio signals
KR101238731B1 (ko) * 2008-04-18 2013-03-06 돌비 레버러토리즈 라이쎈싱 코오포레이션 서라운드 경험에 최소한의 영향을 미치는 멀티-채널 오디오에서 음성 가청도를 유지하는 방법과 장치
CN101425293B (zh) * 2008-09-24 2011-06-08 天津大学 一种高效感知音频比特分配方法
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI643187B (zh) 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US20110257978A1 (en) * 2009-10-23 2011-10-20 Brainlike, Inc. Time Series Filtering, Data Reduction and Voice Recognition in Communication Device
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
FR2973551A1 (fr) * 2011-03-29 2012-10-05 France Telecom Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique
CN102543090B (zh) * 2011-12-31 2013-12-04 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制系统
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
IN2015DN04001A (ja) 2012-11-07 2015-10-02 Dolby Int Ab
KR20150086327A (ko) * 2012-11-16 2015-07-27 브이아이디 스케일, 인크. 시청 조건 인식 비디오 코딩을 위한 지각 전처리 필터
KR101520938B1 (ko) * 2013-04-26 2015-05-18 미디어젠(주) 음량 크기의 통계적 특성을 이용한 음량측정방법
US10045050B2 (en) 2014-04-25 2018-08-07 Vid Scale, Inc. Perceptual preprocessing filter for viewing-conditions-aware video coding
JP6492915B2 (ja) * 2015-04-15 2019-04-03 富士通株式会社 符号化装置、符号化方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2002015C (en) * 1988-12-30 1994-12-27 Joseph Lindley Ii Hall Perceptual coding of audio signals
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
JP3446216B2 (ja) * 1992-03-06 2003-09-16 ソニー株式会社 音声信号処理方法

Also Published As

Publication number Publication date
AU7364294A (en) 1995-02-13
WO1995002930A1 (en) 1995-01-26
ES2096481T3 (es) 1997-03-01
JPH09500503A (ja) 1997-01-14
AU694131B2 (en) 1998-07-16
US5623577A (en) 1997-04-22
DE69401514T2 (de) 1997-06-12
DK0709005T3 (da) 1997-07-14
DE69401514D1 (de) 1997-02-27
ATE147909T1 (de) 1997-02-15
EP0709005B1 (en) 1997-01-15
CA2166551C (en) 2005-10-11
CA2166551A1 (en) 1995-01-26
EP0709005A1 (en) 1996-05-01

Similar Documents

Publication Publication Date Title
JP3297051B2 (ja) 適応ビット配分符号化装置及び方法
US5632003A (en) Computationally efficient adaptive bit allocation for coding method and apparatus
Pan Digital audio compression
JP2906646B2 (ja) 音声帯域分割符号化装置
Johnston Transform coding of audio signals using perceptual noise criteria
KR100550399B1 (ko) 다중 오디오 채널을 저 비트율로 부호화 및 복호화하기위한 장치와 그 방법
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
EP0720148B1 (en) Method for noise weighting filtering
JP3134455B2 (ja) 高能率符号化装置及び方法
CN100361405C (zh) 利用可升级的音频编码器和解码器处理输入信号的方法
KR100397690B1 (ko) 데이터부호화장치및그방법
EP0799531B1 (en) Method and apparatus for applying waveform prediction to subbands of a perceptual coding system
EP0424016A2 (en) Perceptual coding of audio signals
EP1228506B1 (en) Method of encoding an audio signal using a quality value for bit allocation
US6466912B1 (en) Perceptual coding of audio signals employing envelope uncertainty
JP3189401B2 (ja) 音声データ符号化方法及び音声データ符号化装置
JP3297050B2 (ja) デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置
Heron et al. A 32-band sub-band/Transform coder incorporating vector quantization for dynamic bit allocation
CA2303711C (en) Method for noise weighting filtering
Najaf-Zadeh et al. Perceptual coding of narrow-band audio signals at low rates
JPH0537396A (ja) デイジタルデータの高能率符号化方法及び装置
Najafzadeh-Azghandi Percept ual Coding of Narrowband Audio

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080412

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100412

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110412

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120412

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120412

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130412

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130412

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140412

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term