JPH09500502A - デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置 - Google Patents

デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置

Info

Publication number
JPH09500502A
JPH09500502A JP7504747A JP50474795A JPH09500502A JP H09500502 A JPH09500502 A JP H09500502A JP 7504747 A JP7504747 A JP 7504747A JP 50474795 A JP50474795 A JP 50474795A JP H09500502 A JPH09500502 A JP H09500502A
Authority
JP
Japan
Prior art keywords
information
signal
spectral
spectrum
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7504747A
Other languages
English (en)
Other versions
JP3297050B2 (ja
Inventor
フィルダー、ルイス・ダン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/145,975 external-priority patent/US5632003A/en
Priority claimed from US08/190,655 external-priority patent/US5623577A/en
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JPH09500502A publication Critical patent/JPH09500502A/ja
Application granted granted Critical
Publication of JP3297050B2 publication Critical patent/JP3297050B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 本発明は、概して音声情報のような情報の低ビットレート符号化及び復号に関する。特に本発明は、高品質符号化情報の低ビットレート符号化システムにとって効率的でかつ電算的に有効な適応ビット配分及び量子化に関する。オーディオ用途においてデジタル分割帯域エンコーダは、入力信号を人の聴覚システムの限界帯域幅と比例する帯域幅を有する周波数小帯域に分割し、配分関数によって設定された値に従って小帯域信号を量子化しする。配分関数は、心理音響原理に従って復号合成フィルタバンクスペクトル歪みを許容する配分値を設定する。一実施態様においては、入力信号のパワースペクトル密度(PSD)を推定することによって、配分関数が配分値を設定し、PSDに基底膜伸張関数を適用することによって刺激パターンを発生させ、心理音響隠蔽を達成するのに十分な信号対雑音比(SNR)を特定する感度関数と等しい量だけ刺激パターンを調節し、調節されたパターンのレベルを聴力閾値と比較し、2つの中の大きい方と等しい心理音響隠蔽閾値を発生させる。配分関数は、感度関数を改変するような多くの方法の中の任意の方法で、デコーダ合成フィルタバンクスペクトル歪みを許容する。

Description

【発明の詳細な説明】 デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置技術分野 本発明は、概して音声情報のような情報の低ビットレート符号化及び復号に関 する。特に本発明は、電算的に有効な適応ビット配分及び量子化に関し、デコー ダスペクトル歪みを考慮した高品質符号化情報の低ビットレート符号化システム にとって有効である。背景 オーディオ信号及びビデオ信号処理業界においては、信号品質上の知覚可能な 損失なしに信号を表すのに必要な情報量を最低にすることに多大な関心がある。 情報要件を減らすことによって、通信チャンネル及び記憶媒体に対する信号の情 報容量は低下する。 例えば、圧縮又はダイナミックレンジ低減がなされた音声信号は、無圧縮信号 に比べてより低い情報容量要件を与える。より少ない2進ビットで符号化された デジタル信号は、信号を表すために多数のビット数を用いた符号化信号より低い 情報容量要件を与える。もちろん、知覚される信号品質を劣化させることなく実 現できる低減の量には限界がある。以下の記載は特によりデジタル技術向けであ るが、相当する記載はアナログ技術にもまた適応される。 デジタル信号の各サンプルを表すのに利用できるビット数は、デジタル信号記 号の精度を設定する。より低いビットレートは、各サンプルを表すのにより少な いビットが利用できることをを意味する。従って、より低いビットレートは、よ り大きな量子化の誤り、すなわち、量子化誤差を意味する。多くの用途において 量子化誤差は量子化雑音として表され、量子化雑音は、誤差がかなりの大きさで ある場合符号化信号の本来的品質を劣化させるであろう。 各種の分割帯域符号化技術は、各種の心理知覚効果を利用することによって知 覚的劣化なしに情報要件を低下させることを試みている。例えば、オーディオ用 では、人の聴覚系は周波数分析特性を示し、これは中心周波数の関数として変わ る可変中心周波数を有する非対称に調整されたフィルタ特性と類似している。別 個の音を感知する人の聴覚系の能力は、概して音間の周波数差が増加するにつれ て増加する。しかし、人の聴覚系の分解能は、上記フィルタの帯域幅未満の周波 数差に対しては一定のままである。このように人の聴覚系の分解能は、全オーデ ィオスペクトルを通してこれらのフィルタの帯域幅により変化する。この様な聴 覚フィルタの有効帯域幅は『限界帯域』を指す。限界帯域内の優勢信号は、当該 限界帯域外の周波数における他の信号を隠蔽するよりは恐らく当該限界帯域内の 任意の場所にある他の信号の可聴性を隠蔽するであろう。『オーディオ・エンジ ニアリング・ハンドブック』(K.Blair Benson ed.,McGraw-Hill,1988,1.40- 1.42及び4.8-4.10ページ)参照。 有効な信号帯域幅を、人の聴覚系の限界帯域に近似した帯域幅を有する、周波 数帯域に分割するオーディオ分割帯域符号化技術は、広帯域技術より心理音響効 果をより良く利用できる。概念的にこのような分割帯域符号化技術は、フィルタ バンクで信号帯域を分割し、各フィルタ帯域を通過した信号の情報要件を低減さ せて信号劣化が丁度聴取できない程度になるようにし、逆処理で原信号のレプリ カ(写し)を再構成することからなる。この様な2つの技術は小帯域(サブバン ド)符号化及び変換符号化である。オーディオ小帯域コーダ及び変換コーダは、 特定の周波数帯域において情報要件を低減させることができ、そこでは結果的に 生じる人工的所産は1以上のスペクトル成分によって心理音響的に隠蔽され、そ れゆえに符号化信号の本来的品質を劣化させることはない。 小帯域コーダは、アナログ又はデジタルフィルタを備えたフィルタバンクを利 用する各種の技術を任意に用いることができる。デジタル小帯域コーダでは、信 号サンプルから成る入力信号はデジタルフィルタのバンクを通過する。フィルタ バンクにおいてそれぞれのフィルタを通過した各小帯域信号は、当該小帯域フィ ルタの帯域幅によりさらにサンプルが抜き出される。コーダは、量子化雑音を知 覚できないようにするのに丁度十分なビットを用いて各小帯域信号の量子化を試 みる。各小帯域信号は、入力信号の一部を表すサンプルから成る。 変換コーダは、デジタルフィルタバンクを提供するために、各種のいわゆる時 間領域対周波数領域変換の任意のものを用いることができる。変換から得られる 個々の係数又は共にグループ化される2以上の隣接係数が、ここの変換係数帯域 幅の合計である有効帯域幅を有する『小帯域』を定める。小帯域内の係数が各々 の小帯域信号を構成する。コーダは、量子化雑音を知覚できないようにするのに 丁度十分なビットを用いて各小帯域内の係数の量子化を試みる。 以下の記載を通して、『分割帯域コーダ』の用語は、小帯域コーダ、変換コー ダ及び有効な信号帯域幅の各部分で作動する他の分割コード化技術を指すものと する。『小帯域』の用語は、真の小帯域コーダ、変換コーダ又は他の技術によっ て提供されるかどうかに関わらず、有効信号帯域幅の各部分を指すものとする。 上記の通り、心理知覚原理を用いる多くのデジタル分割帯域コーダは、小帯域 信号を発生させるために入力信号にフィルタバンクを適用することによって低ビ ットレートで高品質符号化を提供し、一群のビットを用いて小帯域信号を量子化 することを試みることによって、結果的に生じる量子化雑音が心理知覚隠蔽効果 のために調度知覚できないように量子化情報を発生させ、量子化された情報を伝 送又は記憶に適した形にアセンブルする。 相補的デジタル分割帯域デコーダは、符号化された信号から量子化された情報 を抽出し、小帯域信号を得るために量子化された情報を逆量子化し、原入力信号 のレプリカを発生させるために逆又は合成フィルタバンクを小帯域信号に適用す る。 小帯域信号を量子化するために配分されるビット数は、正確な逆量子化を可能 にするためにデコーダで利用されなければならない。『順方向』エンコーダは、 配分値を設定するために配分ファンクション、すなわち、配分関数を用い、これ らの配分値を『副情報』として明示的にデコーダヘ伝える。『逆方向』エンコー ダは、選択した情報に配分関数を適用することによって配分値を設定し、明示的 に配分値を伝えるよりは符号化された信号内の選択された情報を伝える。逆方向 適応デコーダは、それが符号化した信号から抽出した選択された情報を配分関数 へ適用することによって配分値を設定する。 逆方向適応エンコーダ・デコーダシステムの一実施態様においては、エンコー ダは、入力信号スペクトル包絡線の推定値を作り、配分関数を包絡線推定値に適 用することによって配分値を設定し、包絡線推定値の要素を位取り因子として用 いて信号情報の位取りを行い、設定された配分値に従って位取りされた信号情報 を量子化し、量子化した情報及び包絡線推定値を符号化された信号にアセンブル する。逆方向適応デコーダは、符号化された信号から包絡線推定値及び量子化さ れた情報を抽出し、配分関数を包絡線推定値に適用することによって配分値を設 定し、量子化された情報を逆量子化し、信号情報の位取りを反転させる。位取り は、量子化のために利用できる限られた数のビットによって表すことができる情 報のダイナミックレンジを増大させるのに用いられる。逆方向適応オーディオエ ンコーダ・デコーダシステムの2つの例が、参照によりそのすべてを組み入れた 米国特許第4,790,016号及び5,109,417号に開示されている。 逆方向適応技術は、多くの低ビットレート符号化システムにおいて魅力がある 。その理由は、明示的な配分値を伝えるのにビットを必要としないからである。 デコーダは、配分関数を符号化された信号から抽出された情報に適用することに よって配分値を再構成する。逆方向適応デコーダは、エンコーダで用いられるも のと同一又は少なくとも正確に同等な配分関数を用いなければならない。さもな ければ、デコーダにおける正確な逆量子化は保証されない。その結果、デコーダ の複雑さ又は実施コストはエンコーダのそれと同様である。デコーダの複雑さに 対する制限は、通常エンコーダ及びデコーダの双方における配分関数の複雑さに 対して制限を課し、それによってエンコーダ・デコーダシステムの全般的性能を 制限する。 概して、配分関数は、実際に実施可能な程高性能な知覚モデルに基づいたもの を用いるのが望ましい。この理由は、高性能な心理知覚モデルに基づく複雑な配 分関数は、より簡単なモデルに基づくより複雑でない配分関数によって設定され る配分値よりは、低ビットレートにおいて同等な本質的符号化品質を達成できる 配分値を達成できるからである。より良い知覚モデルを用いることに加えて、復 号処理によって導入されるスペクトル歪みを適切に許容することによって配分関 数でさらに符号化性能を改良することができる。概してこれらの歪みは、合成フ ィルタバンクの不完全さに起因する。しかし、デコーダに対する実際的な要件か ら多くの逆方向適応符号化システムは、その様な電算上集中的なモデルに基づく 配分関数を用いることができない。 順方向適応技術は、多くの高品質符号化システムにおいて魅力がある。それは 総合的なシステム性能は、デコーダにおける配分関数の複雑さに対する制限によ って束縛されないからである。すなわち、デコーダは、配分値を設定するために 配分関数を実行する必要がない。順方向適応デコーダでは、電算的に複雑さを緩 和することが可能で、エンコーダによって行われる配分関数に何等制限を加える 必要はない。さらに、改良された配分関数は、順方向適応符号化システムに組込 むことが可能で、同時に現存のデコーダとの両立性を保つことができる。エンコ ーダで用いられる配分関数は、自由なデザイン結果から選択することができる。 エンコーダの配分関数を改良できる能力は重要である。信号符号化及び信号処 理技術が進歩するにつれて、ますます高性能な配分関数が経済的に実用されてい る。配分関数の高性能化を進めることによって、所与の信号品質に対してビット レートを低減させるか若しくは所与のビットレートに対して信号品を向上させる ことができる。 しかし、これらの利点にもかかわらず、順方向適応符号化システムは多くの低 ビットレート用途に対して不適当である。それは同システムが、副情報を伝える ためにかなりのビット数を必要とするからである。概して、配分関数では、スペ クトルをより狭い、従ってより多くの小帯域に区分することによって符号化性能 を改良せんと試みるにつれて、副情報を伝えるためにさらに多くのビットが必要 になる。さらに、改良された符号化技術を通して符号化された信号の残部を伝え るのに要するビット数が減少するにつれて、この副情報を伝えるのに要するビッ ト数は、符号化された信号のより多くの部分に相当する。 従って、符号化システムの低コスト実施に適しかつ符号化処理によって生じる スペクトル歪みを適当に許容する、より高性能な知覚モデルに基づく有効な配分 関数を開発する要求がある。 人の聴取機構に基づくかなり高性能な一心理音響モデルが、Schroeder、Atal 及びHallによる『人の耳の隠蔽特性を利用した最適デジタルスピーチコーダ』で 述べられている(J.Acoust.Soc.Am.,1979年12月,pp.1647-1652)。同モデル は、1) 短時間フーリエ変換を適用することによって入力信号の短時間スペクト ル分析を行い、2) 結果的に生じたスペクトル係数を限界帯域x内に記入する ことによって入力信号限界帯域密度を入手し、3) 基底膜『伸張関数』を用いて 限界帯域密度をたたみこむことによって基底膜『刺激パターン』を発生させるこ とから成る。このモデルは、入力信号及び量子化雑音を表す雑音信号に適用され 、それぞれ『信号刺激パターン』及び『雑音刺激パターン』を発生させるように される。入力信号及び雑音信号の大きさは、それぞての刺激パターンの積分関数 によって計算される。刺激パターンが隠蔽閾値より下になる入力信号及び雑音信 号の大きさは零である。すなわち、聴取できない。隠蔽関数は、信号刺激パター ンと、隠蔽閾値を定める『感度関数』との積によって得られる。符号化性能の客 観的尺度は、雑音信号の大きさを入力信号の大きさによって除すことによって得 られる比である。同モデルは、簡単でありかつ約5kHz未満のスペクトルエネルギ に対してかなりよい結果を与えるが、電算的に集中的でかつデコーダスペクトル 歪みについて何等許容するところがない。発明の開示 本発明の目的は、高品質低ビットレート符号化・復号システムで用いるのに適 した、効率的な高性能配分関数を与えることにある。同システムは、デコーダス ペクトル歪みも適当に許容する。本発明の一面の教示によれば、エンコーダは、 入力信号を複数の小帯域xに区分して小帯域信号を発生させるようにし、配分関 数によって設定された配分値に従って小帯域信号を量子化し、量子化した信号を 入力信号の符号化された記号にアセンブルする。配分関数は、心理音響原理及び デコーダスペクトル歪み特性に従って配分値を設定する。デコーダ歪みモデルは 、配分関数を通してデコーダによって生成される後続のスペクトル歪みを考慮で きるようにする。 第1実施態様においては、1) 小帯域信号の量子化から生じる量子化雑音スペ クトルQ(x)を設定し、2) デコーダフィルタバンク周波数応答D(x)でQ(x)をた たみこむことによって復号された信号雑音N(x)を推定し、3) N(x)を設定され た隠蔽閾値M(x)と比較することによってN(x)の知覚力を設定し、4) N(x)が知 覚されないか若しくはすべての小帯域xで実質的に最低にされるかどうかを確認 し、5) もしそうなら処理を終結させ、6) さもなければ、N(x)がM(x)を越える 各小帯域xにつき、当該小帯域でN(x)に寄与する最大成分Q(x)を識別、すなわ ち、確認して、これらの成分Q(x)に対応する配分値A(x)を増加させ、上記段階 を反復させることによって、配分関数はデコーダ歪みに備える。 オーディオ符号化システム用の第2実施態様において配分関数は、量子化雑音 スペクトルの小帯域においてのみデコーダスペクトル歪みを考慮し、同小帯域に おいては、設定された隠蔽閾値のロールオフ(漸減)率と等しいか又はそれ以下 の率で、それぞれの小帯域デコーダフィルタ応答がロールオフする。この第2実 施態様の一実施例において配分関数は、約3kHz以下のこれらの小帯域において設 定された隠蔽閾値M(x)を低下させる。すなわち、同小帯域においてM(x)は、デ コーダフィルタバンク応答の低周波ロールオフよりも急速に下方周波数に向けて ロールオフする。これらの小帯域でM(x)が低減される量は小帯域の数に依存し 、閾値は、同小帯域を横切ってフィルタ応答のロールオフより急速に低下する。 隠蔽閾値M(x)の低下は、これらの各小帯域において小帯域を量子化するために 、配分関数を通して追加のビットを配分させ、それによってこれらの小帯域にお ける量子化雑音の予期された可聴性を低減させる。 配分関数を通して隠蔽閾値を設定する方法は、符号化システム性能に著しい影 響を与える可能性があるが、実施上本発明のいかなる方法も概念的に決定的では ない。オーディオ符号化システムの望ましい実施態様においては、隠蔽閾値は、 入力信号のパワースペクトル密度(PSD)を推定し、PSDに伸張関数を適用 することによって刺激パターンを発生させ、心理音響隠蔽を達成するのに十分な 周波数に依存した信号対雑音比(SNR)オフセット(残留偏差)と等しい量だ け刺激パターンを調節し、調節したパターンのレベルを聴取閾値と比較し、2つ の内大きい方と等しい隠蔽閾値を発生させることによって設定させる。 逆方向適応符号化システムにおいてPSDは、同様に符号化された信号にアセ ンブルされる情報から推定される。例えば、PSDは、スペクトル包絡線から得 られた位取り因子から推定できる。順方向適応符号化システムにおいてPSDは 、符号化された信号にアセンブルされる情報と、符号化された信号にアセンブル されない信号とから推定してもよい。例えば、PSDは、たとえ高解像度包絡線 が符号化された信号に含まれていないとしても、入力信号の高解像度スペクトル 包絡線から推定することができる。 望ましい実施態様においては、刺激パターンは、周波数領域の小帯域信号に1 以上のフィルタを適用することによって発生される。これらのフィルタは、再帰 的又は無限インパルス応答(IIR)技術若しくは非再帰的又は有限インパルス 応答(FIR)技術によって実施してもよい。いずれの技術を用いるかは、本発 明の実施上決定的ではない。 第3の実施態様においてエンコーダは、入力信号と、小帯域信号とで検知され た特性に応答して配分関数の結果に影響を与える1以上のパラメータを改変する 。例えば、上記のSNRオフセットは、総合的な符号化品質に影響を与えるよう に改変することができる。改変されたパラメータの指標から成る副情報は符号化 された信号にアセンブルされる。 第3実施態様の実施においては、改変されたパラメータを用いた結果生じた改 変された配分値は、明示的配分値として符号化された信号にアセンブルされる。 本発明の教示によるエンコーダのさらなる実施態様が可能であり、上記実施態 様の組合せを組入れたもの等がある。さらに、上記の特定の実施例につき各種の 組合せが可能である。 オーディオデコーダの第1実施態様においては、量子化された情報は符号化さ れた信号から抽出され、量子化された情報が配分関数によって設定された配分値 により逆量子化され、出力信号が逆量子化された情報に応答して発生される。配 分関数は、隠蔽閾値に基づく心理音響原理により配分値を設定する。隠蔽閾値は 、符号化された信号によって表される原入力信号のPSD推定値を入手し、PS Dに伸張関数を適応することにより刺激パターンを発生させ、心理音響隠蔽を達 成するのに十分なSNRオフセットと等しい量だけ刺激パターンを調節し、調節 されたパターンのレベルを聴取閾値と比較し、2つの内の大きい方と等しい隠蔽 閾値を発生させることによって設定される。 逆方向適応符号化システムにおいてPSDは、小帯域信号振幅と、符号化され た信号から抽出されたパワー、すなわち、軍との測定値から推定してもよい。し かし、順方向適応符号化システムにおいては、概してデコーダはいかなる配分関 数も用いない。これは明示的な配分値が符号化された信号に伝えられるからであ る。 デコーダの第2実施態様においては、配分関数の結果に影響を与える1以上の パラメータが符号化された信号から抽出される。他の実施例においては、改変さ れた配分値を表す明示的な配分値が符号化された信号から抽出される。 本発明の教示によるデコーダのさらなる実施態様が可能で、上記実施態様の組 合わせを組入れた実施態様等が含まれる。さらに、上記の特定の実施例につき各 種の組合せが可能である。 ハイブリッド適応配分を用いた符号化システムにおいて副情報は、改変された 配分値と、改変されたパラメータとだけを伝えてもよい。エンコーダ及びデコー ダの双方に知られた配分関数は、デコーダに基本的配分値を与える。副情報は、 デコーダで用いられるものと同一の配分値を得るのに必要となる、基本配分値に 対する調節手段を与える。こんな風に、エンコーダの配分関数は、現存のデコー ダとの両立性を失うことなく変えることが可能で、副情報を通してエンコーダ及 びデコーダ間の両立性を維持するのに要するビット数が低減される。 本発明は、各種の任意の技術によって実施されるフィルタバンクを有する、分 割帯域コーダにおいて用いてもよい。例えば、オーディオ符号化用途においては 、人の聴覚系限界帯域幅と比例する帯域幅を有する小帯域を用いることで、より 大きな心理音響効果を利用できるが、本発明は各種の面でそのように制限されな いことを理解すべきである。それゆえに、本明細書で用いる小帯域及び同様な用 語は、入力信号の有効帯域幅以内の1以上の周波数帯域を指すものと理解すべき である。 本発明の各種の特徴及び望ましい実施態様は、同一要素には同一参照番号を付 した添付図と共に以下の記載を参照することによりよりよく理解できるであろう 。以下の記載及び図面は例としてのみ示したもので本発明の範囲を制限するとも の理解すべきではない。例えば、本記載は特にオーディオ符号化用途に向けられ ているが、本発明はビデオ符号化のような広範な心理知覚符号化用途で実施する ことができる。図面の簡単な説明 図1は、順方向適応配分を組込んだエンコーダ・デコーダシステムのエンコー ダの一実施態様を例示する構成図である。 図2は、順方向適応配分を組込んだエンコーダ・デコーダシステムのデコーダ の一実施態様を例示する構成図である。 図3は、順方向適応配分を組込んだエンコーダ・デコーダシステムのエンコー ダの他の実施態様を例示する構成図である。 図4は、逆方向適応配分を組込んだエンコーダ・デコーダシステムのエンコー ダの一実施態様を例示する構成図である。 図5は、逆方向適応配分を組込んだエンコーダ・デコーダシステムのデコーダ の一実施態様を例示する構成図である。 図6は、ハイブリッド適応配分を組込んだエンコーダ・デコーダシステムのエ ンコーダの一実施態様を例示する構成図である。 図7は、ハイブリッド適応配分を組込んだエンコーダ・デコーダシステムのデ コーダの一実施態様を例示する構成図である。 図8は、刺激パターンを効果的に得ることができる処理の一実施態様を例示す る構成図である。 図9は、特殊な心理知覚モデルを実行する配分関数の一実施態様を例示する構 成図である。 図10a−10cは、図8の構成に組込むことが可能な単極フィルタのインパ ルス応答を例示する仮想グラフである。 図10dは、図10a−10cに示すインパルス応答を有するフィルタから成 る図8の実施態様の合成インパルス応答を例示する仮想グラフである。 図11は、一極及び1以上の零を有するフィルタに対するインパルス応答を例 示する仮想グラフである。 図11bは、図8の実施態様と類似するが、一方のフィルタが図11aのイン パルス応答を有する2つだけのフィルタから成る実施態様の合成インパルス応答 を例示する仮想グラフである。 図12a−12bは、通過帯域フィルタ周波数応答を例示する仮想グラフであ る。 図13a−13dは、分析及び合成フィルタバンクによって生じるスペクトル 歪みの効果をれ例示するスペクトルの仮想図式表示である。 図14は、デコーダスペクトル歪みモデルを組込んだ処理の一実施態様の各段 階を例示する流れ図である。 図15aは、高周波数スペクトル成分の心理音響隠蔽閾値と比較した通過帯域 フィルタ周波数応答を例示する仮想グラフである。 図15bは、低−中周波数スペクトル成分の心理音響隠蔽閾値と比較した通過 帯域フィルタ周波数応答を例示する仮想グラフである。発明のを実行様式 順方向適応配分 図1は、順方向適応配分を組込んだエンコーダ・デコーダシステムで用いられ る分割帯域エンコーダの一実施態様の基本構成を例示する。フィルタバンク10 2は路100から受信した入力信号に応答して小帯域情報を発生させる。配分関 数110は入力信号に応答して配分情報を設定し、路111を通して同配分情報 を量子化装置104及びフォーマッタ106へ伝える。量子化装置104は、配 分情報によって特定されたビット数を用いてフィルタバンク102から受信した 小帯域情報を量子化し、フォーマッタ106は、量子化された小帯域情報及び配 分情報を伝送又は記憶に適したフォーマットを有する符号化された信号にアセン ブルする。量子化された信号は、路108を通して所望の伝送又は記憶装置へ伝 えられる。 図2は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおいて用 いられる分割帯域デコーダの基本的構成を例示する。デフォーマッタ202は、 量子化された情報及び配分情報を路200から受信した符号化された信号から抽 出する。配分情報は路211を通して逆量子化装置204へ伝えられる。逆量子 化装置204は、デフォーマッタ202から受信した量子化された情報を逆量子 化することによって小帯域情報を発生させる。同情報は、配分情報によって特定 されたビット数を用いて逆量子化される。逆フィルタバンク206は、逆量子化 装置204から受信した逆量子化小帯域情報に応答して路208を通して出力信 号208を発生させる。 エンコーダ及びデコーダの代わりの実施態様が可能である。例えば、図3に示 す通り、順方向適応エンコーダは、フィルタバンク102によって発生された小 帯域情報に応答して配分情報を設定することができる。図示していないさらに他 の実施態様においては、配分情報は、入力信号及び小帯域情報の双方に応答して 設定することができる。 上記の通り、配分情報は符号化された信号に明示的に伝えられるので、順方向 適応エンコーダにおける配分関数は、現存の順方向適応デコーダとの両立性を犠 牲にすることなく変えることができる。逆方向適応配分 図4は、逆方向適応配分を組入れたエンコーダ・デコーダシステムで用いられ る分割帯域エンコーダの一実施態様の基本構成を示す。フィルタバンク102は 、路100から受信した入力信号に応答して小帯域情報を発生させる。変換器1 12は、X語及びY語から成る小帯域情報の記号を発生させる。X語は、入力と して路113を通して配分関数110及びフォーマッタ106へ伝えられる。配 分関数110は、X語に応答して配分情報を設定し、同配分情報を量子化装置1 04へ伝える。量子化装置104は、配分情報によって特定されたビット数を用 いて、路115から受信したY語を量子化することによって量子化された情報を 発生させ、フォーマッタ106は、量子化された情報及びX語を伝送又は記憶に 適したフォーマットを有する符号化された信号にアセンブルする。符号化された 信号は路108を通して所望の伝送チャンネル又は記憶装置へ伝えられる。 図5は、逆方向適応配分を組入れたエンコーダ・デコーダシステムで用いられ る分割帯域デコーダの一実施態様の基本構成を例示する。デフォーマッタ202 は、路200から受信した符号化された信号から量子化された情報情報及びX語 を抽出する。同X語は、路203を通して配分関数210へ伝えられる。配分関 数210は、X語に応答して配分情報を設定し、同配分情報を逆量子化装置20 4へ伝える。逆量子化装置204は、デフォーマッタ202から受信した量子化 された情報を逆量子化することによってY′語を発生させる。同Y′語は、配分 情報によって特定されたビット数を用いて逆量子化される。逆変換器212は、 X語及びY′語に応答して小帯域女王を発生させ、逆フィルタバンク206は、 逆変換器212から受信した小帯域情報に応答して路208を通して出力信号を 発生させる。 逆方向適応符号化システムは、符号化された信号内の副情報を伝えるのに要す るオーバーヘッドを避けることができる。その理由は、配分情報が符号化信号内 にアセンブルされたX語に酔って明示的に表されているからである。逆方向適応 デコーダは、先に逆方向適応エンコーダで行われた同一配分関数を行うことによ ってX語から配分情報を回復することができる。符号化信号の正確な復号は、エ ンコーダ及びデコーダ配分関数それ自体が同一であることは要しないが、正確な 復号は、もし2つの関数が同一組のX語に応答して同一の配分情報を得られる場 合にのみ保証し得るということを理解すべきである。ハイブリッド適応配分 図6は、本発明の教示によるハイブリッド適応配分を組入れたエンコーダ・デ コーダシステムで用いられる分割帯域エンコーダの一実施態様の基本構成を例示 する。この実施態様の構成及び作動は、上記図4で例示した逆方向適応エンコー ダの構成及び作動の関係で記載する。アダプタ120は、2つの基本的技術の1 つ又は双方を用いて配分関数110によって設定された配分情報の1以上の値を 改変する。双方の技術を実行するのに用いられる構成は、図6に例示するが、い ずれか一方の技術のみを用いることができる。 第1又は『パラメータ』技術においては、アダプタ120が配分関数110の 結果に影響する1以上のパラメータを改変する。アダプタ120によって与えら れた改変されたパラメータは、路123を通して関数110及びフォーマッタ1 06へ伝えられる。フォーマッタ106は、改変されたパラメータ及び量子化さ れた情報の表示を、伝送及び記憶に適したフォーマットを有する符号化された情 報にアセンブルする。 第2又は『値』技術においては、アダプタ120が配分情報の各々の値に対す る1以上の新しい値を改変する。アダプタ120によって与えられた改変値は、 路121を通してフォーマッタ106及びマージ118へ伝えられる。マージ1 18は、改変値を配分関数110から受信した配分情報と併合し、併合した配分 情報を量子化装置104へ伝える。フォーマッタ106は、改変された情報及び 量子化された情報の表示を、伝送及び記憶に適したフォーマットを有する符号化 された信号にアセンブルする。 図6に例示する実施態様は、路100から受信した入力信号、路103から受 信した小帯域情報及び路113から受信したX語に応答するアダプタ120を示 す。ハイブリッド適応エンコーダの代わりの実施態様においては、アダプタ12 0は3つの路の任意の1つに応答し、3つの路の任意の組合わせに応答し、他の 情報に応答することができる。 図7は、本発明の教示によるハイブリッド適応配分を組入れたエンコーダ・デ コーダシステムで用いられる分割帯域デコーダの一実施態様の基本構成を例示す る。この実施態様の構成及び作動は、上記図5で例示した逆方向適応デコーダの 構成及び作動の関係で記載する。配分情報の1以上の値が、上記のものと同様な 基本的技術の1つ又は双方のいずれかを用いて改変される。双方の技術を実行す るのに用いる構成は図7に例示するが、いずれか一方の技術のみを用いることが できる。 第1又は『パラメータ』技術においては、デフォーマッタ202が、符号化さ れた信号から、配分関数210の結果に影響する1以上の改変されたパラメータ を抽出し、路213を通して改変パラメータを配分関数210へ伝える。 第2又は『値』技術においては、デフォーマッタ202が、符号化された信号 から1以上の改変された値を抽出し、路205を通して改変値をマージ218へ 伝える。マージ218は、改変値を配分関数210から受信した配分情報と併合 し、併合された配分値を逆量子か装置204へ伝える。実施 以下に示す各種の構成図は、エンコーダ及びデコーダの機能的な基本構成を例 示する。以下に記載するファンクション(関数)は、ハードウエア、ソフトウエ ア又は2者の組合わせで実施することができる。フィルタバンク 図1−7に例示した実施態様は、広範な各種の形で実施できる。例えば、フィ ルタバンク102及び逆フィルタバンク206は、直角位相ミラーフィルタ(Q MF)、多相フィルタ及び各種のフーリエ変換等、当業界で知られた各種のデジ タルフィルタ技術によって実施できる。望ましい実施態様では『時間領域エイリ アシング相殺(TDAC)』変換を用いる。同変換は、Princen、Johnson及 びBradleyによる『時間領域エイリアシング相殺に基づくフィルタバンクデザイ ンを用いた小帯域・変換符号化』(Proceedings Int.Conf.Acoust.,Speech,a nd Signal Proc.,1987年3月,pp.2161-2164)に開示されている。TDAC変換 を有するフィルタバンクを実施する変換エンコーダ・デコーダシステムの例は、 上記米国特許第5,109,417に記載されている。 本発明の実施上決定的な特定の実施例はない。本明細書における本発明の記載 は、特にデジタル分割帯域符号化の実施例に向けられているが、本発明の各面を 組入れたエンコーダ・デコーダシステムは、アナログフィルタバンクも用いるこ とができることを理解すべきである。例えば、フィルタバンク102は、1以上 のアナログフィルタ及び各小帯域信号に対してデジタルサンプルを発生させるア ナログ・デジタル変換器(ADC)で構成してもよい。逆フィルタバンク206 は、デジタルサンプルに応答してアナログ小帯域信号を発生させるデジタル・ア ナログ変換器(DAC)及びアナログ小帯域信号を合成アナログ出力信号に結合 する成分で構成してもよい。変換器 同様にX語及びY語を発生させかつ回復させる変換器112及び逆変換器21 2も、広範な各種の形で実施できる。既に述べた通り、X語は、配分関数を知ら せるためにエンコーダ及びデコーダの双方で利用できる。概してX語は、位取り 因子に相当し、Y語は、位取り因子に従って位取りされた値に相当するであろう 。各種の数量の浮動小数点表示を用いる実施態様においては、X語は、浮動小数 点指数に相当し、Y語は、浮動小数点仮数に相当するであろう。 実施例の中には、Y語のグループ又はブロックが共通X語指数と関連ずけられ て、ブロック浮動小数点(BFP)表現を形成するものもある。しかし、各Y語 仮数をそれぞれのX語指数と関連させることによって、X語から高解像度スペク トル包絡線が得られる。量子化装置 量子化装置104及び逆量子化装置204によって用いられる特定な関数は、 本発明の実施上決定的ではないが、2つの関数は相補的でなければならない。概 して、同一配分値を前提とすれば、逆量子化関数d(x)は量子化関数q(x)の逆で、 元の量xは、ほぼd[q(x)]と等しい。厳密に等しいことは期待されていない。そ れは、量子化では常に若干の精度を失うからである。 配分値に応答して量子化装置104は、幾つかの方法でその量子化関数を改変 することができる。例えば、量子化装置104は、配分値に従って量子化レベル 数を設定できる。3ビット及び2ビットの配分を示す値に応答してそれぞれ8レ ベル量子化関数及び4レベル量子化関数を用いることができる。他の例としては 、量子化装置104は、特定したレベル(例えば6ビット)と等しいか又はそれ より大きい配分値に応答して対数量子化関数を用い、より小さい値に応答して線 形量子化関数を用いることができる。 量子化装置104は、対称及び非対称関数間のスイッチ転換によって若しくは 特定範囲の振幅を表すために1以上の量子化レベルを適応的に用いることによっ てその量子化関数を改変してもよい。例えば、Nビット量子化関数は、2N量子 化レベルの1つを『小零』量子化レベルとして保留することができる。さもなけ れば大振幅を表すために用いられる、このような量子化レベルは、その代わりに 非常に小さい振幅を表すのに用いられる。このような量子化関数を用いることに よって、エンコーダはデコーダを通して、零値に量子化される小振幅信号と、『 小零』量子化レベルに量子化される極小振幅信号とを容易に区別することができ る。 配分値に応答して逆量子化装置204は、量子化装置104がその量子化関数 を改変する方法と相補的な方法でその逆量子化関数を改変する。併合 マージ118及びマージ218によって用いられる方法は、本発明の実施上決 定的ではない。概念的にマージ118及びマージ218は、1組の配分値及び1 組の改変された値からの対応する値を1組の値に結合する。これは各種の方法で 行うことができる。例えば、配分値は対応する改変値で置き換えてもよい。分割 帯域エンコーダにおいて各配分値は、それぞれの小帯域で小帯域信号を量子化す るために用いるビット数を表す。各改変値は対応する配分値にとって代わり、そ の代わりに量子化装置によって用いられる。 他の例として、対応する配分値を調節するために改変値を用いることによって 2組の値を結合してもよい。例えば、改変された値は増分量を表すことが可能で 、同量によって対応する配分値を変えるようにされる。分割帯域エンコーダにお いては、特定の小帯域で小帯域信号を量子化するのに用いられるビット数は、も し改変された値が符号化された信号中にあるなら、それぞれの配分値及び対応す る改変値の代数和によって定めることができる。その代わりに改変された値は、 対応するは配分値が位取りされるべき因子を表すことができる。フォーマッタ 符号化された信号が直列ビットストリームによって表される多くの符号化シス テムにおいては、フォーマッタ108及びデフォーマッタ202によって与えれ る関数は、ほぼ直列ビットストリーム多重化(マルチプレクシング)及び逆多重 化(デマルチプレクシング)にそれぞれ相当する。フォーマット及びデフォーマ ット関数の実行は、特定の用途にとっては重要であるが、本発明の実施上決定的 ではない。符号化された信号を伝送又は記憶に適した形にしかつ定様式表現から 符号化された信号を回復することができるものなら、あらゆる処理を行ってもよ い。配分関数 概観 配分関数110は、もし可能なら、復号された信号で結果的に生じる量子化雑 音が隠蔽閾値を越えないように配分値を設定する。本明細書の記載は特にオーデ ィオ符号化システムに向けられているが、提起された概念は、ビデオ符号化のよ うな広範な用途で用いることができる。例えば、ビデオ用途においてこれらの概 念は、各種の特性に応答して隠蔽閾値を設定する心理視覚モデルに適用すること ができる。各種の特性としては、見掛けの色相、彩度、輝度並びに視覚刺激の大 きさ、視界内の他の刺激の対応特性及び現刺激の前に見た他の刺激の特性等があ る。 隠蔽閾値は、人の知覚モデルを適用することによって設定される。図9は、Sc hroeder 他による上記モデルと類似の、心理音響モデルを実行する数段階から成 る、一実施態様の構成図である。この実施態様では、パワースペクトル密度40 2が、路400から受取った入力信号のパワースペクトル密度(PSD)を 推定し、限界帯域密度404が、限界帯内にPSDを写像することによって入力 信号の限界帯域密度を入手し、刺激パターン406が、基底膜伸張関数を限界帯 域密度情報に適用することによって基底膜刺激パターンを発生させ、感度関数4 08が、心理音響隠蔽を達成するのに十分な信号対雑音比(SNR)と等しい量 だけ刺激パターンを調節することによって中間隠蔽閾値を発生させ、知覚閾値4 10が、中間隠蔽閾値及び人の能力の閾値の中の大きい方と等しい隠蔽閾値を発 生させ、配分値412が、能力閾値及び路405から受取った限界帯域密度情報 に応答して配分値を設定して、路414を通して配分値を伝える。 図9に示した段階の中には、異なった順序で結合又は遂行できるものがある。 例えば、パワースペクトル密度402及び限界帯域密度404は、幾分逆にする ことができる。すなわち、第1に入力信号のスペクトル成分を限界帯域内へ写像 し、その後写像した成分のパワースペクトル密度を推定することによって限界帯 域密度を発生させる。他の例としては、中間隠蔽閾値を発生させるために適切な 伸張関数を直接入力信号PSDに適用することによって、404乃至408の段 階を単一段階に結合することができる。 以下の記載は、特に上記及び図9に示した各段階の変化を組入れた実施態様に 向けられる。これらの段階の記載は、各種の概念を説明するために用いられるが 、段階それ自体は、本発明の実施上必要ではない。各種の実施態様で、異なった 段階から成る他の知覚モデルを組入れることができる。 知覚モデルのみに基づく配分関数の基礎をなす概念につき最初に述べる。しか し、符号化システムのスペクトル歪みのために知覚モデルのみに基づく配分関数 によって設定される配分値は、常に正しいとは限らない。配分関数の記載に続き 、符号化システムのスペクトル歪み及びこのような歪みが許容できる幾つかの方 法につき述べる。パワースペクトル密度 図1及び3に示すような順方向適応システムのエンコーダは、路100、10 3から受取った情報からの入力信号のPSDを推定することができる。例えば、 高速フーリエ変換(FFT)によって実行されるフィルタバンクを組込んだシス テムにおけるPSDは、結果的に生じる各変関係数の大きさの平方から得る ことができる。しかし、図4に示すような逆方向適応システムにおけるエンコー ダは、概して路113から受取ったX語からPSDを推定する。 各スペクトル成分Cの振幅が、指数X及び仮数Yから成る従来の2進浮動小数 点形で表される一実施態様においては、dBで表されるスペクトル成分のパワー 、すなわち、幕は、指数の値から直接推定できる。各指数の値は、関連する仮数 を正規化するのに用いられる2の羃又はC=Y・2-Xである。この表現から各ス ペクトル成分の羃は次のような式から推定できる。 iは、スペクトル成分Ciに対する浮動小数点指数の値である。 望ましい実施態様における各スペクトル成分Cは、正規化された仮数Y及び指 数Xから成る浮動小数点の形で表される。PSDは、1以上のスペクトル成分を 帯域内にグループ化し、各帯域におけるスペクトル成分に対する指数の『対数和 』を得ることによって推定される。対数和を計算する一方法は、以下に述べる。 概念的に、本発明の実施上決定的なPSD推定方法はない。しかし、実際問題 として方法の正確さは符号化システム性能に著しい影響を与える。限界帯域密度 分割帯域符号化システムは、入力信号を限界帯域幅の半分未満の帯域幅を有す る小帯域に分割することによって、より多くの心理音響効果を利用できる。通常 これは必要である。それは符号化システムの小帯域が、可変中央周波数を有する 人の知覚系限界帯域とは異なり、固定された中央周波数を有するからである。優 性スペクトル成分が、限界帯域幅を有する分割帯域コーダ小帯域全体に亘って他 の低レベルスペクトル成分を隠蔽するという不正確な想定が時々なされている。 この想定は正確とはいえない。スペクトル成分の両側において限界帯域幅の半分 の周波数間隔の外側で優性スペクトル成分の隠蔽効果が減少するからである。も しこの優性スペクトル成分が符号化システム小帯域の縁で起こるなら、小帯域の 帯域幅が限界帯域幅の半分未満でない限り、同小帯域内の他のスペクトル成分は 実際の限界帯域幅の外側で起こり得る。 一実施態様においては、入力信号PSDは、各々が人の聴覚系の約一限界帯域 幅の帯域幅を有する帯域内に写像される。帯域の各々は、1バーク(Bark)の幅を 有する。望ましい実施態様においては、入力信号PSDは、人の聴覚系の約半分 の限界帯域幅の帯域幅又は約半バークの幅を有する『副限界帯域』内に写像され る。この望ましい写像は、表1に示すエントリ(項目)によって表される。 代わりの写像関数及び帯域幅が、本発明の概念から逸脱することなく使用でき る。例えば、Schroeder他から、約5kHZ未満の周波数fを以下の式によって限界 帯域内へ写像できる。 ここで、x=限界帯域数 以下の記載を簡単にするために、『限界帯域密度』の用語は、限界帯域幅及び 副限界帯域幅を含む任意の好都合な帯域幅の周波数帯域内へ写像される入力信号 PSDを指すものとする。入力信号の限界帯域密度は、以下の式による適切な写 像関数から得ることができる。 デジタル分割帯域符号化システムの実施態様の中には、S(x)が、約6dB の倍数である値を持つ信号限界帯域密度の対数幕の離散関数であるものもある。 限界帯域密度情報は、隣接小帯域x間の変化が±12dBを越えないようにS( x)の値を制限することによって効果的に区別して符号化することができる。ス ペクトル情報の微分符号化は、米国特許出願第08/115,513(1993年8月31日出願 の同特許は参照により本明細書に組入れる)にさらに詳しく開示されている。刺激パターン 刺激パターンは、入力信号の間隔によって表される音響的パワー(力)から生 じる基底膜に沿ったエネルギ分布の概略を示す。刺激パターンは次の関数のたた みこみから計算できる。 E(x)=S(x)*B(x) (4) ここで、E(x)=は、入力信号から生じる刺激パターンで、 B(x)=は、基底膜伸張関数である。 Schroeder他は、限界帯域幅を有する周波数を横切る伸張関数に対する好都合な 分析式を与えている。周波数帯域x0のスペクトル成分から生じる周波数帯域x 内の伸張レベルを与える同式をは次に示す。 入力信号限界帯域密度S(x)及び伸張関数B(x)のたたみこみは、電算上 集中的で、N・M等級の電算的複雑性を有する。ここで、NはS(x)内の点、 の数、MはB(x)内の点の数である。 入力信号のスペクトル表現を濾波することによって実際的手法で刺激パターン が得られる。この濾波は、本明細書で述べた写像された周波数領域及び写像され ていない周波数領域のような『スペクトル領域』内で行われる。 図8は、刺激パターンをより効率的に得ることができる、N等級の電算的複雑 性を有する処理の一実施態様を例示する。こに実施態様によれば、入力信号限界 帯域密度を伝える情報は、路300から受取られ、3つのフィルタを通され、刺 激パターンを形成するために結合される。 PSDは、パワーの線形表現、対数表現又は他の表現として位取りされる。も しPSDが入力信号パワーの線形表現でありかつより高い周波数帯域がほぼ一定 のバークで表される帯域幅を有するなら、これらのフィルタは、次の帰納的式に よって表される伝達関数を有する単極IIRフィルタとして実施できる。 Fi=ai(x)・S(x)+bi(x)・Fi(x−1) (6) ここで、ai(x)=フィルタiの利得因子 bi(x)=フィルタiの減衰率 F1(x)=周波数帯域xにおけるフィルタ302の出力 F2(x)=周波数帯域xにおけるフィルタ302の出力 F3(x)=周波数帯域xにおけるフィルタ310の出力 フィルタ302、304及び310の仮想インパルス応答は、それぞれ図10 a−10cに例示する。 もしPSDが入力信号パワーの対数表現なら、フィルタ計算は対数パワー領域 でより効率的に行うことができる。これらの計算を行う一方法を以下に述べる。 もしより高い周波数帯域xが、ほぼ一定のバークで表される帯域幅を持たない なら、1以上のフィルタに対してより複雑な伝達関数を要するであろう。例えば 、もし周波数帯域が一定の帯域幅を持つなら、フィルタ302は、次のような伝 達関数で1以上の零を有するのが望ましい。 ここで、Ri=周波数帯域xにおけるフィルタFiの零の数 事実上式7の第3項は、インパルス応答における指数関数的減衰を遅らせる。 仮想インパルス応答を図11aに示す。各零は一周波数帯域の『遅延』を加える 。概して、より高い周波数帯域に対してはより多くの零が用いられる。例えば、 帯域幅20kHzの入力信号のPSD内の各要素が、512点変換によって発生され た変換係数に相当するなら、最高周波数帯域に対しては多分10に及ぶ零を必要と するであろうが、約500Hz未満の帯域に対しては、零は必要としない。 伸長関数の精度は、周波数帯域数xの関数であるフィルタ係数を用いることに よって、より高い電算的複雑性を犠牲にして改良することができる。帰納項係数 bi(x)が、より高い周波数におけるスペクトル成分に対してより多くの伸長を与 えることが望ましい。しかし、入力信号PSDを適切な帯域幅を持つ1組の周波 数帯域内へ写像することによって、ほぼ不変な帰納項係数biを用いて、適度な 精度を有する伸長関数を得ることができる。帰納項係数biの多少の変化は、多 分より低い周波数帯域のための多くの符号化システムでより必要とされる。それ は限界帯域幅が遥かに狭いからである。 フィルタ特性は、符号化用途の必要性により設定できる。これらのフィルタは 、写像された周波数領域である、周波数帯域領域で作動することは強調すべきで ある。フィルタの減衰項は、基低膜に沿った音響エネルギの伸長を表すと共に伸 長関数を有するたたみこみによって与えられるものと類似の効果を与える。 図8を参照すると、反転要素308は、フィルタ310によって瀘波するのに 先だって路300から受取った情報の周波数帯域反転を行い、反転要素312は 、瀘波された出力の周波数帯域反転を行う。2つの反転要素及びはさまれたフィ ルタは、刺激周波数より下方の周波数における基低膜に沿った伸長関数を表す。 成分306及び314は、それぞれの入力の和をとる。成分314から生じる 和、すなわち、計算された刺激パターンは、路316を通して伝えられる。図1 0dは、図8に示した構成の合成応答、すなわち、図10a−10cに示す特性 を有するフィルタを組込んだものを示す。もし路300から受取った限界帯域密 度情報が、対数パワー領域内で表されるなら、成分306及び314によって計 算された和は対数和である。対数和を計算する一方法は以下に述べる。 多くの変わりの実施態様が可能である。例えば、より低い電算複雑性を有する 実施態様は、フィルタ302、304及び成分306だけから成り、成分306 が、単に2つの内大きい方を選択することによって2つの瀘波された出力を結合 することができる。このより簡単な実施態様によって得られた結果は、多くの高 品質符号化用途において受容される。例えば、図11bは、この実施態様の仮想 合成インパルス応答を例示し、そこではフィルタ302が図11aのインパルス 応答を有し、フィルタ304が図10bのインパルス応答を有する。表IIは、フ ィルタ302に対してフィルタ係数a1(x)及びb1(x)を示し、フィルタ304に 対してフィルタ係数a2(x)及びb2(x)を示す。これらの係数は、表Iに示すPS D写像を用いた実施態様で用いるのに適している。係数は、対数パワー領域で用 いるためにdBで表されるが、表内の項目を10で除し、商の真数をとることによ って、線形パワー領域で用いるための係数に容易に変換できる。 例えば、フィルタは、IIRフィルタ、FIRフィルタ又は格子フィルタとして 実施してもよいが、通常電算上より効率的なので概してIIRフィルタが好まれる 。電算上の複雑性は、対数パワー領域でフィルタ計算を行うことによってさらに 低下させることができる。パワー領域における式6を計算するのに要する多重化 は、対数パワー領域、すなわち、次の式における加法として実施できる。 logA=log[ai(x)・S(x)]=logai(x)+logS(x) (8) logB=log[bi(x)・Fi(x-1)]=logbi(x)+logFi(x-1) (9) 式6の2つの項の加算は、対数パワー領域では簡単に行うことはできない。この 加算、すなわち、『対数和』は、次の恒等式を用いて行うことができる。 log(A+B)=max(logA,logB)+log[1+exp(-|logA-logB|)] (10) ここで、exp(y)=量yの真数。適切な範囲の|logA-logB|に対して次式のルック アップ表を作ることによって、 log[1+exp(-|logA-logB|)] (11) 式6における加算は、1) logA及びlogB間の差の絶対値を見出だし、2) この差 を手がかりとして用いてルックアップ表から値を入手し、3) ルックアップ表か ら得た値をlogA及びlogBの大きい方に加える事によって対数パワー領域で行う ことができる。この手段は本発明の実施上肝要ではないが、多くの実施態様にお いて電算上の複雑性を低減させるのに有効である。 ルックアップ表は適切に縮小可能である。その理由は、|logA-logB|の差が 約24dBを越える場合には小さい項は本質的に無視されるからである。言い換える と、表中の項目を零に等しいと仮定することによって、約24dBより大きい差につ き適度に正確な対数和の近似値を得ることができる。感度関数 心理音響隠蔽効果の基礎は、人の聴覚システムが音響エネルギの存在によって 感度が低下すると言うことである。孤立している時には聞き取れる低レベル信号 は、遥かに大きい信号を伴う場合には聴取できない。Shroeder他の『感度関数』 w(x)は、人の知覚システムが減感される程度を近似する。限界帯域x以内の心理 音響隠蔽を保証するのに必要なSNRを与えるこの関数は、次式で表すことがで きる。 10log10w(x)=-(15.5+x)dB (12) より簡単な手法では、必要なSNRを簡単に一定の20dBに設定するw(x)=- 20dBの感度関数を用いる。 最大デジタル値が105dB SPLを表す望ましい実施態様においては、たとえ再 生システムの音量調整が非常に高いレベルに設定される場合であっても、低振幅 スペクトル成分による隠蔽を保証するために控え目のレベルが用いられる。この 感度関数次式で表される。 この式は表Iに示すPSD写像を用いる実施態様で用いるのに適する。 中間隠蔽閾値Z(x)は、感度関数w(x)によって特定される量だけ相殺さ れた、刺激パターンE(x)に関して定められる。対数パワー領域における中間 閾値は次式で与えられる。 Z(x)=w(x)+E(x) (14) 線形パワー領域においては、次式で与えられる。 Z(x)=w(x)・E(x) (15)隠蔽閾値 定義により、聴力閾値未満の音響エネルギは聞き取れない。従って、量子化雑 音が隠蔽されることを保証するのに必要なSNRは、聴力閾値より低いあらゆる 量子化雑音を抑制する必要はない。当業界では聴力閾値は適切に定められている 。例えば、ISO標準226 は、ISO標準ハンドブック(Acoustics,1990,pp. 20-25)で『最低可聴領域』の等音量曲線に関する情報を提供している。関数θ( x)は、ここではこの閾値の分析的式を表す。 心理音響隠蔽閾値M(x)は、聴力の閾値を中間隠蔽閾値と比較し、2閾値の 大きい方を選ぶことによって得ることができる。これは次式で表せる。 X(x)=max[Z(x),θ(x)] (16)配分値 簡単な実施態様におけるビットは、必要なSNRの各6dBに対して1ビットの 割合、すなわち、次式で配分できる。 ここで、A(x)=周波数帯域x内の各スペクトル成分に対する配分値。 望ましい実施態様では、ルックアップ表によりさらに効率的配分が得られる。 隠蔽閾値M(x)に対する推定されたスペクトルパワーS(x)に必要なSNR は、ルックアップ表探索の手がかりとして用いられ、表内の各項目は必要とされ るSNRを達成するのに要する量子化レベルの数を表す。 ルックアップ表の項目は、当業界で周知の量子化関係に基づかせ、各種の先行 技術の符号化システムで用いてもよい。従って、本発明の実施上決定的となる特 定なルックアップ表はないが、実際問題として、ルックアップ表の項目は符号化 システムに著しい影響を与えることができる。 特定な符号化システムに対して表内の項目を引き出す一方法は、スペクトル情 報を強制的に所与の量子化レベル数に量子化する量子化関数を組込んだ符号化シ ステムから生じるSNRを測定することである。例えば、表IIIは、それぞれ3 つの量子化レベル及び5つの量子化レベルを有する量子化関数を用いる符号化シ ステムの特定な実施態様によって、8.21dB及び11.62dB のSNRがいられること を示す。この表の項目によれば、8.21dBより大きいが11.62dB 以下のSNRを要 するスペクトル成分には、5つのレベルに量子化するのに十分なビットを配分す べきである。 この実施においては、表の下限は、0dB における零量子化レベルで、表の上限 は、ここでは『配分天井』と呼ぶかなりの最大ビット数に設定される。表IIIに しめす例によれば、配分天井は、16ビットで表すことができる、65,536量子化レ ベルに相当する。 多くの符号化システムにおいて、配分値の合計は特定なビット数に限定される 。もし配分ビット数が限られたビット予算を越えるなら、配分関数はそれに応じ て配分値を訂正しなければならい。もし配分ビット数が限られたビット未満なら 、残りのビットの利用を最適化するように配分値を訂正するのが望ましい。 実施態様の中には、隠蔽閾値M(x)のレベルを調節し、配分値を再計算する ことによって配分値が改善されるものがある。隠蔽閾値を上昇及び下降させると きは、聴力の閾値を考慮するのが望ましい。一実施態様においてこれは、幾つか の又はすべてのスペクトルを横切って中間隠蔽閾値Z(x)を上下させ、配分さ れた合計ビット数がビット予算に十分近くなるまで式16により隠蔽閾値を再設定 することによって行われる。論考を容易にするために、配分値を改善するために なされる一切の調節をする前に、知覚モデルから得られた初期又は『理想』隠蔽 閾値を参照するために表示M0(x)が用いられる。 一実施態様において隠蔽閾値は、M0(x)隠蔽閾値に関して72dBまで下降さ せ、24dBまで上昇させることができる。これらの調節は、それぞれ約12ビットの 追加配分及びスペクトル成分当たり4ビット少ない配分を行うことに相当する。 当初、隠蔽閾値は、2つの極限値72dB及び-24dB間の中間にある、M0(x)より 24dB下方のレベルに設定される。2進探索技術で、隠蔽閾値に対する粗い調節が なされ、合計ビット配分をビット予算と等しいか又はそれ以下の値に収斂させる ようする。2進探索による粗い調節は、合計ビット配分がビット予算と等しくな るか又は隠蔽閾値に対する調節増分が1.5dB未満になるまで繰り返される。これ らの粗調節に続いて、隠蔽閾値に対して2進探索による細かい調節がなされ、合 計ビット配分をビット予算により近く収斂させる6dB低いレベルを設定するよう にさせる。2進探索による細かい調節は、合計ビット配分がビット予算と等しく なるか又は隠蔽閾値にたいする調節増分が0.375dB未満になるまで繰り返される 。調節された閾値とM0(x)との差が符号化された信号内に伝えられ、収斂処 理を繰り返すことなくデコーダを通して直接配分値を設定するようにされる。 この同一の粗・細調節処理は、多重チャンネル符号化システムでも用いること が可能で、同システムにおいてビットは、共通のビットのたくわえからすべての チャンネルのスペクトル成分に配分される。代わりの実施態様において粗い調節 は、全チャンネルに共通の隠蔽閾値に対してのみ行われる。全チャンネルに対す るすべての配分が十分に収斂した後、個々のチャンネルと関連する隠蔽閾値に対 する細かい調節が、すべての配分されたビットがビット予算と等しくなるか若し くは十分近くなるまで行われる。細かい調節は、1) 各チャンネルにつき順繰り にそれぞれの隠蔽閾値に対して、収斂するまですべてのチャンネルを横切って調 節することにより一回の調節を完成させるか又は、2) 最も優先するチャンネル から始めて最低順位のチャンネルに進むように、各チャンネルにつき順繰りにそ れぞれの隠蔽閾値を収斂するまで調節することによって行ってもよい。 今述べた多重チャンネルに対するものと類似の処理は、1以上のチャンネルを 有する他の符号化システムで用いてもよい。ビットは、延長された時間周期に亘 って共通のビットのたくわえからスペクトル成分へ配分することができる。例 えば、変換符号化システムにおいては、多重ブロックに対するすべての配分がビ ット予算近くで十分収斂するまで、変換係数の多重ブロックを横切った配分に対 して粗調節が行われる。細かい調節は、各ブロックにつき順繰りにそれぞれの隠 蔽閾値に対し、収斂するまですべてのブロックを横切って調節することにより行 われる。この処理は、小帯域符号化システムのような他の分割符号化システムに 適用できる。それはまた多重チャンネル符号化システム用にも改変できる。 これらの例が示す通り、収斂処理における多くの変形が可能である。もし特定 の実施において配分天井が用いられなら、収斂処理では配分値がこの天井を越す ことを許すべきではない。 もしビット予算以内ですべてのビット配分を行うために隠蔽閾値を上げるなら 、1以上の『中間』スペクトル成分が、初期閾値M0(x)は越えるが、調節さ れた閾値M(x)は越えないようにすることが可能である。式17によると、これ らの中間スペクトル成分はいかなるビットも配分されず、それゆえに符号化され た信号から除外される。この除外は、特に除外が断続的な場合には知覚可能かも しれない。例えば、持続音の高調波は、スペクトルのどこかにかなりの音響エネ ルギを有する合間を通じて断続的に除外されるかも知れない。 もしビットがこれらの中間スペクトル成分に配分されるなら、ビット予算は、 より大きなスペクトル成分への配分を低下させることによって釣合わせることが できる。しかし、その結果生じるより大きなスペクトル成分の符号化品質上の劣 化が多分知覚可能であろう。ビット配分は、一方においては中間スペクトル成分 を除外する知覚可能な影響と、他方においてはより大きなスペクトル成分の符号 化品質を低下させることとの間の釣合いをとるように行うことが望ましい。 一実施態様においては、この様な釣合いを達成する試みは、最低数のビットの みをすべての中間スペクトル成分に配分することによって行なっている。特定な 実施方法においては、最低数の量子化レベルを有する量子化関数を用いてすべて の中間スペクトル成分を量子化することによってこれが達成される。 他の実施態様においては、限られた周波数範囲内におけるそれらの中間スペク トルのみに最低数のビットを配分することによってバランスをとるようにしてい る。この範囲は調節された隠蔽閾値を越える最高周波数スペクトル成分から符号 化された信号帯域の上限まで伸びている。 さらに別の実施態様においては、調節された隠蔽閾値よりあるレベル、例えば 、わずかに9dB低いそれらの中間スペクトル成分のみにビットを配分することに よって釣合いをとるようにしてもよい。この実施態様の変形においては、調節さ れた隠蔽閾値未満のレベルは、中間スペクトル成分に配分されたビット数がビッ ト予算の百分率を越えないことを保証するために修正される。他の例として、こ れらの中間スペクトル成分に配分されたビット数は、これらの配分が起こる周波 数範囲の帯域幅を制御することにより釣合いをとってもよい。 これらの中間スペクトル成分へのビット配分の知覚可能な結果は、これらの配 分が変えられる率を制御することによって低減させることができる。例えば、中 間スペクトル成分は、数百ミリセカンドの間隔に亘る配分帯域幅を低減させるこ とによって配分から除外することができる。実際上、中間スペクトル成分を除外 するのに用いられる基準の修正は低域瀘波フィルタに支配される。残留ビット配分 これまでに配分されたビット数がビット予算未満なら、残りのビットは任意の 方法で配分できる。一実施態様においては、2段階処理が用いられる。すなわち 、1) 最低周波数帯域から始めて高周波数に向けて、もしa) それぞれの配分値が 零を越えかつ配分天井未満であるか又はb) 配分値が零でかつ第1段階開始時点 で隣接周波数に対する配分が零を越えていたなら、周波数帯域への配分を増加さ せ、2) ビットが残っている間は、もしそれぞれの配分値が配分天井未満なら、 最低周波数帯域から始めて高周波数に向けて各周波数帯域につき配分値を増加さ せる。残りのビットが無くなるまで段階2を繰り返す。 残りのビット配分は、収斂処理を通してビット予算の十分近くまで収斂させ、 残留ビットがもしあっても非常に少なくなるようにすることによって回避するか 若しくは最小にすることができる。デコーダスペクトル歪 概観 各種の分割帯域符号化システムで用いられる分析及び合成フィルタバンクは、 複数の通過帯域フィルタから成ると考えてよい。図12aは、理想的通過帯域 フィルタの周波数応答を例示する。同フィルタは、通過帯域500における一定 利得、通過帯域遮断周波数における無限に急勾配の転移502、504及び停止 帯域における零利得を有する。 図12bは、実際の通過帯域フィルタの周波数応答を例示する。理想的フィル タとは異なり、多くの実際的通過帯域フィルタは、通過帯域で変化する主ローブ 500、通過帯域及び停止帯域間の転移領域における有限な通過帯域スカート5 02、504及び多分サイドローブを有する、可変利得を与える停止帯域506 、508を含む。通過帯域の幅、転移領域における減衰率及び停止領域のレベル は、フィルタデザインによって互いにかね合いとなるフィルタ応答特性である。 図13a及び13bは、図12aに示すものと類似の周波数特性を有する通過 帯域フィルタから成る分析フィルタバンクによって生じる仮想的グラフを例示す る。図13aは、2つのスペクトル成分600、610から成る信号の真のスペ クトルを例示する。図13bは、それぞれ真のスペクトル成分600及び610 に応答して分析フィルタバンクによって瀘波されるスペクトルを例示する。スペ クトルの形状は、原信号の真のスペクトルを用いた分析フィルタバンク周波数特 性のたたみこみから設定できる。通過帯域フィルタの非理想的周波数応答は、分 析フィルタバンクを通して真のスペクトル成分の形状を不鮮明にさせる。 信号分析に用いられる非理想的フィルタバンクの特性は、概してよく理解され ている。例えば、分析ウインド(窓)の離散フーリエ変換に対する効果は、Harr isの『離散フーリエ変換を用いた高調波分析のためのウインドの利用』(Proc. of IEEE、1978年、第66巻、51-83頁)に記載されている。幾つかのデジタル直角 位相フィルタの応答特性がBarnwellの『帰納的直角位相フィルタ及び最適ADP CMコーダ内臓小帯域コーダデザイン』(IEEE Trans.Acoust.,Speech and Si gal Proc.vol.ASSP-30、1982年10月、751-65頁)及びRothweilerの『多相直角 位相フィルタ・新小帯域符号化技術』(Proc.Int.Conf.Acoust.,Speech and Sigal Proc.、1983年、1280-1283頁)に記載されている。 原則として、分析フィルタバンクスペクトルの不鮮明化は問題とはならない。 これは、相補的分析フィルタバンクが不鮮明化の影響を逆転させ、正確な原信号 を回復できるからである。しかし、分析フィルタバンクは、その正確な出力を与 えられない限り正確な原信号を回復できないので、これは原則的にのみ真実であ るにすぎない。心理知覚に基づく符号化システムにおいては、分析フィルタバン クから得られた小帯域信号は、情報要件を下げるために量子化され、その結果生 じる量子化誤差が、分析フィルタバンクを通して正確な原信号を回復するのを妨 げる。 分析フィルタバンクの効果は、以下の記載並びに合成フィルタバンクによって 生じるスペクトルの仮想グラフを例示する図13c及び13dを参照することに よってさらによく理解できるであろう。図13cは、分析フィルタバンクによっ て瀘波されて不鮮明になったスペクトル602、612及び各スペクトルに付加 された雑音成分604、614を例示する。雑音成分は、不鮮明になった各スペ クトルの主成分のみを量子化した結果生じる量子化雑音を表わす。他のすべての 成分は量子化されない。実際の分割符号化システムにおいては、図13cの例と は異なり、エンコーダ分析フィルタバンク出力の全成分が量子化される。しかし 、この仮想例では、デコーダ分析フィルタバンクスペクトル歪の影響をよりはっ きり示すために、不鮮明になったスペクトルの主成分のみが量子化される。 図13dは、図13cに示す信号に応答してデコーダ合成フィルタバンクによ って回復された信号のスペクトル形状を例示する。スペクトル成分608、61 8は、原信号の真のスペクトル成分600、610に対応し、人工物606、6 16は、それぞれ量子化雑音成分604、614に応答して合成フィルタバンク によって発生されたスペクトル歪である。人工物606、616の形状は、雑音 成分604、614を用いた合成フィルタバンク周波数応答のたたみこみから確 立されるかもしれない。実際的分割帯域符号化システムにおいては、分析フィル タバンク出力のすべての成分が量子化されるので、スペクトル歪はさらに大きい 。 多くの実際的分割帯域符号化システムは、小帯域信号を不均一に量子化するが 、均一量子化を用いる符号化システムによる信号の真のスペクトルの歪は、合成 フィルタバンク周波数応答を用いた分析フィルタバンク周波数応答のたたみこみ によってモデル化できるということは教訓になるかもしれない。 しかし、この歪モデルは実際的符号化システムではそれ程有効ではない。それ は、信号の真のスペクトルが得られないからである。その代わり、分析フィルタ バンクからは不鮮明になった真のスペクトルの表現が得られる。量子化によるよ うな情報要件の低減に支配されるのは、この不鮮明になった表現である。合成フ ィルタバンクによって生じる歪は、合成フィルタバンクの周波数応答を用いて量 子化雑音をたたみこむことによって得ることができる。 合成フィルタバンクのスペクトル歪は、知覚モデルのみに基づく配分関数が常 に正しい配分値を得ることができないことの原因となる。多くの知覚モデルは、 単一周波数正弦波又は非常に狭い雑音帯域のいずれかから成る信号の隠蔽特性を 設定せんとする経験的試験に基づいている。これらの隠蔽モデルは、隠蔽信号及 び隠蔽される信号の双方の真のスペクトル形状に基づく。この様な知覚モデルは 、量子化から生じる雑音スペクトルを不鮮明にする合成フィルタバンクの償いは しない。その結果、配分決定をその様な知覚モデルのみに基づいて行う配分関数 は、いつも正しい配分値を得るとは限らない。その理由は、知覚モデルが隠蔽効 果を過大評価するからである。 配分関数の中には、知覚モデルにより示唆される情報要件に余裕を加えること によって、すべての符号化人工物が知覚できなくなることを保証せんと試みるも のもある。一実施態様においては、例えば、エンコーダは、情報要件を設定する ために知覚モデルを適用し、そこで量子化雑音が隠蔽されることを保証するため に1又は2だけ多いビットを配分する。合成フィルタバンク歪効果が適切に償わ れない限り、この限界的配分は次善のものである。 配分関数は、心理知覚モデルを改変し、設定した隠蔽閾値を変え、配分値を調 節すること等の多くの方法によってデコーダスペクトル歪を許容している。例え ば、デコーダスペクトル歪を許容するために、1) 式4から得られる刺激パター ンE(x)の構成部分を低下させることによって、2) 式14及び15で用いられる 感度関数w(x)の構成部分を低下させることによって、3) 式16で用いられる 中間隠蔽閾値Z(x)の構成部分を低減させることによって、4) 式16から得ら れる設定された隠蔽閾値M(x)の構成部分を低下させることによって若しくは 選択される配分値A(x)を増加させることによって、情報要件を増加させても よい。 『ビット配分を調節する』等の用語は、以下の記載においてはその様な許容の ための包括的な用語として用いられる。望ましい実施態様においては、刺激パタ ーンE(x)を改変することによって許容がなされる。従って、以下に述べる実 施態様は、どの様にして刺激パターンを調節するかにつき記載している。しかし 、これらの実施態様は、上に列記した任意の他の方法を用いるように変えられる ことを理解すべきである。複素処理 図14は、デコーダスペクトル歪モデルを組込んだ処理の一実施態様における 段階を例示する。ENTRY(入口)700において配分関数は、心理知覚原理 に従って予備的配分値を既に設定している。 NOISE(雑音)702は、設定された配分値に従って量子化雑音スペクト ルQ(x)を設定する。分析フィルタバンクから得られる、小帯域信号の量子化 から生じる量子化雑音スペクトルの仮想例は、図13cに例示する。しかし、こ の仮想例とは異なり、小帯域信号の全ての成分が量子化される。 DISTORTION(歪)704は、デコーダ歪スペクトルN(x)を得る ために、量子化雑音スペクトルQ(x)を用いて合成フィルタバンク周波数応答 D(x)をたたみこむことによって復号スペクトル歪の影響を推定する。 たたみこみは、電算上集中的である。上記のものと類似の刺激パターンを得る ための処理は、その実施態様を図8に例示する通り、復号スペクトル歪を推定す るために有効な処理を実施するのにも用いることができる。 CHECK(検査)706は、N(x)を設定された隠蔽閾値M(x)と比較 することによって、N(x)の任意の構成部分がデコーダで回復された信号内で 知覚できるかどうかを確認する。もしN(x)の任意の構成部分がM(x)のそ れぞれの構成部分を越えるなら、N(x)のその構成部分は知覚できると予期さ れる。 TERM(条件)708は、上記段階を反復するかどうかを決定する。もしN (x)がどこでもM(x)を越えないのなら、全てのN(x)が知覚できないと 予期されるので、それ以上の処理は必要としない。EXIT(出力)712が 次に行われる。 もしスペクトルを横切ってほぼ一様なやり方でN(x)がM(x)を越えかつ 配分のために追加ビットが入手できないなら、それ以上の処理でN(x)が知覚 できることは予期されない。EXIT(出力)712が次に行われる。 さもなければ、ADJUST(調節)710が次に行われる。 ADJUST710は、符号化人工物の知覚可能性を下げるために選択された スペクトル成分につきビット配分を調節する。これはM(x)を越えるN(x) の構成部分への寄与が大きいQ(x)を確認し、選択された最大寄与成分Q(x )へのビット配分を増加させることによって達成することができる。 最大寄与者を確認する方法は、デコーダ歪スペクトルN(x)は次式で表され るたたみこにQ(x)*D(x)から得られることを第1に想起することによっ て得られる。 歪スペクトル、例えば、N(x0)の特定な構成部分への最大寄与者Q(x)は 、どの小帯域xに対して項Q(x)・D(0−x)が最大になるかを突止めるこ とによって確認できる。これは、N(x)が知覚できると予期される小帯域x0 を中心とする周波数応答D(−x)で各Q(x)成分に重み付けし、最大加重値 に相当するQ(x)成分を選択することと同等である。 もし合計ビット配分がビット予算を越えるなら、閾値M(x)を越えないN( x)の構成部分へ寄与するかもしくはM(x)を越えるN(x)の構成部分へ最 も寄与しないQ(x)成分に対するビット配分を低下させる。処理は、段階NO ISE702へ戻ることによって反復する。 上記心理音響モデルを用いるオーディオ符号化システムにおいては、これらの 調節は、刺激パターンE(x)を改変することによって達成するのが望ましい。 EXIT712において、デコーダスペクトル歪を許容する処理は完了する。単純化処理 より簡単な処理においては、合成フィルタバンクを通して、符号化された信号 の真のスペクトルによって隠蔽され得る以上に広い周波数に亘り、量子化雑音を 不鮮明にしない限り、デコーダスペクトル歪の影響は通常知覚できないというこ とを利用することによって良好な結果を得ることができる。この条件は、分析フ ィルタバンクで瀘波されたスペクトル成分から設定される閾値が、合成フィルタ バンク周波数応答より急速に減衰する場合さらにありそうである。 多くのフィルタバンク実行手段において、周波数応答減衰の割合を増加させる ことは可能であるが、結果的に停止帯域除外の深さが減少する。多くの合成フィ ルタバンクの実行については、停止帯域除外に対する最低要件でさえ、応答減衰 が、低−中周波数スペクトル成分によって低周波数隠蔽のために設定される隠蔽 減衰と等しくなるか若しくはこれを越えることを防止している。例えば、サンプ リング率48kHZを有する512点変換で実施されるフィルタバンクは、停止帯域除外 レベルを約100dB未満に下げることなく、係数、すなわち、93.75Hz(48kHZ/512) 当たり約12dBを越える減衰を有するフィルタ応答を概して達成することはできな い。 フィルタ周波数応答と比較して、約4kHを越えるスペクトル成分に対する隠蔽 閾値は、下方周波数隠蔽に対して係数当たり約2dBで減衰する。対照的に、約400 Hz乃至3kHz範囲内のスペクトル成分に対する隠蔽閾値は、下方周波数隠蔽に対し て係数当たり約10乃至15dBで減衰する。その結果、今述べたものと類似の特性を 有する合成フィルタバンクを内臓する符号化システムは、約3kH未満の周波数に おいてデコーダスペクトル歪を許容すべきであるが、より高い周波数においては 多分許容する必要はないであろう。 図15aを参照すると、閾値802は高周波スペクトル成分の心理音響隠蔽閾 値を表し、応答800は、仮想合成フィルタバンク内の各通過帯域フィルタの周 波数応答を表す。隠蔽閾値802は、フィルタ周波数応答800より速く減衰す る。人工物が知覚できるような程度まで、デコーダスペクトル歪を通して高周波 符号化人工物を不鮮明にすることはありそうもない。従って、配分関数は、より 高い周波数に対するデコーダスペクトル歪をより安全に無視してもよい。 図15bは、低−中周波数スペクトル成分の心理音響隠蔽閾値を表す閾値80 6及び仮想合成フィルタバンク内のそれぞれの通過帯域フィルタの周波数応答を 表す応答804を例示する。隠蔽成分より下方の周波数については、隠蔽閾 値806は、フィルタの周波数応答804より速く減衰する。人工物が知覚でき るような程度まで、デコーダスペクトル歪を通して低−中周波符号化人工物を不 鮮明にすることが大いにありそうである。従って、配分関数は、より低い周波数 に対するデコーダスペクトル歪を安全に無視することはできない。図15bに示 す例は、符号化システム人工物が聴取できないことを保証するために、量子化雑 音は優勢なスペクトル成分の低周波側で低減されなければならないことを示す。 デコーダスペクトル歪を許容しなければならないかどうかは、符号化する信号 のスペクトル形状に応答して設定された隠蔽閾値に依存する。図15a及び15 bに示すような隠蔽閾値は、単一周波数スペクトル成分又は非常に狭い雑音帯域 の隠蔽特性に関係することを想起するのは重要である。多くのスペクトル成分を 有する複雑な信号の隠蔽特性は非常に異なる。例えば、ホワイトノイズの隠蔽閾 値は大体平坦である。従って、デコーダスペクトル歪は、ほぼ平坦なスペクトル 形状を有する信号については特に関心はない。 単純化された処理では、低−中周波数小帯域において分析フィルタバンクによ り瀘波された小帯域信号の限界帯域密度S(x)を検査することによって、図1 5bに例示するような潜在的状態を確認する。もしスペクトルのより低い部分を 横切るS(x)の変化が、合成フィルタバンクにおけるそれぞれの通過帯域フィ ルタに対する周波数応答減衰の割合とほぼ等しいか又は大きいなら、デコーダス ペクトル歪は許容される。 単純化された処理の概念は、各種の実行手段及び実施態様で用いられるが、こ こに記載する実施態様は以下を前提としている。すなわち、1) 実行手段はデジ タルオーディオ符号化システム用であり、2) 限界帯域密度は、±12dB程度の隣 接小帯域間の6dBの倍数の増分に強制された離散対数パワー関数S(x)によっ て近似され、3) 合成フィルタバンクは、約94Hzの通過帯域、係数当たり約12dB の周波数応答減衰及び約100dBの停止帯域除外を有する、変換によって実施され 、4) デコーダスペクトル歪を考慮することなく、小帯域信号を量子化するため に配分されるビット数は、設定された隠蔽閾値より下方の量子化雑音を下げるの に丁度十分であり、5) 隠蔽閾値は、実際に実施可能な最も正確な心理音響モデ ルにより設定される。第1実施態様 以下のプログラム断片は、デコーダスペクトル歪を許容する配分関数へ組込む ことができる単純化された第1実施態様を例示する。 ライン101は、約2.4kHzより下方のスペクトルを含む0乃至25の小帯域に 対してライン102乃至127で行われる処理を反復する。もしライン102で 、小帯域i乃至i+1において限界帯域密度が12dBだけ増加することが決まるなら、 ライン103乃至126が行われ、さもなければ次の小帯域を検査するライン 102の処理が続く。 ライン103において、変数iは、限界帯域密度が12dBだけ増加する可能性の ある小帯域間隔における第1小帯域を参照する。ライン103は、次の小帯域を 参照するために変数jを初期化し、ライン104は、変数kを0に初期化する。 ライン105は、変数kが0以外の値に設定されるか若しくは変数jが26以上に なるまで、ライン106乃至110の処理を反復する。ライン106乃至110 は、限界帯域密度が12dB増加する時に横切る間隔内の小帯域数を確認する。もし ライン106が、小帯域j+1と小帯域jとの間の増加が12dBでないことを決定する なら、ライン107が、変数kを当該間隔内の小帯域数と等しく設定する。これ は、ライン105を通じてライン106乃至110を反復することを停止させる 。ライン109は、次の小帯域を参照するために変数jの増分を行う。 もしライン111が、間隔の長さが3未満と決定するなら、ライン112が、 変数aを6に設定し、さもなければ、ライン114が、変数aを12に設定する。変 数aは、デコーダスペクトル歪を許容するために刺激パターンE(x)が低減さ れる量をdBで表す。限界帯域密度が12dBだけ増加する小帯域間隔に対しては、パ ターンはさらに低減される。これは長い間隔に対しては発生する不鮮明なスペク トルの量が大きくなるためである。付加的低減を行う理由は、スペクトル歪は、 量子化雑音スペクトルを用いて合成フィルタ周波数をたたみこむことによってモ デル化できること及び合成フィルタ周波数応答は、変換係数当たり(又はより低 い周波数では限界帯域当たり)約12dBで減衰し、これは限界帯域密度の増加率と ほぼ同一であることを想起することによって理解できるであろう。たたみこみは 、より長い間隔に対してさらに広い周波数に亘って量子化雑音スペクトルを不鮮 明にするであろう。 ライン116は、変数aで特定される量だけE(i)が低減される、ライン1 17乃至121で行われる処理を反復する。パターンが低減される小帯域は、限 界帯域密度が12dBだけ増加するとき横切る間隔内の小帯域に相当する。もしライ ン118が、任意の小帯域に対して刺激パターンが零未満に低減されたことを決 定するなら、ライン119は、その小帯域につきパターンを零にリセットする。 もしライン122が、当該間隔に続く限界帯域密度の増加が6dBであることを 決定するなら、刺激パターンは、それに続く小帯域において同様に調節される。 ライン125は、変数iを変数jと等しく設定する。これは、ライン102乃至 127の反復を続行させ、当該小帯域は小帯域jに続く。 幾つかの表が、今述べた処理の結果を例示する。表IVは、限界帯域密度S(x )が12dBだけ増加するとき横切る2つの小帯域の間隔を表す。この間隔の次には 、6dB以外の増加が続く。△(x)の列は、隣接小帯域間の限界帯域密度の変化 を示す。e(x)の列は、刺激パターンに適用される調節量を示す。 表Vは、限界帯域密度が12dBだけ増加するとき横切る3つの小帯域の間隔を表 す。12dB増加の間隔の次には、6dB以外の増加が続く。 表VIは、限界帯域密度が12dBだけ増加するとき横切る2つの小帯域の間隔を表 す。12dB増加の間隔の次には、6dB以外の増加が続く。 表VIIは、限界帯域密度が12dBだけ増加するとき横切る3つの小帯域の間隔を 表す。12dB増加の間隔の次には、6dB以外の増加が続く。第2実施態様 以下のプログラム断片は、デコーダスペクトル歪を許容する配分関数へ組込む ことができる単純化された第2実施態様を例示する。この第2実施態様によって 得られた結果は、概して第1実施態様のもの程良くないが、電算的にさらに効率 的なので、一定の実施手段においては魅力的である。 ライン201は、変数aを零に初期化する。ライン202は、小帯域0乃至2 5につきライン203乃至216で行われる処理を反復する。 もしライン203が、小帯域iから小帯域i+1までの限界帯域密度の変化が+12d Bであることを決定するなら、ライン204乃至206が、変数aを6dBだけ、最 大18dBまで増加させる。変数aは、デコーダスペクトル歪みを許容するために刺 激パターンE(x)が低減される量をdBで表す。この量は、より長い間隔に対し てはより大きな量の不鮮明なスペクトルが生じるので、限界帯域密度が12dBだけ 増加するより長い小帯域間隔に対して増加する。より詳しくは上に述べた第1実 施態様の記載を参照のこと。ライン207は、変数aによって特定される量だけ E(i)を低減させる。 もしライン203が、小帯域iから小帯域i+1までの限界帯域密度の変化が+12d Bでないことを決定するなら、ライン209は変化が-6dB以下であるかどうかを 決定する。もしそうなら、ライン210乃至212は、変数aを6dBだけ、最小0d Bまで低下させる。ライン213は、変数aによって特定される量だけE(i)を 低下させる。第3実施態様 以下のプログラム断片は、デコーダスペクトル歪を許容する配分関数へ組込む ことができる単純化された第3実施態様を例示する。 ライン301は、変数aを零に初期化する。ライン302は、小帯域0乃至2 5に対してライン303乃至330で行われる処理を反復する。ライン303乃 至322は、隣接小帯域間の限界帯域密度の変化に応じて変数aを調節する。例 えば、ライン313は、もし限界帯域密度が小帯域i及び小帯域i+1間で変化しな いなら、変数aを6だけ低下させる。他の例として、小帯域iから小帯域i+1までに 限界帯域密度が+6dBだけ変化するなら、小帯域i+1から小帯域i+2までに限界帯域 密度が+12dBだけ変化するときにはライン307乃至311は、変数aを3だけ低 下させるか若しくはさもなければ変数aを6だけ低下させる。ライン323乃至3 28は、変数aが18より大きくなくかつ0より小さくないことを保証する。ライン 329は、変数aによって特定される量だけ刺激パターンE(i)を低下させる 。 この実施態様は、次のより高い小帯域を『考慮』している。他の実施態様はさ らに先を見越すことができる。もし電算的資源が許すなら、刺激パターンを調節 する前に、関心のあるすべての又はほぼすべての小帯域を横切る限界帯域密度の 変化を分析する実施態様も可能である。アダプタ 各種の心理知覚効果に基づく配分関数を用いる分割帯域符号化システムにおい ては、配分関数を改変するために、基礎をなす心理知覚モデルに影響を与える任 意のパラメータを修正することができる。例えば、オーディオ符号化用途におい てこの様なパラメータとしては以下のようなものがある。すなわち、1) 隠蔽音 の上下方向で心理音響隠蔽のレベルをモデル化する式6及び7のフィルタ係数、 2) 刺激パターンからSNRオフセットを与える感度関数の特性、3) 多重チャン ネルシステムにおける相互チャンネル隠蔽のレベル、4) 入力信号の帯域幅、5) 周波数の関数として小帯域信号に配分する最低ビット数、6) 多分周波数の関数 としての配分天井、7) スペクトル振幅の関数として各増分的振幅増加に対する スペクトル成分に配分する追加のビット数及び8) デコーダスペクトル歪が知覚 されると予期されるときに刺激パターンを調節する量がある。経験的に、より高 い振幅を隠蔽するためにはより高いSNRを要することが立証されている。従っ て、高振幅においては振幅増加6dB当たり1ビットの追加配分が必要となるかも しれないが、より低い振幅においては12dB増加当たり1ビットのみの配分で十分 かもしれない。 アダプタ120は、配分関数の結果を改変するために『パラメータ』技術及び 『値』技術の双方を利用してもよい。『パラメータ』技術は、上で述べたような 1以上のパラメータを修正することを要する。『値』技術は、配分関数から得ら れる配分値と併合される1以上の修正値を発生させることを要する。 いずれかの技術を実行するのに用いられる特定な処理は、本発明の実施上決定 的ではない。一手法は、代わりの配分関数を行い、代わりの配分関数の結果を基 本配分関数110から得られる『基本値』と比較し、代わりの値と各基本値との 差が有意な場合には各代わりの値に対して修正値を形成することからなる。基本 配分関数の複雑性は、デコーダを単純化するように制限できるが、代わりの配分 関数の複雑性は所望の通りでもよい。例えば、オーディオ符号化用において代わ りの配分関数は、入力信号スペクトルの平坦さ、入力信号の平均又はピーク振幅 及び隠蔽成分が音状であるか又は雑音状であるか等の信号特性を考慮したより高 性能な心理音響モデルを用いることができる。 他の改変処理の例では、完全な配分関数を行うことを避け、検知した各種の信 号特性に応答して単に基本配分値に対する修正値のみを発生させる。例えば、検 知した音状隠蔽成分に応答して基本配分値を増加させるか若しくはほぼ平坦な入 力信号を検知することに応答して基本配分値を低減させることができる。 上記の通り、アダプタ120は、入力信号、フィルタバンク102から得られ る小帯域信号、変換器112から得られるX語又は特定の用途に有意なその他の 任意の情報等に応答してもよい。例えば、長距離電話網用の符号化システムにお いてアダプタ120は、日付、時刻及び曜日情報に応答してビット配分を低減さ せる配分関数を与えるようにすることが可能で、それによって電話網を通して予 想される通話量の増大に備えて、より低い情報要件とより高忠実な符号化とを釣 合わせることができる。 例えば、デジタルビデオ表示システムにおいてアダプタ120は、オペレータ 入力に応答する配分関数を与えることが可能で、それによってオペレータを通し て、より短い表示応答時間を、より高い画像解像度と釣合わせることができる。 これらの例が示す通り、アダプタ120は、特定な用途で望まれるあらゆる情 報に応答することができる。この情報の選択は、本発明の実施上決定的ではない 。 本発明は、広範な技術によって実行される多くの実施態様で実施できることを 理解されたい。
【手続補正書】特許法第184条の8 【提出日】1995年7月20日 【補正内容】 ことによって入力信号限界帯域密度を入手し、3) 基底膜『伸張関数』を用いて 限界帯域密度をたたみこむことによって基底膜『刺激パターン』を発生させるこ とから成る。このモデルは、入力信号及び量子化雑音を表す雑音信号に適用され 、それぞれ『信号刺激パターン』及び『雑音刺激パターン』を発生させるように される。入力信号及び雑音信号の大きさは、それぞての刺激パターンの積分関数 によって計算される。刺激パターンが隠蔽閾値より下になる入力信号及び雑音信 号の大きさは零である。すなわち、聴取できない。隠蔽関数は、信号刺激パター ンと、隠蔽閾値を定める『感度関数』との積によって得られる。符号化性能の客 観的尺度は、雑音信号の大きさを入力信号の大きさによって除すことによって得 られる比である。同モデルは、簡単でありかつ約5kHz未満のスペクトルエネルギ に対してかなりよい結果を与えるが、電算的に集中的でかつデコーダスペクトル 歪みについて何等許容するところがない。 しかし、たとえ配分関数が非常に高性能な知覚モデルに基づくとしても、分析 バンク及び合成バンクで起こるスペクトル歪みが許容されない限り、結果的に生 じる配分は最適ではないであろう。エイリアシングフィルタバンクをある程度許 容する一配分関数がJP4177300に記載されている。対応する文献はUS5,301,255で ある。2つの開示された技術は、配分関数を知らせる雑音対隠蔽比及び雑音対信 号比の相対的寄与を変えるために重み付け係数を用いている。例えば、低周波数 小帯域に対し小さな値を持つ重み付け係数を用いることによって、これらの小帯 域においてエイリアシング歪の影響を低下させることができる。同帯域において は、低周波数における限界帯域は概してフィルタ通過帯域幅より狭いのでこのよ うな歪は一層面倒である。しかし、これらの技術によって得られる許容性は最適 ではない。なぜならば、配分歪は、各個々の小帯域内よりはむしろ全信号帯域を 横切って推定される量子化雑音パワーに基づくからである。さらに、重み付け係 数の値をいかにすべきかについて確証を与える方法は開示されていない。発明の開示 本発明の目的は、高品質低ビットレート符号化・復号システムで用いるのに適 した、効率的な高性能配分関数を与えることにある。同システムは、デコーダス ペクトル歪みも適当に許容する。 本発明の一面の教示によれば、エンコーダは、入力信号を複数の小帯域xに区 分して小帯域信号を発生させるようにし、配分関数によって設定された配分値に 従って小帯域信号を量子化し、量子化した信号を入力信号の符号化された表現に アセンブルする。配分関数は、心理音響原理及びデコーダスペクトル歪み特性に 従って配分値を設定する。デコーダ歪みモデルは、配分関数を通してデコーダに よって生成される後続のスペクトル歪みを考慮できるようにする。 第1実施態様においては、1) 小帯域信号の量子化から生じる量子化雑音スペ クトルQ(x)を設定し、2) デコーダフィルタバンク周波数応答D(x)を用いてQ( x)をたたみこむことによって復号された信号雑音N(x)を推定し、3) N(x)を設 定された隠蔽閾値M(x)と比較することによってN(x)の知覚力を設定し、4) N( x)が知覚されないか若しくはすべての小帯域xで実質的に最低にされるかどうか を確認し、5) もしそうなら処理を終結させ、6) さもなければ、N(x)がM(x)を 越える各小帯域xにつき、当該小帯域内でN(x)に寄与する最大成分Q(x)を識別 、すなわち、確認して、これらの成分Q(x)に対応する配分値A(x)を増加させ、 7) 上記段階を反復させることによって、配分関数はデコーダ歪みに備える。 オーディオ符号化システム用の第2実施態様において配分関数は、量子化雑音 スペクトルの小帯域においてのみデコーダスペクトル歪みを考慮し、同小帯域に おいては、設定された隠蔽閾値のロールオフ(漸減)率と等しいか又はそれ以下 の率で、それぞれの小帯域デコーダフィルタ応答がロールオフする。この第2実 施態様の一実行例において配分関数は、約3kHz以下のこれらの小帯域において設 定された隠蔽閾値M(x)を低下させる。すなわち、同小帯域においてM(x)は、デ コーダフィルタバンク応答の低周波ロールオフよりも急速に下方周波数に向けて ロールオフする。これらの小帯域でM(x)が低減される量は小帯域の数に依存し 、閾値は、同小帯域を横切ってフィルタ応答のロールオフより急速に低下する。 隠蔽閾値M(x)の低下は、これらの各小帯域において小帯域を量子化するために 、配分関数を通して追加のビットを配分させ、それによってこれらの小帯域にお ける量子化雑音の予期された可聴性を低減させる。 配分関数を通して隠蔽閾値を設定する方法は、符号化システム性能に著しい影 響を与え得るが、実施上本発明のいかなる方法も概念的に決定的ではない。オー ディオ符号化システムの望ましい実施態様においては、隠蔽閾値は、入力信号の パワースペクトル密度(PSD)を推定し、PSDに伸張関数を適用することに よって刺激パターンを発生させ、心理音響隠蔽を達成するのに十分な周波数に依 存した信号対雑音比(SNR)オフセット(残留偏差)と等しい量だけ刺激パタ ーンを調節し、調節されたパターンのレベルを聴取閾値と比較し、2つの中の大 きい方と等しい隠蔽閾値を発生させることによって設定される。 逆方向適応符号化システムにおいてPSDは、同様に符号化された信号にアセ ンブルされる情報から推定される。例えば、PSDは、スペクトル包絡線から得 られた位取り因子から推定できる。順方向適応符号化システムにおいてPSDは 、符号化された信号にアセンブルされる情報と、符号化された信号にアセンブル されない信号とから推定してもよい。例えば、PSDは、たとえ高解像度包絡線 が符号化された信号に含まれていないとしても、入力信号の高解像度スペクトル 包絡線から推定することができる。 望ましい実施態様においては、刺激パターンは、周波数領域の小帯域信号に1 以上のフィルタを適用することによって発生される。これらのフィルタは、再帰 的又は無限インパルス応答(IIR)技術若しくは非再帰的又は有限インパルス 応答(FIR)技術によって実施してもよい。いずれの技術を用いるかは、本発 明の実施上決定的ではない。 望ましい実施態様においてエンコーダは、入力信号と、小帯域信号とで検知さ れた特性に応答して配分関数の結果に影響を与える1以上のパラメータを改変す る。例えば、上記のSNRオフセットは、総合的な符号化品質に影響を与えるよ うに改変することができる。改変されたパラメータの指標から成る副情報は符号 化された信号にアセンブルされる。 特定の一実行例においては、改変されたパラメータを用いた結果生じた改変さ れた配分値は、符号化された信号内に明示的配分値としてアセンブルされる。 請求の範囲 2 復号方法によって復号するための入力信号の符号化された表現を構成する符 号化方法であって、 前記入力信号に複数のフィルタを適用することによって小帯域信号を発生さ せ、 前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成し、前記低い情報要件が、心理知覚原則に従って達成されると共 に前記復号方法によって導入されるスペクトル歪を許容することによって達成さ れるようにし、前記スペクトル歪を許容することが、 心理知覚モデルに従って配分値を設定し、 前記配分値に従って雑音スペクトルを設定し、 前記雑音スペクトルに応答して復号歪スペクトルを発生させることによっ て復号スペクトル歪の影響を推定し、 前記復号スペクトル歪の前記推定された知覚効果に応答して前記心理知覚 モデルを改変することから成るようにし、 前記符号化された情報を前記符号化された表現にアセンブルすることから成 る符号化方法。 3 前記知覚効果を推定するることが、 前記複数の合成フィルタの各々1つの各々の周波数応答を用いて前記雑音ス ペクトルをたたみこむことによって前記復号歪スペクトルを発生させ、 該復号歪スペクトルの任意の部分が隠蔽しきい値を越えることを確認するこ とによって該知覚効果を推定することから成る、複数の合成フィルタを用いる前 記復号方法と共に用いる請求項1又は2の方法。 4 前記心理知覚モデルと、前記配分値とを改変することが、 前記隠蔽しきい値を越える前記復号歪スペクトルの構成部分に大きく寄与す る雑音スペクトル成分を選択し、 前記選択された雑音スペクトル成分に対応する符号化信号の情報要件を増加 させることから成る、請求項3の方法。 5 前記雑音スペクトル成分を選択することが、 前記雑音スペクトル成分が前記隠蔽しきい値を越える各小帯域を中心とする 前記各々の周波数応答の周波数反転表現を用いて前記雑音成分を重み付けし、 各雑音スペクトル成分に対する重み付けの結果を合計することによって加重 雑音スペクトルを発生させ、 大きな加重雑音スペクトル成分に対応する雑音スペクトル成分を選択するこ とから成る、請求項4の方法。 6 前記心理知覚モデルが、前記隠蔽しきい値を含み、前記改変することで、前 記しきい値を低下させるために心理知覚モデルを改変し、それによって、もしあ れば、前記しきい値を越える前記復号歪スペクトルの部分に対応する前記符号化 された情報の情報要件を増加させる、請求項3の方法。 7 各々が減衰周波数応答を有する複数の合成フィルタを用いる復号方法によっ て復号するための入力信号の符号化された表現を構成する符号化方法であって、 前記入力信号に複数のフィルタを適用することによって小帯域信号を発生さ せ、 前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成し、前記低い情報要件が、心理知覚原則に従って達成されると共 に前記復号方法によって導入されるスペクトル歪を許容することによって達成さ れるようにし、前記スペクトル歪を許容することが、 前記入力信号のスペクトル包絡線を推定し、 前記スペクトル包絡線を前記各々の周波数応答と比較し、 該各々の周波数応答の減衰とほぼ等しいか又はそれより大きい割合で変化 する該スペクトル包絡線の部分を確認し、 心理知覚モデルを改変し、それによってより高い情報要件が前記スペクト ル包絡線の部分に対応する選択された情報に課され、 前記心理知覚モデルに従って前記選択された符号化情報の情報要件を設定 することから成るようにし、 前記符号化された情報を前記符号化された表現にアセンブルすることから成 る符号化方法。 8 前記複数のフィルタが、1以上のデジタルフィルタによって与えられる、請 求項1乃至7のいずれか1つの方法。 9 前記複数のフィルタが、1以上のデジタル変換によって与えられる、請求項 1乃至7のいずれか1つの方法。 14 前記改変装置が、 前記隠蔽しきい値を越える前記復号歪スペクトルの構成部分に大きく寄与す る雑音スペクトル成分を選択する装置と、 前記選択された雑音スペクトル成分に対応する符号化信号の情報要件を増加 させる装置とから成る、請求項13の装置。 15 前記雑音スペクトル成分を選択する装置が、 前記雑音スペクトル成分が前記隠蔽しきい値を越える各小帯域を中心とする 前記各々の周波数応答の周波数反転表現を用いて前記雑音成分を重み付けする装 置と、 各雑音スペクトル成分に対する重み付けの結果を合計することによって加重 雑音スペクトルを発生させる装置と、 大きな加重雑音スペクトル成分に対応する雑音スペクトル成分を選択する装 置から成る、請求項14の装置。 16 前記心理知覚モデルが、前記隠蔽しきい値を含み、前記改変装置が前記しき い値を低下させるために心理知覚モデルを改変し、それによって、もしあれば、 前記しきい値を越える前記復号歪スペクトルの部分に対応する前記符号化された 情報の情報要件を増加させる、請求項13の装置。 17 それぞれ減衰する周波数応答を有する複数の合成フィルタを適用するデコー ダによって復号するための入力信号の符号化された表現を構成する符号化装置で あって、 複数のフィルタを前記入力信号に適用することによって小帯域信号を発生さ せる装置102と、 前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成する装置であって、 心理知覚原理に従って前記より低い情報要件を達成する装置104と、 前記デコーダによって導入されるスペクトル歪を許容する装置であって、 前記入力信号のスペクトル包絡線を推定する装置110と、 前記スペクトル包絡線を前記各々の周波数応答と比較する装置110と、 該各々の周波数応答の減衰とほぼ等しいか又はそれより大きい割合で変化 する該スペクトル包絡線の部分を確認する装置110と、 心理知覚モデルを改変する装置120であって、それによってより高い情 報要件が前記スペクトル包絡線の部分に対応する選択された情報に課される装置 120と、 前記心理知覚モデルに従って前記選択された符号化情報の情報要件を設定 する装置110とから成るスペクトル歪許容装置とを含む情報生成装置と、 前記符号化された情報を前記符号化された表現にアセンブルする装置106 とから成る符号化装置。 18 前記複数のフィルタが、1以上のデジタルフィルタによって与えられる、請 求項11乃至17のいずれか1つの装置。 19 前記複数のフィルタが、1以上のデジタル変換によって与えられる、請求項 11乃至17のいずれか1つの装置。 20 前記発生させる装置が、前記小帯域信号を第1のビット数で表し、前記生成 装置が、適応的に配分された第2のビット数を用いて該小帯域信号を量子化する ことによって前記符号化された情報を生成し、前記第2のビット数が前記第1の ビット数より少ない、請求項11乃至19のいずれか1つの装置。 【手続補正書】特許法第184条の8 【提出日】1995年9月7日 【補正内容】 請求の範囲 1 復号方法によって復号するための入力信号の符号化された表現を構成する符 号化方法であって、 前記入力信号に複数のフィルタを適用することによって小帯域信号を発生さ せ、 前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成し、前記低い情報要件が、心理知覚原則に従って達成されると共 に前記復号方法によって導入されるスペクトル歪を許容することによって達成さ れるようにし、前記スペクトル歪を許容することが、 1) 心理知覚モデルに従って配分値を設定し、 2) 前記配分値に従って雑音スペクトルを設定し、 3) 前記雑音スペクトルに応答して復号歪スペクトルを発生させることによっ て復号スペクトル歪の影響を推定し、 4) 前記復号スペクトル歪の前記推定された知覚効果に応答して前記心理知覚 モデルを改変し、 5) 段階1)乃至4)を反復することから成るようにし、 前記符号化された情報を前記符号化された表現にアセンブルすることから成 る符号化方法。 2 復号方法によって復号するための入力信号の符号化された表現を構成する符 号化方法であって、 前記入力信号に複数のフィルタを適用することによって小帯域信号を発生さ せ、 前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成し、前記低い情報要件が、心理知覚原則に従って達成されると共 に前記復号方法によって導入されるスペクトル歪を許容することによって達成さ れるようにし、前記スペクトル歪を許容することが、 心理知覚モデルに従って配分値を設定し、 前記配分値に従って雑音スペクトルを設定し、 前記雑音スペクトルに応答して復号歪スペクトルを発生させることによっ て復号スペクトル歪の影響を推定し、 前記復号スペクトル歪の前記推定された知覚効果に応答して前記心理知覚 モデルを改変することから成るようにし、 前記符号化された情報を前記符号化された表現にアセンブルすることから成 る符号化方法。 10 前記小帯域信号が、第1のビット数によって表現され、前記生成段階で、適 応的に配分された第2のビット数を用いて該小帯域信号を量子化することによっ て前記符号化された情報が生成され、前記第2のビット数が前記第1のビット数 より少ない、請求項1乃至9のいずれか1つの方法。 11 デコーダによって復号するための入力信号の符号化された表現を構成する装 置であって、 前記入力信号に複数のフィルタを適用することによって小帯域信号を発生さ せる装置102と、 前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成する装置であって、 心理知覚原理に従って前記より低い情報要件を達成する装置104と、 前記デコーダによって導入されるスペクトル歪を許容する装置であって、 1) 心理知覚モデルに従って配分値を設定する装置110と、 2) 前記配分値に従って雑音スペクトルを設定する装置110と、 3) 前記雑音スペクトルに応答して復号歪スペクトルを発生させることに よって復号スペクトル歪の影響を推定する装置110と、 4) 前記復号スペクトル歪の前記推定された知覚効果に応答して前記心理 知覚モデルを改変する装置120と、 5) 必要に応じて段階1)乃至4)を反復する装置とを含むスペクトル歪 許容装置とから成る情報生成装置と、 前記符号化された情報を前記符号化された表現にアセンブルする装置106 とから成る符号化装置。 12 デコーダによって復号するための入力信号の符号化された表現を構成する符 号化装置であって、 前記入力信号に複数のフィルタを適用することによって小帯域信号を発生さ せる装置102と、 前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成する装置であって、 心理知覚原理に従って前記より低い情報要件を達成する装置104と、 前記デコーダによって導入されるスペクトル歪を許容する装置であって、 心理知覚モデルに従って配分値を設定する装置110と、 前記配分値に従って雑音スペクトルを設定する装置110と、 前記雑音スペクトルに応答して復号歪スペクトルを発生させることによっ て復号スペクトル歪の影響を推定する装置110と、 前記復号スペクトル歪の前記推定された知覚効果に応答して前記心理知覚 モデルを改変する装置120とから成る生成装置と、 前記符号化された情報を前記符号化された表現にアセンブルする装置106 とから成る符号化装置。 13 前記デコーダが複数の合成フィルタを適用し、前記知覚的効果を推定する装 置が、 前記複数の合成フィルタの各々1つの各々の周波数応答を用いて前記雑音ス ペクトルをたたみこむことによって前記復号歪スペクトルを発生させる装置と、 該復号歪スペクトルの任意の部分が隠蔽しきい値を越えることを確認するこ とによって該知覚効果を推定する装置とから成る、請求項11又は12の装置。 前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成する装置であって、 心理知覚原理に従って前記より低い情報要件を達成する装置104と、 前記デコーダによって導入されるスペクトル歪を許容する装置であって、 前記入力信号のスペクトル包絡線を推定する装置110と、 前記スペクトル包絡線を前記各々の周波数応答と比較する装置110と、 該各々の周波数応答の減衰とほぼ等しいか又はそれより大きい割合で変化 する該スペクトル包絡線の部分を確認する装置110と、 心理知覚モデルを改変する装置120であって、それによってより高い情 報要件が前記スペクトル包絡線の部分に対応する選択された情報に課される装置 120と、 前記心理知覚モデルに従って前記選択された符号化情報の情報要件を設定 する装置110とから成るスペクトル歪許容装置とを含む情報生成装置と、 前記符号化された情報を前記符号化された表現にアセンブルする装置106 とから成る符号化装置。 14 前記改変装置が、 前記隠蔽しきい値を越える前記復号歪スペクトルの構成部分に大きく寄与す る雑音スペクトル成分を選択する装置と、 前記選択された雑音スペクトル成分に対応する符号化信号の情報要件を増加 させる装置とから成る、請求項13の装置。
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 08/190,655 (32)優先日 1994年1月28日 (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),AU,CA,JP 【要約の続き】 方法で、デコーダ合成フィルタバンクスペクトル歪みを 許容する。

Claims (1)

  1. 【特許請求の範囲】 1 復号方法によって復号するための入力信号の符号化された表現を構成する符 号化方法であって、 前記入力信号に複数のフィルタを適用することによって小帯域信号を発生さ せ、前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成し、前記低い情報要件が、前記復号方法によって導入されるスペ クトル歪を許容することによって、心理知覚原則に従って達成されるようにし、 前記符号化された情報を前記符号化された表現にアセンブルすることから成 る符号化方法。 2 前記複数のフィルタが、1以上のデジタルフィルタによって与えられる、請 求項1の方法。 3 前記複数のフィルタが、1以上のデジタル変換によって与えられる、請求項 1の方法。 4 前記小帯域信号が、第1のビット数によって表現され、前記生成段階で、適 応的に配分された第2のビット数を用いて該小帯域信号を量子化することによっ て前記符号化された情報が生成され、前記第2のビット数が前記第1のビット数 より少ない、請求項1乃至3のいずれか1つの方法。 5 前記スペクトル歪を許容することが、 心理知覚モデルに従って配分値を設定し、 前記配分値に従って雑音スペクトルを設定し、 前記雑音スペクトルに応答して復号歪スペクトルを発生させることによって 、復号スペクトル歪の知覚できる効果を推定し、 前記複号スペクトル歪の前記推定された効果に応答して前記心理知覚モデル と、前記配分値とを改変することからなる、請求項1乃至4のいずれか1つの方 法。 6 前記復号方法が複数の合成フィルタを適用することを含み、前記知覚的効果 を推定することが、 前記複数の合成フィルタの各々1つの各々の周波数応答を用いて前記雑音ス ペクトルをたたみこむことによって前記復号歪スペクトルを発生させ、 該復号歪スペクトルの任意の部分が隠蔽閾値を越えることを確認することに よって該知覚効果を推定することから成る、請求項5の方法。 7 前記心理知覚モデルと、前記配分値とを改変することが、 前記隠蔽閾値を越える前記復号歪スペクトルの構成部分に大きく寄与する雑 音スペクトル成分を選択し、 前記選択された雑音スペクトル成分に対応する符号化信号の情報要件を増加 させることから成る、請求項6の方法。 8 前記雑音スペクトル成分を選択することが、 前記雑音スペクトル成分が前記隠蔽閾値を越える各小帯域を中心とする前記 各々の周波数応答の周波数反転表現を用いて前記雑音成分を重み付けし、 各雑音スペクトル成分に対する重み付けの結果を合計することによって加重 雑音スペクトルを発生させ、 大きな加重雑音スペクトル成分に対応する雑音スペクトル成分を選択するこ とから成る、請求項7の方法。 9 前記心理知覚モデルが、前記隠蔽閾値を含み、前記改変することで、前記閾 値を低下させるために心理知覚モデルを改変し、それによって、もしあれば、前 記閾値を越える前記復号歪スペクトルの部分に対応する前記符号化された情報の 情報要件を増加させる、請求項6の方法。 10 前記復号方法が、各々の減衰する周波数応答を有する複数の合成フィルタを 適用することを含み、前記スペクトル歪を許容することが、 前記入力信号のスペクトル包絡線を推定し、 前記スペクトル包絡線を前記各々の周波数応答と比較し、 該各々の周波数応答の減衰とほぼ等しいか又はそれより大きい割合で変化す る該スペクトル包絡線の部分を確認し、 心理知覚モデルを改変し、それによってより高い情報要件が前記スペクトル 包絡線の部分に対応する選択された情報に課され、 前記心理知覚モデルに従って前記選択された符号化情報の情報要件を設定す ることから成る、請求項1乃至9のいずれか1つの方法。 11 デコーダによって復号するための入力信号の符号化された表現を構成する装 置であって、 前記入力信号に複数のフィルタを適用することによって小帯域信号を発生さ せる装置と、 前記小帯域信号に応答して該小帯域信号より低い情報要件を有する符号化さ れた情報を生成する装置であって、前記符号化情報生成装置が、 心理知覚原則に従って前記より低い情報要件を達成する装置と、 前記デコーダによって導入されるスペクトル歪を許容する装置と、 前記符号化された情報を前記符号化された表現にアセンブルする装置とから 成る符号化装置。 12 前記複数のフィルタが、1以上のデジタルフィルタによって与えられる、請 求項11の装置。 13 前記複数のフィルタが、1以上のデジタル変換によって与えられる、請求項 11の装置。 14 前記発生させる装置が、前記小帯域信号を第1のビット数で表し、前記生成 装置が、適応的に配分された第2のビット数を用いて該小帯域信号を量子化する ことによって前記符号化された情報を生成し、前記第2のビット数が前記第1の ビット数より少ない、請求項11乃至13のいずれか1つの装置。 15 前記スペクトル歪を許容する装置が、 心理知覚モデルに従って配分値を設定する装置と、 前記配分値に従って雑音スペクトルを設定する装置と、 前記雑音スペクトルに応答して復号歪スペクトルを発生させることによって 、復号スペクトル歪の知覚できる効果を推定する装置と、 前記複号スペクトル歪の前記推定された効果に応答して前記心理知覚モデル と、前記配分値とを改変する装置とからなる、請求項11乃至14のいずれか1 つの装置。 16 前記デコーダが複数の合成フィルタを適用する装置を含み、前記知覚的効果 を推定する装置が、 前記複数の合成フィルタの各々1つの各々の周波数応答を用いて前記雑音ス ペクトルをたたみこむことによって前記復号歪スペクトルを発生させる装置と、 該復号歪スペクトルの任意の部分が隠蔽閾値を越えることを確認することに よって該知覚効果を推定する装置とから成る、請求項15の装置。 17 前記改変装置が、 前記隠蔽閾値を越える前記復号歪スペクトルの構成部分に大きく寄与する雑 音スペクトル成分を選択する装置と、 前記選択された雑音スペクトル成分に対応する符号化信号の情報要件を増加 させる装置とから成る、請求項16の装置。 18 前記雑音スペクトル成分を選択する装置が、 前記雑音スペクトル成分が前記隠蔽閾値を越える各小帯域を中心とする前記 各々の周波数応答の周波数反転表現を用いて前記雑音成分を重み付けする装置と 、 各雑音スペクトル成分に対する重み付けの結果を合計することによって加重 雑音スペクトルを発生させる装置と、 大きな加重雑音スペクトル成分に対応する雑音スペクトル成分を選択する装 置から成る、請求項17の装置。 19 前記心理知覚モデルが、前記隠蔽閾値を含み、前記改変装置が前記閾値を低 下させるために心理知覚モデルを改変し、それによって、もしあれば、前記閾値 を越える前記復号歪スペクトルの部分に対応する前記符号化された情報の情報要 件を増加させる、請求項16の方法。 20 前記デコーダが、各々の減衰する周波数応答を有する複数の合成フィルタを 適用する装置を含み、前記スペクトル歪を許容する装置が、 前記入力信号のスペクトル包絡線を推定する装置と、 前記スペクトル包絡線を前記各々の周波数応答と比較する装置と、 該各々の周波数応答の減衰とほぼ等しいか又はそれより大きい割合で変化す る該スペクトル包絡線の部分を確認する装置と、 心理知覚モデルを改変する装置であって、それによってより高い情報要件が 前記スペクトル包絡線の部分に対応する選択された情報に課される装置と、 前記心理知覚モデルに従って前記選択された符号化情報の情報要件を設定する 装置とから成る、請求項11乃至19のいずれか1つの装置。
JP50474795A 1993-07-16 1994-07-15 デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置 Expired - Lifetime JP3297050B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US9226993A 1993-07-16 1993-07-16
US08/092,269 1993-07-16
US08/145,975 US5632003A (en) 1993-07-16 1993-11-01 Computationally efficient adaptive bit allocation for coding method and apparatus
US08/145,975 1993-11-01
US08/190,655 1994-01-28
US08/190,655 US5623577A (en) 1993-07-16 1994-01-28 Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
PCT/US1994/007976 WO1995002929A1 (en) 1993-07-16 1994-07-15 Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions

Publications (2)

Publication Number Publication Date
JPH09500502A true JPH09500502A (ja) 1997-01-14
JP3297050B2 JP3297050B2 (ja) 2002-07-02

Family

ID=27377179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50474795A Expired - Lifetime JP3297050B2 (ja) 1993-07-16 1994-07-15 デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置

Country Status (10)

Country Link
EP (1) EP0709006B1 (ja)
JP (1) JP3297050B2 (ja)
AT (1) ATE149766T1 (ja)
AU (1) AU677688B2 (ja)
CA (1) CA2165450C (ja)
DE (1) DE69401959T2 (ja)
DK (1) DK0709006T3 (ja)
ES (1) ES2098974T3 (ja)
SG (1) SG66294A1 (ja)
WO (1) WO1995002929A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002542648A (ja) * 1999-04-12 2002-12-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化
JP2005532586A (ja) * 2002-07-08 2005-10-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ処理
US9620135B2 (en) 2014-10-24 2017-04-11 Fujitsu Limited Audio encoding device and audio encoding method

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0722225A3 (de) * 1994-11-17 2000-06-07 Deutsche Thomson-Brandt Gmbh Audiosignalkodierung mittels Kurzzeitspektren und einem psychoakustischen Modell
DE60323331D1 (de) * 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
KR100738109B1 (ko) * 2006-04-03 2007-07-12 삼성전자주식회사 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치
CN101425293B (zh) * 2008-09-24 2011-06-08 天津大学 一种高效感知音频比特分配方法
KR101726205B1 (ko) 2012-11-07 2017-04-12 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산
US10332527B2 (en) 2013-09-05 2019-06-25 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio signal
CN113933590A (zh) * 2020-07-14 2022-01-14 森兰信息科技(上海)有限公司 波的频谱的计算方法、系统、介质及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
JP4177300B2 (ja) 2004-07-27 2008-11-05 三菱電機株式会社 電子ビーム表面処理方法、および電子ビーム表面処理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002542648A (ja) * 1999-04-12 2002-12-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化
JP4643019B2 (ja) * 1999-04-12 2011-03-02 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化
JP2005532586A (ja) * 2002-07-08 2005-10-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ処理
US9620135B2 (en) 2014-10-24 2017-04-11 Fujitsu Limited Audio encoding device and audio encoding method

Also Published As

Publication number Publication date
DK0709006T3 (da) 1997-09-01
DE69401959D1 (de) 1997-04-10
DE69401959T2 (de) 1997-07-31
ATE149766T1 (de) 1997-03-15
SG66294A1 (en) 1999-07-20
AU7335794A (en) 1995-02-13
ES2098974T3 (es) 1997-05-01
WO1995002929A1 (en) 1995-01-26
CA2165450A1 (en) 1995-01-26
EP0709006B1 (en) 1997-03-05
AU677688B2 (en) 1997-05-01
EP0709006A1 (en) 1996-05-01
JP3297050B2 (ja) 2002-07-02
CA2165450C (en) 2005-10-11

Similar Documents

Publication Publication Date Title
CA2166551C (en) Computationally efficient adaptive bit allocation for coding method and apparatus
US5632003A (en) Computationally efficient adaptive bit allocation for coding method and apparatus
US10529347B2 (en) Methods, apparatus and systems for determining reconstructed audio signal
US5301255A (en) Audio signal subband encoder
Tribolet et al. Frequency domain coding of speech
Pan Digital audio compression
US5357594A (en) Encoding and decoding using specially designed pairs of analysis and synthesis windows
KR100550399B1 (ko) 다중 오디오 채널을 저 비트율로 부호화 및 복호화하기위한 장치와 그 방법
EP1160770B2 (en) Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US5054075A (en) Subband decoding method and apparatus
EP0720148B1 (en) Method for noise weighting filtering
US5737718A (en) Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration
US6604069B1 (en) Signals having quantized values and variable length codes
US6199038B1 (en) Signal encoding method using first band units as encoding units and second band units for setting an initial value of quantization precision
JPH09500502A (ja) デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置
US6064698A (en) Method and apparatus for coding
JP3827720B2 (ja) 差分コーディング原理を用いる送信システム
EP0720146A1 (en) A method for measuring speech masking properties
Garnero et al. Perceptual speech coding using time and frequency masking constraints
Trinkaus et al. An algorithm for compression of wideband diverse speech and audio signals
JPH06291679A (ja) オーディオ信号のためのしきい値制御量子化決定法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080412

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100412

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110412

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120412

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120412

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130412

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130412

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140412

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term