JP4843142B2 - 音声符号化のための利得−適応性量子化及び不均一符号長の使用 - Google Patents
音声符号化のための利得−適応性量子化及び不均一符号長の使用 Download PDFInfo
- Publication number
- JP4843142B2 JP4843142B2 JP2000612930A JP2000612930A JP4843142B2 JP 4843142 B2 JP4843142 B2 JP 4843142B2 JP 2000612930 A JP2000612930 A JP 2000612930A JP 2000612930 A JP2000612930 A JP 2000612930A JP 4843142 B2 JP4843142 B2 JP 4843142B2
- Authority
- JP
- Japan
- Prior art keywords
- component
- components
- subband signal
- quantized
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000013139 quantization Methods 0.000 title claims description 123
- 238000000034 method Methods 0.000 claims description 70
- 230000008859 change Effects 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 230000000295 complement effect Effects 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims 4
- 102000001690 Factor VIII Human genes 0.000 claims 1
- 108010054218 Factor VIII Proteins 0.000 claims 1
- 230000006870 function Effects 0.000 description 60
- 230000008569 process Effects 0.000 description 19
- 230000008901 benefit Effects 0.000 description 17
- 238000013507 mapping Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 230000000153 supplemental effect Effects 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241001441724 Tetraodontidae Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
発明の技術分野
本発明は、一般に、符号化及び復号化信号に関する。本発明は、周波数サブバンド信号が別々に符号化される分割バンド符号化及び復号化のために有利に用いられ得る。本発明は、特に知覚音声符号化システムにおいて有用である。
【0002】
発明の背景技術
伝送チャネルに低情報容量要求を課す形式でデジタル音声信号を符号化する連続的な関心があり、記憶媒体は、高レベルな主観的品質で符号化音声信号をまだ伝達することができる。知覚符号化システムは、結果として生ずる量子化雑音をマスクするか、あるいは聞き取れないようにするための音声信号内のより大きなスペクトル成分を用いる方法で、音声信号を符号化及び量子化する処理を用いることによって、この矛盾する目的を達成しようと試みる。一般に、それがちょうど符号化される信号の音響心理学のマスク閾値以下に位置するように、量子化雑音スペクトルの形状及び振幅を制御することは、有利である。
【0003】
知覚符号化処理は、人の聴覚システムの臨界帯域に比例した帯域幅を有するサブバンド信号を得るために分析フィルタのバンクを音声信号に適用し、結果として生じる量子化雑音がちょうど音声信号の評価されたマスク閾値以下であるように、十分小さいサブバンド信号を量子化するための量子化ステップサイズを確立し、確立された量子化ステップサイズに従ってサブバンド信号を量子化し、量子化サブバンド信号を表す複数の符号を符号化信号にアセンブルする、いわゆる分割帯域符号器によって実行され得る。補足的知覚復号化処理は、符号化信号からその符号を抽出し、それから量子化サブバンド信号を復元し、量子化サブバンド信号の非量子化指示を得て、オリジナルの音声信号から理想的に、知覚的に区別できない音声信号を生成するために、合成フィルタのバンクを非量子化指示に適用する、分割帯域復号器によって実行され得る。
【0004】
これらのコーディングシステムにおけるコーディング処理は、しばしば、量子化信号要素又は各サブバンド信号の要素を表すために、均一長符号を用いる。残念ながら、均一長符号の使用は、必要とするより高い情報容量を強要する。要求される情報容量は、各サブバンド信号の量子化成分を表すために、非均一長符号を用いることによって減少され得る。
【0005】
非均一長符号を提供するための一つの技術は、量子化サブバンド信号成分のハフマン(Huffman)符号化である。典型的に、ハフマンコード表は、実際の適用で符号化される信号を表すために選択された「トレーニング信号」を用いて設計される。トレーニング信号の平均確率密度関数(PDF)が符号化された実際の信号のPDFに適度に近く、PDFが平らでないならば、ハフマンコーディングは、非常に良いコーディング利得を提供することができる。
【0006】
符号化される実際の信号のPDFがトレーニング信号の平均PDFに近くないならば、ハフマンコーディングは、コーディング利得を実現しないが、符号化信号の情報容量要求を増やして、コーディングペナルティーを被ってもよい。この問題は、異なる信号PDFに対応する多数のコードブックを用いることによって最小にされ得る。しかしながら、追加の記憶空間が、そのコードブックを格納するために要求され、追加の処理が、各コードブックに従って信号を符号化し、最良の結果を供給するものを選ぶために要求される。
【0007】
成分値のあらゆる特定のPDFに依存しない各サブバンド内の非均一長符号を用いて量子化サブバンド信号成分のブロックを表すことができ、最小の計算及びメモリリソースを用いて効率的に実行され得るコーディング技術のための要求が残存する。
【0008】
発明の開示
本発明の目的は、分割帯域コーディングシステムにおけるそれぞれの周波数サブバンド内のサブバンド信号成分のような量子化信号成分を表すために非均一長符号を用いることによって実現され得る利点を提供することである。
【0009】
本発明は、良いコーディング利得を達成するために成分値のあらゆる特定のPDFに依存せず、最小の計算及びメモリリソースを用いて効率的に実行され得る技術を用いて、この目的を達成する。ある適用では、コーディングシステムは、ハフマンコーディングのような他の技術と関連して本発明の機能を有利に使用し得る。
【0010】
本発明の一態様の教示によれば、入力信号を符号化する方法は、前記入力信号を受信し、該入力信号の周波数サブバンドを表すサブバンド信号成分のサブバンド信号ブロックを生成するステップと、前記サブバンド信号ブロック内の成分の大きさをある閾値と比較し、成分の大きさに従って2以上のクラスに各成分を配列し、利得率を得るステップと、前記サブバンド信号ブロックのいくつかの成分の大きさを変更するために、前記クラスの一つに配列された成分に前記利得率を適用するステップと、前記サブバンド信号ブロックの前記成分を量子化するステップと、前記成分の分類を伝達する符号化信号制御情報及び前記量子化サブバンド信号成分を表す非均一長符号にアセンブルするステップとを有する。本発明のもう一つの態様の教示によれば、符号化信号を復号する方法は、前記符号化信号を受信してそこから制御信号及び非均一長符号を得て、入力信号の周波数サブバンドを表す量子化サブバンド信号成分を該非均一長符号から得るステップと、サブバンド信号非量子化成分を得るために、前記サブバンド信号成分を非量子化するステップと、前記制御情報に従って、非量子化成分のいくつかの大きさを変更するために、利得率を適用するステップと、前記サブバンド信号非量子化成分に応じて出力信号を生成するステップとを有する。
【0011】
これらの方法は、本発明を実行するための装置によって実行され得る命令のプログラムとして媒体で具体化されてもよい。
【0012】
本発明のもう一つの態様の教示によれば、入力信号を符号化する装置は、前記入力信号を受信する入力と、該入力信号の周波数サブバンドを表すサブバンド信号成分のサブバンド信号ブロックを供給するための出力とを有する分析フィルタと、前記サブバンド信号ブロックの成分の大きさとある閾値を比較し、成分の大きさに従って2以上のクラスに各成分を配列し、利得率を得る、前記分析フィルタに接続されるサブバンド信号ブロック分析器と、前記サブバンド信号ブロックにおけるいくつかの成分の大きさを変更するために、前記利得率を前記クラスの一つに配列された成分に適用する、前記サブバンド信号ブロック分析器に接続されるサブバンド信号成分プロセッサと、前記利得率に従って変更された大きさを有する前記サブバンド信号ブロックの成分を量子化する、前記サブバンド信号プロセッサに接続される第1の量子化器と、量子化サブバンド信号成分を表す非均一長符号と前記成分の分類を伝達する制御情報を符号化信号にアセンブルする、前記第1の量子化器に接続されるフォーマッタとを備える。
【0013】
符号化信号を復号する装置における本発明のまだもう一つの教示によれば、その装置は、前記符号化信号を受信してそこから制御情報及び非均一長符号を得、該非均一長符号から量子化サブバンド信号成分を得るデフォーマッタと、第1の非量子化成分を得るために、前記制御情報に従って前記ブロックのいくつかのサブバンド信号成分を非量子化する、前記デフォーマッタに接続される第1の非量子化器と、前記制御情報に従って前記サブバンド信号ブロックのいくつかの第1の非量子化成分の大きさを変更するために、利得率を適用する、前記第1の非量子化器に接続されるサブバンド信号ブロックプロセッサと、前記サブバンド信号プロセッサに接続される入力と、出力信号を供給する出力とを有する合成フィルタとを備える。
【0014】
本発明の更にもう一つの態様の教示によれば、媒体は、(1) 量子化サブバンド信号成分を表す非均一長符号であって、該量子化サブバンド信号成分が音声信号の周波数サブバンドを表すサブバンド信号ブロックの要素に対応する、非均一長符号と、(2) 対応するサブバンド信号ブロック要素の大きさに従って量子化サブバンド信号成分の分類を示す制御情報と、(3) 前記制御情報に従って前記量子化サブバンド信号成分の大きさに関係する利得率の表示とを伝達する。
【0015】
本発明の種々の特徴及びその好ましい実施の形態は、以下の議論、及び、同様な参照数字が複数の図で同様な構成要素を言及する添付図面を参照することによってより良く理解され得る。以下の議論及び図面の内容は、単に例示として示され、本発明の範囲の制限を表すと理解すべきではない。
【0016】
発明を実行するためのモード
A.コーディングシステム
本発明は、音声情報のような量子化情報を表す効率を改善することに向けられ、分割帯域符号器及び分割帯域復号器を用いるコーディングシステムにおける有利な適用を見出す。本発明の種々の態様を組み込む分割帯域符号器及び分割帯域復号器の実施の形態は、それぞれ図1及び2に示される。
【0017】
1.符号器
a)分析フィルタリング
図1では、分析フィルタバンク12は、経路11から入力信号を受信し、その入力信号を入力信号の周波数サブバンドを表すサブバンド信号に分割し、経路13及び23に沿ってサブバンド信号を渡す。図の明確のため、図1及び2に示される実施の形態は、2つのサブバンドのみの構成要素を示す。しかしながら、知覚コーディングシステムの分割帯域符号器及び復号器が人の聴覚システムの臨界帯域に比例する帯域幅を有するより多くのサブバンドを処理することが、一般的である。
【0018】
分析フィルタバンク12は、多層フィルタ、格子フィルタ、直交鏡フィルタ(QMF)、フーリエ級数型変換、コサイン変調フィルタバンク変換及びウェーブレット変換を含む種々の時間領域から周波数領域へのブロック変換を含む多種多様な方法で実行され得る。好ましい実施の形態では、フィルタのバンクは、分析(15)特表2002−542522ウィンドウ関数でデジタル音声サンプルの重複ブロックに重み付けをするか又は変調することによって、及び特定の修正された離散コサイン変換(MDCT)をウィンドウ重み付けブロックに適用することによって実行される。このMDCTは、時間領域エイリアシング相殺(TDAC)変換として言及され、1987年5月のProc.Int.Conf.Acoust.,Speech,andSignalProc.の2161〜2164頁におけるPrincen、Johnson及びBradleyの「時間領域エイリアシング相殺に基づくフィルタバンク設計を用いるサブバンド/変換符号化」に開示される。実行の選択がコーディングシステムの性能における重要な効果を有し得るけれども、分析フィルタバンクの特定の実行は、本発明の概念において重要ではない。
【0019】
経路13及び23に沿って渡されるサブバンド信号は、それぞれ、ブロックに配列されるサブバンド信号成分を含む。好ましい実施の形態では、各サブバンド信号ブロックは、成分が倍率に関して大きさを調整されるブロックスケール形式で表される。例えば、サブバンド信号成分は、ブロック浮動小数点(BFP)形式が用いられてもよい。
【0020】
例えば、分析フィルタバンク12がブロック変換によって実行されるならば、その変換を、入力信号サンプルのブロックに適用して変換係数のブロックを生成し、そして、1以上の隣接した変換係数をグループ化しサブバンド信号ブロックを形成することによって、サブバンド信号が生成される。例えば、分析フィルタバンク12がQMFのようなもう一つのタイプのデジタルフィルタによって実行されるならば、そのフィルタを一連の入力信号サンプルに適用して周波数サブバンドの各々について一連のサブバンド信号サンプルを生成し、そして、このサブバンド信号サンプルをブロックにグループ化することによって、サブバンド信号が生成される。これらの2つの例のサブバンド信号成分は、それぞれ、変換係数及びサブバンド信号サンプルである。
【0021】
b)知覚モデリング
知覚コーディングシステムのための好ましい実施の形態では、符号器は、各サブバンド信号を量子化するためのそれぞれの量子化ステップサイズを確立するために、知覚モデルを用いる。順応してビットを割り当てるために、知覚モデルを用いる一方法は、図3に示される。この方法によれば、ステップ51は、望ましい量子化雑音スペクトルを確立するために、入力信号の特性を表す情報に知覚モデルを適用する。多くの実施の形態では、このスペクトルの雑音レベルは、入力信号の評価音響心理学的マスク閾値に対応する。ステップ52は、サブバンド信号ブロックの成分を量子化するための最初の提案された量子化ステップサイズを確立する。ステップ53は、すべてのサブバンド信号成分のための提案された量子化ステップサイズを得るために要求されるビットの割当てを決定する。好ましくは、割当ては、符号化信号を復号するために用いられる分割帯域復号器の合成フィルタの雑音伸長効果のためになされる。割当てのようなものをなすためのいくつかの方法は、1999年4月12日に出願された「合成フィルタ雑音伸長のための補償を持つ知覚音声コーダにおけるの量子化」と題されたUbale他の米国特許第5,623,577号及び米国特許出願番号第09/289,865号に開示される。そのどちらも参照によってここに組み込まれる。
【0022】
ステップ54は、要求される割当てのトータルが量子化に利用可能なトータルビット数から著しく違っているか否かを決定する。トータル割当てがあまりに高いならば、ステップ55は、提案された量子化ステップサイズを増加する。トータル割当てがあまりに低いならば、ステップ55は、提案された量子化ステップサイズを減少する。処理は、ステップ53に戻り、提案される量子化ステップサイズを得るために要求されるトータル割当てが利用可能なトータルビット数に概ね近いとステップ54が決定するまでこの処理を繰り返す。その後、ステップ56は、確立された量子化ステップサイズに従ってサブバンド信号成分を量子化する。
【0023】
c)利得−適応性量子化
利得−適応性量子化は、例えば、ステップ53中に本発明の種々の態様を含むことによって、上述の方法に組み込まれてもよい。上述の方法が多くの知覚コーディングシステムの典型であるけれども、本発明に組み込まれ得るコーディング処理の単なる一例である。本発明は、量子化信号成分のためのステップサイズを確立するために、あらゆる主観的及び/又は客観的基準を本質的に用いるコーディングシステムにおいて用いられ得る。議論の容易のため、単純化された実施の形態が、本発明の種々の態様を説明するためにここでは用いられる。
【0024】
一周波数サブバンドのためのサブバンド信号ブロックは、経路13に沿ってサブバンド信号分析器14に渡される。この分析器14は、各部ロックのサブバンド信号成分の大きさを閾値と比較し、成分の大きさに従って2つのクラスの一つに各成分を配列する。成分の分類を伝達する制御情報は、フォーマッタ19に渡される。好ましい実施の形態では、閾値以下の大きさを有する成分が、第1のクラスに配列される。サブバンド信号分析器14は、また、次の使用のための利得率を得る。以下に説明されるように、好ましくは、利得率の値は、いくつかの方法で閾値のレベルに関連する。例えば、閾値は、利得率だけの関数として表現されてもよい。その代わりに、閾値は、利得率及び他の考慮の関数として表現されてもよい。
【0025】
第1のクラスに配列されるサブバンド信号成分は、利得要素15に渡される。それは、サブバンド信号分析器14によって得られる利得率を第1のクラスの各成分に適用する。利得変更成分は、それから、量子化器17に渡される。量子化器17は、第1の量子化ステップサイズに従って利得変更成分を量子化し、フォーマッタ19に結果として生じる量子化成分を渡す。好ましい実施の形態では、第1の量子化ステップサイズは、知覚モデルに従って、及びサブバンド信号分析器14によって用いられる閾値の値に従って設定される。
【0026】
第1のクラスに配列されるサブバンド信号成分は、経路16に沿って量子化器18に渡される。それは、第2の量子化ステップサイズに従ってこれらの成分を量子化する。第2の量子化ステップサイズは、第1の量子化ステップサイズと等しくてもよい。しかしながら、好ましい実施の形態では、第2の量子化ステップサイズは、第1の量子化ステップサイズよりも小さい。
【0027】
第2の周波数サブバンドのためのサブバンド信号ブロックは、経路23に沿って渡され、第1の周波数サブバンドのために上述したのと同じ方法で、サブバンド信号分析器24、利得要素25、並びに、量子化器27及び28によって処理される。好ましい実施の形態では、各周波数サブバンドに用いられる閾値は、適応性があり、他の周波数サブバンドに用いられる閾値から独立している。
【0028】
d)符号化信号フォーマッティング
フォーマッタ19は、成分の分類を伝達する制御情報と、量子化サブバンド信号成分を表す非均一長符号とを符号化信号にアセンブルし、ベースバンド又は超音波から紫外周波数までを含むスペクトル中の変調通信経路のような伝送媒体、あるいは、磁気又は光学式記録技術を用いて情報を運ぶ、磁気テープ、磁気ディスク及び光学式ディスクを含む記憶媒体によって伝送される経路20に沿って符号化信号を渡す。
【0029】
量子化成分を表すために用いられる符号は、量子化値に同一であってもよく、あるいは、それらは、量子化値から得られるいくつかのコードのタイプであってもよい。例えば、符号は、量子化器から直接得られてもよく、あるいは、ハフマン符号化のようないくつかの処理によって量子化値を得られてもよい。量子化値そのものは、非均一長符号として容易に用いられ得る。なぜならば、ビットの非均一数は、サブバンド内の量子化サブバンド信号成分に割り当てられ得るからである。
【0030】
2.復号器
a)符号化信号デフォーマッティング
図2では、デフォーマッタ32は、経路31から符号化信号を受信し、量子化サブバンド信号成分を表す符号と成分の分類を伝達する制御情報とをそこから得る。復号化処理は、符号から量子化成分を得るのに必要であるとして適用され得る。好ましい実施の形態では、利得変更成分は、第1のクラスに配列される。例えば、デフォーマッタ32は、同じく、あらゆる知覚モデル又はビット割当て処理によって必要とされ得るあらゆる情報を得る。
【0031】
b)利得−適応性非量子化
非量子化器33は、第1のクラスに配列される一サブバンド信号ブロックのための成分を受信し、第1の量子化ステップサイズに従ってそれらを非量子化し、利得要素35にその結果を渡す。好ましい実施の形態では、第1の量子化ステップサイズは、知覚モデルに従って、及びサブバンド信号成分を分類するために用いられた閾値に従って設定される。
【0032】
利得要素35は、非量子化器33から受信される非量子化成分に利得率を適用し、利得変更成分を合流37に渡す。利得要素35の操作は、片方のふぐ気乗り特要素15によって提供される利得変更を反転する。上記で説明されるように、好ましくは、この利得率は、サブバンド信号成分を分類するために用いられた閾値に関連する。
【0033】
第1のクラスに配列されないサブバンド信号成分は、非量子化器34に渡される。それは、第2の量子化ステップサイズに従ってこれらの成分を非量子化し、その結果を合流37に渡す。第2の量子化ステップサイズは、第1の量子化ステップサイズと等しくてもよい。しかしながら、好ましい実施の形態では、第2の量子化ステップサイズは、第1の量子化ステップサイズよりも小さい。
【0034】
合流37は、利得要素35から受信される利得変更非量子化成分を非量子化器36から受信される非量子化成分と融合し、経路38に沿って結果として生じるサブバンド信号ブロックを合成フィルタバンク39に渡す。
【0035】
第2の周波数サブバンドのためのサブバンド信号ブロック内の量子化成分は、第1の周波数サブバンドのために上述のような同一の方法で、非量子化器43及び44、利得要素45、並びに合流47によって処理され、経路48に沿って結果として生じるサブバンド信号ブロックを合成フィルタバンク39に渡す。
【0036】
c)合成フィルタリング
合成フィルタバンク39は、分析フィルタバンク12を実行するための上述の方法に補足的な多種多様の方法で実行され得る。出力信号は、経路38及び48から受信されたサブバンド信号成分のブロックに応じて経路40に沿って生成される。
【0037】
B.機能
1.サブバンド信号成分分類
a)単純化閾値関数
利得−適応性量子化の効果は、図4において評価され得る。それは、サブバンド信号成分の仮想ブロック111、112及び113を示す。示される例では、各サブバンド信号ブロックは、1から8まで番号を付された8つの成分を含む。各成分は、垂直線によって表され、各成分の大きさは、それぞれの線の高さによって表される。例えば、ブロック111の成分1は、グラフの縦座標軸に示されるように、値0.25よりもわずかに大きい大きさを有する。
【0038】
線102は、0.50レベルにおける閾値を表す。ブロック111の各成分は、それぞれの成分の大きさをその閾値と比較することによって、2つのクラスの一つに配列され得る。閾値以下の大きさを有する成分は、第1のクラスに配列される。残りの成分は、第2のクラスに配列される。その代わりに、閾値より厳密に小さい大きさを有する成分を第1のクラスに配列することによって、成分が分類されるならば、わずかに異なる結果が得られることができる。議論の容易のため、第1の例による閾値比較が想定され、ここで特に言及される。
【0039】
ブロック112の成分は、第1のクラスに配列される各部ロック111成分に2つの利得率を適用することによって得られる。例えば、0.500よりわずかに大きいブロック112の成分1の大きさは、ブロック111の成分1の大きさに2に等しい利得率を乗算することによって得られる。逆に、ブロック112の成分2の大きさは、ブロック111の成分2の大きさに等しい。なぜならば、この成分は、第2のクラスに配列されたので、利得率によって変更されないからである。
【0040】
線104は、0.25レベルにおける閾値を表す。ブロック111の各成分は、それぞれの成分の大きさをこの閾値と比較しその閾値以下の大きさを有する成分を第1のクラスに配列することによって、2つのクラスの一つに配列されてもよい。残りの成分は、第2のクラスに配列される。
【0041】
ブロック113の成分は、第1のクラスに配列された各ブロック111成分に4の利得率を適用することによって得られる。例えば、およそ0.44であるブロック113の成分3の大きさは、およそ0.11であるブロック111の成分3の大きさに4に等しい利得率を乗算することによって得られる。逆に、ブロック113の成分1の大きさは、ブロック111の成分1の大きさに等しい。なぜならば、この成分は、第2のクラスに配列されたので、利得率によって変更されないからである。閾値は、利得率だけの関数として表現されてもよい。これらの2つの例によって示されるように、閾値は、以下のように表現され得る:
Th=1/G (1)
ここで、Th=閾値、及び、
G=利得率。
【0042】
b)代わりの閾値関数
残念ながら、式1から得られる閾値は、大きすぎるかもしれない。なぜならば、利得率Gによって変更されるとき、閾値Thよりわずかに小さい大きさを有するサブバンド信号成分は、量子化器に負荷をかけすぎ得るからである。その値の量子化エラーが量子化ステップサイズの1/2を越えるならば、値は、量子化器(22) 特表2002−542522に負荷をかけすぎると言われる。およそ−1〜+1までの範囲に値を量子化する均一の量子化ステップサイズを有する対称の量子化器のために、量子化器に負荷をかけすぎる正数の領域は、以下のように表現され得る:
QOL >QMAX +ΔQ/2 (2a)
また、量子化器に負荷をかけすぎる負数の領域は、以下のように表現され得る:
QOL <−QMAX −ΔQ/2 (2b)
ここで、QOL =量子化器に負荷をかけすぎる値;
QMAX =最大正量子化値;
ΔQ=量子化ステップサイズ。
【0043】
およそ−1〜+1の範囲に値を量子化する均一量子化ステップサイズを有するbビット対称ミッドスレッドサイン量子化器のために、最大正量子化値QMAXは、1−21−bに等しく、量子化ステップサイズΔQは、21−bに等しく、量子化ステップサイズの1/2は、2−bに等しい。正の過負荷値のための式2aは、以下のように書き直され得る:
QOL>1−21−b+2−b=1−2−b (3a)
また、負の過負荷値のための式2bは、以下のように書き直され得る:
QOL<−(1−21−b)−2−b=−1+2−b (3b)
【0044】
図4の線100は、3ビット対称ミッドスレッドサイン量子化器のための正の過負荷値の境界を表す。この量子化器の負の範囲は図示しない。この量子化器のための最大正量子化値は、0.75=(1−21−3)であり、量子化ステップサイズの1/2は、0.125=2−3である;それゆえ、この量子化器の正過負荷値の境界は、0.875=(1−2−3)である。負の過負荷値の境界は、−0.875である。
【0045】
ブロック111の成分5は、0.500における閾値よりわずかに小さい大きさを有する。2に等しい利得率がこの成分に適用されると、結果として生じる大きさは、量子化器の過負荷境界を越える。類似の問題は、0.250に等しい閾値が4に等しい利得率で用いられるとき、成分6で発生する。
【0046】
過負荷を避け、量子化器の正の範囲に第1のクラスの正の成分値の領域を最適に写像する正数の閾値は、以下のように表現され得る:
Th=QOL/G (4a)
負数の閾値は、以下のように表現され得る:
Th=−QOL/G (4b)
【0047】
この議論の残りを通して、単に正の閾値が議論される。この単純かはあらゆる普遍性を失わない。なぜならば、成分の大きさを正の閾値と比較する操作は、成分の振幅を正及び負の閾値と比較する他の操作と同等だからである。
【0048】
上述のbビット対称ミッドスレッドサイン量子化器のために、式4Aの閾値関数は、以下のように書き直され得る:
Th=(1−2−b)/G (5)
【0049】
この代わりの閾値を用いる利得−適応性量子化の効果は、図5に示される。その図は、サブバンド信号成分の仮想ブロック121、122、123及び124を示す。示される例では、各サブバンド信号ブロックは、1から8までの番号を付された8つの成分を含む。その大きさは、それぞれの垂直線の長さによって表される。線102及び104は、それぞれ2及び4に等しい利得率のための3ビット最小ミッドスレッドサイン量子化器のための閾値を表す。線100は、この量子化器のための正の過負荷値の境界を表す。
【0050】
サブバンド信号ブロック122の成分は、ブロック121の成分の大きさを閾値102と比較し、G=2の利得を閾値以下の大きさを有する成分に適用することによって得られてもよい。同様に、サブバンド信号ブロック123の成分は、ブロック121の成分の大きさを閾値104と比較し、G=4の利得をこの閾値以下の大きさを有する成分に適用することによって得られてもよい。サブバンド信号ブロック124の成分は、以下に示されるカスケード技術を用いて得られてもよい。上述の第1の閾値のために図4に示される例とは異なり、図5に示される利得変更成分は、量子化器の過負荷境界を越えない。
【0051】
一方では、式5による代わりの閾値が望ましい。なぜならば、それは、第1のクラスの小さい大きさの成分のための量子化過負荷を避け、量子化器に最適に負荷をかけるからである。他方、この閾値は、最適な量子化ステップサイズを求めるいくつかの実施の形態では望ましくないかもしれない。なぜならば、閾値は、量子化ステップサイズが確立されるまで決定され得ないからである。ビットを割り当てることによって量子化ステップサイズを適応する実施の形態では、量子化ステップサイズは、それぞれのサブバンド信号ブロックのビット割当てbが知られるまで確立され得ない。この不利益は、以下に詳細に説明される。
【0052】
2.量子化
好ましくは、サブバンド信号ブロックの成分を量子化するために用いられる量子化器の量子化ステップサイズは、そのブロックのための利得率に応じて適応される。上述の、図3に示されるものと類似の処理を用いる一実施の形態では、多くのビットbが、サブバンド信号ブロック内の各成分に割り当てられ、それから、量子化ステップサイズあるいはビット割当ては、そのブロックのために選択された利得率に従って各成分に適応される。この実施の形態のために、利得率は、1、2、4及び8の利得を表す4つの可能な値から選択される。そのブロック内の成分は、対称ミッドスレッドサイン量子化器を用いて量子化される。
【0053】
第1のクラスに配列されず、利得変更されないより大きい大きさの成分は、本発明の利益なく割り当てられるように、ビットの同じ数bを割り当てられる。以下に示される分割インターバル量子化を用いる代わりの実施の形態では、これらのより大きい大きさの成分のためのビット割当ては、いくつかの利得率のために減少され得る。
【0054】
第1のクラスに配列され、利得変更される小さい大きさの成分には、表Iに示される値に従ってビット数が割り当てられる。
【0055】
【表1】
【0056】
特定のサブバンド信号ブロックの1に等しい利得率は、本発明の利得変更機能がそのブロックに適用されないことを示す。それゆえ、ビットの同数bは、本発明の利益なく割り当てられるように、各成分に割り当てられる。特定のサブバンド信号ブロックの利得率G=2、4及び8の使用は、それぞれ、そのサブバンドブロックの各より小さい大きさの成分のための1、2及び3ビットの減らされた割当ての利益を潜在的に提供することができる。
【0057】
表Iに示される割当ては、各成分に割り当てられるビット数が1より小さくなり得ないという制限を受ける。例えば、b=3ビットを特定のサブバンド信号ブロックと利得率G=8に割り当てられるビット割当て処理は、そのブロックのために選択されるならば、より小さい大きさの成分のためのビット割当ては、表Iによって提案されるように、0ビットよりもむしろ1ビットに減らされるであろう。利得変更とビット割当てへの調整の意図的効果は、わずかなビットを用いる同じ信号−量子化雑音比を本質的に保つことである。望むならば、一実施の形態は、割り当てられたビット数を減らさないあらゆる利得率を選択することを避け得る。
【0058】
3.制御情報
上記で説明されるように、サブバンド信号分析器14は、符号化信号へのアセンブリーのためにフォーマッタ19に制御情報を供給する。この制御情報は、サブバンド信号ブロック内の各成分のための分類を伝達する。この制御情報は、種々の方法で符号化信号に含まれ得る。
【0059】
制御情報を含む一つの方法は、1ビットがブロック内の各成分に対応するそれぞれのサブバンド信号ブロックのビット列を符号化信号に埋め込むことである。一つの値にセットされたビット、例えば、値1は、対応する成分が利得変更成分でないことを示し、この例では値0である他の値に設定されたビットは、対応する成分が利得変更成分であることを示す。制御情報を含むもう一つの方法は、利得変更された、あるいはその代わりに利得変更されない各成分のすぐ前の符号化信号に特別な「エスケープコード」を埋め込むことである。
【0060】
対称ミッドスレッドサイン量子化器を用いる上述の好ましい実施の形態では、利得変更ではない各大きい大きさの成分は、未使用の量子化値に等しいエスケープコードによって先導される。例えば、3ビット2補数サイン量子化器のための量子化値は、3ビットの2進数列b’101によって表される−0.750の最小値から2進数列b’011によって表される+0.75の最大値まで変化する。―1.000に対応する2進数列b’100は、量子化のために用いられず、制御情報としての使用のために利用可能である。同様に、4ビット2補数サイン量子化のための未使用の2進数列は、b’1000である。
【0061】
図5のサブバンド信号ブロック121において、成分4及び5は、閾値102を越える大きい大きさの成分である。この閾値が利得率G=2に関して用いられるならば、第1のクラスに配列されるすべての小さい大きさの成分のためのビット割当ては、表Iに上記で示されるようにb−1である。例えば、ビット割当て処理がb=4ビットをブロック121の各成分に割り当てるならば、各サブバンド信号成分の割当ては、3=(b−1)ビットに減らされ、3ビット量子化器は、小さい大きさの成分を量子化するために用いられる。この例では成分4及び5である各大きい大きさの成分は、4ビット量子化器で量子化され、3ビット量子化器の未使用の2進数列又はb’100に等しい制御情報によって識別される。各大きい大きさの成分のためのこの制御情報は、それぞれの大きい大きさの成分のすぐ前の符号化信号に都合よくアセンブルされ得る。
【0062】
本発明が前のパラグラフで論じられた例では利益を提供しないことを指摘することは、教訓的であり得る。この例では6ビットである制御情報を伝達するために要求されるコスト又は間接費は、小さい大きさの成分のためにビット割当てを減らすことによって節約されるビット数に等しい。上記例において、ブロック121のただ一つの成分が大きい大きさの成分であったならば、本発明は、このブロックを伝達するために要求されるビット数を4だけ減らす。7ビットが、7つの小さい大きさの成分に減らされた割当てによって節約され、ただ3ビットだけが、一つの大きい大きさの成分のための制御情報を伝達するために要求される。
【0063】
この最後の例は、一つの追加の態様を無視する。2ビットが、4つの利得率がそのブロックに用いられるものを伝達するために、この模範的な実施の形態における各サブバンド信号ブロックのために要求される。上述のように、1に等しい利得率は、本発明の特徴が特定のサブバンド信号ブロックのために適用されないことを示すために用いられてもよい。
【0064】
本発明は、通常、4又はそれ以下の成分を持つサブバンド信号ブロックを量子化するための利益を提供しない。人の聴覚システムの臨界帯域幅に比例した帯域幅を有するサブバンド信号を生成する知覚コーディングシステムでは、低周波数サブバンドのためのサブバンド信号ブロックの成分数は小さく、おそらくブロック毎に1成分であるが、サブバンド信号ブロック毎の成分数は、サブバンド周波数が増えるにつれて増加する。結果として、好ましい実施の形態では、本発明の特徴を実行するために要求される処理は、一層広いサブバンドに制限され得る。制御情報の追加の一つは、利得−適応性量子化が用いられるもっとも低い周波数サブバンドを示すために、符号化信号に埋め込まれてもよい。符号器は、入力信号特性に従ってこのサブバンドを順応して選択することができる。この技術は、利得−適応性量子化を用いないサブバンドのための制御情報を提供する必要性を防止する。
【0065】
4.復号器特徴
本発明の特徴と組み込む復号器は、本質的にあらゆる方法で、その量子化器の量子化ステップサイズを順応して変え得る。例えば、上述の実施の形態で符号器によって生成された符号化信号を複kごうする用仁位とされる復号器は、量子化ステップサイズを設定するために、適応性のあるビット割当てを用いてもよい。復号器は、いわゆる前方適応性システムで操作してもよい。そのシステムでは、ビット割当ては、符号化信号から直接得られてもよい。それは、いわゆる後方適応性システムで操作してもよい。そのシステムでは、ビット割当ては、符号器に用いられた同じ割当て処理を繰り返すことによって得られてもよい。あるいは、それは、2つのシステムの混合で操作してもよい。この方法で得られる割当て値は、「従来の」ビット割当てとして言及される。
【0066】
復号器は、利得率及び各サブバンド信号ブロックの成分の分類を識別するために、符号化信号から制御情報を得る。上述の例を続けて、利得率G=1を伝達する制御情報は、利得−適応性特徴が用いられず、従来のビット割当てbがその特定のサブバンド信号ブロックの成分を非量子化するために用いられるべきであることを示す。他の利得率値のために、あるブロックのための従来のビット割当てbは、「エスケープコード」の値あるいは大きい大きさの成分を識別する制御情報を決定するために用いられる。上記に与えられた例では、利得率G=2でb=4の割当ては、制御情報が3=(b−1)ビットに等しい長さを有する2進数列b’100であることを示す。符号化信号のこの制御情報の存在は、大きい大きさの成分がすぐに次に続くことを示す。
【0067】
各利得変更成分のためのビット割当ては、上述のように調整され、表Iに示される。非量子化は、適切な量子化ステップサイズを用いて実行され、利得変更成分は、符号器における利得変更を実行するために用いられる利得率の複製である利得率をかけられる。例えば、小さい大きさの成分が符号器において利得率G=2を欠けられたならば、復号器は、対応する非量子化成分に逆数利得G=0.5を適用する。
【0068】
C.追加の特徴
上述のバリエーションに加えて、いくつかの代替が以下に論じられる。
【0069】
1.追加の分類
一代替によれば、サブバンド信号ブロックの成分の大きさは、2以上の閾値と比較され、2以上のクラスに配列される。例えば、図5において、ブロック121の各成分の大きさは、閾値102及び104と比較され、3つのクラスの一つに配列され得る。利得率は、クラスの2つのために得られ、適切な成分に適用され得る。例えば、利得率G=4は、閾値104以下の大きさを有する成分に適用され得、利得率G=2は、閾値102以下であるが、閾値104より大きい大きさを有する成分に適用され得る。その代わりに、利得率G=2は、閾値102以下の大きさを有する成分のすべてに適用され得、利得率G=2は、閾値104以下の大きさを有する成分に適用され得る。
【0070】
2.カスケード操作
上述の利得変更処理は、量子化の前に複数回実行されてもよい。図6は、カスケードで2つの利得ステージの一実施の形態を示すブロック図である。この実施の形態では、サブバンド信号分析器61は、サブバンド信号ブロックの大きさを第1の閾値と比較し、その成分を2つのクラスの一つに配列する。利得要素62は、クラスの一つに配列される成分に第1の利得率を適用する。第1の利得率の値は、第1の閾値の値に関連する。
【0071】
サブバンド信号分析器64は、利得変更成分の大きさとあるいはブロック内の残りの成分を第2の閾値と比較し、その成分を2つのクラスの一つに配列する。利得要素65は、第2の利得率をクラスの一つに配列された成分に適用する。第2の利得率の値は、第2の閾値の値に関連する。第2の閾値が第1の閾値以下ならば、サブバンド信号分析器64は、分析器61が第1の閾値より大きい大きさのためにクラスに配列した成分を分析する必要がない。
【0072】
サブバンド信号ブロック成分は、上述と類似の方法で、量子化器67及び68によって量子化される。
【0073】
図5において、サブバンド信号ブロック124の成分は、サブバンド信号分析器61及び利得要素62が利得率G=2を閾値102以下の大きさを有する成分に適用する利得ステージの連続する適用によって得られてもよく、サブバンド信号分析器64及び利得要素65は、まだ閾値102以下である大きさを有する利得変更成分に利得率G=2を適用する。例えば、ブロック121の成分1〜3及び6〜8は、ブロック122に示される暫定結果を作り出す第1のステージで利得率G=2によって変更される。成分1、3、7及び8は、ブロック124に示される結果を得るために、第2ステージで利得率G=2によって変更される。
【0074】
カスケードの利得ステージを用いる実施の形態では、適当な制御情報は、復号器がカスケードの利得ステージの補足的なセットを実行できるように、符号化信号に供給されるべきである。
【0075】
3.最適化ビット割当て
利得−適応性量子化を適用するいくつかの可能な計画がある。一つの単純な計画は、第1の閾値及び関連する第1の利得率G=2で始めることによって、それぞれサブバンド信号ブロックの成分を分析し、第1の閾値及び第1の利得率に従って利得−適応性量子化がビット割当て要求の減少をもたらすか否かを決定する。もたらさないならば、分析がストップし、利得−適応性量子化は、実行されない。減少をもたらすならば、分析は、第2の閾値及び関連する第2の利得率G=4で継続する。第2の閾値及び関連する利得率の使用がビット割り当ての減少をもたらさないならば、利得適応性量子化は、第1の閾値及び第1の利得率を用いて実行される。第2の閾値及び第2の利得率の使用が減少をもたらすならば、分析は第3の閾値及び関連する第3の利得率G=8で継続する。この処理は、ある閾値及び関連する利得率の使用がビット割り当ての減少をもたらさないか、あるいは閾値及び関連する利得率のすべての組み合わせが考慮されるまで継続する。
【0076】
もう一つの計画は、各可能な閾値及び関連する利得率によって提供されるコスト及び利益を計算し、もっとも大きい総利益をもたらす閾値及び利得率を用いることによって、利得率の選択を最適化することを調べる。上述の例では、特定の閾値及び関連する利得率のための総利益は、コストより少ない全体の利益である。全体の利益は、利得変更される小さい大きさの成分のためのビット割り当てを減少することによって節約されるビット数である。コストは、利得変更されない大きい大きさの成分のための制御情報を伝達するように要求されるビット数である。
【0077】
この好ましい計画が実行され得る一方法は、以下のプログラム片で示される。このプログラム片は、C、フォートラン(FORTRAN)及びベーシック(BASIC)プログラム言語のある統語論的な特徴を含む構文を用いる擬似コードで表現される。このプログラム片及びここで示される他のプログラムは、コンパイルに適するソースコード部分であるように意図されないが、可能な実施の2、3の態様を伝えるために提供される。
【0078】
Gain ( X, N, b ) {
Th2 = (1-2^(-b)) / gf[1]; //利得率G=2の閾値を初期化
Th4 = Th2 / 2; //利得率G=4の. . .
Th8 = Th4 / 2; //利得率G=8の. . .
n2 = n4 = n8 = 0; //カウンタを初期化
for ( k=1 to N ) { //各成分kのために
CompMag = Abs(X[k]); //成分の大きさを得る
if (CompMag >Th2)
n2 = n2 + 1 ; //Th2より上の成分をカウント
else if (CompMag >Th4)
n4 = n4 + 1 ; //Th4及びTh2の間の成分をカウント
else if (CompMag >Th8)
n8 = n8 + 1 //Th8及びTh4の間の成分をカウント
}
n24 = n2 + n4; //Th4より上の大きい成分の数
n248 = n24 + n8; //Th8より上の大きい成分の数
benefit2 = Min(b-1, 1); //G=2を用いることによって節約される小さい成分毎のビット
benefit4 = Min(b-1, 2); //G=4を用いることによって節約される小さい成分毎のビット
benefit8 = Min(b-1, 3); //G=8を用いることによって節約される小さい成分毎のビット
net[0] = 0; //利得変更ない総利益
net[1] = (N-n2) * benefit2 - n2 * (b-benefit2); //G=2を用いる総利益
net[2] = (N-n24) * benefit4 - n24 * (b-benefit4); //G=4を用いる総利益
net[3] = (N-n248) * benefit8 - n248 * (b-benefit8); //G=8を用いる総利益
j = IndexMax(net[j], j=0 to 3); //最大利益のインデックスを得る
Gain = gf[j]; //利得率を得る
}
【0079】
関数Gainは、サブバンド信号ブロック成分のアレイX、ブロックの成分数N、及び成分のブロックのための従来のビット割当てbで提供される。関数の第1分は、アレイgfから得られる利得率G=2に関連する閾値を表すための変数Th2を初期化するために、上記で示される式5に従ってある計算を用いる。この例では、利得率gf[1]、gf[2]及びgf[3]は、それぞれG=2、4及び8に等しい。次の文は、利得率G=4及び8に関連する閾値のための変数を初期化する。次に、種々のクラスの大きい大きさの成分数を決定するために用いられるカウンタは、0に初期化される。
【0080】
for-loopの文は、アレイXの各サブバンド信号ブロック成分のための大きさを得るために関数Absを呼び出し、最も高い閾値で初めて、成分の大きさをその閾値と比較する。例えば、大きさが閾値Th2より大きいならば、変数n2は、1だけ増される。For-loopが終わると、変数n2は、閾値Th2より大きい大きさを有する成分数を含み、変数n4は、閾値Th4より大きいが閾値Th2以下である大きさを有する成分数を含み、変数n8は、閾値Th8より大きいが閾値Th4以下である大きさを有する成分数を含む。
【0081】
for-loopにすぐに続く2つの文は、それぞれの閾値より上の成分のトータル数を計算する。変数n24の数は、閾値Th4より大きい大きさを有する成分数を表し、変数n248は、閾値Th8より大きい大きさを有する成分数を表す。
【0082】
次の第3文は、各利得率を用いるための小さい大きさの成分毎の利益を計算する。この利益は、表Iに上記で示されるように成分毎に1、2又は3ビットと同じ多さであってもよいが、各成分への割当てが1ビットの最小値に制限されるので、その利益は、また、成分毎にわずかにb−1ビットに制限される。例えば、変数benefit2の数は、利得率G=2を用いることによって節約される小さい大きさの成分毎のビット数を表す。表Iに示されるように、利益は、1ビットと同じ多さであってもよい。しかしながら、利益は、また、わずかに従来のビット割当てb−1に制限される。この利益の計算は、2つの値b−1及び1の最小値を生む関数Minを用いることによって供給される。
【0083】
ネット利益は、それから計算され、アレイnetの要素に割り当てられる。要素net[0]は、0である利得−適応性量子化を用いないネット利益を表す。利得率G=2を用いるネット利益は、小さい大きさの成分毎の適切な利益benefit2に小さい大きさの成分の適切な数(N-n2)をかけ、コストを減ずることによって、net[1]に割り当てられる。それは、制御情報のために用いられる未使用の量子化値の長さをかけられる大きい大きさの成分数n2である。この長さは、小さい大きさの成分のビット長であり、それは、小さい大きさの成分毎に節約されるビットだけ減らされる従来のビット割当てbから得られてもよい。例えば、利得率G=2のときの小さい大きさの成分のビット長は、数量(b-benefit2)である。類似の計算は、利得率G=4及び8を用いるネット利益をそれぞれ変数net[2]及びnet[3]に割り当てるために実行される。
【0084】
関数IndexMaxは、アレイnetの最も大きいネット利益のためのアレイインデックスjを得るために呼び出される。このインデックスは、関数Gainだけ減らされるgfアレイから適切な利得率を得るために用いられる。
【0085】
4.単純化閾値関数を用いる改善された効率
図3に示されるように、本発明の種々の特徴が知覚ビット割当て処理に組み込まれ得ることが上述された。特に、これらの特徴はステップ53で実行され得る。ステップ53は、符号化される各サブバンド信号ブロックの成分を量子化する提案されたビット割当てを反復して決定するループ内で実行される。このため、ステップ53で実行される操作の効率は、非常に重要である。
【0086】
各ブロックのための最適な利得率を決定する関数Gainのために上述される処理は、比較的非効率的である。なぜならば、それは、種々のクラスに配列されるサブバンド信号ブロック成分数をカウントしなければならないからである。成分のカウントは、各反復中計算されなければならない。なぜならば、式5に従って得られる閾値は、各反復のための提案されたビット割当てbが知られるまで計算され得ないからである。
【0087】
式5に従って得られる閾値と対比して、式1に従って得られる閾値は、それほど正確ではないが、提案されたビット割当てbが知られる前に計算され得る。これは、閾値及び成分カウントが反復外で計算されることを可能にする。図3に示される方法において、閾値Th1、Th2及びTh3、並びに成分カウントn2、n24及びn248は、例えば、ステップ52において計算され得る。
【0088】
この実施の形態で用いられ得る上述の関数Gainの代わりのバージョンは、以下のプログラム片で示される。
【0089】
Gain2 (X.N) {
benefit2 = Min(b-1, 1); //G=2を用いることによって節約される小さい成分毎のビット
benefit4 = Min(b-1, 2); //G=4を用いることによって節約される小さい成分毎のビット
benefit8 = Min(b-1, 3); //G=8を用いることによって節約される小さい成分毎のビット
net[0] = 0; //利得変更のないネット利益
net[l] = (N-n2) * benefit2 - n2 * (b-benefit2); //G=2を用いるネット利益
net[2] = (N-n24) * benefit4 - n24 * (b-benefit4); //G=4を用いるネット利益
net[3] = (N-n248) * benefit8 - n248 * (b-benefit8); //G=8を用いるネット利益
j = IndexMax(net[j], j=0 to 3); //最大利益のインデックスを得る
Gain = gf[i]; //利得率を得る
}
【0090】
関数Gain2の文は、各利得率のためのネット利益を計算し、最適な利得率を選択する上述の関数Gainの対応する文と全く同じである。
【0091】
5.量子化関数
a)分割インターバル関数
大きい大きさの成分の量子化精度は、2つの不連続インターバル内の入力値を量子化する分割インターバル量子化関数を用いることによって改善され得る。
【0092】
図7の線105は、3ビット対称ミッドスレッドサイン量子化器及び補足的な非量子化器の端と端を接した効果を表す関数のグラフである。x軸に沿う値は、量子化器への入力値を表し、q(x)軸に沿う値は、非量子化器から得られる対応する出力値を表す。線100及び109は、それぞれ、この量子化器のための正及び負の過負荷値の境界を表す。線102及び108は、それぞれ、式1に従って利得率G=2のための、及び図4に示されるような正及び負の閾値を表す。線104及び107は、それぞれ、利得率G=4の正及び負の閾値を表す。
【0093】
図1において、サブバンド信号分析器14が閾値102に従ってサブバンド信号ブロック成分を分類するならば、量子化器18に供給される成分の大きさがすべて閾値102より大きいことが知られる。換言すれば、量子化器18は、閾値108と102の間に落ちるあらゆる値を量子化するために用いられない。この欠如は、量子化器の下の利用を表す。
【0094】
この下の利用は、分割インターバル量子化関数を実行する量子化器を用いることによって克服され得る。種々の分割インターバル関数が可能である。図8は、一つの分割インターバル3ビットサイン量子化及び補足的な非量子化の端と端を接した効果を表す関数のグラフである。線101は、正数の関数を表し、線106は、負数の関数を表す。
【0095】
図8に示される関数は、ただ7つのみの量子化レベルを有する図7に示される関数に対比して8つの量子化レベルを有する。追加の量子化レベルは、ミッドスレッド量子化関数のために−1に対応する上述のレベルを用いることによって得られる。
【0096】
b)非過負荷量子化器
図8に示される関数を実行する3ビット量子化器及び補足的な非量子化器は、―1.0からおよそ−0.5まで、及びおよそ+0.5から+1.0までの分割インターバル内の値を量子化するのに好ましい。なぜならば、その量子化器は、負荷をかけ過ぎられ得ないからである。上記で説明されるように、ある値の量子化エラーが量子化ステップサイズの1/2を越えるならば、その値は量子化器に負荷をかけすぎる。図8に示される例では、非量子化器出力は、−0.9375、−0.8125、−0.6875、−0.5625、+0.5625、+0.6875、+0.8125及び+0.9375に等しい値に定義され、量子化ステップサイズは、0.125に等しい。上述の分割インターバル内のすべての値の量子化エラーの大きさは、量子化ステップサイズの1/2に等しい0.0625より大きくない。そのような量子化器は、「非過負荷量子化器」としてここでは言及される。なぜならば、それは負荷をかけ過ぎることに免疫があるからである。
【0097】
本質的にあらゆる量子化ステップサイズのための非過負荷信号及び分割インターバル量子化器は、量子化された値のインターバル内に適切に間隔を置かれた量子化器「判断ポイント」によって境界となされる量子化器出力を有する量子化関数を実行することによって実現されてもよい。一般的に言って、判断ポイントは、ある距離dだけ互いに離隔され、入力値インターバルのそれぞれの終わりに最も近い判断ポイントは、量dだけそれぞれの終わりから離隔される。この間隔は、補足的な非量子化器で用いられるとき、特定の量子化ステップサイズによって互いから離隔される均等に離隔され、この特定の量子化ステップサイズの1/2に等しい最大量子化エラーを有する量子化出力を提供する量子化器に提供される。
【0098】
c)写像関数
分割インターバル量子化器は、種々の方法で実行されてもよい。特定の実行が重要ではない。図9Aに示される一実行は、量子化器74でカスケードにされた写像変換72を含む。写像変換72は、経路71から入力値を受信し、これらの入力値を適切なインターバルに写像し、経路73に沿って量子化器73にその写像された値を渡す。量子化器74が非対称ミッドスレッドサイン量子化器であるならば、図9bに示される線80及び81によって表される写像関数は、写像関数72に適する。この写像関数によれば、−1.0から−0.5までのインターバル内の値は、−1.0−1/2ΔQからー1/2ΔQまでのインターバルに線形に写像される。ここで、ΔQは量子化器74の量子化ステップサイズであり、+0.5から+1.0までのインターバル内の値は、−1/2ΔQから+1.0−1/2ΔQまでのインターバルに線形に写像される。この例では、大きい大きさの成分は、−0.5又は+0.5のいずれかに正確に等しい値を有すことができない。なぜならば、これらの値を持つ成分は、小さい大きさの成分として分類されるからである。このため、写像変換72は、正確に−1/2ΔQに入力値を写像しない。しかしながら、それは、−1/2ΔQのいずれかの側に任意に近いかその上の入力値を写像し得る。
【0099】
この写像の効果は、図9B及び9Cにおいて示される。図9Bにおいて、写像変換72が入力ポイント82及び84をそれぞれ写像ポイント86及び88に写像することが示される。3ビット対称ミッドスレッドサイン量子化器及び補足的非量子化器の端と端を接した効果を表す関数を示す図9Cにおいて、写像ポイント86及び88は、値−1/2ΔQを有する量子化器判断ポイント87のいずれかの側にあることが示される。
【0100】
補足的な分割インターバル非量子化器は、写像変換72の逆関数である写像変換によって続けられる量子化器74にとって補足的である対称ミッドスレッドサイン非量子化器によって実行されてもよい。
【0101】
d)合成関数
上述の一例では、利得率G=2を持つ利得−適応性量子化は、従来のビット割当てbが3ビットに等しいサブバンド信号の成分を量子化するために用いられる。表Iに関して上記で説明されたように、3ビットは、大きい大きさの成分ビットを量子化するために用いられ、2=(b−1)ビットは、小さい大きさの利得変更成分を量子化するために用いられる。好ましくは、図8の量子化関数を実行する量子化器は、大きい大きさの成分を量子化するために用いられる。
【0102】
図10に示される実行関数111を実行する2ビット対称ミッドスレッドサイン量子化器及び補足的非量子化器は、小さい大きさの利得変更成分のために用いられてもよい。示されるような関数111は、それぞれ量子化器及び非量子化器に関して用いられる利得率G=2のスケーリング及びデスケーリング効果を考慮に入れる。非量子化器の出力値は、−0.3333・・・、0.0及び+0.3333・・・であり、量子化判断ポイントは、−0.1666・・・及び+0.1666・・・においてである。
【0103】
大きい大きさ及び小さい大きさの成分のための関数の合成は、図11に示される。
【0104】
e)代わりの分割インターバル関数
利得率G=2及び0.500においてあるいはおよそその値の閾値での分割インターバル量子化器の使用は、およそ1ビットの量子化解像度の改善を提供する。その改善解像度は、これらの成分へのビット割当てを1ビット減らす間、大きい大きさの成分の量子化解像度を保つために用いられてもよい。上述の例では、2ビット量子化器は、大きい大きさ及び小さい大きさの成分の両方を量子化するために用いられ得る。2つの量子化器によって実行される量子化関数の合成は、図12に示される。量子化関数112及び113を実行する量子化器は、それぞれ正及び負の振幅を有する大きい大きさの成分を量子化するために用いられることができ、量子化関数111を実行する量子化器は、小さい大きさの成分を量子化するために用いられ得る。
【0105】
より大きい利得率及びより小さい閾値での分割インターバル量子化関数の使用は、改善量子化解像度のフルビットを提供しない。それゆえ、ビット割当ては、量子化解像度を犠牲にすることなく減らされ得ない。好ましい実施の形態では、大きい大きさの仮数のためのビット割当てbは、利得率G=2を用いて利得−適応性量子化されるブロックのための1ビットだけ減らす。
【0106】
復号器で提供される非量子化関数は、復号器で用いられる量子化関数を補足すべきである。
【0107】
6.フレーム内コーディング
用語「符号関心号ブロック」は、入力信号の有用な帯域幅を超えて周波数サブバンドのためのサブバンド信号ブロックのすべてを表す符号化情報に言及するために、ここで用いられる。いくつかのコーディングシステムは、多数の符号化信号ブロックをより大きいユニットにアセンブルする。それは、符号化信号のフレームとしてここでは言及される。フレーム構造は、それによって、情報間接費を減らす符号化信号ブロックを超えて情報を共有し、音声及び映像信号のような同期信号を容易にする多くのアプリケーションで有用である。音声/映像アプリケーションのためのフレームへの符号化音声情報に関する種々の論点は、参照によってここに組み込まれる、1998年10月17日に出願された米国特許出願番号PCT/US98/20751号に開示される。
【0108】
上述の利得−適応性量子化の特徴は、異なる符号化信号ブロックにあるサブバンド信号ブロックのグループに適用されてもよい。この態様は、例えば、フレームへの符号化信号ブロックをグループ化する適用において有利に用いられ得る。この技術は、フレーム内の多数のサブバンド信号ブロックの成分を本質的にグループ化し、成分を分類し、上述のような成分のこのグループに利得率を適用する。このいわゆるフレーム内コーディング技術は、フレーム内のブロックの間の制御情報を共有し得る。符号化信号ブロックの特定のグループ化が、この技術を実行するために重要ではない。
【0109】
E.実行
本発明は、汎用コンピュータシステムや、汎用コンピュータで見出されるものと類似する構成に接続されるデジタル信号プロセッサ(DSP)回路のようなより専門的構成を含む何か他の装置におけるソフトウェアを含む多種多様な方法で実行されてもよい。図13は、本発明の種々の態様を実行するために用いられ得る装置90のブロック図である。DSP92は計算リソースを提供する。RAM93はシステムランダムアクセスメモリ(RAM)である。ROM94は、装置90を操作し、本発明の種々の態様を実行するために必要なプログラムを格納するリードオンリーメモリ(ROM)のような固定記憶装置のいくつかの形式を表す。I/O制御95は、通信チャネル96を経由して音声信号を送受信するためのインターフェース回路を表す。アナログ/デジタル変換器及びデジタル/アナログ変換器は、アナログ音声信号を受信及び/又は送信するために望まれるようなI/O制御95に含まれてもよい。示される実施の形態では、すべての主要な構成要素は、1以上の物理的バスを表し得るバス91に接続する。しかしながら、バス方式は、本発明を実行するために要求されない。
【0110】
汎用コンピュータシステムで実行される実施の形態では、キーボードやマウス及びディスプレイのような装置に相互作用し、磁気テープやディスク、あるいは光学式媒体のような記憶媒体を有する記憶装置を制御するための追加の構成要素が含まれてもよい。記憶媒体は、オペレーティングシステム、ユーティリティ及びアプリケーションのための命令のプログラムを記録するために用いられてもよく、本発明の種々の態様を実行するプログラムの実施の形態を含んでもよい。
【0111】
本発明の種々の態様を実行するために要求される機能は、独立の論理要素、1以上のASIC及び/又はプログラム制御プロセッサを含む多種多様な方法で実行される構成要素によって実行され得る。これらの構成要素が実装される方法は、本発明ではあまり重要でない。
【0112】
本発明のソフトウェア実行は、超音波から紫外線周波数までを含むスペクトルを通して、バースバンド又は変調通信経路のような種々の機械に読取可能な媒体、あるいは、磁気テープ、磁気ディスク及び光学式ディスクを含むあらゆる磁気又は光学式記録技術を本質的に用いて情報を伝達するものを含む記憶媒体によって伝送され得る。種々の態様は、同様に、ASIC、汎用集積回路、リードオンリーメモリ(ROM)又はRAMの種々の形態で実施されるプログラムによって制御されるマイクロプロセッサ、及び他の技術のような処理回路によってコンピュータシステム90の種々の構成要素で実行され得る。
【図面の簡単な説明】
【図1】 利得−適応性量子化を組み込む分割帯域符号器のブロック図である。
【図2】 利得−適応性量子化を組み込む分割帯域復号器のブロック図である。
【図3】 反復ビット割当て処理のステップを示すフローチャートである。
【図4】 サブバンド信号成分の仮想ブロック及び成分に利得を適用する効果を示す図である。
【図5】 サブバンド信号成分の仮想ブロック及び成分に利得を適用する効果を示す図である。
【図6】 利得−適応性量子化のためのカスケードにされた利得ステージのブロック図である。
【図7】 量子化関数の図である。
【図8】 量子化関数の図である。
【図9】 分割インターバル量子化関数が写像関数変換を用いてどのように実行され得るかを示す。
【図10】 量子化関数の図である。
【図11】 量子化関数の図である。
【図12】 量子化関数の図である。
【図13】 本発明の種々の態様を実行するために用いられ得る装置のブロック図である。
Claims (33)
- 入力信号を符号化する方法であって、
前記入力信号を受信し、該入力信号の周波数サブバンドを表す、サブバンド信号成分からなるサブバンド信号ブロックを生成するステップと、
前記サブバンド信号ブロック内の成分の大きさをある閾値と比較し、それぞれの成分の大きさに従って2つのクラスに各成分を配列し、利得率を得るステップと、
前記サブバンド信号ブロックのいくつかの成分の大きさを変更するために、前記クラスの一つに配列された成分に前記利得率を適用するステップと、
前記サブバンド信号ブロックの前記成分を量子化するステップと、
前記成分の分類を伝達する符号化信号制御情報及び前記量子化サブバンド信号成分を表す非均一長符号にアセンブルするステップと、を有することを特徴とする方法。 - 前記利得率に従って変更されることのない大きさを有する量子化されたサブバンド信号成分を示す符号化された信号に制御情報をアセンブルし、該制御情報は、量子化されたサブバンド信号成分を表すためには用いられない1以上の予備の符号によって伝達されることを特徴とする請求項1記載の方法。
- 利得率に依存するが、前記量子化された成分の量子化ステップサイズには依存しない関数から前記閾値を得るステップを含むことを特徴とする請求項1又は2に記載の方法。
- 利得率及び量子化された成分の量子化ステップサイズに依存する関数から前記閾値を得るステップを含むことを特徴とする請求項1又は2に記載の方法。
- 分割インターバル量子化関数に従って前記クラスの1つに配列されている成分を量子化するステップを有することを特徴とする請求項1乃至4のいずれかに記載の方法。
- 1以上の非過負荷量子化器を用いて前記成分の少なくともいくつかを量子化することを特徴とする請求項1乃至5のいずれかに記載の方法。
- 符号化信号を復号する方法であって、
前記符号化された信号を受信してそこから制御信号及び非均一長符号を得て、入力信号の周波数サブバンドを表す量子化サブバンド信号成分を該非均一長符号から得るステップと、
非量子化された成分のサブバンド信号のブロックを得るために、前記サブバンド信号成分を非量子化するステップと、
非量子化された成分の変更されたサブバンド信号のブロックを得るための前記制御情報に従って、非量子化された成分のいくつかの大きさを変更するために、利得率を適用するステップであって、前記変更されたサブバンド信号のブロックにおける各非量子化された成分は、閾値と比べそれぞれの非量子化された成分の大きさに従い2以上のクラスのうちの1つにあり、前記利得率に従って変更されたすべての非量子化された成分は同じクラスにあることを特徴とする、ステップと、
前記非量子化された成分の変更されたサブバンド信号のブロックに応じて出力信号を生成するステップと、
を有することを特徴とする方法。 - 前記利得率に従って変更されることのない大きさを有する量子化されたサブバンド信号成分を示す符号化された信号から、量子化されたサブバンド信号成分を表すためには用いられない1以上の予備の符号によって伝達される制御情報を得ることを特徴とする請求項7記載の方法。
- 分割インターバル量子化関数を補完する非量子化関数に従って、前記サブバンド信号ブロック内の量子化された成分のいくつかを非量子化するステップを有することを特徴とする請求項7又は8に記載の方法。
- 前記制御情報に従って非量子化された成分のいくつかの大きさを変更するために第2の利得率を適用するステップを有することを特徴とする請求項7乃至9のいずれかに記載の方法。
- それぞれの非過負荷量子化器を補完する1以上の非量子化器を用いて前記量子化された成分の少なくともいくつかを非量子化することを特徴とする請求項7乃至10のいずれかに記載の方法。
- 入力信号を符号化する装置であって、
前記入力信号を受信する入力と、該入力信号の周波数サブバンドを表す、サブバンド信号成分からなるサブバンド信号ブロックを供給するための出力とを有する分析フィルタと、
前記サブバンド信号ブロックの成分の大きさとある閾値を比較し、それぞれの成分の大きさに従って2つのクラスに各成分を配列し、利得率を得る、前記分析フィルタに接続されるサブバンド信号ブロック分析器と、
前記サブバンド信号ブロックにおけるいくつかの成分の大きさを変更するために、前記利得率を前記クラスの一つに配列された成分に適用する、前記サブバンド信号ブロック分析器に接続されるサブバンド信号成分プロセッサと、
前記利得率に従って変更された大きさを有する前記サブバンド信号ブロックの成分を量子化する、前記サブバンド信号プロセッサに接続される第1の量子化器と、
量子化サブバンド信号成分を表す非均一長符号と前記成分の分類を伝達する制御情報を符号化信号にアセンブルする、前記第1の量子化器に接続されるフォーマッタと、
を備えることを特徴とする装置。 - 分割インターバル量子化関数に従って前記クラスの1つに配列されている成分を量子化する、前記サブバンド信号ブロック分析器に接続される第2の量子化器を備え、前記フォーマッタは前記第2の量子化器にも接続されていることを特徴とする請求項12に記載の装置。
- 前記フォーマッタは、前記利得率に従って変更されることのない大きさを有する量子化されたサブバンド信号成分を示す符号化信号に制御情報をアセンブルし、該制御情報は、量子化されたサブバンド信号成分を表すためには用いられない1以上の予備の符号によって伝達されることを特徴とする請求項12又は13に記載の装置。
- 利得率に依存するが、前記量子化された成分の量子化ステップサイズには依存しない関数から前記閾値を得ることを特徴とする請求項12乃至14のいずれかに記載の装置。
- 利得率及び量子化された成分の量子化ステップサイズに依存する関数から前記閾値を得ることを特徴とする請求項12乃至14のいずれかに記載の装置。
- 1以上の非過負荷量子化器を用いて前記成分の少なくともいくつかを量子化することを特徴とする請求項12乃至16のいずれかに記載の装置。
- 符号化信号を復号する装置であって、
前記符号化信号を受信してそこから制御情報及び非均一長符号を得、該非均一長符号から量子化サブバンド信号成分を得るデフォーマッタと、
第1の非量子化された成分のブロックを得るために、前記制御情報に従って前記ブロックのいくつかのサブバンド信号成分を非量子化する、前記デフォーマッタに接続される第1の非量子化器と、
非量子化された成分の変更されたサブバンド信号のブロックを得るための前記制御情報に従って、前記サブバンド信号ブロックにおけるいくつかの第1の非量子化された成分の大きさを変更するために、利得率を適用する、前記第1の非量子化器に接続されるサブバンド信号ブロックプロセッサであって、前記変更されたサブバンド信号のブロックにおける各非量子化された成分は、閾値と比べそれぞれの非量子化された成分の大きさに従い2以上のクラスのうちの1つにあり、前記利得率に従って変更されたすべての非量子化された成分は同じクラスにあることを特徴とする、サブバンド信号ブロックプロセッサと、
前記サブバンド信号プロセッサに接続される入力と、出力信号を供給する出力とを有する合成フィルタと、
を備えることを特徴とする装置。 - 第2の非量子化された成分を得るために、分割インターバル量子化関数を補完する非量子化関数に従ってブロック内の他のサブバンド信号成分を非量子化する、前記デフォーマッタに接続される第2の非量子化器を備え、前記合成フィルタは、前記第2の非量子化器に接続される入力を有することを特徴とする請求項18記載の装置。
- 前記デフォーマッタは、前記利得率に従って変更されることのない大きさを有する量子化されたサブバンド信号成分を示す符号化信号から制御情報を得て、前記制御情報は、量子化されたサブバンド信号成分を表すためには用いられない1以上の予備の符号によって伝達されることを特徴とする請求項18又は19記載の装置。
- 前記サブバンド信号ブロックプロセッサは、前記制御情報に従って非量子化された成分のいくつかの大きさを変更するために第2の利得率を適用することを特徴とする請求項18乃至20のいずれかに記載の装置。
- それぞれの非過負荷量子化器を補完する1以上の非量子化器を用いて前記量子化された成分の少なくともいくつかを非量子化することを特徴とする請求項18乃至21のいずれかに記載の装置。
- コンピュータプログラム命令を記録した、コンピュータ読取可能な記録媒体であって、該コンピュータプログラム命令は、入力信号を符号化するための方法をコンピュータに実行させることを特徴とし、該方法は、
前記入力信号を受信し、該入力信号の周波数サブバンドを表す、サブバンド信号成分のサブバンド信号からなるブロックを生成するステップと、
前記サブバンド信号ブロック内の成分の大きさをある閾値と比較し、成分の大きさに従って2つのクラスに各成分を配列し、利得率を得るステップと、
前記サブバンド信号ブロックのいくつかの成分の大きさを変更するために、前記クラスの一つに配列された成分に前記利得率を適用するステップと、
前記サブバンド信号ブロックの前記成分を量子化するステップと、
前記成分の分類を伝達する符号化された信号制御情報及び前記量子化されたサブバンド信号成分を表す非均一長符号にアセンブルするステップと、
を有することを特徴とする記録媒体。 - 前記方法により、前記利得率に従って変更されない大きさを有する量子化されたサブバンド信号成分を示す符号化された信号に制御情報をアセンブルし、該制御情報は、量子化されたサブバンド信号成分を表すために用いられない1以上の予備の符号によって伝達されることを特徴とする請求項23記載の記録媒体。
- 前記方法は、利得率に依存するが、前記量子化された成分の量子化ステップサイズには依存しない関数から前記閾値を得るステップを含むことを特徴とする請求項23又は24記載の記録媒体。
- 前記方法は、利得率及び量子化された成分の量子化ステップサイズに依存する関数から前記閾値を得るステップを含むことを特徴とする請求項23又は24に記載の記録媒体。
- 前記方法は、分割インターバル量子化関数に従って前記クラスの1つに配列されている成分を量子化するステップを有することを特徴とする請求項23乃至26のいずれかに記載の記録媒体。
- 前記方法は、1以上の非過負荷量子化器を用いて前記成分の少なくともいくつかを量子化することを特徴とする請求項23乃至27のいずれかに記載の記録媒体。
- コンピュータプログラム命令を記録した、コンピュータ読取可能な記録媒体であって、該コンピュータプログラム命令は、符号化された信号を復号するための方法をコンピュータに実行させることを特徴とし、該方法は、
前記符号化信号を受信してそこから制御信号及び非均一長符号を得て、入力信号の周波数サブバンドを表す量子化されたサブバンド信号成分を該非均一長符号から得るステップと、
非量子化されたサブバンド信号成分を得るために、前記サブバンド信号成分を非量子化するステップと、
前記制御情報に従って、非量子化された成分のいくつかの大きさを変更するために、利得率を適用するステップであって、前記変更されたサブバンド信号のブロックにおける各非量子化された成分は、閾値と比べそれぞれの非量子化された成分の大きさに従い2以上のクラスのうちの1つにあり、前記利得率に従って変更されたすべての非量子化された成分は同じクラスにあることを特徴とする、ステップと、
前記サブバンド信号の非量子化された成分に応じて出力信号を生成するステップと、
を有することを特徴とする記録媒体。 - 前記方法は、前記利得率に従って変更されない大きさを有する量子化されたサブバンド信号成分を示す符号化された信号から、量子化されたサブバンド信号成分を表すためには用いられない1以上の予備の符号によって伝達される制御情報を得ることを特徴とする請求項29に記載の記録媒体。
- 前記方法は、分割インターバル量子化関数を補完する非量子化関数に従って、前記サブバンド信号ブロック内の量子化された成分のいくつかを非量子化するステップを有することを特徴とする請求項29又は30に記載の記録媒体。
- 前記方法は、前記制御情報に従って非量子化された成分のいくつかの大きさを変更するために第2の利得率を適用するステップを有することを特徴とする請求項29乃至31のいずれかに記載の記録媒体。
- 前記方法は、それぞれの非過負荷量子化器を補完する1以上の非量子化器を用いて前記量子化された成分の少なくともいくつかを非量子化することを特徴とする請求項29乃至32のいずれかに記載の記録媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29357799A | 1999-04-16 | 1999-04-16 | |
US09/293,577 | 1999-04-16 | ||
US09/349,645 | 1999-07-08 | ||
US09/349,645 US6246345B1 (en) | 1999-04-16 | 1999-07-08 | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
PCT/US2000/009604 WO2000063886A1 (en) | 1999-04-16 | 2000-04-11 | Using gain-adaptive quantization and non-uniform symbol lengths for audio coding |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002542522A JP2002542522A (ja) | 2002-12-10 |
JP2002542522A5 JP2002542522A5 (ja) | 2007-06-14 |
JP4843142B2 true JP4843142B2 (ja) | 2011-12-21 |
Family
ID=26968028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000612930A Expired - Lifetime JP4843142B2 (ja) | 1999-04-16 | 2000-04-11 | 音声符号化のための利得−適応性量子化及び不均一符号長の使用 |
Country Status (17)
Country | Link |
---|---|
EP (1) | EP1175670B2 (ja) |
JP (1) | JP4843142B2 (ja) |
KR (1) | KR100893281B1 (ja) |
CN (1) | CN1158646C (ja) |
AR (1) | AR023444A1 (ja) |
AT (1) | ATE269574T1 (ja) |
AU (1) | AU771454B2 (ja) |
BR (1) | BRPI0010672B1 (ja) |
CA (1) | CA2368453C (ja) |
DE (1) | DE60011606T3 (ja) |
DK (1) | DK1175670T4 (ja) |
ES (1) | ES2218148T5 (ja) |
HK (1) | HK1045747B (ja) |
MX (1) | MXPA01010447A (ja) |
MY (1) | MY122486A (ja) |
TW (1) | TW536692B (ja) |
WO (1) | WO2000063886A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
DE102004007191B3 (de) | 2004-02-13 | 2005-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
DE102004007184B3 (de) * | 2004-02-13 | 2005-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Quantisieren eines Informationssignals |
RU2420816C2 (ru) * | 2006-02-24 | 2011-06-10 | Франс Телеком | Способ двоичного кодирования показателей квантования огибающей сигнала, способ декодирования огибающей сигнала и соответствующие модули кодирования и декодирования |
DE102006022346B4 (de) | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
WO2008013672A2 (en) * | 2006-07-24 | 2008-01-31 | Marvell World Trade Ltd. | Magnetic and optical rotating storage systems with audio monitoring |
US8571852B2 (en) * | 2007-03-02 | 2013-10-29 | Telefonaktiebolaget L M Ericsson (Publ) | Postfilter for layered codecs |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
MX365013B (es) * | 2011-08-29 | 2019-05-20 | Ibex Pt Holdings Co Ltd | Metodo para generar un bloque de prediccion en modo de prediccion de vector de movimiento avanzada (amvp). |
PT3232437T (pt) | 2012-12-13 | 2019-01-11 | Fraunhofer Ges Forschung | Dispositivo de codificação de áudio de voz, dispositivo de descodificação de áudio de voz, método de codificação de áudio de voz e método de descodificação de áudio de voz |
CN116366411B (zh) * | 2023-03-28 | 2024-03-08 | 扬州宇安电子科技有限公司 | 一种多比特信号量化自适应门限生成及量化方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08237132A (ja) * | 1995-02-27 | 1996-09-13 | Sony Corp | 信号符号化方法及び装置、信号復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5365553A (en) * | 1990-11-30 | 1994-11-15 | U.S. Philips Corporation | Transmitter, encoding system and method employing use of a bit need determiner for subband coding a digital signal |
DE69522187T2 (de) * | 1994-05-25 | 2002-05-02 | Sony Corp | Verfahren und vorrichtung zur kodierung, dekodierung und kodierung-dekodierung |
US5924064A (en) * | 1996-10-07 | 1999-07-13 | Picturetel Corporation | Variable length coding using a plurality of region bit allocation patterns |
US6006179A (en) * | 1997-10-28 | 1999-12-21 | America Online, Inc. | Audio codec using adaptive sparse vector quantization with subband vector classification |
-
2000
- 2000-04-11 CN CNB008063303A patent/CN1158646C/zh not_active Expired - Lifetime
- 2000-04-11 TW TW089106701A patent/TW536692B/zh not_active IP Right Cessation
- 2000-04-11 EP EP00922036A patent/EP1175670B2/en not_active Expired - Lifetime
- 2000-04-11 CA CA002368453A patent/CA2368453C/en not_active Expired - Lifetime
- 2000-04-11 ES ES00922036T patent/ES2218148T5/es not_active Expired - Lifetime
- 2000-04-11 DE DE60011606T patent/DE60011606T3/de not_active Expired - Lifetime
- 2000-04-11 AT AT00922036T patent/ATE269574T1/de active
- 2000-04-11 BR BRPI0010672A patent/BRPI0010672B1/pt active IP Right Grant
- 2000-04-11 AR ARP000101655A patent/AR023444A1/es active IP Right Grant
- 2000-04-11 JP JP2000612930A patent/JP4843142B2/ja not_active Expired - Lifetime
- 2000-04-11 AU AU42279/00A patent/AU771454B2/en not_active Expired
- 2000-04-11 DK DK00922036T patent/DK1175670T4/da active
- 2000-04-11 KR KR1020017013223A patent/KR100893281B1/ko active IP Right Grant
- 2000-04-11 MX MXPA01010447A patent/MXPA01010447A/es active IP Right Grant
- 2000-04-11 WO PCT/US2000/009604 patent/WO2000063886A1/en active IP Right Grant
- 2000-04-14 MY MYPI20001607A patent/MY122486A/en unknown
-
2002
- 2002-10-03 HK HK02107256.2A patent/HK1045747B/zh unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08237132A (ja) * | 1995-02-27 | 1996-09-13 | Sony Corp | 信号符号化方法及び装置、信号復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 |
Also Published As
Publication number | Publication date |
---|---|
ES2218148T3 (es) | 2004-11-16 |
JP2002542522A (ja) | 2002-12-10 |
HK1045747A1 (en) | 2002-12-06 |
ES2218148T5 (es) | 2008-02-16 |
CA2368453C (en) | 2009-12-08 |
CA2368453A1 (en) | 2000-10-26 |
TW536692B (en) | 2003-06-11 |
AU4227900A (en) | 2000-11-02 |
EP1175670B1 (en) | 2004-06-16 |
DK1175670T4 (da) | 2007-11-19 |
DK1175670T3 (da) | 2004-10-11 |
CN1158646C (zh) | 2004-07-21 |
AR023444A1 (es) | 2002-09-04 |
DE60011606D1 (de) | 2004-07-22 |
AU771454B2 (en) | 2004-03-25 |
CN1347549A (zh) | 2002-05-01 |
MXPA01010447A (es) | 2002-07-30 |
BR0010672A (pt) | 2002-02-19 |
WO2000063886A1 (en) | 2000-10-26 |
ATE269574T1 (de) | 2004-07-15 |
BRPI0010672B1 (pt) | 2016-06-07 |
KR20010112434A (ko) | 2001-12-20 |
EP1175670B2 (en) | 2007-09-19 |
HK1045747B (zh) | 2004-12-31 |
DE60011606T3 (de) | 2008-01-24 |
MY122486A (en) | 2006-04-29 |
EP1175670A1 (en) | 2002-01-30 |
DE60011606T2 (de) | 2005-06-23 |
KR100893281B1 (ko) | 2009-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6246345B1 (en) | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding | |
EP1537562B1 (en) | Low bit-rate audio coding | |
KR100991450B1 (ko) | 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템 | |
KR101343267B1 (ko) | 주파수 세그먼트화를 이용한 오디오 코딩 및 디코딩을 위한 방법 및 장치 | |
EP1449205B1 (en) | Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression | |
EP1701452B1 (en) | System and method for masking quantization noise of audio signals | |
US6735339B1 (en) | Multi-stage encoding of signal components that are classified according to component value | |
CN109313908B (zh) | 用于对音频信号进行编码的音频编码器以及方法 | |
KR20080025404A (ko) | 디지털 미디어 스펙트럼 데이터의 효율적인 코딩을 위해사용되는 사전 내의 코드워드의 수정 | |
JPH09500772A (ja) | 適応配分式符号化・復号装置及び方法 | |
WO2008021247A9 (en) | Arbitrary shaping of temporal noise envelope without side-information | |
JP2005338850A (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
JP4843142B2 (ja) | 音声符号化のための利得−適応性量子化及び不均一符号長の使用 | |
KR100738109B1 (ko) | 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치 | |
US7613609B2 (en) | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto | |
Chen et al. | Fast time-frequency transform algorithms and their applications to real-time software implementation of AC-3 audio codec | |
JPH0964751A (ja) | 多チャネルオーディオ符号化器及び符号化方法 | |
JPH0870252A (ja) | 多チャネルオーディオ符号化器及び符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070404 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070404 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100511 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100805 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100812 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110726 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110927 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111007 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4843142 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141014 Year of fee payment: 3 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111018 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141014 Year of fee payment: 3 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
A072 | Dismissal of procedure [no reply to invitation to correct request for examination] |
Free format text: JAPANESE INTERMEDIATE CODE: A072 Effective date: 20120313 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |