JP3592473B2 - 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形 - Google Patents
周波数領域内のlpc予測による時間領域内での知覚ノイズ整形 Download PDFInfo
- Publication number
- JP3592473B2 JP3592473B2 JP00524897A JP524897A JP3592473B2 JP 3592473 B2 JP3592473 B2 JP 3592473B2 JP 00524897 A JP00524897 A JP 00524897A JP 524897 A JP524897 A JP 524897A JP 3592473 B2 JP3592473 B2 JP 3592473B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- time period
- spectral component
- component signals
- given time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000007493 shaping process Methods 0.000 title description 6
- 230000003595 spectral effect Effects 0.000 claims description 78
- 238000000034 method Methods 0.000 claims description 50
- 230000005236 sound signal Effects 0.000 claims description 36
- 238000013139 quantization Methods 0.000 claims description 32
- 230000008447 perception Effects 0.000 claims description 4
- 230000007704 transition Effects 0.000 description 11
- 238000001228 spectrum Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000000873 masking effect Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 4
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003121 nonmonotonic effect Effects 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3002—Conversion to or from differential modulation
- H03M7/3044—Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、オーディオ信号のコード化に関し、特に知覚モデルに基づくオーディオ信号のコード化のための改良型方法および装置に関する。
【0002】
【従来の技術、及び、発明が解決しようとする課題】
ここ数年間の間に、いわゆる「知覚オーディオ・コーダ」が開発され、従来のコンパクト・ディスク媒体(CD)上で通常使用されるビット速度の、約1/12またはそれ以下のビット速度で、高品質のオーディオ信号を送信したり記憶したりすることができるようになった。上記コーダは、知覚によっては識別できない再構成(すなわち、デコード)信号を作り出すのに必要な程度の正確さのレベルでコード化することによって、人間の聴覚器官が聴覚の限界を持っているためにオーディオ信号に含まれている聴覚に感じられない部分を利用する。国際基準化機構の動画専門部会(ISO/MPEG)、MPEG1およびMPEG2オーディオ規格のような、いろいろな規格が制定されてきた。知覚オーディオ・コーダについては、例えば、1994年2月8日付けのジェームズ D.ジョンソンの米国特許第5,285,498号、および1994年8月23日付けのジョセフ L.ホール・ジュニアおよびジェームズ D.ジョンソンの米国特許第5,341,457号に詳細に開示されている。これら米国特許は、本発明の譲受人に譲渡されている。上記両米国特許の全文は参考として本明細書に組み込まれている。
【0003】
一般的にいって、モノラル・オーディオ信号用の知覚オーディオ・コーダの構造は下記のようなものである。
・入力サンプルが、種々のタイプのフィルタ・バンク、および、例えば、周知の修正個別コサイン変換装置(MDCT)、多相フィルタ・バンクまたはハイブリッド構造体のような変換装置により、二段標本化スペクトル表現に変換される。
・知覚モデルを使用して、上記信号に対する一つまたはそれ以上の時間依存マスキング域値が推定される。上記域値は、信号の品質の劣化は知覚されないが、オーディオ信号に導入される恐れがある最大コード化エラーを示す。
・スペクトル値は、マスキング域値の推定値に対応する精度に従って、量子化されコード化される。このようにして、量子化されたノイズは、送信された各信号により隠され(マスクされ)、デコード後知覚することができなくなる。
・最後に、すべての関連情報(例えば、コード化されたスペクトル値および追加副次情報)はビット・ストリームにパックされ、デコーダに送られる。
従って、対応するデコーダ回路で使用された処理が逆の順序で行われる。
・ビット・ストリームはデコードされ、コード化されたスペクトル・データおよび副次情報に分析される。
・量子化されたスペクトル値の逆方向の量子化が行われる。
・合成フィルタ・バンクを使用して、スペクトル値が、時間領域内にもう一度マップされる。
【0004】
上記の一般コーダ構造を使用することによって、人間の聴覚器官の知覚制限があるために、各信号に含まれる聴覚に感じない部分を効率的に活用することができる。特に、量子化ノイズのスペクトルを、信号ノイズのマスキング域値の形に従って整形することができる。このようにして、コード化プロセスによるノイズをコード化された信号の下に隠し、それにより知覚的に透明な品質を高い圧縮率で達成することができる。
【0005】
しかし、例えば、カスタネット雑音、すなわち、グロケンシュピール雑音のような遷移信号をコード化する場合には、さらに注意を払わなければ、知覚コーダは、透明な品質の信号を送ることはできない。この問題は、当業者がよく知っている通常「プリエコー」と呼ばれている周知のノイズから生じる。特に、コード化される信号が、コーダの分析フィルタ・バンクにより一定の瞬間に、処理されたタイム・ウィンドウのほんの一部分に強い信号構成部分を含んでいる恐れがある場合は、その結果生じるコード化エラーは、通常タイム・ウィンドウの全長にわたって広がる。それ故、量子化ノイズは、例えば、20ミリ秒またはもっと長い時間の間に渡って分散し、それによりある信号領域内の元の信号部分の振幅より大きくなる場合がある。例えば、分析ウィンドウの中央部分に「スタート部分」を持つカスタネット信号の場合には、コード化信号のノイズ成分は、「スタート部分」の直前のウィンドウの部分の元の信号成分より大きくなる場合がある。
【0006】
人の聴覚器官の特性のために、信号がスタートする前の約2秒間より長い時間、有意のレベルのコード化ノイズが存在しない場合には、上記の「プリエコー」はマスクされる。そうでない場合には、コード化ノイズが、例えば、信号がスタートする前の短いノイズのような「プリエコー」ノイズとして知覚される。
【0007】
知覚オーディオ・コード化システムにより生じるコード化/デコード信号の「プリエコー」を防止するために、多くの技術が提案されてきた。
1)従来使用されてきた一つの技術は、最初に、遷移信号部分をカバーするフィルタ・バンク・ウィンドウのスペクトル係数のコード化精度を高めるという方法である。この技術は「プリエコー制御」と呼ばれるもので、例えば、MPEG1オーディオ規格に含まれている。この方法は、これらのフレームをコード化するのに、かなりのビットを必要とするので、定ビット速度コーダに簡単に使用することはできない。ビット速度デマンドの局部的変化は、同様に、例えば、MPEG1オーディオ規格に含まれている、「ビット・タンク」と呼ばれる従来の技術を使用して、ある程度まで解決することができる。この技術を使用すれば、始めのほうのフレームのコード化中に使用しなかったビットを使用して、ビット速度のピーク・デマンドを処理することができる。それ故、平均ビット速度は依然として一定である。しかし、実際には、非常に遷移の大きい入力信号をコード化する場合には、ノイズを避けるために必要なビット・タンクの容量は、実現することができないほど大きなものになる。
【0008】
2)多くの知覚オーディオ・コーダで使用される他の方法は、適応ウィンドウ切り替えと呼ばれるものである。上記の方法と同様に、MPEG1オーディオ規格に含まれるこの技術は、フィルタ・バンクのサイズを入力信号の特性に適応させる。比較的変化の少ない信号の各部には、(通常)縦が長いウィンドウを使用するが、信号の遷移部分をコード化するには短いウィンドウを使用する。こうすることにより、ビット需要のピークをかなり低減することができる。何故なら、高いコード化精度が要求される領域は時間による制限を受けるからである。
【0009】
適応ウィンドウ切り替え技術の一つの重要な欠点は、コーダがさらにかなり複雑なものになり、構造もまた複雑になることである。異なるサイズのウィンドウは異なるパラメータおよび異なるコード化方法を必要とするので、実際にウィンドウ切り替えを使用するコーダは、本質的に二つのコーダ、すなわち、サイズの長いウィンドウ用のコーダおよびサイズの短いウィンドウ用のコーダからなる。さらに、この技術は、例えば、実質的にコード化の効率に悪影響を与えない人間の音声にような、インパルスに似た信号の疑似固定シリーズからなる「ピッチド」信号の場合には、効率的に使用することはできない。音声発声の機構に対して、より短いウィンドウを永久的に選択した場合だけ、この技術を使用することにより、一次的な量子化ノイズの広がりを適度に防止することができる。そのため、今度は、コード化の利得の低下および副次情報オーバヘッドの増大により、コーダの効率が有意に低下することになる。
【0010】
3)量子化ノイズの一次的な広がりを避けるために使用されてきた第三の技術は、スペクトルの分解を行う前に、信号に対する利得を変化させたり/修正したりする方法である。この方法の原理は、コード化を行う前に、利得の修正を行うことにより、入力信号のダイナミックスを下げることである。利得修正のパラメータは、その後、ビット・ストリームに送られ、この情報を使用してデコーダ側でプロセスが逆の順序で行われる。
【0011】
しかし、大部分の信号に対して良い性能を発揮するには、この処理を周波数スペクトルのいろいろな部分に個々に行わなければならない。何故なら、遷移事象は多くの場合、スペクトルのある部分にだけ存在するからである。この方法は、異なるスペクトル成分の個々の利得の処理を考慮する、もっと複雑なハイブリッド・フィルタ・バンクを使用して行うことができる。しかし、一般的にいって、利得修正とコーダの知覚モデルとの間を相互に分離することは、多くの場合困難である。
【0012】
【課題を解決するための手段】
本発明の例示としての実施例は、従来技術の欠点を解決する方法および装置を提供する。特に、知覚ノイズ整形を、周波数領域内で(線形)予測(すなわち、ろ過作業)を行うことにより、時間領域内で行う。その結果、量子化ノイズの一時的な広がりが減少する。特に、本発明の例示としての一実施例の場合には、下記の処理ステップがモノラル信号と一緒に、エンコーダで適用される。
・コード化されるオーディオ信号は、(適応ウィンドウ切り替えを使用している従来の知覚コーダで、「より長いブロック」用に使用されるような)高解像度のフィルタ・バンク/変換装置により、スペクトル係数に分解される。
・知覚モデルを使用して、信号に対する一つまたはそれ以上の時間依存マスキング域値が推定される。これらの域値は、信号の品質の劣化を感じさせないが、オーディオ信号に導入される恐れがある最大のコード化エラーを示す。
・その後、周波数のフィルタ・バンク出力上で作動する差動パルス・コード変調(DPCM)に基づく量子化/コード化スキームを使用して、スペクトル値のコード化が行われる。従来の知覚コーダの場合のように、必要なコード化の精度の目標値は、知覚モデルにより与えられる。
・最後に、すべての関連情報(例えば、コード化スペクトル値および生成した副次情報)は、ビット・ストリームにパックされデコーダに送られる。特に、生成した二次情報は、使用している場合には、DPCMコード化が使用されていることを示すフラグ、および目標周波数レンジおよびコード化に使用されたフィルタに関する情報を含む。
【0013】
同様に、本発明の例示としての実施例の対応する例示としてのデコーダは、下記の処理ステップを行う。
・ビット・ストリームをデコードし、コード化スペクトル・データおよび副次情報を分析する。
・量子化したスペクトル値を逆方向に量子化する。特に、この量子化は、DPCMの使用が副次情報にフラグにより表示されている場合には、スペクトル値のDPCMデコードを含む場合がある。
・スペクトル値は、合成フィルタ・バンクを使用して、時間領域内に再びマップされる。
【0014】
DPCM量子化/コード化スキーム(予測装置/量子化装置の組合わせ)の選択により、システム全体の行動に対する利点が異なってくる。特に、本発明の第一の例示としての実施例の場合には、閉ループDPCMシステムが使用されている。この第一の実施例の場合には、遷移信号に対するコード化の利得が上がり、本発明の第二の実施例による好適な方法の場合には、開ループDPCMシステムが使用されている。この第二の実施例は、デコーダの出力の時間整形した量子化エラーの点で有利である。特に、DPCM処理は、スペクトル係数に適用されるので、(逆方向のフィルタ・バンクがデコーダで適用された後の)デコードされた信号の量子化ノイズは、丁度時間的に間に合うように整形され、それにより量子化ノイズが実際の信号レベル以下に抑えられる。このようにして、遷移信号またはピッチイ信号のマスクされていない信号に関する一時的な問題は、実質的に過度のコード化を行わずに、またそれに比例したビットを使用しなくても、有利に避けることができる。
【0015】
【発明の実施の形態】
本発明の方法および装置を使用すれば、従来の知覚オーディオ・コーダで通常使用される、従来のパルス・コード変調(PCM)を、差動パルス・コード変調(DPCM)に基づく、量子化/コード化スキームにより効果的に置き換えることにより、従来技術の欠点を解決することができる。この場合、DPCMスキームは、周波数領域内のフィルタ・バンク出力上で作動する。(一般的に、PCMコード化技術もDPCMコード化技術も当業者には周知である。)
【0016】
図1は、モノラル・オーディオ信号をコード化するのに使用する従来の知覚エンコーダである。
・入力信号はx(k)は、分析フィルタ・バンク/変換装置12により、スペクトル係数に分解され、その結果、各分析ブロック「b」に対して「n」個のスペクトル成分、y(b,0)...y(b,n−1)ができる。この場合、「n」は各分析ブロック毎のスペクトル係数の数(すなわち、ブロック・サイズ)である。各スペクトル成分y(b,j)は、使用したフィルタ・バンクによる分析周波数または周波数レンジに関連する。
・知覚モデル14は、コード化信号/デコード信号の知覚的に透明な品質に対する必要なコード化精度を推定し、一つまたはそれ以上のマスキング域値を生成する。例えば、この情報は、各周波数帯で必要とされる最小信号/雑音比(SNR)からなり、PCMエンコーダ16に供給される。
・各スペクトル成分y(b,j)は、(それぞれ、量子化Q0 ...Qn−1 を行うための)量子化装置16−0...16−(n−1)によって量子化され、送信インデックスi(b,0)...i(b,n−1)にマップされる。上記量子化装置は、知覚モデル14が生成した知覚マスキング域値に従って、スペクトル係数のPCM量子化/コード化を行う。
・インデックス値i(b,0)...i(b,n−1)は、(オプションとしての)副次情報と一緒にビット・ストリーム・エンコーダ18に送られ、コード化されたビット・ストリームにより(例えば、デコーダに)送られる。別な方法としては、コード化したビット・ストリームを、後で検索するために、コンパクト・ディスク(CD)またはデジタル・オーディオ・テープ(DAT)のようなオーディオ信号記憶媒体上に記憶することができる。
【0017】
本発明の例示としての一実施例の場合には、図1のコード化装置は、PCMエンコーダ16をDPCMタイプのエンコーダにより置き換えることによって、有利に修正することができる。この場合、DPCMコード化は、周波数領域内で行われる。図3および図4は、本発明の上記の二つの例示としての実施例である。特に、本発明の例示としての実施例は、図1の従来のコード化装置のPCMエンコーダ16の代わりに、図3のモジュール32を使用することによって、実行することができる。こうすることにより、本発明の第一の例示としての実施例のコード化装置を作ることができる。同様に、本発明の他の実施例は、図1の従来のコード化装置のPCMエンコーダ16の代わりに、図4のモジュール42を使用することによって実行することができる。こうすることにより、本発明の第二の例示としての実施例のコード化装置を作ることができる。上記のそれぞれの場合、量子化/コード化カーネルへの入力は、一連のスペクトル係数y(b,0)...y(b,n−1)によって与えられる。すなわち、DPCMコード化は、例えば、当業者にとっては周知の従来の副バンド−ADPCMコーダにより時間領域を横切って行われる予測コード化とは反対に、周波数領域を横切って行われる。
【0018】
特に、図3の例示としてのエンコーダのロータリ・スイッチ33および図4の例示としてのエンコーダのロータリ・スイッチ43は、それぞれDPCMエンコーダ34および44によって量子化/コード化が行われる前に、それぞれスペクトル値y(b,0)...y(b,n−1)をシリアルな順序に配列するのに使用され、図3の例示としてのエンコーダのロータリ・スイッチ35、および図4の例示としてのエンコーダのロータリ・スイッチ46は、結果として得られた各インデックス値i(b,0)...i(b,n−1)をその後で並列に並べるのに使用される。図示の例示としての各エンコーダでは、周波数の昇順に、スペクトル値y(b,0)...y(b,n−1)の処理が行われるが、他の例示としての実施例の場合には、周波数の降順にまたは他の(例えば、非単調な)順序で処理を行うことができる。さらに、(本明細書に記載する全部のnではない)スペクトル値のサブセットだけを、差動コード化を行うためにDPCMエンコーダ34および44に供給することができる。
【0019】
より詳細に説明すると、図3は閉ループ予測スキームを使用する、本発明のエンコーダの第一の例示としての実施例である。閉ループ予測は、通常の当業者なら周知の従来の技術である。しかし、図3の例示としての知覚オーディオ・エンコーダの場合には、スペクトル値(すなわち、周波数領域)に閉ループ予測が適用される。特に、(この図では、予測装置36および加算器39からなる)予測フィルタは、量子化装置37が生成した量子化出力値により駆動され、減算器38により予測値が入力信号から引かれ、その結果、予測エラー信号だけが有利に量子化/コード化される。量子化装置37が、(減算器38を通して)ロータリ・スイッチ33により供給される各スペクトル成分の数値y(b,0)...y(b,n−1)に対して、それぞれ量子化Q0 ...Qn−1 を行うことに留意されたい。図3の例示としてのエンコーダを使用すれば、エンコーダの入力信号x(k)が遷移特性を持っている場合には、コード化の利得が上がる。
【0020】
図4は、開ループ予測スキームを使用する、本発明のエンコーダの第二の例示としての実施例である。開ループ予測は、通常の当業者には周知の従来技術である。しかし、図4の例示としての知覚オーディオ・エンコーダの場合には、開ループ予測はスペクトル値(すなわち、周波数領域)に適用される。特に、予測装置47は、減算器48によって駆動され、その結果、(量子化装置45により)予測エラー信号だけが有利に量子化/コード化される。量子化装置45が、(減算器48を通して)ロータリ・スイッチ43により対応する予測エラー信号が供給される、各スペクトルの成分の数値y(b,0)...y(b,n−1)に対して、それぞれ量子化Q0 ...Qn−1 を行うことに留意されたい。
【0021】
図3の例示としてのエンコーダのように、図4の例示としてのエンコーダを使用すると、エンコーダの入力信号x(k)が遷移特性を持っている場合には、コード化の利得が上がる。しかし、その上、図4の開ループ方法を使用する知覚オーディオ・エンコーダを使用すると、対応するデコーダの最終的に再構成された出力信号x’(k)で、時間整形された量子化エラーを有利に作ることができる。これは、開ループ予測がスペクトル係数にすでに適用され、その結果、量子化ノイズが時間により整形された形で現れ、それによりノイズ・レベルが信号レベル以下になっているからである。このようにして、遷移信号またはピッチ信号のマスクされていない信号に関する一時的な問題は、実質的に過度のコード化を行わず、またそれに比例したビットを使用しなくても、有利に避けることができる。
【0022】
上記の本発明の例示としての実施例に場合には、スペクトル領域データに予測コード化が適用されるので、スワップした時間領域および周波数領域に対して、古典的な予測について周知のある種の関係が有効である。例えば、予測利得は、(「スペクトル平坦測定」とは反対の)信号の「包絡平坦測定」に従って達成される。さらに、図4に示す開ループの場合には、予測エラーは(周波数ではなく)時間で整形される。それ故、実際には、上記開ループ技術は、例えば、時間領域ノイズ整形を裏づけるために、周波数領域内でいくつかの要素によりコンボリューションを有効に使用して、周波数領域内での予測により適応時間領域ウィンドウを適用するのと同じであると見なすことができる。
【0023】
上記実施例の場合には、予測プロセスは全周波数スペクトル(すなわち、すべてのスペクトル係数)にわたって行われるが、他の例示としての実施例の場合には、予測は、スペクトルの一部に対してだけ(すなわち、スペクトル係数のサブセットに対して)行うことができる。さらに、異なる予測装置フィルタを、信号スペクトルのいくつかの部分で有利に使用することができる。このようにして、時間領域ノイズを抑制するための本発明の方法は、任意の周波数依存方法で適用することができる。
【0024】
コード化された信号を正しくデコードするために、図3および図4の例示としてのエンコーダが生成したビット・ストリームは、有利に、例えば、図1のビット・ストリーム・エンコーダ18への追加入力として示した、ある種の追加副次情報を含む。本発明の種々の例示としての実施例の場合には、例えば、副次情報の一つのフィールドは、DPCMが使用されていること、および使用した数個の予測フィルタの数を示すことができる。その後、ビット・ストリームの追加フィールドを、各フィルタおよびそのフィルタ係数の目標周波数レンジを知らせる各予測フィルタに送ることができる。
【0025】
図6は、本発明の例示としての実施例による、モノラル・オーディオ信号をコード化する方法のフローチャートである。このフローチャートに示す例示としての実施例は、開ループ予測および一つの予測フィルタを使用する知覚オーディオ・エンコーダのいくつかの関連部分を実行する。特に、ステップ61においては、(例えば、図1の従来のエンコーダの分析フィルタ・バンク/変換装置12により行われるように)分析フィルタ・バンクにより、スペクトル値の従来の計算が行われる。その後、ステップ62で、予測フィルタの順序が設定され、目標周波数レンジが指定される。パラメータは、例えば、例示のように15のフィルタの順序に設定され、目標周波数レンジを4ー20kHzに設定することができる。これら例示としてのパラメータ数値を使用して、ピッチ信号をコード化すれば、プリエコーおよびポストエコーを有利に除去することができる。
【0026】
ステップ63においては、予測フィルタが、目標周波数レンジに対応するスペクトル係数の範囲を使用し、またDPCMコーダにとっては周知の予測コード化用の従来の方法を適用することにより決定される。例えば、係数の自動較正機能は、当業者にとっては周知の従来のレビンソン−ダービン帰納アルゴリズムで計算し使用することができる。その結果、予測装置フィルタ係数、対応する反射係数(「PARCOR」係数)および期待予測利得を得ることができる。
【0027】
期待予測利得が、決定ステップ64で決定されたある域値(例えば、2dB)を越えた場合には、ステップ65−67のDPCMコード化手順が使用される。この場合、予測フィルタ係数は、副次情報の一部としてデコーダに送ることができるように、量子化される(ステップ65)。その後、(ステップ66において)、予測フィルタが、量子化されたフィルタ係数が使用される、目標周波数レンジに対応するスペクトル係数の範囲に適用される。その後のすべての処理に対しては、指定の範囲のスペクトル係数の代わりに、ろ過処理の出力が使用される。最後に(ステップ67)、DPCMコード化(「予測フラグ」オン」)が使用されていることを知らせる、ビット・ストリームの一つのフィールドが送信されるが、目標周波数レンジ、予測フィルタの順序、およびそのフィルタ係数を示す情報もビット・ストリームに含まれる。一方、期待予測利得が決定域値を越えない場合には、ステップ68において、DPCMコード化を使用したこと(「予測フラグ」オン)を知らせるための、ビット・ストリームの一つのフィールドが送られる。最後に、どちらの場合でも、量子化プロセスがスペクトル係数に適用される(ステップ69)。この場合、量子化はエンコーダの知覚モデルが生成する知覚マスキング域値に基づいて行われる。
【0028】
(例えば、図3の例示としての装置、および図6の例示としての方法に示すように)、本発明の開ループエンコーダの実施例を使用することにより、離散フーリエ変換(DFT)または離散コサイン変換(DCT)含むある種の従来のブロック変換装置に対して、直接の一時的ノイズ整形効果を行うことができる。例えば、本発明の知覚コーダが、例えば、従来の修正離散コサイン変換(MDCT)、または時間領域偽信号打消し(TDAC)に基づく他の従来のフィルタ・バンクのような、重畳しているウィンドウにより非常に正確に二次標本化されたフィルタ・バンクが使用されている場合には、結果として得られる一時的なノイズ整形に対して、フィルタ・バンクの固有な時間領域偽信号効果が適用される。例えば、MDCTの場合には、窓の半分毎に一つのミラー(すなわち、偽信号)動作が行われ、それぞれのデコード後に、ウィンドウの左および右半分に、ミラー効果による(すなわち、偽信号による)量子化ノイズが現れる。最後のフィルタ・バンクの出力は、各逆方向変換の出力に合成ウィンドウを適用し、これらのデータ・セグメントの重畳追加を行うことによって得られるので、不必要な偽信号による成分は、使用する合成ウィンドウに応じて減衰する。それ故、一時的な偽信号による影響を最小限度に抑えるために、後続のブロック間の重畳部分が小さいフィルタ・バンク・ウィンドウを選択するほうが有利である。エンコーダで適当な方法を使用することにより、それに従って、よりよい周波数選択性を提供する静止信号に対して、より広いウィンドウ・タイプを使用する一方、非常に遷移特性の強い臨界信号に対して、重畳部分の少ないウィンドウを選択することができる。当業者にとっては、上記の方法の実行の詳細は明かであろう。
【0029】
図2は、図1の従来の知覚エンコーダに対応する、モノラルオーディオ信号をデコードする際に使用する従来の知覚デコーダである。図2のデコーダは下記のステップを実行する。
・入力ビット・ストリームの分析と、インデックス値i(b,0)...i(b,n−1)のデコーダ/デマルチプレクサ22による抽出。
・(それぞれによる、逆方向量子化IQ0...IQn−1の実行)逆方向量子化装置24−0から24−(n−1)の使用、およびPCMデコーダ24による、量子化したスペクトル値yq(b,0)...yq(b,n−1)の再構成。
・量子化したスペクトル値yq(b,0)...yq(b,n−1)の、合成フィルタ・バンク26による時間領域表現への再マップ化と、その結果としての、再構成出力信号x’(k)の取得。
【0030】
本発明の例示としての実施例の場合には、図2の従来のデコード装置はPCMデコーダ24に代わりに、DPCMタイプのデコーダを使用することによって、有利に修正することができる。この場合、DPCMデコードは周波数領域で行われる。図5は、本発明の上記の例示として一実施例である。特に、本発明の例示としての実施例は、図2の従来のデコード装置のPCMデコーダ24の代わりに、図5のモジュール52を使用することにより実行することができ、それにより、本発明の例示としての実施例のデコード装置が得られる。特に、DPCMデコーダ55への入力は、ロータリ・スイッチ53によるデコードが行われる前に、シリアルな順番に配列される一連のインデックス値i(b,0)...i(b,n−1)によって与えられる。結果として得られるスペクトル値、yq(b,0)...yq(b,n−1)は、ロータリ・スイッチ56によるDPCMデコードの後で並列に配列される。
【0031】
DPCMデコーダ55は、逆方向量子化装置54、予測装置57、および加算器58からなる。逆量子化装置54は、ロータリ・スイッチ53により供給される各インデックス値i(b,0)...i(b,n−1)に対して、逆方向量子化IQ0 ...IQn−1 を実行する。図4の例示としての開ループ・エンコーダを、オーディオ信号をコード化するために使用した場合には、図5の例示としてのデコーダの予測装置57および加算器58の組み合わせは、量子化ノイズの一時的な形を有利に制御するノイズ整形フィルタを形成する。また、図5の例示としてのデコーダは、周波数を高くするために、インデックス値i(b,0)...i(b,n−1)を有利に実行するが、他の例示としての実施例は、周波数を低くするため、または他の別の(例えば、非単調な)順序に配列するために、処理を実行することができる。さらに、(本明細書に記載するとおり、その全部のnではなく)インデックス値のサブセットだけをDPCMデコーダ55に供給することもできるし、および/またはいくつかの異なる予測装置フィルタを、好適には、対応するエンコーダが使用する特定の技術と同じ方法で、信号スペクトルのいくつかの部分に対して使用することができる。また、後者の場合、例えば、入力ビット・ストリームを正しくデコードするために、本発明のデコーダは、対応するエンコーダによって送られた追加副次情報を有利に評価することができる。このようにして、デコーダは、必要な対応するデコーダ予測フィルタ・バンクにより、指定の各目標周波数レンジ内でDPCMデコードを適用することができる。
【0032】
図7は、本発明の例示としての実施例のモノラル・オーディオ信号をデコードする方法のフローチャートである。このフローチャートの例示としての実施例は、一つの予測フィルタにより、知覚オーディオ・デコーダのある種の関連部分を実行する。より詳細に説明すると、ステップ71においては、逆方向量子化によりスペクトル係数値の従来の再構成が行われる。その後、判断ステップ72で、DPCMコード化の使用(「予測フラグ」オン)が表示されているかどうかを判断するために、ビット・ストリーム情報がチェックされる。イエスの場合には、ステップ73および74に示す拡張デコードプロセスが適用される。より詳細に説明すると、DPCMコード化の目標周波数レンジ、予測フィルタの順序、およびそのフィルタ係数を含む情報を決定するために、ビット・ストリームにより送られた副次情報がデコードされる(ステップ73)。その後、逆方向のフィルタが、指定の目標周波数レンジに対応するスペクトル係数のレンジに適用される(ステップ74)。その後の他の処理のために、一定のレンジのスペクトル係数の代わりに、ろ過プロセスの出力が使用される。最後に、(そして上記の判断72によって行われた決定とは無関係に)ステップ75において、スペクトル係数から従来の合成フィルタ・バンクが実行される。
【0033】
本発明の多数の特定の実施例を説明してきたが、これら実施例は単に例示としてのものに過ぎず、本発明の原理を適用して考案することができる多くの特定の装置を作ることができることを理解されたい。例えば、図示し、説明してきた例示としての実施例は、モノラル・オーディオ信号のコード化およびデコードに限定されれているが、当業者なら本明細書の開示に基づいて、マルチチャネル(例えば、ステレオ)オーディオ信号のコード化およびデコードに使用することができる他の実施例を容易に思いつくことができるだろう。さらに、通常の当業者なら本発明の精神および範囲から逸脱しないで、本発明の原理により多くの種々の他の装置を考案することがことができるだろう。
【図面の簡単な説明】
【図1】モノラル・オーディオ信号をコード化するのに使用する、PCM量子化/コード化スキームを使用する知覚オーディオ・コード化を実行するための従来の装置を示す図である。
【図2】図1の知覚オーディオ・コード化装置に対応する、知覚オーディオデコードを実行するための従来の装置を示す図である。
【図3】本発明の第一の例示としての実施例の閉ループ予測スキームを使用する、知覚オーディオ・エンコーダを示す図である。
【図4】本発明の第二の例示としての実施例の開ループ予測スキームを使用する、知覚オーディオ・エンコーダを示す図である。
【図5】本発明の例示としての実施例の知覚オーディオ・デコーダを示す図である。
【図6】本発明の例示としての実施例のオーディオ信号のコード化方法のフローチャートを示す図である。
【図7】本発明の例示としての実施例のコード化オーディオ信号デコード方法のフローチャートを示す図である。
【符号の説明】
32 モジュール
33 ロータリ・スイッチ
34 DPCMエンコーダ
36 予測装置
37 量子化装置
38 減算器
39 加算器
Claims (16)
- オーディオ信号を知覚モデルに基づいてコード化して、所与の時間期間についてコード化された信号を生成する方法であって、
(a)該オーディオ信号を、該所与の時間期間についての複数のスペクトル成分信号にスペクトル分解するステップと、
(b)該所与の時間期間についての該スペクトル成分信号のうちの一つの信号の、該所与の時間期間についての該スペクトル成分信号の一つまたはそれより多くの他の信号に基づく予測を表わす予測信号を生成するステップと、
(c)該予測信号を、該所与の時間期間についての該スペクトル成分信号のうちの該一つの信号と比較して予測エラー信号を生成するステップと、
(d)該所与の時間期間についての該スペクトル成分信号のうちの該一つの信号を、該予測エラー信号に基づき、さらに該知覚モデルに基づいてコード化して、該所与の時間期間についてのコード化されたスペクトル成分信号を生成するステップと、
(e)該所与の時間期間についての該コード化されたスペクトル成分信号に基づいて、該所与の時間期間についての該コード化された信号を生成するステップと、を含み、
該コード化された信号をデコードすることにより生成される再構成されたオーディオ信号が、該所与の時間期間内に一時的に整形されたコーディング・ノイズを含むようにすることを特徴とする方法。 - 該オーディオ信号が、音声からなる請求項1に記載の方法。
- 該オーディオ信号が、音楽からなる請求項1に記載の方法。
- 該スペクトル成分信号のうちの該一つの信号をコード化するステップが、該予測エラー信号を量子化することからなる請求項1に記載の方法。
- 該予測信号の生成、および該スペクトル成分信号のうちの該一つの信号のコード化が、閉ループ様式で実行される請求項1に記載の方法。
- 該予測信号の生成、および上記のスペクトル成分信号のうちの該一つの信号のコード化が、開ループ様式で実行される請求項1に記載の方法。
- 知覚モデルに基づいて所与の時間期間についてコード化された複数のコード化スペクトル成分信号からなるコード化された信号をデコードして、該所与の時間期間についての再構成されたオーディオ信号を生成する方法であって、
(a)該所与の時間期間についての該コード化されたスペクトル成分信号のうちの最初の信号をデコードするステップと、
(b)該所与の時間期間についての該スペクトル成分信号のうちの第二の信号の、該所与の時間期間についての該スペクトル成分信号のうちの第一の信号のデコードに基づく予測を表す予測信号を生成するステップと、
(c)該予測信号に基づいて、該所与の時間期間についての該スペクトル成分信号のうちの第二の信号をデコードするステップと、
(d)該所与の時間期間についての該コード化されたスペクトル成分信号のうちの第一の信号のデコードと、該所与の時間期間についての該コード化されたスペクトル成分信号のうちの第二の信号のデコードに基づいて、該再構成されたオーディオ信号を生成するステップと、を含み、
該再構成されたオーディオ信号が、該所与の時間期間内に一時的に整形されたコーディング・ノイズを含むようにすることを特徴とする方法。 - 該再構成されたオーディオ信号が、音声からなる請求項7に記載の方法。
- 該再構成されたオーディオ信号が、音楽からなる請求項7に記載の方法。
- 該上記スペクトル成分信号のうちの第一の信号をデコードするステップが、逆方向量子化を実行することからなる請求項7に記載の方法。
- オーディオ信号から、知覚モデルに基づいて、所与の時間期間についてコード化された信号を生成するためのエンコーダであって、
(a)該オーディオ信号を、該所与の時間期間についての複数のスペクトル成分信号に分解する手段と、
(b)該所与の時間期間についての該スペクトル成分信号のうちの一つの信号の、該所与の時間期間についての該スペクトル成分信号の一つまたはそれより多くの他の信号に基づく予測を表す予測信号を生成する手段と、
(c)該予測信号を、該所与の時間期間についての該スペクトル成分信号のうちの該一つの信号と比較して予測エラー信号を生成する手段と、
(d)該所与の時間期間についての該スペクトル成分信号のうちの該一つの信号を表わす該所与の時間期間についてのコード化スペクトル成分信号であって、予測信号およびさらに該知覚モデルに基づいて生成された該所与の時間期間についてのコード化スペクトル成分信号を生成するためのコーダと、
(e)該所与の時間期間についての該コード化されたスペクトル成分信号に基づいて、該所与の時間期間についての該コード化された信号を生成するための手段と、を含み、
該コード化された信号に適用されるデコーダにより生成される再構成されたオーディオ信号が、該所与の時間期間内に一時的に整形されたコーディング・ノイズを含むようにすることを特徴とするエンコーダ。 - 該コーダが、予測エラー信号に適用された量子化器を含む請求項11に記載のエンコーダ。
- 該予測信号を生成するための手段および該コーダが、開ループ様式で配置されている請求項11に記載のエンコーダ。
- 該予測信号を生成するための手段および該コーダが、開ループ様式で配置されている請求項11に記載のエンコーダ。
- 知覚モデルに基づいて所与の時間期間についてコード化された複数のスペクトル成分信号からなる該所与の時間期間についてのコード化されたオーディオ信号から再構成されたオーディオ信号を生成するためのデコーダであって、
(a)該所与の時間期間についての該コード化されたスペクトル成分信号のうちの第一の信号をデコードする手段と、
(b)該所与の時間期間についての該スペクトル成分信号のうちの第二の信号の、該所与の時間期間についての該コード化されたスペクトル成分信号のうちの第一の信号のデコードに基づく予測を表す予測信号を生成する手段と、
(c)該予測信号に基づいて、該所与の時間期間についての該スペクトル成分信号のうちの第二の信号をデコードする手段と、
(d)該所与の時間期間についての該コード化されたスペクトル成分信号のうちの第一の信号のデコードと、該所与の時間期間についての該コード化されたスペクトル成分信号のうちの第二の信号のデコードに基づいて、該所与の時間期間についての再構成されたオーディオ信号を生成するための手段と、を含み、
該再構成されたオーディオ信号が、該所与の時間期間内に一時的に整形されたコーディング・ノイズを含むようにすることを特徴とするデコーダ。 - 該スペクトル成分信号のうちの第一の信号をデコードするための手段が、それに適用された逆方向量子化器を含む請求項15に記載のデコーダ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/585086 | 1996-01-16 | ||
US08/585,086 US5781888A (en) | 1996-01-16 | 1996-01-16 | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09204197A JPH09204197A (ja) | 1997-08-05 |
JP3592473B2 true JP3592473B2 (ja) | 2004-11-24 |
Family
ID=24339994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00524897A Expired - Lifetime JP3592473B2 (ja) | 1996-01-16 | 1997-01-16 | 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5781888A (ja) |
EP (1) | EP0785631B1 (ja) |
JP (1) | JP3592473B2 (ja) |
CA (1) | CA2194419C (ja) |
DE (1) | DE69737489T2 (ja) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2891193B2 (ja) * | 1996-08-16 | 1999-05-17 | 日本電気株式会社 | 広帯域音声スペクトル係数量子化装置 |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US5913191A (en) * | 1997-10-17 | 1999-06-15 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries |
KR100304092B1 (ko) * | 1998-03-11 | 2001-09-26 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 |
DE19829284C2 (de) * | 1998-05-15 | 2000-03-16 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten eines zeitlichen Stereosignals und Verfahren und Vorrichtung zum Decodieren eines unter Verwendung einer Prädiktion über der Frequenz codierten Audiobitstroms |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6430529B1 (en) * | 1999-02-26 | 2002-08-06 | Sony Corporation | System and method for efficient time-domain aliasing cancellation |
DE19921122C1 (de) * | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
US6850559B1 (en) | 1999-06-28 | 2005-02-01 | At&T Corp. | System and methods for transmitting data |
US7792681B2 (en) * | 1999-12-17 | 2010-09-07 | Interval Licensing Llc | Time-scale modification of data-compressed audio information |
US6842735B1 (en) * | 1999-12-17 | 2005-01-11 | Interval Research Corporation | Time-scale modification of data-compressed audio information |
US6567781B1 (en) | 1999-12-30 | 2003-05-20 | Quikcat.Com, Inc. | Method and apparatus for compressing audio data using a dynamical system having a multi-state dynamical rule set and associated transform basis function |
JP2001231035A (ja) * | 2000-02-14 | 2001-08-24 | Nec Corp | 復号同期制御装置、復号装置、及び復号同期制御方法 |
US6735561B1 (en) * | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US7099830B1 (en) * | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
US6778953B1 (en) * | 2000-06-02 | 2004-08-17 | Agere Systems Inc. | Method and apparatus for representing masked thresholds in a perceptual audio coder |
US6647365B1 (en) * | 2000-06-02 | 2003-11-11 | Lucent Technologies Inc. | Method and apparatus for detecting noise-like signal components |
CA2341834C (en) * | 2001-03-21 | 2010-10-26 | Unitron Industries Ltd. | Apparatus and method for adaptive signal characterization and noise reduction in hearing aids and other audio devices |
KR100378796B1 (ko) * | 2001-04-03 | 2003-04-03 | 엘지전자 주식회사 | 디지탈 오디오 부호화기 및 복호화 방법 |
WO2004008437A2 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
US7149591B2 (en) * | 2003-10-01 | 2006-12-12 | Cleveland State University | Multi-resolution controller |
US7379875B2 (en) * | 2003-10-24 | 2008-05-27 | Microsoft Corporation | Systems and methods for generating audio thumbnails |
US7356748B2 (en) * | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
US6980933B2 (en) * | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
US7653255B2 (en) | 2004-06-02 | 2010-01-26 | Adobe Systems Incorporated | Image region of interest encoding |
US7627481B1 (en) * | 2005-04-19 | 2009-12-01 | Apple Inc. | Adapting masking thresholds for encoding a low frequency transient signal in audio data |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US8392176B2 (en) * | 2006-04-10 | 2013-03-05 | Qualcomm Incorporated | Processing of excitation in audio coding and decoding |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
US8428957B2 (en) * | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
ES2797525T3 (es) * | 2009-10-15 | 2020-12-02 | Voiceage Corp | Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
FR2973552A1 (fr) * | 2011-03-29 | 2012-10-05 | France Telecom | Traitement dans le domaine code d'un signal audio code par codage micda |
EP2887350B1 (en) | 2013-12-19 | 2016-10-05 | Dolby Laboratories Licensing Corporation | Adaptive quantization noise filtering of decoded audio data |
WO2016142357A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3483880A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE457402B (sv) * | 1987-02-20 | 1988-12-19 | Harald Brusewitz | Foerfarande och anordning foer kodning och avkodning av bildinformation |
US4875095A (en) * | 1987-06-30 | 1989-10-17 | Kokusai Denshin Denwa Kabushiki Kaisha | Noise-shaping predictive coding system |
US4943855A (en) * | 1988-07-22 | 1990-07-24 | At&T Bell Laboratories | Progressive sub-band image coding system |
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
DE4320990B4 (de) * | 1993-06-05 | 2004-04-29 | Robert Bosch Gmbh | Verfahren zur Redundanzreduktion |
-
1996
- 1996-01-16 US US08/585,086 patent/US5781888A/en not_active Expired - Lifetime
-
1997
- 1997-01-06 CA CA002194419A patent/CA2194419C/en not_active Expired - Lifetime
- 1997-01-07 DE DE69737489T patent/DE69737489T2/de not_active Expired - Lifetime
- 1997-01-07 EP EP97300068A patent/EP0785631B1/en not_active Expired - Lifetime
- 1997-01-16 JP JP00524897A patent/JP3592473B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0785631B1 (en) | 2007-03-21 |
DE69737489D1 (de) | 2007-05-03 |
CA2194419C (en) | 2001-05-01 |
EP0785631A2 (en) | 1997-07-23 |
JPH09204197A (ja) | 1997-08-05 |
DE69737489T2 (de) | 2007-11-29 |
US5781888A (en) | 1998-07-14 |
EP0785631A3 (en) | 2000-10-11 |
CA2194419A1 (en) | 1997-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3592473B2 (ja) | 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形 | |
US9728196B2 (en) | Method and apparatus to encode and decode an audio/speech signal | |
US5812971A (en) | Enhanced joint stereo coding method using temporal envelope shaping | |
Iwakami et al. | High-quality audio-coding at less than 64 kbit/s by using transform-domain weighted interleave vector quantization (TWINVQ) | |
EP2207170B1 (en) | System for audio decoding with filling of spectral holes | |
US7110953B1 (en) | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction | |
KR101041895B1 (ko) | 패킷 손실 후 디코딩된 오디오 신호의 시간 워핑 | |
KR100823097B1 (ko) | 멀티채널 신호를 처리하는 장치 및 방법 | |
KR101237413B1 (ko) | 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치 | |
EP1536410A1 (en) | Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information | |
JP2004264814A (ja) | 純可逆的音声圧縮における技術革新 | |
CA2489443C (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
CA2698031A1 (en) | Method and device for noise filling | |
US7197454B2 (en) | Audio coding | |
US6678647B1 (en) | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution | |
JP5451603B2 (ja) | デジタルオーディオ信号の符号化 | |
JP4721355B2 (ja) | 符号化データの符号化則変換方法および装置 | |
Spanias et al. | Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB | |
MXPA06009933A (en) | Device and method for processing a multi-channel signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20031203 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20040303 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040803 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040825 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080903 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080903 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090903 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090903 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100903 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110903 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120903 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |