JP2005527851A - 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法 - Google Patents
時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法 Download PDFInfo
- Publication number
- JP2005527851A JP2005527851A JP2003585070A JP2003585070A JP2005527851A JP 2005527851 A JP2005527851 A JP 2005527851A JP 2003585070 A JP2003585070 A JP 2003585070A JP 2003585070 A JP2003585070 A JP 2003585070A JP 2005527851 A JP2005527851 A JP 2005527851A
- Authority
- JP
- Japan
- Prior art keywords
- block
- integer
- difference
- quantized
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000003595 spectral effect Effects 0.000 claims abstract description 151
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 55
- 238000013139 quantization Methods 0.000 claims abstract description 49
- 230000009466 transformation Effects 0.000 claims abstract description 10
- 238000001228 spectrum Methods 0.000 claims description 56
- 238000012545 processing Methods 0.000 claims description 34
- 238000006243 chemical reaction Methods 0.000 claims description 32
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000002123 temporal effect Effects 0.000 claims description 10
- 238000007667 floating Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 239000000284 extract Substances 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 12
- 230000002441 reversible effect Effects 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000013144 data compression Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Description
Claims (33)
- 時間離散オーディオ信号を符号化し、符号化オーディオデータを得るための装置であって、
上記時間離散オーディオ信号のスペクトル値の量子化ブロックであって、聴覚心理モデル(54)を用いて量子化された量子化ブロックを供給する手段(52)と、
逆量子化されラウンディングされたスペクトル値を含むラウンディングブロックを提供するために、上記量子化ブロックを逆量子化し、この逆量子化されたスペクトル値をラウンディングする手段(58)と、
整数時間離散サンプルのブロックからスペクトル値の整数ブロックを生成するため構成された整数変換アルゴリズムを用いて、整数スペクトル値の整数ブロックを生成する手段(56)と、
差分スペクトル値を有する差分ブロックを得るために、上記ラウンディングブロックと上記整数ブロックとの間のスペクトル値を基にした差分に依存して上記差分ブロックを形成する結合手段(58)と、
上記量子化ブロックに関する情報と上記差分ブロックに関する情報とを含む符号化オーディオデータを生成するために、上記量子化ブロックと上記差分ブロックとを処理する手段(60)と、
を含むことを特徴とする装置。 - 請求項1に記載の装置において、
上記量子化ブロックを供給するための手段(52)は、
MDCTを用いて時間オーディオ信号値の時間ブロックからMDCTスペクトル値のMDCTブロックを生成し、かつ
量子化されたMDCTスペクトル値を含む上記量子化ブロックを生成するために、聴覚心理モデルを用いて上記MDCTブロックを量子化するように構成されていることを特徴とする装置。 - 請求項2に記載の装置において、
上記整数ブロックを生成するための手段(56)は、
上記時間ブロックに対して整数MDCTを実行して、整数MDCTスペクトル値を含む上記整数ブロックを生成するように形成されていることを特徴とする装置。 - 請求項1乃至3のいずれかに記載の装置において、
上記量子化ブロックを供給するための手段(52)は、
浮動小数点変換アルゴリズムを用いて上記量子化ブロックを計算するように構成されていることを特徴とする装置。 - 請求項1乃至3のいずれかに記載の装置において、
上記量子化ブロックを供給するための手段(52)は、
上記整数ブロックを生成するための手段(56)によって生成された整数ブロックを用いて上記量子化ブロックを計算するように構成されていることを特徴とする装置。 - 請求項1乃至5のいずれかに記載の装置において、
上記処理手段(60)は、
上記量子化ブロックをエントロピー符号化し、エントロピー符号化された量子化ブロックを得る手段(60a)と、
上記ラウンディングブロックをエントロピー符号化し、エントロピー符号化されたラウンディングブロックを得る手段(60b)と、を備え、
上記符号化オーディオデータを表すスケーリングされたデータストリームの第1スケーリングレイヤに上記エントロピー符号化された量子化ブロックを変換し、
上記スケーリングされたデータストリームの第2スケーリングレイヤに上記エントロピー符号化されたラウンディングブロックを変換することを特徴とする装置。 - 請求項6に記載の装置において、
上記処理手段(60)は、上記量子化ブロックのエントロピー符号化のために、上記量子化されたスペクトル値に依存して、複数のコード表から1つのコード表を使用するように形成され、かつ
上記処理手段(60)は、上記差分ブロックのエントロピー符号化のために、上記量子化ブロックを生成するための量子化において使用される量子化器の特性に依存して、複数のコード表から1つのコード表を選択するように形成されていることを特徴とする装置。 - 請求項1乃至7のいずれかに記載の装置において、
上記量子化ブロックを供給するための手段(52)は、オーディオ信号値の時間ブロックをウィンドウ化するための複数のウィンドウから、上記オーディオ信号の特性に依存して1つのウィンドウを使用し、
上記整数ブロックを生成するための手段(56)は、上記整数変換アルゴリズムのために、同じウィンドウを選択することを特徴とする装置。 - 請求項1乃至8のいずれかに記載の装置において、
上記整数ブロックを生成するための手段(56)は、
時間離散サンプルを2N個の時間離散サンプルに対応する長さを持つウィンドウ(W)でウィンドウ化する第1ステップであって、N個の入力値からN個の出力値を生成することができる変換によって、上記時間離散サンプルをスペクトル表現に変換するためのウィンドウ化された時間離散サンプルを提供するステップであり、以下のサブステップ1〜3、すなわち、
1つの時間離散サンプルを上記ウィンドウの1つのクォータから選択(16)し、もう1つの時間離散サンプルを上記ウィンドウの他のクォータから選択して、時間離散サンプルのベクトルを得るサブステップ1と、
上記ベクトルに対し回転マトリクスを適用するサブステップ2であって、この回転マトリクスのディメンションは上記ベクトルのディメンションと一致し、さらに上記回転マトリクスは複数のリフティングマトリクスにより表現され、1つのリフティングマトリクスは上記ウィンドウ(W)に依存しかつ1でも0でもない成分を1つだけ有するものであり、さらに以下の小ステップ1〜3、すなわち、
上記ベクトルに1つのリフティングマトリクスを乗算(18)し、第1結果ベクトルを得る小ステップ1と、
上記第1結果ベクトルの要素を、実数を整数にマッピングするラウンディング関数(r)でラウンディング(20)し、ラウンディングされた第1結果ベクトルを得る小ステップ2と、
全てのリフティングマトリクスが処理されるまで乗算(22)およびラウンディング(24)のステップを他のリフティングマトリクスを用いて順に実行し、その結果、上記ウィンドウの上記1つのクォータからの整数ウィンドウ化サンプルと上記ウィンドウの上記他のクォータからの整数ウィンドウ化サンプルとを有する回転されたベクトルを得る小ステップ3と、を含む回転マトリクスを適用するサブステップ2と、
上記ウィンドウの残りのクォータの全ての時間離散サンプルに対して上記ウィンドウ化ステップを実行し、2N個のウィンドウ化された整数サンプルを得るサブステップ3と、を含むウィンドウ化の第1ステップと、
上記ウィンドウの第2クォータおよび第3クォータのウィンドウ化された整数サンプルを持つ値に対して、整数DCT変換を実行し、N個のウィンドウ化整数サンプルをスペクトル表現に変換(14)し、N個の整数スペクトル値を得る第2ステップと、
を含む整数変換アルゴリズムを使用するように形成されたことを特徴とする装置。 - 請求項1乃至9のいずれかに記載の装置において、
上記量子化ブロックを供給するための手段(52)は、量子化ステップ(52b)に先立ち、予測フィルタを用いて周波数に関するスペクトル値の予測を実行し、量子化後の上記量子化ブロックを表現する予測剰余スペクトル値を得るように形成され、
上記整数ブロックの上記整数スペクトル値の周波数に関する予測を実行する予測手段が設けられ、
さらに、上記ラウンディングブロックを表す上記整数スペクトル値によって、上記予測剰余スペクトル値をラウンディングするためのラウンディング手段が設けられていることを特徴とする装置。 - 請求項1乃至10のいずれかに記載の装置において、
上記時間離散オーディオ信号は少なくとも2つのチャンネルを備え、
上記量子化ブロックを供給するための手段(52)は、上記時間離散オーディオ信号のスペクトル値に対してセンター/サイド符号化を実行し、センター/サイドスペクトル値の量子化の後で上記量子化ブロックを得るように構成され、
上記整数ブロックを生成するための手段(56)は、上記量子化ブロックを供給するための手段(52)のセンター/サイド符号化に対応するセンター/サイド符号化を実行するように構成されていることを特徴とする装置。 - 請求項1乃至11のいずれかに記載の装置において、
上記処理装置(60)は、MPEG−2 AACデータストリームを生成するように構成され、
補助データの分野において、上記整数変換アルゴリズムのための補助情報が導入されることを特徴とする装置。 - 請求項1乃至12のいずれかに記載の装置において、
上記処理装置(60)は、上記符号化オーディオデータを複数のスケーリングレイヤを持つデータストリームとして出力するよう構成されていることを特徴とする装置。 - 請求項13に記載の装置において、
上記処理装置(60)は、上記量子化ブロックに関する情報を第1スケーリングレイヤ(81)に挿入し、かつ上記差分ブロックに関する情報を第2スケーリングレイヤ(82)に挿入するよう構成されていることを特徴とする装置。 - 請求項13に記載の装置において、
上記処理装置(60)は、上記量子化ブロックに関する情報を第1スケーリングレイヤに挿入し、かつ上記差分ブロックに関する情報を少なくとも第2および第3のスケーリングレイヤに挿入するよう構成されていることを特徴とする装置。 - 請求項15に記載の装置において、
上記第2スケーリングレイヤの中に精度の低い差分スペクトル値が含まれ、
1つまたはそれ以上の高いスケーリングレイヤの中に上記差分スペクトル値の余剰部が含まれていることを特徴とする装置。 - 請求項15または16に記載の装置において、
上記差分ブロックに関する情報はバイナリ符号化差分スペクトル値を含み、
上記差分スペクトル値のための第2スケーリングレイヤは、最高重要ビット(MSB)から低重要ビット(MSB−x)までの差分スペクトル値のための幾つかのビットを含み、
第3スケーリングレイヤは、低重要ビット(MSB−x−1)から最低重要ビット(LSB)までの幾つかのビットを含むことを特徴とする装置。 - 請求項17に記載の装置において、
上記時間離散オーディオ信号が24ビットの幅を持つサンプルの形式で存在し、
上記処理装置(60)は、差分スペクトル値のさらに重要な16ビットを第2スケーリングレイヤに挿入し、差分スペクトル値の剰余の8ビットを第3スケーリングレイヤに挿入するよう構成され、その結果、上記第2スケーリングレイヤを用いた復号器はCD品質に到達し、上記第3スケーリングレイヤをも用いた復号器はスタジオ品質に到達することを特徴とする装置。 - 請求項15に記載の装置において、
上記処理装置(60)は、ローパスフィルタリングされた信号を表すための差分スペクトル値の少なくとも一部を第2スケーリングレイヤに挿入し、上記第2スケーリングレイヤ内の差分スペクトル値とオリジナル差分スペクトル値との間の差分を少なくとも1つのさらなるスケーリングレイヤに挿入するよう構成されていることを特徴とする装置。 - 請求項15または19に記載の装置において、
上記処理装置(60)は、所定のカット・オフ周波数までの差分スペクトル値の少なくとも一部を第2スケーリングレイヤに挿入し、上記所定のカット・オフ周波数より高周波数の差分スペクトル値の少なくとも一部を第3スケーリングレイヤに挿入するよう構成されていることを特徴とする装置。 - 時間離散オーディオ信号を符号化し、符号化オーディオデータを得るための方法であって、
聴覚心理モデル(54)を用いて量子化された時間離散オーディオ信号のスペクトル値の量子化ブロックを供給するステップ(52)と、
上記量子化ブロックを逆量子化し、この逆量子化されたスペクトル値をラウンディングして、逆量子化されラウンディングされたスペクトル値のラウンディングブロックを得るステップ(58)と、
整数時間離散サンプルのブロックからスペクトル値の整数ブロックを生成するため構成された整数変換アルゴリズムを用いて、整数スペクトル値の整数ブロックを生成するステップ(56)と、
差分スペクトル値を有する差分ブロックを得るために、上記ラウンディングブロックと上記整数ブロックとの間のスペクトル値を基にした差分に依存して上記差分ブロックを形成するステップ(58)と、
上記量子化ブロックに関する情報と上記差分ブロックに関する情報とを含む符号化オーディオデータを生成するために、上記量子化ブロックと上記差分ブロックとを処理するステップ(60)と
を含むことを特徴とする方法。 - 聴覚心理モデル(54)を用いて量子化された時間離散オーディオ信号のスペクトル値の量子化ブロックを供給(52)し、上記量子化ブロックを逆量子化(58)し、この逆量子化されたスペクトル値をラウンディングして、逆量子化されラウンディングされたスペクトル値のラウンディングブロックを得、整数時間離散サンプルのブロックからスペクトル値の整数ブロックを生成するため構成された整数変換アルゴリズムを用いて、整数スペクトル値の整数ブロックを生成(56)し、差分スペクトル値を有する差分ブロックを得るために、上記ラウンディングブロックと上記整数ブロックとの間のスペクトル値を基にした差分に依存して上記差分ブロックを形成(58)することによって、時間離散オーディオ信号から生成された符号化オーディオデータを復号化するための装置であって、
量子化ブロックと差分ブロックとを得るために、上記符号化オーディオデータを処理する手段(70)と、
逆量子化された整数量子化ブロックを得るために、上記量子化ブロックを逆量子化しかつラウンディングするための手段(74)と、
結合ブロックを得るために、上記整数量子化ブロックと上記差分ブロックとをスペクトル値を基にして結合させるための手段(78)と、
上記結合ブロックと、上記整数変換アルゴリズムとは逆の整数変換アルゴリズムとを用いて、上記時間離散オーディオ信号の時間的表現を生成するための手段(82)と、
を備えたことを特徴とする装置。 - 請求項22に記載の復号化するための装置において、
上記符号化オーディオデータはスケールされ、かつ複数のスケーリングレイヤを含み、上記符号化オーディオデータを処理する手段(70)は、第1スケーリングレイヤとして上記符号化オーディオデータから上記量子化ブロックを確認し、第2スケーリングレイヤとして上記符号化オーディオデータから上記差分ブロックを確認するように構成されていることを特徴とする装置。 - 請求項22に記載の装置において、
上記差分ブロックに関する情報はバイナリ符号化差分スペクトル値を含み、
上記符号化オーディオデータはスケーリングされ、かつ複数のスケーリングレイヤを含み、
上記符号化オーディオデータを処理する手段(70)は、第1スケーリングレイヤとして上記符号化オーディオデータから上記量子化ブロックを確認し、第2スケーリングレイヤとして上記差分スペクトル値の表現を低い精度で引き出すように構成されていることを特徴とする装置。 - 請求項24に記載の装置において、
上記符号化オーディオデータを処理する手段(70)は、第2スケーリングレイヤとして、最高重要ビットから重要度が低いビットまでの幾つかのビットを引き出すように構成され、上記重要度が低いビットとは差分スペクトル値の最低重要ビットよりも重要度が高いビットであり、
上記時間離散オーディオ信号の時間的表現を生成するための手段(82)は、上記整数変換アルゴリズムを用いる前に、差分スペクトル値のためにミッシングビットを合成的に生成するように構成されていることを特徴とする装置。 - 請求項25に記載の装置において、
上記手段(82)は、上記合成的な生成のために第2スケーリングレイヤのアップスケーリングを、そのアップスケーリングにおいて2n、(nは第2スケーリングレイヤに含まれない低重要ビットの数である)に等しいスケールファクタが用いられるよう実行し、または上記合成的な生成のためにディザリングアルゴリズム(dithering algorithm)を用いるよう構成されていることを特徴とする装置。 - 請求項22に記載の装置において、
上記符号化オーディオデータはスケールされ、かつ複数のスケーリングレイヤを含み、上記符号化オーディオデータを処理する手段(70)は、第1スケーリングレイヤとして上記符号化オーディオデータの量子化ブロックを確認し、第2スケーリングレイヤとしてローパスフィルタリングされた差分スペクトル値を確認するように構成されていることを特徴とする装置。 - 請求項22または27に記載の装置において、
上記符号化オーディオデータはスケールされ、かつ複数のスケーリングレイヤを含み、上記符号化オーディオデータを処理する手段(70)は、第1スケーリングレイヤとして上記符号化データの量子化ブロックを確認し、第2スケーリングレイヤとして第1カット・オフ周波数までの差分スペクトル値を確認するように構成され、
上記第1カット・オフ周波数は符号器の中で生成されうる差分スペクトル値の最大周波数より低いことを特徴とする装置。 - 請求項28に記載の装置において、
上記時間的表現を生成するための手段(82)は、上記第2スケーリングレイヤのカット・オフ周波数より高い入力値を、全長の整数変換アルゴリズムにおいて、所定値にセットし、かつ符号器の中で生成されうる差分スペクトル値の最大周波数と上記カット・オフ周波数との比に応じて選択されたファクタによって上記逆整数変換アルゴリズムを用いた後で、上記時間離散オーディオ信号の時間的表現をダウンサンプリングするように構成されていることを特徴とする装置。 - 請求項29に記載の装置において、
上記所定値は上記カット・オフ周波数より高いすべての入力値に対してゼロであることを特徴とする装置。 - 供給し、逆量子化し、生成し、形成することによって、時間離散オーディオ信号から生成された符号化オーディオデータを復号化するための方法であって、
量子化ブロックと差分ブロックとを得るために、上記符号化オーディオデータを処理するステップ(70)と、
逆量子化された整数量子化ブロックを得るために、上記量子化ブロックを逆量子化しかつラウンディングするステップ(74)と、
結合ブロックを得るために、上記整数量子化ブロックと上記差分ブロックとをスペクトル値を基にして結合させるステップ(78)と、
上記結合ブロックと上記整数変換アルゴリズムとは逆の整数変換アルゴリズムとを用いて、上記時間離散オーディオ信号の時間的表現を生成するステップ(82)と、
を備えたことを特徴とする方法。 - コンピュータ上で実行されるプログラムであって、請求項21に記載の符号化方法を実行するためのプログラムコードを持つコンピュータプログラム。
- コンピュータ上で実行されるプログラムであって、請求項31に記載の復号化方法を実行するためのプログラムコードを持つコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10217297A DE10217297A1 (de) | 2002-04-18 | 2002-04-18 | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten |
PCT/EP2002/013623 WO2003088212A1 (de) | 2002-04-18 | 2002-12-02 | Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005527851A true JP2005527851A (ja) | 2005-09-15 |
JP4081447B2 JP4081447B2 (ja) | 2008-04-23 |
Family
ID=28798541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003585070A Expired - Lifetime JP4081447B2 (ja) | 2002-04-18 | 2002-12-02 | 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法 |
Country Status (9)
Country | Link |
---|---|
EP (1) | EP1495464B1 (ja) |
JP (1) | JP4081447B2 (ja) |
KR (1) | KR100892152B1 (ja) |
CN (1) | CN1258172C (ja) |
AT (1) | ATE305655T1 (ja) |
CA (1) | CA2482427C (ja) |
DE (2) | DE10217297A1 (ja) |
HK (1) | HK1077391A1 (ja) |
WO (1) | WO2003088212A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010508550A (ja) * | 2006-11-02 | 2010-03-18 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル値の後処理用装置と方法及びオーディオ信号のエンコーダとデコーダ |
JP2010538314A (ja) * | 2007-08-27 | 2010-12-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成 |
JP2013539548A (ja) * | 2010-07-30 | 2013-10-24 | クゥアルコム・インコーポレイテッド | 複数段階の形状ベクトル量子化のためのシステム、方法、装置、およびコンピュータ可読媒体 |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
JP2020512587A (ja) * | 2017-03-22 | 2020-04-23 | イマージョン・ネットワークス・インコーポレイテッドImmersion Networks, Inc. | オーディオデータを処理するためのシステム及び方法 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MXPA06003508A (es) * | 2003-09-29 | 2007-01-25 | Agency Science Tech & Res | Metodo para transformar una senal digital del dominio de tiempo al dominio de frecuencia y viceversa. |
JP4849466B2 (ja) * | 2003-10-10 | 2012-01-11 | エージェンシー フォー サイエンス, テクノロジー アンド リサーチ | デジタル信号をスケーラブルビットストリームにエンコードする方法、及びスケーラブルビットストリームをデコードする方法 |
DE102004007184B3 (de) * | 2004-02-13 | 2005-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Quantisieren eines Informationssignals |
DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
DE102004059979B4 (de) | 2004-12-13 | 2007-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals |
US8494667B2 (en) | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US7761303B2 (en) | 2005-08-30 | 2010-07-20 | Lg Electronics Inc. | Slot position coding of TTT syntax of spatial audio coding application |
KR100878828B1 (ko) | 2005-10-05 | 2009-01-14 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7761289B2 (en) | 2005-10-24 | 2010-07-20 | Lg Electronics Inc. | Removing time delays in signal paths |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
EP1883067A1 (en) * | 2006-07-24 | 2008-01-30 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
EP1903559A1 (en) | 2006-09-20 | 2008-03-26 | Deutsche Thomson-Brandt Gmbh | Method and device for transcoding audio signals |
DE102007003187A1 (de) * | 2007-01-22 | 2008-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals |
KR101149448B1 (ko) * | 2007-02-12 | 2012-05-25 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
EP2063417A1 (en) * | 2007-11-23 | 2009-05-27 | Deutsche Thomson OHG | Rounding noise shaping for integer transform based encoding and decoding |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
JP5555707B2 (ja) * | 2008-10-08 | 2014-07-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチ分解能切替型のオーディオ符号化及び復号化スキーム |
JP5863765B2 (ja) | 2010-03-31 | 2016-02-17 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute | 符号化方法および装置、そして、復号化方法および装置 |
JP5799707B2 (ja) * | 2011-09-26 | 2015-10-28 | ソニー株式会社 | オーディオ符号化装置およびオーディオ符号化方法、オーディオ復号装置およびオーディオ復号方法、並びにプログラム |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
CN105632503B (zh) * | 2014-10-28 | 2019-09-03 | 南宁富桂精密工业有限公司 | 信息隐藏方法及系统 |
EP3471271A1 (en) * | 2017-10-16 | 2019-04-17 | Acoustical Beauty | Improved convolutions of digital signals using a bit requirement optimization of a target digital signal |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
CN107911122A (zh) * | 2017-11-13 | 2018-04-13 | 南京大学 | 基于分解压缩的分布式光纤振动传感数据无损压缩方法 |
US11281312B2 (en) | 2018-01-08 | 2022-03-22 | Immersion Networks, Inc. | Methods and apparatuses for producing smooth representations of input motion in time and space |
WO2019199995A1 (en) | 2018-04-11 | 2019-10-17 | Dolby Laboratories Licensing Corporation | Perceptually-based loss functions for audio encoding and decoding based on machine learning |
DE102019204527B4 (de) * | 2019-03-29 | 2020-11-19 | Technische Universität München | Kodierungs-/dekodierungsvorrichtungen und verfahren zur kodierung/dekodierung von vibrotaktilen signalen |
KR102250835B1 (ko) * | 2019-08-05 | 2021-05-11 | 국방과학연구소 | 수동 소나의 협대역 신호를 탐지하기 위한 lofar 또는 demon 그램의 압축 장치 |
-
2002
- 2002-04-18 DE DE10217297A patent/DE10217297A1/de not_active Withdrawn
- 2002-12-02 AT AT02792858T patent/ATE305655T1/de active
- 2002-12-02 KR KR1020047016744A patent/KR100892152B1/ko active IP Right Grant
- 2002-12-02 CA CA002482427A patent/CA2482427C/en not_active Expired - Lifetime
- 2002-12-02 JP JP2003585070A patent/JP4081447B2/ja not_active Expired - Lifetime
- 2002-12-02 WO PCT/EP2002/013623 patent/WO2003088212A1/de active IP Right Grant
- 2002-12-02 DE DE50204426T patent/DE50204426D1/de not_active Expired - Lifetime
- 2002-12-02 EP EP02792858A patent/EP1495464B1/de not_active Expired - Lifetime
- 2002-12-02 CN CNB028289749A patent/CN1258172C/zh not_active Expired - Lifetime
-
2005
- 2005-10-20 HK HK05109316A patent/HK1077391A1/xx not_active IP Right Cessation
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010508550A (ja) * | 2006-11-02 | 2010-03-18 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル値の後処理用装置と方法及びオーディオ信号のエンコーダとデコーダ |
US8321207B2 (en) | 2006-11-02 | 2012-11-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Device and method for postprocessing spectral values and encoder and decoder for audio signals |
JP2010538314A (ja) * | 2007-08-27 | 2010-12-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成 |
JP2013539548A (ja) * | 2010-07-30 | 2013-10-24 | クゥアルコム・インコーポレイテッド | 複数段階の形状ベクトル量子化のためのシステム、方法、装置、およびコンピュータ可読媒体 |
US8831933B2 (en) | 2010-07-30 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
JP2020512587A (ja) * | 2017-03-22 | 2020-04-23 | イマージョン・ネットワークス・インコーポレイテッドImmersion Networks, Inc. | オーディオデータを処理するためのシステム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
CA2482427A1 (en) | 2003-10-23 |
EP1495464B1 (de) | 2005-09-28 |
DE50204426D1 (de) | 2005-11-03 |
AU2002358578A1 (en) | 2003-10-27 |
CN1625768A (zh) | 2005-06-08 |
WO2003088212A1 (de) | 2003-10-23 |
JP4081447B2 (ja) | 2008-04-23 |
EP1495464A1 (de) | 2005-01-12 |
ATE305655T1 (de) | 2005-10-15 |
CA2482427C (en) | 2010-01-19 |
DE10217297A1 (de) | 2003-11-06 |
CN1258172C (zh) | 2006-05-31 |
KR20050007312A (ko) | 2005-01-17 |
HK1077391A1 (en) | 2006-02-10 |
KR100892152B1 (ko) | 2009-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4081447B2 (ja) | 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法 | |
US7275036B2 (en) | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data | |
US7343287B2 (en) | Method and apparatus for scalable encoding and method and apparatus for scalable decoding | |
EP2270777B1 (en) | Mixed lossy and lossless audio compression | |
KR100331166B1 (ko) | 오디오신호를 코딩하기 위한 방법 및 장치와 비트스트림을디코딩하기 위한 방법 및 장치 | |
EP1964111B1 (en) | Device and method for postprocessing spectral values and encoder and decoder for audio signals | |
US20100274555A1 (en) | Audio Coding Apparatus and Method Thereof | |
JP5400143B2 (ja) | オーバーラッピング変換の2つのブロック変換への因数分解 | |
JP3814611B2 (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
WO1998042083A1 (en) | Audio coding method and apparatus | |
WO2008072670A1 (ja) | 符号化装置、復号装置、およびこれらの方法 | |
EP2856776B1 (en) | Stereo audio signal encoder | |
EP2227682A1 (en) | An encoder | |
Geiger et al. | IntMDCT-A link between perceptual and lossless audio coding | |
US20100292986A1 (en) | encoder | |
US20100280830A1 (en) | Decoder | |
Geiger et al. | Integer low delay and MDCT filter banks | |
US20170206905A1 (en) | Method, medium and apparatus for encoding and/or decoding signal based on a psychoacoustic model | |
JP4721355B2 (ja) | 符号化データの符号化則変換方法および装置 | |
US20190096410A1 (en) | Audio Signal Encoder, Audio Signal Decoder, Method for Encoding and Method for Decoding | |
WO2005055203A1 (en) | Audio signal coding | |
Herre | Audio Coding Based on Integer Transforms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070807 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20071025 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20071101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080208 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110215 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4081447 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110215 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120215 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130215 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140215 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |