JP2008089999A - 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム - Google Patents
音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム Download PDFInfo
- Publication number
- JP2008089999A JP2008089999A JP2006270993A JP2006270993A JP2008089999A JP 2008089999 A JP2008089999 A JP 2008089999A JP 2006270993 A JP2006270993 A JP 2006270993A JP 2006270993 A JP2006270993 A JP 2006270993A JP 2008089999 A JP2008089999 A JP 2008089999A
- Authority
- JP
- Japan
- Prior art keywords
- band
- bits
- encoding
- partition
- divisor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 138
- 238000001228 spectrum Methods 0.000 claims abstract description 101
- 238000006243 chemical reaction Methods 0.000 claims abstract description 25
- 238000005192 partition Methods 0.000 claims description 173
- 230000005236 sound signal Effects 0.000 claims description 47
- 238000013139 quantization Methods 0.000 claims description 42
- 230000003595 spectral effect Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 29
- 230000006835 compression Effects 0.000 description 28
- 238000007906 compression Methods 0.000 description 28
- 241000282414 Homo sapiens Species 0.000 description 20
- 230000001629 suppression Effects 0.000 description 20
- 230000005540 biological transmission Effects 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 13
- 230000035945 sensitivity Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 2
- 238000012913 prioritisation Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
聴覚特性を考慮して、音質を維持しつつ軽快かつ高速に音声の符号化及び復号を行う。
【解決手段】
符号化装置に入力された音声は、MDCT係数から構成されるスペクトルに変換される。まず、中区画帯域毎に、MDCT係数と与えられたビット数との比較により決定されたシフトビット数ぶんだけ、MDCT係数が右ビットシフトされる。次に、MDCT係数は大区画帯域毎に異なる精度で再量子化され、前記シフトビット数とともに符号化される。復号側では、逆再量子化、前記シフトビット数ぶんだけ左ビットシフトすることによるMDCT係数の復元、及び、逆MDCTによる実時間領域への変換、により、音声信号が復元される。
【選択図】図6
Description
デジタル音声信号について、所定帯域幅を有する小区画帯域毎の量子化成分の値を求める離散スペクトル変換手段と、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域であって且つその中区画帯域に属する各量子化成分の値を表すために聴覚特性に合わせて予め設定された所定のビット数が割り当てられている各中区画帯域について、その中区画帯域に属する量子化成分の値のうちの最大値を検索する最大値検索手段と、
前記各中区画帯域について、前記最大値検索手段で検索された最大値を表すための必要ビット数が、その中区画帯域に割り当てられた前記所定のビット数を超えるか否かを判別する判別手段と、
前記判別手段により前記中区画帯域において前記必要ビット数が前記所定のビット数を超えると判別された場合に、前記最大値に除算を施して前記所定のビット数で表し得る値を超えないようにするための除数であり且つ2の累乗のうち最小の数である除数を求め、該中区画帯域に属する前記量子化成分の各値を該除数で除算し、前記判別手段により前記中区画帯域において前記必要ビット数が前記所定のビット数を超えないと判別された場合に、該中区画帯域に属する前記量子化成分の各値を維持する除算手段と、
聴覚特性に合わせて予め設定された所定の数の連続する前記中区画帯域から構成される大区画帯域に属する前記除算手段で処理済の量子化成分の値を、聴覚特性に合わせて予め該大区画帯域に割り当てられた精度にて量子化し直して再量子化済成分に変換する再量子化手段と、
前記除数と前記再量子化済成分とを符号化して出力する符号化手段と、
を備える。
音声信号の量子化スペクトルを、聴覚特性にあわせた第1の帯域分割方法により生成された帯域別に、2の累乗である除数で除した結果、生成される第1の変形スペクトルデータを、さらに第2の帯域分割方法により生成された帯域別に、聴覚特性に合わせた精度で再量子化した結果生成される第2の変形スペクトルデータと、前記除数と、が所定の符号化方法により符号化されたデータを受信する受信手段と、
前記符号化されたデータから、前記所定の符号化方法に対応する復号方法により、前記第2の変形スペクトルデータと、前記除数と、を復号する復号手段と、
復号された前記第2の変形スペクトルデータから、前記第1の変形スペクトルデータを復元する逆再量子化手段と、
復元された前記第1の変形スペクトルデータをビットシフトして、復号された前記除数を乗じることにより、前記量子化スペクトルを復元する乗算ビットシフト手段と、
復元された前記量子化スペクトルから前記音声信号を復元する離散スペクトル逆変換手段と、
を備える。
デジタル音声信号について、所定帯域幅を有する小区画帯域毎の量子化成分の値を求める離散スペクトル変換ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域であって且つその中区画帯域に属する各量子化成分の値を表すために聴覚特性に合わせて予め設定された所定のビット数が割り当てられている各中区画帯域について、その中区画帯域に属する量子化成分の値のうちの最大値を検索する最大値検索ステップと、
前記各中区画帯域について、前記最大値検索ステップで検索された最大値を表すための必要ビット数が、その中区画帯域に割り当てられた前記所定のビット数を超えるか否かを判別する判別ステップと、
前記判別ステップにより前記中区画帯域において前記必要ビット数が前記所定のビット数を超えると判別された場合に、前記最大値に除算を施して前記所定のビット数で表し得る値を超えないようにするための除数であり且つ2の累乗のうち最小の数である除数を求め、該中区画帯域に属する前記量子化成分の各値を該除数で除算し、前記判別ステップにより前記中区画帯域において前記必要ビット数が前記所定のビット数を超えないと判別された場合に、該中区画帯域に属する前記量子化成分の各値を維持する除算ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記中区画帯域から構成される大区画帯域に属する前記除算ステップで処理済の量子化成分の値を、聴覚特性に合わせて予め該大区画帯域に割り当てられた精度にて量子化し直して再量子化済成分に変換する再量子化ステップと、
前記除数と前記再量子化済成分とを符号化して出力する符号化ステップと、
から構成される。
音声信号の量子化スペクトルを、聴覚特性にあわせた第1の帯域分割方法により生成された帯域別に、2の累乗である除数で除した結果生成される第1の変形スペクトルデータを、さらに第2の帯域分割方法により生成された帯域別に、聴覚特性に合わせた精度で再量子化した結果、生成される第2の変形スペクトルデータと、前記除数と、が所定の符号化方法により符号化されたデータを受信する受信ステップと、
前記符号化されたデータから、前記所定の符号化方法に対応する復号方法により、前記第2の変形スペクトルデータと、前記除数と、を復号する復号ステップと、
復号された前記第2の変形スペクトルデータから、前記第1の変形スペクトルデータを復元する逆再量子化ステップと、
復元された前記第1の変形スペクトルデータをビットシフトして、復号された前記除数を乗じることにより、前記量子化スペクトルを復元する乗算ビットシフトステップと、
復元された前記量子化スペクトルから前記音声信号を復元する離散スペクトル逆変換ステップと、
から構成される。
コンピュータに、
デジタル音声信号について、所定帯域幅を有する小区画帯域毎の量子化成分の値を求める離散スペクトル変換ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域であって且つその中区画帯域に属する各量子化成分の値を表すために聴覚特性に合わせて予め設定された所定のビット数が割り当てられている各中区画帯域について、その中区画帯域に属する量子化成分の値のうちの最大値を検索する最大値検索ステップと、
前記各中区画帯域について、前記最大値検索ステップで検索された最大値を表すための必要ビット数が、その中区画帯域に割り当てられた前記所定のビット数を超えるか否かを判別する判別ステップと、
前記判別ステップにより前記中区画帯域において前記必要ビット数が前記所定のビット数を超えると判別された場合に、前記最大値に除算を施して前記所定のビット数で表し得る値を超えないようにするための除数であり且つ2の累乗のうち最小の数である除数を求め、該中区画帯域に属する前記量子化成分の各値を該除数で除算し、前記判別ステップにより前記中区画帯域において前記必要ビット数が前記所定のビット数を超えないと判別された場合に、該中区画帯域に属する前記量子化成分の各値を維持する除算ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記中区画帯域から構成される大区画帯域に属する前記除算ステップで処理済の量子化成分の値を、聴覚特性に合わせて予め該大区画帯域に割り当てられた精度にて量子化し直して再量子化済成分に変換する再量子化ステップと、
前記除数と前記再量子化済成分とを符号化して出力する符号化ステップと、
を実行させる。
コンピュータに、
音声信号の量子化スペクトルを、聴覚特性にあわせた第1の帯域分割方法により生成された帯域別に、2の累乗である除数で除した結果、生成される第1の変形スペクトルデータを、さらに第2の帯域分割方法により生成された帯域別に、聴覚特性に合わせた精度で再量子化した結果生成される第2の変形スペクトルデータと、前記除数と、が所定の符号化方法により符号化されたデータを受信する受信ステップと、
前記符号化されたデータから、前記所定の符号化方法に対応する復号方法により、前記第2の変形スペクトルデータと、前記除数と、を復号する復号ステップと、
復号された前記第2の変形スペクトルデータから、前記第1の変形スペクトルデータを復元する逆再量子化ステップと、
復元された前記第1の変形スペクトルデータをビットシフトして、復号された前記除数を乗じることにより、前記量子化スペクトルを復元する乗算ビットシフトステップと、
復元された前記量子化スペクトルから前記音声信号を復元する離散スペクトル逆変換ステップと、
を実行させる。
図1に、本実施形態に係る音声符号化兼復号装置9111を示す。該装置としては、例えば、携帯電話機が想定される。
XBS(ωRANGE、1)
=X(ωRANGE、1)
÷{2^ShiftBit(ωRANGE)}、
・・・、
XBS(ωRANGE、q(ωRANGE))
=X(ωRANGE、q(ωRANGE))
÷{2^ShiftBit(ωRANGE)}
を求める(ステップS9327)。ただし、記号^は、累乗を表す。ビットシフト済MDCT係数とは、あらかじめ設定され与えられたビットであるGivenBit(ωRANGE)個のビットで表現し得る範囲内に収まるよう調整されたMDCT係数であるといえる。
以下では、本発明の実施形態2に係る音声符号化兼復号装置について述べる。装置の概要は、実施形態1に係る音声符号化兼復号装置9111と同様である。ただし、記憶部9125は、実時間領域における振幅制圧用シフトビット数、符号化用帯域毎の特徴量、符号長、をさらに記憶する。
ShiftBit(fm)
=TmpBit−GivenBitAC+1
={TmpBitの初期値+1}−GivenBitAC+1
={(GivenBitAC−1)+1}−GivenBitAC+1
=1
のようになり、振幅制圧用シフトビット数は1と求まる。
xBS、AC(fm、0)=xAC(fm、0)/2ShiftBit(fm)、
・・・、
xBS、AC(fm、M−1)=xAC(fm、M−1)/2ShiftBit(fm)
のように計算する(ステップS9827)。ここでは除算が行われているが、除数が2の累乗に限れられていることから、CPU9121が実際に行う演算は、1度の除算につき1度の右シフト演算だけで済む。
g(ωCRNG)
=X(ωCRNG、1)2+・・・+X(ωCRNG、q(ωCRNG))2
のように計算され、記憶部9125に格納される(ステップS1017)。
XQBS(ωCRNG(1)、1)、・・・、
XQBS(ωCRNG(1)、q(ωCRNG(1)))、
・・・
XQBS(ωCRNG(PriorityMAX)、1)、・・・、
XQBS(ωCRNG(PriorityMAX)、q(ωCRNG(PriorityMAX)))
である。
Claims (15)
- デジタル音声信号について、所定帯域幅を有する小区画帯域毎の量子化成分の値を求める離散スペクトル変換手段と、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域であって且つその中区画帯域に属する各量子化成分の値を表すために聴覚特性に合わせて予め設定された所定のビット数が割り当てられている各中区画帯域について、その中区画帯域に属する量子化成分の値のうちの最大値を検索する最大値検索手段と、
前記各中区画帯域について、前記最大値検索手段で検索された最大値を表すための必要ビット数が、その中区画帯域に割り当てられた前記所定のビット数を超えるか否かを判別する判別手段と、
前記判別手段により前記中区画帯域において前記必要ビット数が前記所定のビット数を超えると判別された場合に、前記最大値に除算を施して前記所定のビット数で表し得る値を超えないようにするための除数であり且つ2の累乗のうち最小の数である除数を求め、該中区画帯域に属する前記量子化成分の各値を該除数で除算し、前記判別手段により前記中区画帯域において前記必要ビット数が前記所定のビット数を超えないと判別された場合に、該中区画帯域に属する前記量子化成分の各値を維持する除算手段と、
聴覚特性に合わせて予め設定された所定の数の連続する前記中区画帯域から構成される大区画帯域に属する前記除算手段で処理済の量子化成分の値を、聴覚特性に合わせて予め該大区画帯域に割り当てられた精度にて量子化し直して再量子化済成分に変換する再量子化手段と、
前記除数と前記再量子化済成分とを符号化して出力する符号化手段と、
を備える音声符号化装置。 - 前記中区画帯域の中心周波数が小さいほど、該中区画帯域に多くの前記所定のビット数を割り当てる割り当てビット数決定手段をさらに備える、
請求項1に記載の音声符号化装置。 - 前記中区画帯域に低域から順に中区画識別用整数を割り当て、前記中区画帯域の中心周波数の対数が、前記中区画識別用整数に線型的に依存するように前記中区画帯域を構成する中区画帯域構成手段をさらに備える、
請求項1又は2に記載の音声符号化装置。 - 前記大区画帯域の中心周波数が小さいほど、該大区画帯域における前記再量子化手段による量子化し直しの前記精度が高くなるように、各大区画帯域の前記精度を決定する再量子化精度決定手段をさらに備える、
請求項1乃至3の何れか1項に記載の音声符号化装置。 - 前記再量子化手段は、
前記除算手段で処理済みの量子化済成分の値を、その対数を量子化することによって前記再量子化成分に変換する、
ことを特徴とする請求項1乃至4の何れか1項に記載の音声符号化装置。 - 前記大区画帯域に低域から順に大区画識別用整数を割り当て、前記大区画帯域の中心周波数の対数が、前記大区画識別用整数に線型的に依存するように前記大区画帯域を構成する第1の大区画帯域構成手段をさらに備える、
請求項1乃至5の何れか1項に記載の音声符号化装置。 - 低域の大区画帯域と中域の大区画帯域と高域の大区画帯域とを構成し、前記中域の大区画帯域と前記高域の大区画帯域との境界の周波数が、前記離散スペクトル変換手段が扱い得る周波数の上限値の半分の値となるようにするとともに、1乃至3の前記中区画帯域により前記低域の大区画帯域を構成する第2の大区画帯域構成手段をさらに備える、
請求項1乃至5の何れか1項に記載の音声符号化装置。 - 単数又は複数の前記小区画帯域から構成されるエントロピ符号化用帯域毎に、それに属する前記量子化成分の絶対値の2乗の和を求め、該和に所定の係数を乗じた値を該エントロピ符号化用帯域の重要度とする重要度決定手段をさらに備え、
前記符号化手段は、符号長を所定の符号長以下にしつつ、前記重要度が大きい前記エントロピ符号化用帯域の前記再量子化成分を優先してエントロピ符号化する、
ことを特徴とする請求項1乃至7の何れか1項に記載の音声符号化装置。 - 前記重要度決定手段は、前記和に、前記エントロピ符号化用帯域の中心周波数が低いほど大きな数を乗じた値を該エントロピ符号化用帯域の重要度とする、
ことを特徴とする請求項8に記載の音声符号化装置。 - 前記離散スペクトル変換手段は、
MDCT(Modified Discrete Cosine Transform)を用いる、
ことを特徴とする請求項1乃至9の何れか1項に記載の音声符号化装置。 - 音声信号の量子化スペクトルを、聴覚特性にあわせた第1の帯域分割方法により生成された帯域別に、2の累乗である除数で除した結果、生成される第1の変形スペクトルデータを、さらに第2の帯域分割方法により生成された帯域別に、聴覚特性に合わせた精度で再量子化した結果生成される第2の変形スペクトルデータと、前記除数と、が所定の符号化方法により符号化されたデータを受信する受信手段と、
前記符号化されたデータから、前記所定の符号化方法に対応する復号方法により、前記第2の変形スペクトルデータと、前記除数と、を復号する復号手段と、
復号された前記第2の変形スペクトルデータから、前記第1の変形スペクトルデータを復元する逆再量子化手段と、
復元された前記第1の変形スペクトルデータをビットシフトして、復号された前記除数を乗じることにより、前記量子化スペクトルを復元する乗算ビットシフト手段と、
復元された前記量子化スペクトルから前記音声信号を復元する離散スペクトル逆変換手段と、
を備える音声復号装置。 - デジタル音声信号について、所定帯域幅を有する小区画帯域毎の量子化成分の値を求める離散スペクトル変換ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域であって且つその中区画帯域に属する各量子化成分の値を表すために聴覚特性に合わせて予め設定された所定のビット数が割り当てられている各中区画帯域について、その中区画帯域に属する量子化成分の値のうちの最大値を検索する最大値検索ステップと、
前記各中区画帯域について、前記最大値検索ステップで検索された最大値を表すための必要ビット数が、その中区画帯域に割り当てられた前記所定のビット数を超えるか否かを判別する判別ステップと、
前記判別ステップにより前記中区画帯域において前記必要ビット数が前記所定のビット数を超えると判別された場合に、前記最大値に除算を施して前記所定のビット数で表し得る値を超えないようにするための除数であり且つ2の累乗のうち最小の数である除数を求め、該中区画帯域に属する前記量子化成分の各値を該除数で除算し、前記判別ステップにより前記中区画帯域において前記必要ビット数が前記所定のビット数を超えないと判別された場合に、該中区画帯域に属する前記量子化成分の各値を維持する除算ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記中区画帯域から構成される大区画帯域に属する前記除算ステップで処理済の量子化成分の値を、聴覚特性に合わせて予め該大区画帯域に割り当てられた精度にて量子化し直して再量子化済成分に変換する再量子化ステップと、
前記除数と前記再量子化済成分とを符号化して出力する符号化ステップと、
から構成される音声符号化方法。 - 音声信号の量子化スペクトルを、聴覚特性にあわせた第1の帯域分割方法により生成された帯域別に、2の累乗である除数で除した結果生成される第1の変形スペクトルデータを、さらに第2の帯域分割方法により生成された帯域別に、聴覚特性に合わせた精度で再量子化した結果、生成される第2の変形スペクトルデータと、前記除数と、が所定の符号化方法により符号化されたデータを受信する受信ステップと、
前記符号化されたデータから、前記所定の符号化方法に対応する復号方法により、前記第2の変形スペクトルデータと、前記除数と、を復号する復号ステップと、
復号された前記第2の変形スペクトルデータから、前記第1の変形スペクトルデータを復元する逆再量子化ステップと、
復元された前記第1の変形スペクトルデータをビットシフトして、復号された前記除数を乗じることにより、前記量子化スペクトルを復元する乗算ビットシフトステップと、
復元された前記量子化スペクトルから前記音声信号を復元する離散スペクトル逆変換ステップと、
から構成される音声復号方法。 - コンピュータに、
デジタル音声信号について、所定帯域幅を有する小区画帯域毎の量子化成分の値を求める離散スペクトル変換ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域であって且つその中区画帯域に属する各量子化成分の値を表すために聴覚特性に合わせて予め設定された所定のビット数が割り当てられている各中区画帯域について、その中区画帯域に属する量子化成分の値のうちの最大値を検索する最大値検索ステップと、
前記各中区画帯域について、前記最大値検索ステップで検索された最大値を表すための必要ビット数が、その中区画帯域に割り当てられた前記所定のビット数を超えるか否かを判別する判別ステップと、
前記判別ステップにより前記中区画帯域において前記必要ビット数が前記所定のビット数を超えると判別された場合に、前記最大値に除算を施して前記所定のビット数で表し得る値を超えないようにするための除数であり且つ2の累乗のうち最小の数である除数を求め、該中区画帯域に属する前記量子化成分の各値を該除数で除算し、前記判別ステップにより前記中区画帯域において前記必要ビット数が前記所定のビット数を超えないと判別された場合に、該中区画帯域に属する前記量子化成分の各値を維持する除算ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記中区画帯域から構成される大区画帯域に属する前記除算ステップで処理済の量子化成分の値を、聴覚特性に合わせて予め該大区画帯域に割り当てられた精度にて量子化し直して再量子化済成分に変換する再量子化ステップと、
前記除数と前記再量子化済成分とを符号化して出力する符号化ステップと、
を実行させるコンピュータプログラム。 - コンピュータに、
音声信号の量子化スペクトルを、聴覚特性にあわせた第1の帯域分割方法により生成された帯域別に、2の累乗である除数で除した結果、生成される第1の変形スペクトルデータを、さらに第2の帯域分割方法により生成された帯域別に、聴覚特性に合わせた精度で再量子化した結果生成される第2の変形スペクトルデータと、前記除数と、が所定の符号化方法により符号化されたデータを受信する受信ステップと、
前記符号化されたデータから、前記所定の符号化方法に対応する復号方法により、前記第2の変形スペクトルデータと、前記除数と、を復号する復号ステップと、
復号された前記第2の変形スペクトルデータから、前記第1の変形スペクトルデータを復元する逆再量子化ステップと、
復元された前記第1の変形スペクトルデータをビットシフトして、復号された前記除数を乗じることにより、前記量子化スペクトルを復元する乗算ビットシフトステップと、
復元された前記量子化スペクトルから前記音声信号を復元する離散スペクトル逆変換ステップと、
を実行させるコンピュータプログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006270993A JP4396683B2 (ja) | 2006-10-02 | 2006-10-02 | 音声符号化装置、音声符号化方法、及び、プログラム |
PCT/JP2007/068733 WO2008041596A1 (en) | 2006-10-02 | 2007-09-19 | Audio encoding device5 audio decoding device, audio encoding method, audio decoding method, and information recording |
KR1020097009136A KR101026597B1 (ko) | 2006-10-02 | 2007-09-19 | 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법, 음성 복호화 방법 및 정보기록매체 |
CN2007800366177A CN101523485B (zh) | 2006-10-02 | 2007-09-19 | 音频编码装置、音频解码装置、音频编码方法和音频解码方法 |
US11/906,312 US8447597B2 (en) | 2006-10-02 | 2007-10-01 | Audio encoding device, audio decoding device, audio encoding method, and audio decoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006270993A JP4396683B2 (ja) | 2006-10-02 | 2006-10-02 | 音声符号化装置、音声符号化方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008089999A true JP2008089999A (ja) | 2008-04-17 |
JP4396683B2 JP4396683B2 (ja) | 2010-01-13 |
Family
ID=38669899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006270993A Active JP4396683B2 (ja) | 2006-10-02 | 2006-10-02 | 音声符号化装置、音声符号化方法、及び、プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US8447597B2 (ja) |
JP (1) | JP4396683B2 (ja) |
KR (1) | KR101026597B1 (ja) |
CN (1) | CN101523485B (ja) |
WO (1) | WO2008041596A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009125588A1 (ja) * | 2008-04-09 | 2009-10-15 | パナソニック株式会社 | 符号化装置および符号化方法 |
JP2012032803A (ja) * | 2010-07-01 | 2012-02-16 | Polycom Inc | フルバンド拡張可能なオーディオコーデック |
JP2012518194A (ja) * | 2009-02-16 | 2012-08-09 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置 |
JP5328368B2 (ja) * | 2006-12-13 | 2013-10-30 | パナソニック株式会社 | 符号化装置、復号装置、およびこれらの方法 |
US8831932B2 (en) | 2010-07-01 | 2014-09-09 | Polycom, Inc. | Scalable audio in a multi-point environment |
JP2016027411A (ja) * | 2011-05-25 | 2016-02-18 | ▲ホア▼▲ウェイ▼技術有限公司 | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8638699B2 (en) | 2008-11-10 | 2014-01-28 | Qualcomm Incorporated | Method and apparatus for supporting the large service data unit (SDU) |
US8711881B2 (en) | 2009-01-07 | 2014-04-29 | Qualcomm Incorporated | Packet bundling at the PDCP layer |
US8644338B2 (en) | 2009-01-07 | 2014-02-04 | Qualcomm Incorporated | Unbundling packets received in wireless communications |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
US20120029926A1 (en) | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
CN103368682B (zh) | 2012-03-29 | 2016-12-07 | 华为技术有限公司 | 信号编码和解码的方法和设备 |
KR101920029B1 (ko) * | 2012-08-03 | 2018-11-19 | 삼성전자주식회사 | 모바일 장치 및 제어방법 |
CN104282312B (zh) * | 2013-07-01 | 2018-02-23 | 华为技术有限公司 | 信号编码和解码方法以及设备 |
JP6439296B2 (ja) * | 2014-03-24 | 2018-12-19 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP6640849B2 (ja) * | 2014-10-31 | 2020-02-05 | ドルビー・インターナショナル・アーベー | マルチチャネル・オーディオ信号のパラメトリック・エンコードおよびデコード |
CN109328382B (zh) * | 2016-06-22 | 2023-06-16 | 杜比国际公司 | 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法 |
EP3780396B1 (en) * | 2018-04-13 | 2023-05-31 | Nippon Telegraph And Telephone Corporation | Encoding device, decoding device, encoding method, decoding method, program, and recording medium |
JP7272360B2 (ja) | 2018-06-28 | 2023-05-12 | ソニーグループ株式会社 | 符号化装置、符号化方法、復号装置、復号方法、プログラム |
WO2020008716A1 (ja) | 2018-07-03 | 2020-01-09 | ソニー株式会社 | 符号化装置、符号化方法、復号装置、復号方法、伝送システム、受信装置、プログラム |
WO2020031483A1 (ja) * | 2018-08-08 | 2020-02-13 | ソニー株式会社 | 復号装置、復号方法、プログラム |
CN112289343B (zh) * | 2020-10-28 | 2024-03-19 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频修复方法、装置及电子设备和计算机可读存储介质 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1986004198A1 (en) * | 1984-12-29 | 1986-07-17 | Sony Corporation | Digital signal transmission device |
JPS6386907A (ja) * | 1986-09-30 | 1988-04-18 | Yamaha Corp | 利得調整回路 |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
JPH04150522A (ja) * | 1990-10-15 | 1992-05-25 | Sony Corp | ディジタル信号処理装置 |
US5317672A (en) * | 1991-03-05 | 1994-05-31 | Picturetel Corporation | Variable bit rate speech encoder |
JP2993324B2 (ja) | 1993-07-28 | 1999-12-20 | 日本ビクター株式会社 | 音声高能率符号化装置 |
US6151442A (en) * | 1996-07-08 | 2000-11-21 | Victor Company Of Japan, Ltd. | Signal compressing apparatus |
US6353808B1 (en) * | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
US6871180B1 (en) * | 1999-05-25 | 2005-03-22 | Arbitron Inc. | Decoding of information in audio signals |
WO2001028222A2 (en) * | 1999-10-12 | 2001-04-19 | Perception Digital Technology (Bvi) Limited | Digital multimedia jukebox |
JP2001285073A (ja) * | 2000-03-29 | 2001-10-12 | Sony Corp | 信号処理装置及び方法 |
WO2002056297A1 (en) * | 2001-01-11 | 2002-07-18 | Sasken Communication Technologies Limited | Adaptive-block-length audio coder |
FI119955B (fi) * | 2001-06-21 | 2009-05-15 | Nokia Corp | Menetelmä, kooderi ja laite puheenkoodaukseen synteesi-analyysi puhekoodereissa |
US6732071B2 (en) * | 2001-09-27 | 2004-05-04 | Intel Corporation | Method, apparatus, and system for efficient rate control in audio encoding |
EP1440433B1 (en) * | 2001-11-02 | 2005-05-04 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device |
US20040002859A1 (en) * | 2002-06-26 | 2004-01-01 | Chi-Min Liu | Method and architecture of digital conding for transmitting and packing audio signals |
JP3861770B2 (ja) * | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
TWI220753B (en) * | 2003-01-20 | 2004-09-01 | Mediatek Inc | Method for determining quantization parameters |
JP2004309921A (ja) * | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
US7349842B2 (en) * | 2003-09-29 | 2008-03-25 | Sony Corporation | Rate-distortion control scheme in audio encoding |
JP4734859B2 (ja) * | 2004-06-28 | 2011-07-27 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
JP4800645B2 (ja) | 2005-03-18 | 2011-10-26 | カシオ計算機株式会社 | 音声符号化装置、及び音声符号化方法 |
-
2006
- 2006-10-02 JP JP2006270993A patent/JP4396683B2/ja active Active
-
2007
- 2007-09-19 KR KR1020097009136A patent/KR101026597B1/ko active IP Right Grant
- 2007-09-19 WO PCT/JP2007/068733 patent/WO2008041596A1/en active Application Filing
- 2007-09-19 CN CN2007800366177A patent/CN101523485B/zh active Active
- 2007-10-01 US US11/906,312 patent/US8447597B2/en active Active
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5328368B2 (ja) * | 2006-12-13 | 2013-10-30 | パナソニック株式会社 | 符号化装置、復号装置、およびこれらの方法 |
WO2009125588A1 (ja) * | 2008-04-09 | 2009-10-15 | パナソニック株式会社 | 符号化装置および符号化方法 |
JP2012518194A (ja) * | 2009-02-16 | 2012-08-09 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置 |
US8805694B2 (en) | 2009-02-16 | 2014-08-12 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding |
JP2014170232A (ja) * | 2009-02-16 | 2014-09-18 | Electronics & Telecommunications Research Inst | 適応的正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置 |
US9251799B2 (en) | 2009-02-16 | 2016-02-02 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding |
JP2012032803A (ja) * | 2010-07-01 | 2012-02-16 | Polycom Inc | フルバンド拡張可能なオーディオコーデック |
US8831932B2 (en) | 2010-07-01 | 2014-09-09 | Polycom, Inc. | Scalable audio in a multi-point environment |
JP2016027411A (ja) * | 2011-05-25 | 2016-02-18 | ▲ホア▼▲ウェイ▼技術有限公司 | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス |
JP2017191341A (ja) * | 2011-05-25 | 2017-10-19 | ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス |
JP2021060618A (ja) * | 2011-05-25 | 2021-04-15 | ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス |
JP7177185B2 (ja) | 2011-05-25 | 2022-11-22 | ▲ホア▼▲ウェイ▼技術有限公司 | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス |
Also Published As
Publication number | Publication date |
---|---|
CN101523485A (zh) | 2009-09-02 |
CN101523485B (zh) | 2012-10-10 |
JP4396683B2 (ja) | 2010-01-13 |
WO2008041596A1 (en) | 2008-04-10 |
US20080082321A1 (en) | 2008-04-03 |
KR20090076956A (ko) | 2009-07-13 |
US8447597B2 (en) | 2013-05-21 |
KR101026597B1 (ko) | 2011-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4396683B2 (ja) | 音声符号化装置、音声符号化方法、及び、プログラム | |
US8612215B2 (en) | Method and apparatus to extract important frequency component of audio signal and method and apparatus to encode and/or decode audio signal using the same | |
US8615391B2 (en) | Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same | |
RU2670797C9 (ru) | Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов | |
KR102165403B1 (ko) | 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법 | |
CN111179946B (zh) | 无损编码方法和无损解码方法 | |
KR102401002B1 (ko) | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 | |
KR101361933B1 (ko) | 오디오 인코딩에서 주파수 대역 신호 에너지를 기초로 한 주파수 대역 스케일 팩터 결정 | |
EP1596366A1 (en) | Digital signal encoding method and apparatus using plural lookup tables | |
CN102483924A (zh) | 使用通道间及时间冗余减少的音频信号编码 | |
JP2004309921A (ja) | 符号化装置、符号化方法及びプログラム | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
EP1249837A2 (en) | A method for decompressing a compressed audio signal | |
KR20170089982A (ko) | 신호 인코딩 및 디코딩 방법 및 장치 | |
JP2019070823A (ja) | 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法 | |
JP5098453B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム | |
JP3146121B2 (ja) | 符号化復号化装置 | |
JP2009288560A (ja) | 音声符号化装置、音声復号装置、及びプログラム | |
JP2003280695A (ja) | 音声圧縮方法および音声圧縮装置 | |
JP2003195898A (ja) | 音声データ処理装置、方法及びプログラム | |
JPH08237130A (ja) | 信号符号化方法及び装置、並びに記録媒体 | |
JPH08328600A (ja) | 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置 | |
JP2009288561A (ja) | 音声符号化装置、音声復号装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090929 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091012 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121030 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4396683 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121030 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131030 Year of fee payment: 4 |