JP4635709B2 - 音声符号化装置及び方法、並びに音声復号装置及び方法 - Google Patents
音声符号化装置及び方法、並びに音声復号装置及び方法 Download PDFInfo
- Publication number
- JP4635709B2 JP4635709B2 JP2005137667A JP2005137667A JP4635709B2 JP 4635709 B2 JP4635709 B2 JP 4635709B2 JP 2005137667 A JP2005137667 A JP 2005137667A JP 2005137667 A JP2005137667 A JP 2005137667A JP 4635709 B2 JP4635709 B2 JP 4635709B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- frequency spectrum
- information
- quantization information
- normalization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
先ず、第1の実施の形態における音声符号化装置の概略構成を図1に示す。また、図1に示す音声符号化装置10における符号化処理の手順を図2のフローチャートに示す。以下、図1を参照しながら、図2のフローチャートについて説明する。
nspec1=mdspec1*sf1(idsf) ・・・(1)
で示すように正規化し、得られた正規化周波数スペクトルnspec1を第1の量子化部14に供給する。この処理により、周波数スペクトルmdspec1は、±f∈Rの範囲に正規化される。正規化情報idsfと正規化係数sf1(idsf)との関係は、例えば以下の表1のように表される。
qspec1=(int)(floor(nspec1*qf1(idwl1))+0.5) ・・・(2)
のように求められる。この処理により、正規化周波数スペクトルnspec1は、量子化ステップ幅nstep(idwl1)で表されるステップ数の量子化周波数スペクトルqspec1に量子化される。量子化情報idwl1と量子化ステップ幅nstep(idwl1)及び量子化係数qf1(idwl1)との関係は、例えば以下の表2のように表される。
nspec1'=qspec1*iqf1(idwl1) ・・・(3)
で示すように逆量子化し、得られた正規化周波数スペクトルnspec1'を逆正規化部16に供給する。ここで、量子化係数qf1(idwl1)と逆量子化係数iqf1(idwl1)との関係は、以下の式(4)、
iqf1(idwl1)=1/qf1(idwl1) ・・・(4)
で表される。
mdspec1'=nspec1'*isf1(idsf) ・・・(5)
で示すように逆正規化し、得られた周波数スペクトルmdspec1'を減算部17に供給する。ここで、正規化係数sf1(idsf)と逆正規化係数isf1(idsf)との関係は、以下の式(6)、
isf1(idsf)=1/sf1(idsf) ・・・(6)
で表される。
mdspec2=mdspec1−mdspec1' ・・・(7)
で示すように周波数スペクトルmdspec1から周波数スペクトルmdspec1'を減算し、得られた差分周波数スペクトルmdspec2を第2の正規化部18に供給する。
nspec2=mdspec2*sf2
=(mdspec1−mdspec1')*sf2
=((nspec1−nspec1')*isf1(idsf))*sf2 ・・・(8)
で示すように正規化し、得られた差分正規化周波数スペクトルnspec2を第2の量子化部19に供給する。
sf2(idsf,idwl1)=sf1(idsf)*nstep(idwl1)/f ・・・(9)
で示すように算出することができる。すなわち、正規化情報idsfと量子化情報idwl1とに基づいて正規化係数sf2(idsf,idwl1)を算出することができる。
qspec2=(int)(floor(nspec2*qf2(idwl2))+0.5) ・・・(10)
のように求められる。なお、量子化情報idwl2と量子化係数qf2(idwl2)との関係は、上述した表2と同様であってもよく、異なっていてもよい。
nspec1'=qspec1*iqf1(idwl1) ・・・(11)
で示すように逆量子化し、得られた正規化周波数スペクトルnspec1'を第1の逆正規化部33に供給する。ここで、量子化係数qf1(idwl1)と逆量子化係数iqf1(idwl1)との関係は、上述した式(4)で表される。
mdspec1'=nspec1'*isf1(idsf) ・・・(12)
で示すように逆正規化し、得られた周波数スペクトルmdspec1'を加算部36に供給する。ここで、正規化係数sf1(idsf)と逆正規化係数isf1(idsf)との関係は、上述した式(6)で表される。
nspec2'=qspec2*iqf2(idwl2) ・・・(13)
で示すように逆量子化し、得られた差分正規化周波数スペクトルnspec2'を第2の逆正規化部35に供給する。ここで、量子化係数qf2(idwl2)と逆量子化係数iqf2(idwl2)との関係は、以下の式(14)、
iqf2(idwl2)=1/qf2(idwl2) ・・・(14)
で表される。
mdspec2'=nspec2'*isf2(idsf,idwl1) ・・・(15)
で示すように逆正規化し、得られた差分周波数スペクトルmdspec2'を加算部36に供給する。ここで、逆正規化係数isf2(idsf,idwl1)と正規化情報idsf及び量子化情報idwl1との関係は、以下の式(16)、
isf2(idsf,idwl1)=1/sf2(idsf,idwl1)=isf1(idsf)*f/nstep(idwl1) ・・・(16)
で表される。なお、ステップS35及びステップS36の処理は、ステップS33及びステップS34の処理よりも前に行ってもよく、並列に行ってもよい。
mdspec'=mdspec1'+mdspec2' ・・・(17)
で示すように周波数スペクトルmdspec1'と差分周波数スペクトルmdspec2'とを加算し、得られた周波数スペクトルmdspec'を周波数時間変換部37に供給する。
ところで、上述のように2段の正規化・量子化を行う場合には、1段目及び2段目の量子化情報idwl1,idwl2を符号化する必要があるため、段数に応じて周波数スペクトル情報の符号化効率が低下してしまう。そこで、本実施の形態では、この量子化情報idwl1,idwl2の符号化を省略することにより周波数スペクトル情報の符号化効率を向上させる方法について説明する。
何れも、上述した音声符号化装置10及び音声復号装置30と同様の構成については同一符号を付して詳細な説明を省略する。
次に、第3の実施の形態として図11に示す音声符号化装置60は、基本構造を図1に示した音声符号化装置10と同様とするが、周波数スペクトルmdspec1と周波数スペクトルmdspec1'との差分に対して2段目の正規化・量子化を行うのではなく、正規化周波数スペクトルnspec1と正規化周波数スペクトルnspec1'との差分に対して2段目の正規化・量子化を行う点に特徴を有している。したがって、先に図1に示した音声符号化装置10と同様の構成については同一符号を付して詳細な説明を省略する。
nspec2=nspec1−nspec1' ・・・(18)
で示すように正規化周波数スペクトルnspec1から正規化周波数スペクトルnspec1'を減算し、得られた差分正規化周波数スペクトルnspec2を第2の正規化部62に供給する。
nnspec2=nspec2*sf2
=(nspec1−nspec1')*sf2 ・・・(19)
で示すように正規化し、得られた差分再正規化周波数スペクトルnnspec2を第2の量子化部63に供給する。
sf2(idwl1)=nstep(idwl1)/f ・・・(20)
で示すように算出することができる。すなわち、量子化情報idwl1に基づいて正規化係数sf2(idwl1)を算出することができる。
qspec2=(int)(floor(nnspec2*qf2(idwl2))+0.5) ・・・(21)
のように求められる。
nnspec2'=qspec2*iqf2(idwl2) ・・・(22)
で示すように逆量子化し、得られた差分再正規化周波数スペクトルnnspec2'を第2の逆正規化部72に供給する。
nspec2'=nnspec2'*isf2(idwl1) ・・・(23)
で示すように逆正規化し、得られた差分正規化周波数スペクトルnspec2'を加算部73に供給する。ここで、逆正規化係数isf2(idwl1)と量子化情報idwl1との関係は、以下の式(24)、
isf2(idwl1)=1/sf2(idwl1)=f/nstep(idwl1) ・・・(24)
で表される。
nspec'=nspec1'+nspec2' ・・・(25)
で示すように正規化周波数スペクトルnspec1'と差分正規化周波数スペクトルnspec2'とを加算し、得られた正規化周波数スペクトルnspec'を第1の逆正規化部74に供給する。
mdspec'=nspec'*isf1(idsf) ・・・(26)
で示すように逆正規化し、得られた周波数スペクトルmdspec'を周波数時間変換部37に供給する。
上述した第1乃至第3の実施の形態では、音声符号化装置及び音声復号装置の基本的な3種類の構成について説明したが、本実施の形態では、音声符号化装置及び音声復号装置の変形例について説明する。なお、音声符号化装置10及び音声復号装置30と同様の構成については同一符号を付して詳細な説明を省略する。
Claims (16)
- 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第1の量子化手段と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算手段と、
上記正規化情報及び上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第2の正規化手段と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第2の量子化手段と、
上記正規化情報、上記第1の量子化情報、上記第2の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段とを備え、
上記量子化情報計算手段は、上記第1の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第1の量子化情報として配分し、上記所定の制限の超過分を上記第2の量子化情報として配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する
ことを特徴とする音声符号化装置。 - 上記周波数スペクトル又は上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトル、又はこの正規化周波数スペクトルを逆正規化した周波数スペクトルに対して非線形逆変換を施す後処理手段と
をさらに備えることを特徴とする請求項1記載の音声符号化装置。 - 前段における差分周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
上記量子化情報計算手段は、各段の量子化情報に所定の制限を設け、k段目(kは1以上の整数)に配分した量子化情報がk段目の制限を超過する場合に、超過分を(k+1)段目の量子化情報として配分する
ことを特徴とする請求項1記載の音声符号化装置。 - 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化工程と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第1の量子化工程と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算工程と、
上記正規化情報及び上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第2の正規化工程と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第2の量子化工程と、
上記正規化情報、上記第1の量子化情報、上記第2の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
上記量子化情報計算工程では、上記第1の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第1の量子化情報として配分し、上記所定の制限の超過分を上記第2の量子化情報として配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する
ことを特徴とする音声符号化方法。 - 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第1の量子化手段と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算手段と、
上記正規化情報及び上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第2の正規化手段と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第2の量子化手段と、
上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段とを備え、
上記量子化情報計算手段は、上記第1の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第1の量子化情報として配分し、上記所定の制限の超過分を上記第2の量子化情報として配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する
ことを特徴とする音声符号化装置。 - 上記第1の量子化手段では、上記第1の量子化情報に対応して最大量子化誤差が一意に決定され、
上記第2の正規化係数は、上記第1の正規化係数と上記最大量子化誤差の逆数との積により決定される
ことを特徴とする請求項5記載の音声符号化装置。 - 上記正規化情報が1ずつ増減すると、上記総量子化情報で表される量子化ビット数が1ビットずつ増減することを特徴とする請求項5記載の音声符号化装置。
- 上記周波数スペクトル又は上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトル、又はこの正規化周波数スペクトルを逆正規化した周波数スペクトルに対して非線形逆変換を施す後処理手段と
をさらに備えることを特徴とする請求項5記載の音声符号化装置。 - 前段における差分周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
上記量子化情報計算手段は、各段の量子化情報に所定の制限を設け、k段目(kは1以上の整数)に配分した量子化情報がk段目の制限を超過する場合に、超過分を(k+1)段目の量子化情報として配分する
ことを特徴とする請求項5記載の音声符号化装置。 - 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化工程と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第1の量子化工程と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算工程と、
上記正規化情報及び上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第2の正規化工程と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第2の量子化工程と、
上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
上記量子化情報計算工程では、上記第1の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第1の量子化情報として配分し、上記所定の制限の超過分を上記第2の量子化情報として配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する
ことを特徴とする音声符号化方法。 - 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第1の量子化手段と、
上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算手段と、
上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第2の正規化手段と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第2の量子化手段と、
上記正規化情報、上記第1の量子化情報、上記第2の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段とを備え、
上記量子化情報計算手段は、上記第1の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第1の量子化情報として配分し、上記所定の制限の超過分を上記第2の量子化情報として配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する
ことを特徴とする音声符号化装置。 - 上記周波数スペクトル又は上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトル、又はこの正規化周波数スペクトルを逆正規化した周波数スペクトルに対して非線形逆変換を施す後処理手段と
をさらに備えることを特徴とする請求項11記載の音声符号化装置。 - 前段における差分周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
上記量子化情報計算手段は、各段の量子化情報に所定の制限を設け、k段目(kは1以上の整数)に配分した量子化情報がk段目の制限を超過する場合に、超過分を(k+1)段目の量子化情報として配分する
ことを特徴とする請求項11記載の音声符号化装置。 - 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化工程と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第1の量子化工程と、
上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算工程と、
上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第2の正規化工程と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第2の量子化工程と、
上記正規化情報、上記第1の量子化情報、上記第2の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
上記量子化情報計算工程では、上記第1の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第1の量子化情報として配分し、上記所定の制限の超過分を上記第2の量子化情報として配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する
ことを特徴とする音声符号化方法。 - 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号手段と、
上記正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを生成する第1の逆量子化手段と、
上記正規化情報に対応した第1の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化手段と、
上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第2の逆量子化手段と、
上記正規化情報及び上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第2の逆正規化手段と、
上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算手段と、
上記加算手段によって得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換手段とを備え、
上記量子化情報計算手段は、上記第1の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第1の量子化情報として配分し、上記所定の制限の超過分を上記第2の量子化情報として配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する
ことを特徴とする音声復号装置。 - 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号工程と、
上記正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを生成する第1の逆量子化工程と、
上記正規化情報に対応した第1の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化工程と、
上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第2の逆量子化工程と、
上記正規化情報及び上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第2の逆正規化工程と、
上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算工程と、
上記加算工程にて得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換工程とを有し、
上記量子化情報計算工程では、上記第1の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第1の量子化情報として配分し、上記所定の制限の超過分を上記第2の量子化情報として配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する
ことを特徴とする音声復号方法。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005137667A JP4635709B2 (ja) | 2005-05-10 | 2005-05-10 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
| US11/381,791 US8521522B2 (en) | 2005-05-10 | 2006-05-05 | Audio coding/decoding method and apparatus using excess quantization information |
| US14/835,121 USRE46388E1 (en) | 2005-05-10 | 2015-08-25 | Audio coding/decoding method and apparatus using excess quantization information |
| US15/434,964 USRE48272E1 (en) | 2005-05-10 | 2017-02-16 | Audio coding/decoding method and apparatus using excess quantization information |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005137667A JP4635709B2 (ja) | 2005-05-10 | 2005-05-10 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006317549A JP2006317549A (ja) | 2006-11-24 |
| JP4635709B2 true JP4635709B2 (ja) | 2011-02-23 |
Family
ID=37420268
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005137667A Expired - Fee Related JP4635709B2 (ja) | 2005-05-10 | 2005-05-10 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (3) | US8521522B2 (ja) |
| JP (1) | JP4635709B2 (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5098492B2 (ja) * | 2007-07-30 | 2012-12-12 | ソニー株式会社 | 信号処理装置及び信号処理方法、並びにプログラム |
| ES2820537T3 (es) | 2012-07-12 | 2021-04-21 | Nokia Technologies Oy | Cuantificación vectorial |
| KR102547480B1 (ko) * | 2014-12-09 | 2023-06-26 | 돌비 인터네셔널 에이비 | Mdct-도메인 에러 은닉 |
Family Cites Families (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3227945B2 (ja) * | 1993-11-09 | 2001-11-12 | ソニー株式会社 | 符号化装置 |
| JP3227948B2 (ja) * | 1993-11-17 | 2001-11-12 | ソニー株式会社 | 復号化装置 |
| EP0692881B1 (en) * | 1993-11-09 | 2005-06-15 | Sony Corporation | Quantization apparatus, quantization method, high efficiency encoder, high efficiency encoding method, decoder, high efficiency encoder and recording media |
| US20010047256A1 (en) * | 1993-12-07 | 2001-11-29 | Katsuaki Tsurushima | Multi-format recording medium |
| US6904404B1 (en) * | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
| JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
| US5966688A (en) * | 1997-10-28 | 1999-10-12 | Hughes Electronics Corporation | Speech mode based multi-stage vector quantizer |
| KR100304092B1 (ko) * | 1998-03-11 | 2001-09-26 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 |
| US6353808B1 (en) * | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
| JP4055336B2 (ja) * | 2000-07-05 | 2008-03-05 | 日本電気株式会社 | 音声符号化装置及びそれに用いる音声符号化方法 |
| US6757860B2 (en) * | 2000-08-25 | 2004-06-29 | Agere Systems Inc. | Channel error protection implementable across network layers in a communication system |
| JP3636094B2 (ja) * | 2001-05-07 | 2005-04-06 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
| JP4506039B2 (ja) * | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
| JP4622164B2 (ja) * | 2001-06-15 | 2011-02-02 | ソニー株式会社 | 音響信号符号化方法及び装置 |
| WO2003038389A1 (en) * | 2001-11-02 | 2003-05-08 | Matsushita Electric Industrial Co., Ltd. | Encoding device, decoding device and audio data distribution system |
| CN1275222C (zh) * | 2001-12-25 | 2006-09-13 | 株式会社Ntt都科摩 | 信号编码装置和信号编码方法 |
| US20040002859A1 (en) * | 2002-06-26 | 2004-01-01 | Chi-Min Liu | Method and architecture of digital conding for transmitting and packing audio signals |
| US8090577B2 (en) * | 2002-08-08 | 2012-01-03 | Qualcomm Incorported | Bandwidth-adaptive quantization |
| JP3877683B2 (ja) * | 2003-01-23 | 2007-02-07 | 三洋電機株式会社 | 量子化装置及び逆量子化装置、並びにそれらの装置を利用可能なオーディオ及び画像の符号化装置及び復号装置 |
| US7406412B2 (en) * | 2004-04-20 | 2008-07-29 | Dolby Laboratories Licensing Corporation | Reduced computational complexity of bit allocation for perceptual coding |
| JP4609097B2 (ja) * | 2005-02-08 | 2011-01-12 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
-
2005
- 2005-05-10 JP JP2005137667A patent/JP4635709B2/ja not_active Expired - Fee Related
-
2006
- 2006-05-05 US US11/381,791 patent/US8521522B2/en not_active Ceased
-
2015
- 2015-08-25 US US14/835,121 patent/USRE46388E1/en active Active
-
2017
- 2017-02-16 US US15/434,964 patent/USRE48272E1/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| USRE46388E1 (en) | 2017-05-02 |
| JP2006317549A (ja) | 2006-11-24 |
| US8521522B2 (en) | 2013-08-27 |
| USRE48272E1 (en) | 2020-10-20 |
| US20060259298A1 (en) | 2006-11-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2670797C9 (ru) | Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов | |
| JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
| EP3611728A1 (en) | Method and apparatus for high-frequency encoding/decoding for bandwidth extension | |
| KR20110049789A (ko) | 스펙트럼 평활화 장치, 부호화 장치, 복호 장치, 통신 단말 장치, 기지국 장치 및 스펙트럼 평활화 방법 | |
| JP3357829B2 (ja) | 音声符号化/復号化方法 | |
| US20110015933A1 (en) | Signal encoding apparatus, signal decoding apparatus, signal processing system, signal encoding process method, signal decoding process method, and program | |
| US7613609B2 (en) | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto | |
| JP3519859B2 (ja) | 符号器及び復号器 | |
| WO2006054583A1 (ja) | オーディオ信号符号化装置および方法 | |
| KR101143792B1 (ko) | 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법 | |
| JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
| USRE48272E1 (en) | Audio coding/decoding method and apparatus using excess quantization information | |
| JP2006145782A (ja) | オーディオ信号符号化装置および方法 | |
| JP2003110429A (ja) | 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体 | |
| JP5451603B2 (ja) | デジタルオーディオ信号の符号化 | |
| JP4191503B2 (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
| JP4609097B2 (ja) | 音声符号化装置及び方法、並びに音声復号装置及び方法 | |
| JP4024185B2 (ja) | デジタルデータ符号化装置 | |
| JPWO2011086900A1 (ja) | 符号化装置および符号化方法 | |
| JPWO2002103683A1 (ja) | 符号化装置および符号化方法 | |
| JP3454394B2 (ja) | 音声の準可逆符号化装置 | |
| US20200402524A1 (en) | Coding apparatus, coding method, program, and recording medium | |
| JP4822816B2 (ja) | オーディオ信号符号化装置および方法 | |
| JP3050966B2 (ja) | コード励振線形予測符号化装置 | |
| JP2001148632A (ja) | 符号化装置、符号化方法、及びその記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080501 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101014 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101026 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101108 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 3 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 4635709 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |
