JP4609097B2 - 音声符号化装置及び方法、並びに音声復号装置及び方法 - Google Patents
音声符号化装置及び方法、並びに音声復号装置及び方法 Download PDFInfo
- Publication number
- JP4609097B2 JP4609097B2 JP2005032190A JP2005032190A JP4609097B2 JP 4609097 B2 JP4609097 B2 JP 4609097B2 JP 2005032190 A JP2005032190 A JP 2005032190A JP 2005032190 A JP2005032190 A JP 2005032190A JP 4609097 B2 JP4609097 B2 JP 4609097B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- information
- frequency spectrum
- normalization
- quantization information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000013139 quantization Methods 0.000 claims abstract description 473
- 238000001228 spectrum Methods 0.000 claims abstract description 324
- 238000010606 normalization Methods 0.000 claims abstract description 190
- 238000004364 calculation method Methods 0.000 claims abstract description 45
- 238000006243 chemical reaction Methods 0.000 claims description 38
- 230000005236 sound signal Effects 0.000 claims description 18
- 238000012805 post-processing Methods 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 13
- 230000007423 decrease Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims 3
- 230000003595 spectral effect Effects 0.000 abstract 1
- 101000995014 Archaeoglobus fulgidus (strain ATCC 49558 / DSM 4304 / JCM 9628 / NBRC 100126 / VC-16) Iron-sulfur flavoprotein AF_1436 Proteins 0.000 description 13
- 101000995013 Methanocaldococcus jannaschii (strain ATCC 43067 / DSM 2661 / JAL-1 / JCM 10045 / NBRC 100440) Iron-sulfur flavoprotein MJ0731 Proteins 0.000 description 13
- 101001057424 Archaeoglobus fulgidus (strain ATCC 49558 / DSM 4304 / JCM 9628 / NBRC 100126 / VC-16) Iron-sulfur flavoprotein AF_1519 Proteins 0.000 description 9
- 101001057427 Methanocaldococcus jannaschii (strain ATCC 43067 / DSM 2661 / JAL-1 / JCM 10045 / NBRC 100440) Iron-sulfur flavoprotein MJ1083 Proteins 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
先ず、第1の実施の形態における音声符号化装置の概略構成を図1に示す。また、図1に示す音声符号化装置10における符号化処理の手順を図2のフローチャートに示す。以下、図1を参照しながら、図2のフローチャートについて説明する。
nspec1=mdspec1*sf1(idsf) ・・・(1)
で示すように正規化し、得られた正規化周波数スペクトルnspec1を第1の量子化部14に供給する。この処理により、周波数スペクトルmdspec1は、±f∈Rの範囲に正規化される。正規化情報idsfと正規化係数sf1(idsf)との関係は、例えば以下の表1のように表される。
qspec1=(int)(floor(nspec1*qf1(idwl1))+0.5) ・・・(2)
のように求められる。この処理により、正規化周波数スペクトルnspec1は、量子化ステップ幅nstep(idwl1)で表されるステップ数の量子化周波数スペクトルqspec1に量子化される。量子化情報idwl1と量子化ステップ幅nstep(idwl1)及び量子化係数qf1(idwl1)との関係は、例えば以下の表2のように表される。
nspec1'=qspec1*iqf1(idwl1) ・・・(3)
で示すように逆量子化し、得られた正規化周波数スペクトルnspec1'を逆正規化部16に供給する。ここで、量子化係数qf1(idwl1)と逆量子化係数iqf1(idwl1)との関係は、以下の式(4)、
iqf1(idwl1)=1/qf1(idwl1) ・・・(4)
で表される。
mdspec1'=nspec1'*isf1(idsf) ・・・(5)
で示すように逆正規化し、得られた周波数スペクトルmdspec1'を減算部17に供給する。ここで、正規化係数sf1(idsf)と逆正規化係数isf1(idsf)との関係は、以下の式(6)、
isf1(idsf)=1/sf1(idsf) ・・・(6)
で表される。
mdspec2=mdspec1−mdspec1' ・・・(7)
で示すように周波数スペクトルmdspec1から周波数スペクトルmdspec1'を減算し、得られた差分周波数スペクトルmdspec2を第2の正規化部18に供給する。
nspec2=mdspec2*sf2
=(mdspec1−mdspec1')*sf2
=((nspec1−nspec1')*isf1(idsf))*sf2 ・・・(8)
で示すように正規化し、得られた差分正規化周波数スペクトルnspec2を第2の量子化部19に供給する。
sf2(idsf,idwl1)=sf1(idsf)*nstep(idwl1)/f ・・・(9)
で示すように算出することができる。すなわち、正規化情報idsfと量子化情報idwl1とに基づいて正規化係数sf2(idsf,idwl1)を算出することができる。
sf2(idsf,idwl1)=sf1(idsf)*((nstep(idwl1)+1)*0.5)/f ・・・(10)
で示すように算出することができる。
qspec2=(int)(floor(nspec2*qf2(idwl2))+0.5) ・・・(11)
のように求められる。なお、量子化情報idwl2と量子化係数qf2(idwl2)との関係は、上述した表2と同様であってもよく、異なっていてもよい。
nspec1'=qspec1*iqf1(idwl1) ・・・(12)
で示すように逆量子化し、得られた正規化周波数スペクトルnspec1'を第1の逆正規化部34に供給する。ここで、量子化係数qf1(idwl1)と逆量子化係数iqf1(idwl1)との関係は、上述した式(4)で表される。
mdspec1'=nspec1'*isf1(idsf) ・・・(13)
で示すように逆正規化し、得られた周波数スペクトルmdspec1'を加算部37に供給する。ここで、正規化係数sf1(idsf)と逆正規化係数isf1(idsf)との関係は、上述した式(6)で表される。
nspec2'=qspec2*iqf2(idwl2) ・・・(14)
で示すように逆量子化し、得られた差分正規化周波数スペクトルnspec2'を第2の逆正規化部36に供給する。ここで、量子化係数qf2(idwl2)と逆量子化係数iqf2(idwl2)との関係は、以下の式(15)、
iqf2(idwl2)=1/qf2(idwl2) ・・・(15)
で表される。
mdspec2'=nspec2'*isf2(idsf,idwl1) ・・・(16)
で示すように逆正規化し、得られた差分周波数スペクトルmdspec2'を加算部37に供給する。ここで、逆正規化係数isf2(idsf,idwl1)と正規化情報idsf及び量子化情報idwl1との関係は、以下の式(17)、
isf2(idsf,idwl1)=1/sf2(idsf,idwl1)=isf1(idsf)*f/nstep(idwl1) ・・・(17)
で表される。なお、ステップS26及びステップS27の処理は、ステップS24及びステップS25の処理よりも前に行ってもよく、並列に行ってもよい。
mdspec'=mdspec1'+mdspec2' ・・・(18)
で示すように周波数スペクトルmdspec1'と差分周波数スペクトルmdspec2'とを加算し、得られた周波数スペクトルmdspec'を周波数時間変換部38に供給する。
次に、第2の実施の形態として図7に示す音声符号化装置40は、基本構造を図1に示した音声符号化装置10と同様とするが、周波数スペクトルmdspec1と周波数スペクトルmdspec1'との差分に対して2段目の正規化・量子化を行うのではなく、正規化周波数スペクトルnspec1と正規化周波数スペクトルnspec1'との差分に対して2段目の正規化・量子化を行う点に特徴を有している。したがって、先に図1に示した音声符号化装置10と同様の構成については同一符号を付して詳細な説明を省略する。
nspec2=nspec1−nspec1' ・・・(19)
で示すように正規化周波数スペクトルnspec1から正規化周波数スペクトルnspec1'を減算し、得られた差分正規化周波数スペクトルnspec2を第2の正規化部42に供給する。
nnspec2=nspec2*sf2
=(nspec1−nspec1')*sf2 ・・・(20)
で示すように正規化し、得られた差分再正規化周波数スペクトルnnspec2を第2の量子化部43に供給する。
sf2(idwl1)=nstep(idwl1)/f ・・・(21)
で示すように算出することができる。すなわち、量子化情報idwl1に基づいて正規化係数sf2(idwl1)を算出することができる。
qspec2=(int)(floor(nnspec2*qf2(idwl2))+0.5) ・・・(22)
のように求められる。
nnspec2'=qspec2*iqf2(idwl2) ・・・(23)
で示すように逆量子化し、得られた差分再正規化周波数スペクトルnnspec2'を第2の逆正規化部52に供給する。
nspec2'=nnspec2'*isf2(idwl1) ・・・(24)
で示すように逆正規化し、得られた差分正規化周波数スペクトルnspec2'を加算部53に供給する。ここで、逆正規化係数isf2(idwl1)と量子化情報idwl1との関係は、以下の式(25)、
isf2(idwl1)=1/sf2(idwl1)=f/nstep(idwl1) ・・・(25)
で表される。
nspec'=nspec1'+nspec2' ・・・(26)
で示すように正規化周波数スペクトルnspec1'と差分正規化周波数スペクトルnspec2'とを加算し、得られた正規化周波数スペクトルnspec'を第1の逆正規化部54に供給する。
mdspec'=nspec'*isf1(idsf) ・・・(27)
で示すように逆正規化し、得られた周波数スペクトルmdspec'を周波数時間変換部38に供給する。
上述した第1,第2の実施の形態では、音声符号化装置及び音声復号装置の基本的な2種類の構成について説明したが、本実施の形態では、音声符号化装置及び音声復号装置の変形例について説明する。なお、音声符号化装置10及び音声復号装置30と同様の構成については同一符号を付して詳細な説明を省略する。
Claims (22)
- 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化手段と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算手段と、
上記正規化情報及び上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第2の正規化手段と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化手段と、
上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段とを備え、
上記量子化情報計算手段は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
音声符号化装置。 - 上記第1の量子化手段では、上記第1の量子化情報に対応して最大量子化誤差が一意に決定され、
上記第2の正規化係数は、上記第1の正規化係数と上記最大量子化誤差の逆数との積により決定される
請求項1記載の音声符号化装置。 - 上記量子化情報計算手段は、上記正規化情報に基づいて量子化ビット数を表す量子化情報を生成し、該量子化情報を配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する請求項1記載の音声符号化装置。
- 上記正規化情報が1ずつ増減すると、上記量子化情報で表される量子化ビット数が1ビットずつ増減する請求項3記載の音声符号化装置。
- 上記量子化情報計算手段は、上記量子化情報を所定の割合で配分し、上記第1の量子化情報及び上記第2の量子化情報を生成する請求項3記載の音声符号化装置。
- 上記量子化情報計算手段は、上記第1の量子化情報及び上記第2の量子化情報のいずれか一方を固定値として上記量子化情報を配分し、上記第1の量子化情報及び上記第2の量子化情報を生成する請求項3記載の音声符号化装置。
- 上記周波数スペクトル又は上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトル、又はこの正規化周波数スペクトルを逆正規化した周波数スペクトルに対して非線形逆変換を施す後処理手段と
をさらに備える請求項1記載の音声符号化装置。 - 前段における差分周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
k段目(kは2以上の整数)における正規化係数は、上記正規化情報及びk−1段目の量子化情報に基づいて求められる
請求項1記載の音声符号化装置。 - 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化工程と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化工程と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算工程と、
上記正規化情報及び上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第2の正規化工程と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化工程と、
上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
上記量子化情報計算工程では、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
音声符号化方法。 - 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号手段と、
上記正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを出力する第1の逆量子化手段と、
上記正規化情報に対応した第1の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化手段と、
上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第2の逆量子化手段と、
上記正規化情報及び上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第2の逆正規化手段と、
上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算手段と、
上記加算手段によって得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換手段とを備え、
上記量子化情報計算手段は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
音声復号装置。 - 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号工程と、
上記正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを出力する第1の逆量子化工程と、
上記正規化情報に対応した第1の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化工程と、
上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第2の逆量子化工程と、
上記正規化情報及び上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第2の逆正規化工程と、
上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算工程と、
上記加算工程にて得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換工程とを有し、
上記量子化情報計算工程では、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
音声復号方法。 - 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化手段と、
上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算手段と、
上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第2の正規化手段と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化手段と、
上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段ととを備え、
上記量子化情報計算手段は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
音声符号化装置。 - 上記第1の量子化手段では、上記第1の量子化情報に対応して最大量子化誤差が一意に決定され、
上記第2の正規化係数は、上記最大量子化誤差の逆数により決定される
請求項12記載の音声符号化装置。 - 上記量子化情報計算手段は、上記正規化情報に基づいて量子化ビット数を表す量子化情報を生成し、該量子化情報を配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成する請求項12記載の音声符号化装置。
- 上記正規化情報が1ずつ増減すると、上記量子化情報で表される量子化ビット数が1ビットずつ増減する請求項14記載の音声符号化装置。
- 上記量子化情報計算手段は、上記量子化情報を所定の割合で配分し、上記第1の量子化情報及び上記第2の量子化情報を生成する請求項14記載の音声符号化装置。
- 上記量子化情報計算手段は、上記第1の量子化情報及び上記第2の量子化情報のいずれか一方を固定値として上記量子化情報を配分し、上記第1の量子化情報及び上記第2の量子化情報を生成する請求項14記載の音声符号化装置。
- 上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルに対して非線形逆変換を施す後処理手段と
をさらに備える請求項12記載の音声符号化装置。 - 前段における差分正規化周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
k段目(kは2以上の整数)における正規化係数は、k−1段目の量子化情報に基づいて求められる
請求項12記載の音声符号化装置。 - 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化工程と、
上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化工程と、
上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算工程と、
上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第2の正規化工程と、
上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化工程と、
上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
上記量子化情報計算工程では、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
音声符号化方法。 - 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号手段と、
上記正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを出力する第1の逆量子化手段と、
上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分再正規化周波数スペクトルを生成する第2の逆量子化手段と、
上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分再正規化周波数スペクトルを逆正規化し、差分正規化周波数スペクトルを生成する第2の逆正規化手段と、
上記正規化周波数スペクトルと上記差分正規化周波数スペクトルとを加算する加算手段と、
上記正規化情報に対応した第1の逆正規化係数を用いて上記加算手段によって得られた正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化手段と、
上記周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換手段とを備え、
上記量子化情報計算手段は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
音声復号装置。 - 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号工程と、
上記正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを出力する第1の逆量子化工程と、
上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分再正規化周波数スペクトルを生成する第2の逆量子化工程と、
上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分再正規化周波数スペクトルを逆正規化し、差分正規化周波数スペクトルを生成する第2の逆正規化工程と、
上記正規化周波数スペクトルと上記差分正規化周波数スペクトルとを加算する加算工程と、
上記正規化情報に対応した第1の逆正規化係数を用いて上記加算工程にて得られた正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化工程と、
上記周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換工程とを有し、
上記量子化情報計算工程では、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
音声復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005032190A JP4609097B2 (ja) | 2005-02-08 | 2005-02-08 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005032190A JP4609097B2 (ja) | 2005-02-08 | 2005-02-08 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006220767A JP2006220767A (ja) | 2006-08-24 |
JP4609097B2 true JP4609097B2 (ja) | 2011-01-12 |
Family
ID=36983153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005032190A Expired - Fee Related JP4609097B2 (ja) | 2005-02-08 | 2005-02-08 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4609097B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4635709B2 (ja) * | 2005-05-10 | 2011-02-23 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1020898A (ja) * | 1996-07-01 | 1998-01-23 | Matsushita Electric Ind Co Ltd | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
JP3227945B2 (ja) * | 1993-11-09 | 2001-11-12 | ソニー株式会社 | 符号化装置 |
JP3227948B2 (ja) * | 1993-11-17 | 2001-11-12 | ソニー株式会社 | 復号化装置 |
JP2002023799A (ja) * | 2000-07-05 | 2002-01-25 | Nec Corp | 音声符号化装置及びそれに用いる心理聴覚分析方法 |
JP2002141810A (ja) * | 2000-08-25 | 2002-05-17 | Agere Systems Guardian Corp | 通信システムのネットワーク層を横断して実現可能なチャネル誤り保護 |
JP2002372995A (ja) * | 2001-06-15 | 2002-12-26 | Sony Corp | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
JP2004226742A (ja) * | 2003-01-23 | 2004-08-12 | Sanyo Electric Co Ltd | 量子化装置及び逆量子化装置、並びにそれらの装置を利用可能なオーディオ及び画像の符号化装置及び復号装置 |
-
2005
- 2005-02-08 JP JP2005032190A patent/JP4609097B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3227945B2 (ja) * | 1993-11-09 | 2001-11-12 | ソニー株式会社 | 符号化装置 |
JP3227948B2 (ja) * | 1993-11-17 | 2001-11-12 | ソニー株式会社 | 復号化装置 |
JPH1020898A (ja) * | 1996-07-01 | 1998-01-23 | Matsushita Electric Ind Co Ltd | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
JP2002023799A (ja) * | 2000-07-05 | 2002-01-25 | Nec Corp | 音声符号化装置及びそれに用いる心理聴覚分析方法 |
JP2002141810A (ja) * | 2000-08-25 | 2002-05-17 | Agere Systems Guardian Corp | 通信システムのネットワーク層を横断して実現可能なチャネル誤り保護 |
JP2002372995A (ja) * | 2001-06-15 | 2002-12-26 | Sony Corp | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
JP2004226742A (ja) * | 2003-01-23 | 2004-08-12 | Sanyo Electric Co Ltd | 量子化装置及び逆量子化装置、並びにそれらの装置を利用可能なオーディオ及び画像の符号化装置及び復号装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006220767A (ja) | 2006-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2830062B1 (en) | Method and apparatus for high-frequency encoding/decoding for bandwidth extension | |
JP5343098B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
CN106941003B (zh) | 能量无损编码方法和设备以及能量无损解码方法和设备 | |
CN109313908B (zh) | 用于对音频信号进行编码的音频编码器以及方法 | |
MXPA05006664A (es) | Metodo y dispositivo para la cuantizacion robusta de vector predictivo de parametros de prediccion lineal en la codificacion de conversacion a velocidad variable de bits. | |
KR101143792B1 (ko) | 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법 | |
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
WO2011086923A1 (ja) | 符号化装置、復号装置、スペクトル変動量算出方法及びスペクトル振幅調整方法 | |
US7613609B2 (en) | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto | |
CN111710342B (zh) | 编码装置、解码装置、编码方法、解码方法及程序 | |
JP5544370B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP4843142B2 (ja) | 音声符号化のための利得−適応性量子化及び不均一符号長の使用 | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
USRE48272E1 (en) | Audio coding/decoding method and apparatus using excess quantization information | |
JPH11184498A (ja) | 音声符号化/復号化方法 | |
JP4609097B2 (ja) | 音声符号化装置及び方法、並びに音声復号装置及び方法 | |
JP4191503B2 (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
JP5451603B2 (ja) | デジタルオーディオ信号の符号化 | |
JP4024185B2 (ja) | デジタルデータ符号化装置 | |
JP4574320B2 (ja) | 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 | |
JPWO2011086900A1 (ja) | 符号化装置および符号化方法 | |
JP4721355B2 (ja) | 符号化データの符号化則変換方法および装置 | |
JP3137550B2 (ja) | 音声符号化・復号化装置 | |
JP2005004119A (ja) | 音響信号符号化装置及び音響信号復号化装置 | |
Bachu et al. | A Comparison of LBG and ADPCM Speech Compression Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100914 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100927 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131022 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4609097 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131022 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |