JP4609097B2 - 音声符号化装置及び方法、並びに音声復号装置及び方法 - Google Patents

音声符号化装置及び方法、並びに音声復号装置及び方法 Download PDF

Info

Publication number
JP4609097B2
JP4609097B2 JP2005032190A JP2005032190A JP4609097B2 JP 4609097 B2 JP4609097 B2 JP 4609097B2 JP 2005032190 A JP2005032190 A JP 2005032190A JP 2005032190 A JP2005032190 A JP 2005032190A JP 4609097 B2 JP4609097 B2 JP 4609097B2
Authority
JP
Japan
Prior art keywords
quantization
information
frequency spectrum
normalization
quantization information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005032190A
Other languages
English (en)
Other versions
JP2006220767A (ja
Inventor
祐樹 松村
志朗 鈴木
恵祐 東山
光行 畠中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005032190A priority Critical patent/JP4609097B2/ja
Publication of JP2006220767A publication Critical patent/JP2006220767A/ja
Application granted granted Critical
Publication of JP4609097B2 publication Critical patent/JP4609097B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、いわゆる変換符号化によって入力音声信号を符号化し、得られた符号列を伝送し、又は記録媒体に記録する音声符号化装置及びその方法、並びに伝送され、又は記録媒体から読み出した符号列を復号して出力音声信号を得る音声復号装置及びその方法に関する。
従来、音声符号化装置において、入力音声信号を時間周波数変換して得られた周波数スペクトルに対して正規化・量子化を行い、量子化誤差である差分周波数スペクトルに対して再度、正規化・量子化を行う方法が知られている(特許文献1,2を参照)。これにより、音声符号化装置の量子化精度を向上させることができ、また、音声復号装置の性能や使用環境に応じたスケーラビリティを実現することができる。
しかしながら、このように正規化・量子化を多段化する場合には、周波数スペクトル情報以外のサイド情報、例えば正規化情報や量子化情報の占有率が段数に応じて増加し、周波数スペクトル情報の符号化効率が低下するという問題があった。そこで、上記特許文献1,2では、2段の正規化・量子化を行う場合において、2種類の正規化係数のうち1段目の正規化係数のみを符号列に含め、音声復号装置では2段目の正規化係数を1段目の正規化係数に基づいて算出するようにしている。
特許3227945号公報 特許3227948号公報
上述のように、特許文献1,2記載の技術によれば、2段目の正規化係数の情報を削減することにより生じた余剰ビットを周波数スペクトル情報の符号化に流用することで、周波数スペクトル情報の符号化効率を向上させることができるが、固定ビット数で量子化を行わない場合には量子化情報を符号列に含めなければならないため、サイド情報が効果的に削減されているとは言い難かった。その一方で、サイド情報の占有率を上述よりもさらに削減し、周波数スペクトル情報の符号化効率を向上させる技術が望まれていた。
本発明は、このような従来の実情に鑑みて提案されたものであり、多段の正規化・量子化を行って入力音声信号を符号化する際に、周波数スペクトル情報以外のサイド情報の占有率を効果的に削減することが可能な音声符号化装置及びその方法、並びにその音声符号化装置によって得られた符号列を復号して出力音声信号を得る音声復号装置及びその方法を提供することを目的とする。
上述した目的を達成するために、本発明に係る音声符号化装置及びその方法は、入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段(工程)と、所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段(工程)と、上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段(工程)と、上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化手段(工程)と、上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算手段(工程)と、上記正規化情報及び上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第2の正規化手段(工程)と、上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化手段(工程)と、上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段(工程)とを有し、上記量子化情報計算手段(工程で)は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
また、上述した目的を達成するために、本発明に係る音声復号装置及びその方法は、入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号手段(工程)と、上記正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段(工程)と、上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを出力する第1の逆量子化手段(工程)と、上記正規化情報に対応した第1の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化手段(工程)と、上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第2の逆量子化手段(工程)と、上記正規化情報及び上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第2の逆正規化手段(工程)と、上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算手段(工程)と、上記加算手段(工程)によって得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換手段(工程)とを有し、上記量子化情報計算手段(工程で)は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
このような音声符号化装置及びその方法、並びに音声復号装置及びその方法では、入力音声信号を時間周波数変換して得られた周波数スペクトルに対して例えば2段の正規化・量子化を行って符号化する際に、各段の量子化ビット数を表す第1の量子化情報及び第2の量子化情報を所定の正規化情報に基づいて生成し、2段目の正規化で用いる第2の正規化係数を正規化情報及び第1の量子化情報に基づいて生成する。また、符号化側で得られた符号列を復号する際に、各段の量子化ビット数を表す第1の量子化情報及び第2の量子化情報を所定の正規化情報に基づいて生成し、2段目の逆正規化で用いる第2の逆正規化係数を正規化情報及び第1の量子化情報に基づいて生成する。
また、上述した目的を達成するために、本発明に係る音声符号化装置及びその方法は、入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段(工程)と、所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段(工程)と、上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段(工程)と、上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化手段(工程)と、上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算手段(工程)と、上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第2の正規化手段(工程)と、上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化手段(工程)と、上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段(工程)とを有し、上記量子化情報計算手段(工程で)は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
また、上述した目的を達成するために、本発明に係る音声符号化装置及びその方法は、入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段(工程)と、所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段(工程)と、上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段(工程)と、上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第1の量子化手段(工程)と、上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算手段(工程)と、上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第2の正規化手段(工程)と、上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第2の量子化手段(工程)と、上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段(工程)とを有し、上記量子化情報計算手段(工程で)は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
このような音声符号化装置及びその方法、並びに音声復号装置及びその方法では、入力音声信号を時間周波数変換して得られた周波数スペクトルに対して例えば2段の正規化・量子化を行って符号化する際に、各段の量子化ビット数を表す第1の量子化情報及び第2の量子化情報を所定の正規化情報に基づいて生成し、2段目の正規化で用いる第2の正規化係数を第1の量子化情報に基づいて生成する。また、符号化側で得られた符号列を復号する際に、各段の量子化ビット数を表す第1の量子化情報及び第2の量子化情報を所定の正規化情報に基づいて生成し、2段目の逆正規化で用いる第2の逆正規化係数を第1の量子化情報に基づいて生成する。
本発明に係る音声符号化装置及びその方法、並びに音声復号装置及びその方法によれば、正規化情報に基づいて第1の量子化情報及び第2の量子化情報を一意に決定し、また、第1の量子化情報、又は正規化情報及び第1の量子化情報に基づいて2段目の正規化で用いる第2の正規化係数や2段目の逆正規化で用いる第2の逆正規化係数を算出するため、符号列にはサイド情報として正規化情報を含めるのみでよい。さらに、サイド情報の削減によって生じた余剰ビットを量子化周波数スペクトル及び差分量子化周波数スペクトルの符号化に流用することで、量子化周波数スペクトル及び差分量子化周波数スペクトルの符号化効率を向上させることができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、入力音声信号を時間周波数変換して得られた周波数スペクトルに対して2段の正規化・量子化を行って符号化する音声符号化装置及びその方法、並びにその符号列を復号して出力音声信号を得る音声復号装置及びその方法に適用したものである。
(第1の実施の形態)
先ず、第1の実施の形態における音声符号化装置の概略構成を図1に示す。また、図1に示す音声符号化装置10における符号化処理の手順を図2のフローチャートに示す。以下、図1を参照しながら、図2のフローチャートについて説明する。
図2のステップS1において、時間周波数変換部11は、音声信号(PCM(Pulse Code Modulation)データ等)を所定単位時間(フレーム)毎に入力し、ステップS2において、この入力音声信号を時間周波数変換し、周波数スペクトルmdspec1を生成する。例えば、時間周波数変換として変形離散コサイン変換(Modified Discrete Cosine Transform;MDCT)を用いる場合、Nサンプルの音声信号は、N/2サンプルのMDCT係数に変換される。時間周波数変換部11は、周波数スペクトルmdspec1を第1の正規化部13及び減算部17に供給すると共に、正規化情報idsfを量子化情報計算部12に供給する。
次にステップS3において、量子化情報計算部12は、正規化情報idsfに基づいて、周波数スペクトルmdspec1を量子化する際の量子化ビット数を表す量子化情報idwl1と後述する2段目の量子化における量子化ビット数を表す量子化情報idwl2とを一意に決定する。なお、量子化情報計算部12において正規化情報idsfに基づいて量子化情報idwl1,idwl2を一意に決定する処理の詳細については後述する。
続いてステップS4において、第1の正規化部13は、正規化情報idsfに対応した正規化係数sf1(idsf)を用いて周波数スペクトルmdspec1を以下の式(1)、
nspec1=mdspec1*sf1(idsf) ・・・(1)
で示すように正規化し、得られた正規化周波数スペクトルnspec1を第1の量子化部14に供給する。この処理により、周波数スペクトルmdspec1は、±f∈Rの範囲に正規化される。正規化情報idsfと正規化係数sf1(idsf)との関係は、例えば以下の表1のように表される。
Figure 0004609097
続いてステップS5において、第1の量子化部14は、量子化情報idwl1に対応した量子化係数qf1(idwl1)を用いて正規化周波数スペクトルnspec1を量子化し、得られた量子化周波数スペクトルqspec1を逆量子化部15及び符号列符号化部20に供給する。例えば、図3に示すような線形量子化を行う場合、量子化周波数スペクトルqspec1は以下の式(2)、
qspec1=(int)(floor(nspec1*qf1(idwl1))+0.5) ・・・(2)
のように求められる。この処理により、正規化周波数スペクトルnspec1は、量子化ステップ幅nstep(idwl1)で表されるステップ数の量子化周波数スペクトルqspec1に量子化される。量子化情報idwl1と量子化ステップ幅nstep(idwl1)及び量子化係数qf1(idwl1)との関係は、例えば以下の表2のように表される。
Figure 0004609097
続いてステップS6において、逆量子化部15は、量子化情報idwl1に対応した逆量子化係数iqf1(idwl1)を用いて量子化周波数スペクトルqspec1を以下の式(3)、
nspec1'=qspec1*iqf1(idwl1) ・・・(3)
で示すように逆量子化し、得られた正規化周波数スペクトルnspec1'を逆正規化部16に供給する。ここで、量子化係数qf1(idwl1)と逆量子化係数iqf1(idwl1)との関係は、以下の式(4)、
iqf1(idwl1)=1/qf1(idwl1) ・・・(4)
で表される。
続いてステップS7において、逆正規化部16は、正規化情報idsfに対応した逆正規化係数isf1(idsf)を用いて正規化周波数スペクトルnspec1'を以下の式(5)、
mdspec1'=nspec1'*isf1(idsf) ・・・(5)
で示すように逆正規化し、得られた周波数スペクトルmdspec1'を減算部17に供給する。ここで、正規化係数sf1(idsf)と逆正規化係数isf1(idsf)との関係は、以下の式(6)、
isf1(idsf)=1/sf1(idsf) ・・・(6)
で表される。
続いてステップS8において、減算部17は、以下の式(7)、
mdspec2=mdspec1−mdspec1' ・・・(7)
で示すように周波数スペクトルmdspec1から周波数スペクトルmdspec1'を減算し、得られた差分周波数スペクトルmdspec2を第2の正規化部18に供給する。
続いてステップS9において、第2の正規化部18は、正規化係数sf2を用いて周波数スペクトルmdspec2を以下の式(8)、
nspec2=mdspec2*sf2
=(mdspec1−mdspec1')*sf2
=((nspec1−nspec1')*isf1(idsf))*sf2 ・・・(8)
で示すように正規化し、得られた差分正規化周波数スペクトルnspec2を第2の量子化部19に供給する。
ここで、正規化周波数スペクトルnspec1は、正規化情報idsfに対応した正規化係数sf1(idsf)により±f∈Rの範囲に正規化されているため、例えば図3に示すように、量子化情報idwl1に対応して量子化ステップ幅nstep(idwl1)が一意に決定されるような線形量子化を行う場合には、量子化前後での正規化周波数スペクトルnspec1、nspec1'の差分は最大量子化誤差である±f/nstep(idwl1)の範囲となる。したがって、正規化係数sf2は、以下の式(9)、
sf2(idsf,idwl1)=sf1(idsf)*nstep(idwl1)/f ・・・(9)
で示すように算出することができる。すなわち、正規化情報idsfと量子化情報idwl1とに基づいて正規化係数sf2(idsf,idwl1)を算出することができる。
なお、正規化係数sf2(idsf,idwl1)を算出する式は、第1の量子化部14における量子化器の構造に依存する。例えば、図4に示すような線形量子化を行う場合には、量子化前後での正規化周波数スペクトルnspec1、nspec1'の差分は±f/((nstep(idwl1)+1)*0.5)の範囲となる。したがって、正規化係数sf2は、以下の式(10)、
sf2(idsf,idwl1)=sf1(idsf)*((nstep(idwl1)+1)*0.5)/f ・・・(10)
で示すように算出することができる。
続いてステップS10において、第2の量子化部19は、量子化情報idwl2に対応した量子化係数qf2(idwl2)を用いて差分正規化周波数スペクトルnspec2を量子化し、得られた差分量子化周波数スペクトルqspec2を符号列符号化部20に供給する。例えば、図3に示すような線形量子化を行う場合、差分量子化周波数スペクトルqspec2は以下の式(11)、
qspec2=(int)(floor(nspec2*qf2(idwl2))+0.5) ・・・(11)
のように求められる。なお、量子化情報idwl2と量子化係数qf2(idwl2)との関係は、上述した表2と同様であってもよく、異なっていてもよい。
続いてステップS11において、符号列符号化部20は、量子化周波数スペクトルqspec1、差分量子化周波数スペクトルqspec2、及び正規化情報idsfを符号化し、ステップS12において、得られた符号列を出力する。
続いてステップS13において、入力音声信号が終了したか否かを判別し、終了していない場合にはステップS1に戻り、入力音声信号が終了している場合には符号化処理を終了する。
次に、この音声符号化装置10に対応する音声復号装置の概略構成を図5に示す。また、図5に示す音声復号装置30における復号処理の手順を図6のフローチャートに示す。以下、図5を参照しながら、図6のフローチャートについて説明する。
図6のステップS21において、符号列復号部31は、符号列を入力し、ステップS22において、この入力符号列を復号して量子化周波数スペクトルqspec1、差分量子化周波数スペクトルqspec2、及び正規化情報idsfを生成する。符号列復号部31は、正規化情報idsfを量子化情報計算部32に供給し、量子化周波数スペクトルqspec1を第1の逆量子化部33に供給し、差分量子化周波数スペクトルqspec2を第2の逆量子化部35に供給する。
次にステップS23において、量子化情報計算部32は、正規化情報idsfに基づいて、量子化周波数スペクトルqspec1の逆量子化に用いる量子化情報idwl1と差分量子化周波数スペクトルqspec2の逆量子化に用いる量子化情報idwl2とを一意に決定する。なお、量子化情報計算部32において正規化情報idsfに基づいて量子化情報idwl1,idwl2を一意に決定する処理の詳細については後述する。
続いてステップS24において、第1の逆量子化部33は、量子化情報idwl1に対応した逆量子化係数iqf1(idwl1)を用いて量子化周波数スペクトルqspec1を以下の式(12)、
nspec1'=qspec1*iqf1(idwl1) ・・・(12)
で示すように逆量子化し、得られた正規化周波数スペクトルnspec1'を第1の逆正規化部34に供給する。ここで、量子化係数qf1(idwl1)と逆量子化係数iqf1(idwl1)との関係は、上述した式(4)で表される。
続いてステップS25において、第1の逆正規化部34は、正規化情報idsfに対応した逆正規化係数isf1(idsf)を用いて正規化周波数スペクトルnspec1'を以下の式(13)、
mdspec1'=nspec1'*isf1(idsf) ・・・(13)
で示すように逆正規化し、得られた周波数スペクトルmdspec1'を加算部37に供給する。ここで、正規化係数sf1(idsf)と逆正規化係数isf1(idsf)との関係は、上述した式(6)で表される。
続いてステップS26において、第2の逆量子化部35は、量子化情報idwl2に対応した逆量子化係数iqf2(idwl2)を用いて差分量子化周波数スペクトルqspec2を以下の式(14)、
nspec2'=qspec2*iqf2(idwl2) ・・・(14)
で示すように逆量子化し、得られた差分正規化周波数スペクトルnspec2'を第2の逆正規化部36に供給する。ここで、量子化係数qf2(idwl2)と逆量子化係数iqf2(idwl2)との関係は、以下の式(15)、
iqf2(idwl2)=1/qf2(idwl2) ・・・(15)
で表される。
続いてステップS27において、第2の逆正規化部36は、正規化情報idsf及び量子化情報idwl1に対応した逆正規化係数isf2(idsf,idwl1)を用いて差分正規化周波数スペクトルnspec2'を以下の式(16)、
mdspec2'=nspec2'*isf2(idsf,idwl1) ・・・(16)
で示すように逆正規化し、得られた差分周波数スペクトルmdspec2'を加算部37に供給する。ここで、逆正規化係数isf2(idsf,idwl1)と正規化情報idsf及び量子化情報idwl1との関係は、以下の式(17)、
isf2(idsf,idwl1)=1/sf2(idsf,idwl1)=isf1(idsf)*f/nstep(idwl1) ・・・(17)
で表される。なお、ステップS26及びステップS27の処理は、ステップS24及びステップS25の処理よりも前に行ってもよく、並列に行ってもよい。
続いてステップS28において、加算部37は、以下の式(18)、
mdspec'=mdspec1'+mdspec2' ・・・(18)
で示すように周波数スペクトルmdspec1'と差分周波数スペクトルmdspec2'とを加算し、得られた周波数スペクトルmdspec'を周波数時間変換部38に供給する。
続いてステップS29において、周波数時間変換部38は、周波数スペクトルmdspec'を周波数時間変換して音声信号を生成し、ステップS30において、この音声信号を出力する。例えば、周波数時間変換として逆変形離散コサイン変換(Inverse MDCT;IMDCT)を用いる場合、N/2サンプルのMDCT係数は、Nサンプルの音声信号に変換される。
続いてステップS31において、入力符号列が終了したか否かを判別し、終了していない場合にはステップS21に戻り、入力符号列が終了している場合には復号処理を終了する。
以上のように、本実施の形態における音声符号化装置10及び音声復号装置30によれば、正規化情報idsfに基づいて量子化情報idwl1,idwl2を一意に決定し、また、正規化情報idsfと量子化情報idwl1とに基づいて正規化係数sf2(idsf,idwl1)を算出するため、符号列にはサイド情報として正規化情報idsfを含めるのみでよい。さらに、サイド情報の削減によって生じた余剰ビットを量子化周波数スペクトルqspec1及び差分量子化周波数スペクトルqspec2の符号化に流用することで、量子化周波数スペクトルqspec1及び差分量子化周波数スペクトルqspec2の符号化効率を向上させることができる。
ここで、量子化情報計算部12,32において正規化情報idsfに基づいて量子化情報idwl1,idwl2を一意に決定する処理について詳細に説明する。
量子化情報計算部12,32は、正規化情報idsf及び所定の変数Aから、量子化情報idwlを以下の表3に示すように一意に決定する。
Figure 0004609097
この表3から分かるように、正規化情報idsfが1つ小さくなると量子化情報idwlも1つ小さくなる。これは、正規化情報idsfがXであり量子化情報がBである場合の絶対SNR(Signal to Noise Ratio)をSNRabsとしたとき、正規化情報idsfがX−1である場合に同等のSNRabsを得るには略々B−1の量子化情報で示される量子化ビット数が必要となり、また正規化情報idsfがX−2である場合には同様に略々B−2の量子化情報で示される量子化ビット数が必要となることに着目したものである。
上述した変数Aとは、最大の正規化情報idsfに対して割り当てられる最大量子化情報を示しており、この値は付加情報として符号列に含められる。なお、この変数Aとしては先ず規格上とり得る最大の量子化ビット数を設定し、符号化の結果、総使用ビット数が総使用可能ビット数を上回る場合には、順次繰り下げられる。
この変数Aの値が17ビットである場合において、正規化情報idsfと量子化情報idwlとの関係を示すテーブルの一例を以下の表4に示す。この表4において丸で囲まれている数字は、スペクトル毎に決定された量子化情報idwlを表すものとする。
Figure 0004609097
表4に示すように、正規化情報idsfが最大の31である場合には量子化情報idwlは最大の17となり、例えば正規化情報idsfが最大の正規化情報idsfより2だけ小さい29である場合には量子化情報idwlは15となる。なお、該当する正規化情報idsfが最大の正規化情報idsfよりも17以上小さい場合には量子化ビット数がマイナスになってしまうが、その場合は0ビットと下限を設けることとする。
量子化情報計算部12,32は、このようにして求められたスペクトル毎の量子化情報idwlに基づいて量子化情報idwl1,idwl2を決定する。具体的には、量子化情報idwl、すなわちスペクトル毎に使用可能な量子化ビット数を所定の割合で配分し、量子化情報idwl1,idwl2として決定することができる。或いは、量子化情報idwl1,idwl2の何れか一方の量子化ビット数を固定値とし、超過分を他方の量子化ビット数として決定することができる。
ところで、このようにして量子化情報idwl1,idwl2を一意に決定した場合、ノイズフロアは略々平坦になる。すなわち、人間の聴感上重要な低域についても聴感上重要でない高域についても一様な量子化精度で量子化を行っているため、雑音感は最小とならない。
そこで、量子化情報計算部12,32において、以下の表5に示すように、スペクトル毎の正規化情報idsfに対して重み係数Wn[i](i=0〜N/2−1)を加算し、新たな正規化情報idsf1を生成するようにしても構わない。
Figure 0004609097
この表5の例では、低域の正規化情報idsfには4乃至1の値を加算し、高域の正規化情報idsfには何も加算していない。このように正規化情報idsfに対して重み係数Wn[i]を加算することで、低域にビットを集中させて、人間の聴覚に重要な帯域の音質を向上させることができる。
表5のように重み係数Wn[i]を加算した場合、正規化情報idsfの最大値が35となるため、表4のテーブルを正規化情報idsfの最大加算数である4だけ大きい方向に単純に拡張したとすると、例えば以下の表6のようになる。この表6において、破線の丸で囲まれている数字は重み付けを行わない場合におけるスペクトル毎の量子化情報idwlを表し、実線の丸で囲まれている数字は重み付けを行う場合におけるスペクトル毎の量子化情報idwlを表す。
Figure 0004609097
この表6の例では、低域の量子化精度が向上するが、最大量子化情報が増加して総使用ビット数が増加するため、実際には総使用ビット数が総使用可能ビット数に収まるようにビット調整を行うことが好ましい。
なお、上述した重み係数Wn[i]としては、予め符号化側と復号側とで固定のものを用いてもよく、或いは、符号化側で音源の特徴(周波数エネルギ、過渡特性、ゲイン、マスキング特性など)に基づいて最適な重み係数Wn[i]を生成してもよい。後者の場合、量子化情報計算部12は、例えば周波数スペクトルmdspec1に基づいて重み係数Wn[i]を生成し、符号列符号化部20は、この重み係数Wn[i]を符号化して符号列に含める。
(第2の実施の形態)
次に、第2の実施の形態として図7に示す音声符号化装置40は、基本構造を図1に示した音声符号化装置10と同様とするが、周波数スペクトルmdspec1と周波数スペクトルmdspec1'との差分に対して2段目の正規化・量子化を行うのではなく、正規化周波数スペクトルnspec1と正規化周波数スペクトルnspec1'との差分に対して2段目の正規化・量子化を行う点に特徴を有している。したがって、先に図1に示した音声符号化装置10と同様の構成については同一符号を付して詳細な説明を省略する。
この音声符号化装置40において、減算部41は、以下の式(19)、
nspec2=nspec1−nspec1' ・・・(19)
で示すように正規化周波数スペクトルnspec1から正規化周波数スペクトルnspec1'を減算し、得られた差分正規化周波数スペクトルnspec2を第2の正規化部42に供給する。
第2の正規化部42は、正規化係数sf2を用いて差分正規化周波数スペクトルnspec2を以下の式(20)、
nnspec2=nspec2*sf2
=(nspec1−nspec1')*sf2 ・・・(20)
で示すように正規化し、得られた差分再正規化周波数スペクトルnnspec2を第2の量子化部43に供給する。
ここで、正規化周波数スペクトルnspec1は、正規化情報idsfに対応した正規化係数sf1(idsf)により±f∈Rの範囲に正規化されているため、例えば図3に示すように、量子化情報idwl1に対応して量子化ステップ幅nstep(idwl1)が一意に決定されるような線形量子化を行う場合には、量子化前後での正規化周波数スペクトルnspec1、nspec1'の差分は最大量子化誤差である±f/nstep(idwl1)の範囲となる。したがって、正規化係数sf2は、以下の式(21)、
sf2(idwl1)=nstep(idwl1)/f ・・・(21)
で示すように算出することができる。すなわち、量子化情報idwl1に基づいて正規化係数sf2(idwl1)を算出することができる。
第2の量子化部43は、量子化情報idwl2に対応した量子化係数qf2(idwl2)を用いて差分再正規化周波数スペクトルnnspec2を量子化し、得られた差分量子化周波数スペクトルqspec2を符号列符号化部20に供給する。例えば、図3に示すような線形量子化を行う場合、差分量子化周波数スペクトルqspec2は以下の式(22)、
qspec2=(int)(floor(nnspec2*qf2(idwl2))+0.5) ・・・(22)
のように求められる。
符号列符号化部20は、量子化周波数スペクトルqspec1、差分量子化周波数スペクトルqspec2、及び正規化情報idsfを符号化し、得られた符号列を出力する。
次に、この音声符号化装置40に対応する音声復号装置の概略構成を図8に示す。図8に示す音声符号化装置50は、基本構造を図5に示した音声復号装置30と同様とするため、音声復号装置30と同様の構成については同一符号を付して詳細な説明を省略する。
この音声復号装置50において、第2の逆量子化部51は、量子化情報idwl2に対応した逆量子化係数iqf2(idwl2)を用いて差分量子化周波数スペクトルqspec2を以下の式(23)、
nnspec2'=qspec2*iqf2(idwl2) ・・・(23)
で示すように逆量子化し、得られた差分再正規化周波数スペクトルnnspec2'を第2の逆正規化部52に供給する。
第2の逆正規化部52は、量子化情報idwl1に対応した逆正規化係数isf2(idwl1)を用いて差分再正規化周波数スペクトルnnspec2'を以下の式(24)、
nspec2'=nnspec2'*isf2(idwl1) ・・・(24)
で示すように逆正規化し、得られた差分正規化周波数スペクトルnspec2'を加算部53に供給する。ここで、逆正規化係数isf2(idwl1)と量子化情報idwl1との関係は、以下の式(25)、
isf2(idwl1)=1/sf2(idwl1)=f/nstep(idwl1) ・・・(25)
で表される。
加算部53は、以下の式(26)、
nspec'=nspec1'+nspec2' ・・・(26)
で示すように正規化周波数スペクトルnspec1'と差分正規化周波数スペクトルnspec2'とを加算し、得られた正規化周波数スペクトルnspec'を第1の逆正規化部54に供給する。
第1の逆正規化部54は、正規化情報idsfに対応した逆正規化係数isf1(idsf)を用いて正規化周波数スペクトルnspec'を以下の式(27)、
mdspec'=nspec'*isf1(idsf) ・・・(27)
で示すように逆正規化し、得られた周波数スペクトルmdspec'を周波数時間変換部38に供給する。
周波数時間変換部38は、周波数スペクトルmdspec'を周波数時間変換して音声信号を生成し、この音声信号を出力する。
以上のように、本実施の形態における音声符号化装置40及び音声復号装置50によれば、正規化情報idsfに基づいて量子化情報idwl1,idwl2を一意に決定し、また、量子化情報idwl1に基づいて正規化係数sf2(idwl1)を算出するため、符号列にはサイド情報として正規化情報idsfを含めるのみでよい。さらに、サイド情報の削減によって生じた余剰ビットを量子化周波数スペクトルqspec1及び差分量子化周波数スペクトルqspec2の符号化に流用することで、量子化周波数スペクトルqspec1及び差分量子化周波数スペクトルqspec2の符号化効率を向上させることができる。
(第3の実施の形態)
上述した第1,第2の実施の形態では、音声符号化装置及び音声復号装置の基本的な2種類の構成について説明したが、本実施の形態では、音声符号化装置及び音声復号装置の変形例について説明する。なお、音声符号化装置10及び音声復号装置30と同様の構成については同一符号を付して詳細な説明を省略する。
先ず、図9は、第1の変形例における音声符号化装置60の概略構成を示したものであり、図10は、音声符号化装置60に対応する音声復号装置70の概略構成を示したものである。この音声符号化装置60において、前処理部61は、入力音声信号を時間周波数変換する前に、入力音声信号に対して帯域分割やゲイン調整等の前処理を施す。一方、音声復号装置70において、後処理部71は、周波数スペクトルmdspec'を周波数時間変換した後、音声信号に対して帯域合成やゲイン調整等の後処理を施す。
次に、図11は、第2の変形例における音声符号化装置80の概略構成を示したものであり、図12は、音声符号化装置80に対応する音声復号装置90の概略構成を示したものである。この音声符号化装置80において、第1の前処理部81は、周波数スペクトルmdspec1に対して周波数スペクトル分布に応じた非線形変換等の前処理を施し、後処理部82は、周波数スペクトルmdspec1'に対して対応する非線形逆変換等の後処理を施す。また、第2の前処理部83は、差分周波数スペクトルmdspec2に対して周波数スペクトル分布に応じた非線形変換等の前処理を施す。一方、音声復号装置90において、第1の後処理部91は、周波数スペクトルmdspec1'に対して符号化側と対応する非線形逆変換等の後処理を施し、第2の後処理部92は、差分周波数スペクトルmdspec2'に対して符号化側と対応する非線形逆変換等の後処理を施す。
また、図13は、第3の変形例における音声符号化装置100の概略構成を示したものであり、図14は、音声符号化装置100に対応する音声復号装置110の概略構成を示したものである。この音声符号化装置100において、第1の前処理部101は、正規化周波数スペクトルnspec1に対して周波数スペクトル分布に応じた非線形変換等の前処理を施し、後処理部102は、正規化周波数スペクトルnspec1'に対して対応する非線形逆変換等の後処理を施す。また、第2の前処理部103は、差分正規化周波数スペクトルnspec2に対して周波数スペクトル分布に応じた非線形変換等の前処理を施す。一方、音声復号装置110において、第1の後処理部111は、正規化周波数スペクトルnspec1'に対して符号化側と対応する非線形逆変換等の後処理を施し、第2の後処理部112は、差分正規化周波数スペクトルnspec2'に対して符号化側と対応する非線形逆変換等の後処理を施す。
上述した第1,第2の実施の形態では、第1の量子化部14において線形量子化を行うことを前提として説明したが、非線形量子化は非線形変換後に線形量子化を行うことと等価であるため、図11,図13のように、第1の量子化部14の前段に非線形変換を行う第1の前処理部81,101を設けることで、非線形量子化を行う場合にも適用することが可能である。
次に、図15は、第4の変形例における音声符号化装置120の概略構成を示したものであり、図16は、音声符号化装置120に対応する音声復号装置130の概略構成を示したものである。この音声符号化装置120において、第1の正規化量子化部121は、正規化量子化係数sf1(idsf)*qf1(idwl1)を用いて周波数スペクトルmdspec1を正規化・量子化し、逆量子化逆正規化部122は、逆量子化逆正規化係数iqf1(idwl1)*isf1(idsf)を用いて量子化周波数スペクトルqspec1を逆量子化・逆正規化する。また、第2の正規化量子化部123は、正規化量子化係数sf2(idsf,idwl1)*qf2(idwl2)を用いて差分周波数スペクトルmdspec2を正規化・量子化する。一方、音声復号装置130において、第1の逆量子化逆正規化部131は、逆量子化逆正規化係数iqf1(idwl1)*isf1(idsf)を用いて量子化周波数スペクトルqspec1を逆量子化・逆正規化し、第2の逆量子化逆正規化部132は、逆量子化逆正規化係数iqf2(idwl2)*isf2(idsf,idwl1)を用いて差分量子化周波数スペクトルqspec2を逆量子化・逆正規化する。このように、正規化係数と量子化係数とを予め乗算しておくことで正規化処理及び量子化処理を1つの処理に纏めることができ、逆量子化係数と逆正規化係数とを予め乗算しておくことで逆量子化処理及び逆正規化処理を1つの処理に纏めることができるため、演算量及び処理量を低減することができる。
なお、本実施の形態では、第1の実施の形態における音声符号化装置10及び音声復号装置30の変形例について説明したが、第2の実施の形態における音声符号化装置40及び音声復号装置50についても同様の変形が可能である。
以上、本発明を実施するための最良の形態について説明したが、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
例えば、上述した実施の形態では、入力音声信号を時間周波数変換して得られた周波数スペクトルに対して2段の正規化・量子化を行って符号化するものとして説明したが、これに限定されるものではなく、任意の段数の正規化・量子化を行って符号化する場合に拡張可能である。この場合、各段の量子化情報は、正規化情報に基づいて一意に決定することができ、また、k段目(kは2以上の整数)の正規化係数は、k−1段目の量子化情報、又は正規化情報及びk−1段目の量子化情報に基づいて求めることができる。
第1の実施の形態における音声符号化装置の概略構成を示す図である。 同音声符号化装置における符号化処理の手順を示すフローチャートである。 同音声符号化装置の第1の量子化部における量子化処理の一例を示す図である。 同第1の量子化部における量子化処理の他の例を示す図である。 図1の音声符号化装置に対応する音声復号装置の概略構成を示す図である。 同音声復号装置における復号処理の手順を示すフローチャートである。 第2の実施の形態における音声符号化装置の概略構成を示す図である。 図7の音声符号化装置に対応する音声復号装置の概略構成を示す図である。 第3の実施の形態における音声符号化装置の概略構成を示す図である。 図9の音声符号化装置に対応する音声復号装置の概略構成を示す図である。 第3の実施の形態における音声符号化装置の概略構成の他の例を示す図である。 図11の音声符号化装置に対応する音声復号装置の概略構成を示す図である。 第3の実施の形態における音声符号化装置の概略構成の他の例を示す図である。 図13の音声符号化装置に対応する音声復号装置の概略構成を示す図である。 第3の実施の形態における音声符号化装置の概略構成の他の例を示す図である。 図15の音声符号化装置に対応する音声復号装置の概略構成を示す図である。
符号の説明
10 音声符号化装置、11 時間周波数変換部、12 量子化情報計算部、13 第1の正規化部、14 第1の量子化部、15 逆量子化部、16 逆正規化部、17 減算部、18 第2の正規化部、19 第2の量子化部、20 符号列符号化部、30 音声復号装置、31 符号列復号部、32 量子化情報計算部、33 第1の逆量子化部、34 第1の逆正規化部、35 第2の逆量子化部、36 第2の逆正規化部、37 加算部、38 周波数時間変換部

Claims (22)

  1. 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
    所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
    上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段と、
    上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化手段と、
    上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算手段と、
    上記正規化情報及び上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第2の正規化手段と、
    上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化手段と、
    上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段とを備え
    上記量子化情報計算手段は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
    音声符号化装置。
  2. 上記第1の量子化手段では、上記第1の量子化情報に対応して最大量子化誤差が一意に決定され、
    上記第2の正規化係数は、上記第1の正規化係数と上記最大量子化誤差の逆数との積により決定され
    請求項1記載の音声符号化装置。
  3. 上記量子化情報計算手段は、上記正規化情報に基づいて量子化ビット数を表す量子化情報を生成し、該量子化情報を配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成す請求項1記載の音声符号化装置。
  4. 上記正規化情報が1ずつ増減すると、上記量子化情報で表される量子化ビット数が1ビットずつ増減す請求項3記載の音声符号化装置。
  5. 上記量子化情報計算手段は、上記量子化情報を所定の割合で配分し、上記第1の量子化情報及び上記第2の量子化情報を生成す請求項3記載の音声符号化装置。
  6. 上記量子化情報計算手段は、上記第1の量子化情報及び上記第2の量子化情報のいずれか一方を固定値として上記量子化情報を配分し、上記第1の量子化情報及び上記第2の量子化情報を生成す請求項3記載の音声符号化装置。
  7. 上記周波数スペクトル又は上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
    上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトル、又はこの正規化周波数スペクトルを逆正規化した周波数スペクトルに対して非線形逆変換を施す後処理手段と
    をさらに備え請求項1記載の音声符号化装置。
  8. 前段における差分周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
    k段目(kは2以上の整数)における正規化係数は、上記正規化情報及びk−1段目の量子化情報に基づいて求められ
    請求項1記載の音声符号化装置。
  9. 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
    所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
    上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化工程と、
    上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化工程と、
    上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算工程と、
    上記正規化情報及び上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第2の正規化工程と、
    上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化工程と、
    上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
    上記量子化情報計算工程では、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
    音声符号化方法。
  10. 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号手段と、
    上記正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
    上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを出力する第1の逆量子化手段と、
    上記正規化情報に対応した第1の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化手段と、
    上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第2の逆量子化手段と、
    上記正規化情報及び上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第2の逆正規化手段と、
    上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算手段と、
    上記加算手段によって得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換手段とを備え
    上記量子化情報計算手段は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
    音声復号装置。
  11. 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号工程と、
    上記正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
    上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを出力する第1の逆量子化工程と、
    上記正規化情報に対応した第1の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化工程と、
    上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第2の逆量子化工程と、
    上記正規化情報及び上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第2の逆正規化工程と、
    上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算工程と、
    上記加算工程にて得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換工程とを有し、
    上記量子化情報計算工程では、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
    音声復号方法。
  12. 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
    所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
    上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化手段と、
    上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化手段と、
    上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算手段と、
    上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第2の正規化手段と、
    上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化手段と、
    上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段ととを備え
    上記量子化情報計算手段は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
    音声符号化装置。
  13. 上記第1の量子化手段では、上記第1の量子化情報に対応して最大量子化誤差が一意に決定され、
    上記第2の正規化係数は、上記最大量子化誤差の逆数により決定され
    請求項12記載の音声符号化装置。
  14. 上記量子化情報計算手段は、上記正規化情報に基づいて量子化ビット数を表す量子化情報を生成し、該量子化情報を配分することにより、上記第1の量子化情報及び上記第2の量子化情報を生成す請求項12記載の音声符号化装置。
  15. 上記正規化情報が1ずつ増減すると、上記量子化情報で表される量子化ビット数が1ビットずつ増減す請求項14記載の音声符号化装置。
  16. 上記量子化情報計算手段は、上記量子化情報を所定の割合で配分し、上記第1の量子化情報及び上記第2の量子化情報を生成す請求項14記載の音声符号化装置。
  17. 上記量子化情報計算手段は、上記第1の量子化情報及び上記第2の量子化情報のいずれか一方を固定値として上記量子化情報を配分し、上記第1の量子化情報及び上記第2の量子化情報を生成す請求項14記載の音声符号化装置。
  18. 上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
    上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルに対して非線形逆変換を施す後処理手段と
    をさらに備え請求項12記載の音声符号化装置。
  19. 前段における差分正規化周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
    k段目(kは2以上の整数)における正規化係数は、k−1段目の量子化情報に基づいて求められ
    請求項12記載の音声符号化装置。
  20. 入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
    所定の正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
    上記正規化情報に対応した第1の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第1の正規化工程と、
    上記第1の量子化情報に対応した第1の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、上記第1の量子化情報で表されるビット数の量子化周波数スペクトルを生成する第1の量子化工程と、
    上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算工程と、
    上記第1の量子化情報に対応した第2の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第2の正規化工程と、
    上記第2の量子化情報に対応した第2の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、上記第2の量子化情報で表されるビット数の差分量子化周波数スペクトルを生成する第2の量子化工程と、
    上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
    上記量子化情報計算工程では、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
    音声符号化方法。
  21. 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号手段と、
    上記正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算手段と、
    上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを出力する第1の逆量子化手段と、
    上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分再正規化周波数スペクトルを生成する第2の逆量子化手段と、
    上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分再正規化周波数スペクトルを逆正規化し、差分正規化周波数スペクトルを生成する第2の逆正規化手段と、
    上記正規化周波数スペクトルと上記差分正規化周波数スペクトルとを加算する加算手段と、
    上記正規化情報に対応した第1の逆正規化係数を用いて上記加算手段によって得られた正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化手段と、
    上記周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換手段とを備え
    上記量子化情報計算手段は、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
    音声復号装置。
  22. 入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号工程と、
    上記正規化情報に基づいて、量子化ビット数を表す第1の量子化情報及び第2の量子化情報を生成する量子化情報計算工程と、
    上記第1の量子化情報に対応した第1の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを出力する第1の逆量子化工程と、
    上記第2の量子化情報に対応した第2の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分再正規化周波数スペクトルを生成する第2の逆量子化工程と、
    上記第1の量子化情報に対応した第2の逆正規化係数を用いて上記差分再正規化周波数スペクトルを逆正規化し、差分正規化周波数スペクトルを生成する第2の逆正規化工程と、
    上記正規化周波数スペクトルと上記差分正規化周波数スペクトルとを加算する加算工程と、
    上記正規化情報に対応した第1の逆正規化係数を用いて上記加算工程にて得られた正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第1の逆正規化工程と、
    上記周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換工程とを有し、
    上記量子化情報計算工程では、上記正規化情報の最大正規化情報に対して割り当てられる最大量子化情報から各スペクトル毎の量子化ビット数を表す量子化情報を決定し、求められたスペクトル毎の量子化情報を所定の割合で配分して上記第1、第2の量子化情報を決定する
    音声復号方法。
JP2005032190A 2005-02-08 2005-02-08 音声符号化装置及び方法、並びに音声復号装置及び方法 Expired - Fee Related JP4609097B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005032190A JP4609097B2 (ja) 2005-02-08 2005-02-08 音声符号化装置及び方法、並びに音声復号装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005032190A JP4609097B2 (ja) 2005-02-08 2005-02-08 音声符号化装置及び方法、並びに音声復号装置及び方法

Publications (2)

Publication Number Publication Date
JP2006220767A JP2006220767A (ja) 2006-08-24
JP4609097B2 true JP4609097B2 (ja) 2011-01-12

Family

ID=36983153

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005032190A Expired - Fee Related JP4609097B2 (ja) 2005-02-08 2005-02-08 音声符号化装置及び方法、並びに音声復号装置及び方法

Country Status (1)

Country Link
JP (1) JP4609097B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4635709B2 (ja) * 2005-05-10 2011-02-23 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1020898A (ja) * 1996-07-01 1998-01-23 Matsushita Electric Ind Co Ltd オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP3227945B2 (ja) * 1993-11-09 2001-11-12 ソニー株式会社 符号化装置
JP3227948B2 (ja) * 1993-11-17 2001-11-12 ソニー株式会社 復号化装置
JP2002023799A (ja) * 2000-07-05 2002-01-25 Nec Corp 音声符号化装置及びそれに用いる心理聴覚分析方法
JP2002141810A (ja) * 2000-08-25 2002-05-17 Agere Systems Guardian Corp 通信システムのネットワーク層を横断して実現可能なチャネル誤り保護
JP2002372995A (ja) * 2001-06-15 2002-12-26 Sony Corp 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
JP2004226742A (ja) * 2003-01-23 2004-08-12 Sanyo Electric Co Ltd 量子化装置及び逆量子化装置、並びにそれらの装置を利用可能なオーディオ及び画像の符号化装置及び復号装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3227945B2 (ja) * 1993-11-09 2001-11-12 ソニー株式会社 符号化装置
JP3227948B2 (ja) * 1993-11-17 2001-11-12 ソニー株式会社 復号化装置
JPH1020898A (ja) * 1996-07-01 1998-01-23 Matsushita Electric Ind Co Ltd オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP2002023799A (ja) * 2000-07-05 2002-01-25 Nec Corp 音声符号化装置及びそれに用いる心理聴覚分析方法
JP2002141810A (ja) * 2000-08-25 2002-05-17 Agere Systems Guardian Corp 通信システムのネットワーク層を横断して実現可能なチャネル誤り保護
JP2002372995A (ja) * 2001-06-15 2002-12-26 Sony Corp 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
JP2004226742A (ja) * 2003-01-23 2004-08-12 Sanyo Electric Co Ltd 量子化装置及び逆量子化装置、並びにそれらの装置を利用可能なオーディオ及び画像の符号化装置及び復号装置

Also Published As

Publication number Publication date
JP2006220767A (ja) 2006-08-24

Similar Documents

Publication Publication Date Title
EP2830062B1 (en) Method and apparatus for high-frequency encoding/decoding for bandwidth extension
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
CN106941003B (zh) 能量无损编码方法和设备以及能量无损解码方法和设备
CN109313908B (zh) 用于对音频信号进行编码的音频编码器以及方法
MXPA05006664A (es) Metodo y dispositivo para la cuantizacion robusta de vector predictivo de parametros de prediccion lineal en la codificacion de conversacion a velocidad variable de bits.
KR101143792B1 (ko) 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법
JP3636094B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
WO2011086923A1 (ja) 符号化装置、復号装置、スペクトル変動量算出方法及びスペクトル振幅調整方法
US7613609B2 (en) Apparatus and method for encoding a multi-channel signal and a program pertaining thereto
CN111710342B (zh) 编码装置、解码装置、编码方法、解码方法及程序
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
JP4843142B2 (ja) 音声符号化のための利得−適応性量子化及び不均一符号長の使用
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
USRE48272E1 (en) Audio coding/decoding method and apparatus using excess quantization information
JPH11184498A (ja) 音声符号化/復号化方法
JP4609097B2 (ja) 音声符号化装置及び方法、並びに音声復号装置及び方法
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP5451603B2 (ja) デジタルオーディオ信号の符号化
JP4024185B2 (ja) デジタルデータ符号化装置
JP4574320B2 (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
JPWO2011086900A1 (ja) 符号化装置および符号化方法
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
JP3137550B2 (ja) 音声符号化・復号化装置
JP2005004119A (ja) 音響信号符号化装置及び音響信号復号化装置
Bachu et al. A Comparison of LBG and ADPCM Speech Compression Techniques

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100914

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100927

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4609097

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees
S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250