JP2004246038A - 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム - Google Patents

音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム Download PDF

Info

Publication number
JP2004246038A
JP2004246038A JP2003035256A JP2003035256A JP2004246038A JP 2004246038 A JP2004246038 A JP 2004246038A JP 2003035256 A JP2003035256 A JP 2003035256A JP 2003035256 A JP2003035256 A JP 2003035256A JP 2004246038 A JP2004246038 A JP 2004246038A
Authority
JP
Japan
Prior art keywords
band
coefficient
reproduction
index
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003035256A
Other languages
English (en)
Other versions
JP4191503B2 (ja
Inventor
Takeshi Mori
岳至 森
Yuusuke Hiwazaki
祐介 日和▲崎▼
Jiyoutarou Ikedo
丈太朗 池戸
Toru Morinaga
徹 森永
Daisuke Tokumoto
大輔 徳元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003035256A priority Critical patent/JP4191503B2/ja
Publication of JP2004246038A publication Critical patent/JP2004246038A/ja
Application granted granted Critical
Publication of JP4191503B2 publication Critical patent/JP4191503B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】音声楽音信号の周波数帯域を分割して帯域毎に残差係数に対するベクトル長、ビット割当てを行い高能率にディジタル符号に変換符号化復号化する。
【解決手段】周波数帯域を分割して帯域毎に残差係数に対するベクトル長およびビット割り当てを行い音声楽音信号を高能率にディジタル符号に変換符号化して音声楽音信号に復元復号化する符号化復号化方法、装置、符号化復号化プログラムであり、特に、ベクトル量子化は、帯域毎にベクトル長と量子化ビット割り当ておよびベクトル量子化を行ない、必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスを求め、ベクトル量子化復号化は帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックス、および必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスから再生残差係数を求める音声楽音信号符号化・復号化方法、装置、プログラム。
【選択図】 図1

Description

【0001】
【産業上の利用分野】
この発明は音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラムに関し、特に、音声楽音の周波数帯域を分割して帯域毎に残差係数に対するベクトル長およびビット割り当てを行い音声楽音信号を高能率にディジタル符号に変換符号化して、このディジタル信号を音声楽音信号に復元復号化する音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、および符号化プログラム、復号化プログラムに関する。
【0002】
【従来の技術】
音声信号および楽音信号を圧縮する従来方法として、入力信号をMDCT(modified discrete cosine transform:変形離散コサイン変換)により一定サンプルの入力毎に時間/周波数変換し、周波数領域の一連の係数に変換してから符号化を行なう変換符号化方法が知られている。一例として、図1に示されるが如きTwinVQ方式(transfer−domain weighted interleave vector quantization:周波数領域重み付けインタリーブベクトル量子化)(非特許文献1、特許文献1 参照)は、MDCTにより変換した周波数領域MDCT係数をLPC(linear predictiv coefficient:線形予測係数)スペクトル包絡、2段階のパワーにより平坦化を行ない、得られる出力信号、即ち、残差信号を重み付けベクトル量子化により量子化する方法である。
【0003】
ベクトル量子化は、目標ベクトルとの間の距離が最小となるコードベクトルをコードブックから選択し、復号化装置でベクトルを先のコードベクトルから再生する方法である。この符号化方法は、低いビットレートでも高音質な符号化がなされるが、効率的に符号化するには符号化するベクトルを或る程度の長さの、即ち、5〜6次元の長さのベクトルに設定する必要がある。しかし、ベクトル長を長くするとパワー変動が急峻なデータを符号化する際に大きな符号化歪が発生するという問題がある。また、ベクトル長を短くすると、各ベクトルを符号化するに使用することができるビットが減るところから、目標ベクトルに近いコードベクトルがコードブック中に存在しない状態になりやすく、これが大きな符号化歪を発生させる原因となる。
【0004】
【特許文献1】
特開平08−044399号公報
【非特許文献1】
岩上、守谷、三樹、「周波数領域重み付けインターリーブベクトル量子化によるオーディオ符号化」、日本音響学会秋季講演論文、pp.339−340、1994−10
【0005】
【発明が解決しようとする課題】
この発明は、広帯域入力信号のスペクトルを符号化する音声楽音信号の変換符号化方法において帯域毎に異なる形状を持つスペクトルを効率的に符号化する方法およびこの符号化された信号を復号化する帯域分割音声楽音信号符号化方法、復号化方法およびこれらの方法を実行するプログラム記憶媒体を提供するものである。
【0006】
【課題を解決するための手段】
離散音声楽音信号サンプルを入力としてディジタル符号を出力する音声楽音信号符号化方法において、時間系列の信号を一定数の入力サンプル毎に帯域分割フィルタにより帯域分割し、複数の帯域別時間系列の信号を求め、帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎にMDCT変換して周波数領域MDCT係数を求め、帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出し、帯域毎の周波数領域MDCT係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求め、帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワーで正規化し、パワー正規化インデックスおよび残差入力係数を求め、帯域毎の残差入力係数をそれぞれベクトル量子化によりベクトル量子化インデックスを求め、このベクトル量子化は、帯域毎にLPCスペクトル包絡、或はパワー正規化インデックス、或いは残差入力係数からベクトル長と量子化ビット割り当ておよびベクトル量子化を行い、必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスを求める音声楽音信号符号化方法を構成した。
【0007】
そして、ディジタル符号を入力して音声楽音信号を再生する音声楽音信号復号化方法において、帯域毎のパワー正規化インデックスから再生正規化パワーを求め、帯域毎のLPCインデックスから再生LPCスペクトル包絡を求め、帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックスにより再生残差係数を求めてベクトル量子化復号化を行い、帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求め、帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を求め、帯域毎の再生MDCT係数を逆MDCT変換して複数の帯域別時間系列信号を求め、複数の帯域別時間系列信号から帯域合成フィルタにより時間系列の再生音声楽音信号を求める音声楽音信号復号化方法を構成した。
【0008】
また、離散音声楽音信号サンプルを入力としてディジタル符号を出力する音声楽音信号符号化装置において、時間系列の信号を一定数の入力サンプル毎に帯域分割し、複数の帯域別時間系列の信号を求める帯域分割フィルタを具備し、帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎にMDCT変換して周波数領域MDCT係数を求めるMDCT変換部210、211、212を具備し、帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出するLPC分析部220、221、222を具備し、帯域毎の周波数領域MDCT係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求めるLPC平坦化部230、231、232を具備し、帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワー成分で正規化し、正規化パワーおよびパワー正規化インデックスを求めるパワー正規化部240、241、242を具備し、帯域毎の入力平坦化係数を正規化パワーにより正規化し、残差入力係数を計算する残差計算部250、251、252を具備し、LPCスペクトル包絡、或いは正規化パワー、或いは残差入力係数から各帯域のベクトル量子化で使用するベクトル長とベクトル量子化に使用するビットの割り当てを計算するベクトル長量子化ビット割り当て部270を具備し、帯域毎にベクトル長と量子化ビット割り当ておよびベクトル量子化を行ない、必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスを求めるベクトル量子化部260、261、262を具備する音声楽音信号符号化装置を構成した。
【0009】
更に、ディジタル符号を入力して音声楽音信号を再生する音声楽音信号復号化装置において、帯域毎のパワー正規化インデックスから再生正規化パワーを求めるパワー逆正規化部440、441、442を具備し、帯域毎のLPCインデックスから再生LPCスペクトル包絡を求めるLPC合成部420、421、422を具備し、帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックスにより再生残差係数を求めてベクトル量子化復号化を行うベクトル量子化復号部460、461、462を具備し、帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求める残差逆平坦化部450、451、452を具備し、帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を求めるLPC逆平坦化部430、431、432を具備し、帯域毎の再生MDCT係数を逆MDCT変換して複数の帯域別時間系列信号を求める逆MDCT変換部410、411、412を具備し、複数の帯域別時間系列信号から時間系列の再生音声楽音信号を求める帯域合成フィルタ400を具備する音声楽音信号復号化装置を構成した。
【0010】
ここで、時間系列の信号を一定数の入力サンプル毎に帯域分割フィルタにより帯域分割し、複数の帯域別時間系列の信号を求め、帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎にMDCT変換して周波数領域MDCT係数を求め、帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出し、帯域毎の周波数領域MDCT係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求め、帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワーで正規化し、パワー正規化インデックスおよび残差入力係数を求め、帯域毎の残差入力係数をそれぞれベクトル量子化によりベクトル量子化インデックスを求め、このベクトル量子化は、帯域毎にベクトル長と量子化ビット割り当ておよびベクトル量子化を行ない、必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスを求める指令を実行する音声楽音信号符号化プログラムを構成した。
【0011】
そして、帯域毎のパワー正規化インデックスから再生正規化パワーを求め、帯域毎のLPCインデックスから再生LPCスペクトル包絡を求め、帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックスにより再生残差係数を求めてベクトル量子化復号化を行い、帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求め、帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を求め、帯域毎の再生MDCT係数を逆MDCT変換して複数の帯域別時間系列信号を求め、複数の帯域別時間系列信号から帯域合成フィルタにより時間系列の再生音声楽音信号を求める指令を実行する音声楽音信号復号化プログラムを構成した。
【0012】
【発明の実施の形態】
符号器は、入力された信号系列を一定時間毎に帯域分割フィルタにより複数帯域に分割し、それぞれの時間系列信号をMDCTにより周波数領域のMDCT係数に変換し、LPCスペクトル包絡により正規化を行ない平坦化入力係数を算出した後、パワーにより正規化を行ない、残差入力係数を得る。帯域毎に計算されるLPCスペクトル包絡とパワー正規化係数と残差入力係数より、各帯域においてベクトル量子化に使用するビット数およびベクトル長を計算し、各帯域毎に算出される残差入力係数をベクトル量子化する。
復号器は、ベクトル量子化復号を行ない再生平坦化係数を算出する。この再生平坦化係数を再生正規化パワーおよび再生LPCスペクトル包絡により逆平坦化を行なった後、周波数/時間変換により帯域別出力時間領域信号を得て、これら出力時間領域信号を帯域合成フィルタにより合成し、出力信号を得る。この方法は、各帯域の重要度に応じた品質の制御を特に低ビットレートの符号化に効果のあるベクトル量子化により実現することができる。
【0013】
【実施例】
この発明の実施例を図を参照して説明する。
図2および図4はこの発明の第1の実施例を説明する図である。図2に示される第1の実施例における符号化装置は、帯域分割フィルタ部200とMDCT変換部210、211、212と、LPC分析部220、221、222と、LPC平坦化部230、231、232と、パワー正規化部240、241、242と、残差計算部250、251、252と、ベクトル量子化部260、261、262と、ベクトル長量子化ビット割り当て部270より構成される。入力端子201から入力した入力信号である音声楽音信号の離散サンプル列は、帯域分割フィルタ部200に入力される。(・おいて帯域分割され、符号化したビット列をLPC分析部220、221、222、パワー正規化部240、241、242、ベクトル量子化部260、261、262より出力する。即ち、・)入力信号は帯域分割フィルタ部200において帯域別時間系列信号に変換される。この実施例において、入力信号は3帯域に分割している。一例として、0kHzから16kHzに亘る広帯域の音声楽音信号を32kHzでサンプリングして入力信号とし、この入力信号をOkHzから4kHz迄の帯域、4kHzから8kHz迄の帯域、8kHzから16kHz迄の帯域の3帯域に分割すると効果が高い。この通りに3分割された帯域別時間系列信号は、各帯域のMDCT変換部210、211、212に入力され、ここにおいて変形離散コサイン変換によりそれぞれ周波数領域の入力MDCT係数に変換されて、各帯域のLPC平坦化部230、231、232に送信される。3分割された帯域別時間系列信号は、また、各帯域のLPC分析部220、221、222にも入力され、ここにおいてこの入力信号に基づいてLPCスペクトル包絡が算出され、各帯域のLPC平坦化部230、231、232とベクトル長量子化ビット割り当て部270に送信される。ここで、ベクトル長、量子化ビット割り当てには、以下の3通りがある。
(A)LPCスペクトル包絡より求める。
(B)パワー正規化インデックスより求める。
(C)残差入力係数から求める。この場合のみベクトル長インデックスと量子化ビット割り当てインデックスが必要とされる。
【0014】
入力MDCT係数については、効率的な量子化を行なうために、各帯域のLPC平坦化部230、231、232においてLPCスペクトル包絡により平坦化された平坦化入力係数が計算され、それぞれ各帯域のパワー正規化部240、241、242と残差計算部250、251、252とに送信される。各帯域のパワー正規化部240、241、242は、平坦化入力係数からのパワー成分を計算し、正規化パワーをそれぞれの残差計算部250、251、252とベクトル長量子化ビット割り当て部270に送信する。以上の計算は、一定数サンプルにおける平均パワーの平方根、一定数サンプル内での最大振幅の絶対値を使用すると効果的である。
各帯域の残差計算部250、251、252は、入力平坦化係数を正規化パワーにより正規化し、残差入力係数を計算し、計算結果をそれぞれのベクトル量子化部260、261、262に送信する。ベクトル長量子化ビット割り当て部270は、LPCスペクトル包絡と正規化パワーから各帯域のベクトル量子化で使用するベクトル長とベクトル量子化に使用するビットの割り当てを計算し、計算結果を各帯域のベクトル量子化部260、261、262に送信する。ここで、例えば、ベクトル長の上限をVs−t、下限をVs−bとし、各帯域の正規化パワーの平均をP(k)(kは帯域番号)とすると、帯域番号kにおけるベクトル量子化部で使用するベクトル長V(k)は、
【数1】
Figure 2004246038
但し、(int)は整数化を表す。
により計算することができる。ここで、例えば、Vs−t=6、Vs−b=2とすることにより、効果的なベクトル長を決定することができる。また、ベクトルVs−t(k、n)(kは帯域番号、nはベクトル番号)のビット割り当てBit(V−t(k、n))は、帯域別に符号化に使用することができるビット数をBit−total(k)とし、LPCスペクトルをLPC(k、s)(kは帯域番号、sはサンプル番号)とすると、
【数2】
Figure 2004246038
により計算することができる。各帯域のベクトル量子化部260、261、262は、残差入力係数を、ベクトル長、ビット割り当て情報を用いてベクトル量子化して、ベクトル量子化インデックスを計算する。
ベクトル長を、その帯域の正規化残差パワーの全帯域パワーの合計に対する比に基づいて決められることにより、パワーが大きくなる程ベクトル長を短く設定することができる。そして、式(2)および後で説明される式(4)の内のs∈V_t(k、n)とは、V_t(k、n)(帯域kにおけるn番目のベクトル)に含まれるベクトル長個分あるベクトル要素サンプルsを示し、式(2)(4)においてベクトル要素サンプルsに関するLPCスペクトル和を計算することにより、ベクトルのパワーが大きい程多くの情報量が割り当てられる。以上のことから、パワーが大きな帯域ほどベクトル長を短くし、ビット割り当てを多く設定することにより、帯域内パワー変動が激しくとも符号化品質劣化を抑制することができる。ここで、ベクトル長は帯域毎に決定され、帯域別で且つビット割り当て応じた符号帳を使用する。符号帳にはビット割り当てに応じた個数の符号ベクトルが符号と対応付けて記憶されている。この個数は、一般に、2のビット割り当て個数乗個であり、ビット割り当てが多いほどベクトル個数が大きい。復号化においても、ベクトル長、ビット割り当て決定後にこの様な符号帳を使用し、入力符号に対するベクトルを再生する。
【0015】
図4に示される第1の実施例における復号化装置は、帯域合成フィルタ400と、逆MDCT変換部410、411、412と、LPC合成部420、421、422と、LPC逆平坦化部430、431、432と、パワー逆正規化部440、441、442と、残差逆平坦化部450、451、452と、ベクトル量子化復号部460、461、462と、ベクトル長量子化ビット割り当て部470から構成される。LPC合成部420、421、422、パワー逆正規化部440、441、442、ベクトル量子化復号部460、461、462から入力された符号ビット列を復号し、時間領域の離散サンプル列である音声楽音信号を出力端子401から出力する。即ち、各帯域のLPC合成部420、421、422は入力されたLPCインデックスから再生LPCスペクトル包絡を算出し、LPC逆平坦化部430、431、432とベクトル長量子化ビット割り当て部470に送信する。また、パワー逆正規化部440、441、442は入力されたパワー正規化インデックスから正規化パワーを計算して、残差逆平坦化部450、451、452とベクトル長量子化ビット割り当て部470に送信する。ベクトル長量子化ビット割り当て部470は、図2に示されるベクトル長量子化ビット割り当て部270と同様の計算により、各帯域でベクトル量子化に使用するベクトル長およびビット割り当てを計算し、計算結果を各帯域のベクトル量子化復号部460、461、462に送信する。各帯域のベクトル量子化復号部460、461、462は、ベクトル量子化インデックスと以上において計算されたベクトル長、量子化ビット割り当てを使ってベクトル量子化復号を行ない、再生残差係数を計算し、計算結果をそれぞれの残差逆平坦化部450、451、452に送信する。各帯域の残差逆平坦化部450、451、452は、再生残差係数を正規化パワーにより逆正規化し、再生平坦化係数を算出し、計算結果をそれぞれのLPC逆平坦化部430、431、432に送信する。各帯域のLPC逆平坦化部430、431、432は、再生平坦化係数を再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を計算して、それぞれの逆MDCT変換部410、411、412に送信する。各帯域の逆MDCT変換部410、411、412は、再生MDCT係数を逆MDCT計算することで、帯域別時間系列信号を計算し、計算結果を帯域合成フィルタ部400に送信する。帯域合成フィルタ部400は、各帯域から出力された時間系列信号を合成し、時間領域の出力サンプル系列に変換し、復号結果として出力端子401から出力される。
以上の図2および図4による第1の実施例の場合は、ベクトル長、ビット割り当てを、帯域毎に、符号化の対象となるパワー正規化係数、包絡成分から算出するので、ベクトル長、ビット割り当てに関する情報を符号化出力とする必要はない。従って、復号化においては、伝送したパワー正規化係数、包絡成分に基づいてベクトル長、ビット割り当てを行った上で伝送符号からの残差成分の再生を行っている。
【0016】
図3および図5はにこの発明の第2の実施例を説明する図である。
図3に示される符号化装置は、帯域分割フィルタ部300と、MDCT変換部310、311、312と、LPC分析部320、321、322と、LPC平坦化部330、331、332と、パワー正規化部340、341、342と、残差計算部350、351、352と、ベクトル量子化部360、361、362と、ベクトル長量子化ビット割り当て部370より構成され、音声楽音信号の離散サンプル列を端子301に入力し、符号化したビット列をLPC分析部330、331、.332、パワー正規化部340、341、342、ベクトル量子化部360、361、362より出力する。即ち、入力信号は入力端子301を介して帯域分割フィルタ部300に入力され、ここにおいて帯域別時間系列信号に変換される。この実施例においては、入力信号は3帯域に分割される。一例として、0kHzから16kHzに亘る広帯域の音声楽音信号を32kHzでサンプリングして入力信号とし、この入力信号を0kHzから4kHz迄の帯域、4kHzから8kHz迄の帯域、8kHzから16kHz迄の帯域の3帯域に分割すると効果が高い。この通りに3分割された帯域別時間系列信号は、各帯域のMDCT変換部310、311、312において、変形離散コサイン変換によりそれぞれ周波数領域の入力MDCT係数に変換され、変換結果を対応するLPC平坦化部330、331、332に送信する。3分割された帯域別時間系列信号は、また、対応するLPC分析部330、331、332にも送信され、ここにおいてLPCスペクトル包絡が入力信号より算出され、LPC平坦化部330、331、332に送信される。入力MDCT係数について、効率的な量子化を行なうために、対応するLPC平坦化部330、331、332においてLPCスペクトル包絡により平坦化されて平坦化入力係数が計算され、対応する残差計算部350、351、352とパワー正規化部340、341、342に送信される。各帯域のパワー正規化部340、341、342は平坦化入力係数からのパワー成分を計算し、残差計算部350、351、352に送信する。以上の計算は、一定数サンプルにおける平均パワーの平方根、一定数サンプル内での最大振幅の絶対値を使用すると効果的である。各帯域の残差計算部350、351、352は、入力平坦化係数を正規化パワーにより正規化し、残差入力係数を計算し、対応するベクトル量子化部260、261、262とベクトル長量子化ビット割り当て部370に送信する。ベクトル長量子化ビット割り当て部370は、残差入力係数から各帯域のベクトル量子化で使用するベクトル長とベクトル量子化に使用するビットの割り当てを計算し、ベクトル長および量子化ビット割り当てを対応するベクトル量子化部360、361、362に送信する。そして、これらベクトル量子化部360、361、362はベクトル量子化インデックスを計算する。ここで、例えば、ベクトル長の上限をVs−t、下限をVs−bとし、各帯域の残差入力信号のパワーをP(k、s)(kは帯域番号、sはサンプル番号)とすると、帯域番号kのベクトル量子化におけるベクトル長V(k)は
【数3】
Figure 2004246038
但し、(int)は整数化を表す。
により計算することができる。ここで、例えばVs−t=6、Vs−b=2とすることにより、効果的なベクトル長を決定することができる。また、各帯域におけるベクトルV−t(k、n)(kは帯域番号、nはベクトル番号)のビット割り当てBit(V−t(k、n))は、帯域別に符号化に使用することができるビット数をBit−total(k)としたとき、
【数4】
Figure 2004246038
により計算することができる。各帯域のベクトル量子化部360、361、362は、残差入力係数を、ベクトル長、ビット割り当て情報を用いてベクトル量子化し、ベクトル量子化インデックスを計算する。
図5に示される第2の実施例における復号化装置は各帯域の帯域合成フィルタ500と、逆MDCT変換部510、511、512と、LPC合成部520、521、522と、LPC逆平坦化部530、531、532と、パワー逆正規化部540、541、542と、残差逆平坦化部550、551、552と、ベクトル量子化復号部560、561、562から構成されて、LPC合成部520、521、522、パワー逆正規化部540、541、542、ベクトル量子化復号部560、561、562から入力された符号ビット列を復号し、時間領域の離散サンプル列である音声楽音信号を出力端子501から出力する。即ち、各帯域のLPC合成部520、521、522は、入力されたLPCインデックスから再生LPCスペクトル包絡を算出し、対応するLPC逆平坦化部530、531、532に送信する。また、各帯域のパワー逆正規化部540、541、542は、パワー正規化インデックスから正規化パワーを計算し、残差逆平坦化部550、551,552に送信する。各帯域のベクトル量子化復号部560、561、562は、ベクトル量子化インデックスとベクトル長および量子化ビット割り当てからベクトル量子化復号を行ない、再生残差係数を計算し、残差逆平坦化部550、551、552に送信する。各帯域の残差逆平坦化部550、551、552は、再生残差係数を正規化パワーにより逆正規化し、再生平坦化係数を算出し、LPC逆平坦化部530、531、532に送信する。LPC逆平坦化部530、531、532は、再生平坦化係数を再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を計算して、逆MDCT変換部510、511、512に送信する。逆MDCT変換部510、511、512は再生MDCT係数を逆MDCT計算することで、帯域別時間系列信号を計算し、帯域合成フィルタ部500に送信する。帯域合成フィルタ部500は、各帯域から出力された時間系列信号を合成し、時間領域の出力サンプル系列に変換し、復号結果として出力端子501に出力する。
以上の図3および図5による第2の実施例の場合は、残差成分に対するベクトル長、ビット割り当てを量子化前の値に基づいて行うので、ベクトル長、ビット割り当て情報を符号化し、復号においてはこれらを再生してベクトル長、ビット割り当てを決めてから残差成分を再生するところが、第1の実施例と異なるところである。
【0017】
図6はこの発明による符号化方法および復号化方法をコンピュータで実施する場合の構成を示す。コンピュータ600は、バス680を介して互いに接続されたCPU610、RAM620、ROM630、入出カインタフェース640、ハードディスク650を含んでいる。ROM630にはコンピュータ600を動作させる基本プログラムが格納されており、ハードディスク650は前述したこの発明による符号化方法および復号化方法を実行するプログラムが予め格納されている。
符号化時には、CPU610はハードディスク650から符号化プログラムをRAM620にロードし、インタフニース640から入力されたオーディオ信号サンプルを符号化プログラムに従って処理することにより符号化し、インタフェース640から出力する。復号時には、復号プログラムをハードディスク650からRAM620にロードし、入力信号を復号プログラムに従って処理してオーディオ信号サンプルを出力する。
【0018】
この発明による符号化方法および復号化方法を実行するプログラムは、内部バス680に駆動装置660を介して接続された外部ディスク装置670に記録されたものを使用しても良い。或いは、インタフェース640を介して外部ネットワークからプログラムをダウンロードしてハードディスク650に格納したものでも良い。この発明による符号化、復号化方法を実行するプログラムが記録された記憶媒体としては、磁気記録媒体、ICメモリ、コンパクトディスクなどの形態の記憶媒体であっても良い。
【0019】
【発明の効果】
上述した通りであって、この発明は、帯域毎に異なる形状を持つ広帯域音声楽音信号を効率的に符号化、復号化することができる。音声楽音信号は、これを周波数を横軸にとり、パワーを縦軸にとって一例として帯域に分割して示した場合、これら3帯域はそれぞれ各別の異なる形状のスペクトルを持つ。ベクトル量子化に使用する全体として一定量のビット数およびベクトル長を、各帯域別の一定値により固定的に割り当てることをしないで、各帯域の重要度、必要性を勘案しこれに対応した適正な分配、割り当てを行うことにより、広帯域の音声楽音信号を効率的に符号化する。
【図面の簡単な説明】
【図1】ベクトル量子化利用の変換符号化方法の一例を説明する図。
【図2】第1の実施例における符号化器を説明する図。
【図3】第2の実施例における符号化器を説明する図。
【図4】第1の実施例における復号化器を説明する図。
【図5】第2の実施例における復号化器を説明する図。
【図6】符号化、復号化方法を実施するコンピュータを示す図。
【符号の説明】
201 帯域分割フィルタ
210、211、212 MDCT変換部
220、221、222 LPC分析部
230、231、232 LPC平坦化部
240、241、242 パワー正規化部
250、251、252 残差計算部
260、261、262 ベクトル量子化部
270 ベクトル長量子化ビット割り当て部
400 帯域合成フィルタ
410、411、412 逆MDCT変換部
420、421、422 LPC合成部
430、431、432 LPC逆平坦化部
440、441、442 パワー逆正規化部
450、451、452 残差逆平坦化部
460、461、462 ベクトル量子化復号部

Claims (6)

  1. 離散音声楽音信号サンプルを入力としてディジタル符号を出力する音声楽音信号符号化方法において、
    時間系列の信号を一定数の入力サンプル毎に帯域分割フィルタにより帯域分割し、複数の帯域別時間系列の信号を求め、
    帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎にMDCT変換して周波数領域MDCT係数を求め、
    帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出し、
    帯域毎の周波数領域MDCT係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求め、
    帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワーで正規化し、パワー正規化インデックスおよび残差入力係数を求め、
    帯域毎のLPCスペクトル包絡、或いはパワー正規化インデックス、或いは残差入力係数からベクトル長と量子化ビット割り当てを行い、帯域毎の残差入力係数をベクトル長と量子化ビット割り当てによりベクトル量子化し、ベクトル量子化インデックスと、必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスを求める、
    ことを特徴とする音声楽音信号符号化方法。
  2. ディジタル符号を入力して音声楽音信号を再生する音声楽音信号復号化方法において、
    帯域毎のパワー正規化インデックスから再生正規化パワーを求め、
    帯域毎のLPCインデックスから再生LPCスペクトル包絡を求め、
    帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックスにより再生残差係数を求めてベクトル量子化復号化を行い、
    帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求め、
    帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を求め、
    帯域毎の再生MDCT係数を逆MDCT変換して複数の帯域別時間系列信号を求め、
    複数の帯域別時間系列信号から帯域合成フィルタにより時間系列の再生音声楽音信号を求める、
    ことを特徴とする音声楽音信号復号化方法。
  3. 離散音声楽音信号サンプルを入力としてディジタル符号を出力する音声楽音信号符号化装置において、
    時間系列の信号を一定数の入力サンプル毎に帯域分割し、複数の帯域別時間系列の信号を求める帯域分割フィルタを具備し、
    帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎にMDCT変換して周波数領域MDCT係数を求めるMDCT変換部を具備し、
    帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出するLPC分析部を具備し、
    帯域毎の周波数領域MDCT係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求めるLPC平坦化部を具備し、
    帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワー成分で正規化し、正規化パワーおよびパワー正規化インデックスを求めるパワー正規化部を具備し、
    帯域毎の入力平坦化係数を正規化パワーにより正規化し、残差入力係数を計算する残差計算部を具備し、
    LPCスペクトル包絡或いは正規化パワーから各帯域のベクトル量子化で使用するベクトル長とベクトル量子化に使用するビットの割り当てを計算するベクトル長量子化ビット割り当て部、或いは各帯域毎の残差入力係数から帯域毎にベクトル長と量子化ビット割り当ておよびベクトル量子化を行ない、ベクトル長インデックスと量子化ビット割り当てインデックスを求めるベクトル量子化部を具備する、
    ことを特徴とする音声楽音信号符号化装置。
  4. ディジタル符号を入力して音声楽音信号を再生する音声楽音信号復号化装置において、
    帯域毎のパワー正規化インデックスから再生正規化パワーを求めるパワー逆正規化部を具備し、
    帯域毎のLPCインデックスから再生LPCスペクトル包絡を求めるLPC合成部を具備し、
    帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックスにより再生残差係数を求めてベクトル量子化復号化を行うベクトル量子化復号部を具備し、
    帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求める残差逆平坦化部を具備し、
    帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を求めるLPC逆平坦化部を具備し、
    帯域毎の再生MDCT係数を逆MDCT変換して複数の帯域別時間系列信号を求める逆MDCT変換部を具備し、
    複数の帯域別時間系列信号から時間系列の再生音声楽音信号を求める帯域合成フィルタを具備する、
    ことを特徴とする音声楽音信号復号化装置。
  5. 時間系列の信号を一定数の入力サンプル毎に帯域分割フィルタにより帯域分割し、複数の帯域別時間系列の信号を求め、帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎にMDCT変換して周波数領域MDCT係数を求め、帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出し、帯域毎の周波数領域MDCT係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求め、帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワーで正規化し、パワー正規化インデックスおよび残差入力係数を求め、帯域毎の残差入力係数をそれぞれベクトル量子化によりベクトル量子化インデックスを求め、このベクトル量子化は、帯域毎にLPCスペクトル包絡、或いはパワー正規化インデックス、或いは残差入力係数からベクトル長と量子化ビット割り当てを行った後、ベクトル量子化を行い、必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスを求める指令を実行する音声楽音信号符号化プログラム。
  6. 帯域毎のパワー正規化インデックスから再生正規化パワーを求め、帯域毎のLPCインデックスから再生LPCスペクトル包絡を求め、帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックスにより再生残差係数を求めてベクトル量子化復号化を行い、帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求め、帯域毎の再生平坦化係数を帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を求め、帯域毎の再生MDCT係数を逆MDCT変換して複数の帯域別時間系列信号を求め、複数の帯域別時間系列信号から帯域合成フィルタにより時間系列の再生音声楽音信号を求める指令を実行する音声楽音信号復号化プログラム。
JP2003035256A 2003-02-13 2003-02-13 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム Expired - Lifetime JP4191503B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003035256A JP4191503B2 (ja) 2003-02-13 2003-02-13 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003035256A JP4191503B2 (ja) 2003-02-13 2003-02-13 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム

Publications (2)

Publication Number Publication Date
JP2004246038A true JP2004246038A (ja) 2004-09-02
JP4191503B2 JP4191503B2 (ja) 2008-12-03

Family

ID=33020733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003035256A Expired - Lifetime JP4191503B2 (ja) 2003-02-13 2003-02-13 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム

Country Status (1)

Country Link
JP (1) JP4191503B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2456682C2 (ru) * 2008-01-04 2012-07-20 Долби Интернэшнл Аб Аудиокодер и декодер
JP2013534328A (ja) * 2010-07-30 2013-09-02 クゥアルコム・インコーポレイテッド ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体
JP2014510305A (ja) * 2011-02-14 2014-04-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法
US8843380B2 (en) 2008-01-31 2014-09-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding residual signals and method and apparatus for decoding residual signals
RU2541864C2 (ru) * 2010-04-13 2015-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудио или видео кодер, аудио или видео и относящиеся к ним способы для обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8924201B2 (en) 2008-01-04 2014-12-30 Dolby International Ab Audio encoder and decoder
US8484019B2 (en) 2008-01-04 2013-07-09 Dolby Laboratories Licensing Corporation Audio encoder and decoder
US8494863B2 (en) 2008-01-04 2013-07-23 Dolby Laboratories Licensing Corporation Audio encoder and decoder with long term prediction
RU2456682C2 (ru) * 2008-01-04 2012-07-20 Долби Интернэшнл Аб Аудиокодер и декодер
RU2696292C2 (ru) * 2008-01-04 2019-08-01 Долби Интернэшнл Аб Аудиокодер и декодер
RU2562375C2 (ru) * 2008-01-04 2015-09-10 Долби Интернэшнл Аб Аудиокодер и декодер
US8938387B2 (en) 2008-01-04 2015-01-20 Dolby Laboratories Licensing Corporation Audio encoder and decoder
US8843380B2 (en) 2008-01-31 2014-09-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding residual signals and method and apparatus for decoding residual signals
USRE49464E1 (en) 2010-04-13 2023-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49511E1 (en) 2010-04-13 2023-04-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
RU2541864C2 (ru) * 2010-04-13 2015-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудио или видео кодер, аудио или видео и относящиеся к ним способы для обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания
US9398294B2 (en) 2010-04-13 2016-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49717E1 (en) 2010-04-13 2023-10-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49549E1 (en) 2010-04-13 2023-06-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49453E1 (en) 2010-04-13 2023-03-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49469E1 (en) 2010-04-13 2023-03-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multichannel audio or video signals using a variable prediction direction
USRE49492E1 (en) 2010-04-13 2023-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
US8831933B2 (en) 2010-07-30 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP2013534328A (ja) * 2010-07-30 2013-09-02 クゥアルコム・インコーポレイテッド ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
JP2014510305A (ja) * 2011-02-14 2014-04-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Also Published As

Publication number Publication date
JP4191503B2 (ja) 2008-12-03

Similar Documents

Publication Publication Date Title
JP4742087B2 (ja) オーディオ信号の2重変換符号化
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
CN106941003B (zh) 能量无损编码方法和设备以及能量无损解码方法和设备
US7599833B2 (en) Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
WO2002103685A1 (fr) Appareil et procede de codage, appareil et procede de decodage et programme
JP3406275B2 (ja) ディジタル信号符号化方法、ディジタル信号復号化方法、これらの装置及びその各プログラム記録媒体
KR102204136B1 (ko) 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JP2003140692A (ja) 符号化装置及び復号化装置
JP3487250B2 (ja) 符号化音声信号形式変換装置
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
JP2003228399A (ja) 符号化装置、復号化装置および音響データ配信システム
JP2002091497A (ja) オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体
JP4848049B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP2006047561A (ja) オーディオ信号符号化装置およびオーディオ信号復号化装置
KR100975522B1 (ko) 스케일러블 오디오 복/부호화 방법 및 장치
JP4618823B2 (ja) 信号符号化装置及び方法
JPH0451100A (ja) 音声情報圧縮装置
JP4195598B2 (ja) 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050124

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080909

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080918

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4191503

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130926

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term