JP4191503B2 - Speech musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program - Google Patents
Speech musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program Download PDFInfo
- Publication number
- JP4191503B2 JP4191503B2 JP2003035256A JP2003035256A JP4191503B2 JP 4191503 B2 JP4191503 B2 JP 4191503B2 JP 2003035256 A JP2003035256 A JP 2003035256A JP 2003035256 A JP2003035256 A JP 2003035256A JP 4191503 B2 JP4191503 B2 JP 4191503B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- power
- reproduction
- coefficient
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【産業上の利用分野】
この発明は音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラムに関し、特に、音声楽音の周波数帯域を分割して帯域毎に残差係数に対するベクトル長およびビット割り当てを行い音声楽音信号を高能率にディジタル符号に変換符号化して、このディジタル信号を音声楽音信号に復元復号化する音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、および符号化プログラム、復号化プログラムに関する。
【0002】
【従来の技術】
音声信号および楽音信号を圧縮する従来方法として、入力信号をMDCT(modified discrete cosine transform:変形離散コサイン変換)により一定サンプルの入力毎に時間/周波数変換し、周波数領域の一連の係数に変換してから符号化を行なう変換符号化方法が知られている。一例として、図1に示されるが如きTwinVQ方式(transfer-domain weighted interleave vector quantization:周波数領域重み付けインタリーブベクトル量子化)(非特許文献1、特許文献1 参照)は、MDCTにより変換した周波数領域MDCT係数をLPC(linear predictiv coefficient:線形予測係数)スペクトル包絡、2段階のパワーにより平坦化を行ない、得られる出力信号、即ち、残差信号を重み付けベクトル量子化により量子化する方法である。
【0003】
ベクトル量子化は、目標ベクトルとの間の距離が最小となるコードベクトルをコードブックから選択し、復号化装置でベクトルを先のコードベクトルから再生する方法である。この符号化方法は、低いビットレートでも高音質な符号化がなされるが、効率的に符号化するには符号化するベクトルを或る程度の長さの、即ち、5〜6次元の長さのベクトルに設定する必要がある。しかし、ベクトル長を長くするとパワー変動が急峻なデータを符号化する際に大きな符号化歪が発生するという問題がある。また、ベクトル長を短くすると、各ベクトルを符号化するに使用することができるビットが減るところから、目標ベクトルに近いコードベクトルがコードブック中に存在しない状態になりやすく、これが大きな符号化歪を発生させる原因となる。
【0004】
【特許文献1】
特開平08−044399号公報
【非特許文献1】
岩上、守谷、三樹、「周波数領域重み付けインターリーブベクトル量子化によるオーディオ符号化」、日本音響学会秋季講演論文、pp.339−340、1994−10
【0005】
【発明が解決しようとする課題】
この発明は、広帯域入力信号のスペクトルを符号化する音声楽音信号の変換符号化方法において帯域毎に異なる形状を持つスペクトルを効率的に符号化する方法およびこの符号化された信号を復号化する帯域分割音声楽音信号符号化方法、復号化方法およびこれらの方法を実行するプログラム記憶媒体を提供するものである。
【0006】
【課題を解決するための手段】
離散音声楽音信号サンプルを入力としてディジタル符号を出力する音声楽音信号符号化方法において、時間系列の信号を一定数の入力サンプル毎に帯域分割フィルタにより帯域分割し、複数の帯域別時間系列の信号を求め、帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎にMDCT変換して周波数領域MDCT係数を求め、帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出し、帯域毎の周波数領域MDCT係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求め、帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワーで正規化し、パワー正規化インデックスおよび残差入力係数を求め、帯域毎の残差入力係数をそれぞれベクトル量子化によりベクトル量子化インデックスを求め、このベクトル量子化は、帯域毎にLPCスペクトル包絡、或はパワー正規化インデックス、或いは残差入力係数からベクトル長と量子化ビット割り当ておよびベクトル量子化を行い、必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスを求める音声楽音信号符号化方法を構成した。
【0007】
そして、ディジタル符号を入力して音声楽音信号を再生する音声楽音信号復号化方法において、帯域毎のパワー正規化インデックスから再生正規化パワーを求め、帯域毎のLPCインデックスから再生LPCスペクトル包絡を求め、帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックスにより再生残差係数を求めてベクトル量子化復号化を行い、帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求め、帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を求め、帯域毎の再生MDCT係数を逆MDCT変換して複数の帯域別時間系列信号を求め、複数の帯域別時間系列信号から帯域合成フィルタにより時間系列の再生音声楽音信号を求める音声楽音信号復号化方法を構成した。
【0008】
また、離散音声楽音信号サンプルを入力としてディジタル符号を出力する音声楽音信号符号化装置において、時間系列の信号を一定数の入力サンプル毎に帯域分割し、複数の帯域別時間系列の信号を求める帯域分割フィルタを具備し、帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎にMDCT変換して周波数領域MDCT係数を求めるMDCT変換部210、211、212を具備し、帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出するLPC分析部220、221、222を具備し、帯域毎の周波数領域MDCT係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求めるLPC平坦化部230、231、232を具備し、帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワー成分で正規化し、正規化パワーおよびパワー正規化インデックスを求めるパワー正規化部240、241、242を具備し、帯域毎の入力平坦化係数を正規化パワーにより正規化し、残差入力係数を計算する残差計算部250、251、252を具備し、LPCスペクトル包絡、或いは正規化パワー、或いは残差入力係数から各帯域のベクトル量子化で使用するベクトル長とベクトル量子化に使用するビットの割り当てを計算するベクトル長量子化ビット割り当て部270を具備し、帯域毎にベクトル長と量子化ビット割り当ておよびベクトル量子化を行ない、必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスを求めるベクトル量子化部260、261、262を具備する音声楽音信号符号化装置を構成した。
【0009】
更に、ディジタル符号を入力して音声楽音信号を再生する音声楽音信号復号化装置において、帯域毎のパワー正規化インデックスから再生正規化パワーを求めるパワー逆正規化部440、441、442を具備し、帯域毎のLPCインデックスから再生LPCスペクトル包絡を求めるLPC合成部420、421、422を具備し、帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックスにより再生残差係数を求めてベクトル量子化復号化を行うベクトル量子化復号部460、461、462を具備し、帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求める残差逆平坦化部450、451、452を具備し、帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を求めるLPC逆平坦化部430、431、432を具備し、帯域毎の再生MDCT係数を逆MDCT変換して複数の帯域別時間系列信号を求める逆MDCT変換部410、411、412を具備し、複数の帯域別時間系列信号から時間系列の再生音声楽音信号を求める帯域合成フィルタ400を具備する音声楽音信号復号化装置を構成した。
【0010】
ここで、時間系列の信号を一定数の入力サンプル毎に帯域分割フィルタにより帯域分割し、複数の帯域別時間系列の信号を求め、帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎にMDCT変換して周波数領域MDCT係数を求め、帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出し、帯域毎の周波数領域MDCT係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求め、帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワーで正規化し、パワー正規化インデックスおよび残差入力係数を求め、帯域毎の残差入力係数をそれぞれベクトル量子化によりベクトル量子化インデックスを求め、このベクトル量子化は、帯域毎にベクトル長と量子化ビット割り当ておよびベクトル量子化を行ない、必要に応じてベクトル長インデックスと量子化ビット割り当てインデックスを求める指令を実行する音声楽音信号符号化プログラムを構成した。
【0011】
そして、帯域毎のパワー正規化インデックスから再生正規化パワーを求め、帯域毎のLPCインデックスから再生LPCスペクトル包絡を求め、帯域毎にベクトル長と量子化ビット割り当てを行い、ベクトル量子化インデックスにより再生残差係数を求めてベクトル量子化復号化を行い、帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求め、帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を求め、帯域毎の再生MDCT係数を逆MDCT変換して複数の帯域別時間系列信号を求め、複数の帯域別時間系列信号から帯域合成フィルタにより時間系列の再生音声楽音信号を求める指令を実行する音声楽音信号復号化プログラムを構成した。
【0012】
【発明の実施の形態】
符号器は、入力された信号系列を一定時間毎に帯域分割フィルタにより複数帯域に分割し、それぞれの時間系列信号をMDCTにより周波数領域のMDCT係数に変換し、LPCスペクトル包絡により正規化を行ない平坦化入力係数を算出した後、パワーにより正規化を行ない、残差入力係数を得る。帯域毎に計算されるLPCスペクトル包絡とパワー正規化係数と残差入力係数より、各帯域においてベクトル量子化に使用するビット数およびベクトル長を計算し、各帯域毎に算出される残差入力係数をベクトル量子化する。
復号器は、ベクトル量子化復号を行ない再生平坦化係数を算出する。この再生平坦化係数を再生正規化パワーおよび再生LPCスペクトル包絡により逆平坦化を行なった後、周波数/時間変換により帯域別出力時間領域信号を得て、これら出力時間領域信号を帯域合成フィルタにより合成し、出力信号を得る。この方法は、各帯域の重要度に応じた品質の制御を特に低ビットレートの符号化に効果のあるベクトル量子化により実現することができる。
【0013】
【実施例】
この発明の実施例を図を参照して説明する。
図2および図4はこの発明の第1の実施例を説明する図である。図2に示される第1の実施例における符号化装置は、帯域分割フィルタ部200とMDCT変換部210、211、212と、LPC分析部220、221、222と、LPC平坦化部230、231、232と、パワー正規化部240、241、242と、残差計算部250、251、252と、ベクトル量子化部260、261、262と、ベクトル長量子化ビット割り当て部270より構成される。入力端子201から入力した入力信号である音声楽音信号の離散サンプル列は、帯域分割フィルタ部200に入力される。入力信号は帯域分割フィルタ部200において帯域別時間系列信号に変換される。この実施例において、入力信号は3帯域に分割している。一例として、0kHzから16kHzに亘る広帯域の音声楽音信号を32kHzでサンプリングして入力信号とし、この入力信号をOkHzから4kHz迄の帯域、4kHzから8kHz迄の帯域、8kHzから16kHz迄の帯域の3帯域に分割すると効果が高い。この通りに3分割された帯域別時間系列信号は、各帯域のMDCT変換部210、211、212に入力され、ここにおいて変形離散コサイン変換によりそれぞれ周波数領域の入力MDCT係数に変換されて、各帯域のLPC平坦化部230、231、232に送信される。3分割された帯域別時間系列信号は、また、各帯域のLPC分析部220、221、222にも入力され、ここにおいてこの入力信号に基づいてLPCスペクトル包絡が算出され、各帯域のLPC平坦化部230、231、232とベクトル長量子化ビット割り当て部270に送信される。ここで、ベクトル長、量子化ビット割り当てには、以下の3通りがある。
(A)LPCスペクトル包絡より求める。
(B)パワー正規化インデックスより求める。
(C)残差入力係数から求める。この場合のみベクトル長インデックスと量子化ビット割り当てインデックスが必要とされる。
【0014】
入力MDCT係数については、効率的な量子化を行なうために、各帯域のLPC平坦化部230、231、232においてLPCスペクトル包絡により平坦化された平坦化入力係数が計算され、それぞれ各帯域のパワー正規化部240、241、242と残差計算部250、251、252とに送信される。各帯域のパワー正規化部240、241、242は、平坦化入力係数からのパワー成分を計算し、正規化パワーをそれぞれの残差計算部250、251、252とベクトル長量子化ビット割り当て部270に送信する。以上の計算は、一定数サンプルにおける平均パワーの平方根、一定数サンプル内での最大振幅の絶対値を使用すると効果的である。
各帯域の残差計算部250、251、252は、入力平坦化係数を正規化パワーにより正規化し、残差入力係数を計算し、計算結果をそれぞれのベクトル量子化部260、261、262に送信する。ベクトル長量子化ビット割り当て部270は、LPCスペクトル包絡と正規化パワーから各帯域のベクトル量子化で使用するベクトル長とベクトル量子化に使用するビットの割り当てを計算し、計算結果を各帯域のベクトル量子化部260、261、262に送信する。ここで、例えば、ベクトル長の上限をVs−t、下限をVs−bとし、各帯域の正規化パワーの平均をP(k)(kは帯域番号)とすると、帯域番号kにおけるベクトル量子化部で使用するベクトル長V(k)は、
【数1】
但し、(int)は整数化を表す。
により計算することができる。ここで、例えば、Vs−t=6、Vs−b=2とすることにより、効果的なベクトル長を決定することができる。また、ベクトルVs−t(k、n)(kは帯域番号、nはベクトル番号)のビット割り当てBit(V−t(k、n))は、帯域別に符号化に使用することができるビット数をBit−total(k)とし、LPCスペクトルをLPC(k、s)(kは帯域番号、sはサンプル番号)とすると、
【数2】
により計算することができる。各帯域のベクトル量子化部260、261、262は、残差入力係数を、ベクトル長、ビット割り当て情報を用いてベクトル量子化して、ベクトル量子化インデックスを計算する。
ベクトル長を、その帯域の正規化残差パワーの全帯域パワーの合計に対する比に基づいて決められることにより、パワーが大きくなる程ベクトル長を短く設定することができる。そして、式(2)および後で説明される式(4)の内のs∈V_t(k、n)とは、V_t(k、n)(帯域kにおけるn番目のベクトル)に含まれるベクトル長個分あるベクトル要素サンプルsを示し、式(2)(4)においてベクトル要素サンプルsに関するLPCスペクトル和を計算することにより、ベクトルのパワーが大きい程多くの情報量が割り当てられる。以上のことから、パワーが大きな帯域ほどベクトル長を短くし、ビット割り当てを多く設定することにより、帯域内パワー変動が激しくとも符号化品質劣化を抑制することができる。ここで、ベクトル長は帯域毎に決定され、帯域別で且つビット割り当て応じた符号帳を使用する。符号帳にはビット割り当てに応じた個数の符号ベクトルが符号と対応付けて記憶されている。この個数は、一般に、2のビット割り当て個数乗個であり、ビット割り当てが多いほどベクトル個数が大きい。復号化においても、ベクトル長、ビット割り当て決定後にこの様な符号帳を使用し、入力符号に対するベクトルを再生する。
【0015】
図4に示される第1の実施例における復号化装置は、帯域合成フィルタ400と、逆MDCT変換部410、411、412と、LPC合成部420、421、422と、LPC逆平坦化部430、431、432と、パワー逆正規化部440、441、442と、残差逆平坦化部450、451、452と、ベクトル量子化復号部460、461、462と、ベクトル長量子化ビット割り当て部470から構成される。LPC合成部420、421、422、パワー逆正規化部440、441、442、ベクトル量子化復号部460、461、462から入力された符号ビット列を復号し、時間領域の離散サンプル列である音声楽音信号を出力端子401から出力する。即ち、各帯域のLPC合成部420、421、422は入力されたLPCインデックスから再生LPCスペクトル包絡を算出し、LPC逆平坦化部430、431、432とベクトル長量子化ビット割り当て部470に送信する。また、パワー逆正規化部440、441、442は入力されたパワー正規化インデックスから正規化パワーを計算して、残差逆平坦化部450、451、452とベクトル長量子化ビット割り当て部470に送信する。ベクトル長量子化ビット割り当て部470は、図2に示されるベクトル長量子化ビット割り当て部270と同様の計算により、各帯域でベクトル量子化に使用するベクトル長およびビット割り当てを計算し、計算結果を各帯域のベクトル量子化復号部460、461、462に送信する。各帯域のベクトル量子化復号部460、461、462は、ベクトル量子化インデックスと以上において計算されたベクトル長、量子化ビット割り当てを使ってベクトル量子化復号を行ない、再生残差係数を計算し、計算結果をそれぞれの残差逆平坦化部450、451、452に送信する。各帯域の残差逆平坦化部450、451、452は、再生残差係数を正規化パワーにより逆正規化し、再生平坦化係数を算出し、計算結果をそれぞれのLPC逆平坦化部430、431、432に送信する。各帯域のLPC逆平坦化部430、431、432は、再生平坦化係数を再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を計算して、それぞれの逆MDCT変換部410、411、412に送信する。各帯域の逆MDCT変換部410、411、412は、再生MDCT係数を逆MDCT計算することで、帯域別時間系列信号を計算し、計算結果を帯域合成フィルタ部400に送信する。帯域合成フィルタ部400は、各帯域から出力された時間系列信号を合成し、時間領域の出力サンプル系列に変換し、復号結果として出力端子401から出力される。
以上の図2および図4による第1の実施例の場合は、ベクトル長、ビット割り当てを、帯域毎に、符号化の対象となるパワー正規化係数、包絡成分から算出するので、ベクトル長、ビット割り当てに関する情報を符号化出力とする必要はない。従って、復号化においては、伝送したパワー正規化係数、包絡成分に基づいてベクトル長、ビット割り当てを行った上で伝送符号からの残差成分の再生を行っている。
【0016】
図3および図5はにこの発明の第2の実施例を説明する図である。
図3に示される符号化装置は、帯域分割フィルタ部300と、MDCT変換部310、311、312と、LPC分析部320、321、322と、LPC平坦化部330、331、332と、パワー正規化部340、341、342と、残差計算部350、351、352と、ベクトル量子化部360、361、362と、ベクトル長量子化ビット割り当て部370より構成され、音声楽音信号の離散サンプル列を端子301に入力し、符号化したビット列をLPC分析部320、321、322、パワー正規化部340、341、342、ベクトル量子化部360、361、362より出力する。即ち、入力信号は入力端子301を介して帯域分割フィルタ部300に入力され、ここにおいて帯域別時間系列信号に変換される。この実施例においては、入力信号は3帯域に分割される。一例として、0kHzから16kHzに亘る広帯域の音声楽音信号を32kHzでサンプリングして入力信号とし、この入力信号を0kHzから4kHz迄の帯域、4kHzから8kHz迄の帯域、8kHzから16kHz迄の帯域の3帯域に分割すると効果が高い。この通りに3分割された帯域別時間系列信号は、各帯域のMDCT変換部310、311、312において、変形離散コサイン変換によりそれぞれ周波数領域の入力MDCT係数に変換され、変換結果を対応するLPC平坦化部330、331、332に送信する。3分割された帯域別時間系列信号は、また、対応するLPC分析部320、321、322にも送信され、ここにおいてLPCスペクトル包絡が入力信号より算出され、LPC平坦化部330、331、332に送信される。入力MDCT係数について、効率的な量子化を行なうために、対応するLPC平坦化部330、331、332においてLPCスペクトル包絡により平坦化されて平坦化入力係数が計算され、対応する残差計算部350、351、352とパワー正規化部340、341、342に送信される。各帯域のパワー正規化部340、341、342は平坦化入力係数からのパワー成分を計算し、残差計算部350、351、352に送信する。以上の計算は、一定数サンプルにおける平均パワーの平方根、一定数サンプル内での最大振幅の絶対値を使用すると効果的である。各帯域の残差計算部350、351、352は、入力平坦化係数を正規化パワーにより正規化し、残差入力係数を計算し、対応するベクトル量子化部260、261、262とベクトル長量子化ビット割り当て部370に送信する。ベクトル長量子化ビット割り当て部370は、残差入力係数から各帯域のベクトル量子化で使用するベクトル長とベクトル量子化に使用するビットの割り当てを計算し、ベクトル長および量子化ビット割り当てを対応するベクトル量子化部360、361、362に送信する。そして、これらベクトル量子化部360、361、362はベクトル量子化インデックスを計算する。ここで、例えば、ベクトル長の上限をVs−t、下限をVs−bとし、各帯域の残差入力信号のパワーをP(k、s)(kは帯域番号、sはサンプル番号)とすると、帯域番号kのベクトル量子化におけるベクトル長V(k)は
【数3】
但し、(int)は整数化を表す。
により計算することができる。ここで、例えばVs−t=6、Vs−b=2とすることにより、効果的なベクトル長を決定することができる。また、各帯域におけるベクトルV−t(k、n)(kは帯域番号、nはベクトル番号)のビット割り当てBit(V−t(k、n))は、帯域別に符号化に使用することができるビット数をBit−total(k)としたとき、
【数4】
により計算することができる。各帯域のベクトル量子化部360、361、362は、残差入力係数を、ベクトル長、ビット割り当て情報を用いてベクトル量子化し、ベクトル量子化インデックスを計算する。
図5に示される第2の実施例における復号化装置は各帯域の帯域合成フィルタ500と、逆MDCT変換部510、511、512と、LPC合成部520、521、522と、LPC逆平坦化部530、531、532と、パワー逆正規化部540、541、542と、残差逆平坦化部550、551、552と、ベクトル量子化復号部560、561、562から構成されて、LPC合成部520、521、522、パワー逆正規化部540、541、542、ベクトル量子化復号部560、561、562から入力された符号ビット列を復号し、時間領域の離散サンプル列である音声楽音信号を出力端子501から出力する。即ち、各帯域のLPC合成部520、521、522は、入力されたLPCインデックスから再生LPCスペクトル包絡を算出し、対応するLPC逆平坦化部530、531、532に送信する。また、各帯域のパワー逆正規化部540、541、542は、パワー正規化インデックスから正規化パワーを計算し、残差逆平坦化部550、551,552に送信する。各帯域のベクトル量子化復号部560、561、562は、ベクトル量子化インデックスとベクトル長および量子化ビット割り当てからベクトル量子化復号を行ない、再生残差係数を計算し、残差逆平坦化部550、551、552に送信する。各帯域の残差逆平坦化部550、551、552は、再生残差係数を正規化パワーにより逆正規化し、再生平坦化係数を算出し、LPC逆平坦化部530、531、532に送信する。LPC逆平坦化部530、531、532は、再生平坦化係数を再生LPCスペクトル包絡により逆平坦化し、再生MDCT係数を計算して、逆MDCT変換部510、511、512に送信する。逆MDCT変換部510、511、512は再生MDCT係数を逆MDCT計算することで、帯域別時間系列信号を計算し、帯域合成フィルタ部500に送信する。帯域合成フィルタ部500は、各帯域から出力された時間系列信号を合成し、時間領域の出力サンプル系列に変換し、復号結果として出力端子501に出力する。
以上の図3および図5による第2の実施例の場合は、残差成分に対するベクトル長、ビット割り当てを量子化前の値に基づいて行うので、ベクトル長、ビット割り当て情報を符号化し、復号においてはこれらを再生してベクトル長、ビット割り当てを決めてから残差成分を再生するところが、第1の実施例と異なるところである。
【0017】
図6はこの発明による符号化方法および復号化方法をコンピュータで実施する場合の構成を示す。コンピュータ600は、バス680を介して互いに接続されたCPU610、RAM620、ROM630、入出カインタフェース640、ハードディスク650を含んでいる。ROM630にはコンピュータ600を動作させる基本プログラムが格納されており、ハードディスク650は前述したこの発明による符号化方法および復号化方法を実行するプログラムが予め格納されている。
符号化時には、CPU610はハードディスク650から符号化プログラムをRAM620にロードし、インタフニース640から入力されたオーディオ信号サンプルを符号化プログラムに従って処理することにより符号化し、インタフェース640から出力する。復号時には、復号プログラムをハードディスク650からRAM620にロードし、入力信号を復号プログラムに従って処理してオーディオ信号サンプルを出力する。
【0018】
この発明による符号化方法および復号化方法を実行するプログラムは、内部バス680に駆動装置660を介して接続された外部ディスク装置670に記録されたものを使用しても良い。或いは、インタフェース640を介して外部ネットワークからプログラムをダウンロードしてハードディスク650に格納したものでも良い。この発明による符号化、復号化方法を実行するプログラムが記録された記憶媒体としては、磁気記録媒体、ICメモリ、コンパクトディスクなどの形態の記憶媒体であっても良い。
【0019】
【発明の効果】
上述した通りであって、この発明は、帯域毎に異なる形状を持つ広帯域音声楽音信号を効率的に符号化、復号化することができる。音声楽音信号は、これを周波数を横軸にとり、パワーを縦軸にとって一例として帯域に分割して示した場合、これら3帯域はそれぞれ各別の異なる形状のスペクトルを持つ。ベクトル量子化に使用する全体として一定量のビット数およびベクトル長を、各帯域別の一定値により固定的に割り当てることをしないで、各帯域の重要度、必要性を勘案しこれに対応した適正な分配、割り当てを行うことにより、広帯域の音声楽音信号を効率的に符号化する。
【図面の簡単な説明】
【図1】ベクトル量子化利用の変換符号化方法の一例を説明する図。
【図2】第1の実施例における符号化器を説明する図。
【図3】第2の実施例における符号化器を説明する図。
【図4】第1の実施例における復号化器を説明する図。
【図5】第2の実施例における復号化器を説明する図。
【図6】符号化、復号化方法を実施するコンピュータを示す図。
【符号の説明】
201 帯域分割フィルタ
210、211、212 MDCT変換部
220、221、222 LPC分析部
230、231、232 LPC平坦化部
240、241、242 パワー正規化部
250、251、252 残差計算部
260、261、262 ベクトル量子化部
270 ベクトル長量子化ビット割り当て部
400 帯域合成フィルタ
410、411、412 逆MDCT変換部
420、421、422 LPC合成部
430、431、432 LPC逆平坦化部
440、441、442 パワー逆正規化部
450、451、452 残差逆平坦化部
460、461、462 ベクトル量子化復号部[0001]
[Industrial application fields]
The present invention relates to a voice tone signal encoding method, a decoding method, an encoding device, a decoding device, an encoding program, and a decoding program, and more particularly to dividing a frequency band of a voice tone into a residual coefficient for each band. Voice musical tone signal encoding method, decoding method, encoding device, and decoding, which performs vector length and bit allocation and converts and encodes a voice musical tone signal into a digital code with high efficiency and restores the digital signal to a voice musical tone signal. The present invention relates to an encoding device, an encoding program, and a decoding program.
[0002]
[Prior art]
As a conventional method for compressing audio signals and musical tone signals, the input signal is converted into a series of coefficients in the frequency domain by MDCT (modified discrete cosine transform) for time / frequency conversion for each input of a fixed sample. A transform coding method for performing coding from the above is known. As an example, as shown in FIG. 1, the TwinVQ method (transfer-domain weighted interleave vector quantization) (see
[0003]
Vector quantization is a method in which a code vector that minimizes the distance to a target vector is selected from the code book, and the vector is reproduced from the previous code vector by a decoding device. In this encoding method, encoding with high sound quality is performed even at a low bit rate. However, for efficient encoding, a vector to be encoded has a certain length, that is, a length of 5 to 6 dimensions. Must be set to a vector of However, when the vector length is increased, there is a problem that a large encoding distortion occurs when encoding data with a sharp power fluctuation. Also, if the vector length is shortened, the number of bits that can be used to encode each vector is reduced, so that a code vector close to the target vector tends not to exist in the codebook, which causes a large coding distortion. Cause it to occur.
[0004]
[Patent Document 1]
Japanese Patent Laid-Open No. 08-044399
[Non-Patent Document 1]
Iwakami, Moriya, Miki, “Audio coding by frequency domain weighted interleaved vector quantization”, Acoustical Society of Japan Autumn Lecture, pp. 339-340, 1994-10
[0005]
[Problems to be solved by the invention]
The present invention relates to a method for efficiently encoding a spectrum having a different shape for each band and a band for decoding the encoded signal in a method for transforming and encoding a voice tone signal for encoding a spectrum of a wideband input signal. A divided voice musical tone signal encoding method, a decoding method, and a program storage medium for executing these methods are provided.
[0006]
[Means for Solving the Problems]
In a speech tone signal encoding method in which a discrete speech tone signal sample is input and a digital code is output, a time-series signal is band-divided by a band-splitting filter for each predetermined number of input samples, and a plurality of time-series time-series signals are obtained. The frequency domain MDCT coefficient is obtained by performing MDCT conversion for each predetermined number of input samples for each band, and frequency domain MDCT coefficients are obtained from each band time series signal to perform linear prediction analysis for each band to obtain an LPC spectrum envelope and The LPC index is calculated, the frequency domain MDCT coefficient for each band is flattened by the LPC spectrum envelope for each band to obtain a flattened input coefficient, and the flattened input coefficient for each band is normalized by the power for each fixed number of input sample coefficients. And calculate the power normalization index and residual input coefficient. A vector quantization index is obtained by quantization, and this vector quantization is performed by assigning the vector length and quantization bit and vector quantization from the LPC spectrum envelope, power normalization index, or residual input coefficient for each band. A speech tone signal encoding method for obtaining a vector length index and a quantization bit allocation index according to the above is constructed.
[0007]
Then, in a voice music signal decoding method for inputting a digital code and reproducing a voice music signal, a reproduction normalization power is obtained from a power normalization index for each band, and a reproduction LPC spectrum envelope is obtained from an LPC index for each band. Vector length and quantization bit allocation are performed for each band, reproduction residual coefficient is obtained by vector quantization index, vector quantization decoding is performed, and reproduction residual coefficient for each band is inversely flattened by reproduction normalization power, The reproduction flattening coefficient is obtained, the reproduction flattening coefficient for each band is inversely flattened by the reproduction LPC spectrum envelope for each band, the reproduction MDCT coefficient is obtained, the reproduction MDCT coefficient for each band is subjected to inverse MDCT conversion, and a plurality of bands are obtained. Time sequence signal is obtained, and a time-series playback voice tone signal is obtained from multiple time sequence signals by band synthesis filter. We configured the audio tone signal decoding method for obtaining.
[0008]
In addition, in a voice tone signal encoding apparatus that outputs a digital code with a discrete voice tone signal sample as an input, a band for dividing a time-series signal into a predetermined number of input samples and obtaining a plurality of time-series signals by band
[0009]
Furthermore, in the voice musical tone signal decoding apparatus for inputting the digital code and reproducing the voice musical tone signal,
[0010]
Here, the time-series signal is band-divided by a band-division filter for every fixed number of input samples to obtain a plurality of time-series signals by band, and the time-series signal is divided into a certain number of input samples for each band. The frequency domain MDCT coefficient is obtained by performing MDCT conversion to the frequency domain, linear prediction analysis is performed for each band from the time-series signal of each band to calculate the LPC spectrum envelope and the LPC index, and the frequency domain MDCT coefficient for each band is converted to the LPC for each band. A flattened input coefficient is obtained by flattening with the spectral envelope, and the flattened input coefficient for each band is normalized with the power for each of a certain number of input sample coefficients to obtain a power normalization index and a residual input coefficient. A vector quantization index is obtained by vector quantization for each difference input coefficient, and this vector quantization is performed by vector length for each band. It performs quantization bit allocation and vector quantization, to constitute a speech sound signal encoding program for executing a command for obtaining the vector length index and the quantization bit allocation indexes as necessary.
[0011]
Then, the reproduction normalization power is obtained from the power normalization index for each band, the reproduction LPC spectrum envelope is obtained from the LPC index for each band, the vector length and the quantization bit are assigned for each band, and the reproduction residual is obtained by the vector quantization index. Vector quantization decoding is performed by obtaining the difference coefficient, and the reproduction residual coefficient for each band is inversely flattened by the reproduction normalization power, the reproduction flattening coefficient is obtained, and the reproduction flattening coefficient for each band is reproduced for each band. Inverse flattening by LPC spectrum envelope to obtain reproduction MDCT coefficients, inverse MDCT conversion of reproduction MDCT coefficients for each band to obtain a plurality of time-series signals by band, and time series by a band synthesis filter from the plurality of time-series signals by band A voice musical tone signal decoding program for executing a command for obtaining a reproduced voice musical tone signal is constructed.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
The encoder divides the input signal sequence into a plurality of bands by a band division filter at regular intervals, converts each time sequence signal into MDCT coefficients in the frequency domain by MDCT, normalizes by LPC spectrum envelope, and flattens After calculating the normalized input coefficient, normalization is performed by power to obtain a residual input coefficient. The number of bits and vector length used for vector quantization in each band are calculated from the LPC spectrum envelope, power normalization coefficient, and residual input coefficient calculated for each band, and the residual input coefficient calculated for each band. Is vector quantized.
The decoder performs vector quantization decoding and calculates a reproduction flattening coefficient. The playback flattening coefficient is inversely flattened using the playback normalization power and playback LPC spectrum envelope, and then output time domain signals are obtained by frequency / time conversion, and these output time domain signals are synthesized by a band synthesis filter. And an output signal is obtained. In this method, quality control according to the importance of each band can be realized by vector quantization which is particularly effective for low bit rate coding.
[0013]
【Example】
An embodiment of the present invention will be described with reference to the drawings.
2 and 4 are views for explaining a first embodiment of the present invention. 2 includes a band
(A) Obtained from LPC spectrum envelope.
(B) Obtained from the power normalization index.
(C) Obtain from the residual input coefficient. Only in this case a vector length index and a quantization bit allocation index are required.
[0014]
For the input MDCT coefficients, in order to perform efficient quantization, the flattened input coefficients flattened by the LPC spectrum envelope are calculated in the
The
[Expression 1]
However, (int) represents integerization.
Can be calculated. Here, for example, by setting Vs−t = 6 and Vs−b = 2, an effective vector length can be determined. Further, the bit allocation Bit (Vt (k, n)) of the vector Vs-t (k, n) (k is a band number, n is a vector number) is the number of bits that can be used for encoding by band. Is Bit-total (k), and LPC spectrum is LPC (k, s) (k is a band number, s is a sample number),
[Expression 2]
Can be calculated. The
By determining the vector length based on the ratio of the normalized residual power of the band to the sum of all band powers, the vector length can be set shorter as the power increases. SεV_t (k, n) in the expression (2) and the expression (4) described later is a vector length included in V_t (k, n) (the nth vector in the band k). A certain number of vector element samples s are shown, and by calculating the LPC spectrum sum related to the vector element samples s in equations (2) and (4), a larger amount of information is allocated as the vector power increases. From the above, by reducing the vector length and setting a larger bit allocation for a band with higher power, it is possible to suppress deterioration in encoding quality even if the in-band power fluctuation is severe. Here, the vector length is determined for each band, and a codebook corresponding to each band and corresponding to bit allocation is used. The code book stores a number of code vectors corresponding to bit allocation in association with codes. This number is generally a power of 2 bit allocations, and the greater the bit allocation, the larger the vector number. Also in decoding, after determining the vector length and bit allocation, such a codebook is used to reproduce the vector for the input code.
[0015]
4 includes a
In the case of the first embodiment shown in FIGS. 2 and 4, the vector length and the bit allocation are calculated from the power normalization coefficient and the envelope component to be encoded for each band. It is not necessary to use information relating to allocation as an encoded output. Accordingly, in decoding, a vector length and bit allocation are performed based on the transmitted power normalization coefficient and envelope component, and then the residual component from the transmission code is reproduced.
[0016]
3 and 5 are views for explaining a second embodiment of the present invention.
3 includes a band
[Equation 3]
However, (int) represents integerization.
Can be calculated. Here, for example, by setting Vs−t = 6 and Vs−b = 2, an effective vector length can be determined. In addition, the bit allocation Bit (Vt (k, n)) of the vector Vt (k, n) (k is a band number, n is a vector number) in each band may be used for encoding for each band. When the number of possible bits is Bit-total (k),
[Expression 4]
Can be calculated. The
The decoding apparatus in the second embodiment shown in FIG. 5 includes a
In the case of the second embodiment shown in FIGS. 3 and 5 above, since the vector length and bit allocation for the residual component are performed based on the values before quantization, the vector length and bit allocation information are encoded and decoded. Is different from the first embodiment in that the residual component is reproduced after the vector length and bit allocation are determined by reproducing them.
[0017]
FIG. 6 shows a configuration when the encoding method and the decoding method according to the present invention are implemented by a computer. The
At the time of encoding, the
[0018]
As a program for executing the encoding method and the decoding method according to the present invention, those recorded in the
[0019]
【The invention's effect】
As described above, the present invention can efficiently encode and decode a wideband audio musical tone signal having a different shape for each band. When the voice tone signal is divided into bands as an example with the frequency on the horizontal axis and the power on the vertical axis, these three bands each have a spectrum of a different shape. Do not assign a fixed number of bits and vector length as a whole for vector quantization with a fixed value for each band, but consider the importance and necessity of each band and make sure it is appropriate By performing appropriate distribution and allocation, a wideband voice musical sound signal is efficiently encoded.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining an example of a transform coding method using vector quantization.
FIG. 2 is a diagram for explaining an encoder in the first embodiment;
FIG. 3 is a diagram for explaining an encoder in a second embodiment;
FIG. 4 is a diagram illustrating a decoder in the first embodiment.
FIG. 5 is a diagram for explaining a decoder according to a second embodiment.
FIG. 6 is a diagram illustrating a computer that performs an encoding / decoding method.
[Explanation of symbols]
201 Band-splitting filter
210, 211, 212 MDCT converter
220, 221, 222 LPC analysis section
230, 231, 232 LPC flattening section
240, 241, 242 Power normalization unit
250, 251, 252 Residual calculator
260, 261, 262 Vector quantization unit
270 Vector length quantization bit allocation unit
400 band synthesis filter
410, 411, 412 Inverse MDCT converter
420, 421, 422 LPC synthesis unit
430, 431, 432 LPC reverse flattening section
440, 441, 442 Power denormalization unit
450, 451, 452 Residual inverse flattening section
460, 461, 462 Vector quantization decoding unit
Claims (6)
時間系列の信号を一定数の入力サンプル毎に帯域分割フィルタにより帯域分割し、複数の帯域別時間系列の信号を求め、
帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎に周波数領域に変換して周波数領域係数を求め、
帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出し、
帯域毎の周波数領域係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求め、
帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワーで正規化し、パワー正規化インデックスおよび残差入力係数を求め、
帯域毎に、該帯域のパワーの全帯域のパワーに対する割合が高い程ベクトル長が短くなり、該帯域のパワーの全帯域のパワーに対する割合が低い程ベクトル長が長くなるよう、ベクトル量子化で使用するベクトル長を決定し、
帯域毎の残差入力係数を前記決定されたベクトル長によりベクトル量子化してベクトル量子化インデックスを求める、
ことを特徴とする音声楽音信号符号化方法。In a voice tone signal encoding method for outputting a digital code by using a discrete voice tone signal sample as an input,
A time-series signal is band-divided by a band-splitting filter for every certain number of input samples, and a plurality of time-series signals are obtained by band.
Seeking frequency domain coefficients are converted into a frequency domain signal of a band-specific time sequence for each input sample of the certain number for each band,
Perform linear prediction analysis for each band from the time-series signal of each band to calculate the LPC spectrum envelope and LPC index,
Seeking flattening input factor planarized by LPC spectrum envelope of each band the frequency domain coefficients for each band,
Normalize the flattened input coefficient for each band by power for a certain number of input sample coefficients, find the power normalization index and residual input coefficient,
Used in vector quantization so that for each band, the vector length decreases as the ratio of the band power to the power of the entire band increases, and the vector length increases as the ratio of the power of the band to the power of the entire band decreases. Determine the vector length to be
Obtaining a vector quantization index residual input coefficient for each band by more vector quantization on the determined vector length,
A voice musical sound signal encoding method characterized by the above.
帯域毎のパワー正規化インデックスから再生正規化パワーを求め、
帯域毎のLPCインデックスから再生LPCスペクトル包絡を求め、
帯域毎に、該帯域の再生正規化パワーの全帯域の再生正規化パワーに対する割合が高い程ベクトル長が短くなり、該帯域の再生正規化パワーの全帯域の再生正規化パワーに対する割合が低い程ベクトル長が長くなるよう、ベクトル量子化復号化で使用するベクトル長を決定し、
ベクトル量子化インデックスにより前記決定されたベクトル長を有する符号帳を用いてベクトル量子化復号化を行い再生残差係数を求め、
帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求め、
帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生周波数領域係数を求め、
帯域毎の再生周波数領域係数を時間領域に変換して複数の帯域別時間系列信号を求め、
複数の帯域別時間系列信号から帯域合成フィルタにより時間系列の再生音声楽音信号を求める、
ことを特徴とする音声楽音信号復号化方法。In a voice music signal decoding method for inputting a digital code and reproducing a voice music signal,
Obtain the playback normalization power from the power normalization index for each band,
Obtain the playback LPC spectrum envelope from the LPC index for each band,
For each band, the higher the ratio of the reproduction normalization power of the band to the reproduction normalization power of the entire band, the shorter the vector length, and the lower the ratio of the reproduction normalization power of the band to the reproduction normalization power of the entire band, the lower the vector length. Determine the vector length to be used in vector quantization decoding so that the vector length becomes longer,
A vector quantization decoding is performed using a codebook having the vector length determined by the vector quantization index to obtain a reproduction residual coefficient ,
The playback residual coefficient for each band is inversely flattened by the playback normalization power, and the playback flattening coefficient is obtained.
The reproduction flattening coefficient for each band is inversely flattened by the reproduction LPC spectrum envelope for each band, and the reproduction frequency domain coefficient is obtained.
By converting the reproduction frequency domain coefficient for each band to the time domain, a plurality of time series signals by band are obtained,
Obtaining a time-series playback voice musical sound signal from a plurality of time-series signals by band using a band synthesis filter,
A voice musical sound signal decoding method characterized by the above.
時間系列の信号を一定数の入力サンプル毎に帯域分割し、複数の帯域別時間系列の信号を求める帯域分割フィルタを具備し、
帯域別時間系列の信号を帯域毎に一定数の入力サンプル毎に周波数領域に変換して周波数領域係数を求める周波数領域変換部を具備し、
帯域別時間系列の信号から帯域毎に線形予測分析を行なってLPCスペクトル包絡およびLPCインデックスを算出するLPC分析部を具備し、
帯域毎の周波数領域係数を帯域毎のLPCスペクトル包絡により平坦化して平坦化入力係数を求めるLPC平坦化部を具備し、
帯域毎の平坦化入力係数を一定数の入力サンプル係数毎にパワー成分で正規化し、正規化パワーおよびパワー正規化インデックスを求めるパワー正規化部を具備し、
帯域毎の入力平坦化係数を正規化パワーにより正規化し、残差入力係数を計算する残差計算部を具備し、
帯域毎に、該帯域のパワーの全帯域のパワーに対する割合が高い程ベクトル長が短くなり、該帯域のパワーの全帯域のパワーに対する割合が低い程ベクトル長が長くなるよう、ベクトル量子化で使用するベクトル長を計算するベクトル長量子化ビット割り当て部を具備し、
該帯域の残差入力係数を前記決定されたベクトル長によりベクトル量子化してベクトル量子化インデックスを求めるベクトル量子化部を具備する、
ことを特徴とする音声楽音信号符号化装置。In a voice musical sound signal encoding apparatus for outputting a digital code with a discrete voice musical sound signal sample as an input,
A band division filter that divides a time-series signal into a certain number of input samples and obtains a plurality of time-series time-series signals,
Comprising a frequency domain conversion unit for obtaining the frequency domain coefficients are transformed into the frequency domain signals of the band-specific time sequence for each input sample of the certain number for each band,
An LPC analysis unit that performs linear prediction analysis for each band from a time-series signal of each band to calculate an LPC spectrum envelope and an LPC index,
Planarized by LPC spectrum envelope of each band the frequency domain coefficients of each band comprises a LPC flattening unit for obtaining a planarization input coefficients,
A power normalization unit that normalizes a flattened input coefficient for each band with a power component for each of a certain number of input sample coefficients, and obtains a normalized power and a power normalized index,
Normalizing the input flattening coefficient for each band with the normalized power, and comprising a residual calculation unit for calculating the residual input coefficient,
Used in vector quantization so that for each band, the vector length decreases as the ratio of the band power to the power of the entire band increases, and the vector length increases as the ratio of the power of the band to the power of the entire band decreases. A vector length quantization bit allocation unit for calculating a vector length to be
A vector quantization unit that performs vector quantization on the residual input coefficient of the band by the determined vector length to obtain a vector quantization index;
A voice musical sound signal encoding device characterized by the above.
帯域毎のパワー正規化インデックスから再生正規化パワーを求めるパワー逆正規化部を具備し、
帯域毎のLPCインデックスから再生LPCスペクトル包絡を求めるLPC合成部を具備し、
帯域毎に、該帯域の再生正規化パワーの全帯域の再生正規化パワーに対する割合が高い程ベクトル長が短くなり、該帯域の再生正規化パワーの全帯域の再生正規化パワーに対する割合が低い程ベクトル長が長くなるよう、ベクトル量子化復号化で使用するベクトル長を計算するベクトル長量子化ビット割り当て部を具備し、
帯域毎に計算されたベクトル長とベクトル量子化インデックスを用いてベクトル量子化復号化を行い、再生残差係数を求めるベクトル量子化復号部を具備し、
帯域毎の再生残差係数を再生正規化パワーにより逆平坦化し、再生平坦化係数を求める残差逆平坦化部を具備し、
帯域毎の再生平坦化係数を、帯域毎の再生LPCスペクトル包絡により逆平坦化し、再生周波数領域係数を求めるLPC逆平坦化部を具備し、
帯域毎の再生周波数領域係数を時間領域に変換して複数の帯域別時間系列信号を求める時間領域変換部を具備し、
複数の帯域別時間系列信号から時間系列の再生音声楽音信号を求める帯域合成フィルタを具備する、
ことを特徴とする音声楽音信号復号化装置。In a voice music signal decoding apparatus for inputting a digital code and reproducing a voice music signal,
A power denormalization unit for obtaining a reproduction normalization power from a power normalization index for each band;
An LPC synthesis unit for obtaining a reproduction LPC spectrum envelope from an LPC index for each band;
For each band, the higher the ratio of the reproduction normalization power of the band to the reproduction normalization power of the entire band, the shorter the vector length, and the lower the ratio of the reproduction normalization power of the band to the reproduction normalization power of the entire band, the lower the vector length. A vector length quantization bit allocation unit for calculating a vector length to be used in vector quantization decoding so that the vector length becomes longer;
A vector quantization decoding unit that performs vector quantization decoding using a vector length and a vector quantization index calculated for each band, and obtains a reproduction residual coefficient ;
A residual deflating unit that obtains a reproduction flattening coefficient by deflating a reproduction residual coefficient for each band using a reproduction normalization power,
An LPC inverse flattening unit for obtaining a reproduction frequency domain coefficient by inversely flattening the reproduction flattening coefficient for each band by a reproduction LPC spectrum envelope for each band;
The reproduction frequency domain coefficients for each band by converting the time domain comprises a time domain conversion unit for obtaining a plurality of bands by time series signal,
A band synthesizing filter for obtaining a time-series reproduced voice musical sound signal from a plurality of time-series signals by band;
A voice musical tone signal decoding apparatus characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003035256A JP4191503B2 (en) | 2003-02-13 | 2003-02-13 | Speech musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003035256A JP4191503B2 (en) | 2003-02-13 | 2003-02-13 | Speech musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004246038A JP2004246038A (en) | 2004-09-02 |
JP4191503B2 true JP4191503B2 (en) | 2008-12-03 |
Family
ID=33020733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003035256A Expired - Lifetime JP4191503B2 (en) | 2003-02-13 | 2003-02-13 | Speech musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4191503B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
KR101441897B1 (en) | 2008-01-31 | 2014-09-23 | 삼성전자주식회사 | Method and apparatus for encoding residual signals and method and apparatus for decoding residual signals |
EP3779975B1 (en) | 2010-04-13 | 2023-07-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder and related methods for processing multi-channel audio signals using a variable prediction direction |
US9236063B2 (en) * | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
PL2676265T3 (en) * | 2011-02-14 | 2019-09-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using an aligned look-ahead portion |
KR101525185B1 (en) | 2011-02-14 | 2015-06-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
-
2003
- 2003-02-13 JP JP2003035256A patent/JP4191503B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2004246038A (en) | 2004-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5175028B2 (en) | Digital signal encoding method and apparatus, and decoding method and apparatus | |
JP5788833B2 (en) | Audio signal encoding method, audio signal decoding method, and recording medium | |
TW201724087A (en) | Apparatus for coding envelope of signal and apparatus for decoding thereof | |
WO2006054583A1 (en) | Audio signal encoding apparatus and method | |
EP1047047B1 (en) | Audio signal coding and decoding methods and apparatus and recording media with programs therefor | |
KR20070074546A (en) | Method and device for transcoding | |
KR101143792B1 (en) | Signal encoding device and method, and signal decoding device and method | |
JP3900000B2 (en) | Encoding method and apparatus, decoding method and apparatus, and program | |
JP3434260B2 (en) | Audio signal encoding method and decoding method, these devices and program recording medium | |
JP3353868B2 (en) | Audio signal conversion encoding method and decoding method | |
JP3406275B2 (en) | Digital signal encoding method, digital signal decoding method, these devices and their respective program recording media | |
JPH07261800A (en) | Transformation encoding method, decoding method | |
JP3344944B2 (en) | Audio signal encoding device, audio signal decoding device, audio signal encoding method, and audio signal decoding method | |
JP4191503B2 (en) | Speech musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program | |
JP2003140692A (en) | Coding device and decoding device | |
JP4359949B2 (en) | Signal encoding apparatus and method, and signal decoding apparatus and method | |
JP2003110429A (en) | Coding method and device, decoding method and device, transmission method and device, and storage medium | |
JPH10268897A (en) | Signal coding method and device therefor | |
JP3557164B2 (en) | Audio signal encoding method and program storage medium for executing the method | |
WO1999044291A1 (en) | Coding device and coding method, decoding device and decoding method, program recording medium, and data recording medium | |
JP2523286B2 (en) | Speech encoding and decoding method | |
JP4848049B2 (en) | Encoding method, decoding method, apparatus thereof, program, and recording medium | |
JP4024185B2 (en) | Digital data encoding device | |
JP4618823B2 (en) | Signal encoding apparatus and method | |
JP3361790B2 (en) | Audio signal encoding method, audio signal decoding method, audio signal encoding / decoding device, and recording medium recording program for implementing the method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050124 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080918 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4191503 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130926 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |