JP3887598B2 - 確率的符号帳の音源の符号化方法及び復号化方法 - Google Patents
確率的符号帳の音源の符号化方法及び復号化方法 Download PDFInfo
- Publication number
- JP3887598B2 JP3887598B2 JP2002330768A JP2002330768A JP3887598B2 JP 3887598 B2 JP3887598 B2 JP 3887598B2 JP 2002330768 A JP2002330768 A JP 2002330768A JP 2002330768 A JP2002330768 A JP 2002330768A JP 3887598 B2 JP3887598 B2 JP 3887598B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- channel
- source waveform
- candidate
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
Description
【発明の属する技術分野】
本発明は、CELP方式の音声符号化装置/音声復号装置における確率的符号帳の音源の符号化方法/復号化方法に関する。
【0002】
【従来の技術】
インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声信号を伝送する場合、音声信号の伝送効率を高めるため、圧縮・符号化技術がよく使われる。これまでに多くの音声符号化方式が開発されており、CELP方式等、近年開発された低ビットレート音声符号化方式の多くは、音声信号をスペクトル包絡情報とスペクトルの微細構造情報とに分離し、分離した情報をそれぞれ圧縮・符号化する方式である(例えば、非特許文献1)。
【0003】
CELP方式の音声符号化装置では、適応符号帳が格納している適応コードベクトルと、確率的符号帳が格納している固定コードベクトルの全組み合わせについて合成音声ベクトルを計算し、各合成音声と入力音声信号との距離計算を行い、距離が最小となる適応コードベクトルのインデクスと固定コードベクトルのインデクス求める。
【0004】
ここで、確率的符号帳の1つとして、代数的符号帳(Algebraic Codebook)が知られている。この符号帳は、比較的少ない計算量で確率的符号帳の探索を行うことができることから、近年のCELPで多く用いられている符号帳である。
【0005】
代数的符号帳の音源は、少数の振幅1で極性(+、−)のあるパルスで構成され、パルス位置(この場合の音源波形候補)は互いに重ならないような配置となる。
【0006】
例えば、サブフレーム32、パルス本数(=チャネル数)4の場合、各チャネルのパルスの数は32/4=8で、第0チャネルのパルス位置ici0[i0]、第1チャネルのパルス位置ici1[i1]、第2チャネルのパルス位置ici2[i2]、第3チャネルのパルス位置ici3[i3]は以下のようになる。なお、i0、i1、i2、i3は各チャネルのインデクスを示す。
ici0[i0]={0, 4, 8,12,16,20,24,28}
ici1[i1]={1, 5, 9,13,17,21,25,29}
ici2[i2]={2, 6,10,14,18,22,26,30}
ici3[i3]={3, 7,11,15,19,23,27,31}
【0007】
従来の確率的符号帳は、各チャネルのパルス位置を独立に符号化し、これと極性の符号を合わせた符号を確率的音源の符号としている。
【0008】
例えば、上記のサブフレーム32、チャネル数4の場合、従来の確率的符号帳103は、各チャネルのパルス位置を3ビットで表現し、極性の符号と合わせて、(3+1)×4=16ビットの符号により符号化する。
【0009】
【非特許文献1】
M.R.Schroeder, B.S.Atal, "Code Excited Linear Prediction: High Quality Speech at Low Bit Rate", IEEE proc., ICASSP'85 pp.937-940
【0010】
【発明が解決しようとする課題】
しかしながら、上記従来の確率的符号帳の符号化方法では、ビットレートが低くなると、各チャネルに割り当てられるビットも限られ、パルスが全く立たない位置が存在するようになり、符号(位置情報)に対応する音源波形のヴァリエーションが激減するため、音質劣化が起こるという問題を有している。
【0011】
例えば、上記サブフレーム32、チャネル数4の場合、16ビット未満で符号化するとパルスが全く立たない位置が存在するようになる。
【0012】
本発明はかかる点に鑑みてなされたものであり、確率的符号帳のパルスを符号化する際のビット数の削減を図りながら、パルスが全く立たない位置が存在しないようにヴァリエーションを確保することができる確率的符号帳の音源の符号化方法及び復号化方法を提供することを目的とする。
【0013】
【課題を解決するための手段】
本発明は、複数のチャネルに分かれている確率的符号帳の音源の符号化方法及び復号化方法であって、符号化方法においては、所定のチャネルの音源波形候補を他のチャネルの音源波形候補と関連付けし、関連付けられた前記所定のチャネルの音源波形候補と前記他のチャネルの音源波形候補とを用いて符号化歪を最小化する音源波形を探索する探索ステップと、探索により求められた前記音源波形の符号を用いて確率的符号帳の音源の符号を決定する符号化ステップと、を具備し、前記探索ステップでは、前記他のチャネルの音源波形候補を特定する番号の変化に対応して前記所定のチャネルの音源波形候補が変化する関連付けを行い、変化後の前記他のチャネルの音源波形候補を特定する番号と、前記関連付けに基づいて変化した前記所定のチャネルの音源波形候補とを、予め設定された関数に用いて関数値を算出し、前記関数値を用いて、前記符号化歪を最小化する各チャネルの音源波形候補を探索により求め、前記符号化ステップでは、前記符号化歪を最小化する前記各チャネルの音源波形候補を前記音源波形として符号化することにより前記音源波形の符号を求め、前記音源波形の符号を用いて確率的符号帳の音源の符号を決定する。また、復号化方法においては、得られた音源波形の符号に基づいて各チャネルの音源波形候補を生成する音源波形候補生成ステップと、所定のチャネルの音源波形候補と他のチャネルの音源波形候補との関連付けを実行することで音源波形を復号化する復号化ステップと、を具備し、前記復号化ステップでは、前記他のチャネルの音源波形候補を特定する番号を変化させることで前記所定のチャネルの音源波形候補を変化させる関連付けの処理を実行することで音源波形を復号化する、方法を採る。
【0014】
本発明の符号化方法は、前記探索ステップでは、前記他のチャネルの音源波形候補を特定する番号を変化させることで前記所定のチャネルの音源波形候補を変化させる関連付けの処理を予め設定された回数について繰り返し行うループ計算を、チャネルの数nだけ多重化したn重ループとして行うことで前記音源波形を探索し、前記ループ計算は、所定のループにて前記他のチャネルの音源波形候補を特定する番号を変化させることで、前記所定のループよりも内側のループの前記所定のチャネルの音源波形候補を変化させる、方法を採る。
【0015】
本発明の符号化方法及び復号化方法は、確率的符号帳が代数的符号帳であり、音源波形候補がパルス位置である方法を採る。
【0016】
本発明の符号化方法及び復号化方法は、前記関連付けは、前記所定のチャネルの音源波形候補を、前記他のチャネルの音源波形候補を特定する番号を用いた剰余演算結果にて関連付ける方法を採る。
【0017】
これらの方法により、確率的音源を従来よりも少ないビット数で表現することができ、かつ、パルスが全く立たない位置が存在しないようにヴァリエーションを確保することができる。
【0018】
本発明の音声符号化装置は、上記いずれかの符号化方法により確率的符号帳の音源を符号化する構成を採る。また、本発明の音声復号装置は、上記いずれかの復号化方法に対応した確率的符号帳の音源の復号を行う構成を採る。
【0019】
これらの構成により、確率的音源を従来よりも少ないビット数で表現することができ、かつ、パルスが全く立たない位置が存在しないようにヴァリエーションを確保することができる。
【0020】
【発明の実施の形態】
本発明の骨子は、所定のチャネルのパルス位置を他のチャネルのパルス位置と関連付け、所定のアルゴリズムによりパルス位置を探索し、探索されたパルス位置の符号と極性の符号とを確率的音源の符号とすることである。
【0021】
図1は、CELP方式の音声符号化装置の構成を示すブロック図である。なお、入力音声信号は、20ms程度の時間間隔で区切られた処理フレームごとに、音声符号化装置に逐次入力されるものとする。
【0022】
処理フレームごとに音声符号化装置に入力された入力音声信号は、まず、LPC分析部101に供給される。LPC分析部101は、入力音声信号をLPC(Linear Predictive Coding)分析してLPC係数を取得し、LPC係数をベクトル量子化してLPC符号とし、このLPC符号を復号して復号化LPC係数を得る。
【0023】
音源作成部104は、適応符号帳102及び確率的符号帳103から、それぞれ適応コードベクトル及び固定コードベクトルを読み出して、LPC合成部105へ送る。LPC合成部105は、音源作成部104から供給される適応コードベクトル及び固定コードベクトルを、LPC分析部101より与えられる復号化LPC係数をフィルタ係数にもつ全極型の合成フィルタでそれぞれ合成フィルタリングし、合成適応コードベクトル及び合成固定コードベクトルを得る。
【0024】
比較部106は、LPC合成部105から出力される合成適応コードベクトルと合成固定コードベクトルと入力音声信号との関係を分析して、合成適応コードベクトルに乗じる適応符号帳最適ゲインと合成固定コードベクトルに乗じる確率的符号帳最適ゲインをそれぞれ求める。
【0025】
また、比較部106は、合成適応コードベクトルに適応符号帳最適ゲインを乗じて得られるベクトルと、合成固定コードベクトルに確率的符号帳最適ゲインを乗じて得られるベクトルとを加算して合成音声ベクトルを取得し、合成音声と入力音声信号との距離計算を行う。そして、比較部106は、適応符号帳102が格納している適応コードベクトルと、確率的符号帳103が格納している固定コードベクトルの全組み合わせについて合成音声ベクトルを取得し、合成音声と入力音声信号との距離が最小となる適応コードベクトルのインデクスと固定コードベクトルのインデクス求める。そして、比較部106は、各符号帳から出力されるコードベクトルのインデクス、インデクスに対応するそれぞれのコードベクトル、並びにインデクスに対応する適応符号帳最適ゲイン及び確率的符号帳最適ゲインをパラメータ符号化部107へ送る。
【0026】
パラメータ符号化部107は、適応符号帳最適ゲインと確率的符号帳最適ゲインを符号化してゲイン符号を取得し、ゲイン符号と、LPC分析部101から与えられたLPC符号と、各符号帳のインデクスとを処理フレームごとにまとめて出力する。
【0027】
また、パラメータ符号化部107は、適応符号帳のインデクスに対応する適応コードベクトルにゲイン符号に対応する適応符号帳ゲインを乗じて得られるベクトルと、確率的符号帳のインデクスに対応する固定コードベクトルにゲイン符号に対応する確率的符号帳ゲインを乗じたベクトルとの2つベクトルを加算して駆動音源ベクトルを取得し、駆動音源ベクトルで適応符号帳102内の古い適応コードベクトルを更新する。
【0028】
なお、LPC合成部105における合成フィルタリングは、線形予測係数や、高域強調フィルタや、入力音声を長期予測分析して得られる長期予測係数を用いた聴感重み付けフィルタを併用するのが一般的である。
【0029】
また、適応符号帳と確率的符号帳の最適インデクスの探索、最適ゲインの算出、最適ゲインの符号化処理は、フレームを更に分割したサブフレーム単位で行われるのが一般的である。
【0030】
なお、音声復号装置(デコーダ)では、図1に示したLPC分析部101、適応符号帳102、確率的符号帳103、音源作成部104、LPC合成部105と同一の構成を備え、音声符号化装置から伝送されてきた各符号を復号して音源波形を得る。
【0031】
ここで、計算量を削減するために、比較部106では、通常、適応符号帳102の音源と確率的符号帳103の音源をオープンループにより探索する。以下、このオープンループによる探索手順を述べる。
(1)まず、音源作成部104が適応符号帳102のみから音源候補(適応音源)を次々に選び、LPC合成部105が合成音を生成し、比較部106が入力音声と合成音との比較を行って最適な適応符号帳102の符号を選択する。なお、この時のゲインは符号化歪が最も少なくなる値(最適ゲイン)であると仮定して選択を行う。
(2)次に、上記適応符号帳の符号を固定し、音源作成部104が適応符号帳102からは同じ音源を、確率的符号帳103が比較部106の符号に対応した音源(確率的音源)を次々に選択し、LPC合成部105が合成音を生成し、比較部106が両合成音の和と入力音声の比較を行って最適な確率的符号帳103の符号を決定する。なお、上記(1)と同様に、この時のゲインは符号化歪が最も少なくなる値(最適ゲイン)であることを仮定して選択を行う。
【0032】
以上の手順にて最適な音源を探索することにより、両符号帳の全ての音源の組み合わせを比較して最適な音源を探索する方法より、符号化性能は若干劣化するが、計算量は大幅に削減される。
【0033】
次に、確率的符号帳103の音源の探索方法の詳細について説明する。
音源の符号の導出は、以下の式(1)の符号化歪Eを最小化する音源を探索することにより行われる。なお、式(1)において、x:符号化ターゲット、p:適応音源のゲイン、H:聴感重み付け合成フィルタ、a:適応音源、q:確率的音源のゲイン、s:確率的音源である。
【0034】
【数1】
適応音源はオープンループで探索されるので、確率的符号帳103の符号の導出は以下の式(2)の符号化歪Eを最小化する確率的音源を探索することにより行われる。なお、式(2)において、y:確率的音源探索のターゲットベクトルである。
【0035】
【数2】
ここで、ゲインp、qは音源を探索した後で決定するものとし、ゲインp、q=1とすることにより、上記式(2)は以下の式(3)と書くことができる。
【0036】
【数3】
そして、この歪の式を最小化することは以下の式(4)の関数Cを最大化することと等価である。
【0037】
【数4】
従って、代数符号帳の音源のような少数パルスからなる音源の探索の場合は、yHとHHを予め計算しておけば、少ない計算量で上記関数Cを算出することができる。
【0038】
yHはベクトルyを逆順にしてマトリクスHを畳み込み、更にその結果を逆順にすることにより求めることができ、HHはマトリクス同士の掛け算により求めることができる。
【0039】
確率的符号帳103は、以下の(1)から(4)の手順により、確率的音源を探索して符号化する。
(1)まず、前処理として、ベクトルyHとマトリクスHHを算出する。
(2)次に、ベクトルyHの要素の極性(+−)から、事前にパルスの極性を決める。具体的には、各位置に立つパルスの極性をyHのその位置の値に合わせることとし、yHの値の極性を別の配列に格納しておく。各位置の極性を別の配列に格納した後、yHの値は全て絶対値をとり正の値に変換しておく。また、その極性にあわせてHHの値も極性を乗ずることによって変換しておく。
(3)次に、n重ループ(nはチャネル数)の探索アルゴリズムを用いて、yHとHHの値を加算することにより上記式(4)に示した関数Cを求め、この値が最大となる各チャネルのパルス位置を探索する。
(4)探索された各チャネルのパルス位置を符号化し、これと極性の符号を合わせた符号を確率的音源の符号とする。
【0040】
以下、本発明の各実施の形態に係る確率的音源の符号化方法について、添付図面を参照して詳細に説明する。なお、各実施の形態では、サブフレーム32、パルス本数(=チャネル数)4の代数的符号帳を用いて説明する。
【0041】
(実施の形態1)
実施の形態1では、所定のチャネルのインデクスを他のチャネルによって変化させる場合について説明する。
【0042】
本実施の形態では、第0チャネルのパルス位置ici0[i0]、第1チャネルのパルス位置ici1[j1]、第2チャネルのパルス位置ici2[j2]、第3チャネルのパルス位置ici3[j3]を以下のものとする。
ici0[i0]={0, 4, 8,12,16,20,24,28}
ici1[j1]={1, 5, 9,13,17,21,25,29}
ici2[j2]={2, 6,10,14,18,22,26,30}
ici3[j3]={3, 7,11,15,19,23,27,31}
【0043】
なお、i0(0≦i0≦7)は第0チャネルのインデクス、j1(0≦j1≦7)は第1チャネルのインデクス、j2(0≦j2≦7)は第2チャネルのインデクス、j3(0≦j3≦7)は第3チャネルのインデクスである。
【0044】
例えば、i0=0のパルス位置は{0}、i0=1のパルス位置は{4}・・・、j1=0のパルス位置は{1}、j1=1のパルス位置は{5}・・・となる。
【0045】
また、第1チャネル、第2チャネル、第3チャネルのパルスは、2個1組にグループ化される。例えば、第1チャネルは、第0グループ{1,5}、第1グループ{9,13}、第2グループ{17,21}、第3グループ{25,29}の4つにグループ化される。
【0046】
そして、i1(0≦i1≦3)を第1チャネルのグループインデクス、i2(0≦i2≦3)を第2チャネルのグループインデクス、i3(0≦i3≦3)を第3チャネルのグループインデクスとすると、インデクスj1、j2、j3とグループインデクスi1、i2、i3とは以下の式(5)の関係を有する。
j1=i1×2+(i0%2)
j2=i2×2+((i0+i1)%2)
j3=i3×2+((i1+i2)%2)・・・式(5)
【0047】
ただし、式(5)において、「%」はその左の数値(インデクス)を右の数値で除した際の剰余を求める演算である。なお、インデクスi0〜i3を2進数で表現すれば、「%」の演算は、その左のインデクスの最下位1ビットの符号を調べるだけで実現することができる。
【0048】
本実施の形態では、上記式(5)に示すように、第1から第3のチャネルのインデクスを他のチャネルのインデクスによって変化させる。例えば、第1チャネルのインデクスj1は第0チャネルのインデクスi0によって変化し、i0=0のときici1[j1]={1, 9,17,25}であり、i0=1のときici1[j1]={5,13,21,29}である。
【0049】
図2、図3は、本実施の形態に係る符号化方法における各チャネルのパルス探索アルゴリズムの一例を示すフロー図である。
【0050】
図2、図3において、第0ループはi0を0から7まで変化させるループであり、第1ループはi1を0から3まで変化させるループであり、第2ループはi2を0から3まで変化させるループであり、第3ループはi3を0から3まで変化させるループである。
【0051】
図2、図3では、まず、i0=0、i1=0、i2=0を固定し、第1段階として第3ループにて各i3におけるy、Hを算出し、その中の最大値ymax、Hmax、及び、そのときのi0、i1、i2、i3をそれぞれii0、ii1、ii2、ii3として保存する。この場合、探索される第3チャネルのパルス位置は、ici3[j3]={3,11,19,27}である。
【0052】
次に、第2段階として、第2ループにてi2をインクリメントさせ、各i2において上記第1段階の演算を行う。なお、i0=0、i1=0、i2=1の場合、第1段階で探索される第3チャネルのパルス位置は、ici3[j3]={7,15,23,31}である。このように、i0、i1、i2の値によって第1段階で探索される第3チャネルのパルス位置が変化する。
【0053】
次に、第3段階として、第1ループにてi1をインクリメントさせ、各i1において上記第1段階、第2段階の演算を行う。この場合、i0、i1の値によって第2段階で探索される第2チャネルのパルス位置が変化する。
【0054】
最後に、第4段階として、第0ループにてi0をインクリメントさせ、i0において上記第1段階、第2段階、第3段階の演算を行う。この場合、i0の値によって第3段階で探索される第1チャネルのパルス位置が変化する。
【0055】
このように、本実施の形態では、n重ループ(nはチャネル数)の探索アルゴリズムにおいて、ループの外側の符号に応じて内側のループの候補位置を変化させる。
【0056】
そして、探索した全てのパルス位置においてy、Hが最大となるii0、ii1、ii2、ii3を求める。
【0057】
この結果、ii0は3ビット、ii1、ii2、ii3は各2ビットなので、パルス位置は9ビットで符号化することができ、各チャネルの極性の符号(1ビット×4チャネル)と合わせて13ビットの符号により符号化することができる。従って、従来よりも符号化に必要なビット数を削減することができ、低ビットレート化を図ることができる。
【0058】
一方、第1から第3チャネルのインデクスj1、j2、j3はそれぞれ8箇所とることができるので、サブフレームにおいてパルスが全く立たない位置が存在せず、符号(位置情報)に対応する音源波形のヴァリエーションを確保することができ、音質劣化を防ぐことができる。
【0059】
このように、本実施の形態によれば、所定のチャネルのインデクスを他のチャネルによって変化させることにより、所定のチャネルのパルス位置を他のチャネルのパルス位置と関連付ける。これにより、確率的音源を従来よりも少ないビット数で表現することができ、かつ、パルスが全く立たない位置が存在しないようにヴァリエーションを確保することができる。
【0060】
(実施の形態2)
実施の形態2は、所定のチャネルのパルス位置そのものを他のチャネルによって変化させる場合について説明する。
【0061】
本実施の形態では、第0チャネルのパルス位置ici0[i0]、第1チャネルのパルス位置ici1[i1]、第2チャネルのパルス位置ici2[i2]、第3チャネルのパルス位置ici3[i3]を以下のものとする。ここで、第1から第3チャネルのパルス位置の1つ多い位置が存在しないことに注意されたい。
ici0[i0]={4, 7,12,15,20,23,28,31}
ici1[i1]={0, 8,16,24}
ici2[i2]={2,10,18,26}
ici3[i3]={5,13,21,29}
【0062】
なお、i0(0≦i0≦7)は第0チャネルのインデクス、i1(0≦i1≦3)は第1チャネルのインデクス、i2(0≦i2≦3)は第2チャネルのインデクス、i3(0≦i3≦3)は第3チャネルのインデクスである。
【0063】
例えば、i0=0のパルス位置は{4}、i0=1のパルス位置は{7}・・・、i1=0のパルス位置は{0}、i1=1のパルス位置は{8}・・・となる。
【0064】
そして、各チャネルのパルス位置ici0[i0]、ici1[i1]、ici2[i2]、ici3[i3]は、以下の式(6)によりインデクスi0、i1、i2、i3にてk0、k1、k2、k3に調整される。
k0=ici0[i0]
k1=ici1[i1]×2+(i0%2)
k2=ici0[i2]×2+((i0+i1)%2)
k3=ici0[i3]×2+((i1+i2)%2)・・・式(6)
【0065】
ただし、式(6)において、「%」はその左の数値(インデクス)を右の数値で除した際の剰余を求める演算である。
【0066】
上記式(6)に示すように、本実施の形態では、第1から第3のチャネルのパルスの位置そのものを他のチャネルによって変化させる。この結果、第0から第3チャネルの調整されたパルス位置k0、k1、k2、k3は以下のようになる。
k0={4, 7,12,15,20,23,28,31}
k1={0, 1, 8, 9,16,17,24,25}
k2={2, 3,10,11,18,19,26,27}
k3={5, 6,13,14,21,22,29,30}
【0067】
図4、図5は、本実施の形態に係る符号化方法における各チャネルのパルス探索アルゴリズムの一例を示すフロー図である。
【0068】
図4、図5において、第0ループはi0を0から7まで変化させるループであり、第1ループはi1を0から3まで変化させるループであり、第2ループはi2を0から3まで変化させるループであり、第3ループはi3を0から3まで変化させるループである。
【0069】
図4、図5では、まず、i0=0、i1=0、i2=0を固定し、第1段階として第3ループにて各i3におけるy、Hを算出し、その中の最大値ymax、Hmax、及び、そのときのi0、i1、i2、i3をそれぞれii0、ii1、ii2、ii3として保存する。
【0070】
次に、第2段階として、第2ループにてi2をインクリメントさせ、各i2において上記第1段階の演算を行う。
【0071】
次に、第3段階として、第1ループにてi1をインクリメントさせ、各i1において上記第1段階、第2段階の演算を行う。
【0072】
最後に、第4段階として、第0ループにてi0をインクリメントさせ、i0において上記第1段階、第2段階、第3段階の演算を行い、探索した全てのパルス位置においてy、Hが最大となるii0、ii1、ii2、ii3を求める。
【0073】
この結果、ii0は3ビット、ii1、ii2、ii3は各2ビットなので、パルス位置は9ビットで符号化することができ、各チャネルの極性の符号(1ビット×4チャネル)と合わせて13ビットの符号により符号化することができる。従って、従来よりも符号化に必要なビット数を削減することができ、低ビットレート化を図ることができる。
【0074】
一方、第1から第3チャネルの調整されたパルス位置(k1、k2、k3)はそれぞれ8箇所とることができるので、サブフレームにおいてパルスが全く立たない位置が存在せず、符号(位置情報)に対応する音源波形のヴァリエーションを確保することができ、音質劣化を防ぐことができる。
【0075】
このように、本実施の形態によれば、所定のチャネルのパルス位置そのものを他のチャネルによって変化させることにより、従来よりも少ないビット数で確率的音源を表現することができ、かつ、パルスが全く立たない位置が存在しないようにヴァリエーションを確保することができる。
【0076】
なお、音声復号装置に用意された確率的符号帳では、上記各実施の形態で符号化され、伝送された各チャネルの符号に対して上記探索アルゴリズムによる演算を行うことにより、音声符号化装置にて探索された確率的音源を求めることができる。
【0077】
なお、上記各実施の形態では、ヴァリエーションを2倍にするため2の剰余をとったが、本発明はこれに限られず、更なる低ビットレート化やサブフレーム長拡張のため剰余を取る数値を3以上に大きくする場合にも有効である。
【0078】
また、上記各実施の形態では、複数チャネルの情報を加算によって統合したが、本発明はこれに限られず、重み付き加算(定数を乗じて加算)や乱数発生器等より高度な関数を用いる場合にも有効である。
【0079】
また、上記各実施の形態では、剰余によって他のチャネルの情報を反映する値の抽出を行ったが、本発明はこれに限られず、乱数発生器や変換テーブルを用いる等、より高度な関数を用いる場合にも有効である。
【0080】
また、上記各実施の形態では、代数的符号帳を用いた場合でありインパルスの位置が符号に対応していたが、本発明はこれに限られず、確率的符号帳が部分波形の和で構成されておりその始端位置が符号に対応している場合にも有効である。
【0081】
また、上記各実施の形態では、代数的符号帳を用いた場合でありインパルスの位置が符号に対応していたが、本発明はこれに限られず、確率的符号帳がROMに格納された多数の固定波形で構成されており、その中の複数の和で音源波形が作成されており、その波形番号が符号に対応している場合にも有効である。この場合、「位置」を「波形番号」に置き換えれば本発明を容易に応用することができる。
【0082】
【発明の効果】
以上説明したように、本発明によれば、所定のチャネルのパルス位置を他のチャネルのパルス位置と関連付けて符号化し、これと極性の符号を合わせた符号を確率的符号帳の音源の符号とすることにより、確率的音源を従来よりも少ないビット数で表現することができ、かつ、パルスが全く立たない位置が存在しないようにヴァリエーションを確保することができる。
【図面の簡単な説明】
【図1】CELP方式の音声符号化装置の構成を示すブロック図
【図2】本発明の実施の形態1に係る符号化方法における各チャネルのパルス探索アルゴリズムの一例を示すフロー図
【図3】本発明の実施の形態1に係る符号化方法における各チャネルのパルス探索アルゴリズムの一例を示すフロー図
【図4】本発明の実施の形態2に係る符号化方法における各チャネルのパルス探索アルゴリズムの一例を示すフロー図
【図5】本発明の実施の形態2に係る符号化方法における各チャネルのパルス探索アルゴリズムの一例を示すフロー図
【符号の説明】
101 LPC分析部
102 適応符号帳
103 確率的符号帳
104 音源作成部
105 LPC合成部
106 比較部
107 パラメータ符号化部
Claims (9)
- 複数のチャネルに分かれている確率的符号帳の音源の符号化方法であって、
所定のチャネルの音源波形候補を他のチャネルの音源波形候補と関連付けし、関連付けられた前記所定のチャネルの音源波形候補と前記他のチャネルの音源波形候補とを用いて符号化歪を最小化する音源波形を探索する探索ステップと、
探索により求められた前記音源波形の符号を用いて確率的符号帳の音源の符号を決定する符号化ステップと、を具備し、
前記探索ステップでは、
前記他のチャネルの音源波形候補を特定する番号の変化に対応して前記所定のチャネルの音源波形候補が変化する関連付けを行い、
変化後の前記他のチャネルの音源波形候補を特定する番号と、前記関連付けに基づいて変化した前記所定のチャネルの音源波形候補とを、予め設定された関数に用いて関数値を算出し、
前記関数値を用いて、前記符号化歪を最小化する各チャネルの音源波形候補を探索により求め、
前記符号化ステップでは、
前記符号化歪を最小化する前記各チャネルの音源波形候補を前記音源波形として符号化することにより前記音源波形の符号を求め、
前記音源波形の符号を用いて確率的符号帳の音源の符号を決定する、
ことを特徴とする確率的符号帳の音源の符号化方法。 - 前記探索ステップでは、
前記他のチャネルの音源波形候補を特定する番号を変化させることで前記所定のチャネルの音源波形候補を変化させる関連付けの処理を予め設定された回数について繰り返し行うループ計算を、チャネルの数nだけ多重化したn重ループとして行うことで前記音源波形を探索し、
前記ループ計算は、
所定のループにて前記他のチャネルの音源波形候補を特定する番号を変化させることで、前記所定のループよりも内側のループの前記所定のチャネルの音源波形候補を変化させる、
ことを特徴とする請求項1記載の符号化方法。 - 前記確率的符号帳は代数的符号帳であり、前記音源波形候補はパルス位置であることを特徴とする請求項1又は請求項2記載の符号化方法。
- 前記関連付けは、前記所定のチャネルの音源波形候補を、前記他のチャネルの音源波形候補を特定する番号を用いた剰余演算結果にて関連付けることを特徴とする請求項1から請求項3のいずれかに記載の符号化方法。
- 請求項1から請求項4のいずれかに記載の符号化方法により確率的符号帳の音源を符号化することを特徴とする音声符号化装置。
- 複数のチャネルに分かれている確率的符号帳の音源の復号化方法であって、
得られた音源波形の符号に基づいて各チャネルの音源波形候補を生成する音源波形候補生成ステップと、
所定のチャネルの音源波形候補と他のチャネルの音源波形候補との関連付けを実行することで音源波形を復号化する復号化ステップと、を具備し、
前記復号化ステップでは、
前記他のチャネルの音源波形候補を特定する番号を変化させることで前記所定のチャネルの音源波形候補を変化させる関連付けの処理を実行することで音源波形を復号化する
ことを特徴とする確率的符号帳の音源の復号化方法。 - 前記確率的符号帳は代数的符号帳であり、前記音源波形候補はパルス位置であることを特徴とする請求項6記載の復号化方法。
- 前記関連付けは、前記所定のチャネルの音源波形候補を、前記他のチャネルの音源波形候補を特定する番号を用いた剰余演算結果にて関連付けることを特徴とする請求項6又は請求項7記載の復号化方法。
- 請求項6から請求項8のいずれかに記載の復号化方法により確率的符号帳の音源を復号化することを特徴とする音声復号化装置。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002330768A JP3887598B2 (ja) | 2002-11-14 | 2002-11-14 | 確率的符号帳の音源の符号化方法及び復号化方法 |
CN200380102998A CN100593196C (zh) | 2002-11-14 | 2003-11-11 | 概率式码薄的声源的编码方法 |
AU2003277667A AU2003277667A1 (en) | 2002-11-14 | 2003-11-11 | Method for encoding sound source of probabilistic code book |
US10/531,417 US7577566B2 (en) | 2002-11-14 | 2003-11-11 | Method for encoding sound source of probabilistic code book |
EP03811104A EP1548706A4 (en) | 2002-11-14 | 2003-11-11 | METHOD FOR CODING A SOUND SOUND WITH A PROBABILISTIC CODE BOOK |
KR1020057006362A KR100736504B1 (ko) | 2002-11-14 | 2003-11-11 | 확률적 코드북의 음원 부호화 방법 |
PCT/JP2003/014298 WO2004044893A1 (ja) | 2002-11-14 | 2003-11-11 | 確率的符号帳の音源の符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002330768A JP3887598B2 (ja) | 2002-11-14 | 2002-11-14 | 確率的符号帳の音源の符号化方法及び復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004163737A JP2004163737A (ja) | 2004-06-10 |
JP3887598B2 true JP3887598B2 (ja) | 2007-02-28 |
Family
ID=32310603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002330768A Expired - Fee Related JP3887598B2 (ja) | 2002-11-14 | 2002-11-14 | 確率的符号帳の音源の符号化方法及び復号化方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7577566B2 (ja) |
EP (1) | EP1548706A4 (ja) |
JP (1) | JP3887598B2 (ja) |
KR (1) | KR100736504B1 (ja) |
CN (1) | CN100593196C (ja) |
AU (1) | AU2003277667A1 (ja) |
WO (1) | WO2004044893A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090240494A1 (en) * | 2006-06-29 | 2009-09-24 | Panasonic Corporation | Voice encoding device and voice encoding method |
JP5221642B2 (ja) | 2007-04-29 | 2013-06-26 | 華為技術有限公司 | 符号化法、復号化法、符号器、および復号器 |
CN100583649C (zh) * | 2007-07-23 | 2010-01-20 | 华为技术有限公司 | 矢量编/解码方法、装置及流媒体播放器 |
BRPI0814129A2 (pt) * | 2007-07-27 | 2015-02-03 | Panasonic Corp | Dispositivo de codificação de áudio e método de codificação de áudio |
US20100174539A1 (en) * | 2009-01-06 | 2010-07-08 | Qualcomm Incorporated | Method and apparatus for vector quantization codebook search |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5228086A (en) * | 1990-05-18 | 1993-07-13 | Matsushita Electric Industrial Co., Ltd. | Speech encoding apparatus and related decoding apparatus |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
EP0704836B1 (en) * | 1994-09-30 | 2002-03-27 | Kabushiki Kaisha Toshiba | Vector quantization apparatus |
JP3273455B2 (ja) * | 1994-10-07 | 2002-04-08 | 日本電信電話株式会社 | ベクトル量子化方法及びその復号化器 |
JP3878254B2 (ja) * | 1996-06-21 | 2007-02-07 | 株式会社リコー | 音声圧縮符号化方法および音声圧縮符号化装置 |
US5751901A (en) * | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
DE69721595T2 (de) * | 1996-11-07 | 2003-11-27 | Matsushita Electric Ind Co Ltd | Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs |
FI113571B (fi) * | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
WO1999063522A1 (de) * | 1998-05-29 | 1999-12-09 | Siemens Aktiengesellschaft | Verfahren und anordnung zur sprachcodierung |
EP2378517A1 (en) * | 1998-06-09 | 2011-10-19 | Panasonic Corporation | Speech coding apparatus and speech decoding apparatus |
US7117146B2 (en) * | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
JP4173940B2 (ja) * | 1999-03-05 | 2008-10-29 | 松下電器産業株式会社 | 音声符号化装置及び音声符号化方法 |
JP2001184097A (ja) * | 1999-12-22 | 2001-07-06 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
JP3576485B2 (ja) * | 2000-11-30 | 2004-10-13 | 松下電器産業株式会社 | 固定音源ベクトル生成装置及び音声符号化/復号化装置 |
AU2002218501A1 (en) * | 2000-11-30 | 2002-06-11 | Matsushita Electric Industrial Co., Ltd. | Vector quantizing device for lpc parameters |
US7302387B2 (en) * | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
-
2002
- 2002-11-14 JP JP2002330768A patent/JP3887598B2/ja not_active Expired - Fee Related
-
2003
- 2003-11-11 US US10/531,417 patent/US7577566B2/en not_active Expired - Fee Related
- 2003-11-11 KR KR1020057006362A patent/KR100736504B1/ko not_active IP Right Cessation
- 2003-11-11 EP EP03811104A patent/EP1548706A4/en not_active Withdrawn
- 2003-11-11 CN CN200380102998A patent/CN100593196C/zh not_active Expired - Fee Related
- 2003-11-11 AU AU2003277667A patent/AU2003277667A1/en not_active Abandoned
- 2003-11-11 WO PCT/JP2003/014298 patent/WO2004044893A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
CN100593196C (zh) | 2010-03-03 |
AU2003277667A1 (en) | 2004-06-03 |
CN1711590A (zh) | 2005-12-21 |
EP1548706A4 (en) | 2006-01-18 |
WO2004044893A1 (ja) | 2004-05-27 |
US20050228653A1 (en) | 2005-10-13 |
US7577566B2 (en) | 2009-08-18 |
EP1548706A1 (en) | 2005-06-29 |
KR100736504B1 (ko) | 2007-07-06 |
KR20050074480A (ko) | 2005-07-18 |
JP2004163737A (ja) | 2004-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100350340B1 (ko) | 음성 부호화 장치, 음성 복호 장치 및 음성 부호화 복호 장치 및 음성 부호화 방법, 음성 복호 방법 및 음성 부호화 복호 방법 | |
US6385576B2 (en) | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch | |
WO2001052241A1 (en) | Multi-mode voice encoding device and decoding device | |
JP3887598B2 (ja) | 確率的符号帳の音源の符号化方法及び復号化方法 | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3594854B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP2001075600A (ja) | 音声符号化装置および音声復号化装置 | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JP2538450B2 (ja) | 音声の励振信号符号化・復号化方法 | |
JPH1063300A (ja) | 音声復号化装置及び音声符号化装置 | |
JP3579276B2 (ja) | 音声符号化/復号化方法 | |
JP3144284B2 (ja) | 音声符号化装置 | |
JP3954050B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
JP4619549B2 (ja) | マルチモード音声復号化装置及びマルチモード音声復号化方法 | |
JP3232728B2 (ja) | 音声符号化方法 | |
JP4660496B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP3954716B2 (ja) | 音源信号符号化装置、音源信号復号化装置及びそれらの方法、並びに記録媒体 | |
JP4907677B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP4087429B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP2005062410A (ja) | 音声信号の符号化方法 | |
JP4373667B2 (ja) | 適応符号帳の更新方法、適応符号帳更新装置、音声符号化装置及び音声復号化装置 | |
JP2000200097A (ja) | 音声符号化装置、音声復号化装置及び音声符号化復号化装置 | |
JPH10133696A (ja) | 音声符号化装置 | |
JP2000347699A (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060502 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061027 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061127 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091201 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101201 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111201 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121201 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121201 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131201 Year of fee payment: 7 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |