WO2004044893A1 - 確率的符号帳の音源の符号化方法 - Google Patents

確率的符号帳の音源の符号化方法 Download PDF

Info

Publication number
WO2004044893A1
WO2004044893A1 PCT/JP2003/014298 JP0314298W WO2004044893A1 WO 2004044893 A1 WO2004044893 A1 WO 2004044893A1 JP 0314298 W JP0314298 W JP 0314298W WO 2004044893 A1 WO2004044893 A1 WO 2004044893A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound source
codebook
channel
code
pulse
Prior art date
Application number
PCT/JP2003/014298
Other languages
English (en)
French (fr)
Inventor
Toshiyuki Morii
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to AU2003277667A priority Critical patent/AU2003277667A1/en
Priority to EP03811104A priority patent/EP1548706A4/en
Priority to US10/531,417 priority patent/US7577566B2/en
Publication of WO2004044893A1 publication Critical patent/WO2004044893A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook

Abstract

確率的符号帳103は、所定のチャネルのパルス位置を他のチャネルのパルス位置と関連付け、所定のアルゴリズムによりパルス位置を探索し、探索されたパルス位置と極性の符号とを合わせた符号を確率的音源の符号として音源作成部104に出力する。これにより、低ビットレート化のために確率的符号帳のパルスを符号化する際のビット数の削減を図りながら、パルスが全く立たない位置が存在しないようにヴァリエーションを確保することができる。

Description

明 細 書 確率的符号帳の音源の符号化方法 技術分野
本発明は、 C E L P方式の音声符号化装置 Z音声復号装置における確率的符 号帳の音源の符号化方法に関する。 背景技術
インターネット通信に代表されるパケット通信システムや、 移動通信システ ムなどで音声信号を伝送する場合、 音声信号の伝送効率を高めるため、 圧縮 - 符号化技術が使われる。 これまでに多くの音声符号化方式が開発されており、 C E L P方式等、 近年開発された低ビットレート音声符号化方式の多くは、 音 声信号をスぺクトル包絡情報とスぺクトルの微細構造情報とに分離し、 分離し た情報をそれぞれ圧縮■符号化する方式である。
C E L P方式の音声符号化装置では、 適応符号帳が格納している適応コード ベタトノレと、 確率的符号帳が格鈉している固定コードベクトルの全組み合わせ について合成音声べクトルを計算し、 各合成音声と入力音声信号との距離計算 を行い、 距離が最小となる適応コードべクトルのインデタスと固定コードべク トルのインデクス求める。
ここで、 確率的符号帳の 1つとして、 代数的符号帳 (Algebraic Codebook) が知られている。 この符号帳は、 比較的少ない計算量で確率的符号帳の探索を 行うことができることから、 近年の C E L Pで多く用いられている符号帳であ る。
代数的符号帳の音源は、 少数の振幅 1で極性 (+、 一) のあるパルスで構成 され、 パルス位置 (この場合の音源波形候捕) は互いに重ならないような配置 となる。 例えば、 サブフレーム 3 2、 パ ス本数 (==チャネル数) 4の場合、 各チヤ ネルのパルスの数は 3 2/4 = 8で、 第 0チャネルのパルス位置 i c ί 0 [ i 0] 、 第 1チャネルのパルス位置 i c i 1 [ i 1] 、 第 2チャネルのパルス位 置 i c i 2 [ i 2] 、 第 3チャネルのパルス位置 i c i 3 [ i 3] は以下のよ うになる。 なお、 i 0、 i 1、 i 2、 i 3は各チャネルのインデクスを示す。 i c i 0 [ i 0] = { 0, 4, 8, 1 2, 1 6, 20, 24, 28 } i c i l [ i l] = { l, 5, 9, 1 3, 1 7, 2 1, 25, 29} i c i 2 [ i 2] = { 2, 6, 1 0, 14, 1 8, 22, 26, 30} i c i 3 [ i 3] = { 3, 7, 1 1, 1 5, 1 9, 2 3, 27, 3 1 } 従来の確率的符号帳は、 各チャネルのパルス位置を独立に符号化し、 これと 極性の符号を合わせた符号を確率的音源の符号としている。
例えば、 上記のサブフレーム長 3 2、 チャネル数 4の場合、 従来の確率的符 号帳 1 03は、 各チャネルのパルス位置を 3ビットで表現し、 極性の符号と合 わせて、 (3 + 1) X 4= 1 6ビッ トの符号により符号化する。
しかしながら、 上記従来の確率的符号帳の符号化方法では、 ビットレートが 低くなると、 各チャネルに割り当てられるビットも限られ、 パルスが全く立た ない位置が存在するようになり、 符号 (位置情報) に対応する音源波形のヴァ リエーシヨンが激減するため、 音質劣化が起こるという問題を有している。 例えば、 上記サブフレーム長 3 2、 チャネル数 4の場合、 1 6ビット未満で 符号ィ匕するとパルスが全く立たない位置が存在するようになる。 発明の開示
本発明の目的は、 確率的符号帳のパルスを符号化する際のビット数の削減を 図りながら、 パルスが全く立たない位置が存在しないようにヴァリエーション を確保することができる確率的符号帳の音源の符号化方法を提供することであ る。
この目的は、 所定のチヤネルのパルス位置を他のチヤネルのパルス位置と関 連付け、 所定のアルゴリズムによりパルス位置を探索し、 探索されたパルス位 置の符号と極性の符号とを確率的音源の符号とすることにより達成される。 図面の簡単な説明
図 1は、 C E L P方式の音声符号化装置の構成を示すプロック図、 図 2は、 本発明の実施の形態 1に係る符号化方法における各チャネルのパル ス探索アルゴリズムの一例を示すフロー図、
図 3は、 本発明の実施の形態 1に係る符号化方法における各チャネルのパル ス探索アルゴリズムの一例を示すフロー図、
図 4は、 本発明の実施の形態 2に係る符号化方法における各チャネルのパル ス探索アルゴリズムの一例を示すフロー図、 及び、
図 5は、 本発明の実施の形態 2に係る符号化方法における各チャネルのパル ス探索アルゴリズムの一例を示すフロー図である。 発明を実施するための最良の形態
図 1は、 C E L P方式の音声符号化装置の構成を示すプロック図である。 な お、 入力音声信号は、 2 0 m s程度の時間間隔で区切られた処理フレームごと に、 音声符号化装置に逐次入力されるものとする。
処理フレームごとに音声符号化装置に入力された入力音声信号は、 まず、 L P C分析部 1 0 1に供給される。 L P C分析部 1 0 1は、 入力音声信号を L P C (linear Predictwe Coding) 分析して L P C係数を取得し、 L P C係数を ベタトル量子化して L P C符号とし、 この L P C符号を復号して復号化 L P C 係数を得る。
音源作成部 1 0 4は、 適応符号帳 1 0 2及び確率的符号帳 1 0 3力 ら、 それ ぞれ適応コードべクトル及び固定コードべクトルを読み出して、 L P C合成部 1 0 5へ送る。 ?じ合成部1 0 5は、 音源作成部 1 0 4から供給される適応 コードべクトル及び固定コードべクトルを、 ?。分析部1 0 1より与えられ る複号化 L P C係数をフィルタ係数にもつ全極型の合成フィルタでそれぞれ合 成フィルタリングし、 合成適応コードべクトル及び合成固定コードべクトルを 得る。
比較部 1 0 6は、 ?〇合成部1 0 5から出力される合成適応コードべクト ルと合成固定コードべクトルと入力音声信号との関係を分析して、 合成適応コ 一ドべクトルに乗じる適応符号帳最適ゲインと合成固定コードべクトルに乗じ る確率的符号帳最適ゲインをそれぞれ求める。
また、 比較部 1 0 6は、 合成適応コードべクトルに適応符号帳最適ゲインを 乗じて得られるベタトルと、 合成固定コードべクトルに確率的符号帳最適ゲイ ンを乗じて得られるベタトルとを加算して合成音声べクトルを取得し、 合成音 声と入力音声信号との距離計算を行う。 そして、 比較部 1 0 6は、 適応符号帳 1 0 2が格納している適応コードべクトルと、 確率的符号帳 1 0 3が格納して いる固定コードべクトルの全 み合わせについて合成音声べクトルを取得し、 合成音声と入力音声信号との距離が最小となる適応コードべクトルのィンデク スと固定コードベク トルのインデクス求める。 そして、 比較部 1 0 6は、 各符 号帳から出力されるコードべクトルのインデタス、 インデタスに対応するそれ ぞれのコードべクトル、 並びにィンデクスに対応する適応符号帳最適ゲイン及 び確率的符号帳最適ゲインをパラメータ符号化部 1 0 7へ送る。
パラメータ符号化部 1 0 7は、 適応符号帳最適ゲインと確率的符号帳最適ゲ ィンを符号化してゲイン符号を取得し、 ゲイン符号と、 L P C分析部 1 0 1力 ら与えられた L P C符号と、 各符号帳のィンデタスとを処理フレームごとにま とめて出力する。
また、 パラメータ符号化部 1 0 7は、 適応符号帳のインデクスに対応する適 応コードべクトルにゲイン符号に対応する適応符号帳ゲインを乗じて得られる ベクトルと、 確率的符号帳のインデタスに対応する固定コードベクトルにゲイ ン符号に対応する確率的符号帳ゲインを乗じたベタトルとの 2つべクトルを加 算して駆動音源べクトルを取得し、 駆動音源べクトルで適応符号帳 1 0 2内の 古い適応コードべクトルを更新する。
なお、 L P C合成部 1 0 5における合成フィルタリングは、線形予測係数や、 高域強調フィルタや、 入力音声を長期予測分析して得られる長期予測係数を用 いた聴感重み付けフィルタを併用するのが一般的である。
また、 適応符号帳と確率的符号帳の最適インデタスの探索、 最適ゲインの算 出、 最適ゲインの符号ィ匕処理は、 フレームを更に分割したサブフレーム単位で 行われるのが一般的である。
なお、 音声復号装置 (デコーダ) では、 図 1に示した L P C分析部 1 0 1、 適応符号帳 1 0 2、 確率的符号帳 1 0 3、 音源作成部 1 0 4、 L P C合成部 1 0 5と同一の構成を備え、 音声符号化装置から伝送されてきた各符号を復号し て音源波形を得る。
ここで、 計算量を削減するために、 比較部 1 0 6では、 通常、 適応符号帳 1 0 2の音源と確率的符号帳 1 0 3の音源をオープンループにより探索する。 以 下、 このオープンループによる探索手順を述べる。
( 1 ) まず、 音源作成部 1 0 4が適応符号帳 1 0 2のみから音源候補 (適応音 源) を次々に選び、 L P C合成部 1 0 5が合成音を生成し、 比較部 1 0 6が入 力音声と合成音との比較を行って最適な適応符号帳 1 0 2の符号を選択する。 なお、 この時のゲインは符号ィ匕歪が最も少なくなる値 (最適ゲイン) であると 仮定して選択を行う。
( 2 ) 次に、 上記適応符号帳の符号を固定し、 音源作成部 1 0 4が適応符号帳 1 0 2からは同じ音源を、 確率的符号帳 1 0 3が比較部 1 0 6の符号に対応し た音源(確率的音源)を次々に選択し、 L P C合成部 1 0 5が合成音を生成し、 比較部 1 0 6が両合成音の和と入力音声の比較を行って最適な確率的符号帳 1 0 3の符号を決定する。 なお、 上記 ( 1 ) と同様に、 この時のゲインは符号ィ匕 歪が最も少なくなる値 (最適ゲイン) であることを仮定して選択を行う。
以上の手順にて最適な音源を探索することにより、 両符号帳の全ての音源の 組み合わせを比較して最適な音源を探索する方法より、 符号化性能は若干劣化 するが、 計算量は大幅に削減される。
次に、 確率的符号帳 1 0 3の音源の探索方法の詳細について説明する。
音源の符号の導出は、 以下の式 (1 ) の符号化歪 Eを最小化する音源を探索 することにより行われる。 なお、 式 (1 ) において、 X :符号化ターゲット、 p :適応音源のゲイン、 H:聴感重み付け合成フィルタ、 a :適応音源、 q : 確率的音源のゲイン、 s :確率的音源である。
E = | x - (pHa+qHs ) | 2 · · '式 ( 1 )
適応音源はオープンループで探索されるので、 確率的符号帳 1 0 3の符号の 導出は以下の式 (2 ) の符号化歪 Eを最小化する確率的音源を探索することに より行われる。 なお、 式 (2 ) において、 y :確率的音源探索のターゲットべ クトルである。
y = — p H a
E = I y - q H s I 2 · · ·式 (2 )
ここで、 ゲイン p、 qは音源を探索した後で決定するものとし、 ゲイン p、 q = lとすることにより、上記式(2 ) は以下の式(3 ) と書くことができる。 - H a
y = X H a
I H a I 2 y H s
E = I y H s I 2 · · ·式 ( 3 )
I H s I 2 そして、 この歪の式を最小化することは以下の式 (4 ) の関数 Cを最大化す ることと等価である。
( H · s ) 2
C =
s H H s ' · ·式 ( 4 ) 従って、代数符号帳の音源のような少数パルスからなる音源の探索の場合は、 y Hと HHを予め計算しておけば、 少ない計算量で上記関数 Cを算出すること ができる。 yHはべクトル yを逆順にしてマトリクス Hを畳み込み、 更にその結果を逆 順にすることにより求めることができ、 HHはマトリクス同士の掛け算により 求めることができる。
確率的符号帳 103は、 以下の (1) 力、ら (4) の手順により、 確率的音源 を探索して符号化する。
(1) まず、 前処理として、 べクトル yHとマトリクス HHを算出する。
(2) 次に、 ベクトル yHの要素の極性 (+—) 力 ら、 事前にパルスの極性を 決める。 具体的には、 各位置に立つパルスの極性を yHのその位置の値に合わ せることとし、 y Hの値の極性を別の配列に格納しておく。 各位置の極性を別 の配列に格納した後、 yHの値は全て絶対値をとり正の値に変換しておく。 ま た、 その極性にあわせて HHの値も極性を乗ずることによって変換しておく。
(3) 次に、 n重ループ (nはチャネル数) の探索アルゴリズムを用いて、 y Hと HHの値を加算することにより上記式 (4) に示した関数 Cを求め、 この 値が最大となる各チャネルのパルス位置を探索する。. .
(4) 探索された各チャネルのパルス位置を符号化し、 これと極性の符号を合 わせた符号を確率的音源の符号とする。
以下、 本発明の各実施の形態に係る確率的音源の符号化方法について、 添付 図面を参照して詳細に説明する。なお、各実施の形態では、サブフレーム 32、 パルス本数 (=チャネル数) 4の代数的符号帳を用いて説明する。
(実施の形態 1 )
実施の形態 1では、 所定のチャネルのィンデタスを他のチャネルによって変 化させる場合について説明する。
本実施の形態では、 第 0チャネルのパルス位置 i c i 0 [i 0] 、 第 1チヤ ネルのパルス位置 i c i 1 [j 1] 、 第 2チャネルのパルス位置 ί c ί 2 [ j 2] 、 第 3チャネルのパルス位置 i c i 3 [j 3] を以下のものとする。 i c i 0 [i 0] = {0, 4, 8, 12, 16, 20, 24, 28} i c i l [ j 1] = { 1 , 5, 9, 13, 17, 21, 25, 29} i c i 2 [j 2] = {2, 6, 10, 14, 18, 22, 26, 30} i c i 3 [j 3] = {3, 7, 1 1, 15, 19, 23, 27, 31} なお、 i O (0 i 0≤7) は第 0チャネルのインデタス、 j 1 (0≤ j 1 ≤ 7) は第 1チャネルのィンデクス、 j 2 (0≤ j 2≤ 7) は第 2チャネルの インデタス、 j 3 (0≤ j 3≤7) は第 3チャネルのィンデクスである。
例えば、 i 0 = 0のパルス位置は { 0 }、 i 0=1のパルス位置は { 4 } j 1=0のパルス位置は { 1 }、 j 1=1のパルス位置は { 5 } · ■ ■となる。 また、 第 1チャネル、 第 2チャネル、 第 3チャネルのパルスは、 2個 1組に グループ化される。 例えば、 第 1チャネルは、 第 0グループ { 1, 5} 、 第 1 グループ {9, 13} 、 第 2グループ { 1 7, 21} 、 第 3グループ {25, 29} の 4つにグループ化される。
そして、 i 1 (0≤ i 1≤ 3) を第 1チャネルのグループィンデタス、 i 2 (0≤ i 2≤ 3) を第 2チヤネルのグループィンデクス、 i 3 (0≤ i 3≤ 3) を第 3チャネルのグループィンデタスとすると、 インデクス j 1、 j 2、 j 3 とグループインデクス i 1、 i 2、 i 3とは以下の式 (5) の関係を有する。 j l= i l X 2+ (i O%2)
j 2= i 2 X 2+ ( ( i O+ i l) % 2)
j 3= i 3 X 2+ ( ( i 1 + i 2) %2) . ■ ■式 (5)
ただし、 式 (5) において、 「%」 はその左の数値 (インデクス) を右の数 値で除した際の剰余を求める演算である。 なお、 インデクス i 0〜i 3を 2進 数で表現すれば、 「%」 の演算は、 その左のインデタスの最下位 1ビットの符 号を調べるだけで実現することができる。
本実施の形態では、 上記式 (5) に示すように、 第 1から第 3のチャネルの インデクスを他のチャネルのインデクスによって変化させる。 例えば、 第 1チ ャネルのインデクス j 1は第 0チャネルのインデクス i 0によって変化し、 i 0 = 0のとき i c i l [ j 1] = { 1 , 9, 17, 25} であり、 i O = l のとき i c i l [j 1] = {5, 13, 21, 29} である。 図 2、 図 3は、 本実施の形態に係る符号化方法における各チャネルのパルス 探索アルゴリズムの一例を示すフロー図である。
図 2、 図 3において、 第 0ループは i 0を 0から 7まで変化させるループで あり、 第 1ループは i 1を 0から 3まで変化させるループであり、 第 2ループ は i 2を 0から 3まで変化させるループであり、 第 3ループは i 3を 0から 3 まで変化させるループである。
図 2、 図 3では、 まず、 i 0 = 0、 i 1 = 0, i 2 = 0を固定し、 第 1段階 として第 3ループにて各 i 3における y、Hを算出し、その中の最大値 ymax、 Hmax、及び、そのときの i 0、 i l、 i 2、 i 3をそれぞれ i i 0、 i i 1、 i i 2、 i i 3として保存する。 この場合、 探索される第 3チャネルのパルス 位置は、 i c i 3 [j 3] = {3, 11, 19, 27} である。
次に、 第 2段階として、 第 2ループにて i 2をインクリメントさせ、 各 i 2 において上記第 1段階の演算を行う。 なお、 i 0 = 0、 i 1 = 0, i 2 = lの 場合、 第 1段階で探索される第 3チャネルのパルス位置は、 i c i 3 [j 3] = {7, 15, 23, 31 } である。 このように、 i 0、 i 1、 i 2のィ直によ つて第 1段階で探索される第 3チャネルのパルス位置が変化する。
次に、 第 3段階として、 第 1ループにて i 1をインクリメントさせ、 各 i 1 において上記第 1段階、 第 2段階の演算を行う。 この場合、 i 0、 i 1の値に よって第 2段階で探索される第 2チャネルのパルス位置が変化する。
最後に、 第 4段階として、 第 0ループにて i 0をインクリメントさせ、 i O において上記第 1段階、 第 2段階、 第 3段階の演算を行う。 この場合、 i Oの 値によって第 3段階で探索される第 1チャネルのパルス位置が変化する。
このように、 本実施の形態では、 n重ループ (nはチャネル数) の探索アル ゴリズムにおいて、 ループの外側の符号に応じて内側のループの候捕位置を変 ィ匕させる。
そして、 探索した全てのパルス位置において y、 Hが最大となる i i 0、 i i 1、 ί i 2、 i i 3を求める。 この結果、 i i 0は 3ビット、 i i 1、 i i 2、 i i 3は各 2ビットなので、 パルス位置は 9ビットで符号化することができ、 各チャネルの極性の符号 ( 1 ビット X 4チヤネノレ) と合わせて 1 3ビットの符号により符号化することがで きる。 従って、 従来よりも符号化に必要なビット数を削減することができ、 低 ビットレート化を図ることができる。
一方、 第 1から第 3チャネルのインデクス j 1、 j 2、 j 3はそれぞれ 8箇 所とることができるので、 サブフレームにおいてパルスが全く立たない位置が 存在せず、 符号 (位置情報) に対応する音源波形のヴァリエーションを確保す ることができ、 音質劣化を防ぐことができる。
このように、 本実施の形態によれば、 所定のチャネルのインデクスを他のチ ャネルによって変化させることにより、 所定のチャネルのパルス位置を他のチ ャネルのパルス位置と関連付ける。 これにより、 確率的音源を従来よりも少な いビット数で表現することができ、 かつ、 パルスが全く立たない位置が存在し ないようにヴァリエーションを確保することができる。
(実施の形態 2)
実施の形態 2は、 所定のチャネルのパルス位置そのものを他のチャネルによ つて変化させる場合について説明する。
本実施の形態では、 第 0チャネルのパルス位置 i c i 0 [ i 0] 、 第 1チヤ ネルのパルス位置 i c i 1 [ i 1] 、 第 2チャネルのパルス位置 i c i 2 [ ί 2] 、 第 3チャネルのパルス位置 i c i 3 [ i 3] を以下のものとする。 ここ で、 第 1から第 3チャネルのパルス位置の 1つ多い位置が存在しないことに注 意されたい。
i c i 0 [ i 0] = {4 7, 1 2, 1 5, 20 2 3, 28, 3 1 } i c i 1 [ i 1] = {0 8 , 1 6, 24}
i c i 2 [ i 2] = { 2 1 0, 1 8, 26}
i c i 3 [ i 3] = { 5 1 3, 2 1, 29}
なお、 i 0 (0≤ i 0^ 7) は第' (0≤ i 1 ≤ 3) は第 1チャネルのインデタス、 i 2 (0≤ i 2≤ 3) は第 2チャネルの インデタス、 i 3 (0≤ i 3≤ 3) は第 3チヤネルのインデクスである。 例えば、 i 0 = 0のパルス位置は { 4 }、 i 0 = 1のパルス位置は { 7 }…-、 i 1 =0のパルス位置は {0}、 i 1 = 1のパルス位置は {8} · ■ ■となる。 そして、 各チャネルのパルス位置 i c i O [ i 0] 、 i c i l [ i l] 、 i c i 2 [ i 2]'、 i c i 3 [ i 3〕 は、以下の式(6) によりインデクス i 0、 i 1、 i 2、 1 3にて 0、 k l、 k 2、 k 3に調整される。
k 0= i c i 0 [ i 0]
k 1 = i c i 1 [ i 1 ] X 2 + ( i 0 % 2 )
k 2 = i c i 0 [ i 2] X 2+ ( ( i 0+ i l) % 2)
k 3 = i c i 0 [ i 3] X 2+ ( ( i 1 + i 2) % 2) · · ■式 (6) ただし、 式 (6) において、 「%」 はその左の数値 (インデクス) を右の数 値で除した際の剰余を求める演算である。
上記式 (6) に示すように、 本実施の形態では、 第 1から第 3のチャネルの パルスの位置そのものを他のチャネルによって変化させる。 この結果、 第 0か ら第 3チャネルの調整されたパルス位置 k 0、 k l、 k 2、 k 3は以下のよう になる。
k 0 {4 7, 1 2, 1 5, 20, 23, 28, 3 1 }
k 1 {0 1, 8, 9, 1 6, 1 7, 24, 25}
k 2 {2 3, 1 0, 1 1, 1 8' 1 9, 26, 2 7 }
k 3 { 5 6, 1 3, 14, 21, 2 2, 29, 30 }
図 4、 図 5は、 本実施の形態に係る符号化方法における各チャネルのパルス 探索アルゴリズムの一例を示すフロー図である。
図 4、 図 5において、 第 0ループは i 0を 0から 7まで変化させるループで あり、 第 1ループは i 1を 0から 3まで変化させるループであり、 第 2ループ は i 2を 0から 3まで変化させるループであり、 第 3ループは i 3を 0から 3 まで変化させるループである。 図 4、 図 5では、 まず、 i O = 0、 i l = 0、 i 2 = 0を固定し、 第 1段階 として第 3ループにて各 i 3における y、Hを算出し、その中の最大値 y max、 Hmax、及ぴ、そのときの i O、 i l、 i 2、 i 3をそれぞれ i i 0、 i i 1、 i i 2、 i i 3として保存する。
次に、 第 2段階として、 第 2ループにて i 2をインクリメントさせ、 各 i 2 において上記第 1段階の演算を行う。
次に、 第 3段階として、 第 1ループにて i 1をインクリメントさせ、 各 i 1 において上記第 1段階、 第 2段階の演算を行う。
最後に、 第 4段階として、 第 0ループにて i 0をインクリメントさせ、 i O において上記第 1段階、 第 2段階、 第 3段階の演算を行い、 探索した全てのパ ルス位置において y、 Hが最大となる i i O、 i i l、 i i 2、 i i 3を求め る。
この結果、 i i 0は 3ビット、 i i 1、 i i 2、 i i 3は各 2ビットなので、 パルス位置は 9ビットで符号化することができ、 各チャネルの極性の符号 (1 ビット X 4チャネル) と合わせて 1 3ビットの符号により符号化することがで きる。 従って、 従来よりも符号化に必要なビット数を削減することができ、 低 ビットレート化を図ることができる。
一方、 第 1から第 3チャネルの調整されたパルス位置 (k l、 k 2、 k 3 ) はそれぞれ 8箇所とることができるので、 サブフレームにおいてパルスが全く 立たない位置が存在せず、 符号 (位置情報) に対応する音源波形のヴアリエ一 ションを確保することができ、 音質劣化を防ぐことができる。
このように、 本実施の形態によれば、 所定のチャネルのパルス位置そのもの を他のチャネルによって変化させることにより、 従来よりも少ないビット数で 確率的音源を表現することができ、 かつ、 パルスが全く立たない位置が存在し ないようにヴァリエーションを確保することができる。
なお、 音声復号装置に用意された確率的符号帳では、 上記各実施の形態で符 号ィ匕され、 伝送された各チャネルの符号に対して上記探索アルゴリズムによる 演算を行うことにより、 音声符号化装置にて探索された確率的音源を求めるこ とができる。
なお、 上記各実施の形態では、 ヴァリエーションを 2倍にするため 2の剰余 をとつたが、 本発明はこれに限られず、 更なる低ビットレート化やサブフレー ム長拡張のため剰余を取る数値を 3以上に大きくする場合にも有効である。 また、 上記各実施の形態では、 複数チャネルの情報を加算によって統合した 力 本発明はこれに限られず、 重み付き加算 (定数を乗じて加算) や乱数発生 器等より高度な関数を用いる場合にも有効である。
また、 上記各実施の形態では、 剰余によって他のチャネルの情報を反映する 値の抽出を行ったが、 本発明はこれに限られず、 乱数発生器や変換テーブルを 用いる等、 より高度な関数を用いる場合にも有効である。
また、 上記各実施の形態では、 代数的符号帳を用いた場合でありインパルス の位置が符号に対応していたが、 本発明はこれに限られず、 確率的符号帳が部 分波形の和で構成されておりその始端位置が符号に対応している場合にも有効 である。
また、 上記各実施の形態では、 代数的符号帳を用いた場合でありインパルス の位置が符号に対応していたが、 本発明はこれに限られず、 確率的符号帳が R OMに格納された多数の固定波形で構成されており、 その中の複数の和で音源 波形が作成されており、 その波形番号が符号に対応している場合にも有効であ る。 この場合、 「位置」 を 「波形番号」 に置き換えれば本発明を容易に応用す ることができる。
以上の説明から明らかなように、 本発明によれば、 所定のチャネルのパルス 位置を他のチャネルのパルス位置と関連付けて符号化し、 これと極性の符号を 合わせた符号を確率的符号帳の音源の符号とすることにより、 確率的音源を従 来よりも少ないビット数で表現することができ、 かつ、 パルスが全く立たない 位置が存在しないようにヴァリエーションを確保することができる。
本明細書は、 2 0 0 2年 1 1月 1 4日出願の特願 2 0 0 2— 3 3 0 7 6 8に 基づくものである。 この内容をここに含めておく。 産業上の利用可能性
本発明は、 C E L P方式の音声符号化装置 Z音声復号装置に用いるに好適で ある。

Claims

請 求 の 範 囲
1 . 複数の音源波形を出力することができ、 複数のチャネルに分かれている符 号帳の音源波形の符号化方法であって、 所定のチヤネルの音源波形候補を他の チャネルの音源波形候補と関連付け、 所定のアルゴリズムにより探索された音 源波形の符号を符号帳の音源の符号とする符号化方法。
2 . ループの外側の音源波形候補に応じてループの内側の音源波形候補を変ィ匕 させる n重ループ(nはチャネル数) の探索アルゴリズムにより音源波形を探 索する請求の範囲 1記載の符号化方法。
3 . 符号帳は C E L Pで用いられる確率的符号帳である請求の範囲 1記載の符 号化方法。
4 . 確率的符号帳は代数的符号帳であり、 音源波形候補はパルス位置で表現さ れている請求の範囲 3記載の符号化方法。
5 . 所定のチヤネルの音源波形候補を他のチヤネルの音源波形候補を表す番号 の剰余演算結果にて関連付ける請求の範囲 1記載の符号化方法。
6 . 剰余演算結果を、 所定のチャネルの音源波形候補を示すパルス位置の候補 集合のインデクスに関連付ける請求の範囲 5記載の符号ィ匕方法。
7 . 剰余演算結果を、 所定のチャネルの音源波形候補を示すパルス位置に関連 付ける請求の範囲 5記載の符号化方法。
8 .関連付けが剰余演算結果の加算で行われる請求の範囲 6記載の符号化方法。
9 . 請求の範囲 1記載の符号化方法により符号帳の音源を符号化する音声符号 化装置。
1 0 . 請求の範囲 1記載の符号化方法に対応した符号帳の音源の復号を行う音
PCT/JP2003/014298 2002-11-14 2003-11-11 確率的符号帳の音源の符号化方法 WO2004044893A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
AU2003277667A AU2003277667A1 (en) 2002-11-14 2003-11-11 Method for encoding sound source of probabilistic code book
EP03811104A EP1548706A4 (en) 2002-11-14 2003-11-11 METHOD FOR CODING A SOUND SOUND WITH A PROBABILISTIC CODE BOOK
US10/531,417 US7577566B2 (en) 2002-11-14 2003-11-11 Method for encoding sound source of probabilistic code book

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002330768A JP3887598B2 (ja) 2002-11-14 2002-11-14 確率的符号帳の音源の符号化方法及び復号化方法
JP2002-330768 2002-11-14

Publications (1)

Publication Number Publication Date
WO2004044893A1 true WO2004044893A1 (ja) 2004-05-27

Family

ID=32310603

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/014298 WO2004044893A1 (ja) 2002-11-14 2003-11-11 確率的符号帳の音源の符号化方法

Country Status (7)

Country Link
US (1) US7577566B2 (ja)
EP (1) EP1548706A4 (ja)
JP (1) JP3887598B2 (ja)
KR (1) KR100736504B1 (ja)
CN (1) CN100593196C (ja)
AU (1) AU2003277667A1 (ja)
WO (1) WO2004044893A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008001866A1 (fr) * 2006-06-29 2008-01-03 Panasonic Corporation dispositif de codage vocal et procédé de codage vocal
DK2827327T3 (da) 2007-04-29 2020-10-12 Huawei Tech Co Ltd Fremgangsmåde til excitationsimpulskodning
CN100583649C (zh) * 2007-07-23 2010-01-20 华为技术有限公司 矢量编/解码方法、装置及流媒体播放器
AU2008283697B2 (en) * 2007-07-27 2012-05-10 Iii Holdings 12, Llc Audio encoding device and audio encoding method
US20100174539A1 (en) * 2009-01-06 2010-07-08 Qualcomm Incorporated Method and apparatus for vector quantization codebook search
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08110799A (ja) * 1994-10-07 1996-04-30 Nippon Telegr & Teleph Corp <Ntt> ベクトル量子化方法及びその復号化器
JP2000322097A (ja) * 1999-03-05 2000-11-24 Matsushita Electric Ind Co Ltd 音源ベクトル生成装置及び音声符号化/復号化装置
JP2001184097A (ja) * 1999-12-22 2001-07-06 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
JP2002169595A (ja) * 2000-11-30 2002-06-14 Matsushita Electric Ind Co Ltd 固定音源符号帳及び音声符号化/復号化装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5228086A (en) * 1990-05-18 1993-07-13 Matsushita Electric Industrial Co., Ltd. Speech encoding apparatus and related decoding apparatus
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
EP0704836B1 (en) * 1994-09-30 2002-03-27 Kabushiki Kaisha Toshiba Vector quantization apparatus
JP3878254B2 (ja) * 1996-06-21 2007-02-07 株式会社リコー 音声圧縮符号化方法および音声圧縮符号化装置
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
EP0883107B9 (en) * 1996-11-07 2005-01-26 Matsushita Electric Industrial Co., Ltd Sound source vector generator, voice encoder, and voice decoder
FI113571B (fi) * 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
WO1999063522A1 (de) * 1998-05-29 1999-12-09 Siemens Aktiengesellschaft Verfahren und anordnung zur sprachcodierung
CA2300077C (en) * 1998-06-09 2007-09-04 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus and speech decoding apparatus
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
AU2002218501A1 (en) * 2000-11-30 2002-06-11 Matsushita Electric Industrial Co., Ltd. Vector quantizing device for lpc parameters
US7302387B2 (en) * 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08110799A (ja) * 1994-10-07 1996-04-30 Nippon Telegr & Teleph Corp <Ntt> ベクトル量子化方法及びその復号化器
JP2000322097A (ja) * 1999-03-05 2000-11-24 Matsushita Electric Ind Co Ltd 音源ベクトル生成装置及び音声符号化/復号化装置
JP2001184097A (ja) * 1999-12-22 2001-07-06 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
JP2002169595A (ja) * 2000-11-30 2002-06-14 Matsushita Electric Ind Co Ltd 固定音源符号帳及び音声符号化/復号化装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1548706A4 *

Also Published As

Publication number Publication date
JP2004163737A (ja) 2004-06-10
EP1548706A4 (en) 2006-01-18
EP1548706A1 (en) 2005-06-29
US20050228653A1 (en) 2005-10-13
JP3887598B2 (ja) 2007-02-28
CN1711590A (zh) 2005-12-21
KR20050074480A (ko) 2005-07-18
CN100593196C (zh) 2010-03-03
US7577566B2 (en) 2009-08-18
KR100736504B1 (ko) 2007-07-06
AU2003277667A1 (en) 2004-06-03

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
KR100350340B1 (ko) 음성 부호화 장치, 음성 복호 장치 및 음성 부호화 복호 장치 및 음성 부호화 방법, 음성 복호 방법 및 음성 부호화 복호 방법
US6385576B2 (en) Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
JP2000132197A (ja) Celp型音声符号化装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
JPH09160596A (ja) 音声符号化装置
WO2004044893A1 (ja) 確率的符号帳の音源の符号化方法
JP3594854B2 (ja) 音声符号化装置及び音声復号化装置
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
JP3579276B2 (ja) 音声符号化/復号化方法
JP2004348120A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JPH07168596A (ja) 音声符号化装置
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP3954716B2 (ja) 音源信号符号化装置、音源信号復号化装置及びそれらの方法、並びに記録媒体
JP3232728B2 (ja) 音声符号化方法
JP3319551B2 (ja) ベクトル量子化装置
JP3954050B2 (ja) 音声符号化装置及び音声符号化方法
JP4373667B2 (ja) 適応符号帳の更新方法、適応符号帳更新装置、音声符号化装置及び音声復号化装置
JP4660496B2 (ja) 音声符号化装置及び音声符号化方法
JP4087429B2 (ja) 音声符号化装置及び音声符号化方法
JP3207466B2 (ja) ピッチ合成フィルタの符号化方式
JPH086600A (ja) 音声符号化装置及び音声復号化装置
JP2003015699A (ja) 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置
JP2005062410A (ja) 音声信号の符号化方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1020057006362

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 2003811104

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 20038A29986

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 00903/KOLNP/2005

Country of ref document: IN

Ref document number: 903/KOLNP/2005

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 10531417

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2003811104

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020057006362

Country of ref document: KR