WO2008072732A1

WO2008072732A1 - 音声符号化装置および音声符号化方法

Info

Publication number: WO2008072732A1
Application number: PCT/JP2007/074132
Authority: WO
Inventors: Toshiyuki Morii
Original assignee: Panasonic Corporation
Priority date: 2006-12-14
Filing date: 2007-12-14
Publication date: 2008-06-19
Also published as: JPWO2008072732A1; EP2099025A1; EP2099025A4; US20100049508A1

Abstract

　開ループ探索と比較して計算量を大幅には増やさないようにゲインと音源ベクトルの閉ループ探索を行う音声符号化装置。この音声符号化装置では、まず、第１パラメータ決定部（１２１）が、適応音源符号帳による音源探索を行った後、第２パラメータ決定部（１２２）が、固定音源符号帳による音源探索とゲインの探索とを閉ループにより同時に行う。具体的には、固定音源ベクトルとゲインの組み合わせについて、候補固定音源ベクトルに候補ゲインを乗じた値と適応音源ベクトルに候補ゲインを乗じた値とを加算したものを、量子化線形予測係数に基づくフィルタ係数により構成された合成フィルタに通して合成信号を生成し、この合成信号と入力音声信号との距離である符号化歪を計算し、この符号化歪が最も小さくなる固定音源ベクトルの符号およびゲインを探索する。

Description

明細書

音声符号化装置および音声符号化方法

技術分野

[0001] 本発明は、 CELP (Code Excited Linear Prediction)によって音声を符号化する音声符号化装置および音声符号化方法に関する。

背景技術

[0002] 移動体通信においては、電波などの伝送路容量や記憶媒体の有効利用を図るため、音声や画像のディジタル情報に対して圧縮符号化を行うことが必須であり、これまでに多くの符号化/複号化方式が開発されてきた。

[0003] 音声符号化技術は、音声の発声機構をモデル化してベクトル量子化を巧みに応用した基本方式 CELPによってその性能を大きく向上させた。

[0004] ここで、 CELPには、 LPC (線形予測係数）系パラメータによるスペクトル包絡、適応音源符号帳と固定音源符号帳による音源および 2つの音源のゲインと符号化対象となる情報が多いため、これらを探索するための計算量を少なくする工夫が必要となる

〇

[0005] 以下、従来力行われている CELPの各情報の典型的な符号化手順について図 1 を用いて説明する。

[0006] まず、入力音声信号に対して線形予測分析を行い、 LPC系パラメータを抽出し、 L SP (Line Spectrum Pair)のべタトノレに変換する。そして、そのべタトノレの VQ (ベクトノレ量子化）を行!、LPCの符号を決める。

[0007] 次に、その LPCの符号を復号化して復号化されたパラメータを求め、そのパラメ一タで合成フィルタを構成する。

[0008] 次に、適応音源符号帳単独による音源探索を行う。具体的には、理想ゲイン (歪が最も小さくなるゲイン)を仮定して、適応音源符号帳に格納されてレ、る各適応音源べタトルに上記理想ゲインを乗じた値を上記合成フィルタに通して合成信号を生成し、この合成信号と入力音声信号との距離である符号化歪を計算し、この符号化歪が最も小さくなる適応音源ベクトルの符号を探索する。 [0009] 次に、その探索された符号を復号化し、復号化された適応音源ベクトルを求める。

[0010] 次に、固定音源符号帳による音源探索を行う。具体的には、理想ゲイン (適応音源ベクトルのゲインと固定音源ベクトルのゲインの 2種類）を仮定して、固定音源符号帳の各固定音源ベクトルに上記理想ゲインを乗じた値と上記復号化された適応音源べタトルに上記理想ゲインを乗じた値とを加算したものを上記合成フィルタに通して合成信号を生成し、この合成信号と入力音声信号との距離である符号化歪を計算し、この符号化歪が最も小さくなる固定音源ベクトルの符号を探索する。

[0011] 次に、その探索された符号を復号化し、復号化された固定音源ベクトルを求める。

[0012] 次に、上記復号化された適応音源ベクトルと上記復号化された固定音源ベクトルのゲインを量子化する。具体的には、各ゲイン候補を上記 2つの音源ベクトルに乗じて上記合成フィルタに通したものが入力音声信号に最も近くなるゲインを探索し、最後に、探索されたゲインを量子化する。

[0013] このように、従来から CELPでは、計算量を少なくするため、 1つの情報を探索する際に他の情報を固定し、 1つずつ符号を探索する開ループ探索のアルゴリズムを採用している。このため、 CELPでは、十分な性能を得ることができなかった。

[0014] この問題を解決するべぐ従来から、計算量を大幅には増やさないような閉ループ探索法が検討されている。特許文献 1には、適応音源符号帳と固定音源符号帳の探索を、予備選択を使いながら同時に最適な符号を求める基本的な発明が開示されている。この方法により 2つの符号帳を閉ループで探索することが可能になる。

特許文献 1：特開平 5— 19794号公報

発明の開示

発明が解決しょうとする課題

[0015] しかしながら、適応音源符号帳と固定音源符号帳の閉ループ探索は、それらのベタトルが加算される構造であることから元々比較的独立の関係にあり、開ループ探索と比較してそれほど大きな性能向上を得ることはできない。

[0016] これに対し、 2つのパラメータが乗算される関係にあれば、閉ループ探索で大きな効果がある。 CELPにおいて、音源ベクトルやゲインの探索アルゴリズムに LPC合成フィルタを使用し、合成による分析 (Analysis by Synthesis)により大きな性能向上を得ることができたのは、合成フィルタが完全に 2つの音源ベクトルやゲインと乗算される関係にあるためである。

[0017] 合成フィルタ以外で、乗算される関係にあるものは、ゲインと音源ベクトルである力ゲインと音源ベクトルの閉ループ探索に関する従来の技術では、計算量が大幅に増えてしまうものしか開示されてレヽなレ、。

[0018] 本発明は力、かる点に鑑みてなされたものであり、開ループ探索と比較して計算量を大幅には増やさないようにゲインと音源ベクトルの閉ループ探索を行い、大きな性能向上を得ることができる音声符号化装置および音声符号化方法を提供することを目的とする。

課題を解決するための手段

[0019] 本発明の音声符号化装置は、適応音源符号帳の適応音源ベクトルの符号を探索する第 1パラメータ決定手段と、固定音源符号帳の固定音源ベクトルの符号とゲインとを閉ループ探索する第 2パラメータ決定手段と、を具備し、前記第 2パラメータ決定手段は、固定音源ベクトルとゲインの組み合わせについて、候補固定音源ベクトルに固定音源用候補ゲインを乗じた値と前記適応音源ベクトルに適応音源用候補ゲインを乗じた値とを加算した値を、量子化線形予測係数に基づくフィルタ係数により構成された合成フィルタに通して合成信号を生成し、この合成信号と入力音声信号との距離である符号化歪を計算し、この符号化歪が最も小さくなる固定音源ベクトルの符号およびゲインを探索する、構成を採る。

[0020] 本発明の音声符号化方法は、適応音源符号帳の適応音源ベクトルの符号を探索する第 1ステップと、固定音源符号帳の固定音源ベクトルの符号とゲインとを閉ループ探索する第 2ステップと、を具備し、前記第 2ステップでは、固定音源ベクトルとゲインの組み合わせにつ!/、て、候補固定音源ベクトルに固定音源用候補ゲインを乗じた値と前記適応音源ベクトルに適応音源用候補ゲインを乗じた値とを加算した値を、量子化線形予測係数に基づくフィルタ係数により構成された合成フィルタに通して合成信号を生成し、この合成信号と入力音声信号との距離である符号化歪を計算し、この符号化歪が最も小さくなる固定音源べ外ルの符号およびゲインを探索する、方法を採る。発明の効果

[0021] 本発明によれば、ベクトル演算を行うことなくゲインと固定音源ベクトルの閉ループ探索を行うことができるので、開ループ探索と比較して計算量を大幅には増加させずに、大きな性能向上を得ることができる。

図面の簡単な説明

[0022] [図 1]従来の符号化手順を示すフロー図

[図 2]本発明の実施の形態 1に係る音声符号化装置の構成を示すブロック図

[図 3]本発明の実施の形態 1に係る符号化手順を示すフロー図

[図 4]本発明の実施の形態 1に係る固定音源符号帳とゲインの閉ループ探索のアル発明を実施するための最良の形態

[0023] 以下、本発明の各実施の形態について、図面を用いて説明する。

[0024] (実施の形態 1)

図 2は、実施の形態 1に係る音声符号化装置の構成を示すブロック図である。

[0025] 前処理部 101は、入力音声信号に対し、 DC成分を取り除くハイパスフィルタ処理や後続する符号化処理の性能改善につながるような波形整形処理やプリェンファシス処理を行い、これらの処理後の信号 (Xin)を LPC分析部 102および加算部 105に出力する。

[0026] LPC分析部 102は、 Xinを用いて線形予測分析を行い、分析結果 (線形予測係数) を LPC量子化部 103に出力する。 LPC量子化部 103は、 LPC分析部 102から出力された線形予測係数（LPC)の量子化処理を行い、量子化 LPCを合成フィルタ 104 に出力するとともに量子化 LPCを表す符号 (Uを多重化部 114に出力する。

[0027] 合成フィルタ 104は、量子化 LPCに基づくフィルタ係数により、後述する加算部 11 1から出力される駆動音源に対してフィルタ合成を行うことにより合成信号を生成し、合成信号を加算部 105に出力する。

[0028] 加算部 105は、合成信号の極性を反転させて Xinに加算することにより誤差信号を算出し、誤差信号を聴覚重み付け部 112に出力する。

[0029] 適応音源符号帳 106は、過去に加算部 111によって出力された駆動音源をバッファに記憶しており、ノラメータ決定部 113から出力された信号により特定される過去の駆動音源から 1フレーム分のサンプルを適応音源ベクトルとして切り出して乗算部 10 9に出力する。

[0030] ゲイン符号帳 107は、ノラメータ決定部 113から出力された信号によって特定される適応音源ベクトルのゲインと固定音源ベクトルのゲインとをそれぞれ乗算部 109と乗算部 110とに出力する。

[0031] 固定音源符号帳 108は、ノラメータ決定部 113から出力された信号によって特定される形状を有するノルス音源ベクトル又はそのノルス音源ベクトルに拡散ベクトルを乗算して得られたベクトルを固定音源ベクトルとして乗算部 110に出力する。

[0032] 乗算部 109は、ゲイン符号帳 107から出力されたゲインを、適応音源符号帳 106から出力された適応音源ベクトルに乗じて、加算部 111に出力する。乗算部 110は、ゲイン符号帳 107から出力されたゲインを、固定音源符号帳 108から出力された固定音源ベクトルに乗じて、加算部 111に出力する。

[0033] 加算部 111は、利得乗算後の適応音源ベクトルと固定音源ベクトルとをそれぞれ乗算部 109と乗算部 110とから入力し、これらをベクトル加算し、加算結果である駆動音源を合成フィルタ 104および適応音源符号帳 106に出力する。なお、適応音源符号帳 106に入力された駆動音源は、バッファに記憶される。

[0034] 聴覚重み付け部 112は、加算部 105から出力された誤差信号に対して聴覚的な重み付けをおこない符号化歪みとしてパラメータ決定部 113に出力する。

[0035] ノラメータ決定部 113は、聴覚重み付け部 112から出力された符号化歪みを最小とする適応音源ベクトル、固定音源べ外ル及びゲインの符号を探索し、探索された適応音源ベクトルを表す符号 (A)、固定音源ベクトルを表す符号 (F)及びゲインを表す符号 (G)を多重化部 114に出力する。

[0036] 本発明は、パラメータ決定部 113における固定音源ベクトル及びゲインの探索方法に特徴がある。すなわち、まず、第 1パラメータ決定部 121が、適応音源符号帳単独による音源探索を行った後、第 2パラメータ決定部 122が、固定音源符号帳による音源探索とゲインの探索とを閉ループにより同時に行う。

[0037] 多重化部 114は、 LPC量子化部 103から量子化 LPCを表す符号 (L)を入力し、パラメータ決定部 113から適応音源ベクトルを表す符号 (A)、固定音源ベクトルを表す符号 (F)およびゲインを表す符号 (G)を入力し、これらの情報を多重化して符号化情報として出力する。

[0038] 次に、本実施の形態に係る符号化手順について図 3を用いて説明する。

[0039] まず、入力音声信号に対して線形予測分析を行い、 LPC系パラメータを抽出し、 L SP (Line Spectrum Pair)のべタトノレに変換する。そして、そのべタトノレの VQ (ベクトノレ量子化）を行!、LPCの符号を決める。

[0040] 次に、その LPCの符号を復号化して復号化されたパラメータを求め、そのパラメ一タで合成フィルタを構成する。

[0041] 次に、適応音源符号帳単独による音源探索を行う。具体的には、理想ゲイン (歪が最も小さくなるゲイン)を仮定して、適応音源符号帳に格納されてレ、る各適応音源べタトルに上記理想ゲインを乗じた値を上記合成フィルタに通して合成信号を生成し、この合成信号と入力音声信号との距離である符号化歪を計算し、この符号化歪が最も小さくなる適応音源ベクトルの符号を探索する。

[0042] 次に、その探索された符号を復号化し、復号化された適応音源ベクトルを求める。

[0043] 次に、固定音源符号帳による音源探索とゲインの探索とを閉ループにより同時に行う。具体的には、すべての固定音源ベクトルとゲインの組み合わせについて、候補固定音源ベクトルに候補ゲインを乗じた値と上記復号化された適応音源ベクトルに候補ゲインを乗じた値とを加算したものを上記合成フィルタに通して合成信号を生成し、この合成信号と入力音声信号との距離である符号化歪を計算し、この符号化歪が最も小さくなる固定音源べ外ルの符号およびゲインを探索する。

[0044] 最後に、探索された 2つのベクトルのゲインを量子化する。

[0045] 次に、固定音源符号帳とゲインの閉ループ探索のアルゴリズムについて、図 4のフ口一および数式を用レ、て具体的に説明する。

[0046] 式（1)は、 CELPにおいて符号探索に用いる符号化歪 Eを示すものである。この符号化歪 Eを最小化する符号を探索するのが符号器の処理である。なお、式（1)において、 Xは符号化ターゲット（入力音声）、 pは適応音源用ゲイン、 Hは LPC合成フィルタのインパルス応答、 aは適応音源ベクトル、 qは固定音源用ゲイン、 sは固定音源ベクトルをそれぞれ表す。

國

[0047] 上記式（1)を展開すると以下の式（2)となる。ここで、以降の説明ではインデクスを付与して表記する。適応音源ベクトルは先に符号化して復号化しておくので上記記号のままで表記する力固定音源ベクトルにはインデクス iを付与して sと表記する。またゲインは適応音源用ゲイン pと固定音源用ゲイン qをまとめてベクトル量子化するものとし、同じインデクス jを付与して p、 qと表記する。

J J

[数 2]

Ε = χ'χ + ρ²α'Η'Ηα― Ιρχ'Ηα + q²s'H'Hs― Iqx'Hs + 2pqa'H'Hs · · · ( 2 ) t ：転置記号

[0048] ここで、本実施の形態では、固定音源符号帳とゲインの閉ループ探索を行う前に、固定音源ベクトル sあるいはゲイン qに関わらない中間値を予め計算しておく。

1 j

[0049] まず、上記式（2)の第 1項は、ターゲットのパヮであり、符号帳探索には無関係であるので以後省略する。また、上記式（2)の第 2項、第 3項は、ゲイン qおよび固定音源

J

ベクトル sに関わらないので、第 2項、第 3項のゲイン p以外を、以下の式（3)に示す

J

M²とする。なお、本実施の形態では前もって適応音源ベクトルの探索を終えているので、上記式（2)の第 2項、第 3項は両者ともスカラ値になる。國

M¹ = α'Η'Ηα , 、

. . · ( 3 )

Μ² = - Ιχ'Η

[0050] また、上記式（2)の第 4項、第 5項は、ゲイン pに関わらないので、第 4項、第 5項の

J

ゲイン q以外を、以下の式 (4)に示すように中間値 M³、 M⁴とする。なお、式 (4)にお

J

いて、 Iは固定音源ベクトルの候補数である。

[数 4コ

M = s_i'H'Hs_i

M^ -2x'H_Si · · · ( 4 ) [0051] また、上記式（2)の第 6項のゲイン p、 q以外を、以下の式（5)に示すように中間値

J J

M⁵とする。

[数 5コ

M⁵ = la'H'Hs,

' , · · · ( 5 )

[0052] ここで、上記式（2)の第 2項、第 3項についてはゲイン候補全てについて予め加算しておくことができるので、以下の式（6)に示すように中間値 Nとする。なお、式（6) j

にお!/、て、 Jはゲインの候補数 (本実施の形態ではベクトル数)である。

[数 6]

N . = p_jPjM_x ^ p_jM₂ _ . . _{( 6 )}

ゾ = 1…ゾ

[0053] このように、本実施の形態では、中間値を予め計算し、固定音源符号帳とゲインについてそれぞれの候補数の総当りで同時探索を行う。図 4に示すように、本実施の形態の閉ループ探索は、ゲインの探索のループ (第 1ループ)の中に固定音源符号帳の探索のループ（第 2ループ）が入る 2重ループになって!/、る。

[0054] 図 4に示す探索処理の特徴は、ループ内の計算が全て簡単な数値計算であり、ベタトルの演算が無い点である。この結果、計算量は必要最小限に抑えられる。

[0055] このように、本実施の形態によれば、 CELP方式において、ベクトル演算を行うことなくゲインと固定音源ベクトルの閉ループ探索を行うことができるので、開ループ探索と比較して計算量を大幅には増加させずに、大きな性能向上を得ることができる。

[0056] また、中の探索（第 1ループ）の計算量を

大きく下げることができる。同様に、中間値 M³、 M⁵を予め求めておくことによって固定音源ベクトルの探索（第 2ループ）の計算量を大きく下げることができ

^ o

[0057] (実施の形態 2)

実施の形態 2では、固定音源ベクトルが少数のノルスで構成されたベクトルか、それを拡散させたベクトルであるときに、予めノルス本数や拡散ベクトルの種類毎にスケーリング係数を計算してメモリに格納しておき、固定音源符号帳とゲインの閉ループ探索において、スケーリング係数を固定音源ベクトルに乗じてゲインの量子化を行う場合について説明する。本実施の形態におけるスケーリング係数は、固定音源べクトルの大きさ（振幅）を表す値の逆数であり、パルスの本数や拡散ベクトルの種類に依存する。

[0058] 固定音源符号帳とゲインの閉ループ探索において、スケーリング係数を用いることは、ゲイン qにスケーリング係数 Vを乗ずるのと等価であり、上記式（2)は以下の式（

J

7)に変更になる。

[数 7]

E = x'x + p一 a'H'Ha― 2px'Ha + q²s'H'Hs v² - 2qx'Hs v + 2pqa^lH'Hs v

…（7 )

[0059] 上記スケーリング係数 Vは、パルスの本数に依存した量であるので、例えば以下の式（8)の様に予め算出しておく。なお、式（8)において、 1^は i番目の固定音源べタトルのパルスの本数である。符号帳のこの式（8)は、インパルスの大きさを 1とした場合に相当する。

[数 8コ

…（8 )

i = -I

[0060] なお、上記スケーリング係数はその定義から更に平方根の計算の前にベクトル長で割る場合もある。このような場合は、スケーリング係数を 1サンプルの平均振幅の逆数と定義した場合等である。

[0061] また、更に拡散ベクトルを用いる場合には平均の振幅が拡散ベクトルによって異なつてくる。この場合でも、以下の式（9)の様に、パルス本数や拡散ベクトル毎に全ての音源ベクトル候補の平均振幅や、上記本数に基づく係数を近似値として使用する等、本数や拡散ベクトル毎に 1つのスケーリング係数を求めることができる。ただし、以下の式（9)の計算はあくまで近似である。なぜなら、パルスを拡散する場合、パルスの位置で、拡散ベクトルが重なるので位置毎にパヮが異なってくるからである。なお、式（9)において、 d ^miは拡散ベクトル、 mは i番目の固定音源べタトノレの拡散ベクトルの番号を示す。

[数 9コ

/ = 1·· ·7 · · · ( 9 )

ただし、 Pd_mi = d

[0062] 従って、ノ^レス本数や拡散ベクトルの種類毎にスケーリング係数 Vがある場合は、上記のスケーリング係数を用いて、中間値 M³、 M⁴、 M⁵は以下の式（10)の様に表される。

[数 10]

M = ' V,²

M = - 2x'Hs_j ν,.

Μ,⁵ = la'H'Hs, v.

. j · · · ( 1 0 )

[0063] このように、本実施の形態によれば、スケーリングに伴う処理があっても、中間値に含めることができるので、スケーリングを用いない場合と同様に固定音源符号帳とゲインの閉ループ探索を実現することができる。

[0064] なお、固定音源符号帳として代数的符号帳を用いる場合は、上記 2つの中間値 M³ 、 M⁴は代数的符号帳探索のコスト関数の分母項と分子項に相当する。また、代数的符号帳はノルスの位置とパルスの極性（+—)で符号化を行い、この場合、ベクトル X tfiの各要素の極性を参照して、パルスの極性をパルスの位置の参照値とすることによって、性能の劣化を最小限にしながら極性の探索を省略することができるので、ィンデタス iの種類を少なくでき、閉ループ探索の計算量をより少なくすることができる。例えば、ノルス数 3で各チャネルのエントリ数が { 16, 16, 8 }の場合には情報量（ビット数）は（位置） (4 + 4 + 3) + (極性) (1 + 1 + 1)の 14ビット（1= 16384通り）であるが、極性が探索の対象外だとすると 11ビット（1 = 2048通り）で済むことになる。したがつて、上記実施の形態 1に代数的符号帳を用いることは、計算量を下げるために有効なことである。 [0065] また、固定音源符号帳としての代数的符号帳のパルス数の本数として様々なヴァリエーシヨンを持つことは音質の向上に効果がある。これは、有声性の部分は声帯波に近いことから少数パルスが適しており、無声性や環境ノイズの部分は多数パルスが適しているという傾向から明らかである。例えば、パルス数のヴァリエーションとして 2 本、 3本、 4本を使用し、サブフレームの長さ力 0サンプルである場合、 2本は { 20, 2 0 }で 20 X 20 X 2²の 1600通り、 3本は { 16, 16, 8 }で 16 X 16 X 8 X 2³の 16384通り、 4本 (ま { 16, 8, 8, 8 }で 16 X 8 X 8 X 8 X 2⁴の 131072通りで、人力音声信号 (まサブフレーム毎に合計 17〜； 18ビットで符号化される。

[0066] また、拡散した音源を用いること、すなわち拡散ベクトルをノルスに畳み込んで固定音源ベクトルを作成することも音質の向上に効果がある。この技術により、固定音源ベクトルに様々な特性を与えることができる。この場合、使用する拡散ベクトルによつてパヮが異なってくることになる。

[0067] また、本実施の形態では固定音源符号帳の説明の中で代数的符号帳を用いた場合を例に説明した力本発明は、マルチパルス符号帳等、ノルス本数のヴアリエーシヨンがある音源でも有効である。

[0068] また、パルスが立っている音源以外のフルパルス（全部の位置に値がある）の固定音源符号帳でも本発明は有効である。なぜなら、予め音源ベクトルのパヮのクラスタリングを行い、その少数の代表値で計算したスケーリング係数を求めて格納しておけばよいからである。この場合は、各固定音源のインデタスと使用するスケーリング係数との対応を格納しておく必要がある。

[0069] なお、上記各実施の形態では適応音源符号帳を事前に探索した後で、固定音源符号帳とゲインとの閉ループ探索を行ったが、本発明はこれに限られず、適応音源符号帳をも閉ループ探索に含めることもできる。ただし、この場合、適応音源符号帳の中間値は各実施の形態の固定音源符号帳に関する中間値と同様に計算することができる力 S、最後の閉ループ探索の部分が 3重ループになるために計算量が掛かりすぎる可能性がある。この場合は適応音源符号帳の予備選択を行うことにより、適応音源ベクトルの候補数を削減し、現実的な計算量へ抑えることができる。

[0070] また、上記各実施の形態では固定音源符号帳とゲインの閉ループ探索をそれぞれの候補の総当りで行ったが、本発明はこれに限られず、いずれかの候補の予備選択を組み合わせることができ、これにより計算量をさらに削減することができる。

[0071] また、本発明は、適応音源ベクトルを符号化した後で適応音源ベクトルのゲインを先に符号化した場合でも、固定音源符号帳と固定音源ベクトルのゲインの閉ループ探索を各実施の形態と同様に実現することができる。

[0072] また、上記各実施の形態では CELPに対して用いる場合について説明した力本発明はこれに限られず、音源の符号帳が存在する符号化であれば有効である。なぜなら、本発明の所在は固定音源ベクトルとゲインの閉ループ探索であり、適応音源符号帳の有無や、スペクトル包絡の分析方法に依存しな!/、からである。

[0073] また、本発明に係る音声符号化装置の入力信号は、音声信号だけでなぐオーディォ信号でも良い。また、入力信号の代わりに、 LPC予測残差信号に対して本発明を適用する構成であっても良い。

[0074] また、本発明に係る音声符号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。

[0075] また、ここでは、本発明をハードウェアで構成する場合を例にとって説明した力本発明をソフトウェアで実現することも可能である。例えば、本発明に係る音声符号化方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る音声符号化装置と同様の機能を実現することができる。

[0076] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されても良いし、一部または全てを含むように 1チップ化されても良い。

[0077] また、ここでは LSIとしたが、集積度の違いによって、 IC、システム LSI、スーパー L SI、ウノレ卜ラ LSI等と呼称されることもある。

[0078] また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッサで実現しても良い。 LSI製造後に、プログラム化することが可能な FPGA (Field Pro grammable Gate Array)や、 LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギユラブル .プロセッサを利用しても良!/、。

[0079] さらに、半導体技術の進歩または派生する別技術により、 LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術への適用等が可能性としてあり得る。

[0080] 2006年 12月 14曰出願の特願 2006— 337025の曰本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。

産業上の利用可能性

[0081] 本発明は、 CELPによって音声を符号化する音声符号化装置等に用いるに好適である。

Claims

請求の範囲

[1] 適応音源符号帳の適応音源ベクトルの符号を探索する第 1パラメータ決定手段と、固定音源符号帳の固定音源べ外ルの符号とゲインとを閉ループ探索する第 2パラメータ決定手段と、を具備し、

前記第 2パラメータ決定手段は、固定音源ベクトルとゲインの組み合わせにつ!/、て、候補固定音源ベクトルに固定音源用候補ゲインを乗じた値と前記適応音源べタトルに適応音源用候補ゲインを乗じた値とを加算した値を、量子化線形予測係数に基づくフィルタ係数により構成された合成フィルタに通して合成信号を生成し、この合成信号と入力音声信号との距離である符号化歪を計算し、この符号化歪が最も小さくなる固定音源ベクトルの符号およびゲインを探索する、

音声符号化装置。

[2] 前記第 2パラメータ決定手段は、前記符号化歪みにおいて前記固定音源べクトノレあるいは前記ゲインに関わらない部分である中間値を予め計算し、ゲインの探索のループの中に固定音源符号帳の探索のループが入る 2重ループにより、前記中間値を用いた前記閉ループ探索を行う請求項 1に記載の音声符号化装置。

[3] 前記第 2パラメータ決定手段は、前記固定音源ベクトルが所定数のノ^レスで構成されたベクトルか、それを拡散させたベクトルであるときに、予めパルス本数や拡散べクトルの種類毎にスケーリング係数を計算してメモリに格納しておき、前記閉ループ探索において、スケーリング係数を固定音源ベクトルに乗じてゲインの量子化を行う請求項 1に記載の音声符号化装置。

[4] 適応音源符号帳の適応音源ベクトルの符号を探索する第 1ステップと、

固定音源符号帳の固定音源べ外ルの符号とゲインとを閉ループ探索する第 2ステップと、を具備し、

前記第 2ステップでは、固定音源ベクトルとゲインの組み合わせについて、候補固定音源ベクトルに固定音源用候補ゲインを乗じた値と前記適応音源ベクトルに適応音源用候補ゲインを乗じた値とを加算した値を、量子化線形予測係数に基づくフィルタ係数により構成された合成フィルタに通して合成信号を生成し、この合成信号と入力音声信号との距離である符号化歪を計算し、この符号化歪が最も小さくなる固定音源ベクトルの符号およびゲインを探索する、

音声符号化方法。

[5] 前記第 2ステップでは、前記符号化歪みにおいて前記固定音源ベクトルあるいは前記ゲインに関わらない部分である中間値を予め計算し、ゲインの探索のループの中に固定音源符号帳の探索のループが入る 2重ループにより、前記中間値を用いた前記閉ループ探索を行う請求項 4に記載の音声符号化方法。

[6] 前記第 2ステップでは、前記固定音源ベクトルが所定数のノレスで構成されたべクトルカ、、それを拡散させたベクトルであるときに、予めパルス本数や拡散ベクトルの種類毎にスケーリング係数を計算してメモリに格納しておき、前記閉ループ探索において、スケーリング係数を固定音源ベクトルに乗じてゲインの量子化を行う請求項 4に記載の音声符号化方法。