JPH06282298A - 音声の符号化方法 - Google Patents

音声の符号化方法

Info

Publication number
JPH06282298A
JPH06282298A JP5070534A JP7053493A JPH06282298A JP H06282298 A JPH06282298 A JP H06282298A JP 5070534 A JP5070534 A JP 5070534A JP 7053493 A JP7053493 A JP 7053493A JP H06282298 A JPH06282298 A JP H06282298A
Authority
JP
Japan
Prior art keywords
vector
gain
codebook
noise
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5070534A
Other languages
English (en)
Other versions
JP3148778B2 (ja
Inventor
Akitoshi Kataoka
章俊 片岡
Takehiro Moriya
健弘 守谷
Shinji Hayashi
伸二 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP07053493A priority Critical patent/JP3148778B2/ja
Priority to EP96202584A priority patent/EP0751496B1/en
Priority to DE69309557T priority patent/DE69309557T2/de
Priority to EP93401656A priority patent/EP0577488B9/en
Priority to DE69328450T priority patent/DE69328450T2/de
Publication of JPH06282298A publication Critical patent/JPH06282298A/ja
Priority to US08/658,303 priority patent/US5787391A/en
Application granted granted Critical
Publication of JP3148778B2 publication Critical patent/JP3148778B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 伝送路誤りが発生しても、音声を高品質に符
号化,復号化する。 【構成】 予測係数決定部2,予測係数量子化部4は、
合成フィルタ3に予測係数を設定する。適応符号帳1
7,雑音符号帳18からピッチ周期ベクトル,雑音波形
ベクトルが出力され、雑音波形ベクトルは、予測利得が
乗算される。予測利得決定部15は、現在,過去の利得
部19bの出力のパワーを基に次の雑音波形ベクトルの
予測利得を得る。ピッチ周期ベクトル,予測利得部16
の出力は、同時に決定された利得が乗算された後、加算
され、合成フィルタ3に供給され、合成音声ベクトルが
合成される。入力音声ベクトルから合成音声ベクトルが
減算されて得られた歪は、聴覚重み付けされた後、パワ
ーが計算され、このパワーが最小になるように、適応符
号帳17,雑音符号帳18からピッチ周期ベクトル,雑
音波形ベクトルが選択され、利得部19a,19bの利
得が設定される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、自動車電話等のディ
ジタル移動通信などに用いられ、音声を高能率に符号化
する音声の符号化方法に関する。
【0002】
【従来の技術】近年、ディジタル移動通信などの技術分
野においては、電波を有効利用するなどの目的で、種々
の高能率符号化方法が用いられている。これらの高能率
符号化方法のうち、8kbit/s程度の符号化速度で
音声を符号化する高能率符号化方法としては、符号駆動
型線形予測(CELP)符号化方法やベクトル加算駆動
型線形予測(VSELP)符号化方法、あるいはマルチ
パス符号化方法等がある。
【0003】図16は、従来のCELP符号化方法を用
いた音声の符号化装置の構成例を表すブロック図であ
る。アナログの音声信号がサンプリング周波数8kHz
でサンプリングされて生成された入力音声データが入力
端子1から入力される。予測係数決定部2において、入
力端子1から入力された入力音声データの複数のサンプ
ルが1フレームとして1つのベクトルにまとめられ(以
下、入力音声ベクトルという)、この入力音声ベクトル
について線形予測分析がなされ、伝達関数{1/A
(z)}を有する合成フィルタ3の予測係数(線形予測
符号化(LPC)係数、または線スペクトル対(LS
P)係数)が計算され、決定される。これにより、予測
係数量子化部4において、予測係数が量子化され、合成
フィルタ3に設定される。
【0004】適応符号帳5は、音声の有声区間のピッチ
周期に対応した複数のピッチ周期ベクトルが記憶される
ように構成されている。この適応符号帳5から、後述す
る歪パワー計算部12によって選択され、取り出された
ピッチ周期ベクトルに、利得部6において、同じく歪パ
ワー計算部12によって設定された利得が乗算され、利
得部6から出力される。
【0005】いっぽう、雑音符号帳7には、音声の無声
区間に対応した複数の雑音波形ベクトル(たとえば、乱
数ベクトル)があらかじめ記憶されている。この雑音符
号帳7から、後述する歪パワー計算部12によって選択
され、取り出された雑音波形ベクトルに、利得部8にお
いて、歪パワー計算部12によって設定された利得が乗
算され、利得部8から出力される。そして、利得部6の
出力ベクトルと、利得部8の出力ベクトルとが加算器9
において加算され、加算器9の出力ベクトルが合成フィ
ルタ3に駆動ベクトルとして供給され、合成フィルタ3
において、設定された予測係数に基づいて音声ベクトル
(以下、合成音声ベクトルという)が合成される。
【0006】また、パワー量子化部10において、入力
音声ベクトルのパワーが計算された後、そのパワーが量
子化され、これにより、量子化された入力音声ベクトル
のパワーが用いられて入力音声ベクトルとピッチ周期ベ
クトルとが正規化される。そして、減算器11におい
て、正規化され、パワー量子化部10から出力された入
力音声ベクトルから合成音声ベクトルが減算されて、歪
データが求められる。
【0007】次に、歪パワー計算部12は、歪データの
パワーを計算し、この歪データのパワーが最も小さくな
るように、適応符号帳5および雑音符号帳7それぞれか
らピッチ周期ベクトルおよび雑音波形ベクトルをそれぞ
れ選択するとともに、利得部6および8のそれぞれの利
得を設定する。これにより、符号出力部13において、
予測係数、入力音声ベクトルのパワー、ピッチ周期ベク
トルおよび雑音波形ベクトルそれぞれに対して選択され
た情報(コード)と利得などとがビット系列の符号に変
換されて出力され、これらの符号が伝送される。
【0008】いっぽう、従来のVSLEP符号化方法
は、上述したCELP符号化方法とほぼ同様であるが、
CELP符号化方法のように、選択されたピッチ周期ベ
クトルおよび雑音波形ベクトルにそれぞれ別々の利得を
乗算するのではなく、量子化効率を上げるためにベクト
ル量子化方法を用いて、ピッチ周期ベクトルおよび雑音
波形ベクトルにそれぞれ乗算する利得を同時に決定して
利得部6および8に設定している。
【0009】なお、CELP符号化方法の詳細について
は、たとえば、M.R.SchroederとB.S.Atalとが著した"Co
de-Excited Linear Prediction(CELP) : High-quality
Speech at Very Low Rates" (Proc. ICASSP '85, 25.1.
1, pp. 937-940, 1985を、VSELP符号化方法の詳細
については、たとえば、I.A.GersonとM.A.Jasiukとが著
した"Vector Sum Excited Linear Prediction (VSELP)
Speech Coding at 8kps" (Proc. ICASSP '90, S9.3, p
p. 461-464, 1990)を、マルチパス符号化方法の詳細に
ついては、たとえば、小澤一範と荒関卓とが著した”ピ
ッチ情報を用いた9.6−4.8kbit/sマルチパ
ス音声符号化方式”(信学誌(D−II),J72−D−
II,8,pp.1125−1132,1989)をそれ
ぞれ参照されたい。
【0010】また、予測係数と入力音声ベクトルのパワ
ーとに対して後方予測方法を用いることにより、予測係
数の符号と入力音声ベクトルのパワーの符号とを伝送す
る必要のない高能率符号化方法として、16kbit/
sの符号化速度で音声を符号化する低遅延符号駆動型線
形予測(LD−CELP)符号化方法がある。図17
は、従来のLD−CELP符号化方法を用いた音声の符
号化装置の構成例を表すブロック図である。この図にお
いて、図16の各部に対応する部分には同一の符号を付
け、その説明を省略する。
【0011】予測係数決定部14においては、入力端子
1から入力された、現在量子化しようとしているフレー
ム内の入力音声データについて線形予測分析がなされて
合成フィルタ3の予測係数が計算されるのではなく、過
去に処理された合成フィルタ3の出力ベクトルについ
て、音声のピッチの周期性も含めた50次の高次線形予
測分析がなされて合成フィルタ3の予測係数が計算さ
れ、決定される。これにより、決定された予測係数が合
成フィルタ3に設定される。
【0012】同様に、この音声の符号化装置において
は、図16に示す音声の符号化装置のように、パワー量
子化部10において、現在量子化しようとしているフレ
ーム内の入力音声データのパワーが計算された後、その
パワーが量子化されるのではなく、予測利得決定部15
において、過去に処理された利得部8の出力ベクトルの
パワーについて線形予測分析がなされ、現在のフレーム
の処理において選択された雑音波形ベクトルに与えるパ
ワー(すなわち、予測利得)が計算されて決定され、予
測利得部16に設定される。
【0013】したがって、雑音符号帳7から、歪パワー
計算部12によって選択され、取り出された雑音波形ベ
クトルに、予測利得部16において、予測利得決定部1
5によって設定された予測利得が乗算された後、利得部
8において、歪パワー計算部12によって設定された利
得が乗算され、利得部8から出力される。そして、利得
部8の出力ベクトルが合成フィルタ3に駆動ベクトルと
して供給され、合成フィルタ3において、設定された予
測係数に基づいて合成音声ベクトルが合成される。
【0014】次に、減算器11において、入力音声ベク
トルから合成音声ベクトルが減算されて、歪データが求
められる。これにより、歪パワー計算部12は、歪デー
タのパワーを計算し、この歪データのパワーが最も小さ
くなるように、雑音符号帳7から雑音波形ベクトルを選
択するとともに、利得部8の利得を設定する。これによ
り、符号出力部13において、雑音波形ベクトルに対し
て選択されたコードと利得などとがビット系列の符号に
変換されて出力され、これらの符号が伝送される。
【0015】以上説明したように、従来のLD−CEL
P符号化方法においては、音声の符号化装置と音声の復
号化装置との双方で過去に処理された合成音声ベクトル
を共通に利用することができるので、予測係数と入力音
声ベクトルのパワーとを伝送する必要がない。なお、L
D−CELP符号化方法の詳細については、J.Chenが著
した"High Quality 16kb/s Speech Coding with a One-
Way Delay Less Than 2 ms" (Proc. ICASSP '90, 33. S
9.1, 1990)を参照されたい。
【0016】
【発明が解決しようとする課題】ところで、上述した従
来の音声の符号化方法のうち、CELP符号化方法にお
いては、現在量子化しようとしているフレーム内の入力
音声データについてのみ線形予測分析がなされて合成フ
ィルタ3の予測係数が計算され、その予測係数が量子化
されているので、伝送先において良い品質の復号化され
た音声(以下、復号音声という)を得るためには、予測
係数量子化のためのビット数が多く必要となるという欠
点があった。
【0017】また、入力音声ベクトルのパワーを量子化
し、量子化された入力音声ベクトルのパワーに対して選
択されたコードを符号として伝送しているので、この符
号が伝送路で誤った場合には、復号音声の無音区間で突
然音声が発生したり、逆に突然音声が途切れたりして、
復号音声の品質が著しく劣化してしまうという問題があ
った。また、入力音声ベクトルのパワーを限られたビッ
ト数で量子化しているので、入力音声ベクトルの振幅が
小さい場合には、量子化雑音が増加してしまうという欠
点があった。
【0018】さらに、雑音波形ベクトルを1つの雑音符
号帳7に記憶された1つの雑音波形ベクトルによって表
現し、その雑音波形ベクトルに対して選択されたコード
を符号として伝送しているので、この符号が伝送路で誤
った場合には、伝送先の音声の復号化装置において、ま
ったく異なる雑音波形ベクトルが用いられることにな
り、この場合にも、復号音声の品質が著しく劣化してし
まう。
【0019】また、雑音符号帳に記憶される雑音波形ベ
クトルは、通常、実際の音声データが多数記憶された音
声データベースを用いて実際の音声データにマッチする
ように学習を行って求めるが、雑音波形ベクトルを1つ
の雑音符号帳7の1つの雑音波形ベクトルによって表現
した場合には、多くの記憶容量が必要となり、符号帳サ
イズが大きくなってしまう。したがって、上述した学習
が行えず、雑音波形ベクトルが実際の音声データとうま
くマッチしないという欠点がある。
【0020】また、上述した従来のVSLEP符号化方
法においては、同時に設定された、ピッチ周期ベクトル
および雑音波形ベクトルに乗算すべき利得の符号が伝送
路で誤った場合には、伝送先の音声の復号化装置におい
て、ピッチ周期ベクトルおよび雑音波形ベクトルにまっ
たく異なる利得が乗算されることになり、この場合に
も、復号音声の品質が著しく劣化してしまう。
【0021】さらに、上述した従来のCELP符号化方
法やVSLEP符号化方法などにおいては、歪データの
パワーが最も小さくなるようなピッチ周期ベクトルおよ
び雑音波形ベクトルを適応符号帳5および雑音符号帳7
から選択している。しかしながら、最適なピッチ周期ベ
クトルおよび雑音波形ベクトルを選択するためには、パ
ワーが量子化された入力音声ベクトルをXとし、適応符
号帳5または雑音符号帳7から選択されたピッチ周期ベ
クトルまたは雑音波形ベクトルをVj(j=1〜N;N
は符号帳サイズ)とし、利得部6または8に設定される
利得をgとし、合成フィルタ3および図示せぬ聴覚重み
付けフィルタを1個のFIRフィルタによって表した場
合のFIRフィルタの係数であるインパルスレスポンス
係数をHとし、歪データをdとした場合、歪パワー計算
部12において、構成要素3,5〜9,11および12
によって構成されるクローズドループにおける(1)式
によって表される歪データdのパワーの計算を、適応符
号帳5および雑音符号帳7にそれぞれ記憶されたすべて
のピッチ周期ベクトルおよび雑音波形ベクトルについて
行わなければならず、膨大な演算量が必要となるという
問題があった。 d=|X−gHVj2・・・(1)
【0022】いっぽう、上述した従来のLD−CELP
符号化方法においては、合成フィルタ3の予測係数を計
算する際、過去に処理された合成音声ベクトルについて
のみ線形予測分析する後方予測方法を用いているので、
上述したCELP符号化方法やVSLEP符号化方法に
おいて用いられている前方予測方法に比べて、予測誤差
が大きい。このため、8kbit/s程度の符号化速度
では急激に波形歪が増大し、復号音声の品質が著しく劣
化してしまう。この発明は、このような背景の下になさ
れたもので、伝送路において誤りが発生した場合でも、
その影響をあまり受けずに、遅い符号化速度で音声の高
品質な符号化および復号化ができる音声の符号化方法を
提供することを目的とする。
【0023】
【課題を解決するための手段】この発明は、音声データ
の複数サンプルを線形予測分析して予測係数を算出し、
該予測係数を量子化して合成フィルタに設定し、該合成
フィルタを、複数のピッチ周期ベクトルが記憶された適
応符号帳と、複数の雑音波形ベクトルが記憶された雑音
符号帳とからそれぞれ選択され、それぞれ所定の利得が
乗算されたピッチ周期ベクトルおよび雑音波形ベクトル
によって、前記音声データの複数サンプルからなるフレ
ーム単位に駆動して合成音声ベクトルを合成することを
利用して音声を符号化する音声の符号化方法において、
前記予測係数を量子化する際、この量子化の結果である
量子化パラメータベクトルを、現フレームの候補パラメ
ータベクトルと、1つ前のフレームの処理において用い
た候補パラメータベクトルとの加重平均によって表現す
る第1の処理、前記候補パラメータベクトルを複数の予
測パラメータ符号帳からそれぞれ選択される複数種類の
サブパラメータベクトルの和によって表現し、前記量子
化パラメータベクトルと、前記予測係数に対応した入力
パラメータベクトルとの歪が最小となるように前記複数
種類のサブパラメータベクトルを前記複数の予測パラメ
ータ符号帳からそれぞれ選択し、選択された複数種類の
サブパラメータベクトルを加算して得られた現フレーム
の候補パラメータベクトルが安定か否かを判断し、不安
定な場合には、所定の規則により前記現フレームの候補
パラメータベクトルを安定となるように変換する第2の
処理、前記適応符号帳および前記雑音符号帳から前記ピ
ッチ周期ベクトルおよび前記雑音波形ベクトルを選択す
る際、前記音声データの複数サンプルからなる入力音声
ベクトルと、前記合成音声ベクトルとの相関値をそれぞ
れ算出し、それぞれの相関値が大きいピッチ周期ベクト
ルおよび雑音波形ベクトルについてのみ最終的な選択の
ための演算を行う第3の処理、前記雑音符号帳を複数の
サブ雑音符号帳によって構成し、前記雑音波形ベクトル
は、各サブ雑音符号帳から選択された複数の励振ベクト
ルの和によって表現する第4の処理、前記ピッチ周期ベ
クトルおよび前記雑音波形ベクトルにそれぞれ乗算され
る利得があらかじめ記憶された2つの利得符号帳をそれ
ぞれ複数のサブ利得符号帳によって構成し、前記各利得
を各サブ利得符号帳の出力の和によって表現する第5の
処理、前記各利得が乗算された前記ピッチ周期ベクトル
および前記雑音波形ベクトルによって前記合成フィルタ
を駆動して合成音声ベクトルを得、得られた合成音声ベ
クトルと入力音声ベクトルとの歪が最小となるように前
記各サブ利得符号帳の出力を選択して、前記各利得を同
時に決定する第6の処理、選択された雑音波形ベクトル
に予測利得を乗算する予測利得手段を設け、現フレーム
の処理において前記予測利得および前記利得が乗算され
た前記雑音波形ベクトルと、過去のフレームの処理にお
いて前記予測利得および前記利得が乗算された前記雑音
波形ベクトルとに基づいて、次のフレームの処理におい
て前記雑音波形ベクトルに乗算すべき前記予測利得を予
測する第7の処理の少なくとも1つの処理を行うことを
特徴としている。
【0024】
【作用】上記方法によれば、伝送路において誤りが発生
した場合でも、その影響をあまり受けずに、遅い符号化
速度で音声の高品質な符号化および復号化ができる。
【0025】
【実施例】以下、図面を参照して、この発明の実施例に
ついて説明する。図1はこの発明の一実施例による音声
の符号化方法を用いた符号化装置の概略構成を表すブロ
ック図であり、この図において、図16および図17の
各部に対応する部分には同一の符号を付け、その説明を
省略する。予測係数決定部2において、入力端子1から
入力された複数サンプルの入力音声データについて線形
予測分析がなされ、合成フィルタ3の予測係数が計算さ
れ、決定される。これにより、予測係数量子化部4にお
いて、予測係数が量子化され、合成フィルタ3に設定さ
れる。
【0026】いっぽう、適応符号帳17および雑音符号
帳18からは、歪パワー計算部12によってそれぞれ選
択されたピッチ周期ベクトルおよび雑音波形ベクトルが
それぞれ取り出され、雑音波形ベクトルは、予測利得部
16において、予測利得決定部15によって設定された
予測利得が乗算される。予測利得決定部15において
は、現在のフレームの処理における利得器19の利得部
19bの出力ベクトルのパワーと、過去に処理され、記
憶されている利得部19bの出力ベクトルのパワーとに
基づいて線形予測分析がなされ、次のフレームにおいて
選択される雑音波形ベクトルに与えるパワー(すなわ
ち、予測利得)が計算されて決定され、予測利得部16
に設定される。
【0027】そして、選択されたピッチ周期ベクトルお
よび予測利得部16の出力ベクトルは、歪パワー計算部
12によって同時に決定され、利得器19の利得部19
aおよび19bに設定された利得が、利得部19aおよ
び19bにおいて乗算されて出力される。これにより、
利得部19aの出力ベクトルと、利得部19bの出力ベ
クトルとが加算器9において加算され、加算器9の出力
ベクトルが合成フィルタ3に駆動ベクトルとして供給さ
れ、合成フィルタ3において、合成音声ベクトルが合成
される。
【0028】次に、減算器11において、入力音声ベク
トルから合成音声ベクトルが減算されて、歪データが求
められ、この歪データが聴覚重み付けフィルタ20にお
いて人間の聴覚の特性に対応した係数によって重み付け
された後、歪パワー計算部12において、聴覚重み付け
フィルタ20から出力された歪データのパワーが計算さ
れ、この歪データのパワーが最も小さくなるように、適
応符号帳17および雑音符号帳18それぞれからピッチ
周期ベクトルおよび雑音波形ベクトルがそれぞれ選択さ
れるとともに、利得部19aおよび19bのそれぞれの
利得が設定される。これにより、符号出力部13におい
て、予測係数、ピッチ周期ベクトルおよび雑音波形ベク
トルそれぞれに対して選択されたコードと利得などがビ
ット系列の符号に変換され、必要に応じて誤り訂正符号
が付加されて伝送される。
【0029】次に、図2にこの発明の一実施例による音
声の符号化方法を用いた符号化装置のより詳細な構成を
表すブロック図を示す。この図において、図1の各部に
対応する部分には同一の符号を付け、その説明を省略す
る。アナログの音声信号がサンプリング周波数8kHz
でサンプリングされて生成された入力音声データは、入
力端子1から入力され、80サンプルを1フレームとし
て1つのベクトルにまとめられ、入力音声ベクトルとし
てバッファ21に蓄積される。フレームは、さらに、4
0サンプルを単位とする2つのサブフレームに分割され
る。これ以降の処理は、フレーム単位、またはサブフレ
ーム単位で行われる。
【0030】バッファ21から出力された入力音声ベク
トルは、ソフトリミット部22において、フレーム単位
でその振幅がチェックされ、入力音声ベクトルの振幅の
絶対値があらかじめ設定されたしきい値Lより大きい場
合、すなわち、入力音声ベクトルをXViとした時、|X
Vi|>Lである場合には、(2)または(3)式により
入力音声ベクトルが圧縮され、音声ベクトルXVOとして
出力される。XVi>0の場合には、 XVO=nu+S・・・(2) XVi<0の場合には、 XVO=−nu−S・・・(3) ただし、 S=B×tan-1{(|XVi|−nu)/B}・・・(4) ここで、Bおよびnuはそれぞれ定数(たとえば、B=
16384,nu=2516)である。なお、上述した
ソフトリミット部22における処理は、入力音声ベクト
ルXViの絶対値がしきい値Lを越えた場合のみに行われ
るので、通常、すなわち、入力音声ベクトルが適正な値
の範囲内に入っている場合には、入力音声ベクトルに対
してなんらの影響も与えない。
【0031】ソフトリミット部22から出力された現在
処理すべきフレーム(以下、現フレームという)の入力
音声ベクトル(80サンプルの入力音声データ)と、過
去に処理された176サンプル分の入力音声データとを
含めた計256サンプルの入力音声データについて、L
PC分析部23において、線形予測分析がなされてLP
C係数が計算され、決定される。線形予測分析には、自
己相関法、共分散法、またはラティス法など有効な方法
であれば、いずれの方法を用いてもよい。この実施例に
おいては、自己相関法を用いる。また、線形予測分析に
は、図3に示す形を有する分析窓を用い、分析次数を1
0次元とする。さらに、この線形予測分析には、(5)
式に示す伝達関数A(z)を用いるものとする。
【数1】 したがって、LPC分析部23において、10次のLP
C係数αi(i=1〜10)が計算され、決定される。
【0032】LPC分析部23において決定されたLP
C係数αiは、LPC係数量子化部24において、LS
Pパラメータに変換された後、量子化され、さらに、量
子化されたLSPパラメータは、LPC係数に変換され
る。この一連の処理によって得られたLPC係数は、量
子化されている。LSPパラメータの量子化に用いられ
たコードは、符号出力部13においてビット系列に変換
された後、音声の復号化装置に伝送される。LPC係数
αiは、たとえば、ニュートンラプソン法によりLSP
パラメータに変換される。この実施例においては、LS
Pパラメータの次数は、LPC係数と同一の10次であ
る。
【0033】LSPパラメータの量子化は、フレーム長
が10msecと短く、各フレーム間の相関が高いの
で、これを利用して多段ベクトル量子化方法を用いて行
う。ここで、図4にLPC係数量子化部24内に設けら
れたベクトル量子化部の構成を表すブロック図を示す。
現フレームより1つ前のフレームの処理においてLSP
符号帳25から取り出されたLSP符号ベクトルVk-1
(kはフレーム番号)は、乗算器26および27におい
て、それぞれ乗算係数(1−g1)および(1−g2)が
乗算された後、切換スイッチ28の入力端子Taおよび
bに供給される。なお、符号g1およびg2は、加重平
均の比率の定数である。切換スイッチ28は、歪計算部
29による歪計算結果に応じて切り換えられるようにな
っており、乗算器26、あるいは27のいずれかの出力
ベクトルが選択されて共通端子Tcを介して加算器30
の一方の入力端に供給される。
【0034】いっぽう、現フレームの処理においてLS
P符号帳25から取り出されたLSP符号ベクトルVk
は、切換スイッチ31のそれぞれの入力端子に供給され
る。この切換スイッチ31は、切換スイッチ28と同様
に、歪計算部29による歪計算結果に応じて切り換えら
れるようになっており、選択されたLSP符号ベクトル
kは、乗算器32および33において、それぞれ乗算
係数g1およびg2が乗算された後、切換スイッチ34の
入力端子TaおよびTbに供給される。切換スイッチ34
は、切換スイッチ28および31と同様に、歪計算部2
9による歪計算結果に応じて切り換えられるようになっ
ており、乗算器32、あるいは33のいずれかの出力ベ
クトルが選択されて共通端子Tcを介して加算器30の
他方の入力端に供給される。
【0035】これにより、加算器30において、切換ス
イッチ28および34のそれぞれの出力ベクトルが加算
され、目的とする量子化された、フレーム番号kのLS
PパラメータベクトルΩkが出力される。すなわち、こ
の量子化されたLSPパラメータベクトルΩkは、
(6)式によって表される。 Ωk=(1−gm)Vk-1+gmk・・・(6) (6)式において、mは1、あるいは2である。
【0036】そして、歪計算部29において、量子化す
る前のフレーム番号kのLSPパラメータベクトルΨk
と、量子化されたフレーム番号kのLSPパラメータベ
クトルΩkとの歪データが計算され、この歪データが最
も小さくなるように、切換スイッチ28および34が切
り換えられる。これにより、歪計算部29からは、選択
されたLSP符号ベクトルVKのコードが符号S1として
出力されるとともに、乗算器26,27および乗算器3
2,33のそれぞれどちらの出力ベクトルを用いるかを
示す選択情報S2が出力される。
【0037】なお、LSP符号ベクトルVKは、LSP
符号帳25の記憶容量を削減するために、2段のベクト
ルの和によって表現する。この実施例においては、LS
Pパラメータの次数は、上述したように、LPC係数と
同一の10次である。したがって、LSP符号帳25
は、10次元のベクトルE1が複数記憶された第1段L
SP符号帳25aと、低次と高次との2つに分けられた
それぞれ5次元のベクトルが複数記憶された第2段低次
LSP符号帳25b1および第2段高次LSP符号帳25
b2とからなる第2段LSP符号帳25bとによって構成
される。そして、LSP符号ベクトルVKは、(7)お
よび(8)式によって表される。f<5の場合は、 Vk=E1n+EL 2f・・・(7) 5≦fの場合は、 Vk=E1n+EH 2f・・・(8) ここで、E1nは第1段LSP符号帳25aの出力ベクト
ルであり、n=1〜128である。すなわち、第1段L
SP符号帳25aには、128個の出力ベクトルE1が記
憶されている。また、EL 2lは第2段低次LSP符号帳
25b1の出力ベクトル、EH 2lは第2段高次LSP符号
帳25b2の出力ベクトルである。
【0038】次に、ベクトル量子化部の動作を図5に示
すフローチャートを参照して説明する。ステップSP1
では、歪計算部29は、切換スイッチ31を適宜切り換
えることにより、第1段LSP符号帳25aからLSP
パラメータベクトルΨkに近い出力ベクトルE1nを数個
選択した後、ステップSP2へ進む。ステップSP2で
は、歪計算部29は、選択した出力ベクトルE1nの低次
および高次それぞれに、切換スイッチ31を適宜切り換
えることにより、第2段LSP符号帳23bの第2段低
次LSP符号帳25b1および第2段高次LSP符号帳2
b2からそれぞれ選択した出力ベクトルEL 2fおよびEH
2fを加算してLSP符号ベクトルVKとした後、ステッ
プSP3へ進む。
【0039】ステップSP3では、歪計算部29は、ス
テップSP2の処理で得られたLSPパラメータベクト
ルVKが安定であるか否かを判断する。この判断を行う
のは、このLSPパラメータベクトルVKが設定される
合成フィルタ3を安定して動作させるためである。そし
て、合成フィルタ3が安定して動作するためには、得ら
れた10次元のLSPパラメータベクトルVkの各項ω1
〜ω10の値は、(9)式に示す関係を満足してなければ
ならない。 0<ω1<ω2<……<ω9<ω10<π・・・(9) そして、歪計算部29は、LSPパラメータベクトルV
Kの各項ω1〜ω10の値が(9)式に示す関係を満足して
いないため、不安定であるならば、安定となるように変
換する。
【0040】次に、安定な、あるいは安定となるように
変換されたLSPパラメータベクトルVKは、乗算器3
2および33において、それぞれ乗算係数g1およびg2
が乗算された後、乗算器32、あるいは33のいずれか
一方の出力ベクトルが切換スイッチ34を経て加算器3
0の他方の入力端に供給される。いっぽう、現フレーム
より1つ前のフレームの処理においてLSP符号帳25
から取り出されたLSP符号ベクトルVk-1は、乗算器
26および27において、それぞれ乗算係数(1−
1)および(1−g2)が乗算された後、乗算器26、
あるいは27のいずれか一方の出力ベクトルが切換スイ
ッチ28を経て加算器30の一方の入力端に供給されて
いる。これにより、加算器30において、切換スイッチ
28の出力ベクトルと切換スイッチ34の出力ベクトル
との加重平均が求められ、LSPパラメータベクトルΩ
kが出力される。
【0041】したがって、歪計算部29は、ステップS
P4の処理へ進み、LSPパラメータベクトルΨkとL
SPパラメータベクトルΩkとの歪データを計算した
後、ステップSP5へ進む。ステップSP5では、歪計
算部29は、ステップSP4の処理で計算された歪デー
タが最小であるか否かを判断する。この判断結果が「N
O」の場合には、歪計算部29は、切換スイッチ28、
あるいは34を切り換えた後、ステップSP2の処理に
戻り、上述したステップSP2〜ステップSP5の処理
を、ステップSP1の処理で選択した複数個の出力ベク
トルE1nについて繰り返す。そして、ステップSP4の
処理で計算された歪データが最小となると、ステップS
P5の判断結果が「YES」となるので、歪計算部29
は、LSP符号ベクトルVKを決定し、そのコードを符
号S1として出力するとともに、選択情報S2を出力し、
それぞれベクトル量子化部内部の復号化部に伝送する。
この復号化部は、図4に示す構成のうち、LSP符号帳
25と切換スイッチ31とを有している。
【0042】これにより、復号化部は、ステップSP6
の処理へ進み、伝送された符号S1に基づいて切換スイ
ッチ31を切り換え、第1段LSP符号帳25aから出
力ベクトルE1nを選択した後、ステップSP7へ進む。
ステップSP7では、復号化部は、選択した出力ベクト
ルE1nの低次および高次それぞれに、伝送された選択情
報S2に基づいて切換スイッチ31を切り換え、第2段
LSP符号帳23bの第2段低次LSP符号帳25b1
よび第2段高次LSP符号帳25b2からそれぞれ選択し
た出力ベクトルEL 2fおよびEH 2fを加算してLSP符号
ベクトルVKとした後、ステップSP8へ進む。
【0043】ステップSP8では、復号化部は、ステッ
プSP7の処理で得られたLSPパラメータベクトルV
Kが安定であるか否かを判断する。そして、復号化部
は、LSPパラメータベクトルVKが不安定であるなら
ば、安定となるように変換する。これにより、安定な、
あるいは安定となるように変換されたLSPパラメータ
ベクトルVKは、次のフレームにおいて、過去のLSP
符号ベクトルVk-1として用いられる。
【0044】次に、再び図2の説明に戻る。この実施例
による音声の符号化装置において符号帳から最適なベク
トルを探索する際、入力音声ベクトルと合成音声ベクト
ルとの比較を、これらの差である歪データが最小になる
こと、すなわち、SNが最大になることだけで行うと、
量子化雑音によって伝送先における復号音声の品質が劣
化してしまう。このため、聴覚重み付けフィルタ20
は、符号化雑音感を低減するために用いられる。
【0045】聴覚重み付けフィルタ20の伝達関数W
(z)は、(10)式によって表される。
【数2】 ここで、
【数3】
【数4】 (11)式および(12)式において、係数αiは、L
PC分析部23において得られた量子化されていないL
PC係数である。また、γ1およびγ2は定数(たとえ
ば、γ1=0.9,γ2=0.6)である。この聴覚重み
付けフィルタ20から聴覚重み付けされた入力音声ベク
トルおよび合成音声ベクトルが得られる。
【0046】ところで、図1に示す合成フィルタ3は、
自己回帰(Auto-Regressive;AR)モデルの伝達関数
{1/A(z)}を有し、上述した聴覚重み付けフィル
タ20は、自己回帰移動平均(Auto-Regressive Moving
Average;ARMA)モデルの伝達関数W(z)を有す
る。そして、合成フィルタ3および聴覚重み付けフィル
タ20は、ともにIIRフィルタによってしか実現でき
ないが、このIIRフィルタは規模が大きくなってしま
うとともに、後述する適応符号帳17および雑音符号帳
18それぞれからの最適なベクトルの探索には不都合で
ある。
【0047】そこで、この実施例において、図6に示す
ように、合成フィルタ3と聴覚重み付けフィルタ20と
の縦続接続を1個のFIRフィルタ35によって表現す
る。そして、この実施例においては、このFIRフィル
タ35の係数であるインパルスレスポンス係数Hが適応
符号帳17および雑音符号帳18のそれぞれから最適な
ベクトルを探索する際に用いられるのである。
【0048】図2に示すインパルスレスポンス算出部3
6は、上述したインパルスレスポンス係数Hを、合成フ
ィルタ3の係数である量子化されたLPC係数と、聴覚
重み付けフィルタ20の係数である聴覚重み付け係数と
により算出する。具体的には、インパルスレスポンス係
数Hは、図6(1)に示す、縦続接続された合成フィル
タ3および聴覚重み付けフィルタ20にインパルスを入
力し、得られた出力ベクトルを有限の長さ(この実施例
においては、サブフレーム長の40サンプル)で打ち切
ることによって得られた各サンプルの値である。このイ
ンパルスレスポンス係数Hは、実際は、値H(0),H
(1),・・・,H(39)であるが、他の式と関連づ
けるために、(13)式で表される。
【数5】
【0049】ターゲット入力音声ベクトル算出部37
は、適応符号帳探索部38および雑音符号帳探索部39
のそれぞれにおいて最適なベクトルを探索する際に用い
られるターゲット入力音声ベクトルXTを算出する。タ
ーゲット入力音声ベクトルXTは、(14)式に示すよ
うに、聴覚重み付けフィルタ20において聴覚重み付け
された入力音声ベクトルXWから、過去に局部復号化部
40において復号化され、聴覚重み付けフィルタ20に
おいて聴覚重み付けされた復号音声ベクトルのゼロ入力
応答ベクトルXZを減算して算出する。ここで、ゼロ入
力応答ベクトルXZとは、現フレームの1つの前のフレ
ームまでに処理された復号音声ベクトルが現フレームに
影響を及ぼす成分であり、合成フィルタ3にゼロ系列か
らなるベクトルを入力することによって得られる。 XT=XW−XZ・・・(14)
【0050】ここで、適応符号帳探索部38および雑音
符号帳探索部39において行われる予備選択について説
明する。適応符号帳探索部38および雑音符号帳探索部
39においては、適応符号帳17および雑音符号帳18
のそれぞれに記憶されている複数のピッチ周期ベクトル
および複数の雑音波形ベクトルの中から(15)式で表
される歪データd’のパワーが最小となるピッチ周期ベ
クトルおよび雑音波形ベクトルが選択される。 d’=|XT−g’HV’i2・・・(15) (15)式において、V’i(i=1〜N;Nは符号帳
サイズ)は適応符号帳17または雑音符号帳18から選
択されたピッチ周期ベクトルまたは雑音波形ベクトル、
g’は図1に示す利得器19の各利得部19aまたは1
9bに設定される利得、Hは上述したインパルスレスポ
ンス係数であり、HV’iは合成音声ベクトルという。
【0051】ターゲット入力音声ベクトルXTに対して
最適なピッチ周期ベクトルまたは雑音波形ベクトルV
optを探索するためには、既に〔発明が解決しようとす
る課題〕の項において説明したように、すべてのベクト
ルV’iについて、(15)式の演算を行わなければな
らず、膨大な演算量が必要となる。したがって、このよ
うな演算をハードウェアによって実行するためには、演
算量を削減する必要がある。特に、合成音声ベクトルH
V’iを演算するフィルタリングが演算の多くの部分を
占めているので、フィルタリングの回数を削減すること
が各探索部における全演算量の削減につながる。そこ
で、以下に説明する予備選択は、このフィルタリングの
回数を削減するために行われるのである。
【0052】まず、上記(15)式は、(16)式に示
すように展開することができる。 d’=|XT2−2g’XT THV’i+|g’HV’i2・・・(16) (16)式において、第2項のターゲット入力音声ベク
トルXTと合成音声ベクトルHV’iとの相関値XT T
V’iの値が大きい場合には、全体の歪データd’は小
さくなる。そのため、この相関値XT THV’iの値によ
って各符号帳からベクトルV’iをあらかじめ選択す
る。すなわち、歪データd’を各符号帳に記憶されてい
るすべてのベクトルV’iについて演算するのではな
く、相関値XT THV’iだけをすべてのベクトルV’i
ついて演算し、その値が大きいベクトルV’iについて
のみ歪データd’を演算する。
【0053】ところで、相関値XT THV’iの演算にお
いて、一般的には、合成音声ベクトルHV’iを演算し
た後、ターゲット音声ベクトルXTと合成音声ベクトル
HV’iとの相関演算を行う。しかしながら、このよう
な演算方法では、合成音声ベクトルHV’iの計算にN
回のフィルタリング演算とN回の相関演算とが必要とな
る。というのは、ベクトルV’iは、符号帳サイズNだ
けあるからである。
【0054】そこで、この実施例においては、J-P. Ado
ul等によって、文献"Fast CELP Coding based on algeb
raic dodes" (Proc. ICASSP '87 pp. 1957-1960)におい
て提案されている後方フィルタリングを採用する。これ
は、相関値XT THV’iの演算において、XT THをまず
演算し、次に、(XT TH)V’iの演算を行う。この演
算方法を採用することにより、相関値XT THV’iは、
1回のフィルタリングとN回の相関演算とによって求め
られる。そして、相関値XT THV’iの大きな任意の個
数のベクトルV’iを選択し、この選択された任意の個
数のベクトルV’iについてのみ合成音声ベクトルH
V’iのフィルタリングを演算すればよく、演算量を大
幅に削減することができる。
【0055】再び図2の説明に戻る。適応符号帳探索部
38は、適応符号帳17と、予備選択部41と、最適ベ
クトル決定部42とから構成されており、現フレームの
波形に一番合う過去の波形ベクトル(ピッチ周期ベクト
ル)の探索をサブフレーム単位で行う。適応符号帳17
に記憶される各ピッチ周期ベクトルは、それぞれ復号音
声ベクトルを逆フィルタに通すことによって得られる。
逆フィルタの係数は、量子化されたLPC係数であり、
逆フィルタの出力ベクトルは、復号音声ベクトルの残差
波形ベクトルである。適応符号帳17の探索範囲は、図
7に示すように、最小16サンプルから最大143サン
プルまでの128サンプルである。つまり、整数遅延分
として7ビットを用いる。
【0056】探索範囲を図7に示すように3つの部分A
〜Cに分け、サンプリング周波数を8kHzとし、その
分解能を1とすると、16〜47サンプルの範囲(範囲
A)は4倍の分解能に、48〜79サンプルの範囲(範
囲B)は2倍の分解能にそれぞれアップサンプリングを
行う。これは、サンプリング周波数が8kHzであるの
で、その精度を補うためである。そして、上述した整数
遅延分の7ビットに、これらのアップサンプリングにお
ける小数遅延(フラクショナルディレイ)分の1ビット
を加えた計8ビットをピッチ周期ベクトルの位置情報の
表現に用いる。なお、アップサンプリングは、該当する
サンプル点を含む前後3サンプルの値を用いてシンク関
数に基づいて行う。
【0057】予備選択部41は、選択すべきピッチ周期
ベクトルの候補(以下、ピッチ候補という)の予備選択
を2回行う。1回目は整数遅延分に対してのみ行い、2
回目は1回目において選択されたピッチ候補が範囲Aま
たは範囲Bにあれば、その選択されたピッチ候補の前後
の小数遅延分を含めて4つまたは2つのピッチ候補につ
いてさらに予備選択を行う。
【0058】まず、1回目の予備選択においては、適応
符号帳17において作成された過去の復号音声ベクトル
の残差波形ベクトルにおいて、整数遅延分の探索範囲1
6〜47サンプルから現フレームに最も合う残差波形ベ
クトルの切り出し点を求める。この実施例においては、
サブフレーム長が40サンプルであるので、図8に示す
ように、検索範囲TPが40サンプルより狭い場合に
は、その検索範囲TP内の残差波形ベクトルを繰り返し
用いる。残差波形ベクトルより切り出した波形ベクトル
dが作る音声波形ベクトルHPdとターゲット音声ベク
トルXTとの相関値CORを(17)式に基づいて求め
る。 COR=XT THPd・・・(17) (17)式において、d=1〜128である。次に、1
28個の相関値CORからその値が大きいM個を選択す
る。M個の個数については自由に設定できるが、たとえ
ば、M=16とする。
【0059】2回目の予備選択は、1回目の予備選択に
おいて選択されたM個の相関値CORを有するM個のピ
ッチ候補について行う。選択されたピッチ候補が検索範
囲Aから選択されたピッチ候補であれば、整数遅延分の
前後の3つの小数遅延分に対する切り出し点より残差波
形ベクトルを切り出し、これら3つの波形ベクトルと、
選択されたピッチ候補との4つの波形ベクトルについ
て、もう一度ターゲット音声ベクトルXTとの相関値C
ORを(17)式に基づいて求める。そして、これら4
つの波形ベクトルのうち、最も相関値CORが大きな波
形ベクトルを最終的なピッチ候補として残す。
【0060】また、選択されたピッチ候補が検索範囲B
から選択されたピッチ候補であれば、サンプル値の間の
切り出し点より残差波形ベクトルを切り出し、この波形
ベクトルと、選択されたピッチ候補との2つの波形ベク
トルについて、もう一度ターゲット音声ベクトルXT
の相関値CORを(17)式に基づいて求める。そし
て、これら2つの波形ベクトルのうち、相関値CORが
大きな方の波形ベクトルを最終的なピッチ候補として残
す。以上説明した2回の予備選択によって、最終的にM
個(たとえば、16個)のピッチ候補が選択される。
【0061】最終ベクトル決定部42は、予備選択部4
1において選択されたピッチ候補の中から最適なピッチ
候補を出力すべきピッチ周期ベクトルとして決定する。
上述した(16)式は、最適な利得g’を(18)式に
示すように設定すると、(19)式に示すように変形で
きる。
【数6】
【数7】 そして、最も小さい歪データd’を与えるピッチ候補を
求めることは、(19)式の第2項を最大にするピッチ
候補を求めることに他ならない。したがって、この最終
ベクトル決定部42においては、上述した予備選択部4
1において選択されたM個のピッチ候補について(1
9)式の第2項をそれぞれ計算し、その計算結果が最大
となるピッチ候補を出力すべきピッチ周期ベクトルHP
として決定する。
【0062】雑音符号帳探索部39は、雑音符号帳18
と、予備選択部43と、最適ベクトル決定部44とから
構成されており、現フレームの波形に一番合う波形ベク
トル(雑音波形ベクトル)を、雑音符号帳18に記憶さ
れている複数の雑音波形ベクトルの中からサブフレーム
単位で探索する。雑音符号帳18は、図9に示すよう
に、サブ符号帳18aおよび18bから構成されてお
り、サブ符号帳18aおよび18bには、それぞれ複数
の励振ベクトルが記憶されている。
【0063】そして、雑音波形ベクトルCdは、(2
0)式に示すように、2つの励振ベクトルの和によって
表される。 Cd=θ1・Csub1p+θ2・Csub2q・・・(20) (20)式において、Csub1pおよびCsub2qはそれぞれ
サブ符号帳18aおよび18bに記憶されている励振ベ
クトル、θ1およびθ2はそれぞれ励振ベクトルCsub1p
およびCsub2qの+、あるいは−のサイン、d=1〜1
28、p=1〜128、q=1〜128である。以上説
明したように、1つの雑音波形ベクトルCdを2つの励
振ベクトルCsub 1pおよびCsub2qによって表現し、これ
らのコードをビット系列の符号を伝送することにより、
これらの符号の一方が伝送路で誤った場合でも、他方の
符号によって伝送路誤りの影響を少なくすることができ
る。
【0064】また、この実施例においては、励振ベクト
ルCsub1pおよびCsub2qをそれぞれ7ビットで表現し、
サインθ1およびθ2を1ビットで表現しているが、この
雑音波形ベクトルCdを従来のように単独で表すと、本
体15ビット、サイン1ビットとなり、雑音符号帳に多
くの記憶容量が必要で符号帳サイズが大きすぎてしま
う。しかしながら、この実施例によれば、雑音波形ベク
トルCdを2つの励振ベクトルCsub1pおよびCsub2q
和によって表しているので、雑音符号帳18の符号帳サ
イズを従来に比べて大幅に削減できる。したがって、雑
音符号帳18に記憶される雑音波形ベクトルCdを、実
際の音声ベクトルが多数記憶された音声データベースを
用いて実際の音声ベクトルにマッチするように学習して
求めることができる。
【0065】予備選択部43は、ターゲット入力音声ベ
クトルXTに一番合う雑音波形ベクトルCdを選択するた
めに、サブ符号帳18aおよび18bからそれぞれ励振
ベクトルCsub1pおよびCsub2qを予備選択する。すなわ
ち、それぞれの励振ベクトルCsub1pおよびCsub2qと、
ターゲット入力音声ベクトルXTとの相関値を演算し、
選択すべき雑音波形ベクトルCdの候補(以下、雑音候
補という)の予備選択を行う。
【0066】この雑音波形ベクトルの探索は、量子化効
率を高めるために、各雑音候補を先に求めたピッチ周期
ベクトルHPに対して直交化して行う。ピッチ周期ベク
トルHPに対して直交化された雑音波形ベクトル〔HC
d〕は、(21)式で表される。
【数8】 次に、この直交化された雑音波形ベクトル〔HCd〕と
ターゲット入力音声ベクトルXT Tとの相関値XT T〔HC
d〕は、(22)式で与えられる。
【数9】 そして、相関値XT T〔HCd〕によって雑音候補の予備
選択を行う。(22)式において、第2項の分子項(H
dTHPは、(HP)THCdと等価である。そこで、
(22)式の第1項XT THCdと(HP)THCdとに対
して先に説明した後方フィルタリングを適用する。雑音
波形ベクトルCdは、(20)式に示すように励振ベク
トルCsub1pとCsub2qとの和であるので、相関値X
T T〔HCd〕は、(23)式で表される。 XT T〔HCd〕=XT T〔HCsub1p〕+XT T〔HCsub2q〕・・・(23) したがって、(22)式に示す演算を、それぞれの励振
ベクトルCsub1pおよびCsub2qについて行い、算出され
たそれぞれの相関値の中で値が大きなM個をそれぞれ選
択する。
【0067】最適ベクトル決定部44は、予備選択部4
3において選択されたそれぞれM個の励振ベクトルC
sub1pおよびCsub2qの中から最適な組み合わせの雑音候
補を出力すべき雑音波形ベクトルとして決定する。上述
したピッチ候補の最適候補決定の手法と同様、ターゲッ
ト入力音声ベクトルXTと雑音候補とから求められる歪
データd’’を表す(24)式の第2項が最大となる励
振ベクトルCsub1pとCsub2qとの組み合わせを探索す
る。
【数10】 各サブ符号帳18aおよび18b毎に上述した予備選択
によってそれぞれM個の励振ベクトルCsub1pおよびC
sub2qを選択してあるので、(24)式に示す演算をト
ータルM2回行えばよい。
【0068】以上説明したように、この実施例では、予
備選択部43においてそれぞれM個の励振ベクトルC
sub1pおよびCsub2qの予備選択を行うとともに、最適ベ
クトル決定部44においてこれらそれぞれM個の励振ベ
クトルCsub1pおよびCsub2qの最適な組み合わせを選択
しているので、伝送路誤りに対してさらに耐性が向上す
る。
【0069】すなわち、既に説明したように、1つの雑
音波形ベクトルCdを2つの励振ベクトルCsub1pおよび
sub2qによって表現しているので、これらの符号の一
方が伝送路で誤った場合でも、他方の符号がその伝送路
誤りを補うことができるが、予備選択によりあらかじめ
ターゲット入力音声ベクトルXT Tと相関の高い励振ベク
トルCsub1pおよびCsub2qを選択し、さらにこれらの励
振ベクトルCsub1pおよびCsub2qの最適な組み合わせを
出力すべき雑音波形ベクトルとして決定しているので、
伝送路誤りが発生していない雑音波形ベクトルもターゲ
ット入力音声ベクトルXT Tと相関が高く、予備選択を行
わない場合に比べて伝送路誤りの影響を少なくできる。
【0070】ここで、図10に従来の1つの雑音符号帳
から選択された雑音波形ベクトルと、この実施例による
サブ符号帳18aおよび18bからそれぞれ予備選択さ
れた励振ベクトルCsub1pおよびCsub2qを最適に組み合
わせた雑音波形ベクトルとのそれぞれの符号を伝送した
場合の伝送路誤り率とSNとの関係を示す。曲線aが従
来例、曲線bがこの実施例によるものである。なお、各
雑音波形ベクトルのサイズは、演算量を考慮して10ビ
ットとし、また、伝送路誤りは、雑音波形ベクトルにの
み発生させている。図10によれば、伝送路誤りがない
場合には、従来例および実施例ともほぼ等しいSNであ
るが、誤り率が高くなるにつれて従来例と実施例との差
が大きくなっており、実施例の方が伝送路誤りに強いこ
とがわかる。
【0071】また、図11は、誤り率をパラメータ
(0,0.1,1,3%)とした場合の、各サブ符号帳
18aおよび18bから選択される励振ベクトルC
sub1pおよびCs ub2qの候補数MとSNとの関係を示す。
図11によれば、候補数Mが16の場合でもすべての候
補(128個)について探索を行ったのと同じSNが得
られている。したがって、候補数Mが128の場合に
は、(24)式の演算を16,384回行わなければな
らないが、候補数Mが16の場合には、256回でよ
く、SNを低下させることなく、演算量を大幅に削減す
ることができる。
【0072】ベクトル量子化(Vector Quantization:
VQ)利得探索部45は、図12に示すように、予測利
得決定部15と、予測利得部16と、VQ利得決定部4
6とから構成されている。予測利得決定部15において
は、現在のフレームの処理における利得器19の利得部
19bの出力ベクトルのパワーと、過去に処理された利
得部19bの出力ベクトルのパワーとについて線形予測
分析がなされ、次のフレームにおいて選択される雑音波
形ベクトルに与える予測利得が計算され、決定されて予
測利得部16に設定される。また、VQ利得部46にお
いては、ピッチ周期ベクトルと雑音波形ベクトルとの利
得が計算され、決定されて利得器19の利得部19aお
よび19bに設定される。
【0073】予測利得決定部15は、雑音波形ベクトル
の予測利得を予測する。サブ符号帳18aおよび18b
にそれぞれ記憶されている励振ベクトルCsub1pおよび
sub 2qの振幅は、ターゲット入力音声ベクトルXTの振
幅に比べて大きくないため、これらを組み合わせた雑音
波形ベクトルに適切な利得を与える必要がある。しかし
ながら、この利得すべてを、VQ利得決定部46内に設
けられた利得器19(あらかじめ複数の利得ベクトルが
記憶された利得符号帳によって構成されている。以下、
利得符号帳19という)を用いて与えようとすると、タ
ーゲット入力音声ベクトルXTのダイナミックレンジが
大きいため、利得符号帳19に多くのビット数が必要と
なる。いっぽう、利得符号帳19に充分なビットを与え
ない場合には、雑音波形ベクトルの量子化誤差による量
子化雑音が増加してしまう。
【0074】そこで、上記不都合を防止するために、こ
の実施例においては、図12に示すように、予測利得部
15において、あらかじめ雑音波形ベクトルの利得を過
去に利得符号帳19から出力されたベクトルのパワーに
基づいてターゲット入力音声ベクトルXTのレベルに応
じて予測し、VQ利得決定部46では残りの利得を調整
する構成としている。これにより、利得符号帳19に多
くのビット数が必要ないばかりでなく、振幅の小さいタ
ーゲット入力音声ベクトルXTに対しても精度よく追随
できる。また、利得符号帳19は、ベクトル量子化によ
って量子化効率を向上させるとともに、伝送路誤りに対
する耐性を向上させるために、2つのサブ利得符号帳1
9aおよび19bに分割されている。なお、図1の説明
においては、符号19aおよび19bを利得部と呼んで
いる。
【0075】そして、(25)式で表される歪データd
Gが最小となるサブ利得符号帳19aおよび19bの出
力ベクトルの組み合わせを探索する。 dG=|XT−(g1pu+g2pv)HP−g0(g1cu+g2cv)HC|2・・・(25 ) (25)式において、XTはターゲット入力音声ベクト
ル、HPはピッチ周期ベクトル、HCは雑音波形ベクト
ル、{g1pu,g2pv}はサブ符号帳19aの出力ベクト
ル、{g1cu,g2cv}はサブ符号帳19bの出力ベクト
ルである。(25)式からわかるように、ピッチ周期ベ
クトルHPおよび雑音波形ベクトルHCのそれぞれに対
する利得は、2つの利得の和によって表現されており、
(25)式で表される歪データdGが最小となる符号の
組み合わせ{u,v}が探索される。
【0076】ここで、図13に、ピッチ周期ベクトルお
よび雑音波形ベクトルに与える利得を、従来の1つの利
得符号帳の出力ベクトルによって表現した場合と、この
実施例において2つのサブ利得符号帳の出力ベクトルの
和によって表現した場合との伝送誤り率に対するSNの
特性例を示す。曲線aが従来例、曲線bがこの実施例で
ある。図13によれば、利得を2つのサブ利得符号帳の
出力ベクトルの和によって表現した方が伝送誤りに強い
ことがわかる。
【0077】図2に示す局部復号化部40は、この符号
化装置において次のフレームに対する処理のために、図
2に示す構成要素各部から出力され、復号化装置に伝送
される各種データと同じデータを用いて復号音声ベクト
ルを合成する。なお、局部復号化部40の構成は、以下
に示す復号化装置と同一である。
【0078】図14は復号化装置の構成を表すブロック
図であり、この図において、図2、図9および図12の
各部に対応する部分には同一の符号を付け、その説明を
省略する。この復号化装置は、伝送された符号に基づい
て、復号音声ベクトルを合成する。符号入力部47は、
伝送されたビット系列の符号を元の形式の情報(コー
ド)に変換した後、変換された各コードのうち、各符号
帳17,18,19および25にそれぞれ記憶されてい
る各ベクトルに関するコードを各符号帳17,18,1
9および25に供給する。これにより、各符号帳17,
18,19および25から、供給されたコードに該当す
るベクトルが出力される。
【0079】また、符号入力部47において変換された
コードに基づいてLSP符号帳25から出力されたLS
Pパラメータベクトルは、前のフレームのLSPパラメ
ータベクトルと加算され、目的とするLSPパラメータ
となる。これにより、LSP変換部48において、LS
PパラメータがLPC係数に変換された後、伝達関数
{1/A(z)}を有する合成フィルタ49に設定され
る。
【0080】そして、雑音符号帳18から出力された雑
音波形ベクトルは、予測利得部16において、予測利得
決定部15によって設定された予測利得が乗算される。
予測利得決定部15においては、現在のフレームの処理
における利得符号帳19のサブ利得符号帳19bの出力
ベクトルのパワーと、過去に処理された利得符号帳19
のサブ利得符号帳19bの出力ベクトルのパワーとにつ
いて線形予測分析がなされ、次のフレームにおいて選択
される雑音波形ベクトルに与える予測利得が計算され、
決定される。
【0081】そして、適応符号帳17から出力されたピ
ッチ周期ベクトルおよび予測利得部16の出力ベクトル
は、利得符号帳19のサブ利得符号帳19aおよび19
bに設定された利得が乗算されて出力される。これによ
り、サブ利得符号帳19aの出力ベクトルと、サブ利得
符号帳19bの出力ベクトルとが加算器9において加算
され、加算器9の出力ベクトルが合成フィルタ49に駆
動ベクトルとして供給され、合成フィルタ49におい
て、合成音声ベクトルが合成される。次に、ポストフィ
ルタ係数算出部50において、合成音声ベクトルが分析
され、その分析結果に基づいた係数がポストフィルタ5
1に設定される。これにより、合成音声ベクトルが、ポ
ストフィルタ51を通過することにより、たとえば、ホ
ルマント強調、ピッチ強調および高域強調されて復号音
声ベクトルとして出力される。
【0082】ここで、図15に、従来例およびこの実施
例による音声の符号化装置によって符号化され、伝送さ
れて復号化装置において復号化された場合の復号音声の
品質をオピニオン試験によって評価した結果を示す。こ
の図15には、伝送路誤りのない場合に符号化装置にお
ける入力音声データのレベルを3段階(A:大,B:
中,C:小)とした際の復号音声の品質と、ランダム誤
り率が0.1%である場合Dの復号音声の品質とを示し
ている。斜線の棒グラフが従来のADPCMによるも
の、黒く塗りつぶした棒グラフがこの実施例によるもの
である。図15によれば、この実施例による音声の符号
化装置は、伝送路誤りがない時には入力音声データのレ
ベルに関係なく、ADPCMと同等の品質が得られ、伝
送路誤りがある時にはADPCMより品質がよいことが
わかる。すなわち、この実施例による音声の符号化装置
は、伝送路誤りに対してロバストである。
【0083】以上説明したように、上述した一実施例に
よれば、8kbit/sの符号化速度で国際標準である
32kbit/sの符号化速度のADPCMなみの高品
質な音声の符号化・復号化が実現できる。また、伝送路
においてビット誤りが発生した場合でも、その影響を受
けずに、良い品質の復号音声を得ることができる。以
上、この発明の実施例を図面を参照して詳述してきた
が、具体的な構成はこの実施例に限られるものではな
く、この発明の要旨を逸脱しない範囲の設計の変更等が
あってもこの発明に含まれる。
【0084】
【発明の効果】以上説明したように、この発明によれ
ば、伝送路において誤りが発生した場合でも、その影響
をあまり受けずに、遅い符号化速度で音声の高品質な符
号化および復号化ができるという効果がある。
【図面の簡単な説明】
【図1】この発明の一実施例による音声の符号化方法を
用いた符号化装置の概略構成を表すブロック図である。
【図2】図1に示す音声の符号化装置のより詳細な構成
の一例を表すブロック図である。
【図3】この発明の一実施例において入力音声ベクトル
に対してなされる線形予測分析に用いられる分析窓の一
例を表す図である。
【図4】LPC係数量子化部24内に設けられたベクト
ル量子化部の構成の一例を表すブロック図である。
【図5】ベクトル量子化部の動作を表すフローチャート
である。
【図6】FIRフィルタ35のインパルスレスポンス係
数Hの算出の仕方を説明するための図である。
【図7】ピッチ周期ベクトルの探索範囲の一例を表す図
である。
【図8】ピッチ周期ベクトルの探索方法を説明するため
の図である。
【図9】雑音符号帳18の構成の一例を表すブロック図
である。
【図10】従来例とこの発明の一実施例による音声の符
号化装置とにおける伝送路誤り率に対するSNの特性の
一例を表す図である。
【図11】雑音符号帳探索部39において予備選択され
た雑音候補の数Mに対するSNの特性の一例を表す図で
ある。
【図12】VQ利得探索部45の構成の一例を表すブロ
ック図である。
【図13】従来の利得符号帳を用いた場合とこの発明の
一実施例による利得符号帳を用いた場合とにおける伝送
路誤り率に対するSNの特性の一例を表す図である。
【図14】音声の復号化装置の構成の一例を表すブロッ
ク図である。
【図15】この発明の一実施例よる音声の符号化装置に
おける各種評価条件に対する復号音声のオピニオン値の
一例を表す図である。
【図16】従来のCELP符号化方法を用いた音声の符
号化装置の構成例を表すブロック図である。
【図17】従来のLD−CELP符号化方法を用いた音
声の符号化装置の構成例を表すブロック図である。
【符号の説明】
2 予測係数決定部 3 合成フィルタ 4 予測係数量子化部 12 歪パワー計算部 15 予測利得決定部 16 予測利得部 17 適応符号帳 18 雑音符号帳 19 利得符号帳 20 聴覚重み付けフィルタ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音声データの複数サンプルを線形予測分
    析して予測係数を算出し、該予測係数を量子化して合成
    フィルタに設定し、該合成フィルタを、複数のピッチ周
    期ベクトルが記憶された適応符号帳と、複数の雑音波形
    ベクトルが記憶された雑音符号帳とからそれぞれ選択さ
    れ、それぞれ所定の利得が乗算されたピッチ周期ベクト
    ルおよび雑音波形ベクトルによって、前記音声データの
    複数サンプルからなるフレーム単位に駆動して合成音声
    ベクトルを合成することを利用して音声を符号化する音
    声の符号化方法において、 前記予測係数を量子化する際、この量子化の結果である
    量子化パラメータベクトルを、現フレームの候補パラメ
    ータベクトルと、1つ前のフレームの処理において用い
    た候補パラメータベクトルとの加重平均によって表現す
    る第1の処理、 前記候補パラメータベクトルを複数の予測パラメータ符
    号帳からそれぞれ選択される複数種類のサブパラメータ
    ベクトルの和によって表現し、前記量子化パラメータベ
    クトルと、前記予測係数に対応した入力パラメータベク
    トルとの歪が最小となるように前記複数種類のサブパラ
    メータベクトルを前記複数の予測パラメータ符号帳から
    それぞれ選択し、選択された複数種類のサブパラメータ
    ベクトルを加算して得られた現フレームの候補パラメー
    タベクトルが安定か否かを判断し、不安定な場合には、
    所定の規則により前記現フレームの候補パラメータベク
    トルを安定となるように変換する第2の処理、 前記適応符号帳および前記雑音符号帳から前記ピッチ周
    期ベクトルおよび前記雑音波形ベクトルを選択する際、
    前記音声データの複数サンプルからなる入力音声ベクト
    ルと、前記合成音声ベクトルとの相関値をそれぞれ算出
    し、それぞれの相関値が大きいピッチ周期ベクトルおよ
    び雑音波形ベクトルについてのみ最終的な選択のための
    演算を行う第3の処理、 前記雑音符号帳を複数のサブ雑音符号帳によって構成
    し、前記雑音波形ベクトルは、各サブ雑音符号帳から選
    択された複数の励振ベクトルの和によって表現する第4
    の処理、 前記ピッチ周期ベクトルおよび前記雑音波形ベクトルに
    それぞれ乗算される利得があらかじめ記憶された2つの
    利得符号帳をそれぞれ複数のサブ利得符号帳によって構
    成し、前記各利得を各サブ利得符号帳の出力の和によっ
    て表現する第5の処理、 前記各利得が乗算された前記ピッチ周期ベクトルおよび
    前記雑音波形ベクトルによって前記合成フィルタを駆動
    して合成音声ベクトルを得、得られた合成音声ベクトル
    と入力音声ベクトルとの歪が最小となるように前記各サ
    ブ利得符号帳の出力を選択して、前記各利得を同時に決
    定する第6の処理、 選択された雑音波形ベクトルに予測利得を乗算する予測
    利得手段を設け、現フレームの処理において前記予測利
    得および前記利得が乗算された前記雑音波形ベクトル
    と、過去のフレームの処理において前記予測利得および
    前記利得が乗算された前記雑音波形ベクトルとに基づい
    て、次のフレームの処理において前記雑音波形ベクトル
    に乗算すべき前記予測利得を予測する第7の処理の少な
    くとも1つの処理を行うことを特徴とする音声の符号化
    方法。
JP07053493A 1992-06-29 1993-03-29 音声の符号化方法 Expired - Lifetime JP3148778B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP07053493A JP3148778B2 (ja) 1993-03-29 1993-03-29 音声の符号化方法
EP96202584A EP0751496B1 (en) 1992-06-29 1993-06-28 Speech coding method and apparatus for the same
DE69309557T DE69309557T2 (de) 1992-06-29 1993-06-28 Verfahren und Vorrichtung zur Sprachkodierung
EP93401656A EP0577488B9 (en) 1992-06-29 1993-06-28 Speech coding method and apparatus for the same
DE69328450T DE69328450T2 (de) 1992-06-29 1993-06-28 Verfahren und Vorrichtung zur Sprachkodierung
US08/658,303 US5787391A (en) 1992-06-29 1996-06-05 Speech coding by code-edited linear prediction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07053493A JP3148778B2 (ja) 1993-03-29 1993-03-29 音声の符号化方法

Publications (2)

Publication Number Publication Date
JPH06282298A true JPH06282298A (ja) 1994-10-07
JP3148778B2 JP3148778B2 (ja) 2001-03-26

Family

ID=13434305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07053493A Expired - Lifetime JP3148778B2 (ja) 1992-06-29 1993-03-29 音声の符号化方法

Country Status (1)

Country Link
JP (1) JP3148778B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002043052A1 (en) * 2000-11-27 2002-05-30 Nippon Telegraph And Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
WO2006016439A1 (ja) * 2004-08-12 2006-02-16 Oki Electric Industry Co., Ltd. 消失補償装置、消失補償方法、および消失補償プログラム
US7289953B2 (en) 1999-08-23 2007-10-30 Matsushita Electric Industrial Co., Ltd. Apparatus and method for speech coding
WO2007132750A1 (ja) * 2006-05-12 2007-11-22 Panasonic Corporation Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
JP2010181891A (ja) * 1998-08-24 2010-08-19 Mindspeed Technologies Inc 音声符号化用適応符号帳ゲインの制御

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106091519A (zh) 2016-05-31 2016-11-09 青岛海尔股份有限公司 冰箱
CN106115637B (zh) 2016-06-20 2018-04-20 青岛海尔股份有限公司 冷藏冷冻设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181891A (ja) * 1998-08-24 2010-08-19 Mindspeed Technologies Inc 音声符号化用適応符号帳ゲインの制御
US7289953B2 (en) 1999-08-23 2007-10-30 Matsushita Electric Industrial Co., Ltd. Apparatus and method for speech coding
US7383176B2 (en) 1999-08-23 2008-06-03 Matsushita Electric Industrial Co., Ltd. Apparatus and method for speech coding
WO2002043052A1 (en) * 2000-11-27 2002-05-30 Nippon Telegraph And Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US7065338B2 (en) 2000-11-27 2006-06-20 Nippon Telegraph And Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
WO2006016439A1 (ja) * 2004-08-12 2006-02-16 Oki Electric Industry Co., Ltd. 消失補償装置、消失補償方法、および消失補償プログラム
CN100445716C (zh) * 2004-08-12 2008-12-24 冲电气工业株式会社 消失补偿装置和消失补偿方法
US7793202B2 (en) 2004-08-12 2010-09-07 Oki Electric Industry Co., Ltd. Loss compensation device, loss compensation method and loss compensation program
WO2007132750A1 (ja) * 2006-05-12 2007-11-22 Panasonic Corporation Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法

Also Published As

Publication number Publication date
JP3148778B2 (ja) 2001-03-26

Similar Documents

Publication Publication Date Title
US5787391A (en) Speech coding by code-edited linear prediction
JP3196595B2 (ja) 音声符号化装置
JP3094908B2 (ja) 音声符号化装置
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP3148778B2 (ja) 音声の符号化方法
JP3095133B2 (ja) 音響信号符号化方法
JP3531780B2 (ja) 音声符号化方法および復号化方法
US6393391B1 (en) Speech coder for high quality at low bit rates
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JPWO2008072732A1 (ja) 音声符号化装置および音声符号化方法
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JP3144284B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JPH0830299A (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JPH08185199A (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP3335650B2 (ja) 音声符号化方式
JP3874851B2 (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3230380B2 (ja) 音声符号化装置
JP2808841B2 (ja) 音声符号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 12