JP2001022399A - Celp型音声符号化装置とcelp型音声符号化方法、及びcelp型音声復号化装置とcelp型音声復号化方法 - Google Patents
Celp型音声符号化装置とcelp型音声符号化方法、及びcelp型音声復号化装置とcelp型音声復号化方法Info
- Publication number
- JP2001022399A JP2001022399A JP2000156370A JP2000156370A JP2001022399A JP 2001022399 A JP2001022399 A JP 2001022399A JP 2000156370 A JP2000156370 A JP 2000156370A JP 2000156370 A JP2000156370 A JP 2000156370A JP 2001022399 A JP2001022399 A JP 2001022399A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- diffusion
- pulse
- noise
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
に、実際の音声信号による音源ベクトルと類似性の高い
音源ベクトルを生成する音源ベクトル生成装置を雑音符
号帳に用いることで、品質の高い合成音声を得ることが
可能なCELP型音声符号化装置及びCELP型音声復
号化装置を提供することを目的とする。 【解決手段】 パルスベクトル生成部216と、拡散パ
タン格納・選択部215と、パルスベクトル拡散部21
7と、拡散ベクトル加算部218とを備えることによっ
て、従来の代数的音源生成装置よりも実際の音源ベクト
ルによく類似した音源ベクトルを生成できる雑音符号帳
208が得られる。
Description
に符号化/復号化するためのCELP型音声符号化装置
とその方法、及びCELP型音声復号化装置とその方法
に関する。
xcited Linear Prediction:"High Quality Speech at
Low Bit Rate",M. R. Schroeder, Proc. ICASSP'85, p
p.937-940 (文献1)に記載のCELP音声符号化装置
がある。この音声符号化装置は、入力音声を一定時間で
区切ったフレーム毎に線形予測を行い、フレーム毎の線
形予測による予測残差(励振信号)を、過去の駆動音源
を格納した適応符号帳と複数の雑音符号ベクトルを格納
した雑音符号帳を用いて符号化する装置である。
号化装置を、図6を用いて詳しく説明する。
化装置に入力された音声信号11を分析し、線形予測係
数を算出する。ここで、線形予測係数とは、音声信号の
周波数スペクトルの包絡特性を表すパラメータである。
線形予測分析部12で得られた線形予測係数は、線形予
測係数符号化部13において量子化された後、線形予測
係数復号化部14へ送られる。なお、この時に得られる
量子化番号は、線形予測符号として符号出力部24へ出
力される。線形予測係数復号化部24は、線形予測係数
符号化部13で量子化された線形予測係数を復号化して
合成フィルタの係数を得、合成フィルタ15へ出力す
る。
補を複数種類出力する符号帳であり、駆動音源を過去数
フレーム分格納したバッファによって構成される。な
お、適応符号ベクトルとは、入力音声内の周期成分を表
現する時系列ベクトルである。
補を複数種類(割り当てられたビット数に対応する種
類)格納した符号帳である。なお、雑音符号ベクトルと
は、入力音声内の非周期成分を表現する時系列ベクトル
である。
符号ゲイン重み付け部20は、適応符号帳17および雑
音符号帳18から出力される候補ベクトルそれぞれに対
して、重み符号帳21から読みだした適応符号ゲインと
雑音符号ゲインをそれぞれ乗じ、加算部22へ出力す
る。なお、重み符号帳とは、適応符号ベクトル候補に乗
じる重みと、雑音符号ベクトル候補に乗じる重みをそれ
ぞれ複数種類(割り当てられたビット数に対応する種
類)ずつ格納したメモリである。
19、雑音符号ゲイン重み付け部20においてそれぞれ
重み付けられた適応符号ベクトル候補と雑音符号ベクト
ル候補を加算して駆動音源ベクトル候補を生成し、合成
フィルタ15へ出力する。合成フィルタ15は、線形予
測係数復号化部14で得られた合成フィルタの係数によ
って構成される全極型フィルタであり、加算部22から
の駆動音源ベクトル候補を入力すると、合成音声ベクト
ル候補を出力する機能を有している。
力である合成音声ベクトル候補と入力音声11との歪み
を計算し、得られた歪みの値を符号番号特定部23に出
力する。符号番号特定部23は、歪み計算部16で算出
する歪みを最小化するような3種類の符号番号(適応符
号番号、雑音符号番号、重み符号番号)を、3種類の符
号帳(適応符号帳、雑音符号帳、重み符号帳)それぞれ
について特定する。そして、符号番号特定部23で特定
された3種類の符号番号は、符号出力部24へ出力され
る。符号出力部24は、線形予測係数符号化部13で得
られた線形予測符号番号と、符号番号特定部23で特定
された適応符号番号、雑音符号番号、重み符号番号をま
とめて、伝送路へ出力する。
号化装置の動作を説明する。音声復号化装置(図7)で
は、まず、符号入力部31が、音声符号化装置(図6)
から送信された符号を受信し、受信した符号に対応する
線形予測符号番号と、適応符号番号、雑音符号番号、重
み符号番号に分解し、分解して得られた符号をそれぞ
れ、線形予測係数復号化部32、適応符号帳33、雑音
符号帳34、重み符号帳35へ出力する。
力部31で得られた線形予測符号番号を復号化して合成
フィルタの係数を得、合成フィルタ39へ出力する。そ
して、適応符号帳内の適応符号番号と対応する位置から
適応符号ベクトルが読みだされ、雑音符号帳から雑音符
号番号と対応する雑音符号ベクトルが読みだされ、さら
に、重み符号帳から重み符号番号と対応した適応符号ゲ
インと雑音符号ゲインが読みだされる。そして、適応符
号ベクトル重付け部36において、適応符号ベクトルに
適応符号ゲインが乗じられ加算部38へと送られる。ま
た同様に、雑音符号ベクトル重付け部37において、雑
音符号ベクトルに雑音符号ゲインが乗じられ加算部38
へ送られる。
加算して駆動音源ベクトルを生成し、生成された駆動音
源はバッファ更新のために適応符号帳33へ、また、フ
ィルタを駆動のために合成フィルタ39へと送られる。
合成フィルタ39は、加算部38で得られた駆動音源ベ
クトルで駆動され、線形予測係数復号化部32の出力を
用いて合成音声を再生する。
部16では、一般に、次の(数1)により求められる歪
みEが計算される。
めには、適応符号番号、雑音符号番号、重み符号番号の
全組合せについて閉ループで歪みを算出し、各符号番号
を特定することが理想である。しかし、(数1)を閉ル
ープ探索すると演算処理量が大きくなりすぎるため、一
般的には、まず、適応符号帳を用いてベクトル量子化に
より適応符号番号を特定し、次に雑音符号帳を用いたベ
クトル量子化により雑音符号番号を特定し、最後に、重
み符号帳を用いたベクトル量子化により重み符号番号を
特定する。ここでは、この場合について、雑音符号帳を
用いたベクトル量子化処理をさらに詳しく説明する。
にもしくは暫定的に決まっている場合には、(数1)の
歪み評価式は次の(数2)に変形される。
もしくは暫定的に特定した適応符号番号と適応符号ゲイ
ンを用いた、次の(数3)によって求められる雑音音源
情報(雑音符号番号特定用のターゲットベクトル)であ
る。
ンgcを特定する場合には、(数2)内のgcが任意の値を
とり得ると仮定できるので、(数2)を最小化する雑音
符号ベクトルの番号を特定する処理(雑音音源情報のベ
クトル量子化処理)は、次の(数4)の分数式を最大化
する雑音符号ベクトルの番号特定に置き換えられること
が一般に知られている。
インが前もってもしくは暫定的に特定されている場合、
雑音音源情報のベクトル量子化処理とは、歪み計算部1
6で算出する(数4)の分数式を最大化する雑音符号ベ
クトル候補の番号を特定する処理となる。
は、割り当てられたビット数に対応する種類のランダム
数列をメモリに格納したものが雑音符号帳として用いら
れていた。しかし、非常に多くのメモリ容量が必要にな
るとともに、雑音符号ベクトル候補それぞれについて
(数4)の歪みを計算するための演算処理量が膨大にな
るという課題があった。
は、"8KBIT/S ACELP CODING OF SPEECH WITH 10 MS SPE
ECH-FRAME:A CANDIDATE FOR CCITT STANDARDIZATIO
N":R. Salami, C. Laflamme , J-P. Adoul, ICASSP'9
4, pp.II-97〜II-100,1994(文献2)などに記載され
るように、代数的に音源ベクトルを生成する代数的音源
ベクトル生成部を用いたCELP音声符号化装置/復号
化装置が挙げられる。
数的音源生成部を雑音符号帳に用いたCELP音声符号
化装置/復号化装置では、(数3)によって求めた雑音
音源情報(雑音符号番号特定用のターゲット)を、少数
本のパルスで常に近似表現しているため、音声品質の向
上を図る上で限界がある。このことは、(数3)の雑音
音源情報xの要素を実際に調べると、それが少数本のパ
ルスだけによって構成される場合がほとんどないことか
ら明らかである。
得られる音源ベクトルの形状と、統計的に類似性の高い
形状の音源ベクトルを生成することができる新たな音源
ベクトル生成装置を雑音符号帳に用いることで、従来の
代数的音源生成部を雑音符号帳として用いる場合よりも
品質の高い合成音声を得ることが可能なCELP型音声
符号化装置とその方法、及びCELP型音声復号化装置
とその方法を提供することを目的とする。
に本発明は、入力音声信号を線形予測分析する線形予測
分析手段と、雑音符号ベクトルを生成する雑音符号帳
と、前記雑音符号ベクトルを入力して合成音声ベクトル
を生成する合成フィルタとを有するCELP型音声符号
化装置であって、前記雑音符号帳は、パルスベクトルを
供給するパルスベクトル生成部と、複数の拡散パタンを
格納する拡散パタン格納部と、格納されている前記拡散
パタンのいずれかを選択する選択部と、前記選択部によ
り選択された拡散パタンと前記パルスベクトルを畳み込
むパルスベクトル拡散部とを有し且つ、選択部が音声信
号の有声/無声判定結果を用いて拡散パタンを選択す
る、または、選択部が適応ゲインの値を利用して拡散パ
タンを選択する、あるいは、選択部が適応ゲインの値と
音声信号の短時間的特徴を表すパラメータとを併用して
拡散パタンを選択する、音源ベクトル生成装置であるこ
とを特徴とするCELP型音声符号化装置及びその方法
であり、従来の代数的音源生成部を雑音符号帳に用いた
音声符号化装置及びその方法よりも、より実際の形状に
近い音源ベクトルを生成することができ、よって、より
品質の高い合成音声を出力することが可能な音声符号化
装置及びその方法が得られる。
は、適応符号ベクトルを生成する適応符号帳と、雑音符
号ベクトルを生成する雑音符号帳と、前記適応符号ベク
トルと前記雑音符号ベクトルとを入力して合成する合成
フィルタとを有するCELP型音声復号化装置であっ
て、前記雑音符号帳は、パルスベクトルを供給するパル
スベクトル生成部と、複数の拡散パタンを格納する拡散
パタン格納部と、格納されている前記拡散パタンのいず
れかを選択する選択部と、前記選択部により選択された
拡散パタンと前記パルスベクトルを畳み込むパルスベク
トル拡散部とを有し且つ、選択部が音声信号の有声/無
声判定結果を用いて拡散パタンを選択する、または、選
択部が適応ゲインの値を利用して拡散パタンを選択す
る、あるいは、選択部が適応ゲインの値と音声信号の短
時間的特徴を表すパラメータとを併用して拡散パタンを
選択する、音源ベクトル生成装置であることを特徴とす
るCELP型音声復号化装置及びその方法であり、従来
の代数的音源生成部を雑音符号帳に用いた音声復号化装
置及びその方法よりも、より実際の形状に近い音源ベク
トルを生成することができ、よって、より品質の高い合
成音声を出力することが可能な音声復号化装置及びその
方法が得られる。
は、入力音声信号を線形予測分析する線形予測分析手段
と、雑音符号ベクトルを生成する雑音符号帳と、前記雑
音符号ベクトルを入力して合成音声ベクトルを生成する
合成フィルタとを有するCELP型音声符号化装置であ
って、前記雑音符号帳は、パルスベクトルを供給するパ
ルスベクトル生成部と、複数の拡散パタンを格納する拡
散パタン格納部と、格納されている前記拡散パタンのい
ずれかを選択する選択部と、前記選択部により選択され
た拡散パタンと前記パルスベクトルを畳み込むパルスベ
クトル拡散部とを有し且つ選択部が音声信号の有声/無
声判定結果を用いて拡散パタンを選択する音源ベクトル
生成装置であることを特徴とするCELP型音声符号化
装置であり、格納した拡散パタンの形状(特性)を反映
した音源ベクトルを生成し、それを用いて品質の高い合
成音声を出力することができるという作用を有する。
線形予測分析する線形予測分析手段と、雑音符号ベクト
ルを生成する雑音符号帳と、前記雑音符号ベクトルを入
力して合成音声ベクトルを生成する合成フィルタとを有
するCELP型音声符号化装置であって、前記雑音符号
帳は、パルスベクトルを供給するパルスベクトル生成部
と、複数の拡散パタンを格納する拡散パタン格納部と、
格納されている前記拡散パタンのいずれかを選択する選
択部と、前記選択部により選択された拡散パタンと前記
パルスベクトルを畳み込むパルスベクトル拡散部とを有
し且つ選択部が適応ゲインの値を利用して拡散パタンを
選択する音源ベクトル生成装置であることを特徴とする
CELP型音声符号化装置であり、格納した拡散パタン
の形状(特性)を反映した音源ベクトルを生成し、それ
を用いて品質の高い合成音声を出力することができると
いう作用を有する。
線形予測分析する線形予測分析手段と、雑音符号ベクト
ルを生成する雑音符号帳と、前記雑音符号ベクトルを入
力して合成音声ベクトルを生成する合成フィルタとを有
するCELP型音声符号化装置であって、前記雑音符号
帳は、パルスベクトルを供給するパルスベクトル生成部
と、複数の拡散パタンを格納する拡散パタン格納部と、
格納されている前記拡散パタンのいずれかを選択する選
択部と、前記選択部により選択された拡散パタンと前記
パルスベクトルを畳み込むパルスベクトル拡散部とを有
し且つ選択部が適応ゲインの値と音声信号の短時間的特
徴を表すパラメータとを併用して拡散パタンを選択する
音源ベクトル生成装置であることを特徴とするCELP
型音声符号化装置であり、格納した拡散パタンの形状
(特性)を反映した音源ベクトルを生成し、それを用い
て品質の高い合成音声を出力することができるという作
用を有する。
線形予測分析する段階と、雑音符号ベクトルを生成する
段階と、前記雑音符号ベクトルを入力して合成音声ベク
トルを生成する段階とを有するCELP型音声符号化方
法であって、前記雑音符号ベクトルは、パルスベクトル
を供給する段階と、複数の拡散パタンを格納する段階
と、格納されている前記拡散パタンのいずれかを選択す
る段階と、選択された前記拡散パタンと前記パルスベク
トルを畳み込む段階とを有し且つ音声信号の有声/無声
判定結果を用いて拡散パタンを選択する音源ベクトル生
成方法により生成されることを特徴とするCELP型音
声符号化方法であり、格納した拡散パタンの形状(特
性)を反映した音源ベクトルを生成し、それを用いて品
質の高い合成音声を出力することができるという作用を
有する。
線形予測分析する段階と、雑音符号ベクトルを生成する
段階と、前記雑音符号ベクトルを入力して合成音声ベク
トルを生成する段階とを有するCELP型音声符号化方
法であって、前記雑音符号ベクトルは、パルスベクトル
を供給する段階と、複数の拡散パタンを格納する段階
と、格納されている前記拡散パタンのいずれかを選択す
る段階と、選択された前記拡散パタンと前記パルスベク
トルを畳み込む段階とを有且つ適応ゲインの値を利用し
て拡散パタンを選択する音源ベクトル生成方法により生
成されることを特徴とするCELP型音声符号化方法で
あり、格納した拡散パタンの形状(特性)を反映した音
源ベクトルを生成し、それを用いて品質の高い合成音声
を出力することができるという作用を有する。
線形予測分析する段階と、雑音符号ベクトルを生成する
段階と、前記雑音符号ベクトルを入力して合成音声ベク
トルを生成する段階とを有するCELP型音声符号化方
法であって、前記雑音符号ベクトルは、パルスベクトル
を供給する段階と、複数の拡散パタンを格納する段階
と、格納されている前記拡散パタンのいずれかを選択す
る段階と、選択された前記拡散パタンと前記パルスベク
トルを畳み込む段階とを有し且つ適応ゲインの値と音声
信号の短時間的特徴を表すパラメータとを併用して拡散
パタンを選択する音源ベクトル生成方法により生成され
ることを特徴とするCELP型音声符号化方法であり、
格納した拡散パタンの形状(特性)を反映した音源ベク
トルを生成し、それを用いて品質の高い合成音声を出力
することができるという作用を有する。
ルを生成する適応符号帳と、雑音符号ベクトルを生成す
る雑音符号帳と、前記適応符号ベクトルと前記雑音符号
ベクトルとを入力して合成する合成フィルタとを有する
CELP型音声復号化装置であって、前記雑音符号帳
は、パルスベクトルを供給するパルスベクトル生成部
と、複数の拡散パタンを格納する拡散パタン格納部と、
格納されている前記拡散パタンのいずれかを選択する選
択部と、前記選択部により選択された拡散パタンと前記
パルスベクトルを畳み込むパルスベクトル拡散部とを有
し且つ選択部が音声信号の有声/無声判定結果を用いて
拡散パタンを選択する音源ベクトル生成装置であること
を特徴とするCELP型音声復号化装置であり、格納し
た拡散パタンの形状(特性)を反映した音源ベクトルを
生成し、それを用いて品質の高い合成音声を出力するこ
とができるという作用を有する。
ルを生成する適応符号帳と、雑音符号ベクトルを生成す
る雑音符号帳と、前記適応符号ベクトルと前記雑音符号
ベクトルとを入力して合成する合成フィルタとを有する
CELP型音声復号化装置であって、前記雑音符号帳
は、パルスベクトルを供給するパルスベクトル生成部
と、複数の拡散パタンを格納する拡散パタン格納部と、
格納されている前記拡散パタンのいずれかを選択する選
択部と、前記選択部により選択された拡散パタンと前記
パルスベクトルを畳み込むパルスベクトル拡散部とを有
し且つ選択部が適応ゲインの値を利用して拡散パタンを
選択する音源ベクトル生成装置であることを特徴とする
CELP型音声復号化装置であり、格納した拡散パタン
の形状(特性)を反映した音源ベクトルを生成し、それ
を用いて品質の高い合成音声を出力することができると
いう作用を有する。
ルを生成する適応符号帳と、雑音符号ベクトルを生成す
る雑音符号帳と、前記適応符号ベクトルと前記雑音符号
ベクトルとを入力して合成する合成フィルタとを有する
CELP型音声復号化装置であって、前記雑音符号帳
は、パルスベクトルを供給するパルスベクトル生成部
と、複数の拡散パタンを格納する拡散パタン格納部と、
格納されている前記拡散パタンのいずれかを選択する選
択部と、前記選択部により選択された拡散パタンと前記
パルスベクトルを畳み込むパルスベクトル拡散部とを有
し且つ選択部が適応ゲインの値と音声信号の短時間的特
徴を表すパラメータとを併用して拡散パタンを選択する
音源ベクトル生成装置であることを特徴とするCELP
型音声復号化装置であり、格納した拡散パタンの形状
(特性)を反映した音源ベクトルを生成し、それを用い
て品質の高い合成音声を出力することができるという作
用を有する。
トルを生成する段階と、雑音符号ベクトルを生成する段
階と、前記適応符号ベクトルと前記雑音符号ベクトルと
を入力して合成する段階とを有するCELP型音声復号
化方法であって、前記雑音符号ベクトルは、パルスベク
トルを供給する段階と、複数の拡散パタンを格納する段
階と、格納されている前記拡散パタンのいずれかを選択
する段階と、選択された前記拡散パタンと前記パルスベ
クトルを畳み込む段階とを有し且つ音声信号の有声/無
声判定結果を用いて拡散パタンを選択する音源ベクトル
生成方法により生成されることを特徴とするCELP型
音声復号化方法であり、格納した拡散パタンの形状(特
性)を反映した音源ベクトルを生成し、それを用いて品
質の高い合成音声を出力することができるという作用を
有する。
トルを生成する段階と、雑音符号ベクトルを生成する段
階と、前記適応符号ベクトルと前記雑音符号ベクトルと
を入力して合成する段階とを有するCELP型音声復号
化方法であって、前記雑音符号ベクトルは、パルスベク
トルを供給する段階と、複数の拡散パタンを格納する段
階と、格納されている前記拡散パタンのいずれかを選択
する段階と、選択された前記拡散パタンと前記パルスベ
クトルを畳み込む段階とを有し且つ適応ゲインの値を利
用して拡散パタンを選択する音源ベクトル生成方法によ
り生成されることを特徴とするCELP型音声復号化方
法であり、格納した拡散パタンの形状(特性)を反映し
た音源ベクトルを生成し、それを用いて品質の高い合成
音声を出力することができるという作用を有する。
トルを生成する段階と、雑音符号ベクトルを生成する段
階と、前記適応符号ベクトルと前記雑音符号ベクトルと
を入力して合成する段階とを有するCELP型音声復号
化方法であって、前記雑音符号ベクトルは、パルスベク
トルを供給する段階と、複数の拡散パタンを格納する段
階と、格納されている前記拡散パタンのいずれかを選択
する段階と、選択された前記拡散パタンと前記パルスベ
クトルを畳み込む段階とを有し且つ適応ゲインの値と音
声信号の短時間的特徴を表すパラメータとを併用して拡
散パタンを選択する音源ベクトル生成方法により生成さ
れることを特徴とするCELP型音声復号化方法であ
り、格納した拡散パタンの形状(特性)を反映した音源
ベクトルを生成し、それを用いて品質の高い合成音声を
出力することができるという作用を有する。
て、図1から図5を用いて説明する。
ける音源ベクトル生成装置の構成ブロック図を示す。図
1において、101はベクトル軸上のある1要素に極性
付き単位パルスが立ったベクトル(以下:パルスベクト
ルと呼ぶ)を生成するチャネルをN個(本実施の形態で
は、N=3の場合について説明する)備えたパルスベク
トル生成部、102は前記N個のチャネルごとにM種類
(本実施の形態では、M=2の場合について説明する)
の拡散パタンを格納する機能と、格納したM種類の拡散
パタンからある1種類の拡散パタンを選択する機能とを
併せ持つ拡散パタン格納・選択部、103は前記パルス
ベクトル生成部101から出力されるパルスベクトルと
前記拡散パタン格納・選択部102から選択される拡散
パタンとの重畳演算をチャネルごとに行い、N個の拡散
ベクトルを生成する機能を有するパルスベクトル拡散
部、104は前記パルスベクトル拡散部103により生
成されるN個の拡散ベクトルを加算して音源ベクトルを
生成する機能を有する拡散ベクトル加算部、105は生
成された音源ベクトルである。なお、本実施の形態で
は、パルスベクトル生成部1が、下記の(表1)記載の
規則に従ってN個(N=3)のパルスベクトルを代数的
に生成する場合について説明する。
装置の動作を、図1を用いて説明する。拡散パタン格納
・選択部102は、チャネル毎に2種類ずつ格納した拡
散パタンから1種類ずつ選択し、パルスベクトル拡散部
103へ出力する。ただしここで、選択された拡散パタ
ンの組合せ(組合せ総数:M^N=8通り)に対応し
て、番号が割り当てられることとする。次に、パルスベ
クトル生成部101が、(表1)記載の規則に従い代数
的にパルスベクトルをチャネル数分(本実施の形態では
3個)生成する。
ン格納・選択部102で選択された拡散パタンと、パル
スベクトル生成部101で生成されたパルスとを、下記
(数5)による重畳演算に用いて、チャネル毎に拡散ベ
クトルを生成する。
トル拡散部103で生成された3個の拡散ベクトルを、
下記(数6)により加算して、音源ベクトル105を生
成する。
置では、拡散パタン格納・選択部が選択する拡散パタン
の組合せ方や、パルスベクトル生成部が生成するパルス
ベクトル内のパルスの位置および極性に変化を持たせる
ことで、多様な音源ベクトルを生成することが可能にな
る。そして、このように構成された音源ベクトル生成装
置では、拡散パタン格納・選択部102が選択する拡散
パタンの組合せ方と、パルスベクトル生成部101が生
成するパルスベクトルの形状(パルス位置およびパルス
極性)の組合せ方の2種類の情報に対して、それぞれ1
対1に対応する番号を割り当てておくことが可能であ
る。また、拡散パタン格納・選択部102には、実際の
音源情報をもとに予め学習を行い、その学習の結果得ら
れる拡散パタンを格納しておくことが可能である。
号化装置/復号化装置の音源情報生成部に用いれば、拡
散パタン格納・選択部が選択した拡散パタンの組合せ番
号と、パルスベクトル生成部が生成したパルスベクトル
の組合わせ番号(パルス位置およびパルス極性を特定で
きる)との2種類の番号を伝送することで、雑音音源情
報の伝送を実現できるようになる。
生成部を用いると、代数的に生成したパルス音源を用い
る場合よりも、実際の音源情報に似た形状(特性)の音
源ベクトルを生成することが可能になる。
・選択部102が1チャネルあたり2種類の拡散パタン
を格納している場合について説明したが、各チャネルに
対して2種類以外の拡散パタンを割り当てた場合にも、
同様の作用・効果が得られる。
トル生成部101が3チャネル構成かつ(表1)記載の
パルス生成規則に基づいている場合について説明した
が、チャネル数が異なる場合や、パルス生成規則として
(表1)記載以外のパルス生成規則を用いた場合にも、
同様の作用・効果が得られる。
音声符号化装置/復号化装置を有する、音声信号通信シ
ステムまたは音声信号記録システムを構成することによ
り、上記音源ベクトル生成装置の有する作用・効果を得
ることができる。
けるCELP音声符号化装置の構成ブロック図を示し、
図3はCELP型音声復号化装置の構成ブロック図を示
す。
雑音符号帳(図6内の18)に、実施の形態1記載の音
源ベクトル生成装置(図1)を適用したものであり、図
3は、従来のCELP音声符号化装置の雑音符号帳(図
7内の34)に、上記実施の形態1記載の音源ベクトル
生成装置を適用したものである。よって雑音音源情報の
ベクトル量子化処理以外の処理は、従来技術の項に記載
した内容と同様であり、本実施の形態では、図2および
図3における雑音音源情報のベクトル量子化処理を中心
に、音声符号化装置、音声復号化装置の説明を行う。ま
た、実施の形態1と同様に、チャネル数N=3,1チャ
ネルの拡散パタン数M=2,パルスベクトルの生成は
(表1)によるものとする。
報のベクトル量子化処理は、(数4)の基準値を最大化
するような2種類の番号(拡散パタンの組合せ番号、パ
ルス位置とパルス極性の組合せ番号)を特定する処理で
ある。図1の音源ベクトル生成装置を雑音符号帳として
用いた場合に、拡散パタンの組合せ番号(8種類)とパ
ルスベクトルの組合せ番号(極性を考慮した場合:16
384種類)を閉ループで特定するためには、拡散パタ
ン格納・選択部215が、まず始めに、自ら格納してい
る2種類の拡散パタンのうち、どちらか一方の拡散パタ
ンを選択し、パルスベクトル拡散部217へ出力する。
その後、パルスベクトル生成部216が、(表1)記載
の規則に従い代数的にパルスベクトルをチャネル数分
(本実施の形態では3個)生成し、パルスベクトル拡散
部217へ出力する。パルスベクトル拡散部217は、
拡散パタン格納・選択部215で選択された拡散パタン
と、パルスベクトル生成部216で生成されたパルスベ
クトルとを、(数5)による重畳演算に用いて、チャネ
ル毎に拡散ベクトルを生成する。拡散ベクトル加算部2
18は、パルスベクトル拡散部217で得られた拡散ベ
クトルを加算して、音源ベクトル(雑音符号ベクトルの
候補となる)を生成する。そして、歪み計算部206
が、拡散ベクトル加算部218で得られた雑音符号ベク
トル候補を用いた(数4)の値を算出する。この(数
4)の値の算出を、(表1)記載の規則によって生成さ
れるパルスベクトルの組合せ全てについて行い、その中
から(数4)の値が最大になる時の拡散パタンの組合せ
番号、パルスベクトルの組合せ番号(パルス位置とその
極性の組合せ)、およびその時の最大値を符号番号特定
部213へ出力する。
格納している拡散パタンから、先ほどと異なる組合せの
拡散パタンを選択する。そして新たに選択しなおした拡
散パタンの組合せについて、上記と同様に(表1)の規
則に従ってパルスベクトル生成部216で生成されるパ
ルスベクトルの全組合せについて、(数4)の値を算出
する。そして、その中から、(数4)を最大にする時
の、拡散パタンの組合せ番号、パルスベクトルの組合せ
番号、および最大値を符号番号特定部213へ再度出力
する。
5が格納している拡散パタンから選択できる全組合せ
(本実施の形態の説明では、組合せ総数は8)について
繰り返す。
6によって算出されたトータル8個の最大値を比較し、
その中から一番大きいものを選択し、その最大値を生成
した時の2種類の組合せ番号(拡散パタンの組合せ番
号、パルスベクトルの組合せ番号)を特定し、雑音符号
番号として符号出力部214へ出力する。
力部301が、音声符号化装置(図2)から送信される
符号を受信し、受信した符号を対応する線形予測符号番
号と、適応符号番号、雑音符号番号(拡散パタンの組合
せ番号、パルスベクトルの組合せ番号の2種類から構成
されている)、および重み符号番号に分解し、分解して
得られた符号をそれぞれ、線形予測係数復号化部30
2、適応符号帳303、雑音符号帳304、重み符号帳
305へ出力する。なおここで、雑音符号番号のうち、
拡散パタンの組合せ番号は拡散パタン格納・選択部31
1へ出力され、パルスベクトルの組合せ番号はパルスベ
クトル生成部312へ出力されるものとする。
形予測符号番号を復号化して合成フィルタの係数を得、
合成フィルタ309へ出力する。適応符号帳303で
は、適応符号番号と対応する位置から適応符号ベクトル
が読みだされる。
選択部311が拡散パルスの組合せ番号に対応する拡散
パタンをチャネル毎に読みだしてパルスベクトル拡散部
313へ出力し、パルスベクトル生成部312がパルス
ベクトルの組合せ番号に対応したパルスベクトルをチャ
ネル数分生成してパルスベクトル拡散部313へ出力
し、パルスベクトル拡散部313が拡散パタン格納・選
択部311から受けた拡散パタンとパルスベクトル生成
部312から受けたパルスベクトルとを(数5)記載の
重畳演算に用いて拡散ベクトルを生成し、拡散ベクトル
加算部314へ出力する。拡散ベクトル加算部314が
パルスベクトル拡散部313で生成した各チャネルの拡
散ベクトルを加算して雑音符号ベクトルを生成する。
号と対応した適応符号ゲインと雑音符号ゲインが読みだ
され、適応符号ベクトル重付け部306において適応符
号ベクトルに適応符号ゲインが乗じられ、同様に雑音符
号ベクトル重付け部307において雑音符号ベクトルに
雑音符号ゲインが乗じられ、加算部308へ送られる。
加算部308は、ゲインが乗じられた上記2つの符号ベ
クトルを加算して駆動音源ベクトルを生成し、生成した
駆動音源ベクトルを、バッファ更新のために適応符号帳
303へ、また、合成フィルタを駆動するために合成フ
ィルタ309へと出力する。
られた駆動音源ベクトルで駆動され、合成音声310を
再生する。また適応符号帳303は、加算部308より
受けた駆動音源ベクトルでバッファを更新する。
納・選択部には、(数6)記載の音源ベクトルを(数
2)内のcに代入した下記(数7)の歪み評価基準式を
コスト関数とし、当該コスト関数の値がより小さくなる
ように予め学習して得られた拡散パタンが各チャネル毎
に格納されているものとする。このようにすることで、
実際の雑音音源情報((数4)内のベクトルx)の形状
と類似した形状の音源ベクトルを生成することができる
ようになるため、代数的音源ベクトル生成部を雑音符号
帳に用いたCELP音声符号化装置/復号化装置より
も、品質の高い合成音声を得ることが可能になる。
・選択部が、(数7)記載のコスト関数の値をより小さ
くするように予め学習して得られた拡散パタンをチャネ
ル毎にM個ずつ格納しておいた場合について説明した
が、実際にはM個の拡散パタン全てが学習によって得ら
れたものである必要はなく、学習によって得られた拡散
パタンを各チャネル毎に少くとも1種類格納しておくよ
うにすれば、そのような場合にも合成音声の品質を向上
させる作用・効果を得ることができる。
格納・選択部が格納する拡散パタンの全組合せ、およ
び、パルスベクトル生成部6が生成するパルスベクトル
の位置候補の全組合せから、(数4)の基準値を最大化
する組合せ番号を閉ループで特定する場合について説明
したが、雑音符号帳の番号特定以前に求めたパラメータ
(適応符号ベクトルの理想ゲインなど)を基に予備選択
を行ったり、開ループで探索するなどしても同様の作用
・効果を得ることができる。
有する、音声信号通信システムまたは音声信号記録シス
テムを構成することにより、実施の形態1で記載した音
源ベクトル生成装置の有する作用・効果を得ることがで
きる。
けるCELP音声符号化装置の構成ブロック図である。
装置(図1)を雑音符号帳に用いたCELP音声符号化
装置において、雑音符号帳を探索する以前に求まってい
る理想適応符号ゲインの値を用いて、拡散パタン格納・
選択部に格納された拡散パタンの予備選択を行う方法を
説明するための図であり、雑音符号帳周辺部以外は図2
記載のCELP音声符号化装置と同一である。よって本
実施の形態の説明は、図4記載のCELP音声符号化装
置における雑音音源情報のベクトル量子化処理について
の説明にとどめる。
9は適応符号ゲイン重み付け部、408は実施の形態1
で説明した音源ベクトル生成装置によって構成された雑
音符号帳、410は雑音符号ゲイン重み付け部、405
は合成フィルタ、406は歪み計算部、413は符号番
号特定部、415は拡散パタン格納・選択部、416は
パルスベクトル生成部、417はパルスベクトル拡散
部、418は拡散ベクトル加算部、419は適応ゲイン
判定部である。ただし、本実施の形態において、上記拡
散パタン格納・選択部415が格納する格納するM種類
(M≧2)の拡散パタンのうちすくなくとも1種類は、
雑音音源情報をベクトル量子化する際に生じる量子化歪
みをより小さくするように予め学習し、当該学習の結果
得られた拡散パタンであることとする。
ルスベクトル生成部のチャネル数Nは3、拡散パタン格
納・選択部が格納しているチャネルあたりの拡散パルス
の種類数Mは2とし、さらに、M種類(M=2)の拡散
パタンは、1つが上記学習によって得られた拡散パタン
であり、もう一方は、乱数ベクトル生成装置によって生
成される乱数ベクトル列(以下:ランダムパタンと呼
ぶ)である場合として説明を行う。ちなみに、上記学習
によって得られる拡散パタンは、図1内のw11の様に、
長さは比較的短く、パルス的な形状の拡散パタンになる
ことがわかっている。
は、雑音音源情報のベクトル量子化の前に適応符号帳の
番号特定処理が行われる。よって、雑音音源情報のベク
トル量子化処理を行う時点では、適応符号帳のベクトル
番号(適応符号番号)および、理想適応符号ゲイン(暫
定的に決っている)を参照することが可能である。本実
施の形態では、このうちの理想適応符号ゲインの値を使
って、拡散パルスの予備選択を行う。
後に符号番号特定部413に保持されている適応符号ゲ
インの理想値が、歪み計算部406へ出力される。歪み
計算部406は、符号番号特定部413から受けた適応
符号ゲインを適応ゲイン判定部419へ出力する。適応
ゲイン判定部419は、まず始めに、歪み計算部406
より受けた理想適応符号ゲインの値と予め設定されたし
きい値との大小比較を行う。次に適応ゲイン判定部41
9は、上記大小比較の結果に基づき、拡散パタン格納・
選択部415に予備選択用の制御信号を送る。制御信号
の内容は、上記大小比較において適応符号ゲインが大き
い場合には、雑音音源情報をベクトル量子化する際に生
じる量子化歪みをより小さくするように予め学習して得
られた拡散パタンを選択するように指示するものであ
り、上記大小比較において適応符号ゲインが大きくない
場合には、学習の結果得られた拡散パタンとは別の拡散
パタンを予備選択するように指示するものである。
おいて、各チャネルが格納しているM種類(M=2)の
拡散パタンから学習によって得られた側の拡散パタンだ
けが予備選択されることになり、拡散パタンの組合せ数
を大幅に削減できるようになる。その結果、拡散パタン
の全組合せ番号についての歪み計算をする必要がなくな
り、雑音音源情報のベクトル量子化処理を少い演算量で
効率的に行うことが可能になる。
は、適応ゲインの値が大きい時(有声性が強い時)には
パルス的な形状になり、適応ゲインの値が小さい時(有
声性が弱い時)にはランダム的な形状になる。よって、
音声信号の有声区間および無声区間に対して、それぞれ
適した形状の雑音符号ベクトルを利用できるようになる
ため、合成音声の品質を向上させることが可能になる。
め、パルスベクトル生成部のチャネル数Nは3、拡散パ
タン格納・選択部が格納しているチャネルあたりの拡散
パルスの種類数Mは2の場合に限定して説明を行った
が、パルスベクトル生成部のチャネル数、拡散パタン格
納・選択部内のチャネルあたりの拡散パタン数が上記説
明と異なる場合についても、同様の効果・作用が得られ
る。
め、各チャネルあたり格納するM種類(M=2)の拡散
パタンのうち、一種類は上記学習によって得られた拡散
パタン、もう一種類はランダムパタンである場合につい
て説明を行ったが、学習によって得られた拡散パタンを
各チャネル毎に少くとも1種類格納しておくようにすれ
ば、上記のような場合でなくても、同様の効果・作用を
期待することができる。
を予備選択するための手段として、適応符号ゲインの大
小情報をもちいる場合について説明したが、適応ゲイン
の大小情報以外の音声信号の短時間的特徴を表すパラメ
ータを併用すると、なお一層の効果・作用を期待するこ
とができる。
信号通信システムまたは音声信号記録システムを構成す
ることにより、実施の形態1で記載した音源ベクトル生
成装置の有する作用・効果を得ることができる。
けるCELP音声符号化装置の構成ブロック図である。
装置(図1)を雑音符号帳に用いたCELP音声符号化
装置において、雑音音源情報をベクトル量子化する時点
で利用可能な情報を使って拡散パタン格納・選択部に格
納された複数の拡散パタンの予備選択を行うことを目的
としており、予備選択の基準として適応符号帳の番号特
定を行った時に生じる符号化歪み(S/N比で表現)の
大小を使うことを特徴としている。なお、図5の雑音符
号帳周辺部以外は図2記載のCELP音声符号化装置と
同一である。よって本実施の形態の説明は、図5記載の
CELP音声符号化装置における雑音音源情報のベクト
ル量子化処理についてだけの説明にとどめる。
9は適応符号ゲイン重み付け部、508は実施の形態1
で説明した音源ベクトル生成装置によって構成された雑
音符号帳、510は雑音符号ゲイン重み付け部、505
は合成フィルタ、506は歪み計算部、513は符号番
号特定部、515は拡散パタン格納・選択部、516は
パルスベクトル生成部、517はパルスベクトル拡散
部、518は拡散ベクトル加算部、519は歪みパワ判
定部である。ただし、本実施の形態において、上記拡散
パタン格納・選択部515が格納する格納するM種類
(M≧2)の拡散パタンのうちすくなくとも1種類は、
ランダムパタンであることとする。
ルスベクトル生成部のチャネル数Nは3、拡散パタン格
納・選択部が格納しているチャネルあたりの拡散パルス
の種類数Mは2とし、さらに、M種類(M=2)の拡散
パタンのうち1種類はランダムパタン、もう1種類は雑
音音源情報をベクトル量子化することにより生じる量子
化歪みをより小さくするように予め学習し、当該学習の
結果得られた拡散パタンであるとする。
は、雑音音源情報のベクトル量子化処理の前に適応符号
帳の番号特定処理が行われる。よって、雑音音源番号の
ベクトル量子化処理を行う時点では、適応符号帳のベク
トル番号(適応符号番号)、理想適応符号ゲイン(暫定
的に決っている)および、適応符号帳探索用のターゲッ
トベクトルを参照することができる。本実施の形態で
は、上記3つの情報から算出できる適応符号帳の符号化
歪み(S/N比で表現)を使って、拡散パルスの予備選
択を行う。
後に符号番号特定部513に保持されている適応符号番
号および適応符号ゲイン(理想ゲイン)の値が歪み計算
部506へ出力される。歪み計算部506は、符号番号
特定部513から受けた適応符号番号および適応符号ゲ
インと適応符号帳探索用のターゲットベクトルを用い
て、適応符号帳の番号特定によって生じた符号化歪み
(S/N比)を算出する。算出したS/N比を歪みパワ
判定部519へ出力する。
み計算部506より受けたS/N比と予め設定されたし
きい値との大小比較を行う。次に歪みパワ判定部519
は、上記大小比較の結果に基づき、拡散パタン格納・選
択部515に予備選択用の制御信号を送る。制御信号の
内容は、上記大小比較においてS/N比が大きい場合に
は、雑音符号帳探索用ターゲットベクトルを符号化する
ことにより生じる符号化歪みをより小さくするように予
め学習した結果得られる拡散パタンを選択するように指
示するものであり、上記大小比較においてS/N比が小
さい場合には、ランダムパタンの拡散パタンを選択する
ように指示するのである。
おいて、各チャネルが格納しているM種類(M=2)の
拡散パタンから1種類だけが予備選択されることにな
り、拡散パタンの組合せを大幅に削減できるようにな
る。その結果、拡散パタンの全組合せ番号についての歪
み計算をする必要がなくなり、雑音符号番号の特定を少
い演算量で効率的に行うことができることになる。そし
て、さらに、雑音符号ベクトルの形状は、S/N比が大
きい時にはパルス的な形状になり、S/N比が小さい時
にはランダム的な形状になる。よって、音声信号の短時
間的な特徴に応じて、雑音符号ベクトルの形状を変化さ
せることが可能になるため、合成音声(特に、ノイズ区
間)の品質を向上させることが可能になる。
め、パルスベクトル生成部のチャネル数Nは3、拡散パ
タン格納・選択部が格納しているチャネルあたりの拡散
パルスの種類数Mは2の場合に限定して説明を行った
が、パルスベクトル生成部のチャネル数、チャネルあた
りの拡散パタンの種類数が上記説明と異なる場合につい
ても、同様の効果・作用が得られる。
め、さらに、各チャネルあたり格納するM種類(M=
2)の拡散パタンのうち、一種類は上記学習によって得
られた拡散パタン、もう一種類はランダムパタンである
場合について説明を行ったが、ランダムパタンの拡散パ
タンを各チャネル毎に少くとも1種類格納しておくよう
にすれば、上記のような場合でなくても、同様の効果・
作用を期待することができる。
を予備選択するための手段として、適応符号番号の特定
によって生じる符号化歪み(S/N比で表現)の大小情
報だけを用いたが、音声信号の短時間的特徴をさらに正
確に表せる情報を併用すると、なお一層の効果・作用を
期待することができる。
信号通信システムまたは音声信号記録システムを構成す
ることにより、実施の形態1で記載した音源ベクトル生
成装置の有する作用・効果を得ることができる。
源情報を分析もしくはそれをもとに学習して得られた拡
散パタンの形状(特性)をパルスベクトルに反映するこ
とができるため、実際の音源ベクトルと類似性の高い形
状(特性)の音源ベクトルを生成することができ、それ
を雑音符号ベクトルとして用いるため、従来の代数的音
源生成部を雑音符号帳に用いる場合よりも品質の高い合
成音声を得ることができる。
装置の構成ブロック図
構成ブロック図
構成ブロック図
構成ブロック図
構成ブロック図
ク図
ク図
部 102、215、415、515 拡散パタン格納・選
択部 103、217、417、517 パルスベクトル拡散
部 104、218、418、518 拡散ベクトル加算部 105 音源ベクトル 201、401、501 入力音声 202、402、502 線形予測分析部 203、403、503 線形予測係数符号化部 204、302、404、504 線形予測係数復号化
部 205、309、405、505 合成フィルタ 206、406、506 歪み計算部 207、303、407、507 適応符号帳 208、304、408、508 雑音符号帳 209、306、409、509 適応符号ゲイン重み
付け部 210、307、410、510 雑音符号ゲイン重み
付け部 211、305、411、511 重み符号帳 212、308、412、512 加算部 213、413、513 符号番号特定部 214、414、514 符号出力部 301 符号入力部 310 合成音声 419 適応ゲイン判定部 519 歪みパワ判定部
Claims (12)
- 【請求項1】 入力音声信号を線形予測分析する線形予
測分析手段と、雑音符号ベクトルを生成する雑音符号帳
と、前記雑音符号ベクトルを入力して合成音声ベクトル
を生成する合成フィルタとを有するCELP型音声符号
化装置であって、前記雑音符号帳は、パルスベクトルを
供給するパルスベクトル生成部と、複数の拡散パタンを
格納する拡散パタン格納部と、格納されている前記拡散
パタンのいずれかを選択する選択部と、前記選択部によ
り選択された拡散パタンと前記パルスベクトルを畳み込
むパルスベクトル拡散部とを有し且つ選択部が音声信号
の有声/無声判定結果を用いて拡散パタンを選択する音
源ベクトル生成装置であることを特徴とするCELP型
音声符号化装置。 - 【請求項2】 入力音声信号を線形予測分析する線形予
測分析手段と、雑音符号ベクトルを生成する雑音符号帳
と、前記雑音符号ベクトルを入力して合成音声ベクトル
を生成する合成フィルタとを有するCELP型音声符号
化装置であって、前記雑音符号帳は、パルスベクトルを
供給するパルスベクトル生成部と、複数の拡散パタンを
格納する拡散パタン格納部と、格納されている前記拡散
パタンのいずれかを選択する選択部と、前記選択部によ
り選択された拡散パタンと前記パルスベクトルを畳み込
むパルスベクトル拡散部とを有し且つ選択部が適応ゲイ
ンの値を利用して拡散パタンを選択する音源ベクトル生
成装置であることを特徴とするCELP型音声符号化装
置。 - 【請求項3】 入力音声信号を線形予測分析する線形予
測分析手段と、雑音符号ベクトルを生成する雑音符号帳
と、前記雑音符号ベクトルを入力して合成音声ベクトル
を生成する合成フィルタとを有するCELP型音声符号
化装置であって、前記雑音符号帳は、パルスベクトルを
供給するパルスベクトル生成部と、複数の拡散パタンを
格納する拡散パタン格納部と、格納されている前記拡散
パタンのいずれかを選択する選択部と、前記選択部によ
り選択された拡散パタンと前記パルスベクトルを畳み込
むパルスベクトル拡散部とを有し且つ選択部が適応ゲイ
ンの値と音声信号の短時間的特徴を表すパラメータとを
併用して拡散パタンを選択する音源ベクトル生成装置で
あることを特徴とするCELP型音声符号化装置。 - 【請求項4】 入力音声信号を線形予測分析する段階
と、雑音符号ベクトルを生成する段階と、前記雑音符号
ベクトルを入力して合成音声ベクトルを生成する段階と
を有するCELP型音声符号化方法であって、前記雑音
符号ベクトルは、パルスベクトルを供給する段階と、複
数の拡散パタンを格納する段階と、格納されている前記
拡散パタンのいずれかを選択する段階と、選択された前
記拡散パタンと前記パルスベクトルを畳み込む段階とを
有し且つ音声信号の有声/無声判定結果を用いて拡散パ
タンを選択する音源ベクトル生成方法により生成される
ことを特徴とするCELP型音声符号化方法。 - 【請求項5】 入力音声信号を線形予測分析する段階
と、雑音符号ベクトルを生成する段階と、前記雑音符号
ベクトルを入力して合成音声ベクトルを生成する段階と
を有するCELP型音声符号化方法であって、前記雑音
符号ベクトルは、パルスベクトルを供給する段階と、複
数の拡散パタンを格納する段階と、格納されている前記
拡散パタンのいずれかを選択する段階と、選択された前
記拡散パタンと前記パルスベクトルを畳み込む段階とを
有且つ適応ゲインの値を利用して拡散パタンを選択する
音源ベクトル生成方法により生成されることを特徴とす
るCELP型音声符号化方法。 - 【請求項6】 入力音声信号を線形予測分析する段階
と、雑音符号ベクトルを生成する段階と、前記雑音符号
ベクトルを入力して合成音声ベクトルを生成する段階と
を有するCELP型音声符号化方法であって、前記雑音
符号ベクトルは、パルスベクトルを供給する段階と、複
数の拡散パタンを格納する段階と、格納されている前記
拡散パタンのいずれかを選択する段階と、選択された前
記拡散パタンと前記パルスベクトルを畳み込む段階とを
有し且つ適応ゲインの値と音声信号の短時間的特徴を表
すパラメータとを併用して拡散パタンを選択する音源ベ
クトル生成方法により生成されることを特徴とするCE
LP型音声符号化方法。 - 【請求項7】 適応符号ベクトルを生成する適応符号帳
と、雑音符号ベクトルを生成する雑音符号帳と、前記適
応符号ベクトルと前記雑音符号ベクトルとを入力して合
成する合成フィルタとを有するCELP型音声復号化装
置であって、前記雑音符号帳は、パルスベクトルを供給
するパルスベクトル生成部と、複数の拡散パタンを格納
する拡散パタン格納部と、格納されている前記拡散パタ
ンのいずれかを選択する選択部と、前記選択部により選
択された拡散パタンと前記パルスベクトルを畳み込むパ
ルスベクトル拡散部とを有し且つ選択部が音声信号の有
声/無声判定結果を用いて拡散パタンを選択する音源ベ
クトル生成装置であることを特徴とするCELP型音声
復号化装置。 - 【請求項8】 適応符号ベクトルを生成する適応符号帳
と、雑音符号ベクトルを生成する雑音符号帳と、前記適
応符号ベクトルと前記雑音符号ベクトルとを入力して合
成する合成フィルタとを有するCELP型音声復号化装
置であって、前記雑音符号帳は、パルスベクトルを供給
するパルスベクトル生成部と、複数の拡散パタンを格納
する拡散パタン格納部と、格納されている前記拡散パタ
ンのいずれかを選択する選択部と、前記選択部により選
択された拡散パタンと前記パルスベクトルを畳み込むパ
ルスベクトル拡散部とを有し且つ選択部が適応ゲインの
値を利用して拡散パタンを選択する音源ベクトル生成装
置であることを特徴とするCELP型音声復号化装置。 - 【請求項9】 適応符号ベクトルを生成する適応符号帳
と、雑音符号ベクトルを生成する雑音符号帳と、前記適
応符号ベクトルと前記雑音符号ベクトルとを入力して合
成する合成フィルタとを有するCELP型音声復号化装
置であって、前記雑音符号帳は、パルスベクトルを供給
するパルスベクトル生成部と、複数の拡散パタンを格納
する拡散パタン格納部と、格納されている前記拡散パタ
ンのいずれかを選択する選択部と、前記選択部により選
択された拡散パタンと前記パルスベクトルを畳み込むパ
ルスベクトル拡散部とを有し且つ選択部が適応ゲインの
値と音声信号の短時間的特徴を表すパラメータとを併用
して拡散パタンを選択する音源ベクトル生成装置である
ことを特徴とするCELP型音声復号化装置。 - 【請求項10】 適応符号ベクトルを生成する段階と、
雑音符号ベクトルを生成する段階と、前記適応符号ベク
トルと前記雑音符号ベクトルとを入力して合成する段階
とを有するCELP型音声復号化方法であって、前記雑
音符号ベクトルは、パルスベクトルを供給する段階と、
複数の拡散パタンを格納する段階と、格納されている前
記拡散パタンのいずれかを選択する段階と、選択された
前記拡散パタンと前記パルスベクトルを畳み込む段階と
を有し且つ音声信号の有声/無声判定結果を用いて拡散
パタンを選択する音源ベクトル生成方法により生成され
ることを特徴とするCELP型音声復号化方法。 - 【請求項11】 適応符号ベクトルを生成する段階と、
雑音符号ベクトルを生成する段階と、前記適応符号ベク
トルと前記雑音符号ベクトルとを入力して合成する段階
とを有するCELP型音声復号化方法であって、前記雑
音符号ベクトルは、パルスベクトルを供給する段階と、
複数の拡散パタンを格納する段階と、格納されている前
記拡散パタンのいずれかを選択する段階と、選択された
前記拡散パタンと前記パルスベクトルを畳み込む段階と
を有し且つ適応ゲインの値を利用して拡散パタンを選択
する音源ベクトル生成方法により生成されることを特徴
とするCELP型音声復号化方法。 - 【請求項12】 適応符号ベクトルを生成する段階と、
雑音符号ベクトルを生成する段階と、前記適応符号ベク
トルと前記雑音符号ベクトルとを入力して合成する段階
とを有するCELP型音声復号化方法であって、前記雑
音符号ベクトルは、パルスベクトルを供給する段階と、
複数の拡散パタンを格納する段階と、格納されている前
記拡散パタンのいずれかを選択する段階と、選択された
前記拡散パタンと前記パルスベクトルを畳み込む段階と
を有し且つ適応ゲインの値と音声信号の短時間的特徴を
表すパラメータとを併用して拡散パタンを選択する音源
ベクトル生成方法により生成されることを特徴とするC
ELP型音声復号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000156370A JP3276357B2 (ja) | 1998-03-31 | 2000-05-26 | Celp型音声符号化装置及びcelp型音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000156370A JP3276357B2 (ja) | 1998-03-31 | 2000-05-26 | Celp型音声符号化装置及びcelp型音声符号化方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08571798A Division JP3174756B2 (ja) | 1997-10-22 | 1998-03-31 | 音源ベクトル生成装置及び音源ベクトル生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001022399A true JP2001022399A (ja) | 2001-01-26 |
JP3276357B2 JP3276357B2 (ja) | 2002-04-22 |
Family
ID=18661173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000156370A Expired - Lifetime JP3276357B2 (ja) | 1998-03-31 | 2000-05-26 | Celp型音声符号化装置及びcelp型音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3276357B2 (ja) |
-
2000
- 2000-05-26 JP JP2000156370A patent/JP3276357B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3276357B2 (ja) | 2002-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8352253B2 (en) | Speech coder and speech decoder | |
JP3174756B2 (ja) | 音源ベクトル生成装置及び音源ベクトル生成方法 | |
JP3276356B2 (ja) | Celp型音声符号化装置及びcelp型音声符号化方法 | |
JP3276358B2 (ja) | Celp型音声符号化装置及びcelp型音声符号化方法 | |
JP3276354B2 (ja) | 拡散ベクトル生成装置、音源ベクトル生成装置及び音源ベクトル生成方法 | |
JP3276357B2 (ja) | Celp型音声符号化装置及びcelp型音声符号化方法 | |
JP3276355B2 (ja) | Celp型音声復号化装置及びcelp型音声復号化方法 | |
JP3276353B2 (ja) | 拡散ベクトル生成装置、音源ベクトル生成装置及び音源ベクトル生成方法 | |
JP3292227B2 (ja) | 符号励振線形予測音声符号化方法及びその復号化方法 | |
JP2000132199A (ja) | 音声符号化装置/復号化装置 | |
CA2528645C (en) | Speech coder and speech decoder, orthogonal search method and speech coding method | |
JP3236853B2 (ja) | Celp型音声符号化装置及びcelp型音声符号化方法 | |
JP2000347700A (ja) | Celp型音声復号化装置及びcelp型音声復号化方法 | |
JP2000347699A (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 | |
JP2000330596A (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 | |
JP2000338999A (ja) | Celp型音声符号化装置及びcelp型音声符号化方法 | |
JP2000132198A (ja) | Celp型音声復号化装置 | |
JP2000330595A (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080208 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090208 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100208 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100208 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110208 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120208 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130208 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130208 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140208 Year of fee payment: 12 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S131 | Request for trust registration of transfer of right |
Free format text: JAPANESE INTERMEDIATE CODE: R313135 |
|
SZ02 | Written request for trust registration |
Free format text: JAPANESE INTERMEDIATE CODE: R313Z02 |
|
SZ02 | Written request for trust registration |
Free format text: JAPANESE INTERMEDIATE CODE: R313Z02 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |