JP2000347700A - Celp型音声復号化装置及びcelp型音声復号化方法 - Google Patents
Celp型音声復号化装置及びcelp型音声復号化方法Info
- Publication number
- JP2000347700A JP2000347700A JP2000113780A JP2000113780A JP2000347700A JP 2000347700 A JP2000347700 A JP 2000347700A JP 2000113780 A JP2000113780 A JP 2000113780A JP 2000113780 A JP2000113780 A JP 2000113780A JP 2000347700 A JP2000347700 A JP 2000347700A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- codebook
- unit
- excitation
- diffusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
な合成音を提供する。 【解決手段】 音声復号化装置では、少ないパルス本数
により構成される音源ベクトルの生成情報を音源情報格
納部1に格納し、ランダム数列、学習により求められた
数列、知見により求められた数列のいずれか一つの数列
を拡散ベクトル格納部2に格納するとともに、音源情報
格納部1の音源情報と拡散ベクトル格納部2の拡散ベク
トルとを畳み込み部3で畳み込むことにより、拡散音源
ベクトルが作成されるように構成したものである。音声
符号化装置では、拡散ベクトルとディジタルフィルタか
らのインパルス応答とを畳み込み部で畳み込むことによ
り新インパルス応答が作成されるように構成したもので
ある。
Description
び音声復号化方法における、音声情報の効率的な圧縮復
号化に関するものである。
野においては、加入者の増加に対処するため、低ビット
レート(〜8kbps程度)の音声の圧縮符号化法が求
められている。日本国内では、VSELPおよびPSI
−CELPという音声符号化方式が、フルレートおよび
ハーフレートのディジタル携帯電話の音声符号化標準方
式として、それぞれ採用・実用化されている。国際的に
は、CS−ACELPという符号化方式が8kbpsの
国際標準音声符号化方式として採用され、ITU−T勧
告G.729となっている(1995年)。これらの音
声符号化はいずれも、CELP方式("CODE-EXCITED LI
NEAR PRIDICTION (CELP):HIGH QUALITY SPEECH AT VERY
LOW RATES", Manfred R. Schroeder,Bishnu S. Atal,
Proc., ICASSP'85, pp.937-940に記載されている)を改
良したものである。
ムについて説明する。CELP方式は、音声情報を音源
情報と声道情報とに分離して符号化する方式で、音源情
報については符号帳に格納された複数のコードベクトル
のインデクスによって符号化し、声道情報についてはL
PC(線形予測係数)を符号化するということと、音源
情報符号化の際には声道情報を加味して入力音声と比較
を行う方法(A−b−S:Analysis by Sy
nthesis)を採用していることに特徴を有してい
る。なおCELPでは一般に、入力音声をある時間間隔
で区間(フレームと呼ばれる)ごとに分けてLPC分析
を行い、フレームをさらに細かく分けた区間(サブフレ
ームと呼ばれる)ごとに適応符号帳と確率的符号帳の音
源探索が行われる。
の機能ブロック図である。パラメータ復号化部152
は、従来のCELP型音声符号化装置(図6:後に説明
する)から送られた音声符号(LPC符号、確率的符号
帳のインデクス、確率的符号帳の符号化ゲイン、適応符
号帳のインデクス、適応符号帳の符号化ゲイン)を、伝
送部151を通して獲得する。次に、LPC符号を復号
化して復号化LPC係数を得、確率的符号帳の符号化ゲ
インを復号化して確率的符号帳の復号化ゲインを得、適
応符号帳の符号化ゲインを復号化して適応符号帳の復号
化ゲインを得る。更に、確率的符号帳のインデクス、確
率的符号帳の復号化ゲイン、適応符号帳のインデクス、
適応符号帳の復号化ゲインを駆動音源生成部155へ出
力し、復号化LPC係数をLPC合成部156へ出力す
る。
帳のインデクスに基づいた適応コードベクトルを適応符
号帳153から読み出し、得られた適応コードベクトル
に適応符号帳の復号化ゲインを乗じて駆動音源適応符号
帳成分を得る。次に、確率的符号帳のインデクスに基づ
いた確率的コードベクトルを確率的符号帳154から読
み出し、得られた確率的コードベクトルに確率的符号帳
の復号化ゲインを乗じて駆動音源確率的符号帳成分を得
る。更に、駆動音源適応符号帳成分と駆動音源確率的符
号帳成分を加算して駆動音源を得、得られた駆動音源を
LPC合成部156と適応符号帳153へ出力する。こ
こで、適応符号帳153内の古いコードベクトルは、駆
動音源生成部155から入力された上記駆動音源で更新
される。
55で得られた駆動音源に対し、パラメータ復号化部1
52より得た復号化LPC係数をもとにLPC合成を行
い、その出力をディジタルの出力音声157として出力
部位へ送る。
の機能ブロック図である。LPC分析部112は、ま
ず、ディジタルの入力音声111内のあるフレームに対
して自己相関分析と線形予測分析を行うことによってL
PC係数を算出し、そのLPC係数を量子化してLPC
符号を得てパラメータ符号化部123へ出力し、LPC
符号を復号化して復号化LPC係数を得、次に、ピッチ
強調や高域強調などの特性を持つ聴感重み付けフィルタ
のインパルス応答を求めて聴感重み付け部113へ出力
するとともに、聴感重み付けLPC合成フィルタのイン
パルス応答を求めて、聴感重み付けLPC逆順合成部A
114、聴感重み付けLPC合成部A116、聴感重み
付けLPC逆順合成部B119、聴感重み付けLPC合
成部B121へ出力する。
データに対し、サブフレーム毎に聴感重み付けフィルタ
リングを行い、その出力結果から聴感重み付けLPC合
成フィルタのゼロ入力応答を差し引いて、適応符号帳の
音源探索時に参照するターゲット信号を求め、聴感重み
付けLPC逆順合成部A114および減算部118へ出
力する。
は、聴感重み付け部113で得られたターゲット信号を
時間逆順化し、得られた逆順化信号をLPC分析部11
2より与えられたインパルス応答を係数に持つ聴感重み
付きLPC合成フィルタで合成し、その出力信号を再度
時間逆順化して、ターゲット信号の時間逆合成出力とし
て比較部A117へ出力する。
24により受けた過去の駆動音源を格納しており、その
過去の駆動音源情報は、聴感重み付けLPC合成部A1
16、比較部A117、適応符号帳更新部124によ
り、適応コードベクトルとして参照される。
応符号帳115から適応コードベクトルを読み出し、読
み出した適応コードベクトルに対し、LPC分析部11
2より得たインパルス応答を係数に持つ聴感重み付けL
PC合成フィルタで合成し、その結果を比較部A117
へ出力する。
5から直接読み出した適応コードベクトルと、聴感重み
付けLPC逆順合成部A114で求めたターゲット信号
の時間逆合成出力との内積の2乗値を求め、次に、聴感
重み付けLPC合成部A116から受けた、適応コード
ベクトルに聴感重み付けLPC合成を施した信号のパワ
を求め、そして、上記内積の2乗値をこのパワで割算す
ることによって適応符号帳探索の基準値を求め、その基
準値が最も大きくなるときに読み出した適応コードベク
トルのインデクスと、そのコードベクトルに乗じる最適
ゲインを算出して、減算部118およびパラメータ符号
化部123へ出力する。この一連の処理を適応符号帳の
探索という。
得たターゲット信号から、適応符号帳探索によって探索
されたコードベクトルを聴感重み付けLPC合成した出
力信号にゲインを乗じて得られた信号を減算し、その減
算結果を確率的符号帳の探索の際に参照するターゲット
信号として聴感重み付けLPC逆順合成部B119へ出
力する。
は、減算部118において生成された確率的符号帳の音
源探索用のターゲット信号を時間逆順化し、それを聴感
重み付きLPC合成し、その出力信号を再度時間逆順化
して、確率的符号帳の音源探索用ターゲット信号の時間
逆合成出力を得て、比較部B122へ出力する。
トルを格納しており、これらのコードベクトルは、聴感
重み付けLPC合成部B121、比較部B122、適応
符号帳更新部124により、確率的コードベクトルとし
て参照される。
率的符号帳120から読み出した確率的コードベクトル
に対し、LPC分析部112から得たインパルス応答を
係数に持つ聴感重み付けLPC合成フィルタで合成し、
その合成信号を比較部B122へ出力する。
に、まず、確率的符号帳120より直接読み出したi番
目の確率的コードベクトルV(i,n)と、聴感重み付けLP
C逆順合成部B119で求めたターゲット信号の時間逆
合成出力r(n)との内積の2乗値を求め、次に、聴感重み
付けLPC合成部B121より受けた合成信号S(i,n)の
パワを計算し、そして上記内積の2乗値をこのパワで割
算することによって確率的符号帳探索の基準値std(i)を
求め、その基準値が最も大きくなるときに読み出した確
率的コードベクトルの番号を表すインデクスと、その確
率的コードベクトルに乗じる最適ゲインを算出して、パ
ラメータ符号化部123へ出力する。この一連の処理を
確率的符号帳の探索という。
ら得られた適応コードベクトルに乗じる最適ゲインと、
比較部B122で得られた確率的コードベクトルに乗じ
る最適ゲインの符号化を行って、適応符号帳の符号化ゲ
インと確率的符号帳の符号化ゲインをそれぞれ得、次
に、得られた適応符号帳の符号化ゲインと確率的符号帳
の符号化ゲイン復号化して、適応符号帳の復号化ゲイン
と確率的符号帳の復号化ゲインををそれぞれ得、さら
に、適応符号帳の符号化ゲイン、確率的符号帳の符号化
ゲイン、適応符号帳のインデクス、確率的符号帳のイン
デクス、LPC符号を伝送部125へ出力し、適応符号
帳の復号化ゲイン、確率的符号帳の復号化ゲイン、適応
符号帳のインデクス、確率的符号帳のインデクスを適応
符号帳更新部124へ出力する。
号化部123からの入力を受けて、まず、適応符号帳の
インデクスに基づいた適応コードベクトルを適応符号帳
115から読みだし、読み出した適応コードベクトルに
適応符号帳の復号化ゲインを乗じて駆動音源適応符号帳
成分を得、次に、確率的符号帳のインデクスに基づいた
確率的コードベクトルを確率的符号帳120から読みだ
し、読み出した確率的コードベクトルに確率的符号帳の
復号化ゲインを乗じて駆動音源確率的符号帳成分を得、
駆動音源適応符号帳成分と駆動音源確率的符号帳成分を
加算して駆動音源を得、得られた駆動音源を適応符号帳
115へ出力する。ここで、適応符号帳115内の古い
コードベクトルは、適応符号帳更新部124から入力さ
れた上記駆動音源で更新される。
は、雑音符号帳や代数的符号帳("8KBIT/S ACELP CODIN
G OF SPEECH WITH 10 MS SPEECH-FRAME : A CANDIDATE
FORCCITT STANDARDIZATION":R.Salami, C.Laflamme, J
-P.Adoul,ICASSP'94,pp.II-97〜II-100, 1994に記載さ
れている)などがある。それぞれを簡単に説明する。
乱数から作成したランダム数列を格納したものである。
コードブックの性質がランダムなので、質の高い合成音
を得ることができる。しかし、全コードベクトルをあら
かじめ格納しておけなければならないので、大きなRO
M容量が必要となる。また、符号帳探索は、全てのコー
ドベクトルに対して聴感重み付けLPC合成を行うこと
になるので、多くの計算量を必要としてしまう。
は、大きさが1(振幅は、+1か−1)の4本のパルス
で構成され、それぞれのパルスの位置はインデクスの演
算により決定されることを特徴としている。したがっ
て、符号帳用のROMを必要としない。しかし、少数の
パルスで構成されることから、合成音(特に無声部)の
音質が悪くなってしまう。そして代数的符号帳の最大の
特徴は、少量の計算量で符号帳探索ができるということ
である。代数的符号帳における上記最大の特徴は、V(i,
n)中には大きさ1のパルスが4本しか存在していないの
で、(数1)の分子を、r(n)中の4サンプルの値を加算
し(加算:3回)、その加算結果を2乗(乗算:1回)
することで計算できることと、前もって求めておいた聴
感重み付けLPC合成フィルタのインパルス応答の自己
相関行列をRAMに格納しておくと、(数1)の分母
を、たかだか15回の加算(4重ループの性質や自己相
関行列の対称性を利用すると、実際の計算量はさらに少
なくなる。)によって計算することができることによる
ものである。
と、ランダムな性質を持つ音源で聴感重み付けLPC合
成フィルタを駆動できるので合成音の音質は高くなる
が、(数1)の分子および分母の計算量が多くなるので
符号帳探索の計算量が多くなってしまい、また、全コー
ドベクトルをあらかじめ格納しておくためにROM容量
が大きくなってしまう。
の分子および分母の計算量が少なくなるので符号帳探索
の計算量が少なくなり、コードベクトルをそのまま格納
する必要がないのでROM容量が小さくなるが、少数本
のパルスによって聴感重み付けLPC合成フィルタを駆
動することになるため合成音(特に無声部)の音質が悪
くなってしまう。
なく、ROM容量が小さく、良好な合成音を提供するこ
とが可能であるという有利な作用を併せ持つ復号化装置
およびその方法を提供することを目的とする。
に本発明の音声復号化装置は、適応符号ベクトルを生成
する適応符号帳と、確率的符号ベクトルを生成する確率
的符号帳と、前記適応符号ベクトルと前記確率的符号ベ
クトルとを入力してLPC合成する合成フィルタとを有
し、前記確率的符号帳は、音源ベクトルを供給する音源
ベクトル供給手段と、 拡散ベクトルを格納する手段
と、格納された前記拡散ベクトルと前記音源ベクトルと
を畳み込んで、拡散音源ベクトルを出力する畳み込み手
段とを有し、前記音源ベクトル供給手段は、代数的符号
帳が生成するコードベクトルと同じベクトルを供給す
る。これにより合成音(特に無声部)の音質に優れ、R
OM容量の小さい復号化装置を得ることができる。
号帳が、音源ベクトルを供給する音源ベクトル供給手段
と、 拡散ベクトルを格納する手段と、格納された前記
拡散ベクトルと前記音源ベクトルとを畳み込んで、拡散
音源ベクトルを出力する畳み込み手段とを有し、前記音
源ベクトル供給手段は、代数的符号帳が生成するコード
ベクトルと同じベクトルを供給するCELP型音声復号
化装置である。
いて、図1から図4を用いて説明する。
図1と図2を用いて説明する。
部のブロック図を示す。図1において、1は音源情報格
納部、2は拡散ベクトル格納部、3は畳み込み部であ
る。音源情報格納部1は、例えば代数的符号帳と同じコ
ードベクトルの生成情報等の音源情報を格納し、その音
源情報を音源ベクトルとして出力する。拡散ベクトル格
納部2は、例えばランダム数列等の拡散情報を格納し、
その拡散情報を拡散ベクトルとして出力する。畳み込み
部3は音源ベクトルと拡散ベクトルを入力して畳み込み
を行い、拡散音源ベクトルとして出力する。
従来の確率的符号帳部に代えて用いたCELP型の音声
復号化装置を示す。音源情報格納部1は代数的符号帳と
同じコードベクトルの生成情報を格納し、拡散ベクトル
格納部2はランダム数列を拡散ベクトルとして格納して
いる。パラメータ復号化部4は、まず、符号化装置が生
成した音声符号(LPC符号、拡散音源インデクス、拡
散音源ベクトルの符号化ゲイン、適応符号帳のインデク
ス、適応符号帳の符号化ゲイン)を伝送部5を通して獲
得し、LPC符号を復号化して復号化LPC係数を得
る。次に拡散音源ベクトルの符号化ゲインを復号化して
拡散音源ベクトルの復号化ゲインを得、適応符号帳の符
号化ゲインを復号化して適応符号帳の復号化ゲインを得
る。更に、拡散音源インデクスを畳み込み部3へ出力
し、適応符号帳のインデクス及び復号化ゲイン、拡散音
源ベクトルの復号化ゲインを駆動音源生成部7へ出力
し、復号化LPC係数をLPC合成部8へ出力する。
スに基づいた音源ベクトルを音源情報格納部1から読み
出し、次に、拡散ベクトル格納部2に格納されている拡
散ベクトルを読み出し、更に、読み出した音源ベクトル
と拡散ベクトルとの畳み込みを行って拡散音源ベクトル
を生成し駆動音源生成部7へ出力する。駆動音源生成部
7は、まず、適応符号帳のインデクスに基づいた適応コ
ードベクトルを適応符号帳6から読み出し、得られた適
応コードベクトルに適応符号帳の復号化ゲインを乗じて
駆動音源適応符号帳成分を得、畳み込み部3より得られ
た拡散音源ベクトルに拡散音源ベクトルの復号化ゲイン
を乗じて駆動音源拡散音源ベクトル成分を得る。次に、
得られた駆動音源適応符号帳成分と駆動音源拡散音源ベ
クトル成分を加算して駆動音源を得、得られた駆動音源
をLPC合成部8と適応符号帳6へ出力する。ここで、
適応符号帳6内の古いコードベクトルは、駆動音源生成
部7から入力された上記駆動音源で更新される。LPC
合成部8は、駆動音源生成部7から入力される駆動音源
に対し、パラメータ復号化部4から得た復号化LPC係
数を持つLPC合成フィルタで合成し、出力音声9を得
る。
格納部2は、ランダム数列を拡散ベクトルとして格納し
ているので、上記駆動音源拡散音源ベクトル成分がラン
ダムな性質をもつことになり、出力音声(特に無声部)
の音質を向上することができる。また、拡散音源ベクト
ルは音源情報格納部1の音源情報と拡散ベクトル格納部
2の拡散ベクトルにより作成できるので、ROM容量は
小さくなっている。
1に代数的符号帳と同じコードベクトルの生成情報を格
納した例で説明したが、その他の符号帳の生成情報もし
くはその他の符号帳自身を格納した場合についても同様
に実施可能である。また、本実施の形態では、拡散ベク
トル格納部2にランダム数列を格納した例で説明した
が、その他の学習により求められた数列、もしくは知見
により求められた数列を用いる場合についても同様に実
施可能である。
置はCELP型としたが、VOCODER型等、その他
の音声復号化装置においても適用が可能である。
説明する。
部のブロック図を示す。図3において、11は拡散ベク
トル格納部、12はディジタルフィルタ、13は畳み込
み部、14は音源情報格納部である。拡散ベクトル格納
部11は、例えばランダム数列等の拡散情報を格納し、
その拡散情報を拡散ベクトルとして出力する。
ィルタリングして出力するとともに、フィルタ自身の特
性を決めるフィルタ情報を出力するもので、図3におい
てはフィルタ情報としてインパルス応答もしくは係数の
出力を示す。音源情報格納部14は、例えば代数的符号
帳と同じコードベクトルの生成情報等の音源情報を格納
し、その音源情報を音源ベクトルとして出力する。
ベクトルとインパルス応答もしくは係数を入力して畳み
込みを行い、新インパルス応答もしくは新係数を出力
し、図3(b)では、図3(a)の機能に加えて、音源
ベクトルと拡散ベクトルを入力して畳み込みを行い、拡
散音源ベクトルとして出力する。
従来の確率的符号帳部に代えて用いたCELP型の音声
符号化装置を示す。音源情報格納部14は代数的符号帳
と同じコードベクトルの生成情報を格納し、拡散ベクト
ル格納部11はランダム数列を拡散ベクトルとして格納
している。15は入力音声で、ディジタルの入力音声デ
ータである。
るあるフレームに対して自己相関分析と線形予測分析を
行うことによってLPC係数を算出し、そのLPC係数
を量子化してLPC符号を得てパラメータ符号化部17
へ出力し、LPC符号を復号化して復号化LPC係数を
得る。次に、ピッチ強調や高域強調などの特性を持つ聴
感重み付けフィルタのインパルス応答を求めて聴感重み
付け部18へ出力するとともに、聴感重み付けLPC合
成フィルタのインパルス応答を求めて、聴感重み付けL
PC逆順合成部A19および聴感重み付けLPC合成部
A20へ出力する。聴感重み付けLPC逆順合成部A1
9と聴感重み付けLPC合成部A20はいずれもディジ
タルフィルタを含む。
対し、サブフレーム毎に聴感重み付けフィルタリングを
行い、その出力結果から聴感重み付けLPC合成フィル
タのゼロ入力応答を差し引いて適応符号帳の音源探索時
に参照するターゲット信号を求め、聴感重み付けLPC
逆順合成部A19および減算部18へ出力する。聴感重
み付けLPC逆順合成部A19は、聴感重み付け部18
から入力されるターゲット信号を時間逆順化し、その逆
順化信号をLPC分析部16より与えられたインパルス
応答を係数に持つ聴感重み付きLPC合成フィルタで合
成し、その出力信号を再度時間逆順化してターゲット信
号の時間逆合成出力を得て比較部A21へ出力する。
により受けた過去の駆動音源を格納しており、その過去
の駆動音源情報は、聴感重み付けLPC合成部A20、
比較部A21、適応符号帳更新部23により、適応コー
ドベクトルとして参照される。聴感重み付けLPC合成
部A20は、まず、適応符号帳22から適応コードベク
トルを読み出し、読み出した適応コードベクトルに対
し、LPC分析部16より得たインパルス応答を係数に
持つ聴感重み付けLPC合成フィルタで合成し、その結
果を比較部A21へ出力する。次に、聴感重み付けLP
C合成フィルタのインパルス応答を畳み込み部13へ出
力する。
ら直接読み出した適応コードベクトルと、聴感重み付け
LPC逆順合成部A19で求めたターゲット信号の時間
逆合成出力との内積の2乗値を求める。次に、聴感重み
付けLPC合成部A20から受けた適応コードベクトル
に聴感重み付けLPC合成を施した信号のパワを求め、
上記内積の2乗値をこのパワで割算することによって適
応コードベクトル探索の基準値を求める。その基準値が
最も大きくなるときに読み出した適応コードベクトルの
インデクスと、その適応コードベクトルに乗じる最適ゲ
インを算出し、減算部24およびパラメータ符号化部1
7へ出力する。
れたターゲット信号から、適応符号帳探索において探索
された適応コードベクトルを聴感重み付けLPC合成
し、合成信号に比較部A21で求めた適応符号帳の最適
ゲインを乗じて得られた信号を減算する。その減算結果
を、拡散音源ベクトルの探索の際に参照するターゲット
信号として聴感重み付けLPC逆順合成部B25へ出力
する。
を格納している。畳み込み部13は、聴感重み付けLP
C合成部A20から受けた聴感重み付けLPC合成フィ
ルタのインパルス応答と拡散ベクトル格納部11から読
み出した拡散ベクトルとの畳み込み演算を行い、その演
算結果を新インパルス応答として、聴感重み付けLPC
逆順合成部B25と聴感重み付けLPC合成部B26へ
出力する。聴感重み付けLPC逆順合成部B25と聴感
重み付けLPC合成部B26はいずれもディジタルフィ
ルタを含む。
減算部24で生成された拡散音源ベクトル探索時のター
ゲット信号を時間逆順化し、その逆順化した信号を、畳
み込み部13から得た新インパルス応答を係数に持つ聴
感重み付けLPC合成フィルタで合成する。その出力信
号を再度時間逆順化し、ターゲット信号の時間逆合成出
力として比較部B27へ出力する。
じコードベクトルの生成情報を格納しているので、少数
(ここでは4本)のパルスよりなるコードベクトルを生
成することができる。生成したコードベクトルは、聴感
重み付けLPC合成部B26、比較部B27、畳み込み
部13により、音源ベクトルとして参照される。聴感重
み付けLPC合成部B26は、音源情報格納部14より
読み出した音源ベクトルに対し、畳み込み部13から得
た新インパルス応答を係数に持つ聴感重み付けLPC合
成フィルタで合成し、その合成信号の自己相関行列を求
めて比較部B27へ出力する。
4より直接読み出した音源ベクトルと、聴感重み付けL
PC逆順合成部B25で求めたターゲット信号の時間逆
合成出力との内積の2乗値を求める。次に、聴感重み付
けLPC合成部B26より受けた自己相関行列を参照し
て、音源ベクトルに聴感重み付けLPC合成を施した信
号のパワを求め、そして上記内積の2乗値をこのパワで
割算することによって拡散音源ベクトル探索の基準値を
求める。その基準値が最も大きくなるときに読み出した
音源ベクトルの番号を表す拡散音源インデクスと、その
拡散音源ベクトルに乗じる最適ゲインを算出して、パラ
メータ符号化部17へ出力する。
A21で得られた適応コードベクトルに乗じる最適ゲイ
ンと、比較部B27で得られた拡散音源ベクトルに乗じ
る最適ゲインの符号化を行って、適応符号帳の符号化ゲ
インと拡散音源ベクトルの符号化ゲインをそれぞれ得
る。次に、得られた適応符号帳の符号化ゲインと拡散音
源ベクトルの符号化ゲインを復号化して、適応符号帳の
復号化ゲインと拡散音源ベクトルの復号化ゲインをそれ
ぞれ得る。更に、適応符号帳の符号化ゲイン、拡散音源
ベクトルの符号化ゲイン、LPC符号、適応符号帳のイ
ンデクス、拡散音源インデクスを伝送部28へ出力し、
適応符号帳の復号化ゲインと、適応符号帳のインデクス
とを適応符号帳更新部23へ出力し、拡散音源ベクトル
の復号化ゲイン、拡散音源インデクスを畳み込み部13
へ出力する。
クスに基づいた音源ベクトルを音源情報格納部14から
読み出し、次に、拡散ベクトル格納部11に格納されて
いる拡散ベクトルを読み出す。次に、読み出した音源ベ
クトルと拡散ベクトルとの畳み込み演算を行って拡散音
源ベクトルを生成し、拡散音源ベクトルに復号化ゲイン
を乗じて駆動音源拡散音源ベクトル成分を得て適応符号
帳更新部23へ出力する。適応符号帳更新部23は、ま
ず、パラメータ符号化部17から受けた適応符号帳のイ
ンデクスに基づいた適応コードベクトルを適応符号帳2
2から読み出し、得られた適応コードベクトルに適応符
号帳の復号化ゲインを乗じて駆動音源適応符号帳成分を
得る。次に、得られた駆動音源適応符号帳成分と畳み込
み部13から入力された駆動音源拡散音源ベクトル成分
を加算して駆動音源を生成し、生成した駆動音源を適応
符号帳22へ出力する。ここで、適応符号帳22内の古
いコードベクトルは、適応符号帳更新部23から入力さ
れた上記駆動音源で更新される。
14に代数的符号帳と同じコードベクトルの生成情報を
格納した例で説明したが、その他の符号帳の生成情報も
しくはその他の符号帳自身を格納した場合についても同
様に実施可能である。また、本実施の形態では、拡散ベ
クトル格納部11にランダム数列を格納した例で説明し
たが、その他の学習により求められた数列、もしくは知
見により求められた数列を用いる場合についても同様に
実施可能である。
置はCELP型としたが、VOCODER型等、その他
の音声符号化装置においても適用が可能である。
索のための計算量が少なくて済むとともに、ROM容量
が小さくて済み、更に良好な合成音を提供できるという
有利な効果が得られる。
主要部を示すブロック図
復号化装置を示すブロック図
示すブロック図 (b)参考例による音声符号化装置の主要部を示すブロ
ック図
すブロック図
ク図
ク図
Claims (2)
- 【請求項1】 適応符号ベクトルを生成する適応符号帳
と、確率的符号ベクトルを生成する確率的符号帳と、前
記適応符号ベクトルと前記確率的符号ベクトルとを入力
してLPC合成する合成フィルタとを有する音声復号化
装置であって、 前記確率的符号帳は、音源ベクトルを供給する音源ベク
トル供給手段と、 拡散ベクトルを格納する手段と、格
納された前記拡散ベクトルと前記音源ベクトルとを畳み
込んで、拡散音源ベクトルを出力する畳み込み手段とを
有し、前記音源ベクトル供給手段は、代数的符号帳が生
成するコードベクトルと同じベクトルを供給するCEL
P型音声復号化装置。 - 【請求項2】 適応符号ベクトルを生成する段階と、確
率的符号ベクトルを生成する段階と、前記適応符号ベク
トルと前記確率的符号ベクトルとを合成する段階とを有
するCELP型音声復号化方法であって、 前記確率的符号ベクトルを生成する段階は、音源ベクト
ルを供給する段階と、拡散ベクトルを格納する段階と、
格納された前記拡散ベクトルと前記音源ベクトルとを畳
み込んで拡散音源ベクトルを出力する段階と有し、音源
ベクトルを供給する段階では、代数的符号帳が生成する
コードベクトルと同じベクトルを音源ベクトルとして供
給するCELP型音声復号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000113780A JP3174782B2 (ja) | 1996-08-22 | 2000-04-14 | Celp型音声復号化装置及びcelp型音声復号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000113780A JP3174782B2 (ja) | 1996-08-22 | 2000-04-14 | Celp型音声復号化装置及びcelp型音声復号化方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP22094896A Division JP3174733B2 (ja) | 1996-08-22 | 1996-08-22 | Celp型音声復号化装置、およびcelp型音声復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000347700A true JP2000347700A (ja) | 2000-12-15 |
JP3174782B2 JP3174782B2 (ja) | 2001-06-11 |
Family
ID=18625696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000113780A Expired - Lifetime JP3174782B2 (ja) | 1996-08-22 | 2000-04-14 | Celp型音声復号化装置及びcelp型音声復号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3174782B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003071522A1 (fr) * | 2002-02-20 | 2003-08-28 | Matsushita Electric Industrial Co., Ltd. | Procede de production de vecteur de source sonore fixe et table de codage de source sonore fixe |
-
2000
- 2000-04-14 JP JP2000113780A patent/JP3174782B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003071522A1 (fr) * | 2002-02-20 | 2003-08-28 | Matsushita Electric Industrial Co., Ltd. | Procede de production de vecteur de source sonore fixe et table de codage de source sonore fixe |
US7580834B2 (en) | 2002-02-20 | 2009-08-25 | Panasonic Corporation | Fixed sound source vector generation method and fixed sound source codebook |
Also Published As
Publication number | Publication date |
---|---|
JP3174782B2 (ja) | 2001-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JPH0990995A (ja) | 音声符号化装置 | |
US7047188B2 (en) | Method and apparatus for improvement coding of the subframe gain in a speech coding system | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3174733B2 (ja) | Celp型音声復号化装置、およびcelp型音声復号化方法 | |
JP3095133B2 (ja) | 音響信号符号化方法 | |
JPH05265496A (ja) | 複数のコードブックを有する音声符号化方法 | |
JP2538450B2 (ja) | 音声の励振信号符号化・復号化方法 | |
JP3174779B2 (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 | |
JPH08292797A (ja) | 音声符号化装置 | |
JP3174782B2 (ja) | Celp型音声復号化装置及びcelp型音声復号化方法 | |
JP3174780B2 (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 | |
JP3174783B2 (ja) | Celp型音声符号化装置及びcelp型音声符号化方法 | |
JP3174781B2 (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 | |
JP3174756B2 (ja) | 音源ベクトル生成装置及び音源ベクトル生成方法 | |
JPH07168596A (ja) | 音声符号化装置 | |
JPH0519796A (ja) | 音声の励振信号符号化・復号化方法 | |
JP2000148195A (ja) | 音声符号化装置 | |
JP3024467B2 (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP2000029499A (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JP3230380B2 (ja) | 音声符号化装置 | |
JP3276358B2 (ja) | Celp型音声符号化装置及びcelp型音声符号化方法 | |
JP2808841B2 (ja) | 音声符号化方式 | |
JP2001134298A (ja) | 音声符号化装置と音声復号化装置、及び音声符号化復号化システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080330 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090330 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100330 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120330 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130330 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130330 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140330 Year of fee payment: 13 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |