JPH05289700A - 音声符号化装置 - Google Patents
音声符号化装置Info
- Publication number
- JPH05289700A JPH05289700A JP4088632A JP8863292A JPH05289700A JP H05289700 A JPH05289700 A JP H05289700A JP 4088632 A JP4088632 A JP 4088632A JP 8863292 A JP8863292 A JP 8863292A JP H05289700 A JPH05289700 A JP H05289700A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- vector
- signal
- frame
- pitch period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Abstract
(57)【要約】
【目的】本発明は、時系列に変化するピッチ周期長さに
サブフレームの長さを対応させることにより、高品質な
音声符号化装置を提供することを目的とする。 【構成】本発明は、入力音声信号が所定区間に分割され
たフレームをピッチ予測器50でそのクレーム区間のピ
ッチ周期を予測し、そのピッチ周期の長さのサブフレー
ムに分割し、これより出力された駆動信号ベクトルに所
定範囲の遅延量を与え、ピッチ周期遅延器55で最適コ
ードブック47を生成する。さらに最適コードブック4
7からの各駆動信号ベクトルに任意のピッチ予測ゲイン
を可変した後、現サブフレームのコードベクトルに加算
して合成駆動ベクトルを生成し、LPC合成フィルタ5
2により再生信号を生成し、その再生信号を目標ベクト
ルで減算して誤差を評価器54で評価し、誤差電力が最
小になる合成信号を再生する音声符号化装置である。
サブフレームの長さを対応させることにより、高品質な
音声符号化装置を提供することを目的とする。 【構成】本発明は、入力音声信号が所定区間に分割され
たフレームをピッチ予測器50でそのクレーム区間のピ
ッチ周期を予測し、そのピッチ周期の長さのサブフレー
ムに分割し、これより出力された駆動信号ベクトルに所
定範囲の遅延量を与え、ピッチ周期遅延器55で最適コ
ードブック47を生成する。さらに最適コードブック4
7からの各駆動信号ベクトルに任意のピッチ予測ゲイン
を可変した後、現サブフレームのコードベクトルに加算
して合成駆動ベクトルを生成し、LPC合成フィルタ5
2により再生信号を生成し、その再生信号を目標ベクト
ルで減算して誤差を評価器54で評価し、誤差電力が最
小になる合成信号を再生する音声符号化装置である。
Description
【0001】
【産業上の利用分野】本発明は音声符号化方法に係り、
特にベクトル量子化を用いて音声信号の情報圧縮を行う
高能率な音声符号化方法及びその装置に関する。
特にベクトル量子化を用いて音声信号の情報圧縮を行う
高能率な音声符号化方法及びその装置に関する。
【0002】
【従来の技術】一般に、音声等を情報として伝達する場
合に、音声信号を符号化して、情報圧縮を行い、高能率
的に伝達する技術がある。例えば、音声符号化方式の1
つにCELP(Code Excited Linear Prediction)があ
る。前記CELPについては、M.R.Schroeder ,B.S.Ata
l," Code-excited-linear prediction (CELP):highqua-
lity speech at very low bit rates",ICASSP,pp 937-9
40,1985 に記載される。図5のブロック図に簡略的な構
成を示し、前記CELPについて説明する。このCEL
Pにおいては、コードブック1に、N次元の白色雑音を
用いて生成した2m パターンのベクトルが予め格納され
ている。前記コードブック1から読出された前記ベクト
ルは、乗算器2でゲインを乗算され、ピッチ予測器3及
び線形予測器4を通して、合成信号を生成する。
合に、音声信号を符号化して、情報圧縮を行い、高能率
的に伝達する技術がある。例えば、音声符号化方式の1
つにCELP(Code Excited Linear Prediction)があ
る。前記CELPについては、M.R.Schroeder ,B.S.Ata
l," Code-excited-linear prediction (CELP):highqua-
lity speech at very low bit rates",ICASSP,pp 937-9
40,1985 に記載される。図5のブロック図に簡略的な構
成を示し、前記CELPについて説明する。このCEL
Pにおいては、コードブック1に、N次元の白色雑音を
用いて生成した2m パターンのベクトルが予め格納され
ている。前記コードブック1から読出された前記ベクト
ルは、乗算器2でゲインを乗算され、ピッチ予測器3及
び線形予測器4を通して、合成信号を生成する。
【0003】この合成信号は、差分器5において、端子
6から入力する1フレームつまりNサンプルのディジタ
ル音声信号と比較し、その誤差が評価器7で評価され
る。前記評価器7は、入力音声信号と合成信号との誤差
電力を最小とするコードブックベクトルを探索する。そ
して、前記乗算器2のゲイン及び、前記ピッチ予測器3
のピッチ予測ゲインが、前記評価器7における誤差電力
が最小となるように可変される。
6から入力する1フレームつまりNサンプルのディジタ
ル音声信号と比較し、その誤差が評価器7で評価され
る。前記評価器7は、入力音声信号と合成信号との誤差
電力を最小とするコードブックベクトルを探索する。そ
して、前記乗算器2のゲイン及び、前記ピッチ予測器3
のピッチ予測ゲインが、前記評価器7における誤差電力
が最小となるように可変される。
【0004】前記線形予測器4の伝達関数は線形予測分
析により決定され、マルチプレクサ8では、コードブッ
ク1で決定されたコードと、前記乗算器2のゲインと、
前記ピッチ予測器3で決定されたピッチ周期及びピッチ
予測ゲインと、前記線形予測器4で決定された係数を多
重化し記憶、伝送する。
析により決定され、マルチプレクサ8では、コードブッ
ク1で決定されたコードと、前記乗算器2のゲインと、
前記ピッチ予測器3で決定されたピッチ周期及びピッチ
予測ゲインと、前記線形予測器4で決定された係数を多
重化し記憶、伝送する。
【0005】この多重化された信号は、デマルチプレク
サ9で分割され、それぞれの信号がコードブック10、
乗算器11、ピッチ予測器12、線形予測器13に送ら
れる。前記コードブック10は、前記コードブック1と
同一構造であり、ここから指定されたベクトルが読出さ
れ、乗算器11でゲインを乗算され、ピッチ予測器12
及び線形予測器13を介して、再生信号が端子14より
出力される。
サ9で分割され、それぞれの信号がコードブック10、
乗算器11、ピッチ予測器12、線形予測器13に送ら
れる。前記コードブック10は、前記コードブック1と
同一構造であり、ここから指定されたベクトルが読出さ
れ、乗算器11でゲインを乗算され、ピッチ予測器12
及び線形予測器13を介して、再生信号が端子14より
出力される。
【0006】また、図5に示した前記ピッチ予測器12
には、適応コードブックを用いた方式が知られている。
この方式については、W.B.Kleijin,D.J.Krasinski,R.H.
Ke-tchum,"Impr-oved Speech Quality and Efficient V
ector Quantization in SELP",ICASSP,pp155-158,1988に記載されている。図6
のブロック図には、適応コードブックベクトルを用いた
CELP方式の概略的な構成を示し説明する。
には、適応コードブックを用いた方式が知られている。
この方式については、W.B.Kleijin,D.J.Krasinski,R.H.
Ke-tchum,"Impr-oved Speech Quality and Efficient V
ector Quantization in SELP",ICASSP,pp155-158,1988に記載されている。図6
のブロック図には、適応コードブックベクトルを用いた
CELP方式の概略的な構成を示し説明する。
【0007】同図において、端子21から入力した1フ
レーム分の入力音声信号の入力ベクトルは、前フレーム
履歴部22からの前フレーム履歴を入力し差分器23よ
り前フレームの影響を除き、目標ベクトルとされる。そ
して適応コードブック24は、先行フレームの合成フィ
ルタ駆動信号ベクトルがピッチ探索範囲aからbに渡っ
て可変するピッチ周期遅延器25を通り、ピッチ周期j
に対する駆動信号ベクトルを生成することにより、作成
される。
レーム分の入力音声信号の入力ベクトルは、前フレーム
履歴部22からの前フレーム履歴を入力し差分器23よ
り前フレームの影響を除き、目標ベクトルとされる。そ
して適応コードブック24は、先行フレームの合成フィ
ルタ駆動信号ベクトルがピッチ探索範囲aからbに渡っ
て可変するピッチ周期遅延器25を通り、ピッチ周期j
に対する駆動信号ベクトルを生成することにより、作成
される。
【0008】コードブック26から読出されたベクトル
に乗算器27でゲインを乗算して得られるコードブック
ベクトルと、前記適応コードブック24から読出された
ベクトルに乗算器28でピッチ予測ゲインを乗算して得
られるピッチ予測ベクトルとを加算器29に供給し、合
成駆動ベクトルを得る。この合成駆動ベクトルをLPC
合成フィルタ30に入力し、その出力を再生ベクトルと
する。この再生ベクトルと目標ベクトルとを減算器31
で減算し、誤差を評価器32で評価する。この時、評価
器32では、(1)式に示す誤差電力Ej を最小とする
ベクトルを探索する。
に乗算器27でゲインを乗算して得られるコードブック
ベクトルと、前記適応コードブック24から読出された
ベクトルに乗算器28でピッチ予測ゲインを乗算して得
られるピッチ予測ベクトルとを加算器29に供給し、合
成駆動ベクトルを得る。この合成駆動ベクトルをLPC
合成フィルタ30に入力し、その出力を再生ベクトルと
する。この再生ベクトルと目標ベクトルとを減算器31
で減算し、誤差を評価器32で評価する。この時、評価
器32では、(1)式に示す誤差電力Ej を最小とする
ベクトルを探索する。
【0009】
【数1】
【0010】ここで、Xt は目標ベクトル、Pi はコー
ドブックのi番目のベクトル、bi はi番目のベクトル
に対する最適なゲインパラメータ、Cj はピッチ周期j
の時の適応ブックのベクトル、gj はピッチ周期jに対
する最適なピッチ予測ゲイン、HはLPC合成フィルタ
30のインパルス応答行列である。
ドブックのi番目のベクトル、bi はi番目のベクトル
に対する最適なゲインパラメータ、Cj はピッチ周期j
の時の適応ブックのベクトル、gj はピッチ周期jに対
する最適なピッチ予測ゲイン、HはLPC合成フィルタ
30のインパルス応答行列である。
【0011】
【発明が解決しようとする課題】前述したCELP方式
は、1フレームを予め定められた長さで複数個のサブフ
レームに分割し、サブフレーム毎にピッチ周期長さ、ピ
ッチ周期ゲイン、コードベクトルを求めている。
は、1フレームを予め定められた長さで複数個のサブフ
レームに分割し、サブフレーム毎にピッチ周期長さ、ピ
ッチ周期ゲイン、コードベクトルを求めている。
【0012】しかしながら、音声信号のピッチ周期の長
さは個人差が大きく、しかも時系列的に変動しやすい時
変パラメータであるため、固定された長さのサブフレー
ムでは、サブフレーム内のピッチ周期長さの変動に対応
することが出来ず、ピッチ予測ゲインを劣化させ、音質
を損なう問題がある。
さは個人差が大きく、しかも時系列的に変動しやすい時
変パラメータであるため、固定された長さのサブフレー
ムでは、サブフレーム内のピッチ周期長さの変動に対応
することが出来ず、ピッチ予測ゲインを劣化させ、音質
を損なう問題がある。
【0013】そこで本発明は、時系列に変化する音声信
号のピッチ周期の長さにサブフレームの長さを対応させ
ることにより、高品質な音声符号化を行うことのできる
音声符号化装置を提供することを目的とする。
号のピッチ周期の長さにサブフレームの長さを対応させ
ることにより、高品質な音声符号化を行うことのできる
音声符号化装置を提供することを目的とする。
【0014】
【課題を解決するための手段】本発明は上記目的を達成
するために、入力音声信号を予め定められたフレーム区
間に分割するフレーム分割手段と、前記フレーム分割手
段からのフレーム区間の前フレーム履歴を減算し、目標
ベクトルを生成する目標ベクトル生成手段と、音声信号
が少なくとも1つ含まれるピッチ周期を予測し、前記フ
レームを該ピッチ周期のサブフレームに分割するピッチ
予測手段と、前記ピッチ予測手段から出力された前記ピ
ッチ周期の遅延を先行サブフレームの駆動信号ベクトル
に与え、最適コードブックを生成する最適コードブック
生成手段と、前記最適コードブック生成手段からの各駆
動信号ベクトルに任意のピッチ予測ゲインを可変した
後、現サブフレームのコードベクトルに加算して合成駆
動ベクトルを生成し、フィルタ演算により再生信号を生
成する再生信号生成手段と、前記再生信号生成手段から
の再生信号を前記目標ベクトルで減算して誤差を評価
し、誤差電力が最小になる合成信号を再生するピッチ周
期補正手段とで構成される音声符号化装置を提供する。
するために、入力音声信号を予め定められたフレーム区
間に分割するフレーム分割手段と、前記フレーム分割手
段からのフレーム区間の前フレーム履歴を減算し、目標
ベクトルを生成する目標ベクトル生成手段と、音声信号
が少なくとも1つ含まれるピッチ周期を予測し、前記フ
レームを該ピッチ周期のサブフレームに分割するピッチ
予測手段と、前記ピッチ予測手段から出力された前記ピ
ッチ周期の遅延を先行サブフレームの駆動信号ベクトル
に与え、最適コードブックを生成する最適コードブック
生成手段と、前記最適コードブック生成手段からの各駆
動信号ベクトルに任意のピッチ予測ゲインを可変した
後、現サブフレームのコードベクトルに加算して合成駆
動ベクトルを生成し、フィルタ演算により再生信号を生
成する再生信号生成手段と、前記再生信号生成手段から
の再生信号を前記目標ベクトルで減算して誤差を評価
し、誤差電力が最小になる合成信号を再生するピッチ周
期補正手段とで構成される音声符号化装置を提供する。
【0015】
【作用】以上のような構成の音声符号化装置により、音
声信号のベクトルをフィルタ演算により再生して得た再
生信号と入力音声信号との誤差を評価し、最も誤差電力
が小さくなるベクトルが探索され、前記入力音声信号が
符号化される。
声信号のベクトルをフィルタ演算により再生して得た再
生信号と入力音声信号との誤差を評価し、最も誤差電力
が小さくなるベクトルが探索され、前記入力音声信号が
符号化される。
【0016】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
に説明する。
【0017】図1には、本発明による第1実施例として
の音声符号化装置の構成を示し説明する。この音声符号
化装置においては、端子41から入力する予め定められ
た長さの1フレームの入力音声信号の入力ベクトルは、
差分器43で前フレーム履歴部42から出力される前フ
レーム履歴で減算することによって、前フレームの影響
を除いて、目標ベクトルとされる。この目標ベクトル
は、LPC分析器44に入力され、自己相関法等を用い
て、目標ベクトルの線形予測分析を行い、線形予測パラ
メータを抽出する。このパラメータは、LPC合成フィ
ルタ52で利用される。
の音声符号化装置の構成を示し説明する。この音声符号
化装置においては、端子41から入力する予め定められ
た長さの1フレームの入力音声信号の入力ベクトルは、
差分器43で前フレーム履歴部42から出力される前フ
レーム履歴で減算することによって、前フレームの影響
を除いて、目標ベクトルとされる。この目標ベクトル
は、LPC分析器44に入力され、自己相関法等を用い
て、目標ベクトルの線形予測分析を行い、線形予測パラ
メータを抽出する。このパラメータは、LPC合成フィ
ルタ52で利用される。
【0018】前記フレームはさらにピッチ予測器50に
より、複数のサブフレームに分割され、サブフレーム毎
にコードベクトル、ゲイン、ピッチ周期、ピッチ予測ゲ
インが更新される。これらの最適値は、以下の手順によ
り決定される。
より、複数のサブフレームに分割され、サブフレーム毎
にコードベクトル、ゲイン、ピッチ周期、ピッチ予測ゲ
インが更新される。これらの最適値は、以下の手順によ
り決定される。
【0019】まず、ピッチ周期遅延器55において先行
サブフレームの駆動信号ベクトルに所定範囲の遅延量で
あるピッチ周期を可変して与え適応コードブック47を
作成する。
サブフレームの駆動信号ベクトルに所定範囲の遅延量で
あるピッチ周期を可変して与え適応コードブック47を
作成する。
【0020】それぞれのピッチ周期に対応するベクトル
に任意のピッチ予測ゲインを可変して、乗算器48にて
乗算し、これをピッチ予測ベクトルとした後、現サブフ
レームのコードベクトルに加算器49で加算して合成駆
動ベクトルとされる。これを目標ベクトルから減算器5
3で減算して誤差を評価器54で評価し、誤差電力が最
小になる合成信号を再生する。コードベクトルは、コー
ドブック45より読出されたベクトルにゲインを乗じた
ものである。このときの具体的な評価式は以下のように
なる。
に任意のピッチ予測ゲインを可変して、乗算器48にて
乗算し、これをピッチ予測ベクトルとした後、現サブフ
レームのコードベクトルに加算器49で加算して合成駆
動ベクトルとされる。これを目標ベクトルから減算器5
3で減算して誤差を評価器54で評価し、誤差電力が最
小になる合成信号を再生する。コードベクトルは、コー
ドブック45より読出されたベクトルにゲインを乗じた
ものである。このときの具体的な評価式は以下のように
なる。
【0021】目標ベクトルのサンブル出力をp(n)、
i番目のコードブックのベクトルをLPC合成フィルタ
52に通したときのサンプル出力をgi(n)とする
と、誤差電力Eとiに対するゲインνは、次式で表され
る。
i番目のコードブックのベクトルをLPC合成フィルタ
52に通したときのサンプル出力をgi(n)とする
と、誤差電力Eとiに対するゲインνは、次式で表され
る。
【0022】
【数2】
【0023】また、ピッチ予測ゲインも同様の評価方法
で求める。このときは、コードベクトルの値を“0”と
し、ピッチ予測ベクトルのみにより入力信号を同定する
ことにより求める。具体的な評価式は、(2)式,
(3)式において、iをピッチ周期、gi(n)をピッ
チ周期iに対する適応コードブックのベクトルをLPC
合成フィルタ52に通したときのサンプル出力、νをピ
ッチ予測ゲインに置き換えて用いている。
で求める。このときは、コードベクトルの値を“0”と
し、ピッチ予測ベクトルのみにより入力信号を同定する
ことにより求める。具体的な評価式は、(2)式,
(3)式において、iをピッチ周期、gi(n)をピッ
チ周期iに対する適応コードブックのベクトルをLPC
合成フィルタ52に通したときのサンプル出力、νをピ
ッチ予測ゲインに置き換えて用いている。
【0024】次に、1フレームを複数個のサブフレーム
に分割する方式を説明する。図1において、ピッチ予測
器50でピッチ周期を予測する。ピッチ周期を予測する
方法においては、例えば、LPC分析器44で得られる
予測残差信号の周期性を検出することにより予測する。
このピッチ予測器50で予測されたピッチ周期をピッチ
周期遅延器55に入力し、先行サブフレームの駆動信号
ベクトルに与える。
に分割する方式を説明する。図1において、ピッチ予測
器50でピッチ周期を予測する。ピッチ周期を予測する
方法においては、例えば、LPC分析器44で得られる
予測残差信号の周期性を検出することにより予測する。
このピッチ予測器50で予測されたピッチ周期をピッチ
周期遅延器55に入力し、先行サブフレームの駆動信号
ベクトルに与える。
【0025】この駆動信号ベクトルに対する最適なピッ
チ予測ゲインを前述した方法により求める。ピッチ予測
ゲイン判定器51では、閾値を予め設定しておき、その
ピッチ予測ゲインと前記閾値との大小を比較する。この
比較により、ピッチ予測ゲインが閾値より大きい場合に
は、図3に示すようにフレームをそのピッチ周期P´毎
のサブフレームに分割する。この分割には、1つ前のフ
レームの最後のサブフレームの分割点Psを記憶してお
き、Psからピッチ周期P´だけ、ずらしながら、サブ
フレームに分割していく。ピッチ予測ゲインが閾値より
小さい場合には、予め、決められた長さ、例えば、5m
secのサブフレームに分割する。その時も同様に、1
つ前のフレームの最後のサブフレームの分割点を記憶し
ておき、この点から予め定められた長さだけ、ずらしな
がらサブフレームに分割する。また、コードブックの次
元数は、サブフレーム長に対応して可変する。これは、
オーバーラップコードブックと称される方法を用いるこ
とにより実現される。前記オーバーラップコードブック
については、中田和男著「音声の高能率符号化」(森北
出版)に詳しく述べられている。
チ予測ゲインを前述した方法により求める。ピッチ予測
ゲイン判定器51では、閾値を予め設定しておき、その
ピッチ予測ゲインと前記閾値との大小を比較する。この
比較により、ピッチ予測ゲインが閾値より大きい場合に
は、図3に示すようにフレームをそのピッチ周期P´毎
のサブフレームに分割する。この分割には、1つ前のフ
レームの最後のサブフレームの分割点Psを記憶してお
き、Psからピッチ周期P´だけ、ずらしながら、サブ
フレームに分割していく。ピッチ予測ゲインが閾値より
小さい場合には、予め、決められた長さ、例えば、5m
secのサブフレームに分割する。その時も同様に、1
つ前のフレームの最後のサブフレームの分割点を記憶し
ておき、この点から予め定められた長さだけ、ずらしな
がらサブフレームに分割する。また、コードブックの次
元数は、サブフレーム長に対応して可変する。これは、
オーバーラップコードブックと称される方法を用いるこ
とにより実現される。前記オーバーラップコードブック
については、中田和男著「音声の高能率符号化」(森北
出版)に詳しく述べられている。
【0026】このオーバーラップコードブックについ
て、図2にその原理図を示し説明する。同図において、
Mサンプルの雑音から次元数N1のベクトルを、サンプ
ル位置を1サンプルずつ動かして、作成する。次元数N
1は、サブフレーム長に等しく、該サブフレーム長がN
2の時は、ベクトルの次元数もN2に変化し、サンプル
位置を1サンプルずつ動かして作成する。
て、図2にその原理図を示し説明する。同図において、
Mサンプルの雑音から次元数N1のベクトルを、サンプ
ル位置を1サンプルずつ動かして、作成する。次元数N
1は、サブフレーム長に等しく、該サブフレーム長がN
2の時は、ベクトルの次元数もN2に変化し、サンプル
位置を1サンプルずつ動かして作成する。
【0027】次にサブフレーム毎にピッチ周期を補正す
る方法について述べる。図1のピッチ予測ゲイン判定器
51でピッチ予測ゲインが閾値より大きく、ピッチ予測
器50で求められたピッチ周期長さでサブフレームが分
割された場合、ピッチ周期遅延器55におけるピッチ周
期探索範囲をピッチ周期の周辺に限定し、最適なピッチ
周期を探索することにより、補正する。これによって演
算量を大きく増加させることなく、ピッチ周期を精度良
く、予測することができる。
る方法について述べる。図1のピッチ予測ゲイン判定器
51でピッチ予測ゲインが閾値より大きく、ピッチ予測
器50で求められたピッチ周期長さでサブフレームが分
割された場合、ピッチ周期遅延器55におけるピッチ周
期探索範囲をピッチ周期の周辺に限定し、最適なピッチ
周期を探索することにより、補正する。これによって演
算量を大きく増加させることなく、ピッチ周期を精度良
く、予測することができる。
【0028】図4に前記ピッチ周期を補正する音声符号
化装置の構成を示し説明する。ここで、図4に示す構成
部材で図1の部材と同等の部材には、同じ参照符号を付
してその説明は省略する。
化装置の構成を示し説明する。ここで、図4に示す構成
部材で図1の部材と同等の部材には、同じ参照符号を付
してその説明は省略する。
【0029】この音声符号化装置は、ピッチ予測ゲイン
が閾値より小さく、予め定められた長さのサブフレーム
で分割された時には、予め定められたピッチ周期探索範
囲、例えば、20〜147サンプルで最適なピッチ周期
を探索する。尚、本発明のコードブックの構成は、前記
オーバーラップコードブックに限定されない。
が閾値より小さく、予め定められた長さのサブフレーム
で分割された時には、予め定められたピッチ周期探索範
囲、例えば、20〜147サンプルで最適なピッチ周期
を探索する。尚、本発明のコードブックの構成は、前記
オーバーラップコードブックに限定されない。
【0030】以上詳述したように、本発明では、ピッチ
予測を2段階に分け、第1のピッチ予測により音声信号
が少なくとも1ピッチ周期が含まれるサブフレームに分
割し、第2のピッチ予測では、サブフレーム毎にピッチ
周期の値を補正するので、徐々に変化するピッチ周期長
さに対応することができ、高品質な合成音声を得ること
ができる。また本発明は、前述した実施例に限定される
ものではなく、他にも発明の要旨を逸脱しない範囲で種
々の変形や応用が可能であることは勿論である。
予測を2段階に分け、第1のピッチ予測により音声信号
が少なくとも1ピッチ周期が含まれるサブフレームに分
割し、第2のピッチ予測では、サブフレーム毎にピッチ
周期の値を補正するので、徐々に変化するピッチ周期長
さに対応することができ、高品質な合成音声を得ること
ができる。また本発明は、前述した実施例に限定される
ものではなく、他にも発明の要旨を逸脱しない範囲で種
々の変形や応用が可能であることは勿論である。
【0031】
【発明の効果】以上詳述したように本発明によれば、時
系列に変化する音声信号のピッチ周期の長さにサブフレ
ームの長さを対応させることにより、高品質な音声符号
化を行う音声符号化装置を提供することができる。
系列に変化する音声信号のピッチ周期の長さにサブフレ
ームの長さを対応させることにより、高品質な音声符号
化を行う音声符号化装置を提供することができる。
【図1】図1は、本発明による第1実施例としての音声
符号化装置の構成を示す図である。
符号化装置の構成を示す図である。
【図2】図2は、オーバーラップコードブックを説明す
るための図である。
るための図である。
【図3】図3は、1フレームを所定ピッチ周期に分割す
るサブフレームを示す図である。
るサブフレームを示す図である。
【図4】図4は、所定ピッチ周期を補正する音声符号化
装置の構成を示す図である。
装置の構成を示す図である。
【図5】図5は、CELPについて説明するための原理
的な構成を示すブロック図である。
的な構成を示すブロック図である。
【図6】図6は、適応コードブックベクトルを用いたC
ELP方式を説明するための原理的な構成を示すブロッ
ク図である。
ELP方式を説明するための原理的な構成を示すブロッ
ク図である。
1,10,26,45…コードブック、2,11,2
7,28,48…乗算器、3,12,50…ピッチ予測
器、4,13…線形予測器、5,23,29,43…差
分器、6,14,21,41,55,56…端子、7,
32,54…評価器、8…マルチプレクサ、9…デマル
チプレクサ、22,42…前フレーム履歴部、24,4
7…適応コードブック、25,55…ピッチ周期遅延
器、29,49…加算器、30,52…LPC合成フィ
ルタ、31,53…減算器、33,44…LPC分析
器、51…ピッチ予測ゲイン判定器。
7,28,48…乗算器、3,12,50…ピッチ予測
器、4,13…線形予測器、5,23,29,43…差
分器、6,14,21,41,55,56…端子、7,
32,54…評価器、8…マルチプレクサ、9…デマル
チプレクサ、22,42…前フレーム履歴部、24,4
7…適応コードブック、25,55…ピッチ周期遅延
器、29,49…加算器、30,52…LPC合成フィ
ルタ、31,53…減算器、33,44…LPC分析
器、51…ピッチ予測ゲイン判定器。
Claims (1)
- 【請求項1】 入力音声信号を予め定められたフレーム
区間に分割するフレーム分割手段と、 前記フレーム分割手段からのフレーム区間の前フレーム
履歴を減算し、目標ベクトルを生成する目標ベクトル生
成手段と、 前記フレーム区間の音声信号のピッチ周期を予測すると
ともに、この予測したピッチ周期に応じて複数のサブフ
レームに分割するピッチ予測手段と、 前記ピッチ予測に所定範囲の遅延量を与えて種々可変し
た、複数の異なるピッチ周期を先行サブフレームの有す
る駆動信号ベクトルに与えて、各ピッチ周期に対応した
複数のピッチ予測ベクトルを有する適応コードブックを
生成する適応コードブック生成手段と、 前記適応コードブック生成手段からの各ピッチ予測ベク
トルに任意のピッチ予測ゲインを与えて可変した後、現
サブフレームのコードベクトルに加算して合成駆動ベク
トルを生成し、フィルタ演算により再生信号を生成する
再生信号生成手段と、 前記再生信号生成手段からの再生信号を前記目標ベクト
ルで減算して誤差を評価し、誤差電力が最小になる合成
信号を再生するピッチ周期補正手段とを具備することを
特徴とする音声符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4088632A JPH05289700A (ja) | 1992-04-09 | 1992-04-09 | 音声符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4088632A JPH05289700A (ja) | 1992-04-09 | 1992-04-09 | 音声符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05289700A true JPH05289700A (ja) | 1993-11-05 |
Family
ID=13948188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4088632A Withdrawn JPH05289700A (ja) | 1992-04-09 | 1992-04-09 | 音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05289700A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0749110A2 (en) * | 1995-06-07 | 1996-12-18 | AT&T IPM Corp. | Adaptive codebook-based speech compression system |
US6167375A (en) * | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
WO2002063610A1 (fr) * | 2001-02-02 | 2002-08-15 | Nec Corporation | Dispositif et procede de conversion de sequences de codes vocaux |
JP2008532064A (ja) * | 2005-02-23 | 2008-08-14 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減 |
-
1992
- 1992-04-09 JP JP4088632A patent/JPH05289700A/ja not_active Withdrawn
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0749110A2 (en) * | 1995-06-07 | 1996-12-18 | AT&T IPM Corp. | Adaptive codebook-based speech compression system |
EP0749110A3 (en) * | 1995-06-07 | 1997-10-29 | At & T Corp | Speech compression system based on an adaptive dictionary |
US6167375A (en) * | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
WO2002063610A1 (fr) * | 2001-02-02 | 2002-08-15 | Nec Corporation | Dispositif et procede de conversion de sequences de codes vocaux |
US7505899B2 (en) | 2001-02-02 | 2009-03-17 | Nec Corporation | Speech code sequence converting device and method in which coding is performed by two types of speech coding systems |
JP2008532064A (ja) * | 2005-02-23 | 2008-08-14 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3134817B2 (ja) | 音声符号化復号装置 | |
JPH04363000A (ja) | 音声パラメータ符号化方式および装置 | |
JP2002202799A (ja) | 音声符号変換装置 | |
KR20070029754A (ko) | 음성 부호화 장치 및 그 방법과, 음성 복호화 장치 및 그방법 | |
JPH11327597A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3137176B2 (ja) | 音声符号化装置 | |
JPH1063297A (ja) | 音声符号化方法および装置 | |
JP3063668B2 (ja) | 音声符号化装置及び復号装置 | |
JP2624130B2 (ja) | 音声符号化方式 | |
JP2000112498A (ja) | 音声符号化方法 | |
JPH05289700A (ja) | 音声符号化装置 | |
JP3268750B2 (ja) | 音声合成方法及びシステム | |
JP3283152B2 (ja) | 音声パラメータ量子化装置およびベクトル量子化装置 | |
JPH113098A (ja) | 音声符号化方法および装置 | |
US6856955B1 (en) | Voice encoding/decoding device | |
JP3462958B2 (ja) | 音声符号化装置および記録媒体 | |
JPH08234795A (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3002299B2 (ja) | 音声符号化装置 | |
JPH0844398A (ja) | 音声符号化装置 | |
JP3332132B2 (ja) | 音声符号化方法および装置 | |
JP3092654B2 (ja) | 信号符号化装置 | |
JP2775533B2 (ja) | 音声の長期予測装置 | |
JPH08194499A (ja) | 音声符号化装置 | |
JPH043878B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19990706 |