JPH0785200B2 - スペクトル標準パタンの作成方法 - Google Patents
スペクトル標準パタンの作成方法Info
- Publication number
- JPH0785200B2 JPH0785200B2 JP61271367A JP27136786A JPH0785200B2 JP H0785200 B2 JPH0785200 B2 JP H0785200B2 JP 61271367 A JP61271367 A JP 61271367A JP 27136786 A JP27136786 A JP 27136786A JP H0785200 B2 JPH0785200 B2 JP H0785200B2
- Authority
- JP
- Japan
- Prior art keywords
- standard pattern
- pattern
- standard
- representative
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明はスペクトル標準パタンの作成方法に関し、特に
ステップVQ(Vector Quantization,ベクトル量子化)用
標準パタンを対象としてパタンマッチング歪の減少と作
成の簡素化とを図ったスペクトル標準パタンの作成方法
に関する。
ステップVQ(Vector Quantization,ベクトル量子化)用
標準パタンを対象としてパタンマッチング歪の減少と作
成の簡素化とを図ったスペクトル標準パタンの作成方法
に関する。
パタンマッチングボコーダ、あるいはスプリット(stri
ngs of phoneme-like templotes)バンド法を利用する
音声認識等ではスペクトル標準パタンがVQを利用して用
意される。このVQとは、音声信号の分析,合成等におい
て利用されるスペクトル包絡パターンをサンプル値ごと
に量子化する代りに、複数の値の組すなわちベクトルと
して量子化するものである。このようなVQを介して得ら
れるスペクトル標準パタン(以下単に標準パタンと呼
ぶ)を利用してパタンマッチング処理を行なう場合に発
生するマッチング誤差としての量子歪を実用上十分に小
さくするには、標準パタンとして用意すべきベクトル数
もある程度多くする必要がある。
ngs of phoneme-like templotes)バンド法を利用する
音声認識等ではスペクトル標準パタンがVQを利用して用
意される。このVQとは、音声信号の分析,合成等におい
て利用されるスペクトル包絡パターンをサンプル値ごと
に量子化する代りに、複数の値の組すなわちベクトルと
して量子化するものである。このようなVQを介して得ら
れるスペクトル標準パタン(以下単に標準パタンと呼
ぶ)を利用してパタンマッチング処理を行なう場合に発
生するマッチング誤差としての量子歪を実用上十分に小
さくするには、標準パタンとして用意すべきベクトル数
もある程度多くする必要がある。
しかしながら、標準パタン内のベクトル数の増大は必然
的にパタンマッチングの演算量を増大する。この問題を
排除する手段としてステップVQなる手法がある。
的にパタンマッチングの演算量を増大する。この問題を
排除する手段としてステップVQなる手法がある。
このステップVQは、VQを多段階ステップで実施するの
で、通常のVQによる標準パタンを利用して行なうパタン
マッチング処理が総当り、いわゆるフルサーチ(full s
earch)処理となって演算量が膨大化するのに対し、こ
のステップVQによって表現された標準パタンによるパタ
ンマッチング処理は本質的に著しい演算量の削減をもた
らす。
で、通常のVQによる標準パタンを利用して行なうパタン
マッチング処理が総当り、いわゆるフルサーチ(full s
earch)処理となって演算量が膨大化するのに対し、こ
のステップVQによって表現された標準パタンによるパタ
ンマッチング処理は本質的に著しい演算量の削減をもた
らす。
いま、標準パタン内のベクトル数がNであるとすると、
通常のVQを利用する標準パタンであればパタン照合回数
はNである。しかしながら、これをステップ数がMであ
るステップVQを利用した標準パタンで照合するものとす
ると、パタン照合回数は と著しく低減される。このような特徴を有するステップ
VQを利用する標準パタンを用いてパタンマッチング処理
における演算量の増大の抑圧を図っている。
通常のVQを利用する標準パタンであればパタン照合回数
はNである。しかしながら、これをステップ数がMであ
るステップVQを利用した標準パタンで照合するものとす
ると、パタン照合回数は と著しく低減される。このような特徴を有するステップ
VQを利用する標準パタンを用いてパタンマッチング処理
における演算量の増大の抑圧を図っている。
ここで、このような効果の期待できるステップVQを利用
しての標準パタンの作成方法について説明する。
しての標準パタンの作成方法について説明する。
第3図は従来のステップVQによる標準パタンの作成方法
の説明図である。
の説明図である。
従来のステップVQ標準パタンは、ベクトル特徴尺度とし
て通常、スペクトル距離を利用し、かつベクトル空間を
スペクトル距離の小さいものから大きいものに移行する
形式で切出していくようなクラスタリングを行なう。第
3図はスペクトル距離がθ1およびθ2dB2(θ1>θ2)
による2段階のステップでのクラスタリングの例を示
し、まずスペクトル空間をθ2bB2でクラスタリングし標
準パタンを構成するベクトルとしてのa,b等が得られ
る。これらa,bは勿論θ2dB2によるクラスタリングで得
られる全標準パタンの一部を構成するベクトルを示すも
のである。このθ2db2によるクラスタリング後のベクト
ルの集合で構成される空間を次にスペクトル距離θ1dB2
でクラスタリングする。このクラスタリングによって得
られる標準パタンを構成するベクトルがA,Bとして示さ
れる空間位置を占有するものとして決定される。
て通常、スペクトル距離を利用し、かつベクトル空間を
スペクトル距離の小さいものから大きいものに移行する
形式で切出していくようなクラスタリングを行なう。第
3図はスペクトル距離がθ1およびθ2dB2(θ1>θ2)
による2段階のステップでのクラスタリングの例を示
し、まずスペクトル空間をθ2bB2でクラスタリングし標
準パタンを構成するベクトルとしてのa,b等が得られ
る。これらa,bは勿論θ2dB2によるクラスタリングで得
られる全標準パタンの一部を構成するベクトルを示すも
のである。このθ2db2によるクラスタリング後のベクト
ルの集合で構成される空間を次にスペクトル距離θ1dB2
でクラスタリングする。このクラスタリングによって得
られる標準パタンを構成するベクトルがA,Bとして示さ
れる空間位置を占有するものとして決定される。
クラスタリングの対象となるベクトル空間に含まれる全
空間ベクトルは音声信号のLPC(Linear Prediction Cod
ing)分析で得られるスペクトル包絡パラメータ、たと
えばLSP(Line Spectrum Pairs)係数等で表現されるの
が一般的であり、これがトレーニングデータである。第
3図のa,bはθ2dB2でクラスタリングされたベクトル空
間の重心としての標準パタンを構成する代表ベクトルで
あり、トレーニングに対応する全ベクトル空間はかかる
標準パタンを構成する代表ベクトルの集合として表現さ
れることとなる。たとえば、Pで示すベクトル空間に包
含される全ベクトルはaで示す代表ベクトルで示され
る。
空間ベクトルは音声信号のLPC(Linear Prediction Cod
ing)分析で得られるスペクトル包絡パラメータ、たと
えばLSP(Line Spectrum Pairs)係数等で表現されるの
が一般的であり、これがトレーニングデータである。第
3図のa,bはθ2dB2でクラスタリングされたベクトル空
間の重心としての標準パタンを構成する代表ベクトルで
あり、トレーニングに対応する全ベクトル空間はかかる
標準パタンを構成する代表ベクトルの集合として表現さ
れることとなる。たとえば、Pで示すベクトル空間に包
含される全ベクトルはaで示す代表ベクトルで示され
る。
このような低位のクラスタリングから上位のクラスタリ
ングに移行する処理を必要ステップ繰返しステップVQ標
準パタンが作成される。
ングに移行する処理を必要ステップ繰返しステップVQ標
準パタンが作成される。
上述した従来のステップVQ用標準パタンには、しかしな
がら次のような問題点がある。
がら次のような問題点がある。
すなわち、上位のクラスタリングの過程に於いて、第一
番目に決定される代表ベクトル例えば第3図に示すAに
より代表されるベクトル空間は概念的に、例えば半径θ
1の球と考え得る。第二番面以降に決定される代表ベク
トル例えば第3図に示すBにより代表されるベクトル空
間は、以前に決定されている代表ベクトルにより代表さ
れるベクトル空間と重複する部分が存在しない場合に
は、半径θ1の球であり、重複する部分が存在する場合
には球にはならない。第3図に示すtは下位のクラスタ
リングの結果設定された代表ベクトルの一つである。t
は又、上位のクラスタリングの結果、代表ベクトルAが
代表する空間UAに含まれている。さて代表ベクトルBが
代表する空間UBは必ずしも球ではなく、UAより容積が小
さい場合がある。その結果、下位の標準パタンを構成す
る代表ベクトルtと、tを含む空間UAの代表ベクトルA
との距離dtAが、ベクトル1とBとの距離dtBより長くな
る場合が発生する。もしdtA>dtBの場合、ベクトルtが
代表すべき空間Utに存在する観測データCは、ステップ
VQに於いて、ベクトルBが代表する空間UBに含まれると
判断される事が多い。CがUBに含まれると判断された場
合、Cは決してベクトル1に代表される事はない。例え
ばUBに含まれるベクトルSに代表される。この結果、元
来代表ベクトルtとして決定すべきもののパタンマッチ
ング精度を劣化させ、パタンマッチング歪をθ2dB2以上
にしてしまうという欠点がある。
番目に決定される代表ベクトル例えば第3図に示すAに
より代表されるベクトル空間は概念的に、例えば半径θ
1の球と考え得る。第二番面以降に決定される代表ベク
トル例えば第3図に示すBにより代表されるベクトル空
間は、以前に決定されている代表ベクトルにより代表さ
れるベクトル空間と重複する部分が存在しない場合に
は、半径θ1の球であり、重複する部分が存在する場合
には球にはならない。第3図に示すtは下位のクラスタ
リングの結果設定された代表ベクトルの一つである。t
は又、上位のクラスタリングの結果、代表ベクトルAが
代表する空間UAに含まれている。さて代表ベクトルBが
代表する空間UBは必ずしも球ではなく、UAより容積が小
さい場合がある。その結果、下位の標準パタンを構成す
る代表ベクトルtと、tを含む空間UAの代表ベクトルA
との距離dtAが、ベクトル1とBとの距離dtBより長くな
る場合が発生する。もしdtA>dtBの場合、ベクトルtが
代表すべき空間Utに存在する観測データCは、ステップ
VQに於いて、ベクトルBが代表する空間UBに含まれると
判断される事が多い。CがUBに含まれると判断された場
合、Cは決してベクトル1に代表される事はない。例え
ばUBに含まれるベクトルSに代表される。この結果、元
来代表ベクトルtとして決定すべきもののパタンマッチ
ング精度を劣化させ、パタンマッチング歪をθ2dB2以上
にしてしまうという欠点がある。
本発明の目的は上述した欠点を除去し、ステップVQ標準
パタン作成におけるクラスタリングを所定の大小順に設
定したスペクトル距離で次次に実施するという手段を備
えることにより、パタンマッチング歪を大幅に減少しう
る簡易な手法によるスペクトル標準パタンの作成方法を
提供することにある。
パタン作成におけるクラスタリングを所定の大小順に設
定したスペクトル距離で次次に実施するという手段を備
えることにより、パタンマッチング歪を大幅に減少しう
る簡易な手法によるスペクトル標準パタンの作成方法を
提供することにある。
〔問題点を解決するための手段〕 本発明の方法は音声信号のスペクトル包絡パラメータを
多段階ステップでベクトル量子化するための標準パタン
を作成する場合のスペクトル標準パタンの作成方法であ
って、スペクトル包絡パラメータに基づき形成された下
位の標準パタンの複数の代表スペクトルを受け、下位の
標準パタンを決定するための基準となる第1のスペクト
ル距離より大なる第2のスペクトル距離でクラスタリン
グすることで上位の標準パタンの複数の代表スペクトル
を決定し、この決定された上位の標準パタンの複数の代
表ベクトル点と下位の標準パタンの代表スペクトル点と
のパタン照合を行い、最小距離を条件として、上位の複
数の代表ベクトル点の各々に代表される下位の標準パタ
ンの代表ベクトルを決定するものである。更に本発明の
方法は前記スペクトル包絡パラメータをトレーニングデ
ータとして第1のスペクトル距離でクラスタリングして
前記下位の標準パタンを決定するものである。
多段階ステップでベクトル量子化するための標準パタン
を作成する場合のスペクトル標準パタンの作成方法であ
って、スペクトル包絡パラメータに基づき形成された下
位の標準パタンの複数の代表スペクトルを受け、下位の
標準パタンを決定するための基準となる第1のスペクト
ル距離より大なる第2のスペクトル距離でクラスタリン
グすることで上位の標準パタンの複数の代表スペクトル
を決定し、この決定された上位の標準パタンの複数の代
表ベクトル点と下位の標準パタンの代表スペクトル点と
のパタン照合を行い、最小距離を条件として、上位の複
数の代表ベクトル点の各々に代表される下位の標準パタ
ンの代表ベクトルを決定するものである。更に本発明の
方法は前記スペクトル包絡パラメータをトレーニングデ
ータとして第1のスペクトル距離でクラスタリングして
前記下位の標準パタンを決定するものである。
次に本発明につき図面を参照して詳細に説明する。
第1図は本発明の一実施例を示すブロック図である。
第1図に示す実施例の構成は、LPC分析器1,LSP分析器2,
一時メモリ(1)3,一時メモリ(2)4,演算器5,スペク
トル感度ファイル6,標準バタン(1)出力ファイル7,標
準パタン(2)出力ファイル8,ROM9等を備えて構成され
る。
一時メモリ(1)3,一時メモリ(2)4,演算器5,スペク
トル感度ファイル6,標準バタン(1)出力ファイル7,標
準パタン(2)出力ファイル8,ROM9等を備えて構成され
る。
本発明によるステップVQ標準パタンの作成方法の要点
は、下位の標準パタンを構成する代表ベクトルをクラス
タリングし、上位の標準パタンを構成する代表ベクトル
を決定し、更に決定された上位の標準パタンを構成する
代表ベクトルを基準とし、下位の標準パタンを構成する
代表ベクトルをクラス分けする点にある。
は、下位の標準パタンを構成する代表ベクトルをクラス
タリングし、上位の標準パタンを構成する代表ベクトル
を決定し、更に決定された上位の標準パタンを構成する
代表ベクトルを基準とし、下位の標準パタンを構成する
代表ベクトルをクラス分けする点にある。
第4図は本発明のステップVQ標準パタンの作成方法であ
る。
る。
まず、θ2dB2のスペクトル距離でトレーニングデータを
クラスタリングし、下位の標準パタンの代表ベクトルa,
b,c,t,s等を決定する。次にこれらの代表ベクトルa,b,
t,s等をθ1dB2のスペクトル距離でクラスタリングし、
上位の標準パタンの代表ベクトルA,B等を決定する。決
定された代表ベクトルA,B等を標準パタンとして前記代
表ベクトルa,b,t,s等をパタン照合する。パタン照合の
結果、a,b,t,s等はA,B等によりクラス分けされる。この
クラス分けにより下位の標準パタンを構成するベクトル
は、距離の最短な上位の標準パタンを構成するベクトル
と関係づけられる。
クラスタリングし、下位の標準パタンの代表ベクトルa,
b,c,t,s等を決定する。次にこれらの代表ベクトルa,b,
t,s等をθ1dB2のスペクトル距離でクラスタリングし、
上位の標準パタンの代表ベクトルA,B等を決定する。決
定された代表ベクトルA,B等を標準パタンとして前記代
表ベクトルa,b,t,s等をパタン照合する。パタン照合の
結果、a,b,t,s等はA,B等によりクラス分けされる。この
クラス分けにより下位の標準パタンを構成するベクトル
は、距離の最短な上位の標準パタンを構成するベクトル
と関係づけられる。
再び第1図に戻って実施例の説明を続行する。入力音声
はLPC分析器1で分析フレームごとにP次のLPC係数を抽
出され、さらにLSP分析器2でP次のLSP係数に変換され
る。このLSP係数はP次のベクトル空間を構成する空間
ベクトルである。
はLPC分析器1で分析フレームごとにP次のLPC係数を抽
出され、さらにLSP分析器2でP次のLSP係数に変換され
る。このLSP係数はP次のベクトル空間を構成する空間
ベクトルである。
分析フレームごとに出力されるP次のLSP係数は、所望
のパタン数n、たとえば50,000パタン程度が一時メモリ
(1)3にトレーニングデータとして格納される。
のパタン数n、たとえば50,000パタン程度が一時メモリ
(1)3にトレーニングデータとして格納される。
一時メモリ(1)3に格納されたトレーニングデータ
は、演算器5で先ず下位の標準パタン作成に利用され
る。本実施例の場合も第3,第4図の例と同じく、スペク
トル距離θ1,θ2dB2の2ステップクラスタリングを考
えているがこのクラスタリングのステップは任意に設定
できる。
は、演算器5で先ず下位の標準パタン作成に利用され
る。本実施例の場合も第3,第4図の例と同じく、スペク
トル距離θ1,θ2dB2の2ステップクラスタリングを考
えているがこのクラスタリングのステップは任意に設定
できる。
演算器5は関連機器の制御を行ないつつ、次のようにし
てクラスタリング処理に必要な演算を実施する。
てクラスタリング処理に必要な演算を実施する。
すなわち、一時メモリ(1)3の内容を読出したうえま
ずスペクトル距離θ2dB2でクラスタリングし、得られる
標準パタンを標準パタン(1)出力ファイル7に供給す
る。このクラスタリングにおいて必要なスペクトル距離
の演出は次の(1)式による。
ずスペクトル距離θ2dB2でクラスタリングし、得られる
標準パタンを標準パタン(1)出力ファイル7に供給す
る。このクラスタリングにおいて必要なスペクトル距離
の演出は次の(1)式による。
ここでdijはパタンi,j間のスペクトル距離WPはスペクト
ル感度,▲ω(i) P▼はパタンiのP次のLSP係数,▲ω
(j) P▼はパタンjのP次のLSP係数であり、また(1)
式は分析次数が10次の場合を示す。スペクトル感度ファ
イル6は、このクラスタリング演算において必要なスペ
クトル感度WPに関するデータをファイルし演算器5に供
給する。
ル感度,▲ω(i) P▼はパタンiのP次のLSP係数,▲ω
(j) P▼はパタンjのP次のLSP係数であり、また(1)
式は分析次数が10次の場合を示す。スペクトル感度ファ
イル6は、このクラスタリング演算において必要なスペ
クトル感度WPに関するデータをファイルし演算器5に供
給する。
演算器5におけるクラスタリングの手順をさらに詳述す
れば次のとおりとなる。
れば次のとおりとなる。
すべてのトレーニングデータごとに他のトレーニン
グデータとのスペクトル距離を(1)式に従って計測し
θ2dB2以内のパタン数を計測する。計測されたパタン数
は一時メモリ(2)4に書込む。一時メモリ(2)4
は、たとえばnワード以上の容量をもつRAMで構成す
る。
グデータとのスペクトル距離を(1)式に従って計測し
θ2dB2以内のパタン数を計測する。計測されたパタン数
は一時メモリ(2)4に書込む。一時メモリ(2)4
は、たとえばnワード以上の容量をもつRAMで構成す
る。
一時メモリ(2)4に書込んだパタンのうち最大の
パタン数を有するトレーニングデータを検索する。
パタン数を有するトレーニングデータを検索する。
で検索されたトレーニングデータを標準パタンと
して標準パタン(1)出力ファイル7に登録する。
して標準パタン(1)出力ファイル7に登録する。
で標準パタン(1)出力ファイル7に登録された
トレーニングデータを含め、このトレーニングデータと
θ2dB2以内のスペクトル距離に存在するトレーニングデ
ータを削除し一時メモリ(1)3を並び替える。
トレーニングデータを含め、このトレーニングデータと
θ2dB2以内のスペクトル距離に存在するトレーニングデ
ータを削除し一時メモリ(1)3を並び替える。
トレーニングデータが存在しなくなるまで上記〜
を繰返す。
を繰返す。
以上の手順で先ずスペクトル距離θ2dB2を尺度とするク
ラスタリングを実行したのち次にθ1dB2を尺度とするク
ラスタリングを次のようにして実施する。
ラスタリングを実行したのち次にθ1dB2を尺度とするク
ラスタリングを次のようにして実施する。
標準パタン(1)出力ファイル7に格納されているすべ
ての代表ベクトルデータ4を一時メモリ(1)3へ転送
する。
ての代表ベクトルデータ4を一時メモリ(1)3へ転送
する。
前述の方法でスペクトル距離θ1dB2で再びクラスタリン
グを実施する。但し検索された代表ベクトルは標準パタ
ン(2)出力ファイル8に登録される。
グを実施する。但し検索された代表ベクトルは標準パタ
ン(2)出力ファイル8に登録される。
次に標準パタン(1)出力ファイル7に登録されている
代表ベクトルの各々について、標準パタン(2)出力フ
ァイル8に登録されている代表ベクトルの全てとの距離
を前記(1)式を利用して算出し、最小距離に対応する
標準パタン(2)の番号を一時メモリ(2)4へ書込
む。
代表ベクトルの各々について、標準パタン(2)出力フ
ァイル8に登録されている代表ベクトルの全てとの距離
を前記(1)式を利用して算出し、最小距離に対応する
標準パタン(2)の番号を一時メモリ(2)4へ書込
む。
更に一時メモリ(2)4に書込まれている番号のうち同
一のものを検索し、その個数を求めるとともに、対応す
る標準パタン(1)出力ファイルに登録されている代表
ベクトルを、この番号が同一のもの同志をまとめて一時
メモリ(1)3へ転送する。尚、この個数は標準パタン
(2)出力ファイル8にデータとして書込まれる。
一のものを検索し、その個数を求めるとともに、対応す
る標準パタン(1)出力ファイルに登録されている代表
ベクトルを、この番号が同一のもの同志をまとめて一時
メモリ(1)3へ転送する。尚、この個数は標準パタン
(2)出力ファイル8にデータとして書込まれる。
標準パタン(2)出力ファイル8に格納された内容は
(n,m)で示される配列数となる。ここでnは上位の標
準パタンに含まれる代表ベクトル数、mはLSP分析次数
に対応する下位の標準パタンの代表ベクトル数指定分1
を加算した数である。
(n,m)で示される配列数となる。ここでnは上位の標
準パタンに含まれる代表ベクトル数、mはLSP分析次数
に対応する下位の標準パタンの代表ベクトル数指定分1
を加算した数である。
最後にこのベクトル数指定分のデータは標準パタン
(1)出力ファイル(1)7の番地に変換される。この
処理は簡単な累算を利用して実施し得る。
(1)出力ファイル(1)7の番地に変換される。この
処理は簡単な累算を利用して実施し得る。
こうして第4図に示す内容のクラスタリングによる標準
パタンの作成が可能となる。この場合、入力音声の有声
/無声ならびに無音情報に対応した標準パタンの作成も
容易に実施しうる。
パタンの作成が可能となる。この場合、入力音声の有声
/無声ならびに無音情報に対応した標準パタンの作成も
容易に実施しうる。
こうして得られる標準パタン(1),(2)は、演算器
5の内蔵するROM書込器によってROM10に書込まれる。
5の内蔵するROM書込器によってROM10に書込まれる。
第2図は第1図の実施例によって作成した標準パタンの
一応用例を示すブロック図である。第2図はパタンマッ
チングボコーダを対象とする応用例であり、分析側と合
成側とを含んで構成される。
一応用例を示すブロック図である。第2図はパタンマッ
チングボコーダを対象とする応用例であり、分析側と合
成側とを含んで構成される。
分析側はLPC分析器1,LSP分析器2,スペクトル感度ファイ
ル6,電力量子化器11,ピッチ・V/UV(有声/無声)量子
化器12,パタン照合器13,標準パタン(1)14,標準パタ
ン(2)15およびマルチプレクサ16を備えて構成され、
また合成側は、デマルチプレクサ17,標準パタンファイ
ル18,電力復号化器19,ピッチパルス発生器20,白色ノイ
ズ発生器21,切替え器21,可変利得増幅器23およびLPC合
成フィルタ24を備えて構成される。
ル6,電力量子化器11,ピッチ・V/UV(有声/無声)量子
化器12,パタン照合器13,標準パタン(1)14,標準パタ
ン(2)15およびマルチプレクサ16を備えて構成され、
また合成側は、デマルチプレクサ17,標準パタンファイ
ル18,電力復号化器19,ピッチパルス発生器20,白色ノイ
ズ発生器21,切替え器21,可変利得増幅器23およびLPC合
成フィルタ24を備えて構成される。
分析側ではLPC分析器1,LSP分析器2によって音声入力の
LSP係数を所定の次数で分析フレームごとに抽出したの
ちこれをパタン照合器13に供給する。
LSP係数を所定の次数で分析フレームごとに抽出したの
ちこれをパタン照合器13に供給する。
LPC分析器1でLPC係数を分析する際には、分析フレーム
ごとに先ず分析次数と同じ次数の自己相関関係数を抽出
するが、電力量子化器11は遅れ時間零における自己相関
係数を受けてこれを所定のビット数で量子化し、電力デ
ータとしてマルチプレクサ16に供給する。
ごとに先ず分析次数と同じ次数の自己相関関係数を抽出
するが、電力量子化器11は遅れ時間零における自己相関
係数を受けてこれを所定のビット数で量子化し、電力デ
ータとしてマルチプレクサ16に供給する。
またピッチ・V/UV量子化器12は、音声入力を受けると公
知の手法によってこれらピッチ,V/UV情報を抽出しマル
チプレクサ16に供給する。上述した電力データ,ピッチ
・V/UV情報は音声入力の音源情報である。
知の手法によってこれらピッチ,V/UV情報を抽出しマル
チプレクサ16に供給する。上述した電力データ,ピッチ
・V/UV情報は音声入力の音源情報である。
LSP分析器2からLSP係数を供給されたパタン照合器13
は、標準パタン(1)14に登録されている標準パタンと
のパタンマッチング処理を行ない、さらにそのあとで標
準パタン(2)15に登録されている標準パタンとのパタ
ンマッチング処理を行なう。このパタンマッチング処理
はスペクトル感度ファイル6に格納されているスペクト
ル感度データを利用しつつ(1)式によるスペクトル距
離の算出を行ない、最もスペクトル距離の小さい標準パ
タンを選択するという形式で行なわれる。標準パタン
(1)14は、第1図の実施例によって得られる標準パタ
ンのうちの上位の標準パタン、すなわちスペクトル距離
θ1dB2でクラスタリングした標準パタンが登録され、ま
た標準パタン(2)15には、上位の標準パタンでクラス
分けされた下位の標準パタンが登録されている。尚、下
位の標準パタンは予じめスペクトル距離θ2dB2でクラス
タリングした標準パタンである。これら標準パタンを利
用することにより、LSP分析器2から提供されたLSP係数
が、最下位のパタン照合に於いて、最も距離の近い標準
パタンと照合されない場合が発生するという従来方法の
欠点が改善される。
は、標準パタン(1)14に登録されている標準パタンと
のパタンマッチング処理を行ない、さらにそのあとで標
準パタン(2)15に登録されている標準パタンとのパタ
ンマッチング処理を行なう。このパタンマッチング処理
はスペクトル感度ファイル6に格納されているスペクト
ル感度データを利用しつつ(1)式によるスペクトル距
離の算出を行ない、最もスペクトル距離の小さい標準パ
タンを選択するという形式で行なわれる。標準パタン
(1)14は、第1図の実施例によって得られる標準パタ
ンのうちの上位の標準パタン、すなわちスペクトル距離
θ1dB2でクラスタリングした標準パタンが登録され、ま
た標準パタン(2)15には、上位の標準パタンでクラス
分けされた下位の標準パタンが登録されている。尚、下
位の標準パタンは予じめスペクトル距離θ2dB2でクラス
タリングした標準パタンである。これら標準パタンを利
用することにより、LSP分析器2から提供されたLSP係数
が、最下位のパタン照合に於いて、最も距離の近い標準
パタンと照合されない場合が発生するという従来方法の
欠点が改善される。
パタン照合器13によって選択された標準パタン(2)を
指定する標準パタン番号はマルチプレクサ16に供給され
るが、これは音声入力に最も類似した分析フレームごと
のスペクトル包絡情報を提供するものである。
指定する標準パタン番号はマルチプレクサ16に供給され
るが、これは音声入力に最も類似した分析フレームごと
のスペクトル包絡情報を提供するものである。
マルチプレクサ16は、電力データ,ピッチ・V/UV情報,
標準パタン番号を適宜組合せて多重化し伝送路を介して
合成側に送出する。
標準パタン番号を適宜組合せて多重化し伝送路を介して
合成側に送出する。
合成側ではデマルチプレクサ17が分析側から送られた多
重化信号を分離し、標準パタン番号は標準パタンファイ
ル18に、電力データは電力復号化器19に、ピッチデータ
はピッチパルス発生器20に、電力データは電力復号化器
19にそれぞれ供給し、またV/UV情報は切替器22にそれぞ
れ供給する。
重化信号を分離し、標準パタン番号は標準パタンファイ
ル18に、電力データは電力復号化器19に、ピッチデータ
はピッチパルス発生器20に、電力データは電力復号化器
19にそれぞれ供給し、またV/UV情報は切替器22にそれぞ
れ供給する。
標準パタンファイル18は、分析側の標準パタン(2)15
と同一のファイル、もしくはこの標準パタン(2)のそ
れぞれのパタンに対応するLSP係数をαパラメータ等のL
P係数に変換したものを格納し、これらスペクトル包絡
情報をLPC合成フィルタ24に供給する。
と同一のファイル、もしくはこの標準パタン(2)のそ
れぞれのパタンに対応するLSP係数をαパラメータ等のL
P係数に変換したものを格納し、これらスペクトル包絡
情報をLPC合成フィルタ24に供給する。
V/UV情報を供給された切替器22は、V/UV情報がVで有声
を指定するときはピッチパルス発生器20の出力を変換利
得増幅器23に供給するように切替え、またUVで無声を指
定するときは白色ノイズ発生器21の出力を提供するよう
に切替える。ピッチパルス発生器20は、入力したピッチ
情報に対応する繰返し数のパルス列をピッチパルスとし
て発生する。
を指定するときはピッチパルス発生器20の出力を変換利
得増幅器23に供給するように切替え、またUVで無声を指
定するときは白色ノイズ発生器21の出力を提供するよう
に切替える。ピッチパルス発生器20は、入力したピッチ
情報に対応する繰返し数のパルス列をピッチパルスとし
て発生する。
可変利得増幅器23は、切替器22を介して提供されるピッ
チパルスもしくは白色ノズルを電力復号化器19の出力レ
ベルに対応して増幅しモデル化された電源情報としてLP
C合成フィルタ24の入力としてこれを駆動する。電力復
号化器19は、入力した電力データを復号して電力情報を
出力する。
チパルスもしくは白色ノズルを電力復号化器19の出力レ
ベルに対応して増幅しモデル化された電源情報としてLP
C合成フィルタ24の入力としてこれを駆動する。電力復
号化器19は、入力した電力データを復号して電力情報を
出力する。
LPC合成ファイル24は、全極型ディジタルフィルタとし
て構成され、ディジタル音声信号を発生し、これをD/A
コンバータによってアナログ化したあと低域通過フィル
タを通して音声出力として送出する。
て構成され、ディジタル音声信号を発生し、これをD/A
コンバータによってアナログ化したあと低域通過フィル
タを通して音声出力として送出する。
なお、上述した応用例でも、利用する標準パタンは2段
階ステップの木(tree)構成としているが、これは何段
階としても同様に実施しうることは明らかである。
階ステップの木(tree)構成としているが、これは何段
階としても同様に実施しうることは明らかである。
以上説明したように本発明によれば、上位の標準パタン
で下位の標準パタンをクラス分けする手段を備えること
により、パタンマッチング歪を大幅に改善しうる簡素な
手法によるスペクトル標準パタンの作成方法が実現でき
るという効果がある。
で下位の標準パタンをクラス分けする手段を備えること
により、パタンマッチング歪を大幅に改善しうる簡素な
手法によるスペクトル標準パタンの作成方法が実現でき
るという効果がある。
第1図は本発明の一実施例を示すブロック図、第2図は
第1図の実施例によって作成した標準パタンの一応用例
を示すブロック図、第3図は従来のステップVQ用標準パ
タンの作成方法の説明図、第4図は本発明のステップVQ
用標準パタンの作成方法の説明図である。 1……LPC分析図、2……LSP分析器、3……一時メモリ
(1)、4……一時メモリ(2)、5……演算器、6…
…スペクトル感度ファイル、7……標準パタン(1)出
力ファイル、8……標準パタン(2)出力ファイル、9
……ROM、11……電力量子化器、12……ピッチ・V/UV量
子化器、13……パタン照合図、14……標準パタン
(1)、15……標準パタン(2)、16……マルチプレク
サ、17……デマルチプレクサ、18……標準パタンファイ
ル、19……電力復号化器、20……ピッチパルス発生器、
21……白色ノイズ発生器、22……切替器、23……可変利
得増幅器、24……LPC合成フィルタ。
第1図の実施例によって作成した標準パタンの一応用例
を示すブロック図、第3図は従来のステップVQ用標準パ
タンの作成方法の説明図、第4図は本発明のステップVQ
用標準パタンの作成方法の説明図である。 1……LPC分析図、2……LSP分析器、3……一時メモリ
(1)、4……一時メモリ(2)、5……演算器、6…
…スペクトル感度ファイル、7……標準パタン(1)出
力ファイル、8……標準パタン(2)出力ファイル、9
……ROM、11……電力量子化器、12……ピッチ・V/UV量
子化器、13……パタン照合図、14……標準パタン
(1)、15……標準パタン(2)、16……マルチプレク
サ、17……デマルチプレクサ、18……標準パタンファイ
ル、19……電力復号化器、20……ピッチパルス発生器、
21……白色ノイズ発生器、22……切替器、23……可変利
得増幅器、24……LPC合成フィルタ。
Claims (2)
- 【請求項1】音声信号のスペクトル包絡パラメータを多
段階ステップでベクトル量子化するための標準パタンを
作成する場合のスペクトル標準パタンの作成方法であっ
て、 前記スペクトル包絡パラメータに基づき形成された下位
の標準パタンの複数の代表ベクトルを受け、下位の標準
パタンを決定するための基準となる第1のスペクトル距
離より大なる第2のスペクトル距離でクラスタリングす
ることで上位の標準パタンの複数の代表ベクトルを決定
し、 この決定された上位の標準パタンの複数の代表ベクトル
点と下位の標準パタンの代表ベクトル点とのパタン照合
を行い、最小距離を条件として、上位の複数の代表ベク
トル点の各々に代表される下位の標準パタンの代表ベク
トルを決定することを特徴とするスペクトル標準パタン
の作成方法。 - 【請求項2】前記スペクトル包絡パラメータをトレーニ
ングデータとして第1のスペクトル距離でクラスタリン
グして前記下位の標準パタンを決定することを特徴とす
る請求項1のスペクトル標準パタンの作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61271367A JPH0785200B2 (ja) | 1986-11-13 | 1986-11-13 | スペクトル標準パタンの作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61271367A JPH0785200B2 (ja) | 1986-11-13 | 1986-11-13 | スペクトル標準パタンの作成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63124099A JPS63124099A (ja) | 1988-05-27 |
JPH0785200B2 true JPH0785200B2 (ja) | 1995-09-13 |
Family
ID=17499083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61271367A Expired - Lifetime JPH0785200B2 (ja) | 1986-11-13 | 1986-11-13 | スペクトル標準パタンの作成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0785200B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2003088209A1 (ja) * | 2002-04-12 | 2005-08-25 | 三菱電機株式会社 | カーナビゲーションシステム並びにその音声認識装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7424423B2 (en) * | 2003-04-01 | 2008-09-09 | Microsoft Corporation | Method and apparatus for formant tracking using a residual model |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6177899A (ja) * | 1984-09-26 | 1986-04-21 | 日本電気株式会社 | 標準パタ−ン作成法 |
JPS61148497A (ja) * | 1984-12-21 | 1986-07-07 | 松下電器産業株式会社 | 標準パタン作成装置 |
-
1986
- 1986-11-13 JP JP61271367A patent/JPH0785200B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6177899A (ja) * | 1984-09-26 | 1986-04-21 | 日本電気株式会社 | 標準パタ−ン作成法 |
JPS61148497A (ja) * | 1984-12-21 | 1986-07-07 | 松下電器産業株式会社 | 標準パタン作成装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2003088209A1 (ja) * | 2002-04-12 | 2005-08-25 | 三菱電機株式会社 | カーナビゲーションシステム並びにその音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JPS63124099A (ja) | 1988-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3707116B2 (ja) | 音声復号化方法及び装置 | |
Yoshimura et al. | Mixed excitation for HMM-based speech synthesis. | |
EP1557821B1 (en) | Segmental tonal modeling for tonal languages | |
JP4005154B2 (ja) | 音声復号化方法及び装置 | |
EP0504927B1 (en) | Speech recognition system and method | |
JP3680380B2 (ja) | 音声符号化方法及び装置 | |
US4661915A (en) | Allophone vocoder | |
AU639394B2 (en) | Speech synthesis using perceptual linear prediction parameters | |
JP3196595B2 (ja) | 音声符号化装置 | |
US20070118366A1 (en) | Methods and apparatuses for variable dimension vector quantization | |
JPH11242494A (ja) | 話者適応化装置と音声認識装置 | |
EP1465153B1 (en) | Method and apparatus for formant tracking using a residual model | |
Wu et al. | Fully vector-quantized neural network-based code-excited nonlinear predictive speech coding | |
Wong et al. | Very low data rate speech compression with LPC vector and matrix quantization | |
JPH0883098A (ja) | パラメータ変換方法及び音声合成方法 | |
JP2898568B2 (ja) | 声質変換音声合成装置 | |
EP2087485B1 (en) | Multicodebook source -dependent coding and decoding | |
JPH0785200B2 (ja) | スペクトル標準パタンの作成方法 | |
JP2709926B2 (ja) | 声質変換方法 | |
JP2006189554A (ja) | テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH0764599A (ja) | 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置 | |
JPH10254473A (ja) | 音声変換方法及び音声変換装置 | |
JP2736157B2 (ja) | 符号化装置 | |
KR100701253B1 (ko) | 이동통신 환경 하에서의 서버 기반 음성 인식을 위한음성부호화 방법 및 장치 | |
JPH0750398B2 (ja) | スペクトル標準パタンの作成方法 |