JPH01237600A

JPH01237600A - スペクトログラムの正規化方法

Info

Publication number: JPH01237600A
Application number: JP63065542A
Authority: JP
Inventors: Satoru Nakamura; 哲中村; Kiyohiro Kano; 清宏鹿野
Original assignee: A T R JIDO HONYAKU DENWA KENKYUSHO KK
Current assignee: A T R JIDO HONYAKU DENWA KENKYUSHO KK
Priority date: 1988-03-17
Filing date: 1988-03-17
Publication date: 1989-09-22
Anticipated expiration: 2013-02-04
Also published as: JP2709935B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］この発明はスペクトロクラムの正規化方式に関し、特に
、ベクトル量子化を用いた異話者間のスペクトログラム
の正規化に関するものであって、不特定話者認識のため
の話者適応化や、声質変換技術に適用可能なスペクトロ
グラムの正規化方式［従来の技術］最近では、ベクトル量子化の手法が音声認識の分野にも
導入され始めている。ベクトル量子化は本来効率的な符
号化の手法であり、計算量やメモリ容量の削減に効果を
発揮している。このようなベクトル量子化については、
５ｈｉｋａｎｏ、Ｌｅｅ、Ｒｅｄｄｙ；　　’５ｐｅａ
ｋｅｒ　　Ａｄａｐｔａｔｉｏｎ　　ｔｈｒｏｕｇｈ　
　ＶｅｃｔｏｒＱｕａｎｔｉｚａｔｉｏｎ”　ＩＣＡＳ
ＳＰ　’８６において、ベクトル量子化をスペクトル空
間の離散表現としてとらえることにより、新しい話者適
応の方法の可能性が提案された。

第１２図は上述の文献に記載された音声認識法を説明す
るための図であり、第１３図は従来のベクトル量子化に
おける歪を説明するための図である。

上述の文献で提案された学習に基づく方法では、第１２
図に示すように、未知話者Ａの入力音声がベクトル量子
化され、コードブックが生成される。

その後、学習単語の動的計画法による非線形マツチング
の最適パスからベクトルコードの対応づけヒストグラム
が求められる。このヒストグラムによりコードブック間
の対応関係が求められて話者適応が行なわれる。このよ
うな手法は、英単語の認識実験に適用され、良好な結果
を収めている。

［発明が解決しようとする課題］ところで、ベクトル量子化においては、コードブック内
の代表点の数を多くしなければ歪が大きくなってしまう
。すなわち、第１３図の実線ａに示すように、音声の流
れに対してベクトル量子化による音声の流れは、各代表
点を結んでいくことにより、第１３図に示す点線すのよ
うになる。コードブック内の代表点の数が多ければ、ベ
クトル量子化による音声の流れは実際の音声の流れに近
似するが、代表点の数が少なければ、ベクトル量子化に
よる音声の流れは実際の音声の流れに比べて大きく折れ
曲がり、実際の音声の流れとの差が歪となる。この歪を
小さくするために代表点の数を多くすれば、大容量のメ
モリを必要とするばかりでなく、大量の計算量を必要と
し、これに伴なって話者適応における学習単語数が膨大
な数になってしまうという問題点があった。

それゆえに、この発明の主たる目的は、既存のコードベ
クトルへの帰属度により入力ベクトルを表現するファジ
ィベクトル量子化を用い、従来のままのコードブックを
用いながら量子化歪を低減し、また話者適応における学
習単語を増加させることなく、高精度にスペクトログラ
ムの正規化を行なうことのできるようなスペクトログラ
ムの正規化方式を提供することである。

［課題を解決するための手段］この発明は音声信号をディジタル化し、その音声信号の
特徴として声紋のスペクトログラムを抽出し、この抽出
されたスペクトログラムを異話者間で正規化するスペク
トログラムの正規化方式であり、て、ディジタル化され
た音声信号に基づいて、入力ベクトルを既存のコードベ
クトルからの帰属度で表現するファジィベクトル量子化
を行なった後、スペクトログラムを抽出し、ベクトル量
子化のコードブックについて異話者間で対応づけを行な
い、この対応づけに基づいてスペクトログラムの正規化
を行なうようにしたものである。

［作用］この発明に係るスペクトログラムの正規化方式は、既存
のコードブックへの帰属度により入力ベクトルを表現す
るファジィベクトル量子化を用い、従来のままのコード
ブックを用いて異話者間で対応づけを行ない、この対応
づけに基づいてスペクトログラムの正規化を行なうこと
により、量子化歪を低減し、話者適応における学習単語
を増加させることなく高精度にスペクトログラムの正規
化を行なうことができる。

［発明の実施例］第１１図はこの発明の一実施例の電気的構成を説明する
ための概略ブロック図ある。

第１１図において、この発明によるスペクトログラムの
正規化方式を実行するために、アンプ１とローパスフィ
ルタ２とＡ／Ｄ変換器３と処理装置４とが設けられる。

アンプ１は入力された音声信号を増幅するものであり、
ローパスフィルタ２は増幅された音声信号から折返し雑
音を除去するものである。Ａ／Ｄ変換器３は音声信号を
１２にＨｚのサンプリング信号により、１６ビツトのデ
ィジタル信号に変換するものである。処理装置４はコン
ピュータと磁気ディスク６と端末類７とプリンタ８とを
含む。コンピュータ５はＡ／Ｄ変換器３から入力された
音声のディジタル信号に基づいて、後述の第１図ないし
第１０図に示した手法を用いてスペクトログラムの正規
化を行なう。

第１図はこの発明の一実施例の音声の入力から正規化ス
ペクトログラムを出力するまでの全体のフロー図であり
、第２図はファジィベクトル量子化を用いたスペクトロ
グラム正規化のフロー図である。

次に、第１図を参照して、音声の入力から正規化スペク
トログラムの出力までの全体の動作について簡単に説明
する。前述の第１１図に示したアンプ１に音声信号が入
力されると、その音声信号が増幅され、ローパスフィル
タ２によって折返し雑音が除去された後、ステップ（図
示ではＳＰと略称する）ＳＰＩにおいて、Ａ／Ｄ変換器
３によってディジタル信号に変換され、コンピュータ５
に与えられる。コンピュータ５はステップＳＰ２におい
て、ディジタル化された音声信号に基づいて、ＬＰＧ分
析などを行なってその音声の特徴抽出を行なう。さらに
、ステップＳＰ３においてコードブックの生成であるか
否かが判別され、コードブックの生成であることが判別
されると、ステップＳＰ４においてＬＢＧアルゴリズム
によりコードブックが生成され、ステップＳＰ５におい
てそのコードブックが格納される。

なお、上述のＬＢＧアルゴリズムについては、Ｌｉｎｄ
ｅ、Ｂｕｚｏ、Ｇｒａｙ　；　　’Ａｎ　　Ａｌｇｏｒ
ｉｔｈｍ　　ｆｏｒ　　Ｖｅｃｔｏｒ　　Ｑｕａｎｔｉ
ｚｅｒ　　Ｄｉｓｉｇｎ”１ＥＥＥ　　Ｃ０Ｍ−２８（
１９８０−０１）に詳細に記載されている。

一方、ステップＳＰ３においてコードブックの生成では
なく量子化であることが判別されたときには、ステップ
ＳＰ６において、ステップＳＰ５において格納されたコ
ードブックを参照して、ステップＳＰ２において抽出さ
れた音声の特徴がファジィベクトル量子化される。そし
て、ステップＳＰ７において変換コードブックの学習で
あるか否かが判別され、学習であれば、ファジィベクト
ル量子化により生成された符号列と破開数値は、ステッ
プＳＰ８において、ステップＳＰ９で格納されている学
習用標準パターン系列とＤＴＷによりマツチングされる
。そして、ステップ５ＰＩＯにおいて、ＤＴＷマツチン
グの結果のベクトルの対応づけのヒストグラムを用いて
変換コードブックが生成され、その変換コードブックは
ステップ５Ｐ１１において格納される。

前述のステップＳＰ７において、変換コードブック学習
ではなく正規化であることが判別されたときには、ステ
ップ５Ｐ１２において、ファジィベクトル量子化により
生成された符号列がステップ５Ｐ１１で既に格納されて
いる変換コードブックを用いてフレームごとに置換えら
れ、正規化スペクトログラムが出力される。

次に、第２図を参照して、ファジィベクトル量子化を用
いたスペクトログラムの正規化についてより具体的に説
明する。

ファジィベクトル量子化を用いたスペクトログラムの正
規化では、大きく２つの機能から構成されている。１つ
は、第２図におけるステップ５Ｐ２２におけるファジィ
ベクトル量子化であり、ステップ５Ｐ２１においてコー
ドブックの生成であることが判別されると、ステップ５
Ｐ２３で格納されている既存のコードベクトルに対する
帰属度を用いて入力ベクトルが表現される。第２は、ス
テップ５Ｐ２４におけるスペクトル変換（正規化）であ
り、学習用単語を未知話者に発声させることでベクトル
の対応づけが行なわれる。ここでは、全学習用単語につ
いて求められた対応づけのヒストグラムを求め、これを
重み゛として未知話者のコードブックの特徴ベクトルが
標準話者のコードブックの特徴ベクトルの線形結合で表
わされ、これが変換コードブックとしてステップ５Ｐ２
５において格納され、正規化時には入力されたスペクト
ルをフレームごとに変換コードブックを用いてスペクト
ルの変換が行なわれる。

第３図は入力ベクトルとコードベクトルとの関係を示す
図である。次に、第３図を参照してファジィベクトル量
子化についてより詳細に説明する。

ファジィ集合は、一般の集合と異なり要素の属性Ｕ＾は
２値ではなく、０から１の連続値で表現されるため、曖
昧さおよび確信度を含むクラスタリングを行なうことが
できる。ファジィベクトル量子化は、Ｅ、Ｒｕ５ｐｉｎ
ｉ；　　’Ｎｕｍｅｒｉｃａｔ　　Ｍｅｔｈｏｄ　　ｆ
ｏｒ　　Ｆｕｚｚｙ　　Ｃｌｕｓｔｅｒｉｎｇ’　　Ｉ
ｎｆ、　　　Ｓｃｉ、Ｖｏｌ。

２（１９７０）およびＪ、Ｃ，Ｄｕｎｎ：　　’ＡＦｕ
ｚｚｙ　　Ｒｅ１ａｔｉｖｅ　　ｏｆ　　ｔｈｅＩＳＯ
ＤＡＴＡ　　Ｐｒｏｃｅｓｓ　　ａｎｄ　　ｉｔｓ　　
Ｕｓｅ　　ｉｎ　　Ｄｅｔｅｃｔｉｎｇ　　Ｃａｍｐａ
ｃｔ、Ｗｅｌｌ　　５ｅｐａｒａｔｅ　　Ｃ１ｕｓｔｅ
ｒｓ”　Ｊｏｕｒｎａｌ　　ｏｆ　　Ｃｙｂｅｒｎｅｔ
ｉｃｓ　　Ｖｏｌ　　３（１９７４）において記載され
ているファジィＣ−Ｍｅａｎｓ　　Ｃｌｕｓｔｅｒｉｎ
ｇ　　Ａｌｇｏｒｉｔｈｍを用いる。

このアルゴリズムは、２乗誤差最小の規範の下でクラス
タリングを行なうものである。このファジィＣ−Ｍｅａ
ｎｓ　　Ｃｌｕｓｔｅｒｉｎｇについては次のように定
義されている。すなわち、第３図に示すように、入力ベ
クトルＸＫ　　（ｎｌ−ｎ４）の要素数をｎとし、クラ
スタ（ｃｌ〜ｃ４）数をＣとし、入力ベクトルＸ（のセ
ントロイド（Ｖｌ〜Ｖｎ）Ｖｌに対する級関数をｕｌｋ
　とするとき、目的関数ＪＩ、ｌは次のように定義され
る。

ｄ＋　ｋ−１ＩＸｔ　−Ｖｌ　ＩＩ　：　Ｉｔ、　ＩＩ
はＥｕｃ　ｌ　ｉｄ　　　ｄｉｓｔａｎｃｅｍ二重み係数二ｍε（１，ｏｏ）Ｖ　−（ｖ　１−ｖ、）　　：コードブックこの目的関
数ｊｍを最小化するようにｕｌｋが決定される。ファジ
ィ級関数の定義から、Σｕ　ｌ　Ｊ　−１ λｚ１のちとで、目的関数ｊｍが最小化される。これは、ラグ
ランシュの未定乗数λを用いて、Ｄ　”　Ｊ　ｍ−λ（Σｕ＋　Ｊ　−１）の最少化から
求めることができ、次の結果が得られる。すなわち、ｍ
をｍｔ＝　（１，ｏｏ）　、　ｘはｃくｎなる要素を持
つものとし、任意のｋに対して、Ｉｋを次のように決め
るとき、Ｉｔ＝（ｉｌｌ≦ｉ≦ｃ；’ｌｋ＝　１ｌｘｉ　　　ｖｌ　ＩＩ　−ｏ）■、−（１，２
，・・・＊　　ｃ）−１゜ｕｌｋが目的関数Ｊ、、、を
最小化する条件は、次のようになる。

ｍｌまたは、 ■に≠０→ｕ１，１ｌｌｌＯとき、ｕ＋ｒ−１／ｃで、５ｏｆｔ　　ｄｅｃｉｓｔｏ
ｎ、ｍ−＋１のとき、従来のｈａｒｄ　　ｄｅｃｉｓｉ
ｏｎによるクラスタリングとなる。したがって、ｍ−１
のときに限り、２乗誤差最小に基づく本クラスタリング
はベクトル量子化に近づく。

ここでは、ｍｅ（１，”）に拡張した場合も含めてファ
ジィベクトル量子化と呼ぶことにする。

コードベクトルについては、目的関数Ｊ、をクラスタ固
定で求めればよいが、逆に入力ベクトルについて解けば
、次の第２式が求まる。

・・・（２）したがって、セントロイド（ｖＯｎ　・・・、ｖｃ）の
線形結合で、新しいコードベクトルを構成することがで
き、近似的にコードブックサイズを増加させることにな
る。さらに、コードベクトル（Ｖ。、・・・ｌ　ｖｃ）
を特徴空間がｃｏｎｖｅｘになるように選んでおけば、
入力ベクトルは上述の式のように分解することができ、
ベクトル量子化の意味でも、わずかの歪で量子化できる
。しかしながら、ファジィベクトル量子化の方法では、
入力Ｘ、に対してすべてのコードベクトルに対して級関
数を計算し、記憶しなければならない。ここでのすべて
のコードベクトルに関する級関数の計算は膨大なものと
なってしまう。

そこで、この発明では、この問題を解決するために、ｋ
近傍則を導入する。これは、入力Ｘ、に対して最も距離
の小さかったコードベクトルからに番目までに対しての
み破開数を計算するものである。これにより、破開数の
計算かに個のコードベクトルに対してのみで済み、スペ
クトル歪を小さくできる。これは、ファジィクラスタリ
ング理論におけるａ−ｃｏｒｅ集合（ｕ／ｕ＞ａｔ　に
非常に近いものといえ、さらに高速化を図った方法であ
る。ところが、一般にｋの値とｆｕｚｌｎｅＳＳの値は
無相関ではない。このため、スペクトル歪が最小になる
ように繰返しアルゴリズムを構成して最適なｋとｆｕｚ
ｉｎｅｓｓを求める。−例として、ｋ−６，ｆｕｚｉｎ
ｅｓｓが１．６のときに量子化歪が最小であった。

第４図はｋ近傍則を導入してファジィベクトル量子化す
る方法を説明するためのフロー図であり、第５図はファ
ジィベクトル量子化のより具体的なフロー図である。

前述の第１１図に示したＡ／Ｄ変換器３によっ、　　て
１２ｋＨｚの周波数のサンプリング信号で１６ビツトに
Ａ／Ｄ変換された音声信号に対して、ステップ５Ｐ３１
において１４次の自己相関分析によるＬＰＧ分析が行な
われ、パワーと自己相関係数とＬＰＣケプストラム係数
とが抽出される。ステップ５Ｐ３２において、コードブ
ックの生成であるか否かが判断され、コードブックの生
成であれば、ステップ５Ｐ３３において、ＬＢＧアルゴ
リズムによるコードブックが生成される。生成されたコ
ードブックはステップ５Ｐ３４において格納される。

ステップ５Ｐ３２においてコードブックの生成ではなく
量子化であることが判別されたときには、ステップ５Ｐ
３５において、ステップ５Ｐ３４におけるコードブック
を参照してファジィベクトル量子化が行なわれる。この
ファジィベクトル量子化では、ｋ近傍則を導入している
ので、出力はに個のベクトルコードのインデックスと紙
間数値となる。このファジィベクトル量子化について、
第５図を参照してより詳細に説明する。

ステップ５Ｐ４１において、入力ベクトルｘｋに対して
、ステップ５Ｐ４２で格納されているコードブックを参
照して、すべてのコードベクトルと距離計算が行なわれ
る。その後、ステップ５Ｐ４３において、最も近いコー
ドベクトルから順次に個のソーティングが行なわれる。

既存のコードベクトルと一致する入力はほとんど生起し
ないが、計算語長の関係上発生し得るので、ステップ５
Ｐ４４においてに個のコードベクトルのそれぞれ距離が
ｄ、、−〇であるか否かが判定される。距離が０になる
コードベクトルがなければ、ステップ５Ｐ４６において
、前述の第（１）式を用いて、ｋ個のコードベクトルに
対する破開数の値ｕｌｋが求められる。もし、コードベ
クトルで０になるものがあれば、ステップ５Ｐ４５にお
いて、０でないコードベクトルに対する破開数の値を０
とし、０のものをΣｕｌ、−１となるようにｕｌｋが決
定される。これによって、ｋｌｌのコードベクトルのイ
ンデックスと破開数の値が出力される。

第６図は変換コードブック学習のアルゴリズムを示すフ
ロー図であって、前述の第２図に示したステップ５Ｐ２
４およびステップ５Ｐ２５をより詳細に示したものであ
る。

次に、第６図を参照して、スペクトルの変換（正規化）
および変換コードブックの生成方法について説明する。

まず、学習用単語を未知話者に発声させる。この入力音
声はステップ５Ｐ５１において、ステップ５Ｐ５２で格
納されているコードブックを用いてファジィベクトル量
子化される。

量子化された符号列は、ステップ５Ｐ５３において、ス
テップ５Ｐ５４で既に格納されている標準話者の同一単
語の学習用標準パターンとＤＴＷによりマツチングされ
、未知話者と標準話者が発声した同一学習単語でＤＰバ
バスらベクトルの対応づけが求められる。そして、全学
習単語について対応づけが求められ、ヒストグラムの形
で格納される。ファジィベクトル量子化を用いた方法で
は、ファジィベクトル量子化の符号系列に対して対応が
求められるので、１度に複数のベクトルコードの対応を
積算することができる。ファジィベクトル量子化の場合
には、破開数の値をそのまま用いるので、確からしさの
連続値を積算することができる。

このヒストグラムを用いて、ステップ５Ｐ５５において
、未知話者の特徴ベクトルが、ステップ５Ｐ５６で格納
されている標準話者のコードブックの特徴ベクトルの対
応づけのヒストグラムを重みとした加重和で表わされる
。次に、ステップ５Ｐ５８において収束であるか否かが
判別され、収束でなければステップ５Ｐ５７において、
ｂ′の変換コードブックによって未知話者のコードブッ
クが入換えられ、同様の処理が繰返される。この繰返し
を一定回数または全学習単語に対するＤＴＷ距離が集束
するまで繰返され、ステップ５Ｐ５８において、集束し
たことが判別されると、ステップ５Ｐ５９において、最
終的な変換コードブックが得られる。

第７図は未知話者から標準話者への変換コードブック生
成アルゴリズムを説明するための図であり、第８図はフ
ァジィベクトルを用いたヒストグラム積算方式を説明す
るための図である。

前述のファジィベクトル量子化のに近傍の数をｋとすれ
ば、学習時の１フレーム対応かに２個のヒストグラム積
算が可能となり、学習サンプル数奔低減できる。第７図
に示すように、未知話者Ａの入力ベクトルＸ、はベクト
ル量子化により第８図に示すようにａ、に符号化された
後、対応づけのヒストグラムｈｌＪを用いて第７図に示
す標準話者Ｂのコードブックのベクトルｂ、からの線形
結合で表わされ、標準話者の空間ｂ′１に次式により写
像される。

Ｂ　、　−ｂ’　、−Σｈ＋　Ｊ　ｂｊ／ΣｈｉＪ第９
図はスペクトログラム正規化のアルゴリズムを説明する
ためのフロー図である。次に、第９図を参照してスペク
トルの正規化について説明する。ステップ５Ｐ６１にお
いて、未知話者Ａの入力音声が、ステップ５Ｐ６２で既
に格納されているコードブックを用いて、ファジィベク
トル量子化され、ステップ５Ｐ６３において、ステップ
５Ｐ６４で求められて格納されている未知話者から標準
話者への変換コードブックを用いて未知話者のコードブ
ックが入換えられ、フレームワイズにスペクトルの入替
えを行なって正規化スペクトログラムが出力される。フ
ァジィベクトル量子化では、入力のベクトルは既存のコ
ードブックからの合成で表わされる。したがって、既存
のコードブックを変換コードブックに入換え、破開数の
値はそのままに保存して変換が行なわれる。話者間の空
間構造の異なりが問題となるが、ヒストグラムによる変
換コードブック生成、ｋ近傍則によるれ部分空間の選択
により、破開数の値がある程度保存されるものと仮定で
きる。

第１０図はマツチングにより非線形な時間軸の対応付け
を求める方法を説明するためのフロー図である。次に、
第１０図を参照して、マツチング方法について説明する
。ファジィベクトル量子化により、各フレームごとにに
個のコードワードとに個の破開数が出力される。ステッ
プ５Ｐ７１において、ステップ５Ｐ７２において格納さ
れているコードブックを用いて、前述の第２式に従って
、フレームごとに入力ベクトルＸ　／１が生成され、入
カバターンが再生成される。次に、ステップ５Ｐ７３に
おいて、標準パターン側も同様にして、ステップ５Ｐ７
６で格納されている標準パターンコード列からコードワ
ードと破開数が読出され、ステップ５Ｐ７４で格納され
ているコードブックを参照して、第２式に基づいて標準
パターンが再生成される。

次に、ステップ５Ｐ７５において、この入カバターンと
標準パターンとがＤＴＷによりマツチングされ、距離が
求められる。ここでのＤＴＷにおける最小距離のときの
対応付けが最適な単語の非線形な時間軸対応を示し、こ
れによりベクトルコードの対応付けを求めることができ
る。

［発明の効果］以上のように、この発明によれば、既存のコードブック
への帰属度により入力ベクトルを表現するファジィベク
トル量子化を導入したことによって、従来のままのコー
ドブックを用いながら量子化工を低減し、また話者適応
における学習単語を増加させることなく高精度でスペク
トログラムの正規化を行なうことができる。

【図面の簡単な説明】

第１図はこの発明の一実施例の音声の入力から正規化ス
ペクトログラムの出力までの全体のフロー図である。第
２図はファジィベクトル量子化を用いたスペクトログラ
ム正規化のフロー図である。第３図は入力ベクトルとセントロイドとの関係を示す図
である。第４図はに近傍則を導入したファジィベクトル
量子化する方法を説明するためのフロー図である。第５
図はファジィベクトル量子化のより具体的なフロー図で
ある。第６図は変換コードブック学習のアルゴリズムを
示すフロー図である。第７図は未知話者から標準話者へ
の変換コードブックアルゴリズムを説明するための図で
ある。第８図はファジィベクトルを用いたヒストグラム
積算方式を説明するための図である。第９図はスペクト
ログラム正規化のアルゴリズムを説明するためのフロー
図である。第１０図はマツチングにより認識結果を出力
する方法を説明するためのフロー図である。第１１図は
この発明の一実施例の電気的構成を説明するための概略
ブロック図である。第１２図は従来のベクトル量子化を
用いた音声認識方法を説明するための図である。第１３
図は従来のベクトル量子化における歪を説明するための
図である。図において、１はアンプ、２はローパスフィルタ、３は
Ａ／Ｄ変換器、４は処理装置、５はコンピュータを示す
。特許出願人　株式会社エイ・ティ・アール第１図第２図未知話者の入力音声正規化スベクトロダラム第８図第４図コーｒり１」★Ｋ１１ｌ第５図入力ベクトルＸｋド、繊閣以第６図図面の浄書８７図第９図正　　スペクトログラム第１０図第１２図第１３図手続補正書（さべ）昭和６３年７月８日昭和６３年特許願第　６５５４２　　号昭和　　年　　
月　　日提出の特許願２、発明の名称スペクトログラムの正規化方式３、補正をする者事件との関係　　特許出願人住　所　京都府相楽郡精華町大字乾谷小字三平谷５番地
名　称　株式会社エイ・ティ・アール自動翻訳電話研究
所代表者　鳩松　　明４、代理人住　所　大阪市北区南森町２丁口１番２９号　住友銀行
南森町ビル６、補正の対象図面７、補正の内容図面の第７図を別紙のとおり補正致します。以上

Claims

【特許請求の範囲】

（１）音声信号の特徴としてスペクトログラムを抽出し
、このスペクトログラムを異話者間で正規化するスペク
トログラムの正規化方式において、入力ベクトルを既存のコードベクトルへの帰属度で表現
するファジィベクトル量子化を行なった後、スペクトロ
グラムを抽出し、異話者間でのベクトル量子化のコード
ブックの対応づけに基づくコードベクトルの変換を行な
い、スペクトログラムの正規化を行なうようにした、ス
ペクトログラムの正規化方式。
（２）前記ファジィベクトル量子化はｋ近傍則を用いる
ことを特徴とする、請求項１項記載のスペクトログラム
の正規化方式。
（３）前記異話者間のコードベクトルの対応付けの方法
として、予め未知話者に所定の学習単語を発声させ、ｋ
近傍則を用いたファジィベクトル量子化により量子化し
、別途同様の方法で量子化し格納されている標準パター
ンと非線形マッチングを行ない、この対応付けの最適パ
スに沿って、ファジィ級関数から対応付けヒストグラム
を作成し、標準話者のコードベクトルからこのヒストグ
ラムを重みとする線形和でベクトルを合成し、未知話者
のコードベクトルをこのベクトルに対応付けることによ
りなすことを特徴とする請求項１項記載のスペクトロク
ラムの正規化方式。