JPH0293500A

JPH0293500A - 発音評価法

Info

Publication number: JPH0293500A
Application number: JP63246733A
Authority: JP
Inventors: Hiroshi Hamada; 浜田　洋
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1988-09-29
Filing date: 1988-09-29
Publication date: 1990-04-04
Anticipated expiration: 2013-01-26
Also published as: JP2704216B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分Ｔｒ］この発明は外国語等の発音の良さを評価する発音評価法
に関するものである。

（従来の技術）従来は、発貰の評価を行う、あるいは、発音の訓練を行
うための装置において、単に教師音声と被験者（被訓練
者）の音声とのスペクトル間の距離を求め、その結果を
発声の良さを表わす値とする方式が取られていた。しか
し、この方式はスペク］・ル間の距離に含まれる教師の
音声と被験者の音声との様々な違いを一括にして扱うた
め、Ｇ伎畜な評価ができない、発音において何が問題で
あるかが明かでなく被験者に発声の何処に問題点がある
かを指摘できない、などの欠点があった。発音の良さを
決める要因としては、（り種々の音韻が正しく発音されているか、（２）音韻
のスペクトルが時間的になめらかに変化しているか、（３）発声における音韻の時間長、音声パワー、ピッチ
などの韻律的特徴が正しく発音されているか、の３点が
挙げられる。一方、発声された音声、特に連続に発声さ
れた音声中の音韻は調音結合の影響で変形しており、個
々の音ｆｉｌを正しく抽出することは非常に困難である
。従って、発音の評価を行うために、また、評価結果か
ら被験者の発声の問題点を明確に指摘するため、これら
の要因を分離し厳密に評価する方式、しかも、それらの
処理が個々の音韻を抽出することなしに扱える方式の実
現が７まれでいた。

〔課題を解決するための手段］この発明は被験者の音声をベクトル量子化することによ
り得られるコードブックを教師音声のコードブックに適
応化することにより得られる適応化ベクトルの妥当性を
用いて、被験者の音声と教師音声との音韻間の対応が正
しく取られているかを定量的に判定し、上記発音の良さ
を決定する要因のうら「種々の音韻が正しく発声されて
いるか」を厳害に評価することにある。また、同時に−
・クトル量子化−話者適応化−適応化ベクトルの評価と
いう手順により、音素を抽出することなしに統計的手法
によって発音の良さを評価することにある。

〔実施例）以下に、この発明の実施例を図面を用いて詳ｔｉｌｌに
説明する。

第１図はこの発明の発音評価法の処理を表わすブロック
図である。

まず、コードブック生成部１において教師および被験者
が発声した音声のクラスタ分析を行い教師および被験者
のコードブックを生成する。教師が発声した音声２を、
音声分析部３において音声のスペクトルの特徴を表わす
パラメータに変換する。音声分析の方法としては、バン
ドパスフィルタ分析、線形予測分析、ＦＦＴ分析など種
々の方法が提案されており、そのいずれかの方式を用い
て分析を行えば良い。ここでは、２次の［、ＰＣ分析に
より得られるＬＰＣケプストラムを特徴パラメータとす
る場合を考える。次に、クラスタリング演（７部４にお
いて教師音声の特ｉＴｈパラメータのクラスタ分析を行
い、あらかじめ定められた数ｎの代表的なスペクトルバ
タン（コードブック）Ｖｔｌ　　　　ＶＬ２　　、　　
・　・　・、　■いを持つ教師音声のコードブック５を
生成する。ただし、■いは１次のＬＰＣケプストラムＶ
、、−（Ｖい、ｌ＋　　Ｖ　Ｌｉ＋　２．　　・　・　
・、　　ｖ　ｔ；、　−１により表わされる。クラスタ
リングの手法については、Ｌｉｎｄｅ、　Ｂｕｚｏ　ａ
ｎｄ　Ｇｒａｙ　”八ｎ　ａｌにｏｒｉｇｈｍ　ｆｏｒ
ｖｅｃｔｏｒ　ｑｕａｎｔｉｚｅｒ　ｄｅｓｉｇｎ　”
　（ＩＩＥＥＥ　Ｔｒａｎｓ、　Ｃｏｍｍ。

ｖｏｌ、　Ｃ０Ｍ−２８、ｌり８０）に詳しい。

一方、被験者が教師と同じ１″１１声１文章等）を発声
する。被験、どの音声６も教師の音声と同様に音声分析
部７で２次のＬＰＣケプストラムに変換された後、クラ
スタリング演算部８でクラスタ分析され１１個のコード
ベクトルを持つ被験者のコードブック９、Ｖ、、、Ｖ、。、・　・　・、　■いがｉ）られる。ただし、■１．は１次のＬＩ’Ｃヶプス
１−ラムＶ、、＝　　（Ｖ、、、、、Ｖ、、、２．　　・　・　
・、　　Ｖｓ；、ｐｌにより表わされる。

次に、話者適応ｊヒ部１０において、被験者のコードブ
ック９を教師のコードブック５に適応化する。話者適応
化の手法については種々提案されているが、ここでは鹿
野により提案されたヒストグラムを用いる方法（Ｓｈｉ
ｋａｎｏ、　Ｌｅｅ　ａｎｄ　Ｒｅｄｄｙ”５ｐｅａｋ
ｅｒ　ａｄａｐｔａｔｉｏｎ　ｔｈｒｏｕｇｈ　ｖｅｃ
ｔｏｒ　ｑｕａｎｔｉｚａＬｉｏｎ”　（ＩＩＥＥＥ　
、　１ｃＡｓｓｌ’８６　、４９．５　、１９８６）参
ｊ！；ｊ　）を用いた例を示す。

まず、ベクトル星γ−化部１１において、コートブ、り
生成部ｌで作成された被験者のコードブック９を用いて
被験Ｈの音声をベクトル量子化（？）号化）する。また
、ベクトル量子化部１２において同様に、教師のコード
ブック５を用いて教師の音声をベクトル量子化（符号化
）する。

次に、マツチング演算部１３において、被験どの音声を
表わすベクトルコート列と教師の音声を表わす・・、ク
トルコー１列とのマノナング演算を行い、破！Ｓｊｉ　
”Ｈの音声と教師音声との時間軸上での対応を取る。マ
ンナング演算には、ＤＰマンチング法、１１財などの手
法を用いれば良い。

次に、ヒストグラム生成部１４においてマツチング演算
部１３で得られた被験者のコードへクトルと教師のコー
ドベクトルとの対応を表わすヒストグラムを生成する。

最後に、適応化コードブック生成部１５において、ヒス
トグラムに従って教師のコードベクトルの線形結合によ
り教師の音声に適応した被験者のコードベクトルを作成
する。具体的には以下の弐により教師音声に適応した被
験者のコードブック１６をｊ７る。

（ｉ＝１．　　・　・　・、　　ｎ）ただし、ａｉｊは被験者のコードベクトルＶ　ｓｉに対
応する教師のコードベクトルＶＬｊのヒストグラムの値
、■や、は教師の音声に適応した被験者のコドブノク１
６を構成するコードベクトルで■２、−（■１゜＋　ｌ
　＋　　Ｖ　Ａｉ＋　２．・・・、　　Ｖ、ｉ、、１で
ある。

話者適応化の方法についてはこの手法に限らず他の手法
も適用することができる。その場合は、適応化６４算部
１７をその方式に置き替えれば良い。

以上の一連の処理で得られた被験者のコードブック９、
及び、教Ｃｌ１ｉｆｆ声に適応化した被験−汗のコード
ブック１６を用いて、適応化ベクトル評価部１８におい
て適応化ベクトルの妥当性を評価し、発音の良さを評価
する。

被験者のコードブック９内のコードベクトルおよび教師
のコードブック５内の二）−ドベクトルは、被験者およ
び教師の音韻スペクトルを表わしている。音韻の数は音
素の数よりも通常は多く、その故はｎを変えることによ
り自由に決定することができる。ｎの値としては１２８
や２５６が通常用いられる。また、適応化後のコードブ
ック１６内のコードベクトルは、教師音声のスペク１−
ル空間上に写像した被験どの音韻スペクトルを表わして
いる。従って、適応化前の被験者のコードブックと適応
化後のコードブックとの間の関係を表わす適応化ベクト
ルは被験汗が音ａ口を正しく発声しているかを表わすベ
クトルであると考えることができる。第２図に適応化ベ
クトルの模式Ｖを示す。

第２図（ａ）は被験者が音αＵを誤って発声している場
合で、被験者の音韻と教師の］＋１とが異なった対応を
示している。第２図（ｂ）は被験者が音韻をはっきり区
別していない場合で、適応化後のコードベクトルの分翔
１が非常に悪くなっている。さらに、第２図（Ｃ）は被
験者が音■を区別してはいるが分離が悪い場合である。

一方、正しい発声をした場合は、第２図（ｄ）に示す場
合のように適応化ベクトルが被験者と教師との声道長な
どの差に起因する個人性のみを表わしているものになり
、それぞれの適応化ベクトルは平行に近いものになる。

従って、適応化ベクトルが平行かつベクトル長が均一で
あるほどよい発声である。

まず、「適応化ベクトルの各方向成分の分散を用いる方
法」の場合について、以下に第１図に従って手順を示す
。初めに、適応化ベクトル演算部１９において被験者の
コードブック９と教師の音声に適応したコードブック１
６との間の対応を表わす適応化ベクトル２０を求める。

適応化へクトルし、は次式により求められる。

Ｕ、　　＝Ｖ、、−Ｖ、。

−［Ｖａｔ、＋　　Ｖｔｉ＋ｌ＋　　Ｖａｔ、Ｚ　　Ｌ
ｉ、２・　・、　　Ｖ、、、、−Ｖ、、１．１−（Ｕｔ
ｌ、Ｕ□、２．・・・、（］３．Ｐ）次に、得られた適
応化へクトルし、の各成分ごとの分散の総和を評価値演
算部２１において求める。

ずなわち評価（ａ巨ｖ１は、により求められる。ただしＵＩＶＩ！＋１　は第ｊ方向
成分の平均値でＵ□。１、−　Σ　Ｕ１２、／ｎである。この評価値Ｅ□、が小さいほど適応化ベクトル
としては平行かつ長さが安定したものであり、良い発音
であるといえる。最終的に、評価値Ｅ　ｖａｔをそのま
まの値、あるいは、１００点満魚の評価値、５段階８′
ｒ価等に変換して発音３１Ｖ価結果２２を出力する。

次に、適応化ベクトルの妥当性を表わす評価値として、
平均適応化ベクトルと各適応化ヘクＩ・ルとの間の角度
を用いる場合について説明する。この場合は、先に述べ
た適応化ベクトルの平行性のみについて評価する方法で
ある。まず、先の場合と同様に適応化ベクトル演算部１
９において被験者のコードブックと教師の音声に適応し
たコードブックとの間の対応を表わす適応化ベクトルＵ
、を求める。また、適応化ベクトルの平均ベクトルＵａ
ｖ、を求める。次に、評価値／ｉｉｉ算部においてｎ個
の適応化ベクトルと平均ベクトルとの間の角度θ、　　
（ｉ−１，・・・、ｎ）を次式により求める。

θ；　　−ｃｏｓ−’　（（Ｕｔ　、　　Ｕ、、−）　
／（＋１　Ｕｒ　　ＩＩ　　−ＩＩ　Ｕｍ、、　　ｉ　
）　　）ただし、（Ｕ、　、Ｕ、、、）は適応化ベクト
ルＵ。

と平均適応ベクトルＵ　ｅｖｅ　との内聞を表わし、（
Ｕｉ　　、Ｕ、ｖ、　　）　　−Σ　（Ｕｔ　　、＝　
　×Ｕａｖｅ　、Ｊ）である。また１ｉＵｌｌはベクト
ルＵ、のノルムを表わし、である。以上の処理により求められたｎ個の角度から評
価（！Ｅｖａ＋　を計算する。評価値としては、角度θ
、の絶対値の総和Ｅ　ｖａｔ　　−Σ　　　　θ１や、角度θ、の２乗和Ｅｖａｌ”　　Σ　θ、′ を用いればよい、この値が小さいほど良い発音である。

最終的に得られた評価値、あるいは、１００点満点の評
価値や５段階評価等に変換して発音評価結果２２を出力
する。

次に、適応化ベクトルの妥当性を表わす評価値として、
適応化前のコードブック内のへクトルコートの分散と適
応化後のコードブック内のコートベクトルの分散の比を
用いる場合について説明する。これは、第２図ｆｂ）、
　（Ｃ）に示したように被験汗が音ｉｉＱをはっきり区
別していない場合、被験打が音α１１を区別してはいる
が分離が悪い場合に、適応化前のコートベクトルの分布
範囲と適応化後のコ１ベクトルの分布範囲が大きく異な
ることを利用したものである。まず、適応化前のコード
ブック内のコートベクトルの分ｊ枚と、Ｊ９化後のコー（ブック内のコードブックトルの分
散を求める。ただしｙ　、　ａｖｅ　、　ｖ、　ａｖｅは
それぞれｃｌｉｓＬ　（Ｖ、　、　　Ｖ７　）はコード
ベクトルＶ；ａＪ−トベクトルｖＪとの間のスペクトル
距離である。

スペクトル距離としてはそれぞれのパラメータにあった
ものを用いれば良（、ＬＰＣケプストラムの場合はユー
クリッド距離などがよく使われる。評価値Ｅ　ｖａｔ　
は以上で求められた分散り。、１〕１　を用いて、例え
ば、ＥＶ−Ｌ　　＝ｍ＋ｎ　　　（Ｄｏ　　、　　ＤＩ　　
）／ｍａｘ　　（Ｄｏ　　、　　ＤＩ　）により求める
ことができる。評価値の計算はこの式に限らすＤｏとり
、の等しさを表わすものであれば良い。上の式を用いた
場合は値が１に近い程よい発声である。この場合も他の
適応化ヘクｌル評価の時と同様、評価値Ｅ□１をそのま
まの値、あるいは、１００点満点の評価値、５段階１坪
価等に変換して発音評価結果２２を出力する。

評価値としては上記３例に限らず、適応化前のコードブ
ックと適応化後のコードブックの関係が音韻の対応とし
てみた場合に妥当であるか否かを表わしているものであ
れば艮い。また、例えば上記３例の評価値の線形和など
種々の評価値の組みあわ拷で最終的な、ｉｆ　１ｔｌｌ
ｉ値を求めても良い。

〔発明の効果〕

以上説明したように、この発明によれば、従来被験者と
教師との音声のスペクトル開路なのみにより行っていた
発音の良さの評価を、特に音韻が正しく発声されたかと
いう点に関してＩｆに行うことができる。また、ベクト
ル量子化の手法を用いてコードブンクを作成し、教師音
声に適応化した後、適応化ベクトルを用いて発音の良さ
を評価しているため、個々の音韻を抽出する必要がなく
、統計的に処理できるという利点がある。

【図面の簡単な説明】第１図はこの発明による発音評価法の実施例を示すブロ
ック図、第２図は適応化ベクトルの評価の考え方を表わ
ｒ模式図である。特許出願人二口本電信電話株式会社

Claims

【特許請求の範囲】

（１）発音の標準とされる教師が発声した音声を分析し
た後クラスタリングしコードブックを作成し、被験者の音声を分析した後クラスタリングしてコードブ
ックを作成し、その被験者音声のコードブックと上記教師音声のコード
ブックとから上記被験者音声から上記教師音声への適応
化ベクトルを求め、その得られた適応化ベクトルから上記被験者の音声の発
声の良さを表わす評価値を求めることを特徴とする発音
評価法。