JPH0336440B2

JPH0336440B2 -

Info

Publication number: JPH0336440B2
Application number: JP14362786A
Authority: JP
Inventors: Tooru Sanada
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1986-06-19
Filing date: 1986-06-19
Publication date: 1991-05-31
Also published as: JPS62299899A

Description

【発明の詳細な説明】〔概要〕本発明は発音練習機システム等において音素／
ｉ／との類似度を用いた、よう音・直音（例えば
「病院」と「美容院」）の言い分け評価において発
生する大きな評価誤りを解決するため、帯域／全
域スペクトル強度比を用いて、音素／ｉ／との類
似度を計算することによつて、よう音・直音の言
い分け評価の大きな誤りを減少させたものであ
る。

〔産業上の利用分野〕

本発明は発音練習機のよう音・直音言い分けの
練習等における発音評価方式、特に音素／ｉ／と
の類似度を用いる方式に関する。

発音練習機等の発音評価は評価誤りが少ないこ
とが要求されるが、特に、大きな誤りが少ない発
音評価方式が必要とされている。

〔従来の技術〕

よう音を含む、すなわち音素列／子音／＋／
ｊ／＋／母音／を含む単語と、そのミニマルペア
として、直音を含む、すなわち、音素列／子音／
＋／ｉ／＋／ｊ／＋／母音／を含む単語の言い分
けを、よう音を含む単語に／ｉ／の特徴が現われ
る部分と、直音を含む単語に／母音／の特徴が現
れる部分が語頭から測つた時間がほぼ同じことを
利用して、この部分と音素／ｉ／との類似度を用
いて評価する、よう音・直音言い分け評価方式が
提案されている。

第４図は、よう音を含む単語と直音を含む単語
の音素列の一例であり、この例により上記評価方
式について説明する。

「病院」と「美容院」を音素列で表すと、／
bjooiN／とbijooiN／になる。ここで、音素／
ｊ／は速く発音された音素列／io／に近い音であ
る。（一般に、音素列／ｊ／＋／母音／の中の／
ｊ／は、速く発音された音素列／ｉ／＋／母音／
に近い音である。）そこで、／bjooiN）と／
bijooiN／の中の／ｊ／を／io／で置き換える
と、／bioooiN／と／biioooiN／になる（第４
図）。しかもこの／bioooiN／の３番目の音素と
４番目の音素の前部による音素列／oo／（第４
図）と／biioooiN／の２番目の音素の後部と
３番目の音素による音素列／ii／（第４図）が
発音されるのは発音開始から測つた時間がほぼ同
じである。したがつて、この時間が分かつていれ
ば、発音開始からこの時間だけ経過した時点での
音声を分析して、／ｉ／に近いか／ｏ／に近いか
を調べることにより「病院」と「美容院」のどち
らが発音されたか知ることができる。そして、こ
の音素列／oo／と音素列／ii／は基の音素列／
bjooiN／と／bijooiN／の中の／ｊ／の後部か
ら／ｏ／の前部にかけての部分と／ｉ／の後部か
ら／ｊ／の前部にかけての部分にそれぞれ対応し
ている。

従来のよう音・直音言い分け評価方式の構成図
を第３図に示す。図中、１６は音声入力回路、１
７はスペクトル計算回路、１７ａはパワースペク
トル計算回路、１７ｂは対数化回路、１８は第１
ホルマント周波数抽出回路、１９は第２ホルマン
ト周波数抽出回路、２０はユークリツド距離計算
回路、２１は標準第１ホルマント周波数発生回
路、２２は標準第２ホルマント周波数発生回路、
２３は評価出力回路、２４は評価値テーブルであ
る。また、音声入力回路１６によつて語頭から測
つて一定時間後に検出される、よう音を含む単語
の／ｊ／の後部から／母音／の前部に致る部分、
あるいは直音を含む単語の／ｉ／の後部から／
ｊ／の前部に致る部分に対応する部分の音声が入
力され、入力された音声はスペクトル計算回路１
７のパワースペクトル計算回路１７ａおよび対数
化回路１７ｂにより対数化スペクトルに変換され
る。これから第１ホルマント周波数抽出回路１８
および第２ホルマント周波数抽出回路１９によつ
て、第１ホルマント周波数および第２ホルマント
周波数が抽出される。これと標準第１ホルマント
周波数発生回路２１および標準第２ホルマント周
波数発生回路２２によつて発生される音素／ｉ／
の標準第１ホルマント周波数および標準第２ホル
マント周波数との２次元ユークリツド距離がユー
クリツド距離計算回路２０で計算され、音素／
ｉ／との類似度が計算される。この値が評価値テ
ーブル２４を参照する評価出力回路２３によつて
適切な評価に変換されて出力される。

〔発明が解決しようとする問題点〕

従来は第１、第２ホルマントを用いて音素／
ｉ／との類似度を計算しているため、ホルマント
でないピークを誤つてホルマントとして抽出して
しまうと、評価の誤りの度合が大きくなつてしま
う。しかも、ホルマントを抽出する部分が、／
ｊ／から／母音／あるいは／ｉ／から／ｊ／への
遷移部分なのでスペクトルが安定せず、このた
め、ホルマントでないピークを誤つてホルマント
として抽出してしまうことがしばしばある。その
ため、大きく誤つた評価を出力することが多いと
いう問題を生じていた。

（問題点を解決するための手段〕第１図は本発明のよう音・直音言い分け評価回
路の原理ブロツク図である。図中、１は音声入力
回路、２はスペクトル計算回路、３，４は帯域ス
ペクトル強度計算回路Ａ，Ｂ、５は全域スペクト
ル強度計算回路、６は帯域／全域スペクトル強度
比計算回路、７は評価出力回路である。

〔作用〕

本発明の帯域スペクトル強度計算回路Ａ３は／
ｉ／の第１ホルマントが出現する可能性がある帯
域のスペクトル強度を出力し、帯域スペクトル強
度計算回路Ｂ４は／ｉ／の第２ホルマントが出現
する可能性がある帯域のスペクトル強度を出力
し、全域スペクトル強度計算回路５は入力音声帯
域全域のスペクトル強度を出力する。さらに帯
域／全域スペクトル強度比計算回路６は帯域スペ
クトル強度計算回路Ａ３と帯域スペクトル強度計
算回路Ｂ４の出力の和を全域スペクトル強度計算
回路５の出力で割ることによりスペクトル計算回
路２から出力されるスペクトルと音素／ｉ／との
類似度を計算する。このため、スペクトルにホル
マント以外のピークがあつても出力結果に大きな
影響は無く、大きな評価誤りが発生することがな
い。

〔実施例〕

第２図は本発明の一実施例を示す構成図であ
る。図中、８は音声入力回路、９はスペクトル計
算回路、９ａはパワースペクトル計算回路、９ｂ
は対数化回路、１０，１１は帯域スペクトル加算
回路Ａ，Ｂ、１２は全域スペクトル加算回路、１
３は帯域／全域スペクトル強度比計算回路、１３
ａは加算回路、１３ｂは除算回路、１４は評価出
力回路、１５は評価値変換テーブルである。

また、音声入力回路８によつて語頭から測つて
一定時間後に検出される、よう音を含む単語の／
ｊ／の後部から／母音／の前部に致る部分あるい
は直音を含む単語の／ｉ／の後部から／ｊ／の前
部に致る部分に対応する部分の音声が入力され、
入力された音声はスペクトル計算回路９のパワー
スペクトル計算回路９ａおよび対数化回路９ｂに
より対数化スペクトルに変換される。この値を、
帯域スペクトル加算回路Ａ１０が／ｉ／の第１ホ
ルマントが出現する可能性がある帯域において加
算して出力し、帯域スペクトル加算回路Ｂ１１
が／ｉ／の第２ホルマントが出現する可能性があ
る帯域において加算して出力し、全域スペクトル
加算回路１２は入力音声帯域全域において加算し
て出力する。さらに帯域／全域スペクトル強度比
計算回路１３の中の加算回路１３ａが帯域スペク
トル加算回路Ａ１０の出力と帯域スペクトル加算
回路Ｂ１１の出力を加算し、さらに除算回路１３
ｂがこれを全域スペクトル加算回路１２の出力で
除算することによりスペクトル計算回路９から出
力されるスペクトルと音素／ｉ／との類似度を計
算する。この値が評価値テーブル２４を参照する
評価出力回路２３によつて適切な評価に変換され
て出力される。

この実施例によれば、ホルマントの抽出が不要
なのでスペクトルにホルマント以外のピークが存
在しても評価に大きな誤りを発生することがない
という効果がある。

〔発明の効果〕

本発明によれば、ホルマントの抽出が不要なの
でスペクトルにホルマント以外のピークが存在し
ても評価に大きな誤りを発生することがない。

【図面の簡単な説明】

第１図は本発明の原理ブロツク図、第２図は本
発明の一実施例の構成図、第３図は従来例の構成
図、第４図はよう音を含む単語と直音を含む単語
の音素列の一例を示す図である。第１図において、１は音声入力回路、２はスペ
クトル計算回路、３，４は帯域スペクトル強度計
算回路、５は全域スペクトル強度計算回路、６は
帯域／全域スペクトル強度比計算回路、７は評価
出力回路である。

Claims

【特許請求の範囲】１音素列〔／子音／＋／ｊ／＋／母音／〕を構
成要素とし、よう音を含む形式の単語と、音素列〔／子音／＋／ｉ／＋／ｊ／＋／母
音／〕を構成要素とし、直音を含む形式の単語の
言い分けを、直音を含む単語に／ｉ／の特徴が現われる部分
と、よう音を含む単語に／母音／の特徴が現われ
る部分がそれぞれ語頭から測つた時間がほぼ同じ
ことを利用して、この部分と音素／ｉ／との類似
度を用いて評価する方式において、／ｉ／の第１ホルマントが出現する可能性があ
る帯域のスペクトル強度を出力する第１の帯域ス
ペクトル強度計算回路３と、／ｉ／の第２ホルマントが出現する可能性があ
る帯域のスペクトル強度を出力する第２の帯域ス
ペクトル強度計算回路４と、入力音声帯域全域のスペクトル強度を出力する
全域スペクトル強度計算回路５と、上記第１の帯域スペクトル強度計算回路３と、
第２の帯域スペクトル強度計算回路４の出力の和
を上記全域スペクトル強度計算回路５の出力で除
算する帯域／全域スペクトル強度比計算回路６を
設け、上記帯域／全域スペクトル強度比計算回路６の
出力にもとづいて、よう音と直音の言い分けを評
価処理することを特徴とするよう音・直音言い分
け評価方式。