JPH0336440B2 - - Google Patents
Info
- Publication number
- JPH0336440B2 JPH0336440B2 JP14362786A JP14362786A JPH0336440B2 JP H0336440 B2 JPH0336440 B2 JP H0336440B2 JP 14362786 A JP14362786 A JP 14362786A JP 14362786 A JP14362786 A JP 14362786A JP H0336440 B2 JPH0336440 B2 JP H0336440B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- calculation circuit
- circuit
- vowel
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001228 spectrum Methods 0.000 claims description 47
- 238000011156 evaluation Methods 0.000 claims description 28
- 230000003595 spectral effect Effects 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 3
- 239000000470 constituent Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003796 beauty Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 241000234282 Allium Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Description
【発明の詳細な説明】
〔概要〕
本発明は発音練習機システム等において音素/
i/との類似度を用いた、よう音・直音(例えば
「病院」と「美容院」)の言い分け評価において発
生する大きな評価誤りを解決するため、帯域/全
域スペクトル強度比を用いて、音素/i/との類
似度を計算することによつて、よう音・直音の言
い分け評価の大きな誤りを減少させたものであ
る。
i/との類似度を用いた、よう音・直音(例えば
「病院」と「美容院」)の言い分け評価において発
生する大きな評価誤りを解決するため、帯域/全
域スペクトル強度比を用いて、音素/i/との類
似度を計算することによつて、よう音・直音の言
い分け評価の大きな誤りを減少させたものであ
る。
本発明は発音練習機のよう音・直音言い分けの
練習等における発音評価方式、特に音素/i/と
の類似度を用いる方式に関する。
練習等における発音評価方式、特に音素/i/と
の類似度を用いる方式に関する。
発音練習機等の発音評価は評価誤りが少ないこ
とが要求されるが、特に、大きな誤りが少ない発
音評価方式が必要とされている。
とが要求されるが、特に、大きな誤りが少ない発
音評価方式が必要とされている。
よう音を含む、すなわち音素列/子音/+/
j/+/母音/を含む単語と、そのミニマルペア
として、直音を含む、すなわち、音素列/子音/
+/i/+/j/+/母音/を含む単語の言い分
けを、よう音を含む単語に/i/の特徴が現われ
る部分と、直音を含む単語に/母音/の特徴が現
れる部分が語頭から測つた時間がほぼ同じことを
利用して、この部分と音素/i/との類似度を用
いて評価する、よう音・直音言い分け評価方式が
提案されている。
j/+/母音/を含む単語と、そのミニマルペア
として、直音を含む、すなわち、音素列/子音/
+/i/+/j/+/母音/を含む単語の言い分
けを、よう音を含む単語に/i/の特徴が現われ
る部分と、直音を含む単語に/母音/の特徴が現
れる部分が語頭から測つた時間がほぼ同じことを
利用して、この部分と音素/i/との類似度を用
いて評価する、よう音・直音言い分け評価方式が
提案されている。
第4図は、よう音を含む単語と直音を含む単語
の音素列の一例であり、この例により上記評価方
式について説明する。
の音素列の一例であり、この例により上記評価方
式について説明する。
「病院」と「美容院」を音素列で表すと、/
bjooiN/とbijooiN/になる。ここで、音素/
j/は速く発音された音素列/io/に近い音であ
る。(一般に、音素列/j/+/母音/の中の/
j/は、速く発音された音素列/i/+/母音/
に近い音である。)そこで、/bjooiN)と/
bijooiN/の中の/j/を/io/で置き換える
と、/bioooiN/と/biioooiN/になる(第4
図)。しかもこの/bioooiN/の3番目の音素と
4番目の音素の前部による音素列/oo/(第4
図)と/biioooiN/の2番目の音素の後部と
3番目の音素による音素列/ii/(第4図)が
発音されるのは発音開始から測つた時間がほぼ同
じである。したがつて、この時間が分かつていれ
ば、発音開始からこの時間だけ経過した時点での
音声を分析して、/i/に近いか/o/に近いか
を調べることにより「病院」と「美容院」のどち
らが発音されたか知ることができる。そして、こ
の音素列/oo/と音素列/ii/は基の音素列/
bjooiN/と/bijooiN/の中の/j/の後部か
ら/o/の前部にかけての部分と/i/の後部か
ら/j/の前部にかけての部分にそれぞれ対応し
ている。
bjooiN/とbijooiN/になる。ここで、音素/
j/は速く発音された音素列/io/に近い音であ
る。(一般に、音素列/j/+/母音/の中の/
j/は、速く発音された音素列/i/+/母音/
に近い音である。)そこで、/bjooiN)と/
bijooiN/の中の/j/を/io/で置き換える
と、/bioooiN/と/biioooiN/になる(第4
図)。しかもこの/bioooiN/の3番目の音素と
4番目の音素の前部による音素列/oo/(第4
図)と/biioooiN/の2番目の音素の後部と
3番目の音素による音素列/ii/(第4図)が
発音されるのは発音開始から測つた時間がほぼ同
じである。したがつて、この時間が分かつていれ
ば、発音開始からこの時間だけ経過した時点での
音声を分析して、/i/に近いか/o/に近いか
を調べることにより「病院」と「美容院」のどち
らが発音されたか知ることができる。そして、こ
の音素列/oo/と音素列/ii/は基の音素列/
bjooiN/と/bijooiN/の中の/j/の後部か
ら/o/の前部にかけての部分と/i/の後部か
ら/j/の前部にかけての部分にそれぞれ対応し
ている。
従来のよう音・直音言い分け評価方式の構成図
を第3図に示す。図中、16は音声入力回路、1
7はスペクトル計算回路、17aはパワースペク
トル計算回路、17bは対数化回路、18は第1
ホルマント周波数抽出回路、19は第2ホルマン
ト周波数抽出回路、20はユークリツド距離計算
回路、21は標準第1ホルマント周波数発生回
路、22は標準第2ホルマント周波数発生回路、
23は評価出力回路、24は評価値テーブルであ
る。また、音声入力回路16によつて語頭から測
つて一定時間後に検出される、よう音を含む単語
の/j/の後部から/母音/の前部に致る部分、
あるいは直音を含む単語の/i/の後部から/
j/の前部に致る部分に対応する部分の音声が入
力され、入力された音声はスペクトル計算回路1
7のパワースペクトル計算回路17aおよび対数
化回路17bにより対数化スペクトルに変換され
る。これから第1ホルマント周波数抽出回路18
および第2ホルマント周波数抽出回路19によつ
て、第1ホルマント周波数および第2ホルマント
周波数が抽出される。これと標準第1ホルマント
周波数発生回路21および標準第2ホルマント周
波数発生回路22によつて発生される音素/i/
の標準第1ホルマント周波数および標準第2ホル
マント周波数との2次元ユークリツド距離がユー
クリツド距離計算回路20で計算され、音素/
i/との類似度が計算される。この値が評価値テ
ーブル24を参照する評価出力回路23によつて
適切な評価に変換されて出力される。
を第3図に示す。図中、16は音声入力回路、1
7はスペクトル計算回路、17aはパワースペク
トル計算回路、17bは対数化回路、18は第1
ホルマント周波数抽出回路、19は第2ホルマン
ト周波数抽出回路、20はユークリツド距離計算
回路、21は標準第1ホルマント周波数発生回
路、22は標準第2ホルマント周波数発生回路、
23は評価出力回路、24は評価値テーブルであ
る。また、音声入力回路16によつて語頭から測
つて一定時間後に検出される、よう音を含む単語
の/j/の後部から/母音/の前部に致る部分、
あるいは直音を含む単語の/i/の後部から/
j/の前部に致る部分に対応する部分の音声が入
力され、入力された音声はスペクトル計算回路1
7のパワースペクトル計算回路17aおよび対数
化回路17bにより対数化スペクトルに変換され
る。これから第1ホルマント周波数抽出回路18
および第2ホルマント周波数抽出回路19によつ
て、第1ホルマント周波数および第2ホルマント
周波数が抽出される。これと標準第1ホルマント
周波数発生回路21および標準第2ホルマント周
波数発生回路22によつて発生される音素/i/
の標準第1ホルマント周波数および標準第2ホル
マント周波数との2次元ユークリツド距離がユー
クリツド距離計算回路20で計算され、音素/
i/との類似度が計算される。この値が評価値テ
ーブル24を参照する評価出力回路23によつて
適切な評価に変換されて出力される。
従来は第1、第2ホルマントを用いて音素/
i/との類似度を計算しているため、ホルマント
でないピークを誤つてホルマントとして抽出して
しまうと、評価の誤りの度合が大きくなつてしま
う。しかも、ホルマントを抽出する部分が、/
j/から/母音/あるいは/i/から/j/への
遷移部分なのでスペクトルが安定せず、このた
め、ホルマントでないピークを誤つてホルマント
として抽出してしまうことがしばしばある。その
ため、大きく誤つた評価を出力することが多いと
いう問題を生じていた。
i/との類似度を計算しているため、ホルマント
でないピークを誤つてホルマントとして抽出して
しまうと、評価の誤りの度合が大きくなつてしま
う。しかも、ホルマントを抽出する部分が、/
j/から/母音/あるいは/i/から/j/への
遷移部分なのでスペクトルが安定せず、このた
め、ホルマントでないピークを誤つてホルマント
として抽出してしまうことがしばしばある。その
ため、大きく誤つた評価を出力することが多いと
いう問題を生じていた。
(問題点を解決するための手段〕
第1図は本発明のよう音・直音言い分け評価回
路の原理ブロツク図である。図中、1は音声入力
回路、2はスペクトル計算回路、3,4は帯域ス
ペクトル強度計算回路A,B、5は全域スペクト
ル強度計算回路、6は帯域/全域スペクトル強度
比計算回路、7は評価出力回路である。
路の原理ブロツク図である。図中、1は音声入力
回路、2はスペクトル計算回路、3,4は帯域ス
ペクトル強度計算回路A,B、5は全域スペクト
ル強度計算回路、6は帯域/全域スペクトル強度
比計算回路、7は評価出力回路である。
本発明の帯域スペクトル強度計算回路A3は/
i/の第1ホルマントが出現する可能性がある帯
域のスペクトル強度を出力し、帯域スペクトル強
度計算回路B4は/i/の第2ホルマントが出現
する可能性がある帯域のスペクトル強度を出力
し、全域スペクトル強度計算回路5は入力音声帯
域全域のスペクトル強度を出力する。さらに帯
域/全域スペクトル強度比計算回路6は帯域スペ
クトル強度計算回路A3と帯域スペクトル強度計
算回路B4の出力の和を全域スペクトル強度計算
回路5の出力で割ることによりスペクトル計算回
路2から出力されるスペクトルと音素/i/との
類似度を計算する。このため、スペクトルにホル
マント以外のピークがあつても出力結果に大きな
影響は無く、大きな評価誤りが発生することがな
い。
i/の第1ホルマントが出現する可能性がある帯
域のスペクトル強度を出力し、帯域スペクトル強
度計算回路B4は/i/の第2ホルマントが出現
する可能性がある帯域のスペクトル強度を出力
し、全域スペクトル強度計算回路5は入力音声帯
域全域のスペクトル強度を出力する。さらに帯
域/全域スペクトル強度比計算回路6は帯域スペ
クトル強度計算回路A3と帯域スペクトル強度計
算回路B4の出力の和を全域スペクトル強度計算
回路5の出力で割ることによりスペクトル計算回
路2から出力されるスペクトルと音素/i/との
類似度を計算する。このため、スペクトルにホル
マント以外のピークがあつても出力結果に大きな
影響は無く、大きな評価誤りが発生することがな
い。
第2図は本発明の一実施例を示す構成図であ
る。図中、8は音声入力回路、9はスペクトル計
算回路、9aはパワースペクトル計算回路、9b
は対数化回路、10,11は帯域スペクトル加算
回路A,B、12は全域スペクトル加算回路、1
3は帯域/全域スペクトル強度比計算回路、13
aは加算回路、13bは除算回路、14は評価出
力回路、15は評価値変換テーブルである。
る。図中、8は音声入力回路、9はスペクトル計
算回路、9aはパワースペクトル計算回路、9b
は対数化回路、10,11は帯域スペクトル加算
回路A,B、12は全域スペクトル加算回路、1
3は帯域/全域スペクトル強度比計算回路、13
aは加算回路、13bは除算回路、14は評価出
力回路、15は評価値変換テーブルである。
また、音声入力回路8によつて語頭から測つて
一定時間後に検出される、よう音を含む単語の/
j/の後部から/母音/の前部に致る部分あるい
は直音を含む単語の/i/の後部から/j/の前
部に致る部分に対応する部分の音声が入力され、
入力された音声はスペクトル計算回路9のパワー
スペクトル計算回路9aおよび対数化回路9bに
より対数化スペクトルに変換される。この値を、
帯域スペクトル加算回路A10が/i/の第1ホ
ルマントが出現する可能性がある帯域において加
算して出力し、帯域スペクトル加算回路B11
が/i/の第2ホルマントが出現する可能性があ
る帯域において加算して出力し、全域スペクトル
加算回路12は入力音声帯域全域において加算し
て出力する。さらに帯域/全域スペクトル強度比
計算回路13の中の加算回路13aが帯域スペク
トル加算回路A10の出力と帯域スペクトル加算
回路B11の出力を加算し、さらに除算回路13
bがこれを全域スペクトル加算回路12の出力で
除算することによりスペクトル計算回路9から出
力されるスペクトルと音素/i/との類似度を計
算する。この値が評価値テーブル24を参照する
評価出力回路23によつて適切な評価に変換され
て出力される。
一定時間後に検出される、よう音を含む単語の/
j/の後部から/母音/の前部に致る部分あるい
は直音を含む単語の/i/の後部から/j/の前
部に致る部分に対応する部分の音声が入力され、
入力された音声はスペクトル計算回路9のパワー
スペクトル計算回路9aおよび対数化回路9bに
より対数化スペクトルに変換される。この値を、
帯域スペクトル加算回路A10が/i/の第1ホ
ルマントが出現する可能性がある帯域において加
算して出力し、帯域スペクトル加算回路B11
が/i/の第2ホルマントが出現する可能性があ
る帯域において加算して出力し、全域スペクトル
加算回路12は入力音声帯域全域において加算し
て出力する。さらに帯域/全域スペクトル強度比
計算回路13の中の加算回路13aが帯域スペク
トル加算回路A10の出力と帯域スペクトル加算
回路B11の出力を加算し、さらに除算回路13
bがこれを全域スペクトル加算回路12の出力で
除算することによりスペクトル計算回路9から出
力されるスペクトルと音素/i/との類似度を計
算する。この値が評価値テーブル24を参照する
評価出力回路23によつて適切な評価に変換され
て出力される。
この実施例によれば、ホルマントの抽出が不要
なのでスペクトルにホルマント以外のピークが存
在しても評価に大きな誤りを発生することがない
という効果がある。
なのでスペクトルにホルマント以外のピークが存
在しても評価に大きな誤りを発生することがない
という効果がある。
本発明によれば、ホルマントの抽出が不要なの
でスペクトルにホルマント以外のピークが存在し
ても評価に大きな誤りを発生することがない。
でスペクトルにホルマント以外のピークが存在し
ても評価に大きな誤りを発生することがない。
第1図は本発明の原理ブロツク図、第2図は本
発明の一実施例の構成図、第3図は従来例の構成
図、第4図はよう音を含む単語と直音を含む単語
の音素列の一例を示す図である。 第1図において、1は音声入力回路、2はスペ
クトル計算回路、3,4は帯域スペクトル強度計
算回路、5は全域スペクトル強度計算回路、6は
帯域/全域スペクトル強度比計算回路、7は評価
出力回路である。
発明の一実施例の構成図、第3図は従来例の構成
図、第4図はよう音を含む単語と直音を含む単語
の音素列の一例を示す図である。 第1図において、1は音声入力回路、2はスペ
クトル計算回路、3,4は帯域スペクトル強度計
算回路、5は全域スペクトル強度計算回路、6は
帯域/全域スペクトル強度比計算回路、7は評価
出力回路である。
Claims (1)
- 【特許請求の範囲】 1 音素列〔/子音/+/j/+/母音/〕を構
成要素とし、よう音を含む形式の単語と、 音素列〔/子音/+/i/+/j/+/母
音/〕を構成要素とし、直音を含む形式の単語の
言い分けを、 直音を含む単語に/i/の特徴が現われる部分
と、よう音を含む単語に/母音/の特徴が現われ
る部分がそれぞれ語頭から測つた時間がほぼ同じ
ことを利用して、この部分と音素/i/との類似
度を用いて評価する方式において、 /i/の第1ホルマントが出現する可能性があ
る帯域のスペクトル強度を出力する第1の帯域ス
ペクトル強度計算回路3と、 /i/の第2ホルマントが出現する可能性があ
る帯域のスペクトル強度を出力する第2の帯域ス
ペクトル強度計算回路4と、 入力音声帯域全域のスペクトル強度を出力する
全域スペクトル強度計算回路5と、 上記第1の帯域スペクトル強度計算回路3と、
第2の帯域スペクトル強度計算回路4の出力の和
を上記全域スペクトル強度計算回路5の出力で除
算する帯域/全域スペクトル強度比計算回路6を
設け、 上記帯域/全域スペクトル強度比計算回路6の
出力にもとづいて、よう音と直音の言い分けを評
価処理することを特徴とするよう音・直音言い分
け評価方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14362786A JPS62299899A (ja) | 1986-06-19 | 1986-06-19 | よう音・直音言い分け評価方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14362786A JPS62299899A (ja) | 1986-06-19 | 1986-06-19 | よう音・直音言い分け評価方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62299899A JPS62299899A (ja) | 1987-12-26 |
JPH0336440B2 true JPH0336440B2 (ja) | 1991-05-31 |
Family
ID=15343152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14362786A Granted JPS62299899A (ja) | 1986-06-19 | 1986-06-19 | よう音・直音言い分け評価方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62299899A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4394752B2 (ja) * | 1996-10-02 | 2010-01-06 | エスアールアイ インターナショナル | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム |
JP4890792B2 (ja) * | 2005-06-09 | 2012-03-07 | 隆 中山 | 音声認識方法 |
-
1986
- 1986-06-19 JP JP14362786A patent/JPS62299899A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS62299899A (ja) | 1987-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hermansky et al. | Perceptually based linear predictive analysis of speech | |
JPS58130393A (ja) | 音声認識装置 | |
JP2000206982A (ja) | 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体 | |
JPH03137699A (ja) | 音声認識装置 | |
JPH031200A (ja) | 規則型音声合成装置 | |
Carlson et al. | Voice source rules for text-to-speech synthesis | |
JPS6138479B2 (ja) | ||
JPH0229232B2 (ja) | ||
JPH0336440B2 (ja) | ||
JPH0215080B2 (ja) | ||
CN110610721B (zh) | 一种基于歌词演唱准确度的检测系统及方法 | |
JPH07191696A (ja) | 音声認識装置 | |
JPS6223888B2 (ja) | ||
JPH0738114B2 (ja) | フオルマント型パタンマツチングボコ−ダ | |
JP2900454B2 (ja) | 音声合成装置の音節データ作成方式 | |
JPS6148897A (ja) | 音声認識装置 | |
JP2548107B2 (ja) | 音声合成方法 | |
Zalewski | Text dependent speaker recognition in noise. | |
Kitazawa et al. | Discriminant analysis of burst spectrum for Japanese initial voiceless stops | |
Holmes | A very-low-cost connected-word recognizer for small vocabularies | |
JPH0311478B2 (ja) | ||
Junqua et al. | A knowledge based approach for automatic labeling of a large speech database | |
JPS63131191A (ja) | 規則型音声合成装置 | |
JPS5995597A (ja) | 音声特徴パラメ−タ作成方式 | |
JPH02205898A (ja) | 音声認識装置 |