JPS62299899A - よう音・直音言い分け評価方式 - Google Patents
よう音・直音言い分け評価方式Info
- Publication number
- JPS62299899A JPS62299899A JP14362786A JP14362786A JPS62299899A JP S62299899 A JPS62299899 A JP S62299899A JP 14362786 A JP14362786 A JP 14362786A JP 14362786 A JP14362786 A JP 14362786A JP S62299899 A JPS62299899 A JP S62299899A
- Authority
- JP
- Japan
- Prior art keywords
- band
- calculation circuit
- spectrum
- circuit
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims description 30
- 238000001228 spectrum Methods 0.000 claims description 49
- 238000004364 calculation method Methods 0.000 claims description 40
- 230000003595 spectral effect Effects 0.000 claims description 12
- 239000000470 constituent Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 230000003796 beauty Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
3、発明の詳細な説明
〔概 要〕
本発明は発音練習機システム等において音素/1/との
類似度を用いた、よう音・直音(例えば「病院」と「美
容院」)の言い分け評価において発生する大きな評価誤
りを解決するため、帯域/全域スペクトル強度比を用い
て、音素/i/との類似度を計算することによって、よ
う音・直音の言い分け評価の大きな誤りを減少させたも
のであ〔産業上の利用分野〕 本発明は発音練習機のよう音・直音言い分けの練習等に
おける発音評価方式、特に音素/i/との類似度を用い
る方式に関する。
類似度を用いた、よう音・直音(例えば「病院」と「美
容院」)の言い分け評価において発生する大きな評価誤
りを解決するため、帯域/全域スペクトル強度比を用い
て、音素/i/との類似度を計算することによって、よ
う音・直音の言い分け評価の大きな誤りを減少させたも
のであ〔産業上の利用分野〕 本発明は発音練習機のよう音・直音言い分けの練習等に
おける発音評価方式、特に音素/i/との類似度を用い
る方式に関する。
発音練習機等の発音評価は評価誤りが少ないことが要求
されるが、特に、大きな誤りが少ない発音評価方式が必
要とされている。
されるが、特に、大きな誤りが少ない発音評価方式が必
要とされている。
よう音を含む、すなわち音素列/子音/+/j/+/母
音/を含む単語と、そのミニマルペアとして、直音を含
む、すなわち、音素列/子音/+/ i /+/ j/
十/fIJ音/を含む単語の言い分けを、よう音を含む
単語に/i/の特徴が現われる部分と、直音を含む単語
に/母音/の特徴が現れる部分が語頭から測った時間が
ほぼ同じことを利用して、この部分と音素/i/とのU
O度を用いて評価する、よう音・直音言い分け評価方式
が提案されている。
音/を含む単語と、そのミニマルペアとして、直音を含
む、すなわち、音素列/子音/+/ i /+/ j/
十/fIJ音/を含む単語の言い分けを、よう音を含む
単語に/i/の特徴が現われる部分と、直音を含む単語
に/母音/の特徴が現れる部分が語頭から測った時間が
ほぼ同じことを利用して、この部分と音素/i/とのU
O度を用いて評価する、よう音・直音言い分け評価方式
が提案されている。
第4図は、よう音を含む単語と直音を含む単語の音素列
の一例であり、この例により−1−記評価方式について
説明する。
の一例であり、この例により−1−記評価方式について
説明する。
「病院」と「美容院」を音素列で表すと、/bjooi
N/と/bijooiN/になる。ここで、音素/j/
は速く発音された音素列/10/に近い音である。(一
般に、音素列/j/十/母音/の中の/j/は、速く発
音された音素列/i/+/母音/に近い音である。)そ
こで、/bjo o i N)と/bijooiN/の
中の/j/を/10/で置き換えると、/bioooi
N/と/biioooiN/になる(第4図)。しかも
この/bioooiN/の3番目の音素と4番目の音素
の前部による音素列100/(第4図■)と/biio
ooiN/の2番目の音素の後部と3番目の音素による
音素列/ i i / (第4図■)が発音されるのは
発音開始から測った時間がほぼ同じである。したがって
、この時間が分かっていれば、発音開始からこの時間だ
け経過した時点で=3− の音声を分析して、/i/に近いか10/に近いかを調
べることにより「病院」と「美容院」のどちらが発音さ
れたか知ることができる。そして、この音素列100/
と音素列/ i i /は基の音素列/bjooiN/
と/bijooiN/の中の/j/の後部から10/の
前部にかけての部分と/i/の後部から/j/の前部に
かけての部分にそれぞれ対応している。
N/と/bijooiN/になる。ここで、音素/j/
は速く発音された音素列/10/に近い音である。(一
般に、音素列/j/十/母音/の中の/j/は、速く発
音された音素列/i/+/母音/に近い音である。)そ
こで、/bjo o i N)と/bijooiN/の
中の/j/を/10/で置き換えると、/bioooi
N/と/biioooiN/になる(第4図)。しかも
この/bioooiN/の3番目の音素と4番目の音素
の前部による音素列100/(第4図■)と/biio
ooiN/の2番目の音素の後部と3番目の音素による
音素列/ i i / (第4図■)が発音されるのは
発音開始から測った時間がほぼ同じである。したがって
、この時間が分かっていれば、発音開始からこの時間だ
け経過した時点で=3− の音声を分析して、/i/に近いか10/に近いかを調
べることにより「病院」と「美容院」のどちらが発音さ
れたか知ることができる。そして、この音素列100/
と音素列/ i i /は基の音素列/bjooiN/
と/bijooiN/の中の/j/の後部から10/の
前部にかけての部分と/i/の後部から/j/の前部に
かけての部分にそれぞれ対応している。
従来のよう音・直音言い分け評価方式の構成図を第3図
に示す。図中、16は音声入力回路、17はスペクトル
計算回路、17aはパワースペクトル計算回路、17b
は対数化回路、18は第1ホルマント周波数抽出回路、
19は第2ホルマント周波数抽出回路、20はユークリ
ッド距離計算回路、21は標準第1ホルマント周波数発
生回路、22は標準第2ホルマント周波数発生回路、2
3は評価出力回路、24は評価値テーブルである。
に示す。図中、16は音声入力回路、17はスペクトル
計算回路、17aはパワースペクトル計算回路、17b
は対数化回路、18は第1ホルマント周波数抽出回路、
19は第2ホルマント周波数抽出回路、20はユークリ
ッド距離計算回路、21は標準第1ホルマント周波数発
生回路、22は標準第2ホルマント周波数発生回路、2
3は評価出力回路、24は評価値テーブルである。
また、音声入力回路16によって語頭から測って一定時
間後に検出される、よう音を含む単語の/j/の後部か
ら/母音/の前部に致る部分、あるいは直音を含む単語
の/+/の後部から/j/のn前部に敗る部分に対応す
る部分の音声が入力され、入力された音声はスペクトル
計算回路17のパワースペクトル計算回路17aおよび
対数化回路17bにより対数化スペクトルに変換される
。
間後に検出される、よう音を含む単語の/j/の後部か
ら/母音/の前部に致る部分、あるいは直音を含む単語
の/+/の後部から/j/のn前部に敗る部分に対応す
る部分の音声が入力され、入力された音声はスペクトル
計算回路17のパワースペクトル計算回路17aおよび
対数化回路17bにより対数化スペクトルに変換される
。
これから第1ホルマント周波数抽出回路18および第2
ホルマント周波数抽出回路19によって、第1ホルマン
ト周波数および第2ホルマント周波数が抽出される。こ
れと標準第1ホルマント周波数発生回路21および標準
第2ホマルント周波数発生回路22によって発生される
音素/i/の標準第1ホルマント周波数および標準第2
ホルマント周波数との2次元ユークリッド距離がユーク
リッド距離計算回路20で計算され、音素/i/との類
似度が計算される。この値が評価値テーブル24を参照
する評価出力回路23によって適切な評価に変換されて
出力される。
ホルマント周波数抽出回路19によって、第1ホルマン
ト周波数および第2ホルマント周波数が抽出される。こ
れと標準第1ホルマント周波数発生回路21および標準
第2ホマルント周波数発生回路22によって発生される
音素/i/の標準第1ホルマント周波数および標準第2
ホルマント周波数との2次元ユークリッド距離がユーク
リッド距離計算回路20で計算され、音素/i/との類
似度が計算される。この値が評価値テーブル24を参照
する評価出力回路23によって適切な評価に変換されて
出力される。
従来は第1.第2ホルマントを用いて音素/i/との類
似度を計算しているため、ホルマントでないピークを誤
ってホルマントとして抽出してしまうと、評価の誤りの
度合が大きくなってしまう。
似度を計算しているため、ホルマントでないピークを誤
ってホルマントとして抽出してしまうと、評価の誤りの
度合が大きくなってしまう。
しかも、ホルマントを抽出する部分が、/j/から/母
音/あるいは/i/から/j/への遷移部分なのでスペ
クトルが安定せず、このため、ホルマントでないピーク
を誤ってホルマントとして抽出してしまうことがしばし
ばある。そのため、大きく誤った評価を出力することが
多いという問題を生じていた。
音/あるいは/i/から/j/への遷移部分なのでスペ
クトルが安定せず、このため、ホルマントでないピーク
を誤ってホルマントとして抽出してしまうことがしばし
ばある。そのため、大きく誤った評価を出力することが
多いという問題を生じていた。
第1図は本発明のよう音・直音言い分け評価回路の原理
ブロック図である。図中、■は音声入力回路、2はスペ
クトル計算回路、3.4は帯域スペクトル強度計算回路
A、B、5は全域スペクトル強度計算回路、6は帯域/
全域スペクトル強度比計算回路、7は評価出力回路であ
る。
ブロック図である。図中、■は音声入力回路、2はスペ
クトル計算回路、3.4は帯域スペクトル強度計算回路
A、B、5は全域スペクトル強度計算回路、6は帯域/
全域スペクトル強度比計算回路、7は評価出力回路であ
る。
本発明の帯域スペクトル強度計算回路A3は/i/の第
1ホルマントが出現する可能性がある帯域のスペクトル
強度を出力し、帯域スペクトル強度計算回路B4は/i
/の第2ホルマントが出現する可能性がある帯域のスペ
クトル強度を出力し、全域スペクトル強度計算回路5は
入力音声帯域全域のスペクトル強度を出力する。さらに
帯域/全域スペクトル強度比計算回路6は帯域スペクト
ル強度計算回路A3と帯域スペクトル強度計算回路B4
の出力の和を全域スペクトル強度計算回路5の出力で割
ることによりスペクトル計算回路2から出力されるスペ
クトルと音素/+/との類似度を計算する。このため、
スペクトルにホルマント以外のピークがあっても出力結
果に大きな影響は無く、大きな評価誤りが発生すること
がない。
1ホルマントが出現する可能性がある帯域のスペクトル
強度を出力し、帯域スペクトル強度計算回路B4は/i
/の第2ホルマントが出現する可能性がある帯域のスペ
クトル強度を出力し、全域スペクトル強度計算回路5は
入力音声帯域全域のスペクトル強度を出力する。さらに
帯域/全域スペクトル強度比計算回路6は帯域スペクト
ル強度計算回路A3と帯域スペクトル強度計算回路B4
の出力の和を全域スペクトル強度計算回路5の出力で割
ることによりスペクトル計算回路2から出力されるスペ
クトルと音素/+/との類似度を計算する。このため、
スペクトルにホルマント以外のピークがあっても出力結
果に大きな影響は無く、大きな評価誤りが発生すること
がない。
第2図は本発明の一実施例を示す構成図である。
図中、8は音声入力回路、9はスペクトル計算回路、9
aはパワースペクトル計算回路、9bは対数化回路、1
0.11は帯域スペクトル加算回路A、B、12は全域
スペクトル加算回路、13は帯域/全域スペクトル強度
比計算回路、13aは加算回路、13bは除算回路、1
4は評価出力回路、15は評価値変換テーブルである。
aはパワースペクトル計算回路、9bは対数化回路、1
0.11は帯域スペクトル加算回路A、B、12は全域
スペクトル加算回路、13は帯域/全域スペクトル強度
比計算回路、13aは加算回路、13bは除算回路、1
4は評価出力回路、15は評価値変換テーブルである。
また、音声入力回路8によって語頭から測って一定時間
後に検出される、よう音を含む単語の/j/の後部から
/母音/の前部に敗る部分あるいは直音を含む単語の/
i/の後部から/j/の前部に敗る部分に対応する部分
の音声が入力され、入力された音声はスペクトル計算回
路9のパワースペクトル計算回路9aおよび対数化回路
9bにより対数化スペクトルに変換される。この値を、
帯域スペクトル加算回路AIOが/1/の第1ホルマン
トが出現する可能性がある帯域において加算して出力し
、帯域スペクトル加算回路Bllが/i/の第2ホルマ
ントが出現する可能性がある帯域において加算して出力
し、全域スペクトル加算回路12は人力音声帯域全域に
おいて加算して出力する。さらに帯域/全域スペクトル
強度比計算回路13の中の加算回路13aが帯域スペク
トル加算回路A10の出力と帯域スペクトル加算回路B
llの出力を加算し、さらに除算回路13bがこれを全
域スペクトル加算回路12の出力で除算することにより
スペクトル計算回路9から出力されるスペクトルと音素
/1/との類似度を計算する。この値が評価値テーブル
24を参照する評1ご 価出力回路23によって適切な評価す変換されて出力さ
れる。
後に検出される、よう音を含む単語の/j/の後部から
/母音/の前部に敗る部分あるいは直音を含む単語の/
i/の後部から/j/の前部に敗る部分に対応する部分
の音声が入力され、入力された音声はスペクトル計算回
路9のパワースペクトル計算回路9aおよび対数化回路
9bにより対数化スペクトルに変換される。この値を、
帯域スペクトル加算回路AIOが/1/の第1ホルマン
トが出現する可能性がある帯域において加算して出力し
、帯域スペクトル加算回路Bllが/i/の第2ホルマ
ントが出現する可能性がある帯域において加算して出力
し、全域スペクトル加算回路12は人力音声帯域全域に
おいて加算して出力する。さらに帯域/全域スペクトル
強度比計算回路13の中の加算回路13aが帯域スペク
トル加算回路A10の出力と帯域スペクトル加算回路B
llの出力を加算し、さらに除算回路13bがこれを全
域スペクトル加算回路12の出力で除算することにより
スペクトル計算回路9から出力されるスペクトルと音素
/1/との類似度を計算する。この値が評価値テーブル
24を参照する評1ご 価出力回路23によって適切な評価す変換されて出力さ
れる。
この実施例によれば、ホルマントの抽出が不要なのでス
ペクトルにホルマント以外のピークが存在しても評価に
大きな誤りを発生することがないという効果がある。
ペクトルにホルマント以外のピークが存在しても評価に
大きな誤りを発生することがないという効果がある。
本発明によれば、ホルマントの抽出が不要なのでスペク
トルにホルマント以外のピークが存在しても評価に大き
な誤りを発生することがない。
トルにホルマント以外のピークが存在しても評価に大き
な誤りを発生することがない。
第1図は本発明の原理ブロック図、
第2図は本発明の一実施例の構成図、
第3図は従来例の構成図、
第4図はよう音を含む単語と直音を含む単語の音素列の
一例を示す図である。 第1図において、■は音声入力回路、2はスペクトル計
算回路、3.4は帯域スペクトル強度計算回路、5は全
域スペクトル強度計算回路、6は帯域/全域スペクトル
強度比計算回路、7ば評価出力回路である。 釈 や
一例を示す図である。 第1図において、■は音声入力回路、2はスペクトル計
算回路、3.4は帯域スペクトル強度計算回路、5は全
域スペクトル強度計算回路、6は帯域/全域スペクトル
強度比計算回路、7ば評価出力回路である。 釈 や
Claims (1)
- 【特許請求の範囲】 音素列〔/子音/+/j/+/母音/〕を構成要素とし
、よう音を含む形式の単語と、 音素列〔/子音/+/i/+/j/+/母音/〕を構成
要素とし、直音を含む形式の単語の言い分けを、 直音を含む単語に/i/の特徴が現われる部分と、よう
音を含む単語に/母音/の特徴が現われる部分がそれぞ
れ語頭から測った時間がほぼ同じことを利用して、この
部分と音素/i/との類似度を用いて評価する方式にお
いて、 /i/の第1ホルマントが出現する可能性がある帯域の
スペクトル強度を出力する第1の帯域スペクトル強度計
算回路(3)と、 /i/の第2ホルマントが出現する可能性がある帯域の
スペクトル強度を出力する第2の帯域スペクトル強度計
算回路(4)と、 入力音声帯域全域のスペクトル強度を出力する全域スペ
クトル強度計算回路(5)と、 上記第1の帯域スペクトル強度計算回路(3)と、第2
の帯域スペクトル強度計算回路(4)の出力の和を上記
全域スペクトル強度計算回路(5)の出力で除算する帯
域/全域スペクトル強度比計算回路(6)を設け、 上記帯域/全域スペクトル強度比計算回路(6)の出力
にもとづいて、よう音と直音の言い分けを評価処理する
ことを特徴とするよう音・直音言い分け評価方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14362786A JPS62299899A (ja) | 1986-06-19 | 1986-06-19 | よう音・直音言い分け評価方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14362786A JPS62299899A (ja) | 1986-06-19 | 1986-06-19 | よう音・直音言い分け評価方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62299899A true JPS62299899A (ja) | 1987-12-26 |
JPH0336440B2 JPH0336440B2 (ja) | 1991-05-31 |
Family
ID=15343152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14362786A Granted JPS62299899A (ja) | 1986-06-19 | 1986-06-19 | よう音・直音言い分け評価方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62299899A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006343544A (ja) * | 2005-06-09 | 2006-12-21 | Miyazaki Prefecture | 音声認識方法 |
JP2007171944A (ja) * | 1996-10-02 | 2007-07-05 | Sri Internatl | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム |
-
1986
- 1986-06-19 JP JP14362786A patent/JPS62299899A/ja active Granted
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007171944A (ja) * | 1996-10-02 | 2007-07-05 | Sri Internatl | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム |
JP2006343544A (ja) * | 2005-06-09 | 2006-12-21 | Miyazaki Prefecture | 音声認識方法 |
Also Published As
Publication number | Publication date |
---|---|
JPH0336440B2 (ja) | 1991-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS58130393A (ja) | 音声認識装置 | |
Carlson et al. | Voice source rules for text-to-speech synthesis | |
JPS6138479B2 (ja) | ||
JPS62299899A (ja) | よう音・直音言い分け評価方式 | |
JPS6050600A (ja) | 規則合成方式 | |
CN110610721B (zh) | 一种基于歌词演唱准确度的检测系统及方法 | |
JPS5972500A (ja) | 音声認識方式 | |
JPS6223888B2 (ja) | ||
JPS6148897A (ja) | 音声認識装置 | |
KR0133467B1 (ko) | 한국어 음성 합성기의 벡터 양자화 방법 | |
JPS58199399A (ja) | 音節抽出方式 | |
JPS5995597A (ja) | 音声特徴パラメ−タ作成方式 | |
Maddela | Machine analysis and synthesis of spoken Telugu vowels | |
JPS62280800A (ja) | 破裂子音識別方式 | |
JPH02205898A (ja) | 音声認識装置 | |
JPS63131191A (ja) | 規則型音声合成装置 | |
JPS60164798A (ja) | 単音節音声認識方法 | |
JPS60172098A (ja) | 単音節音声認識装置 | |
JPS6240497A (ja) | 音声パタ−ン分類方式 | |
JPS61177000A (ja) | 音声パタ−ン登録方式 | |
JPS6126099A (ja) | 音声基本周波数抽出方法 | |
JPS6373299A (ja) | 音声翻訳装置 | |
JPS5975296A (ja) | 音声合成方法 | |
JPS62191900A (ja) | 無声破裂子音識別方式 | |
JPS60166996A (ja) | 音声標準パタン登録方法 |