JPH0389294A - 語学訓練装置 - Google Patents
語学訓練装置Info
- Publication number
- JPH0389294A JPH0389294A JP1225893A JP22589389A JPH0389294A JP H0389294 A JPH0389294 A JP H0389294A JP 1225893 A JP1225893 A JP 1225893A JP 22589389 A JP22589389 A JP 22589389A JP H0389294 A JPH0389294 A JP H0389294A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech
- learner
- learning
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 23
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 230000004044 response Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 3
- 230000007423 decrease Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002620 method output Methods 0.000 description 1
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔目 次〕
概要
産業上の利用分野
従来の技術と発明が解決しようとする課題課題を解決す
るための手段 作用 実施例 発明の効果 〔概要〕 語学訓練装置に係り、特に、外国語等の訓練を行うとき
、学習者の発声に対し、て正しい発声で応答する装置に
関し、 学習者の声質と9合成音声の声質が異なっていることに
起因して、両者の定量的な比較ができず、学習の習熟度
の客観的な評価ができないこと、及び、学習者の習熟度
が上がってきた場合、初期に登録した発声パターンとの
マツチングがとれなくなり、認識率が低下し学習効率が
低下する問題を解消することを目的とし、 学習者の発声した音声パターンを文字列情報と共に、音
声辞書に登録しておき、学習時に、学習者が発声した音
声パターンを認識し、認識された結果として出力される
文字列情報に基づいて合成音声を生成する語学訓練装置
において、該音声辞書に、上記学習者の発声する学習用
の音声パターンの他に、該学習者の発声する基準となる
音声記号(a + 1 + u + e + o)の音
声パターンを登録しておき、該登録されている基準音声
の音声パターンから生成した音声パラメータに基づいて
予測5.抽出した、学習対象のことば(英語等)の基準
となる発音の音声パラメータを用いて音声合成を行うよ
うにすると共に、該合成音声と学習者の発声した学習用
音声との間の距離を計算してスコアを付けて、該スコア
がある閾値を越える場合、即ち、学習者の発声と合成音
声との類似度が高い場合、その発声した学習用音声パタ
ーンを該音声辞書に再登録し、学習者の習熟度が上昇し
た場合でも認識率を低下しないように構成する。
るための手段 作用 実施例 発明の効果 〔概要〕 語学訓練装置に係り、特に、外国語等の訓練を行うとき
、学習者の発声に対し、て正しい発声で応答する装置に
関し、 学習者の声質と9合成音声の声質が異なっていることに
起因して、両者の定量的な比較ができず、学習の習熟度
の客観的な評価ができないこと、及び、学習者の習熟度
が上がってきた場合、初期に登録した発声パターンとの
マツチングがとれなくなり、認識率が低下し学習効率が
低下する問題を解消することを目的とし、 学習者の発声した音声パターンを文字列情報と共に、音
声辞書に登録しておき、学習時に、学習者が発声した音
声パターンを認識し、認識された結果として出力される
文字列情報に基づいて合成音声を生成する語学訓練装置
において、該音声辞書に、上記学習者の発声する学習用
の音声パターンの他に、該学習者の発声する基準となる
音声記号(a + 1 + u + e + o)の音
声パターンを登録しておき、該登録されている基準音声
の音声パターンから生成した音声パラメータに基づいて
予測5.抽出した、学習対象のことば(英語等)の基準
となる発音の音声パラメータを用いて音声合成を行うよ
うにすると共に、該合成音声と学習者の発声した学習用
音声との間の距離を計算してスコアを付けて、該スコア
がある閾値を越える場合、即ち、学習者の発声と合成音
声との類似度が高い場合、その発声した学習用音声パタ
ーンを該音声辞書に再登録し、学習者の習熟度が上昇し
た場合でも認識率を低下しないように構成する。
本発明は、語学訓練装置に係り、特に、外国語等の訓練
を行うとき、学習者の発声に対して正しい発声で応答す
る装置に関する。
を行うとき、学習者の発声に対して正しい発声で応答す
る装置に関する。
最近の経済、産業上の利用分野における国際化動向に伴
い、各分野における個人の外国語に対する習熟度の向上
が要求されるようになっている。
い、各分野における個人の外国語に対する習熟度の向上
が要求されるようになっている。
その為、−々、専門学校に通わなくても、外国語を学習
できる語学訓練装置が求められているが、この場合、学
習者の習熟度が客観的に認識でき、且つ、習熟度が向上
しても、学習効率が低下しない語学訓練装置が必要とさ
れる。
できる語学訓練装置が求められているが、この場合、学
習者の習熟度が客観的に認識でき、且つ、習熟度が向上
しても、学習効率が低下しない語学訓練装置が必要とさ
れる。
〔従来の技術と発明が解決しようとする課題〕第4図は
従来の語学訓練装置を説明する図である。
従来の語学訓練装置を説明する図である。
従来、外国語等の発音訓練を行う場合、学習者の発声に
対して、教師が正しい発声を行い、それを聴取した学習
者が再び発声を行い、自分の発声が教師の発声に近くな
るまで、発声と聴取を繰り返すような学習方法が用いら
れている。
対して、教師が正しい発声を行い、それを聴取した学習
者が再び発声を行い、自分の発声が教師の発声に近くな
るまで、発声と聴取を繰り返すような学習方法が用いら
れている。
この学習方法を自動的(機械的)に、又は、個人的に行
う装置として、音声認識装置と音声合成装置を組合わせ
た語学訓練装置が考えられる。
う装置として、音声認識装置と音声合成装置を組合わせ
た語学訓練装置が考えられる。
上記の第4図は、該音声認識装置と音声合成装置を組合
わせた語学訓練装置の従来例を示したものである。
わせた語学訓練装置の従来例を示したものである。
最初に、音声辞書2に、音声パターンと、それに対応す
る文字列情報が登録される。即ち、制御信号A 10に
よって制御される音声登録部3は、学習者の発声と、文
字列情報(これは、学習者が図示していない文字列情報
入力部から入力するか、或いは、これも図示していない
単語辞書から学習用の単語が選択されて入力される)1
1を受け取って、音声辞書2に登録を行う。ここで、上
記制御信号A 10は、入力音声に対して、認識/登録
のいずれの処理を行うかを制御する。
る文字列情報が登録される。即ち、制御信号A 10に
よって制御される音声登録部3は、学習者の発声と、文
字列情報(これは、学習者が図示していない文字列情報
入力部から入力するか、或いは、これも図示していない
単語辞書から学習用の単語が選択されて入力される)1
1を受け取って、音声辞書2に登録を行う。ここで、上
記制御信号A 10は、入力音声に対して、認識/登録
のいずれの処理を行うかを制御する。
学習時には、音声辞書2に登録されている音声パターン
を用いて、音声認識部lが、学習者の発声した音声の認
識を行う。即ち、該音声認識部1は、学習者の発声した
音声パターンと、上記音声辞書2内の音声パターンとの
マツチングを行い、最も近い音声パターンに対応する文
字列を認識結果7として出力する。
を用いて、音声認識部lが、学習者の発声した音声の認
識を行う。即ち、該音声認識部1は、学習者の発声した
音声パターンと、上記音声辞書2内の音声パターンとの
マツチングを行い、最も近い音声パターンに対応する文
字列を認識結果7として出力する。
音声合成部4は、上記音声認識部1の認識結果7を受け
取り、該文字列に対応した音声パラメータを用いて合成
音声を生成する。
取り、該文字列に対応した音声パラメータを用いて合成
音声を生成する。
学習者は、合成音声と自分の発声とを比較し、再び発声
を繰り返す。
を繰り返す。
このような従来方式においては、学習者が自ら発声した
音声パターンを登録することにより、認識率が高くなる
と共に、学習者の発声が未熟であっても、正しい発声の
応答が得られることになる。
音声パターンを登録することにより、認識率が高くなる
と共に、学習者の発声が未熟であっても、正しい発声の
応答が得られることになる。
例えば、英語の発音を練習する場合、日本人的な発音(
ローマ字読み的な発音)がなされても、その発音と、対
応する文字列情報が登録されていると、該文字列情報に
対応した音声パラメータ5から音声が合成されて出力さ
れるので、正しい英語の発音の応答が得られることにな
る。
ローマ字読み的な発音)がなされても、その発音と、対
応する文字列情報が登録されていると、該文字列情報に
対応した音声パラメータ5から音声が合成されて出力さ
れるので、正しい英語の発音の応答が得られることにな
る。
然しながら、従来の語学訓練装置では、■学習者の声質
と1合成音声の声質とが異なっている為、両者の定量的
な比較ができず、学習の習熟度の認識が、学習者自身に
任せられてしまい、客観的な評価ができないという問題
があった。■又、最初の登録時に登録された音声パター
ンを利用して音声認識を行っていくと、学習者の習熟度
が上がってきた場合、初期の音声パターンとのマツチン
グがとれなくなり、認識率が低下し、学習効率が低下す
るという問題があった。
と1合成音声の声質とが異なっている為、両者の定量的
な比較ができず、学習の習熟度の認識が、学習者自身に
任せられてしまい、客観的な評価ができないという問題
があった。■又、最初の登録時に登録された音声パター
ンを利用して音声認識を行っていくと、学習者の習熟度
が上がってきた場合、初期の音声パターンとのマツチン
グがとれなくなり、認識率が低下し、学習効率が低下す
るという問題があった。
本発明は上記従来の欠点に鑑み、語学訓練装置、特に、
外国語等の訓練を行うとき、学習者の発声に対して正し
い発声で応答する装置において、学習者の声質と1合成
音声の声質が異なっていることに起因して、両者の定量
的な比較ができず、学習の習熟度の客観的な評価ができ
ないこと、及び、学習者の習熟度が上がってきた場合、
初期に登録した発声パターンとのマツチングがとれなく
なり、認識率が低下し学習効率が低下する問題を解消す
ることができる語学訓練装置を提供することを目的とす
るものである。
外国語等の訓練を行うとき、学習者の発声に対して正し
い発声で応答する装置において、学習者の声質と1合成
音声の声質が異なっていることに起因して、両者の定量
的な比較ができず、学習の習熟度の客観的な評価ができ
ないこと、及び、学習者の習熟度が上がってきた場合、
初期に登録した発声パターンとのマツチングがとれなく
なり、認識率が低下し学習効率が低下する問題を解消す
ることができる語学訓練装置を提供することを目的とす
るものである。
第1図は本発明の原理構成図である。
上記の問題点は下記の如くに構成した語学訓練学習装置
によって解決される。
によって解決される。
制御信号A(10)の指令を受けて、学習者の発声と、
それに対応する基準音声記号、又は、文字列情報11を
音声辞書2に登録する音声登録部3と。
それに対応する基準音声記号、又は、文字列情報11を
音声辞書2に登録する音声登録部3と。
該音声辞書2を用いて、学習者の発声する学習用音声パ
ターンの認識を行う音声認識部lと。
ターンの認識を行う音声認識部lと。
上記音声辞書2に登録されている学習者の基準となる音
声記号の音声パターンから、その音声パラメータを生成
し、その音声パラメータを基に、音声合成に必要な基準
となる音声記号の音声パラメータを予測、抽出するパラ
メータ予測・抽出部6と。
声記号の音声パターンから、その音声パラメータを生成
し、その音声パラメータを基に、音声合成に必要な基準
となる音声記号の音声パラメータを予測、抽出するパラ
メータ予測・抽出部6と。
該音声認識部1の認識結果7を受け取り、上記パラメー
タ予測・抽出部6で抽出した音声パラメータ5を用いて
音声合成を行う音声合成部4と。
タ予測・抽出部6で抽出した音声パラメータ5を用いて
音声合成を行う音声合成部4と。
該音声合成部4で生成された合成音声と、学習者の発声
した学習用音声との距離からスコアを計算し、該スコア
がある閾値を越える場合、その時の学習者の発声した学
習用音声パターンを音声辞書2に再登録するための制御
信号B9を音声登録部3に送出するスコア計算部8とか
ら構成される。
した学習用音声との距離からスコアを計算し、該スコア
がある閾値を越える場合、その時の学習者の発声した学
習用音声パターンを音声辞書2に再登録するための制御
信号B9を音声登録部3に送出するスコア計算部8とか
ら構成される。
即ち、本発明によれば、語学訓練装置、特に、外国語等
の訓練を行うとき、学習者の発声に対して正しい発声で
応答する装置において、最初の音声パターン登録時には
、制御信号A 10によって制御される音声登録部3で
、学習者の発声する基準となる音声、例えば、母音の音
声パターンを受け取って音声辞書2の特定の領域に登録
する。
の訓練を行うとき、学習者の発声に対して正しい発声で
応答する装置において、最初の音声パターン登録時には
、制御信号A 10によって制御される音声登録部3で
、学習者の発声する基準となる音声、例えば、母音の音
声パターンを受け取って音声辞書2の特定の領域に登録
する。
次に、通常の学習用の音声、例えば、単語の音声パター
ンと、その時入力された文字列情報を受け取って音声辞
書2の別の領域に登録する。
ンと、その時入力された文字列情報を受け取って音声辞
書2の別の領域に登録する。
学習時には、音声認識部1において、該音声辞書2に登
録されている音声パターンと、学習者の発声した学習用
の音声パターンとのマツチングが行われ、最も近い音声
パターンに対応する文字列が認識結果7として出力され
る。
録されている音声パターンと、学習者の発声した学習用
の音声パターンとのマツチングが行われ、最も近い音声
パターンに対応する文字列が認識結果7として出力され
る。
音声合成部4では、音声認識部lでの上記認識結果を受
け取り、該文字列に対応した音声パラメタ5を用いて合
成音声を生成するが、この時、本発明の場合には、音声
辞書2に登録されている上記基準となる音声(母音)の
音声パターンから、その音声パラメータを生成し、該生
成された音声パラメータを基に、全学習しようとしてい
ることば(上記、英語)の発音記号の音声パラメータを
パラメータ予測・抽出部6で予測、抽出して使用する。
け取り、該文字列に対応した音声パラメタ5を用いて合
成音声を生成するが、この時、本発明の場合には、音声
辞書2に登録されている上記基準となる音声(母音)の
音声パターンから、その音声パラメータを生成し、該生
成された音声パラメータを基に、全学習しようとしてい
ることば(上記、英語)の発音記号の音声パラメータを
パラメータ予測・抽出部6で予測、抽出して使用する。
そして、該生成された合成音声は学習者に対して呈示さ
れると同時に、スコア計算部8に入力され、学習者の発
声した音声パターンとの距離からスコアが計算され、該
スコアがある閾値を越えた場合、即ち、学習者の発声と
合成音声との類似度が高い場合、該スコア計算部8は、
音声登録部3に対して、特定の制御信号B9を送出し、
その時の学習者の発声した音声パターンを再登録するよ
うに動作する。
れると同時に、スコア計算部8に入力され、学習者の発
声した音声パターンとの距離からスコアが計算され、該
スコアがある閾値を越えた場合、即ち、学習者の発声と
合成音声との類似度が高い場合、該スコア計算部8は、
音声登録部3に対して、特定の制御信号B9を送出し、
その時の学習者の発声した音声パターンを再登録するよ
うに動作する。
従って、本発明の語学訓練装置では、最初の音声登録時
に登録された、学習者の基準となる母音(該学習者の音
声の特徴が最も現れている)の音声パターンから、学習
用のことばの基準となる発音記号に対応した音声パラメ
ータ(学習者対応)を予測、抽出し、その音声パラメー
タを用いて、又、子音に関しては、学習者による特徴量
が小さいので、予め、登録しである学習対象のことばの
子音の音声パラメータを利用して、音声合成を行うよう
に機能するので、それぞれの音声パラメータには相関が
あることから、学習者の発声と合成音声との定量的な比
較が可能となり、学習者の習熟度の客観的な評価ができ
る。又、該音声辞書に登録される音声パターンは、学習
者の習熟度に応じて、合成音声に近い音声パターンが再
登録され、該再登録された音声パターンとの距離が計算
されて認識結果(文字列情報)を出力するので、学習者
の習熟度が上昇した場合でも、認識率が低下することが
ないという効果がある。
に登録された、学習者の基準となる母音(該学習者の音
声の特徴が最も現れている)の音声パターンから、学習
用のことばの基準となる発音記号に対応した音声パラメ
ータ(学習者対応)を予測、抽出し、その音声パラメー
タを用いて、又、子音に関しては、学習者による特徴量
が小さいので、予め、登録しである学習対象のことばの
子音の音声パラメータを利用して、音声合成を行うよう
に機能するので、それぞれの音声パラメータには相関が
あることから、学習者の発声と合成音声との定量的な比
較が可能となり、学習者の習熟度の客観的な評価ができ
る。又、該音声辞書に登録される音声パターンは、学習
者の習熟度に応じて、合成音声に近い音声パターンが再
登録され、該再登録された音声パターンとの距離が計算
されて認識結果(文字列情報)を出力するので、学習者
の習熟度が上昇した場合でも、認識率が低下することが
ないという効果がある。
以下本発明の実施例を図面によって詳述する。
前述の第1図が本発明の原理構成図であり、第2図は本
発明の一実施例を示した図であり、第3図は本発明の他
の実施例を示した図であって、登録時に、音声辞書2に
登録された学習者の基準となる音声(母音)の音声パタ
ーンから求めた該母音の音声パラメータに基づいて、該
学習対象のことば(例えば、英語)の基準となる発音記
号に対応した音声パラメータ (特徴パラメータ)5を
、パラメータ予測・抽出部6で予測して抽出し、これを
用いて音声合成部4で合成音声を生成する手段、及び、
該生成された合成音声の音声パターンと、学習者の発声
した音声パターンとの間の距離を計算してスコアを付け
、そのスコアがある閾値を越える場合、即ち、学習者の
発声と1合成音声との類似度が高い場合、その発声した
音声パターンを音声辞書2に再登録する手段が本発明を
実施するのに必要な手段である。尚、全図を通して同じ
符号は同じ対象物を示している。
発明の一実施例を示した図であり、第3図は本発明の他
の実施例を示した図であって、登録時に、音声辞書2に
登録された学習者の基準となる音声(母音)の音声パタ
ーンから求めた該母音の音声パラメータに基づいて、該
学習対象のことば(例えば、英語)の基準となる発音記
号に対応した音声パラメータ (特徴パラメータ)5を
、パラメータ予測・抽出部6で予測して抽出し、これを
用いて音声合成部4で合成音声を生成する手段、及び、
該生成された合成音声の音声パターンと、学習者の発声
した音声パターンとの間の距離を計算してスコアを付け
、そのスコアがある閾値を越える場合、即ち、学習者の
発声と1合成音声との類似度が高い場合、その発声した
音声パターンを音声辞書2に再登録する手段が本発明を
実施するのに必要な手段である。尚、全図を通して同じ
符号は同じ対象物を示している。
以下、第1図を参照しながら、第2図、第3図によって
、本発明の語学訓練装置の構成と動作を説明する。
、本発明の語学訓練装置の構成と動作を説明する。
先ず、第2図に示した実施例においては、最初に、音声
辞書2に、学習者の発声した基準となる音声、即ち、母
音の音声パターンと、それに対応する発音記号が音声辞
書2の特定の領域に登録される。
辞書2に、学習者の発声した基準となる音声、即ち、母
音の音声パターンと、それに対応する発音記号が音声辞
書2の特定の領域に登録される。
次に、学習者の発声した学習用単語の音声パターンと、
それに対応する文字列情報が登録される。
それに対応する文字列情報が登録される。
具体的には、制御信号A 10が音声登録を指示してい
るとき、音声登録部3が起動され、マイク14を通して
入力される学習者の発声(母音、或いは、学習用単語)
と、その時、文字列情報入力部12から学習者によって
入力される、母音の発音記号、或いは、文字列情報11
を受け取って、音声辞書2の特定領域に登録を行う。こ
の際、学習者の発声は、ある種の情報圧縮がなされて、
該音声辞書2に登録されてもよい。又、上記文字列情報
人力部12としては、キーボッド等の入力装置が考えら
れる。
るとき、音声登録部3が起動され、マイク14を通して
入力される学習者の発声(母音、或いは、学習用単語)
と、その時、文字列情報入力部12から学習者によって
入力される、母音の発音記号、或いは、文字列情報11
を受け取って、音声辞書2の特定領域に登録を行う。こ
の際、学習者の発声は、ある種の情報圧縮がなされて、
該音声辞書2に登録されてもよい。又、上記文字列情報
人力部12としては、キーボッド等の入力装置が考えら
れる。
次に、学習時には、該音声辞書2に登録されている学習
用の単語の音声パターンを用いて、音声認識部1が学習
者の発声した音声パターンの認識を行う。具体的には、
該音声認識部1は、学習者の発声した音声パターンと、
音声辞書2内の音声パターンのマツチングを行い、最も
距離の短い音声パターンに対応する文字列を認識結果7
として出力する。
用の単語の音声パターンを用いて、音声認識部1が学習
者の発声した音声パターンの認識を行う。具体的には、
該音声認識部1は、学習者の発声した音声パターンと、
音声辞書2内の音声パターンのマツチングを行い、最も
距離の短い音声パターンに対応する文字列を認識結果7
として出力する。
音声合成部4では、上記音声認識部1の認識結果(文字
列情報)7を受け取り、該文字列情報から、各単語の発
音記号を生成し、パラメータ予測・抽出部6において、
上記音声辞書2に登録されている、基準となる母音(a
、i、u+e+o)に対応した音声パターンから、該母
音の音声パラメータ(例えば、平均基本周波数、平均音
声パワー、第1゜2ホルマンNZ等)を生成した後、該
学習対象のことば、即ち、本例では英語の母音、即ち、
複数個の発音記号の、該学習者に対応した音声パラメー
タを予測して、音声パラメータ5に格納されているもの
から、上記各単語に対応した音声パラメータを取り出す
が、子音に関しては、学習者による特@量の変動が小さ
いので、予め、登録しである学習対象のことばの子音の
音声パラメータを使用し、予め、定められている合成規
則によって接続して(具体的には、該音声パラメータを
用いて音声合成器(例えば、ディジタルフィルタ)を動
作させて)、連続した合成音声を生成する。
列情報)7を受け取り、該文字列情報から、各単語の発
音記号を生成し、パラメータ予測・抽出部6において、
上記音声辞書2に登録されている、基準となる母音(a
、i、u+e+o)に対応した音声パターンから、該母
音の音声パラメータ(例えば、平均基本周波数、平均音
声パワー、第1゜2ホルマンNZ等)を生成した後、該
学習対象のことば、即ち、本例では英語の母音、即ち、
複数個の発音記号の、該学習者に対応した音声パラメー
タを予測して、音声パラメータ5に格納されているもの
から、上記各単語に対応した音声パラメータを取り出す
が、子音に関しては、学習者による特@量の変動が小さ
いので、予め、登録しである学習対象のことばの子音の
音声パラメータを使用し、予め、定められている合成規
則によって接続して(具体的には、該音声パラメータを
用いて音声合成器(例えば、ディジタルフィルタ)を動
作させて)、連続した合成音声を生成する。
これは、一般に、人の音声の特徴は、主として母音に現
れることに着目し、学習者に、日本語の母音(a+t+
u+e+o)を発声させ、その学習者の母音の音声パタ
ーン(声質)からパラメータ予測・抽出部6によって、
該母音の音声パラメータを生成し、該生成された音声パ
ラメータから、学習対象の言語、即ち、英語の母音の上
記学習者に対応した音声パラメータを予測することで、
学習者の声質と、合成音声の声質とを近接させ、学習の
習熟度を客観的に判断できるようにすることを狙ったも
のである。
れることに着目し、学習者に、日本語の母音(a+t+
u+e+o)を発声させ、その学習者の母音の音声パタ
ーン(声質)からパラメータ予測・抽出部6によって、
該母音の音声パラメータを生成し、該生成された音声パ
ラメータから、学習対象の言語、即ち、英語の母音の上
記学習者に対応した音声パラメータを予測することで、
学習者の声質と、合成音声の声質とを近接させ、学習の
習熟度を客観的に判断できるようにすることを狙ったも
のである。
上記のようにして生成された合成音声は、スピーカ15
によって学習者に呈示されると同時に、スコア計算部8
に入力されて、学習者の発声した音声との距離によるス
コアが計算され、該計算結果がスコア表示部13に表示
される。該スコア表示部13としては、例えば、陰極線
管(CRT)等の出力装置が考えられる。
によって学習者に呈示されると同時に、スコア計算部8
に入力されて、学習者の発声した音声との距離によるス
コアが計算され、該計算結果がスコア表示部13に表示
される。該スコア表示部13としては、例えば、陰極線
管(CRT)等の出力装置が考えられる。
上記の計算されたスコアが、予め、定められている閾値
を越えた場合、即ち、学習者の発声と。
を越えた場合、即ち、学習者の発声と。
合成音声との類似度が高い場合、該スコア計算部8は音
声登録部3に対して、特定の制御信号B9を送出し、そ
のとき、学習者によって発声された学習用の音声パター
ンを再登録することを指示する。
声登録部3に対して、特定の制御信号B9を送出し、そ
のとき、学習者によって発声された学習用の音声パター
ンを再登録することを指示する。
このように制御することにより、学習者の習熟度が上が
っていった場合でも、学習者の発声した音声パターンと
音声辞書2に登録されている音声パターンとのマツチン
グがよくとれ、認識率が低下することがなくなる。
っていった場合でも、学習者の発声した音声パターンと
音声辞書2に登録されている音声パターンとのマツチン
グがよくとれ、認識率が低下することがなくなる。
次に、第3図によって、本発明の他の実施例を説明する
。
。
この場合の音声登録は、学習単語選択部16が、単語辞
書17から学習用の単語を選択し、表示部13に渡して
、学習者に対して、その単語の発声を行うように促す。
書17から学習用の単語を選択し、表示部13に渡して
、学習者に対して、その単語の発声を行うように促す。
又、該学習単語選択部16は、該選択した単語を音声登
録部3に渡すと同時に、制御信号A 10も送出し、音
声登録部3に対して、その時学習者の発声した音声パタ
ーンと、該単語とを対応付けて音声辞書2に登録するこ
とを指示する。
録部3に渡すと同時に、制御信号A 10も送出し、音
声登録部3に対して、その時学習者の発声した音声パタ
ーンと、該単語とを対応付けて音声辞書2に登録するこ
とを指示する。
この場合、最初、基準となる単語、例えば、上記母音(
a+ j+u+e+o)の発声を促し、次に、学習単語
の発声を促すことで、第2図で説明した実施例と同様の
登録処理が行われる。
a+ j+u+e+o)の発声を促し、次に、学習単語
の発声を促すことで、第2図で説明した実施例と同様の
登録処理が行われる。
学習時においては、学習単語選択部16は、該学習の初
期時には、ランダムに単語辞書17から単語を選択する
が、学習が進んだ場合9、スコア計算部8から出力され
る単語毎のスコア18を記憶しておいて、十分に高いス
コアの得られている単語を選択しないようにし、逆に、
該スコア値の低い単語を積極的に選択するように動作す
る。
期時には、ランダムに単語辞書17から単語を選択する
が、学習が進んだ場合9、スコア計算部8から出力され
る単語毎のスコア18を記憶しておいて、十分に高いス
コアの得られている単語を選択しないようにし、逆に、
該スコア値の低い単語を積極的に選択するように動作す
る。
その他、該学習時の、音声認識部l、音音声合部部での
動作、及び、スコア計算部8での動作は、上記第2図で
説明した実施例と同じように動作する。
動作、及び、スコア計算部8での動作は、上記第2図で
説明した実施例と同じように動作する。
このように、本発明は、外国語等の訓練を行うとき、最
初学習者の発声を対応する文字列情報と共に登録してお
き、学習時には、学習者の発声した音声パターンが該登
録された音声パターンとマツチングした時、該マツチン
グした音声に対応した文字列情報に基づいて、該学習者
の発声に対して正しい発声で応答する語学訓練装置にお
いて、該登録時に、音声辞書2に登録された学習者の基
準となる音声(母音)の音声パターンから求めた該母音
の音声パラメータに基づいて、該学習対象のことば(例
えば、英語)の基準となる発音記号の、該学習者に対応
した音声パラメータ (特徴パラメータ)を予測して抽
出し、子音については、予め、登録しである学習対象の
ことばの子音の音声パラメータを用いて、音声合成部で
合成音声を生成して学習者に提示すると共に、該生成さ
れた合成音声の音声パターンと、学習者の発声した音声
パターンとの間の距離を計算してスコアを付け、そのス
コアがある閾値を越える場合、即ち、学習者の発声と9
合成音声との類似度が高い場合、その発声した音声パタ
ーンを音声辞書に再登録するようにして、学習者の習熟
度を客観的に判断できるようにすると共に、学習者の習
熟度が向上しても、音声辞書に登録されている音声パタ
ーンとのマツチング率が低下しないようにした所に特徴
がある。
初学習者の発声を対応する文字列情報と共に登録してお
き、学習時には、学習者の発声した音声パターンが該登
録された音声パターンとマツチングした時、該マツチン
グした音声に対応した文字列情報に基づいて、該学習者
の発声に対して正しい発声で応答する語学訓練装置にお
いて、該登録時に、音声辞書2に登録された学習者の基
準となる音声(母音)の音声パターンから求めた該母音
の音声パラメータに基づいて、該学習対象のことば(例
えば、英語)の基準となる発音記号の、該学習者に対応
した音声パラメータ (特徴パラメータ)を予測して抽
出し、子音については、予め、登録しである学習対象の
ことばの子音の音声パラメータを用いて、音声合成部で
合成音声を生成して学習者に提示すると共に、該生成さ
れた合成音声の音声パターンと、学習者の発声した音声
パターンとの間の距離を計算してスコアを付け、そのス
コアがある閾値を越える場合、即ち、学習者の発声と9
合成音声との類似度が高い場合、その発声した音声パタ
ーンを音声辞書に再登録するようにして、学習者の習熟
度を客観的に判断できるようにすると共に、学習者の習
熟度が向上しても、音声辞書に登録されている音声パタ
ーンとのマツチング率が低下しないようにした所に特徴
がある。
以−ヒ、詳細に説明したように、本発明の語学訓練装置
は、学習者の発声した音声パターンを文字列情報と共に
、音声辞書に登録しておき、学習時に、学習者が発声し
た音声パターンを認識し、認識された結果として出力さ
れる文字列情報に基づいて合成音声を生成する語学訓練
装置において、該音声辞書に、上記学習者の発声する学
習用の音声パターンの他に、該学習者の発声する基準と
なる音声記号(a+i、u、e、o)の音声パターンを
登録しておき、該登録されている基準音声の音声バタン
から生成した音声パラメータに基づいて予測。
は、学習者の発声した音声パターンを文字列情報と共に
、音声辞書に登録しておき、学習時に、学習者が発声し
た音声パターンを認識し、認識された結果として出力さ
れる文字列情報に基づいて合成音声を生成する語学訓練
装置において、該音声辞書に、上記学習者の発声する学
習用の音声パターンの他に、該学習者の発声する基準と
なる音声記号(a+i、u、e、o)の音声パターンを
登録しておき、該登録されている基準音声の音声バタン
から生成した音声パラメータに基づいて予測。
抽出した、学習対象のことば(英語等)の基準となる発
音の音声パラメータを用い、子音については、予め、登
録しである該学習対象のことばの子音の音声パラメータ
を利用して、音声合成を行うようにすると共に、該合成
音声と学習者の発声した音声との間の距離を計算してス
コアを付けて、該スコアがある閾値を越える場合、即ち
、学習者の発声と合成音声との類似度が高い場合、その
発声を該音声辞書に再登録し、学習者の習熟度が上昇し
た場合でも認識率を低下しないように構成したものであ
るので、最初の音声登録時に登録された、学習者の基準
となる母音(該学習者の音声の特徴が最も現れている)
の音声パターンから、学習用のことばの基準となる発音
記号に対応した音声パラメータ(学習者対応〉を予測、
抽出し、その音声パラメータを用いて音声合成を行うよ
うに機能するので、学習者の発声と合成音声との定量的
な比較が可能となり、学習者の習熟度の客観的な評価が
できる。又、該音声辞書に登録される音声パターンは、
学習者の習熟度に応じて、合成音声に近い音声パターン
が再登録され、該再登録された音声パターンとの距離が
計算されて認識結果(文字列情報)を出力するので、学
習者の習熟度が上昇した場合でも、認識率が低下するこ
とがないという効果がある。
音の音声パラメータを用い、子音については、予め、登
録しである該学習対象のことばの子音の音声パラメータ
を利用して、音声合成を行うようにすると共に、該合成
音声と学習者の発声した音声との間の距離を計算してス
コアを付けて、該スコアがある閾値を越える場合、即ち
、学習者の発声と合成音声との類似度が高い場合、その
発声を該音声辞書に再登録し、学習者の習熟度が上昇し
た場合でも認識率を低下しないように構成したものであ
るので、最初の音声登録時に登録された、学習者の基準
となる母音(該学習者の音声の特徴が最も現れている)
の音声パターンから、学習用のことばの基準となる発音
記号に対応した音声パラメータ(学習者対応〉を予測、
抽出し、その音声パラメータを用いて音声合成を行うよ
うに機能するので、学習者の発声と合成音声との定量的
な比較が可能となり、学習者の習熟度の客観的な評価が
できる。又、該音声辞書に登録される音声パターンは、
学習者の習熟度に応じて、合成音声に近い音声パターン
が再登録され、該再登録された音声パターンとの距離が
計算されて認識結果(文字列情報)を出力するので、学
習者の習熟度が上昇した場合でも、認識率が低下するこ
とがないという効果がある。
第1図は本発明の原理構成図。
第2図は本発明の一実施例を示した図。
第3図は本発明の他の実施例を示した図。
第4図は従来の語学訓練装置を説明する図。
である。
図面において、
1は音声認識部。
3は音声登録部。
5は音声パラメータ。
6はパラメータ予測・
7は認識結果。
9は制御信号B。
11は文字列情報。
13はスコア表示部。
15はスピーカ。
17は単語辞書。
2は音声辞書。
4は音声合成部。
抽出部。
8はスコア計算部。
10は制御信号A。
12は文字列情報入力部。
14はマイク。
16は学習単語選択部。
18は単語毎のスコア。
第
3
図
第
図
Claims (1)
- 【特許請求の範囲】 制御信号A(10)の指令を受けて、学習者の発声と、
それに対応する基準音声記号、又は、文字列情報(11
)を音声辞書(2)に登録する音声登録部(3)と、 該音声辞書(2)を用いて、学習者の発声する学習用の
音声パターンの認識を行う音声認識部(1)と、 上記音声辞書(2)に登録されている学習者の基準とな
る音声記号の音声パターンから、その音声パラメータを
生成し、その音声パラメータを基に音声合成に必要な基
準となる音声記号の音声パラメータを予測、抽出するパ
ラメータ予測・抽出部(6)と、 該音声認識部(1)の認識結果(7)を受け取り、上記
パラメータ予測・抽出部(6)で抽出した音声パラメー
タ(5)を用いて音声合成を行う音声合成部(4)と、 該音声合成部(4)で生成された合成音声と、学習者の
発声した学習用音声との距離からスコアを計算し、該ス
コアがある閾値を越える場合、その時の学習者の発声し
た学習用音声パターンを音声辞書(2)に再登録するた
めの制御信号B(9)を音声登録部(3)に送出するス
コア計算部(8)とからなることを特徴とする語学訓練
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1225893A JPH0389294A (ja) | 1989-08-31 | 1989-08-31 | 語学訓練装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1225893A JPH0389294A (ja) | 1989-08-31 | 1989-08-31 | 語学訓練装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0389294A true JPH0389294A (ja) | 1991-04-15 |
Family
ID=16836529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1225893A Pending JPH0389294A (ja) | 1989-08-31 | 1989-08-31 | 語学訓練装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0389294A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022531524A (ja) * | 2019-07-09 | 2022-07-07 | グーグル エルエルシー | オンデバイスの音声認識モデルの訓練のためのテキストセグメントのオンデバイスの音声合成 |
-
1989
- 1989-08-31 JP JP1225893A patent/JPH0389294A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022531524A (ja) * | 2019-07-09 | 2022-07-07 | グーグル エルエルシー | オンデバイスの音声認識モデルの訓練のためのテキストセグメントのオンデバイスの音声合成 |
US11705106B2 (en) | 2019-07-09 | 2023-07-18 | Google Llc | On-device speech synthesis of textual segments for training of on-device speech recognition model |
US11978432B2 (en) | 2019-07-09 | 2024-05-07 | Google Llc | On-device speech synthesis of textual segments for training of on-device speech recognition model |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6523893B2 (ja) | 学習装置、音声合成装置、学習方法、音声合成方法、学習プログラム及び音声合成プログラム | |
Fry | Theoretical aspects of mechanical speech recognition | |
Janse | Word perception in fast speech: artificially time-compressed vs. naturally produced fast speech | |
WO2001052237A1 (fr) | Appareil, methode et support d'apprentissage de langues etrangeres | |
JP2002304190A (ja) | 発音変化形生成方法及び音声認識方法 | |
JP5105943B2 (ja) | 発話評価装置及び発話評価プログラム | |
US11935523B2 (en) | Detection of correctness of pronunciation | |
KR20230150377A (ko) | 대화 동안 텍스트 음성 변환에서의 즉각적인 학습 | |
Kabashima et al. | Dnn-based scoring of language learners’ proficiency using learners’ shadowings and native listeners’ responsive shadowings | |
KR20070103095A (ko) | 주파수 대역폭을 이용한 영어 학습 방법 | |
JPH0389294A (ja) | 語学訓練装置 | |
JP3621624B2 (ja) | 外国語学習装置、外国語学習方法および媒体 | |
JP3254977B2 (ja) | 音声認識方法及び音声認識装置 | |
US9437190B2 (en) | Speech recognition apparatus for recognizing user's utterance | |
JP2017015823A (ja) | 発話練習装置、表示制御方法、及びプログラム | |
JPH07140996A (ja) | 音声規則合成装置 | |
Gavat et al. | Natural language processing in assistive technologies | |
JP7060857B2 (ja) | 語学習得装置及び語学習得プログラム | |
JP2007071904A (ja) | 地域別発音学習支援装置 | |
KR102610871B1 (ko) | 청각장애인 음성언어훈련 시스템 | |
JP3883780B2 (ja) | 音声合成装置 | |
KR20170059665A (ko) | 외국어 리듬 동작 감지 센서 기반의 운동 학습 장치, 그리고 이를 이용한 운동 학습 방법 | |
KR20020079021A (ko) | 끝말 이어가기 게임 방법 및 장치 | |
JPH0434499A (ja) | 発声法指示装置 | |
KR20220033186A (ko) | 영어 발음에 대한 학습 서비스를 제공하는 서버, 방법 및 컴퓨터 프로그램 |