JP2001265211A - 外国語学習装置、外国語学習方法および媒体 - Google Patents
外国語学習装置、外国語学習方法および媒体Info
- Publication number
- JP2001265211A JP2001265211A JP2000078578A JP2000078578A JP2001265211A JP 2001265211 A JP2001265211 A JP 2001265211A JP 2000078578 A JP2000078578 A JP 2000078578A JP 2000078578 A JP2000078578 A JP 2000078578A JP 2001265211 A JP2001265211 A JP 2001265211A
- Authority
- JP
- Japan
- Prior art keywords
- word
- phoneme
- information
- sentence
- learner
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 98
- 238000011156 evaluation Methods 0.000 claims abstract description 58
- 230000001755 vocal effect Effects 0.000 claims description 13
- 238000000926 separation method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 20
- 230000008569 process Effects 0.000 description 38
- 238000010586 diagram Methods 0.000 description 21
- 238000012549 training Methods 0.000 description 18
- 238000013500 data storage Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 102100033041 Carbonic anhydrase 13 Human genes 0.000 description 1
- 101000867860 Homo sapiens Carbonic anhydrase 13 Proteins 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 210000004704 glottis Anatomy 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003254 palate Anatomy 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
- G09B5/065—Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
結果を、効率的な外国語発音練習ができるように提示す
ることが可能な外国語学習装置を提供する。 【解決手段】 外国語学習装置100中の音声認識部1
14および演算処理部116は、学習者2の発音した文
章に対応する文章音声情報を受けて、文章に含まれる単
語毎の単語音声情報に分離する。演算処理部116は、
単語音声情報ごとにモデル音声との一致の程度(尤度)
を評価した結果を単語毎に表示装置120表示させる。
Description
ムを用いて外国語学習を行うための外国語学習装置およ
び外国語学習方法ならびにこのような外国語学習方法を
コンピュータに実行させるためのプログラムを記録した
コンピュータ読取り可能な媒体に関する。
に利用する試みが盛んに行われている。すなわち、この
ような外国語学習装置においては、学習者は、一つまた
は複数の外国語の文章を読み上げ、パーソナルコンピュ
ータ(計算機)の音声入力機能を利用して自分の発音し
た文章をパーソナルコンピュータに入力する。そして、
上記パーソナルコンピュータに搭載された当該外国語に
対応した音声認識システムが、学習者が読み上げた文章
をどの程度正しく認識したかを判定し、その結果を学習
者へのフィードバックとして表示するという方式であ
る。
外国語学習装置においては、利用する音声認識システム
が、もともとパーソナルコンピュータへのキーボード入
力を音声入力に置き換えることを目的としたものであっ
て、学習者が発音した文章単位で認識が行われ、その認
識結果と本来期待される文章との比較結果が出力される
に過ぎない。このため、学習者は、このような文章全体
として自分の発音が評価された結果しか知ることができ
ない。
わたって評価が平均していることはまれであって、文章
中のある特定の部分では評価が高く、別の部分では評価
が低いということの方が一般的である。
を用いていたのでは、特に、学習者に対して表示された
評価点が低かった際に、その文章単位中のどの部分の発
音が悪かったのかを学習者が知ることができない。この
結果、学習者は、評価点が上がるまでやみくもに文章全
体の発音をやり直すことになり、学習効率を妨げてしま
うという問題点があった。
るためになされたものであって、その目的は、学習者の
発音した外国語の文章に対する評価結果を、効率的な外
国語発音練習ができるように提示することが可能な外国
語学習装置を提供することである。
外国語の文章に対する発音の評価結果を学習者の外国語
発音練習に対して効率的にフィードバックすることが可
能な外国語学習方法を提供することである。
音した外国語の文章に対する発音の評価結果を学習者の
外国語発音練習に対して効率的にフィードバックするこ
とが可能な外国語学習方法を、コンピュータに実行させ
るためのプログラムを記録したコンピュータ読取り可能
な媒体を提供することである。
習装置は、学習者の発音した文章に対応する文章音声情
報を受けて、文章に含まれる単語毎の単語音声情報に分
離する単語分離手段と、単語音声情報ごとにモデル音声
との一致の程度を評価する尤度判定手段と、尤度判定手
段の判定結果を単語毎に表示する表示手段とを備える。
1記載の外国語学習装置の構成に加えて、学習者が発音
するべきモデル文章と対応するモデル音韻配列情報とを
保持する記憶手段と、予め学習者にモデル文章を提示す
るための出力手段とをさらに備え、単語分離手段は、文
章音声情報を音韻情報毎に認識する音韻認識手段と、分
離された音韻情報とモデル音韻配列情報とに基づいて、
単語毎の単語音声情報を認識する単語音声認識手段とを
含む。
2記載の外国語学習装置の構成に加えて、音韻認識手段
は、外国語に含まれ得る音韻のそれぞれに対する、文章
音声情報中の各音韻情報の尤度を判定する音韻尤度決定
手段を含み、尤度判定手段は、文章音声情報中の各音韻
情報の尤度分布平面上において、モデル音韻配列情報ど
おりの音韻配列で発音したとした場合の経路に沿って求
めた各単語尤度と、学習者の発音した音声波形から間違
いやすい候補の経路に沿って求めた各単語尤度の合計と
を照合することで、単語毎の一致の程度を評価する。
の発音した文章に対応する文章音声情報を受けて、文章
に含まれる単語毎の単語音声情報に分離するステップ
と、単語音声情報ごとにモデル音声との一致の程度を評
価するステップと、単語音声情報ごとの評価結果を単語
毎に表示するステップとを備える。
4記載の外国語学習方法の構成に加えて、予め学習者に
モデル文章を提示するステップをさらに備え、単語音声
情報に分離するステップは、文章音声情報を音韻情報毎
に認識するステップと、学習者に提示されたモデル文章
に対応するモデル音韻配列情報と分離された音韻情報と
に基づいて、単語毎の単語音声情報を認識するステップ
とを含む。
5記載の外国語学習方法の構成に加えて、音韻情報毎に
認識するステップは、外国語に含まれ得る音韻のそれぞ
れに対する、文章音声情報中の各音韻情報の尤度を判定
するステップを有し、モデル音声との一致の程度を評価
するステップは、文章音声情報中の各音韻情報の尤度分
布平面上において、モデル音韻配列情報どおりの音韻配
列で発音したとした場合の経路に沿って求めた各単語尤
度と、学習者の発音した音声波形から間違いやすい候補
の経路に沿って求めた各単語尤度の合計とを照合するこ
とで、単語毎の一致の程度を評価する。
5記載の外国語学習方法の構成に加えて、学習者が発す
るモデル文章中の音韻毎および単語ごとに発音練習結果
を評価するステップをさらに備える。
7記載の外国語学習方法の構成に加えて、発音練習結果
を評価するステップは、学習者に対して、表示装置を介
して、音韻毎に声道形状モデルを表示するステップを含
む。
7記載の外国語学習方法の構成に加えて、発音練習結果
を評価するステップは、学習者に対して、表示装置を介
して、モデル声紋と学習者の発音に対する声紋とを対比
表示するステップを含む。
項7記載の外国語学習方法の構成に加えて、発音練習結
果を評価するステップは、学習者に対して、表示装置を
介して、学習者の発音のフォルマント平面上の位置を表
示するステップを含む。
者が発音するべきモデル文章と対応するモデル音韻配列
情報とを保持する記憶手段と、予め学習者にモデル文章
を提示するための出力手段と、学習者の発音した文章に
対応する文章音声情報を受けて、文章に含まれる単語毎
の単語音声情報に分離する単語分離手段と、単語音声情
報ごとにモデル音声との一致の程度を評価する尤度判定
手段と、尤度判定手段の判定結果を音韻毎および単語毎
に表示する表示手段とを備え、単語分離手段は、文章音
声情報を音韻情報毎に認識する音韻認識手段と、分離さ
れた音韻情報とモデル音韻配列情報とに基づいて、単語
毎の単語音声情報を認識する単語音声認識手段とを含
み、発音練習期間中において、学習者が発するモデル文
章中の音韻毎および単語ごとに発音練習結果を評価する
発音評価手段をさらに備える。
項11記載の外国語学習装置の構成に加えて、発音評価
手段は、学習者に対して、表示装置を介して、音韻毎に
声道形状モデルを表示する。
項11記載の外国語学習装置の構成に加えて、発音評価
手段は、学習者に対して、表示装置を介して、モデル声
紋と学習者の発音に対する声紋とを対比表示する。
項11記載の外国語学習装置の構成に加えて、発音評価
手段は、学習者に対して、表示装置を介して、学習者の
発音のフォルマント平面上の位置を表示する。
ュータに実行させるためのプログラムを記録したコンピ
ュータ読取り可能な媒体において、外国語学習方法は、
学習者の発音した文章に対応する文章音声情報を受け
て、文章に含まれる単語毎の単語音声情報に分離するス
テップと、単語音声情報ごとにモデル音声との一致の程
度を評価するステップと、単語音声情報ごとの評価結果
を単語毎に表示するステップとを有する。
15記載の媒体の構成に加えて、外国語学習方法は、予
め学習者にモデル文章を提示するステップをさらに備
え、単語音声情報に分離するステップは、文章音声情報
を音韻情報毎に認識するステップと、学習者に提示され
たモデル文章に対応するモデル音韻配列情報と分離され
た音韻情報とに基づいて、単語毎の単語音声情報を認識
するステップとを含む。
16記載の媒体の構成に加えて、外国語学習方法は、音
韻情報毎に認識するステップは、外国語に含まれ得る音
韻のそれぞれに対する、文章音声情報中の各音韻情報の
尤度を判定するステップを有し、モデル音声との一致の
程度を評価するステップは、文章音声情報中の各音韻情
報の尤度分布平面上において、モデル音韻配列情報どお
りの音韻配列で発音したとした場合の経路に沿って求め
た各単語尤度と、学習者の発音した音声波形から間違い
やすい候補の経路に沿って求めた各単語尤度の合計とを
照合することで、単語毎の一致の程度を評価する。
16記載の媒体の構成に加えて、外国語学習方法は、学
習者が発するモデル文章中の音韻毎および単語ごとに発
音練習結果を評価するステップをさらに備える。
18記載の媒体の構成に加えて、外国語学習方法は、発
音練習結果を評価するステップは、学習者に対して、表
示装置を介して、音韻毎に声道形状モデルを表示するス
テップを含む。
18記載の媒体の構成に加えて、外国語学習方法は、発
音練習結果を評価するステップは、学習者に対して、表
示装置を介して、モデル声紋と学習者の発音に対する声
紋とを対比表示するステップを含む。
18記載の媒体の構成に加えて、外国語学習方法は、発
音練習結果を評価するステップは、学習者に対して、表
示装置を介して、学習者の発音のフォルマント平面上の
位置を表示するステップを含む。
に係る外国語学習装置100の構成を説明するための概
略ブロック図である。
語を例として説明するが、以下の説明で明らかとなるよ
うに、本発明はこのような場合に限定されることなく、
母国語以外の言語を学習者が学習する際に一般的に適用
可能なものである。
は、学習者2が発声した音声を取得するためのマイクロ
フォン102と、マイクロフォン102からの出力を受
けて、学習者2が発音した文章に対応する音声情報を処
理して、この文章中に含まれる単語毎に、期待される発
音に基づいた学習者の発音の評価点を求めるためのマイ
クロコンピュター110と、マイクロコンピュータ11
0から与えられる学習者2が発音するべき文章を表示
し、単語毎に求められた学習者の発音に対する評価点
を、単語毎に表示するための表示装置(ディスプレイ)
120とを備える。
章(以下、「モデル文章」と呼ぶ)を提示する方法とし
ては、上述のとおり、表示装置120を介して文字情報
として提示してもよいし、スピーカ104から音声とし
て学習者2に提示してもよい。また、後に説明する単語
毎の発音練習においては、スピーカ104から手本とな
る発音を音声として出力することも可能である。
フォン102からの音声信号を受け、また、スピーカ1
04に対して音声信号を与えるためのインターフェース
である音声入出力部112と、後に説明するように音声
入出力部112からの信号に基づいて、マイクロフォン
102に与えられた文章に対応する音声情報(以下、
「文章音声情報」と呼ぶ)をそれに含まれる音韻情報に
分離解析する音声認識部114と、前記文章音声情報を
一時的に格納し、かつ前記モデル文章およびこれに対応
する音韻情報と単語境界に対する情報とを保持するため
のデータ記憶部118と、音声認識部114の解析結果
と、前記データ記憶部118に格納され学習者2に対し
て発音を促すために与えられたモデル文章に対する情報
等とに基づいて、このモデル文章に含まれる単語毎に、
モデル文章に対する音韻情報(モデル音韻情報)に対す
る学習者2の発音の評価点を求める演算処理部116と
を備える。
章のうちの1つについての文章音声情報の構成を説明す
るための概念図である。
というモデル文章を例として挙げている。
しており、文章は、単語、音節(母音と子音とで形成す
る単位で、日本語では通常1つの仮名で表記される単
位)、音韻(各子音、各母音)という風に細分化され
る。
は多少の相違があり、また、文章と単語の中間層とし
て、いわゆる「フレーズ」を形成する場合もある。
0により実現される外国語学習のフローを説明するため
のフローチャートである。
学習装置100により実現される外国語学習において
は、音声言語の階層性を利用して、文章単位の発音に対
して包括的な評価ばかりでなく、単語単位さらには音韻
単位での学習者の発音の評価を学習者にフィードバック
し、学習者はこの評価結果に基づいて、不得意であると
判定された単語毎または音韻毎に発音練習を行うことが
可能な構成となっている。特に、単語毎に評価点を表示
することで、個々の音韻に対する測定誤差の影響が軽減
されるだけでなく、学習者が発音練習をしやすい単位で
ある単語ごとに発音練習を行うことが可能で、発音練習
を効率的に行うことができる。
と(ステップS100)、まず、表示装置120により
学習者2に対し、発音するべきモデル文章が提示される
(ステップS102).つづいて、学習者2がこのモデ
ル文章を発音すると、マイクロフォン102および音声
入出力部112を介して、モデル文章に対応した音声情
報(文章音声情報)が取得される(ステップS10
4)。
部112から出力される信号に基づいて、文章音声情報
を音韻ごとに対応する音声情報として認識する(ステッ
プS106)。
音韻に分離された音声情報と、データ記憶部118に格
納されたモデル文章に対するモデル音韻情報との比較に
より、単語毎の音声情報を認識する(ステップS10
8)。
情報について単語毎に、データ記憶部118に格納され
たモデル文章に対するモデル音韻情報を参照すること
で、単語毎の発音の評価点を求め、表示装置120に対
して出力する(ステップS108)。なお、このとき、
各単語に含まれる音韻毎の評価点を併せて出力してもよ
い。
音韻毎の評価点に基づいて、自分の不得手な単語毎、ま
たは音韻毎に発音練習を行う(ステップS112)。
2によりパーソナルコンピュータ110の入力装置(キ
ーボードまたは音声入力装置)を介して、モデル文章の
発音を再度試みるか否かの指示が与えられる(ステップ
S114)。再度試みることが指示されると、処理はス
テップS104に復帰し、再度試みることが指示されな
いと、処理は次のステップS116に移行する。
ータ110の入力装置を介して、他のモデル文章につい
ての発音練習を試みるか否かの指示が与えられる(ステ
ップS116)。試みることが指示されると、処理はス
テップS102に復帰し、試みることが指示されない
と、処理は終了する(ステップS120)。
は、単語毎の発音の評価点を求める方法について、さら
に詳しく説明する。
るための概念図である。学習者2の発した音声波形は、
データ記憶部118に一時的に格納することで録音され
る。音声認識部114は、録音した音声波形を、図4に
示すように、A区間、B区間、C区間等の一定の長さの
区間毎に区切り、区間毎に音韻としての尤度(確からし
さ:likelihood)を求める。この区間毎の尤度は、予め
設定した全ての音韻、たとえば、英語としての発音に出
現し得る可能性のある全ての音韻についてそれぞれ求め
られる。言換えると、一つの区間から、英語の音韻の全
てに対する尤度が求められることになる。
話者の音声サンプルから作成された各音韻の音響的特徴
ベクトルの集合体であるモデルと、録音した音声の特定
の区間の音響的特徴ベクトルの集合とを照合し、すでに
周知の最尤推定法を用いて、各区間毎に尤度を求める。
「Probability, Random Variables,and Stochastic Pro
cesses(Third Edition)", Ed.Athanasios Papoulis,McG
raw-Hill.Inc. NewYork, Tokyo(1991)に開示されてい
る。
し得る各音韻(縦軸)と各区間(横軸)についての尤度
の分布を示す尤度分布平面上において、最適の音韻の経
路を選択し、音声認識の結果とする。
経過に従って移行することにより、次の音韻に移行した
ことが判定され、音韻の境界が認識される。
候補中で、このような最適音韻が時間経過とともにたど
る経路を太線で示している。
音した音声の各区間ごとの音韻音声情報に基づき、演算
処理部116が、録音した音声の各音韻に対応する尤度
および単語に対応する尤度を求める手続きを示す概念図
である。
音した音声から認識した音韻についての尤度の区間平均
をとることで、それぞれの音韻に対する尤度を求める。
声波形から各単語において図5に示した間違いやすい候
補のパスに従った各音韻尤度に基づいて、これらの各単
語ごとの音韻尤度の総和または平均として、各単語毎の
単語尤度を求める。
られた内容記述情報、たとえば、"Ihave a red pen"と
いうモデル文章であれば、/ai : h ae v : a : r e d :
p en/というこのモデル文章に対する音声表記情報と単
語境界に対する情報(音声表記情報中の“:”の位置に
関する情報)とに基づき、上記の間違いやすい候補のパ
スにそって、各単語ごとに含まれる音韻についての尤度
(以下、「音韻尤度」と呼ぶ)の総和または平均とし
て、各単語についての尤度(以下、「単語尤度」と呼
ぶ)を求める。以下では、モデル文章についての音韻の
配列についての情報および単語境界についての情報とを
総称して、「モデル音韻配列情報」と呼ぶことにする。
いて、モデル文章どおりに発音がされた場合の音韻の時
間変化の経路と発音評価のための尤度を求める手順とを
説明するための図である。
16は、図5および図6において説明した手順と同様に
して、予め与えられた内容記述情報に基づき、内容記述
情報どおりの音韻配列で発音したとした場合のこの音韻
配列に対応するパスにそって、各単語ごとに含まれる音
韻に対する音韻尤度の総和または平均として、各単語に
ついての単語尤度を求める。
められた、内容記述情報どおりの音韻配列(モデル音韻
配列情報どおりの音韻配列)で発音したとした場合のパ
スに沿って求めた各単語尤度と、録音した音声波形から
各単語において間違いやすい候補のパスに沿って求めた
各単語尤度とを照合することで、その相対的な関係から
評価点を求める。
述情報どおりの音韻配列で発音したとした場合のパスに
沿って求めた各単語尤度を「理想経路単語尤度」と呼
び、録音した音声波形から各単語において最適パスに沿
って求めた各単語尤度の合計を「間違候補経路単語尤
度」と呼ぶこととすると、単語毎の評価点は以下のよう
にして求めることが可能である。 (単語評価点)=(理想経路単語尤度)/(理想経路単
語尤度+間違候補経路単語尤度)×100 このような一連の手続きにより、学習者が発音した文章
につき、各単語毎の評価点を求め、単語毎に評価点を表
示することができる。
えば、内容記述情報どおりの音韻配列で発音したとした
場合のパスに沿って求めた各音韻尤度を「理想経路音韻
尤度」と呼び、録音した音声波形から間違いやすい候補
のパスに沿って求めた各音韻尤度の合計を「間違候補経
路音韻尤度」と呼ぶこととすると、音韻毎の評価点も以
下のようにして求めることも可能である。 (音韻評価点)=(理想経路音韻尤度)/(理想経路音
韻尤度+間違候補経路音韻尤度)×100 したがって、学習者が発音した文章につき、各単語毎の
評価点に加えて、単語毎に含まれる各音韻についての評
価点を表示することができる。
度音韻情報にまで細分化したうえで、単語毎の音声情報
を得る構成として本願発明を説明したが、文章音声情報
を直接、単語毎の音声情報に分離する構成としてもよ
い。
は、学習者の発声した外国の文章を認識して、単語ごと
あるいは音韻ごとにその評価点を表示することで、学習
効率を高める外国語学習装置の構成について説明した。
単語ごと(あるいは音韻ごと)に示された評価点に基づ
いて、学習者が効率よく発音練習を行なうことが可能な
外国語学習装置および外国語学習方法の構成について説
明する。
00の構成を説明するための概略ブロック図である。
は、実施の形態1の外国語学習装置100の構成と同様
である。
置200は、学習者が発声した音声を取得するための音
声入力装置(たとえばマイクロフォン)102と、音声
入力装置102からの出力を受けて、学習者が発声した
文章に対する音声情報を処理して、この文章中に含まれ
る単語ごとに期待される発音に基づいた学習者の発音の
評価点を求めるためのMPU116と、MPU116か
ら与えられる学習者が発音するべき文章を表示し、単語
ごとに求められた学習者の発音に対する評価点を、単語
ごとに表示するためのCRTディスプレイ120と、学
習者からの外国語学習装置200へのデータ入力を受け
るためのキーボードマウス122とを備える。
学習装置の動作全体を制御するための学習制御装置10
1と、学習制御装置101により制御されて、音声入力
装置から与えられた文章情報についての音声認識処理を
行なうための音声認識部114と、学習制御装置101
に制御されて、外国語学習処理のために必要なデータを
記憶保持するためのデータ記憶部118とを備える。
から与えられた音声データを元に、音声スペクトル包絡
を抽出した上で、音声信号のセグメンテーションを行な
うための自動音声セグメント装置140.2と、単位言
語音の音韻識別のために、音声尤度を計算するための音
声尤度演算装置140.4と、音声尤度演算装置14
0.4の演算結果に基づいて、文章中の音韻や単語を分
解抽出するための文章・単語・音韻分解装置140.1
と、文章単語音韻分解装置140.1の分解結果に基づ
いて、構文解析等に基づいて、文音声の認識処理を行な
うための音声認識装置140.3とを含む。
して提示するための文章データを保持する文章データベ
ース118.6と、この文章データを構成する単語につ
いての単語データベース118.5と、単語データベー
ス118.5に含まれる音韻に関するデータを保持する
音韻データベース118.4とを含む。
学習履歴を保持するための学習者学習履歴データ保磁部
118.1と、文章データベース118.6中に保持さ
れるデータに対応したネイティブスピーカーの発音によ
る教師音声を保持するための教師音声ファイル118.
2と、当該教師音声ファイル中の音声に対して、音声認
識部114が算出する尤度データを保持するための教師
音声尤度データベース118.3とを含む。
0による外国語学習処理を説明するためのフローチャー
トである。
00の処理が開始されると(ステップS200)、学習
者に文章データベース118.6中に保持された文章デ
ータに基づいて、CRTディスプレイ120上にモデル
文章が提示される(ステップS202)。
応じて、発話を行なうと、この学習者の発話したモデル
文章に対応する音声情報が音声入力装置102を介して
取得される(ステップS204)。
2および文章、単語、音韻分解装置140.1の処理に
より、文章に対応する音声情報を音韻ごとに対応する音
声情報として認識する処理が行なわれる(ステップS2
06)。
て、音韻データベース118.4中に保持されたデータ
に基づいて、取得した音韻に対する音声情報とモデル音
韻との比較により単語ごとの音声情報の認識が行なわれ
る(ステップS208)。
法について、音声尤度演算装置140.4において演算
された尤度情報と、教師音声尤度データベース118.
3中に保持されたデータとに基づいて、MPU116が
単語ごとの評価点を算出し、その算出結果をCRTディ
スプレイ120を介して、学習者に対して提示する(ス
テップS210)。
は音韻ごとに発音練習を行なう(ステップS212)。
て、学習者に対して、他のモデル文章に対する練習を行
なうか否かが質問され、学習者がキーボード・マウス1
22を介して、他のモデル文章の練習を行なうことを選
択した場合は、処理はステップS202に復帰し、練習
の終了を選択した場合は、処理が終了する(ステップS
216)。
ごとの評価点の算出および表示を行なうステップS21
0と、単語ごと・音韻ごとに発音練習を行なうステップ
S212における処理をより詳しく説明するためのフロ
ーチャートである。
されると(ステップS302)、学習者は、キーボード
・マウス122を介して、訓練する単語を選択する(ス
テップS304)。
が録音され(ステップS306)、学習者に単語内の各
音韻のスコアが表示される(ステップS308)。
者が行ない(ステップS310)、音韻レベル訓練をク
リアしたか否かの判断が行なわれ(ステップS31
2)、音韻レベル訓練をクリアした場合は処理は次のス
テップS314に移行し、音韻レベル訓練をクリアした
と判断されない場合は、再び処理はステップS310に
復帰する。
単語レベルのトレーニングに処理が移行する(ステップ
S314)。
続いて、CRTディスプレイ120を介して、学習者に
対し別の単語の訓練を行なうか否かが質問され、キーボ
ード・マウス122から学習者により入力される情報に
基づいて、別の単語を訓練する場合は処理がステップS
304に復帰し、単語訓練を終了させる場合は、処理が
次のステップS318に移行する。
文章レベルのトレーニングが行なわれる(ステップS3
18)。
かの判断が行なわれ(ステップS320)、文章レベル
の訓練をクリアしていない場合は、処理は再びステップ
S302に復帰する。
断された場合は、処理が終了する(ステップS32
2)。
レーニング、単語レベルのトレーニングあるいは文章レ
ベルのトレーニングを行なう際の評価点の算出を行なう
にあたり、音声認識処理を行なうための隠れマルコフモ
デル(HMM:Hidden Markov Model)に対する学習処
理を予め行なうための処理を説明するためのフローチャ
ートである。
と(ステップS400)、トレーニングを行なう語彙に
対応して隠れマルコフモデル(HMM)が作成される
(ステップS402)。
瞭度の高い音声収集が行なわれる(ステップS40
4)。
ストラム係数またはLPC(LinearPredictive Coding)
ケプストラム等を使用して、音声の特徴を数値データ
(特徴ベクトル)として求める(ステップS406)。
ルに基づいて、隠れマルコフモデルのHMM係数のトレ
ーニングが行なわれる(ステップS408)。
音声の処理を行なったかの判断が行われ(ステップS4
10)、すべての音声に対する処理が行なわれていない
場合には、処理はステップS406に復帰し、すべての
音声に対するトレーニング処理が終わっている場合は、
処理が終了する(ステップS412)。
理が行なわれた隠れマルコフモデルに基づいて、各単語
における音韻ごとの評価点を算出するためのフロー(図
10のステップS308)の処理を説明するためのフロ
ーチャートである。
されると(ステップS500)、音声が入力され(ステ
ップS502)、サンプリングを行なう各フレームごと
に特徴ベクトルの算出が行なわれる(ステップS50
4)。
ビタビスコアリングを行なうことにより、最適な音韻の
変遷を導出するための当てはめ計算が行なわれる(ステ
ップS506)。
いて音韻変遷の経路の計算が行なわれたかの判断が行な
われ(ステップS108)、すべての組合せが終了して
いない場合は、処理はステップS506に復帰し、すべ
ての処理が終了している場合は、次のステップS510
に移行する。
ントされた有効なフレームあたりのスコアの平均値が求
められる(ステップS510)。
音韻ごとに、以下の演算により評価点が計算される。
の当該音韻に対するスコア)/(すべての可能な(確率
が0でない)音韻についての組合せのスコアの総和)×
100 以上のようにして評価点を算出して処理が終了する(ス
テップS514)。
学習者に対して適切な情報を提示することで、学習効果
を上げるための提示される情報の例について説明する。
示される情報の1つとして、[L]を発音する際に、声
道(声門から唇に至る音声の共鳴口)の形状を示す図で
ある。
音する際の共鳴口の形状を提示するためのコンピュータ
グラフィックス例である。
り、各音韻の特徴を持った音声が生成される。しかしな
がら、この声道の形状や動きは通常学習者は見ることが
できない。
者が自ら運動を制御することのできる口腔内の器官(舌
や口蓋など)の形状や相対的位置関係、動きなどを、3
次元コンピュータグラフィックスを用いて頚部を透明に
するなどの処置を施すことで、わかりやすく可視化する
ことができる。このような可視化処理により、学習者に
各音韻を発声する場合の各器官の動かし方を知識として
伝えることができる。
される情報の他の例の共振周波数パターンの時間的変動
(声紋)を示す図である。
の声紋表示を対比させて行なう。学習者は、発音を繰返
しながら、声紋のパターンを教師音声に近づけていく。
T)を用いて音声の共振周波数パターンの時間的変動を
可視化したものである。
[w]、[y]など)の声道の振動を伴った音韻では、
音声が周期性を持っており、スペクトルのピーク(フォ
ルマントと呼ぶ)に一定のパターンが見られる。各音韻
は、このフォルマントのパターンにより特徴づけられる
ことになる。そこで、これらの音の場合には、線形予測
法(LPC)により、スペクトルのピークを推定し、そ
のピークを声紋の上に重ねて表示(図中黒丸)すること
により、音韻の特徴を明示的に示すことができる。
示されるさらに他の情報としてフォルマントの位置を表
示する画面を示す図である。
リアルタイムで確認しながら、発音の矯正を行なう。母
音や一部の子音([r]、[l]、[w]、[y]な
ど)では、上記の方法でフォルマントを計算し、実施時
間で画面上に表示する。
る、低い方から3つのフォルマント(第1、第2、第3
フォルマント)位置の相対関係を、3つのフォルマント
を2つずつ組合せて2次元的に表示している。図18に
おいては、第2フォルマント(F2)を横軸に、第3フ
ォルマント(F3)を縦軸としている。L音は、F3=
2800Hz付近に分布しているのに対し、R音は、F
3=1600Hz付近に分布している。学習者の発音し
ている音のフォルマントが黒丸で示され、F2−F3平
面では、R音の領域にあることがわかる。
適切だったかどうかを実時間で確認しながら、音韻の発
音学習を進めることが可能となる。
示される3つの表示画面をそれぞれ別々のものとして説
明したが、上記の表示画面を適宜組合せることで、より
効率的に発音練習を行なうことが可能である。
デル表示や、図17の声紋表示、図18のフォルマント
表示は、音韻ごとに表示されるものとしたが、単語とし
て音韻が連続的に発音される場合に、画面上に一連のも
のとして表示されていく構成とすることも可能である。
しての構成を説明したが、本発明はこのような場合に限
定されることなく、以上説明したような外国語学習方法
を実行するためのソフトウェアを記録した記録媒体を用
いることで、音声入出力機能を備えたパーソナルコンピ
ュータ等によりこのソフトウェアを実行させることによ
り実現可能である。
法を実行するためのソフトウェアは、記録媒体としてパ
ーソナルコンピュータ等にインストールされる場合だけ
でなく、インターネット等の電気通信回線を通じて、音
声入出力機能を備えたパーソナルコンピュータ等にこの
ソフトウェアをインストールすることによっても実現可
能である。
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の範囲によって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。
国語学習装置または外国語学習方法によれば、学習者に
自分の発音した文章について、各単語毎に評価点が示さ
れるので、学習者の発音した外国語の文章に対する発音
の評価結果を学習者の外国語発音練習に対して効率的に
フィードバックすることが可能である。
説明するための概略ブロック図である。
情報の構成を説明するための概念図である。
現される外国語学習のフローを説明するためのフローチ
ャートである。
念図である。
対する音声情報から音韻音声情報を抽出する方法を示す
概念図である。
に対応する尤度および単語に対応する尤度を求める手続
きを示す概念図である。
の時間変化の経路と発音評価のための尤度を求める手順
とを説明するための図である。
を説明するための概略ブロック図である。
国語学習処理を説明するためのフローチャートである。
うステップと、単語ごと・音韻ごとに発音練習を行なう
ステップにおける処理をより詳しく説明するためのフロ
ーチャートである。
モデルに対する学習処理を予め行なうための処理を説明
するためのフローチャートである。
るためのフローの処理を説明するためのフローチャート
である。
1の図である。
2の図である。
1の図である。
2の図である。
の他の例の共振周波数パターンの時間的変動を示す図で
ある。
らに他の情報としてフォルマントの位置を表示する画面
を示す図である。
ロフォン、104 スピーカ、110 マイクロコンピ
ュータ、112 音声入出力部、114 音声認識部、
116 演算処理部、118 データ記憶部、120
表示装置。
Claims (21)
- 【請求項1】 外国語学習装置であって、 学習者の発音した文章に対応する文章音声情報を受け
て、前記文章に含まれる単語毎の単語音声情報に分離す
る単語分離手段と、 前記単語音声情報ごとにモデル音声との一致の程度を評
価する尤度判定手段と、 前記尤度判定手段の判定結果を前記単語毎に表示する表
示手段とを備える、外国語学習装置。 - 【請求項2】 前記外国語学習装置は、 前記学習者が発音するべきモデル文章と対応するモデル
音韻配列情報とを保持する記憶手段と、 予め前記学習者に前記モデル文章を提示するための出力
手段とをさらに備え、 前記単語分離手段は、 前記文章音声情報を音韻情報毎に認識する音韻認識手段
と、 分離された前記音韻情報と前記モデル音韻配列情報とに
基づいて、前記単語毎の単語音声情報を認識する単語音
声認識手段とを含む、請求項1記載の外国語学習装置。 - 【請求項3】 前記音韻認識手段は、前記外国語に含ま
れ得る音韻のそれぞれに対する、前記文章音声情報中の
各音韻情報の尤度を判定する音韻尤度決定手段を含み、 前記尤度判定手段は、 前記文章音声情報中の各音韻情報の尤度分布平面上にお
いて、前記モデル音韻配列情報どおりの音韻配列で発音
したとした場合の経路に沿って求めた各単語尤度と、学
習者の発音した音声波形から間違いやすい候補の経路に
沿って求めた各単語尤度の合計とを照合することで、前
記単語毎の一致の程度を評価する、請求項2記載の外国
語学習装置。 - 【請求項4】 外国語学習方法であって、 学習者の発音した文章に対応する文章音声情報を受け
て、前記文章に含まれる単語毎の単語音声情報に分離す
るステップと、 前記単語音声情報ごとにモデル音声との一致の程度を評
価するステップと、 前記単語音声情報ごとの評価結果を前記単語毎に表示す
るステップとを備える、外国語学習方法。 - 【請求項5】 予め前記学習者にモデル文章を提示する
ステップをさらに備え、 前記単語音声情報に分離するステップは、 前記文章音声情報を音韻情報毎に認識するステップと、 前記学習者に提示されたモデル文章に対応するモデル音
韻配列情報と分離された前記音韻情報とに基づいて、前
記単語毎の単語音声情報を認識するステップとを含む、
請求項4記載の外国語学習方法。 - 【請求項6】 前記音韻情報毎に認識するステップは、
前記外国語に含まれ得る音韻のそれぞれに対する、前記
文章音声情報中の各音韻情報の尤度を判定するステップ
を有し、 前記モデル音声との一致の程度を評価するステップは、
前記文章音声情報中の各音韻情報の尤度分布平面上にお
いて、前記モデル音韻配列情報どおりの音韻配列で発音
したとした場合の経路に沿って求めた各単語尤度と、学
習者の発音した音声波形から間違いやすい候補の経路に
沿って求めた各単語尤度の合計とを照合することで、前
記単語毎の一致の程度を評価する、請求項5記載の外国
語学習方法。 - 【請求項7】 前記学習者が発する前記モデル文章中の
前記音韻毎および前記単語ごとに発音練習結果を評価す
るステップをさらに備える、請求項5記載の外国語学習
方法。 - 【請求項8】 前記発音練習結果を評価するステップ
は、 前記学習者に対して、前記表示装置を介して、前記音韻
毎に声道形状モデルを表示するステップを含む、請求項
7記載の外国語学習方法。 - 【請求項9】 前記発音練習結果を評価するステップ
は、 前記学習者に対して、前記表示装置を介して、モデル声
紋と学習者の発音に対する声紋とを対比表示するステッ
プを含む、請求項7記載の外国語学習方法。 - 【請求項10】 前記発音練習結果を評価するステップ
は、 前記学習者に対して、前記表示装置を介して、学習者の
発音のフォルマント平面上の位置を表示するステップを
含む、請求項7記載の外国語学習方法。 - 【請求項11】 外国語学習装置であって、 学習者が発音するべきモデル文章と対応するモデル音韻
配列情報とを保持する記憶手段と、 予め前記学習者に前記モデル文章を提示するための出力
手段と、 前記学習者の発音した文章に対応する文章音声情報を受
けて、前記文章に含まれる単語毎の単語音声情報に分離
する単語分離手段と、 前記単語音声情報ごとにモデル音声との一致の程度を評
価する尤度判定手段と、 前記尤度判定手段の判定結果を音韻毎および前記単語毎
に表示する表示手段とを備え、 前記単語分離手段は、 前記文章音声情報を音韻情報毎に認識する音韻認識手段
と、 分離された前記音韻情報と前記モデル音韻配列情報とに
基づいて、前記単語毎の単語音声情報を認識する単語音
声認識手段とを含み、 発音練習期間中において、前記学習者が発する前記モデ
ル文章中の前記音韻毎および前記単語ごとに発音練習結
果を評価する発音評価手段をさらに備える、外国語学習
装置。 - 【請求項12】 前記発音評価手段は、 前記学習者に対して、前記表示装置を介して、前記音韻
毎に声道形状モデルを表示する、請求項11記載の外国
語学習装置。 - 【請求項13】 前記発音評価手段は、 前記学習者に対して、前記表示装置を介して、モデル声
紋と学習者の発音に対する声紋とを対比表示する、請求
項11記載の外国語学習装置。 - 【請求項14】 前記発音評価手段は、 前記学習者に対して、前記表示装置を介して、学習者の
発音のフォルマント平面上の位置を表示する、請求項1
1記載の外国語学習装置。 - 【請求項15】 学習者の発音した文章に対応する文章
音声情報を受けて、 前記文章に含まれる単語毎の単語音声情報に分離するス
テップと、 前記単語音声情報ごとにモデル音声との一致の程度を評
価するステップと、 前記単語音声情報ごとの評価結果を前記単語毎に表示す
るステップとを有する外国語学習方法をコンピュータに
実行させるためのプログラムを記録したコンピュータ読
取り可能な媒体。 - 【請求項16】 予め前記学習者にモデル文章を提示す
るステップをさらに備え、 前記単語音声情報に分離するステップは、 前記文章音声情報を音韻情報毎に認識するステップと、 前記学習者に提示されたモデル文章に対応するモデル音
韻配列情報と分離された前記音韻情報とに基づいて、前
記単語毎の単語音声情報を認識するステップとを含む、
外国語学習方法をコンピュータに実行させるためのプロ
グラムを記録したコンピュータ読取り可能な、請求項1
5記載の媒体。 - 【請求項17】 前記音韻情報毎に認識するステップ
は、前記外国語に含まれ得る音韻のそれぞれに対する、
前記文章音声情報中の各音韻情報の尤度を判定するステ
ップを有し、 前記モデル音声との一致の程度を評価するステップは、
前記文章音声情報中の各音韻情報の尤度分布平面上にお
いて、前記モデル音韻配列情報どおりの音韻配列で発音
したとした場合の経路に沿って求めた各単語尤度と、学
習者の発音した音声波形から間違いやすい候補の経路に
沿って求めた各単語尤度の合計とを照合することで、前
記単語毎の一致の程度を評価する、外国語学習方法をコ
ンピュータに実行させるためのプログラムを記録したコ
ンピュータ読取り可能な、請求項16記載の媒体。 - 【請求項18】 前記学習者が発する前記モデル文章中
の前記音韻毎および前記単語ごとに発音練習結果を評価
するステップをさらに備える、外国語学習方法をコンピ
ュータに実行させるためのプログラムを記録したコンピ
ュータ読取り可能な、請求項16記載の媒体。 - 【請求項19】 前記発音練習結果を評価するステップ
は、 前記学習者に対して、前記表示装置を介して、前記音韻
毎に声道形状モデルを表示するステップを含む、外国語
学習方法をコンピュータに実行させるためのプログラム
を記録したコンピュータ読取り可能な、請求項18記載
の媒体。 - 【請求項20】 前記発音練習結果を評価するステップ
は、 前記学習者に対して、前記表示装置を介して、モデル声
紋と学習者の発音に対する声紋とを対比表示するステッ
プを含む、外国語学習方法をコンピュータに実行させる
ためのプログラムを記録したコンピュータ読取り可能
な、請求項18記載の媒体。 - 【請求項21】 前記発音練習結果を評価するステップ
は、 前記学習者に対して、前記表示装置を介して、学習者の
発音のフォルマント平面上の位置を表示するステップを
含む、外国語学習方法をコンピュータに実行させるため
のプログラムを記録したコンピュータ読取り可能な、請
求項18記載の媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000078578A JP3520022B2 (ja) | 2000-01-14 | 2000-03-21 | 外国語学習装置、外国語学習方法および媒体 |
US09/936,365 US7401018B2 (en) | 2000-01-14 | 2000-12-11 | Foreign language learning apparatus, foreign language learning method, and medium |
PCT/JP2000/008762 WO2001052237A1 (fr) | 2000-01-14 | 2000-12-11 | Appareil, methode et support d'apprentissage de langues etrangeres |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000006696 | 2000-01-14 | ||
JP2000-6696 | 2000-01-14 | ||
JP2000078578A JP3520022B2 (ja) | 2000-01-14 | 2000-03-21 | 外国語学習装置、外国語学習方法および媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001265211A true JP2001265211A (ja) | 2001-09-28 |
JP3520022B2 JP3520022B2 (ja) | 2004-04-19 |
Family
ID=26583564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000078578A Expired - Fee Related JP3520022B2 (ja) | 2000-01-14 | 2000-03-21 | 外国語学習装置、外国語学習方法および媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7401018B2 (ja) |
JP (1) | JP3520022B2 (ja) |
WO (1) | WO2001052237A1 (ja) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004354976A (ja) * | 2003-05-29 | 2004-12-16 | Robert Bosch Gmbh | ユーザに発音を教える方法およびシステム、ユーザに言語を教える方法ならびにコンピュータ媒体 |
KR100548604B1 (ko) * | 2003-05-06 | 2006-01-31 | 엘지전자 주식회사 | 어학 학습 기능을 갖는 영상표시기기 및 그 학습방법 |
JP2006084966A (ja) * | 2004-09-17 | 2006-03-30 | Advanced Telecommunication Research Institute International | 発話音声の自動評定装置およびコンピュータプログラム |
JP2006184813A (ja) * | 2004-12-28 | 2006-07-13 | Advanced Telecommunication Research Institute International | 外国語学習装置 |
JP2006201491A (ja) * | 2005-01-20 | 2006-08-03 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2006208806A (ja) * | 2005-01-28 | 2006-08-10 | Advanced Telecommunication Research Institute International | 言語学習装置 |
JP2006208822A (ja) * | 2005-01-28 | 2006-08-10 | Advanced Telecommunication Research Institute International | 言語学習装置 |
JP2006227587A (ja) * | 2005-01-20 | 2006-08-31 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2006227030A (ja) * | 2005-01-20 | 2006-08-31 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2006337667A (ja) * | 2005-06-01 | 2006-12-14 | Ntt Communications Kk | 発音評価方法、音素列モデル学習方法、これらの方法を用いた装置、プログラム、および記録媒体。 |
JP2007017733A (ja) * | 2005-07-08 | 2007-01-25 | Sharp Corp | 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 |
JP2007057692A (ja) * | 2005-08-23 | 2007-03-08 | Advanced Telecommunication Research Institute International | 音声処理装置、およびプログラム |
JP2007133008A (ja) * | 2005-11-08 | 2007-05-31 | Advanced Telecommunication Research Institute International | 音声認識装置、およびプログラム |
JP2007309979A (ja) * | 2006-05-16 | 2007-11-29 | Advanced Telecommunication Research Institute International | 音声処理装置、およびプログラム |
JP2008040035A (ja) * | 2006-08-04 | 2008-02-21 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2008191551A (ja) * | 2007-02-07 | 2008-08-21 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
CN103890825A (zh) * | 2011-09-01 | 2014-06-25 | 斯碧奇弗斯股份有限公司 | 语言学习用系统和方法 |
JP2015011348A (ja) * | 2013-06-26 | 2015-01-19 | 韓國電子通信研究院Electronics and Telecommunications Research Institute | 音声認識を用いた外国語スピーキング能力の訓練及び評価方法並びにその装置 |
JP2016045420A (ja) * | 2014-08-25 | 2016-04-04 | カシオ計算機株式会社 | 発音学習支援装置およびプログラム |
JP2019168478A (ja) * | 2018-03-22 | 2019-10-03 | カシオ計算機株式会社 | 発音学習支援システム、発音学習支援装置、発音学習支援方法及び発音学習支援プログラム |
JPWO2021152786A1 (ja) * | 2020-01-30 | 2021-08-05 | ||
KR20230108027A (ko) * | 2022-01-10 | 2023-07-18 | (주)프로젝트레인보우 | 발음 교정 시스템 및 이의 수행 방법 |
JP7504523B1 (ja) | 2024-01-16 | 2024-06-24 | モノグサ株式会社 | 文章の発話演習を支援するためのプログラム、システム、及び方法 |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100355072B1 (ko) * | 2000-07-06 | 2002-10-05 | 한상종 | 멀티미디어 분할페이지 및 이를 이용한 언어학습방법과언어학습시스템 |
US7752045B2 (en) * | 2002-10-07 | 2010-07-06 | Carnegie Mellon University | Systems and methods for comparing speech elements |
JP3814575B2 (ja) * | 2002-11-27 | 2006-08-30 | 研一郎 中野 | 語学学習コンピュータシステム |
AU2003283892A1 (en) * | 2002-11-27 | 2004-06-18 | Visual Pronunciation Software Limited | A method, system and software for teaching pronunciation |
WO2004061796A1 (en) * | 2002-12-31 | 2004-07-22 | Burlingtonspeech Limited | Comprehensive spoken language learning system |
DE10304229A1 (de) * | 2003-01-28 | 2004-08-05 | Deutsche Telekom Ag | Kommunikationssystem, Kommunikationsendeinrichtung und Vorrichtung zum Erkennen fehlerbehafteter Text-Nachrichten |
JP2004246184A (ja) * | 2003-02-14 | 2004-09-02 | Eigyotatsu Kofun Yugenkoshi | 視覚化された発音の提案を備えた言語学習システム及び方法 |
US20040166481A1 (en) * | 2003-02-26 | 2004-08-26 | Sayling Wen | Linear listening and followed-reading language learning system & method |
DE10360044B3 (de) * | 2003-12-18 | 2005-05-25 | T-Mobile Deutschland Gmbh | Verfahren zur Ermittlung der sprachlichen Fähigkeiten von Probanden |
US20050181336A1 (en) * | 2004-02-17 | 2005-08-18 | Bakalian Kalust C. | System and method for learning letters and numbers of a foreign language |
US20050197837A1 (en) * | 2004-03-08 | 2005-09-08 | Janne Suontausta | Enhanced multilingual speech recognition system |
US20080027731A1 (en) * | 2004-04-12 | 2008-01-31 | Burlington English Ltd. | Comprehensive Spoken Language Learning System |
US7640159B2 (en) * | 2004-07-22 | 2009-12-29 | Nuance Communications, Inc. | System and method of speech recognition for non-native speakers of a language |
US20060053012A1 (en) * | 2004-09-03 | 2006-03-09 | Eayrs David J | Speech mapping system and method |
US8478597B2 (en) * | 2005-01-11 | 2013-07-02 | Educational Testing Service | Method and system for assessing pronunciation difficulties of non-native speakers |
WO2006125347A1 (en) * | 2005-05-27 | 2006-11-30 | Intel Corporation | A homework assignment and assessment system for spoken language education and testing |
US20070048697A1 (en) * | 2005-05-27 | 2007-03-01 | Du Ping Robert | Interactive language learning techniques |
JP5120826B2 (ja) * | 2005-09-29 | 2013-01-16 | 独立行政法人産業技術総合研究所 | 発音診断装置、発音診断方法、記録媒体、及び、発音診断プログラム |
US20070168187A1 (en) * | 2006-01-13 | 2007-07-19 | Samuel Fletcher | Real time voice analysis and method for providing speech therapy |
TWI336880B (en) * | 2007-06-11 | 2011-02-01 | Univ Nat Taiwan | Voice processing methods and systems, and machine readable medium thereof |
US20090007256A1 (en) * | 2007-06-28 | 2009-01-01 | Microsoft Corporation | Using a trusted entity to drive security decisions |
US8103503B2 (en) * | 2007-11-01 | 2012-01-24 | Microsoft Corporation | Speech recognition for determining if a user has correctly read a target sentence string |
JP2009128675A (ja) * | 2007-11-26 | 2009-06-11 | Toshiba Corp | 音声を認識する装置、方法およびプログラム |
US8271281B2 (en) * | 2007-12-28 | 2012-09-18 | Nuance Communications, Inc. | Method for assessing pronunciation abilities |
EP3610918B1 (en) * | 2009-07-17 | 2023-09-27 | Implantica Patent Ltd. | Voice control of a medical implant |
WO2011037587A1 (en) * | 2009-09-28 | 2011-03-31 | Nuance Communications, Inc. | Downsampling schemes in a hierarchical neural network structure for phoneme recognition |
US8744856B1 (en) * | 2011-02-22 | 2014-06-03 | Carnegie Speech Company | Computer implemented system and method and computer program product for evaluating pronunciation of phonemes in a language |
US9704413B2 (en) | 2011-03-25 | 2017-07-11 | Educational Testing Service | Non-scorable response filters for speech scoring systems |
WO2012134997A2 (en) * | 2011-03-25 | 2012-10-04 | Educational Testing Service | Non-scorable response filters for speech scoring systems |
US9058751B2 (en) * | 2011-11-21 | 2015-06-16 | Age Of Learning, Inc. | Language phoneme practice engine |
US8784108B2 (en) | 2011-11-21 | 2014-07-22 | Age Of Learning, Inc. | Computer-based language immersion teaching for young learners |
US8740620B2 (en) | 2011-11-21 | 2014-06-03 | Age Of Learning, Inc. | Language teaching system that facilitates mentor involvement |
US9679496B2 (en) | 2011-12-01 | 2017-06-13 | Arkady Zilberman | Reverse language resonance systems and methods for foreign language acquisition |
KR101697650B1 (ko) * | 2012-12-10 | 2017-01-18 | 한국전자통신연구원 | 발음 평가 장치 |
US20140272820A1 (en) * | 2013-03-15 | 2014-09-18 | Media Mouth Inc. | Language learning environment |
US8825492B1 (en) * | 2013-10-28 | 2014-09-02 | Yousef A. E. S. M. Buhadi | Language-based video game |
US9984585B2 (en) * | 2013-12-24 | 2018-05-29 | Varun Aggarwal | Method and system for constructed response grading |
US9613638B2 (en) * | 2014-02-28 | 2017-04-04 | Educational Testing Service | Computer-implemented systems and methods for determining an intelligibility score for speech |
EP2924676A1 (en) * | 2014-03-25 | 2015-09-30 | Oticon A/s | Hearing-based adaptive training systems |
EP3239975A4 (en) * | 2014-12-26 | 2018-08-08 | Sony Corporation | Information processing device, information processing method, and program |
CN113901197A (zh) | 2017-10-05 | 2022-01-07 | 弗伦特永久公司 | 使用客户端计算设备来教授外语的方法 |
US11393476B2 (en) | 2018-08-23 | 2022-07-19 | Google Llc | Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface |
US10930274B2 (en) * | 2018-11-30 | 2021-02-23 | International Business Machines Corporation | Personalized pronunciation hints based on user speech |
CN111640452B (zh) * | 2019-03-01 | 2024-05-07 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
US11410642B2 (en) * | 2019-08-16 | 2022-08-09 | Soundhound, Inc. | Method and system using phoneme embedding |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60163078A (ja) * | 1984-02-03 | 1985-08-24 | 工業技術院長 | 発話訓練装置 |
JP2757356B2 (ja) | 1986-12-12 | 1998-05-25 | 株式会社日立製作所 | 単語音声認識方法および装置 |
JPS6433831A (en) | 1987-07-28 | 1989-02-03 | Mitsubishi Electric Corp | Picture tube |
JP2790808B2 (ja) | 1987-12-15 | 1998-08-27 | 株式会社リコー | 音声認識装置 |
JP2651172B2 (ja) | 1987-12-28 | 1997-09-10 | 東陶機器株式会社 | アクチュエータ |
JP2834471B2 (ja) * | 1989-04-17 | 1998-12-09 | 日本電信電話株式会社 | 発音評価法 |
JPH03226785A (ja) * | 1990-01-31 | 1991-10-07 | Oki Techno Syst Lab:Kk | 音声認識装置付き語学用教育装置 |
JPH05165494A (ja) * | 1991-12-13 | 1993-07-02 | Osaka Gas Co Ltd | 音声認識装置 |
JP3099845B2 (ja) | 1992-05-07 | 2000-10-16 | 日本電信電話株式会社 | パターン認識後処理方式 |
JPH06110494A (ja) | 1992-09-08 | 1994-04-22 | Osaka Gas Co Ltd | 発音学習装置 |
US5487671A (en) * | 1993-01-21 | 1996-01-30 | Dsp Solutions (International) | Computerized system for teaching speech |
EP0692135B1 (en) * | 1993-03-12 | 2000-08-16 | Sri International | Method and apparatus for voice-interactive language instruction |
US6006175A (en) * | 1996-02-06 | 1999-12-21 | The Regents Of The University Of California | Methods and apparatus for non-acoustic speech characterization and recognition |
JP2983897B2 (ja) | 1996-03-19 | 1999-11-29 | 三洋電機株式会社 | 認識結果の評価方法および認識装置 |
US6029131A (en) * | 1996-06-28 | 2000-02-22 | Digital Equipment Corporation | Post processing timing of rhythm in synthetic speech |
US5766015A (en) | 1996-07-11 | 1998-06-16 | Digispeech (Israel) Ltd. | Apparatus for interactive language training |
WO1998014934A1 (en) * | 1996-10-02 | 1998-04-09 | Sri International | Method and system for automatic text-independent grading of pronunciation for language instruction |
US6064957A (en) * | 1997-08-15 | 2000-05-16 | General Electric Company | Improving speech recognition through text-based linguistic post-processing |
JPH11143346A (ja) | 1997-11-05 | 1999-05-28 | Seiko Epson Corp | 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体 |
JP4267101B2 (ja) * | 1997-11-17 | 2009-05-27 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声識別装置、発音矯正装置およびこれらの方法 |
US6085160A (en) * | 1998-07-10 | 2000-07-04 | Lernout & Hauspie Speech Products N.V. | Language independent speech recognition |
US6224383B1 (en) * | 1999-03-25 | 2001-05-01 | Planetlingo, Inc. | Method and system for computer assisted natural language instruction with distracters |
JP3669869B2 (ja) * | 1999-06-28 | 2005-07-13 | 株式会社サン・フレア | 最適テンプレートパターンを用いた評価方法、評価装置および記録媒体 |
US6505152B1 (en) * | 1999-09-03 | 2003-01-07 | Microsoft Corporation | Method and apparatus for using formant models in speech systems |
US7149690B2 (en) | 1999-09-09 | 2006-12-12 | Lucent Technologies Inc. | Method and apparatus for interactive language instruction |
EP1139318A4 (en) * | 1999-09-27 | 2002-11-20 | Kojima Co Ltd | PRONUNCIATION EVALUATION SYSTEM |
JP3717730B2 (ja) * | 1999-11-02 | 2005-11-16 | セイコーインスツル株式会社 | 電子辞書 |
US6438524B1 (en) * | 1999-11-23 | 2002-08-20 | Qualcomm, Incorporated | Method and apparatus for a voice controlled foreign language translation device |
-
2000
- 2000-03-21 JP JP2000078578A patent/JP3520022B2/ja not_active Expired - Fee Related
- 2000-12-11 US US09/936,365 patent/US7401018B2/en not_active Expired - Lifetime
- 2000-12-11 WO PCT/JP2000/008762 patent/WO2001052237A1/ja active Application Filing
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100548604B1 (ko) * | 2003-05-06 | 2006-01-31 | 엘지전자 주식회사 | 어학 학습 기능을 갖는 영상표시기기 및 그 학습방법 |
JP2004354976A (ja) * | 2003-05-29 | 2004-12-16 | Robert Bosch Gmbh | ユーザに発音を教える方法およびシステム、ユーザに言語を教える方法ならびにコンピュータ媒体 |
US8371857B2 (en) | 2003-05-29 | 2013-02-12 | Robert Bosch Gmbh | System, method and device for language education through a voice portal |
US8202093B2 (en) | 2003-05-29 | 2012-06-19 | Robert Bosch Gmbh | System, method and device for language education through a voice portal |
JP2006084966A (ja) * | 2004-09-17 | 2006-03-30 | Advanced Telecommunication Research Institute International | 発話音声の自動評定装置およびコンピュータプログラム |
JP2006184813A (ja) * | 2004-12-28 | 2006-07-13 | Advanced Telecommunication Research Institute International | 外国語学習装置 |
JP2006201491A (ja) * | 2005-01-20 | 2006-08-03 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2006227587A (ja) * | 2005-01-20 | 2006-08-31 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2006227030A (ja) * | 2005-01-20 | 2006-08-31 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP4669988B2 (ja) * | 2005-01-28 | 2011-04-13 | 株式会社国際電気通信基礎技術研究所 | 言語学習装置 |
JP2006208806A (ja) * | 2005-01-28 | 2006-08-10 | Advanced Telecommunication Research Institute International | 言語学習装置 |
JP4669989B2 (ja) * | 2005-01-28 | 2011-04-13 | 株式会社国際電気通信基礎技術研究所 | 言語学習装置 |
JP2006208822A (ja) * | 2005-01-28 | 2006-08-10 | Advanced Telecommunication Research Institute International | 言語学習装置 |
JP2006337667A (ja) * | 2005-06-01 | 2006-12-14 | Ntt Communications Kk | 発音評価方法、音素列モデル学習方法、これらの方法を用いた装置、プログラム、および記録媒体。 |
JP2007017733A (ja) * | 2005-07-08 | 2007-01-25 | Sharp Corp | 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 |
JP2007057692A (ja) * | 2005-08-23 | 2007-03-08 | Advanced Telecommunication Research Institute International | 音声処理装置、およびプログラム |
JP2007133008A (ja) * | 2005-11-08 | 2007-05-31 | Advanced Telecommunication Research Institute International | 音声認識装置、およびプログラム |
JP2007309979A (ja) * | 2006-05-16 | 2007-11-29 | Advanced Telecommunication Research Institute International | 音声処理装置、およびプログラム |
JP2008040035A (ja) * | 2006-08-04 | 2008-02-21 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP4716125B2 (ja) * | 2006-08-04 | 2011-07-06 | 株式会社国際電気通信基礎技術研究所 | 発音評定装置、およびプログラム |
JP2008191551A (ja) * | 2007-02-07 | 2008-08-21 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
CN103890825A (zh) * | 2011-09-01 | 2014-06-25 | 斯碧奇弗斯股份有限公司 | 语言学习用系统和方法 |
JP2015011348A (ja) * | 2013-06-26 | 2015-01-19 | 韓國電子通信研究院Electronics and Telecommunications Research Institute | 音声認識を用いた外国語スピーキング能力の訓練及び評価方法並びにその装置 |
JP2016045420A (ja) * | 2014-08-25 | 2016-04-04 | カシオ計算機株式会社 | 発音学習支援装置およびプログラム |
JP2019168478A (ja) * | 2018-03-22 | 2019-10-03 | カシオ計算機株式会社 | 発音学習支援システム、発音学習支援装置、発音学習支援方法及び発音学習支援プログラム |
JP7135358B2 (ja) | 2018-03-22 | 2022-09-13 | カシオ計算機株式会社 | 発音学習支援システム、発音学習支援装置、発音学習支援方法及び発音学習支援プログラム |
JPWO2021152786A1 (ja) * | 2020-01-30 | 2021-08-05 | ||
WO2021152786A1 (ja) * | 2020-01-30 | 2021-08-05 | 日本電信電話株式会社 | 訓練装置、その方法、およびプログラム |
JP7294460B2 (ja) | 2020-01-30 | 2023-06-20 | 日本電信電話株式会社 | 訓練装置、その方法、およびプログラム |
KR20230108027A (ko) * | 2022-01-10 | 2023-07-18 | (주)프로젝트레인보우 | 발음 교정 시스템 및 이의 수행 방법 |
KR102591045B1 (ko) | 2022-01-10 | 2023-10-19 | (주)프로젝트레인보우 | 발음 교정 시스템 및 이의 수행 방법 |
JP7504523B1 (ja) | 2024-01-16 | 2024-06-24 | モノグサ株式会社 | 文章の発話演習を支援するためのプログラム、システム、及び方法 |
Also Published As
Publication number | Publication date |
---|---|
US20020160341A1 (en) | 2002-10-31 |
JP3520022B2 (ja) | 2004-04-19 |
US7401018B2 (en) | 2008-07-15 |
WO2001052237A1 (fr) | 2001-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3520022B2 (ja) | 外国語学習装置、外国語学習方法および媒体 | |
US8886534B2 (en) | Speech recognition apparatus, speech recognition method, and speech recognition robot | |
US7711560B2 (en) | Speech recognition device and speech recognition method | |
Gruhn et al. | Statistical pronunciation modeling for non-native speech processing | |
US20070239455A1 (en) | Method and system for managing pronunciation dictionaries in a speech application | |
US20090305203A1 (en) | Pronunciation diagnosis device, pronunciation diagnosis method, recording medium, and pronunciation diagnosis program | |
US20070136062A1 (en) | Method and apparatus for labelling speech | |
CN108431883B (zh) | 语言学习系统以及语言学习程序 | |
JPH10222190A (ja) | 発音測定装置および方法 | |
KR20160122542A (ko) | 발음 유사도 측정 방법 및 장치 | |
US11676572B2 (en) | Instantaneous learning in text-to-speech during dialog | |
JPH075807A (ja) | 合成を基本とした会話訓練装置 | |
US20070067174A1 (en) | Visual comparison of speech utterance waveforms in which syllables are indicated | |
Imoto et al. | Modeling and automatic detection of English sentence stress for computer-assisted English prosody learning system | |
JP5105943B2 (ja) | 発話評価装置及び発話評価プログラム | |
CN113112575B (zh) | 一种口型生成方法、装置、计算机设备及存储介质 | |
KR100362292B1 (ko) | 음성인식 기술을 이용한 영어 발음 학습 방법 및 시스템 | |
CN109697975A (zh) | 一种语音评价方法及装置 | |
Kabashima et al. | Dnn-based scoring of language learners’ proficiency using learners’ shadowings and native listeners’ responsive shadowings | |
Al-Bakeri et al. | ASR for Tajweed rules: integrated with self-learning environments | |
KR20210131698A (ko) | 발음 기관 영상을 이용한 외국어 발음 교육 방법 및 장치 | |
JP2006084966A (ja) | 発話音声の自動評定装置およびコンピュータプログラム | |
JP3378547B2 (ja) | 音声認識方法及び装置 | |
JP3621624B2 (ja) | 外国語学習装置、外国語学習方法および媒体 | |
KR102610871B1 (ko) | 청각장애인 음성언어훈련 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3520022 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090206 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090206 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100206 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110206 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110206 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140206 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |