JPS6032195B2 - 語学練習機 - Google Patents
語学練習機Info
- Publication number
- JPS6032195B2 JPS6032195B2 JP55048349A JP4834980A JPS6032195B2 JP S6032195 B2 JPS6032195 B2 JP S6032195B2 JP 55048349 A JP55048349 A JP 55048349A JP 4834980 A JP4834980 A JP 4834980A JP S6032195 B2 JPS6032195 B2 JP S6032195B2
- Authority
- JP
- Japan
- Prior art keywords
- pronunciation
- standard
- pattern
- section
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Landscapes
- Electrically Operated Instructional Devices (AREA)
Description
【発明の詳細な説明】
本発明は音声合成認識技術を応用し、英語等の発声練習
を効果的に行なおうとする語学練習機に関するものであ
る。
を効果的に行なおうとする語学練習機に関するものであ
る。
本発明の目的とするところは、音声合成技術を用いて学
習者に正しい標準発音の単語又は単文を提示し、これを
学習する練習者の発音を音声認識技術を用いて、分析、
認識し、標準発音との差異点を抽出して、学習者に合成
音を用いて分り易い形で矯正点をフィードバックし、こ
の学習ループを繰返すことによって練習者が最終的に正
しい標準発音で単語又は単文を発声できるようにするこ
とにある。
習者に正しい標準発音の単語又は単文を提示し、これを
学習する練習者の発音を音声認識技術を用いて、分析、
認識し、標準発音との差異点を抽出して、学習者に合成
音を用いて分り易い形で矯正点をフィードバックし、こ
の学習ループを繰返すことによって練習者が最終的に正
しい標準発音で単語又は単文を発声できるようにするこ
とにある。
上記目的を達成するための回路構成として、ある任意の
単語(又は単文、以下同じ)の発音を何らかの手段によ
り、分析し、発音音声を表現するパラメータ系例に符号
化ェンコードし、このパラメータ系列を記憶保持する標
準パターン記憶部と、この標準パターン記憶部から論出
した符号化パラメータ系列を用いて該単語の標準発音を
音声合成部で行うに必要なパラメータに復元する標準発
音デコード部と、練習者の発声音声を分析して、標準パ
ターン記憶部に保持されている符号化パラメー外こ分解
するパターン分析部と、このパターン分析部の出力を標
準パターン記憶部のパラメータ系列と比較し、両者の差
を検出するパターン比較部と、パターン比較部の出力を
練習者の発音を矯正するために練習者にフィードバック
する矯正発音を音声合成部で行うに必要なパラメータに
復元する矯正発音デコード部等を主要回路要素として構
成し、前記目的を達成しようとするものである。
単語(又は単文、以下同じ)の発音を何らかの手段によ
り、分析し、発音音声を表現するパラメータ系例に符号
化ェンコードし、このパラメータ系列を記憶保持する標
準パターン記憶部と、この標準パターン記憶部から論出
した符号化パラメータ系列を用いて該単語の標準発音を
音声合成部で行うに必要なパラメータに復元する標準発
音デコード部と、練習者の発声音声を分析して、標準パ
ターン記憶部に保持されている符号化パラメー外こ分解
するパターン分析部と、このパターン分析部の出力を標
準パターン記憶部のパラメータ系列と比較し、両者の差
を検出するパターン比較部と、パターン比較部の出力を
練習者の発音を矯正するために練習者にフィードバック
する矯正発音を音声合成部で行うに必要なパラメータに
復元する矯正発音デコード部等を主要回路要素として構
成し、前記目的を達成しようとするものである。
・従釆、発音練習機に類するものとしては
handicapedを対象にしたものがいくつか開発
され、実用にも供されている(日本音響学会誌vol.
31、No.3(1975)音声特集号「音声情報伝達
における障害とその対策」)が正常耳を対象にしたもの
ではないので、その考え方等大筋では一部似通よってい
るが、障害の内容と程度に対応したシステム構成が主眼
であり、正常者にそのまま用いられるものではない。
され、実用にも供されている(日本音響学会誌vol.
31、No.3(1975)音声特集号「音声情報伝達
における障害とその対策」)が正常耳を対象にしたもの
ではないので、その考え方等大筋では一部似通よってい
るが、障害の内容と程度に対応したシステム構成が主眼
であり、正常者にそのまま用いられるものではない。
又近年、教育玩具としてSpeak & Spellが
実用化されているが、これは音声合成による標準発音機
能のみであって、練習者の発音を分析し、標準発音との
差を練習者にフィードバックすることにより練習者に、
綾準発音を習得せしむる機能は持っていない。本発明は
これ等の問題を改善したもので普通の語学学習者を対象
に、正しい発音を提示し間違っている点を指摘すること
によって、効果的な学習が行なえるよう構成したもので
ある。
実用化されているが、これは音声合成による標準発音機
能のみであって、練習者の発音を分析し、標準発音との
差を練習者にフィードバックすることにより練習者に、
綾準発音を習得せしむる機能は持っていない。本発明は
これ等の問題を改善したもので普通の語学学習者を対象
に、正しい発音を提示し間違っている点を指摘すること
によって、効果的な学習が行なえるよう構成したもので
ある。
一般に正しい標準発音とは何であろうか、又それを音声
波と云う物理現象から見た場合、音声波の如何なるパラ
メータが如何なる値を取れば良いのかと云った問題は未
解決であるが、語学教室、会話教室等現場における教師
と生徒との対話を観察すれば、正しい発音のためには次
の三つの基本条件が必要である事が分る。
波と云う物理現象から見た場合、音声波の如何なるパラ
メータが如何なる値を取れば良いのかと云った問題は未
解決であるが、語学教室、会話教室等現場における教師
と生徒との対話を観察すれば、正しい発音のためには次
の三つの基本条件が必要である事が分る。
■ 個々の音韻、音素が正しく、且つ単語としての音素
系列が正しいこと。
系列が正しいこと。
(不必要な音素が挿入されたり、必要な音素が脱落した
りしていないこと)■ アクセントが正しいこと、 ■ イントネーションが正しいこと「 次には、これ等の条件が音声波のパラメータから如何に
説明され得るかと云う問題であるが、この点に関しては
、音声学の知識から次の事が分っている。
りしていないこと)■ アクセントが正しいこと、 ■ イントネーションが正しいこと「 次には、これ等の条件が音声波のパラメータから如何に
説明され得るかと云う問題であるが、この点に関しては
、音声学の知識から次の事が分っている。
1 前記条件■の音韻性に関しては声道の伝達関数によ
って規定されるものであり、その定式化についてもフオ
ルマント、極一零、LPC、PARCOR等のいくつか
のモデルが提案され、実証されている。
って規定されるものであり、その定式化についてもフオ
ルマント、極一零、LPC、PARCOR等のいくつか
のモデルが提案され、実証されている。
又単語(又は文章)としての音韻変化としては調音結合
による個々の音韻の変化が重要である事が分っている。
2 前記条件■、■のアクセント、イントネーションに
関しては言語による差異があるが、基本的には声帯音源
の基本周波数であるピッチと、音声波の強度に関係して
いることが分っている。
による個々の音韻の変化が重要である事が分っている。
2 前記条件■、■のアクセント、イントネーションに
関しては言語による差異があるが、基本的には声帯音源
の基本周波数であるピッチと、音声波の強度に関係して
いることが分っている。
これ等の事より、正しい発音を音声波の面からみると、
1 個々の音素、2 ピッチ周波数、3強度振中、4
それ等の時間系列、等がある標準パターンに比較して相
対値的に一致することであると云える。
1 個々の音素、2 ピッチ周波数、3強度振中、4
それ等の時間系列、等がある標準パターンに比較して相
対値的に一致することであると云える。
ここで相対値的と云うのは、音声波のパラメータは元来
生理的、物理的な発声器官の差によって個人差が比較的
大きなものであり、絶対値は余り意味を持たず、時間系
列の相対的な変化パターンが重要であると云う意味であ
る。従って、標準発音との差を練習者に分り易くフィー
ドバックしつつ学習を行う語学練習機の原理としては次
のような方式が考えられる。即ち、パラメータ化した標
準発音パターンを記録保持しておき、これと練習者の発
音音声から何らかの手段により分析した発音パターンと
を比較し、差異点があれば、練習者に合成音声を用いて
、修正方法を指示する。このような学習ループをくり返
すことにより、練習者の発音を標準発音パターンに一致
させると云う方式である。本発明は以上述べた構成原理
による語学練習機であり、以下にその詳細な構成を、図
面を参照しつつ説明する。
生理的、物理的な発声器官の差によって個人差が比較的
大きなものであり、絶対値は余り意味を持たず、時間系
列の相対的な変化パターンが重要であると云う意味であ
る。従って、標準発音との差を練習者に分り易くフィー
ドバックしつつ学習を行う語学練習機の原理としては次
のような方式が考えられる。即ち、パラメータ化した標
準発音パターンを記録保持しておき、これと練習者の発
音音声から何らかの手段により分析した発音パターンと
を比較し、差異点があれば、練習者に合成音声を用いて
、修正方法を指示する。このような学習ループをくり返
すことにより、練習者の発音を標準発音パターンに一致
させると云う方式である。本発明は以上述べた構成原理
による語学練習機であり、以下にその詳細な構成を、図
面を参照しつつ説明する。
図は本発明による語学練習機の構成図である。図におい
て1は英語等の語学の発音を練習しようとする学習者で
ある。学習者1は音声合成部8にて合成され学習者1に
提示される正して標準的な発音の単語を聞いて、それを
そっくりまねするよう発音する。この学習者によって発
音された単語発音信号2はパターン分析部3へ導かれ、
正しい単語発音に最低必要とされる音素パターン、ピッ
チパターン、強度パターンの3つのパラメータについて
分析される。この分析の方法は如何なる方法であっても
よいが、1例として音声認識技術で用いられている各種
の方法が適用可能であり、ピッチパターン抽出には相関
法、ケプストラム法等、強度パターン抽出にはパワスベ
クトル値、音素パターンの抽出にはフィルターバンクに
よるパターンマッチング方法、LPC、PARCOR等
によるパラメータ推定による方法等が挙げられる。これ
等の方法にはデジタル信号処理技術は不可欠であり、従
ってパターン分析部3の入力音声は8〜1皿Hz程度の
周波数でサンプルされA/○変換され、10〜20のS
毎の時間窓をかけられて、フレーム毎に処理される。従
って、分析抽出された各パターンのパラメータ値は適当
に選ばれたフレーム間隔毎の時系列値となる。次に分析
抽出された各パターンは標準パターン記憶部5に記憶保
持されている標準発音の分析パラメータ時系列値とパタ
ーン比較部4で比較され、両者の差が検出される。標準
パターン記憶部には学習者のニ−ズ又は選択されたコ−
スによって異なるが、多数の単語をあらかじめ、外部又
は本練習機組込みパターン分析部で分析し、本記憶部5
に記憶しておく必要がある。外部で分析する場合にはR
OM等にして用い、又内部で分析する場合には標準発音
者9の発音した単語音声をパターン分析部3で分析し標
準パターン記憶部5に書込む必要がある。パターン比較
部4は前述したように絶対値を比較するのではなく、時
系列値を相対値的に比較するものであり、この際単語発
音の時間長の変化を許すとすると、標準パターンと抽出
されたパターンとは全体の時間長が一致しないので何ら
かの時間軸マッチングが必要である。時間軸のマッチン
グ法にもDP等の手法が使用可能であるが、単語等を標
準発音に従がつてまねると云うプロセスを考えると余り
複雑な処理は必要ではなく単純な比例マッチングで両者
の時間軸は一致させる事が出釆る。パターン比較部4で
は以上述べたように学習者の発音が標準者の発音に比較
してどこがどの様に異なっているかが検出される。この
相異点と標準パターンとから矯正発音デコード部7では
学習者に謀まった点を指摘し、正しい発音を指示して、
標準発音と合せてフィードバックするために音声合成部
8に渡すべきデータを準備する。標準発音デコード部6
は単語を指定されると標準パターン記憶部5よりその単
語の標準パターンを選択して、音素、ピッチ、強度を判
読して、次の音声合成部が合成音として発音出来るよう
なデータに変換して渡す。音声合成部8は渡されたデー
タを用いて合成音声として、学習者へフィードバックす
る。音声合成部8としては、分析パターンのパラメータ
の性質に対応して、音素パターン等が、LPC、PAR
COR等のパラメータであれば、パラメータ合成法が適
当であり、音素パターン等が音韻系列であれば、規則合
成法等が適当であるが、いずれの方法も使用可能である
。以上の練習機の動作を学習者との対話形式で示すと次
のようなステップとなる。1 キーボード等で学習者が
、単語又は学習コースを指定する。
て1は英語等の語学の発音を練習しようとする学習者で
ある。学習者1は音声合成部8にて合成され学習者1に
提示される正して標準的な発音の単語を聞いて、それを
そっくりまねするよう発音する。この学習者によって発
音された単語発音信号2はパターン分析部3へ導かれ、
正しい単語発音に最低必要とされる音素パターン、ピッ
チパターン、強度パターンの3つのパラメータについて
分析される。この分析の方法は如何なる方法であっても
よいが、1例として音声認識技術で用いられている各種
の方法が適用可能であり、ピッチパターン抽出には相関
法、ケプストラム法等、強度パターン抽出にはパワスベ
クトル値、音素パターンの抽出にはフィルターバンクに
よるパターンマッチング方法、LPC、PARCOR等
によるパラメータ推定による方法等が挙げられる。これ
等の方法にはデジタル信号処理技術は不可欠であり、従
ってパターン分析部3の入力音声は8〜1皿Hz程度の
周波数でサンプルされA/○変換され、10〜20のS
毎の時間窓をかけられて、フレーム毎に処理される。従
って、分析抽出された各パターンのパラメータ値は適当
に選ばれたフレーム間隔毎の時系列値となる。次に分析
抽出された各パターンは標準パターン記憶部5に記憶保
持されている標準発音の分析パラメータ時系列値とパタ
ーン比較部4で比較され、両者の差が検出される。標準
パターン記憶部には学習者のニ−ズ又は選択されたコ−
スによって異なるが、多数の単語をあらかじめ、外部又
は本練習機組込みパターン分析部で分析し、本記憶部5
に記憶しておく必要がある。外部で分析する場合にはR
OM等にして用い、又内部で分析する場合には標準発音
者9の発音した単語音声をパターン分析部3で分析し標
準パターン記憶部5に書込む必要がある。パターン比較
部4は前述したように絶対値を比較するのではなく、時
系列値を相対値的に比較するものであり、この際単語発
音の時間長の変化を許すとすると、標準パターンと抽出
されたパターンとは全体の時間長が一致しないので何ら
かの時間軸マッチングが必要である。時間軸のマッチン
グ法にもDP等の手法が使用可能であるが、単語等を標
準発音に従がつてまねると云うプロセスを考えると余り
複雑な処理は必要ではなく単純な比例マッチングで両者
の時間軸は一致させる事が出釆る。パターン比較部4で
は以上述べたように学習者の発音が標準者の発音に比較
してどこがどの様に異なっているかが検出される。この
相異点と標準パターンとから矯正発音デコード部7では
学習者に謀まった点を指摘し、正しい発音を指示して、
標準発音と合せてフィードバックするために音声合成部
8に渡すべきデータを準備する。標準発音デコード部6
は単語を指定されると標準パターン記憶部5よりその単
語の標準パターンを選択して、音素、ピッチ、強度を判
読して、次の音声合成部が合成音として発音出来るよう
なデータに変換して渡す。音声合成部8は渡されたデー
タを用いて合成音声として、学習者へフィードバックす
る。音声合成部8としては、分析パターンのパラメータ
の性質に対応して、音素パターン等が、LPC、PAR
COR等のパラメータであれば、パラメータ合成法が適
当であり、音素パターン等が音韻系列であれば、規則合
成法等が適当であるが、いずれの方法も使用可能である
。以上の練習機の動作を学習者との対話形式で示すと次
のようなステップとなる。1 キーボード等で学習者が
、単語又は学習コースを指定する。
2 合成音声で標準発音が提示される。
nang雌ge(〔1亀gwid3〕)」3 学習者は
標準発音をまねて発音する。
標準発音をまねて発音する。
nang雌ge(〔けりgのd3〕)」
4 矯正点を学習者へ提示する。
「1の発音がおかしいです。
アクセントをlaの上において〔1多gwid3〕と発
音して下さい」5 学習者は正し〈疹正して発音する。
音して下さい」5 学習者は正し〈疹正して発音する。
「(1左gWid3〕」
6 正しく発音されたらその旨を指示する。
「はい、よろしい」7 次の単誤へ移る。
以上詳細に説明した如く、本発明は学習者の発音につい
て認識機能を持つたものであり、これにより学習者は自
己の矯正点をはっきり知る事が出来間違いなく、効果的
に語学を学習することが出釆るものである。
て認識機能を持つたものであり、これにより学習者は自
己の矯正点をはっきり知る事が出来間違いなく、効果的
に語学を学習することが出釆るものである。
図は本発明の−実施例における語学練習機のブロック図
である。 1…・・・学習者、2・・・・・・単語発音信号、3・
・・・・・パターン分析部、4・・・・・・パターン比
較部、5・・・・・・標準パターン比較部、6・・・・
・・標準発音デコード部、7・・・・・・矯正発音デコ
ード部、8・・・・・・音声合成部、9・・・・・・標
準発音者。
である。 1…・・・学習者、2・・・・・・単語発音信号、3・
・・・・・パターン分析部、4・・・・・・パターン比
較部、5・・・・・・標準パターン比較部、6・・・・
・・標準発音デコード部、7・・・・・・矯正発音デコ
ード部、8・・・・・・音声合成部、9・・・・・・標
準発音者。
Claims (1)
- 1 英語等の言語音声を学習する語学練習機において、
学習者の任意の単語発音信号を音声分析して、音素時系
列、基本周波数の時系列、音声強度時系列等の時系列パ
ターンを分析、抽出するパターン分析部と、標準発音者
(教師)の該単語に関する正しい標準発音信号と上記パ
ターン分析部に於けると同様の分析を行なつて得た音素
、基本周波数、音声強度時系列パターンを記憶保持する
標準パターン記憶部と、上記標準パターン記憶部の該単
語標準パターンとパターン分析部との出力と比較し差異
点を抽出するパターン比較部と、上記パターン比較部で
抽出された差異点により学習者に矯正点を指示するため
の指示音声を合成するために音声合成部に必要なパラメ
ータに変換する矯正発音デコード部と、前記標準パター
ン記憶部の標準パターンを用いて標準発音を音声合成す
るに必要なパラメータに変換する標準発音デコード部と
、前記標準発音デコード部と矯正発音デコード部とから
のパラメータにより音声を発声する音声合成部とから成
る事を特徴とする語学練習機。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP55048349A JPS6032195B2 (ja) | 1980-04-11 | 1980-04-11 | 語学練習機 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP55048349A JPS6032195B2 (ja) | 1980-04-11 | 1980-04-11 | 語学練習機 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS56144477A JPS56144477A (en) | 1981-11-10 |
JPS6032195B2 true JPS6032195B2 (ja) | 1985-07-26 |
Family
ID=12800894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP55048349A Expired JPS6032195B2 (ja) | 1980-04-11 | 1980-04-11 | 語学練習機 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6032195B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62194993A (ja) * | 1986-02-21 | 1987-08-27 | Riichi Ogura | 船尾振動防止装置 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57188100A (en) * | 1981-05-15 | 1982-11-18 | Nippon Telegraph & Telephone | Voice recognition/synthesization system |
JPS57188099A (en) * | 1981-05-15 | 1982-11-18 | Nippon Telegraph & Telephone | Voice recognition/synthesization system |
US4441399A (en) * | 1981-09-11 | 1984-04-10 | Texas Instruments Incorporated | Interactive device for teaching musical tones or melodies |
JPS58126600A (ja) * | 1982-01-22 | 1983-07-28 | 日本電信電話株式会社 | 音声認識装置 |
JPS58163975U (ja) * | 1982-04-26 | 1983-11-01 | シャープ株式会社 | 語学練習装置 |
US4466801A (en) * | 1982-05-25 | 1984-08-21 | Texas Instruments Incorporated | Electronic learning aid with means for repeating an element of nonspoken sound |
JPS5926949U (ja) * | 1982-08-10 | 1984-02-20 | タキロン株式会社 | 農園芸栽培用ハウスの屋根の防滴構造 |
JPS5989421U (ja) * | 1982-12-06 | 1984-06-16 | クラリオン株式会社 | カラオケ装置 |
JPS59131772U (ja) * | 1983-02-21 | 1984-09-04 | 三菱電機株式会社 | 標章学習機 |
JPH0685105B2 (ja) * | 1984-11-19 | 1994-10-26 | 富士通株式会社 | 発声訓練方式 |
JPS63148288A (ja) * | 1986-12-12 | 1988-06-21 | 株式会社河合楽器製作所 | 発音訓練装置 |
-
1980
- 1980-04-11 JP JP55048349A patent/JPS6032195B2/ja not_active Expired
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62194993A (ja) * | 1986-02-21 | 1987-08-27 | Riichi Ogura | 船尾振動防止装置 |
Also Published As
Publication number | Publication date |
---|---|
JPS56144477A (en) | 1981-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Holmes | Speech synthesis and recognition | |
EP0446208B1 (en) | Language training | |
Raghavendra et al. | An investigation of different degrees of dysarthric speech as input to speaker-adaptive and speaker-dependent recognition systems | |
JPH075807A (ja) | 合成を基本とした会話訓練装置 | |
WO2012033547A1 (en) | System and method for teaching non-lexical speech effects | |
KR20150076128A (ko) | 3차원 멀티미디어 활용 발음 학습 지원 시스템 및 그 시스템의 발음 학습 지원 방법 | |
JPS6032195B2 (ja) | 語学練習機 | |
Demenko et al. | The use of speech technology in foreign language pronunciation training | |
Kommissarchik et al. | Better Accent Tutor–Analysis and visualization of speech prosody | |
Peabody et al. | Towards automatic tone correction in non-native mandarin | |
Sundström | Automatic prosody modification as a means for foreign language pronunciation training | |
Rodríguez et al. | COMUNICA-tools for speech and language therapy. | |
Ahad et al. | Acoustic Analysis of English Long Vowels Produced by Pashto Speakers | |
Fuller | Pulmonic ingressive fricatives in Tsou | |
Yu | A Model for Evaluating the Quality of English Reading and Pronunciation Based on Computer Speech Recognition | |
Kawai et al. | A system for learning the pronunciation of Japanese Pitch Accent | |
Komissarchik et al. | Application of knowledge-based speech analysis to suprasegmental pronunciation training | |
CN111508523A (zh) | 一种语音训练提示方法及系统 | |
Kainada et al. | The acquisition of English intonation by native Greek speakers | |
Granstrom | Applications of intonation-an overview | |
Rayshata et al. | Automatic speech recognition to enhance EFL students’ pronunciation through Google’s Voice Search Application | |
KR102610871B1 (ko) | 청각장애인 음성언어훈련 시스템 | |
Silpachai et al. | Effects of voice type and task on L2 learners’ awareness of pronunciation errors | |
Chun et al. | Using technology to explore l2 pronunciation | |
Kusz | Effects of imitation and self-imitation practice on L2 pronunciation progress |