JP6997993B2 - 語学学習支援装置、その方法、およびプログラム - Google Patents
語学学習支援装置、その方法、およびプログラム Download PDFInfo
- Publication number
- JP6997993B2 JP6997993B2 JP2018169594A JP2018169594A JP6997993B2 JP 6997993 B2 JP6997993 B2 JP 6997993B2 JP 2018169594 A JP2018169594 A JP 2018169594A JP 2018169594 A JP2018169594 A JP 2018169594A JP 6997993 B2 JP6997993 B2 JP 6997993B2
- Authority
- JP
- Japan
- Prior art keywords
- pronunciation error
- pronunciation
- error
- storage unit
- native
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Description
本実施形態の語学学習支援装置は、学習者の発音を練習したい学習用テキストに合わせて、発音誤りに注意を要する箇所を指摘する。
発音誤り事例記憶部103には、発音誤り候補を付加する前に、予め発音誤り事例を記憶しておく。例えば、発音誤り事例記憶部103は、発音誤りの事例がテーブル等の形式で記録されているデータベースである。表のような形式で記憶されても良いし、正解から誤りへの変換テーブル+変換確率のような形式で記憶されても良い。
[l]->[r]
[r]->[l]
本実施形態では、発音誤り候補(発音誤りの事例)は、予め用意されているものとする。
(参考文献1)特開2017-191278号公報
(参考文献2)Michael Swan Bernard Smith、"Learner English: A Teacher's Guide to Interference Teacher's Guide to Interference and Other Problems", Cambridge University Press, 2版, 2001年, p.296-310
学習用言語データ記憶部101は、学習対象のテキストデータが記録されているデータベースである。例えば、学習したい文章がリストになって記憶されている。
例1)I like rice.
例2)I like apples.
既に蓄積されているデータベースを用いても良く、学習者が自ら追加したテキストデータを用いても良い。
入力:学習用言語データ、発音誤り事例
出力:発音誤り候補付言語データ
処理内容:
発音誤り事例を用いて、学習用言語データ(入力テキスト)の発音誤りを起こしやすい箇所の候補を抽出し(S5)、発音誤り候補を含む情報を付加して、発音誤り候補付言語データを出力する。
(参考文献3)Josef R. Novak, Nobuaki Minematsu, Keikichi Hirose, "WFST-based Grapheme-to-Phoneme Conversion: Open Source Tools for Alignment, Model-Building and Decoding", Proceedings of the 10th International Workshop on Finite State Methods and Natural Language Processing, pages 45-49, 2012.
以上の構成により、対象とする文章に適応的に対応するため、任意の文章を学習対象とする事が可能になる。また、学習対象の文章に応じた正解の音声を収録する必要が無いため、学習コンテンツ作成に関わるコストを抑える事が可能となる。
第一実施形態と異なる部分を中心に説明する。
確率付発音誤り事例記憶部203には、発音誤り事例と発音誤り事例に対応する発音誤りの起こしやすさの指標との組が記憶される。例えば、確率付発音誤り事例記憶部203は、発音誤り事例と(発音誤りの起こしやすさの指標である)その出現確率の組がテーブル等の形式で記録されているデータベースである。例えば、表のような形式で記憶されている。例えば、以下のように[正解の発音記号の音素系列] => [誤り易い発音記号の音素系列]:指標の形式で記憶されている。
[r] ->[l]:0.2
(例1)学習用テキスト(学習用言語データ)における出現頻度から出現し易さを推定し、指標とする。このとき、出現し易さとして、各音素の出現頻度を、全出現頻度で除算した割合を用いても良い。
(例2)非ネイティブ話者(非母語話者ともいう)の音声を対象とした発音誤り検出技術から別途算出した発音誤り確率を指標とする。ここで発音誤り検出技術としては、例えば発音誤り前の音素の出現頻度で、発音誤り後の音素の出現頻度を除算した割合を用いることが出来る。
(例3)出現し易さとしての確率(上述の例1)と、発音誤り確率(上述の例2)の積を指標とする。
(例4)特に確率値である必要は無く、当該発音誤りの出現頻度や出現頻度の順位の逆数を指標としてもよい。
入力:学習用言語データ、発音誤り事例と発音誤り事例に対応する発音誤りの起こしやすさの指標との組
出力:発音誤り候補付言語データ
処理内容:
発音誤りの事例に対応する発音誤りやすさの程度に基づいて、学習用言語データ(入力テキスト)に対して発音誤りを起こしやすい箇所の候補を予め定めた候補数以下だけ抽出し(S5)、発音誤り候補を含む情報を付加して出力する。
このような構成とすることで、第一実施形態と同様の効果を得ることができる。さらに、学習意欲の低下を防ぐことができる。
第二実施形態と異なる部分を中心に説明する。
発音誤り学習データ記憶部307は、発音誤りを含むサンプルデータ(発音誤り学習データ)が蓄積された一定量のテキストデータベースである。例えば、テキストデータと、そのテキストデータの正解発音の単語の音素系列と、発音誤りを含む音素系列が保持されたテキストデータベースである。以下に例を示す。
Ex. [正解発音系列] => [発音誤り音素系列]
[lik] => [rik]
[ris] => [lis]
Ex.
ARPABET 2文字 AA
発音誤り音素系列等が発音辞書、すなわち正解発音系列とは異なる形式で記述されている事例も想定される。その際は、異なる発音記述方式間の変換を行う必要がある。この場合、例えば、上述のGrapheme-to-Phonemeを用いて変換する事で統一化を図る事が考えられる。このとき、Grapheme-to-Phonemeを処理する変換モデルの学習データには、ネイティブ話者(母語話者ともいう)の発音系列に絞って学習する事とする。異なる発音記述方式間の変換に、非ネイティブの発音誤りを含めない事で、頑健な変換処理が可能となる。
入力: 発音誤り学習データ
出力: 確率付発音誤り事例
処理内容:
例えば、発音誤り事例抽出部309は、発音誤り学習データにおける各発音誤りの出現頻度を計算し、発音誤り事例とその出現確率を計算する。
[l]->[r]の場合:p([l]->[r]) = (rと発声された数)/(lと発声すべき数)
このとき、(lと発声すべき数)は学習データにおける音素lの出現頻度、 (rと発声された数)は本来音素lと発声すべきであるが音素rと発声されてしまったものの出現頻度とする。
発音誤り事例記憶部303は、発音誤り事例に対応する発音誤りの起こしやすさの指標が予め定められた閾値を超えた発音誤り事例とその指標との組のみを記憶する。本実施形態における発音誤りの起こしやすさの指標は、発音誤り事例の出現確率である。
このような構成とすることで、第二実施形態と同様の効果を得ることができる。さらに、指摘箇所を限定したり、照合時間を減らすことができる。
第三実施形態と異なる部分を中心に説明する。
発音誤り学習データ記憶部(非ネイティブ)411は、発音誤りを含む非ネイティブ話者のサンプルデータ(非ネイティブ発音誤り学習データ)が蓄積された一定量のテキストデータベースである。
発音誤り学習データ記憶部(ネイティブ)413は、発音誤りを含むネイティブ話者のサンプルデータ(ネイティブ発音誤り学習データ)が蓄積された一定量のテキストデータベースである。
入力:非ネイティブ発音誤り学習データ、ネイティブ発音誤り学習データ、
出力:確率付発音誤り事例
処理内容:
非ネイティブ特有発音誤り事例抽出部409は、非ネイティブ発音誤り学習データ(テキストデータ)とネイティブ発音誤り学習データ(テキストデータ)について、ネイティブ話者の発音誤り事例に対応する発音誤りやすさの程度と非ネイティブ話者の発音誤り事例に対応する発音誤りやすさの程度に基づいて算出された非ネイティブ話者特有の発音誤りやすさの程度と対応する発音誤り事例を発音誤り事例記憶部303に格納する。
このような構成とすることで、第三実施形態と同様の効果を得ることができる。さらに、非ネイティブ特有の発音誤りに指摘箇所を限定することで、非ネイティブ話者の学習効果を高めることができる。
第四実施形態と異なる部分を中心に説明する。
正解付音声データベース記憶部(非ネイティブ)517は、非ネイティブによる音声データベースであり、そもそも非ネイティブ話者が発声したかった正解の文章(テキスト)が付与されており、正しい発音が分かる。
ネイティブ音響モデル記憶部515には、ネイティブ話者の音声データに基づき予め生成された音響モデル(ネイティブ音響モデル)が格納されている。
入力:非ネイティブ音声データ、発音誤り事例、ネイティブ音響モデル
出力:非ネイティブ発音誤り学習データ
処理内容:
発音誤り学習データ抽出部519は、非母語話者の音声に対応づけられたテキストまたは制限確率付発音誤り事例記憶部303に記憶された発音誤り事例のテキストの少なくもいずれかである入力テキストに対して、入力テキストに対応する音声について高制約文法に対応する第1の音響モデルのスコアと低制約文法に対応する第2の音響モデルのスコアのうち、第2の音響モデルのスコアが高い場合に、非ネイティブ話者の発話に対応するテキストを非ネイティブ話者の発音誤り学習データとして発音誤り学習データ記憶部(非ネイティブ)411に格納する。さらに、非母語話者特有発音誤り事例抽出部409に、発音誤り学習データ記憶部(非ネイティブ)411に新たに格納された非ネイティブ話者の発音誤り学習データを用いて、発音誤り事例記憶部303に記憶された発音誤り事例に対応する発音誤りやすさの程度を更新する、または、新たな発音誤り事例に対応するテキストと発音誤りやすさの程度を追加するように制御信号を出力する。
Ex.
高制約文法: 正解のみで認識させる文法
I like rice -> aI laIk raIs
低制約文法: 発音誤りが入る可能性を考慮して認識させる文法
I like rice -> aI {l,l2r}aIk {r,r2l}aIs
ただし、{l,l2r}はlをrに発音誤りすることを許容することを意味し、{r,r2l}はrをlに発音誤りすることを許容することを意味する。
第五実施形態と異なる部分を中心に説明する。
正解無音声データベース記憶部(非ネイティブ)623は、非ネイティブによる音声データベースである。正解無音声データベース記憶部(非ネイティブ)623には、そもそも非ネイティブ話者が発声したかった正解の文章が付与されていなくても構わない。
非ネイティブ音響モデル記憶部621には、非ネイティブ話者の音声データに基づき予め生成された音響モデル(非ネイティブ音響モデル)が格納されている。
入力:正解無音声データ、非ネイティブ音響モデル、信頼度閾値
出力:正解付音声データ
処理内容:
音声認識部625は、非ネイティブ音響モデルを用いて、正解無音声データに対して音声認識し、音声認識の信頼度が信頼度閾値より高い音声認識結果のみを正解(学習者が発声したかった文章として)として採用し、音声認識結果(非ネイティブ話者が発声したかったと推定される正解の文章(テキスト))を付与した正解無音声データを正解付音声データとして、正解付音声データベース記憶部(非ネイティブ)517に格納する。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (9)
- 正解の発音記号の音素系列と誤り易い発音記号の音素系列との組を含む発音誤り事例を記憶する発音誤り事例記憶部と、
入力テキストの発音表記に前記発音誤り事例の音素系列を含んでいる場合には、その音素を発音誤り候補として抽出する発音誤り候補抽出部を含む、
語学学習支援装置。 - 発音誤り事例を記憶する発音誤り事例記憶部と、
前記発音誤り事例を用いて入力テキストの発音誤りを起こしやすい箇所の候補を抽出する発音誤り候補抽出部を含み、
前記発音誤り事例記憶部には、前記発音誤り事例と前記発音誤り事例に対応する発音誤りの起こしやすさの指標との組を記憶し、
前記発音誤り候補抽出部は、前記発音誤りの事例に対応する発音誤りの起こしやすさの指標に基づいて、入力テキストに対して前記発音誤りを起こしやすい箇所の候補を予め定めた候補数以下だけ抽出する、
語学学習支援装置。 - 請求項1または請求項2の語学学習支援装置であって、
前記発音誤り事例記憶部は、発音誤り事例の音素環境に基づく、発音誤りの起こしやすさの指標が予め定められた閾値を超えた発音誤り事例のみを記憶する、
語学学習支援装置。 - 請求項2または請求項3の語学学習支援装置であって、
非母語話者の発音誤りテキストと母語話者の発音誤りテキストについて、母語話者の発音誤り事例に対応する発音誤りの起こしやすさの指標と非母語話者の発音誤り事例に対応する発音誤りの起こしやすさの指標に基づいて算出された非母語話者特有の発音誤りの起こしやすさの指標と対応する発音誤り事例を前記発音誤り事例記憶部に格納する非母語話者特有発音誤り事例抽出部を備える、
語学学習支援装置。 - 請求項4の語学学習支援装置であって、
非母語話者の音声に対応づけられたテキストまたは発音誤り事例記憶部に記憶された発音誤り事例のテキストの少なくもいずれかである入力テキストに対して、前記入力テキストに対応する音声について高制約文法に対応する第1の音響モデルのスコアと低制約文法に対応する第2の音響モデルのスコアのうち、前記第2の音響モデルのスコアが高い場合に、前記非母語話者の発話に対応するテキストを非母語話者の発音誤りテキストとして非母語話者特有発音誤り事例抽出部に出力し、前記非母語話者特有発音誤り部によって、前記発音誤り事例記憶部に記憶された前記発音誤り事例に対応する発音誤りの起こしやすさの指標を更新する、または、新たな発音誤り事例に対応するテキストと発音誤りの起こしやすさの指標を追加する発音誤り学習データ抽出部を備え、
前記発音誤り事例記憶部の発音誤りが更新または追加されるたびに、発音誤り学習データ抽出部の処理を行なう、
語学学習支援装置。 - 請求項5の語学学習支援装置であって、
前記非母語話者の発話に対応するテキストは、前記非母語話者音声を非母語話者の音響モデルを用いて音声認識し、前記音声認識の信頼度が所定の閾値より高い音声認識結果である、
語学学習支援装置。 - 発音誤り事例記憶部には正解の発音記号の音素系列と誤り易い発音記号の音素系列との組を含む発音誤り事例が記憶されるものとし、
入力テキストの発音表記に前記発音誤り事例の音素系列を含んでいる場合には、その音素を発音誤り候補として抽出する発音誤り候補抽出ステップを含む、
語学学習支援方法。 - 発音誤り事例記憶部には発音誤り事例が記憶されるものとし、
前記発音誤り事例を用いて入力テキストの発音誤りを起こしやすい箇所の候補を抽出する発音誤り候補抽出ステップを含み、
前記発音誤り事例記憶部には、前記発音誤り事例と前記発音誤り事例に対応する発音誤りの起こしやすさの指標との組が記憶されるものとし、
前記発音誤り候補抽出ステップは、前記発音誤りの事例に対応する発音誤りの起こしやすさの指標に基づいて、入力テキストに対して前記発音誤りを起こしやすい箇所の候補を予め定めた候補数以下だけ抽出する、
語学学習支援装置。 - 請求項1から請求項6の何れかの語学学習支援装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018169594A JP6997993B2 (ja) | 2018-09-11 | 2018-09-11 | 語学学習支援装置、その方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018169594A JP6997993B2 (ja) | 2018-09-11 | 2018-09-11 | 語学学習支援装置、その方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020042174A JP2020042174A (ja) | 2020-03-19 |
JP6997993B2 true JP6997993B2 (ja) | 2022-01-18 |
Family
ID=69798252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018169594A Active JP6997993B2 (ja) | 2018-09-11 | 2018-09-11 | 語学学習支援装置、その方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6997993B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002072841A (ja) | 2000-08-29 | 2002-03-12 | Hitachi Ltd | 単語学習システム |
JP2006190006A (ja) | 2005-01-04 | 2006-07-20 | Internatl Business Mach Corp <Ibm> | 文章表示方法、情報処理装置、情報処理システム、プログラム |
US20080027731A1 (en) | 2004-04-12 | 2008-01-31 | Burlington English Ltd. | Comprehensive Spoken Language Learning System |
JP2017191278A (ja) | 2016-04-15 | 2017-10-19 | 日本電信電話株式会社 | 音素誤り獲得装置、辞書追加装置、音声認識装置、音素誤り獲得方法、音声認識方法、およびプログラム |
JP2018054638A (ja) | 2015-02-11 | 2018-04-05 | 藤田 一郎 | 外国語学習用プログラム及び方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03226785A (ja) * | 1990-01-31 | 1991-10-07 | Oki Techno Syst Lab:Kk | 音声認識装置付き語学用教育装置 |
-
2018
- 2018-09-11 JP JP2018169594A patent/JP6997993B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002072841A (ja) | 2000-08-29 | 2002-03-12 | Hitachi Ltd | 単語学習システム |
US20080027731A1 (en) | 2004-04-12 | 2008-01-31 | Burlington English Ltd. | Comprehensive Spoken Language Learning System |
JP2006190006A (ja) | 2005-01-04 | 2006-07-20 | Internatl Business Mach Corp <Ibm> | 文章表示方法、情報処理装置、情報処理システム、プログラム |
JP2018054638A (ja) | 2015-02-11 | 2018-04-05 | 藤田 一郎 | 外国語学習用プログラム及び方法 |
JP2017191278A (ja) | 2016-04-15 | 2017-10-19 | 日本電信電話株式会社 | 音素誤り獲得装置、辞書追加装置、音声認識装置、音素誤り獲得方法、音声認識方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020042174A (ja) | 2020-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Barnard et al. | The NCHLT speech corpus of the South African languages | |
JP3782943B2 (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
US7996209B2 (en) | Method and system of generating and detecting confusing phones of pronunciation | |
US8768704B1 (en) | Methods and systems for automated generation of nativized multi-lingual lexicons | |
US8494847B2 (en) | Weighting factor learning system and audio recognition system | |
JP2017513047A (ja) | 音声認識における発音予測 | |
WO2019065263A1 (ja) | 発音誤り検出装置、発音誤り検出方法、プログラム | |
Kurimo et al. | Modeling under-resourced languages for speech recognition | |
CN112397056B (zh) | 语音评测方法及计算机存储介质 | |
JP6552999B2 (ja) | テキスト補正装置、テキスト補正方法、およびプログラム | |
JP2020154076A (ja) | 推論器、学習方法および学習プログラム | |
US11694028B2 (en) | Data generation apparatus and data generation method that generate recognition text from speech data | |
Pakoci et al. | Language model optimization for a deep neural network based speech recognition system for Serbian | |
Coto‐Solano | Computational sociophonetics using automatic speech recognition | |
JP6997993B2 (ja) | 語学学習支援装置、その方法、およびプログラム | |
Baranwal et al. | Improved Mispronunciation detection system using a hybrid CTC-ATT based approach for L2 English speakers | |
Mittal et al. | Speaker-independent automatic speech recognition system for mobile phone applications in Punjabi | |
KR102299269B1 (ko) | 음성 및 스크립트를 정렬하여 음성 데이터베이스를 구축하는 방법 및 장치 | |
Thatphithakkul et al. | LOTUS-BI: A Thai-English code-mixing speech corpus | |
KR20130043817A (ko) | 어학 학습 장치 및 어학 학습 방법 | |
JP6625961B2 (ja) | 発音辞書及び音響モデル生成装置、音声認識装置、方法及びプログラム | |
Mittal et al. | Implementation of phonetic level speech recognition system for Punjabi language | |
Schlippe et al. | Rapid bootstrapping of a ukrainian large vocabulary continuous speech recognition system | |
Al-Barhamtoshy et al. | Speak correct: phonetic editor approach | |
Shukla | Development of a Human-AI Teaming Based Mobile Language Learning Solution for Dual Language Learners in Early and Special Educations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180911 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20180927 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210525 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6997993 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |