JP7064413B2 - 言語識別モデルを用いた発音評価プログラム、装置及び方法 - Google Patents
言語識別モデルを用いた発音評価プログラム、装置及び方法 Download PDFInfo
- Publication number
- JP7064413B2 JP7064413B2 JP2018186432A JP2018186432A JP7064413B2 JP 7064413 B2 JP7064413 B2 JP 7064413B2 JP 2018186432 A JP2018186432 A JP 2018186432A JP 2018186432 A JP2018186432 A JP 2018186432A JP 7064413 B2 JP7064413 B2 JP 7064413B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation
- score
- pronunciation
- target
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
入力した発音が当該所定言語による発音である確度に係るスコアを出力する言語識別モデルを用いて取得されたスコアであって、評価基準対象による当該所定言語の発音に対するスコアを複数取得することにより決定された、当該評価基準対象のスコア分布情報を取得する基準スコア分布取得手段と、
当該言語識別モデルを用い、当該評価対象による当該所定言語の発音に対する当該スコアを複数取得して、当該評価対象のスコア分布情報を決定する対象スコア分布決定手段と、
当該評価対象のスコア分布情報と、当該評価基準対象のスコア分布情報との差の分布における分布パラメータに係る値に基づいて、当該評価対象による当該所定言語の発音に対する評価スコアを決定する評価スコア決定手段と
してコンピュータを機能させる発音評価プログラムが提供される。
対象スコア分布決定手段は、取得した複数の当該スコアのヒストグラムを生成し、当該評価対象のスコア分布情報を、該ヒストグラムを表す正規分布の分布パラメータを含む情報とすることも好ましい。
評価スコア決定手段は、更新された当該評価対象のスコア分布情報に係る差の分布における分布パラメータに係る値に基づいて、当該評価対象による当該所定言語の発音に対する評価スコアを更新することも好ましい。
入力した発音が当該所定言語による発音である確度に係るスコアを出力する言語識別モデルを用いて取得されたスコアであって、評価基準対象による当該所定言語の発音に対するスコアを複数取得することにより決定された、当該評価基準対象のスコア分布情報を取得する基準スコア分布取得手段と、
当該言語識別モデルを用い、当該評価対象による当該所定言語の発音に対する当該スコアを複数取得して、当該評価対象のスコア分布情報を決定する対象スコア分布決定手段と、
当該評価対象のスコア分布情報と、当該評価基準対象のスコア分布情報との差の分布における分布パラメータに係る値に基づいて、当該評価対象による当該所定言語の発音に対する評価スコアを決定する評価スコア決定手段と
を有する発音評価装置が提供される。
入力した発音が当該所定言語による発音である確度に係るスコアを出力する言語識別モデルを用いて取得されたスコアであって、評価基準対象による当該所定言語の発音に対するスコアを複数取得することにより決定された、当該評価基準対象のスコア分布情報を取得し、一方で、当該言語識別モデルを用い、当該評価対象による当該所定言語の発音に対する当該スコアを複数取得して、当該評価対象のスコア分布情報を決定するステップと、
当該評価対象のスコア分布情報と、当該評価基準対象のスコア分布情報との差の分布における分布パラメータに係る値に基づいて、当該評価対象による当該所定言語の発音に対する評価スコアを決定するステップと
を有する発音評価方法が提供される。
図1は、本発明による発音評価装置を含む発音評価システムの一実施形態を示す模式図である。
(a)本発明による発音評価装置1と、
(b)発音評価装置1とインターネット等を介して通信接続されたサーバ2と
を含む。このうち(a)の発音評価装置1は、所定言語の発音を評価する装置であるが、例えば本発明による発音評価プログラムをダウンロードした端末、すなわちパーソナル・コンピュータ(PC)、タブレット型コンピュータや、スマートフォン等とすることが可能である。
(A)入力した発音が所定言語による発音である確度(likelihood)に係るスコアを出力する「言語識別(LID,Language IDentification)モデル」を用いて取得されたスコアであって、評価基準対象、例えば外国語会話教室のネイティブの教師による所定言語の発音に対するスコアを複数取得することにより決定された、教師(評価基準対象)の「スコア分布情報」を取得する基準スコア分布取得部112と、
(B)同じ「LIDモデル」を用い、1人の生徒(評価対象)による当該所定言語の発音に対するスコアを複数取得して、生徒(評価対象)の「スコア分布情報」を決定する対象スコア分布決定部113と、
(C)この生徒(評価対象)の「スコア分布情報」と、教師(評価基準対象)の「スコア分布情報」との「差の分布」における「分布パラメータに係る値」に基づいて、生徒(評価対象)による所定言語の発音に対する評価スコアを決定する評価スコア決定部114と
を有している。
(a)教師(評価基準対象)の「スコア分布情報」としての分散σ1 2、及び
(b)生徒(評価対象)の「スコア分布情報」として分散σ2 2
が取得されれば、最終的に生徒の評価スコアを決定することができるのである。
同じく図1の機能ブロック図によれば、発音評価装置1は、通信インタフェース部101と、ネイティブコーパス102と、ユーザ発音保存部103と、評価スコア保存部104と、タッチパネル・ディスプレイ(TP・DP)105と、マイク(MC)107と、スピーカ(SP)108と、プロセッサ・メモリとを有する。
(a)サーバ2から、学習済みのLID(言語識別)モデルを受信し、
(b)サーバ2から、学習済みの評価スコア推定モデルを受信し、
(c)サーバ2から、教師(評価基準対象)のスコア分布情報である基準スコア分布情報を受信し、
(d)評価スコア決定部114から出力された評価スコアを、外部の情報処理装置へ送信する
ことも好ましい。
(a)上述したように取得された複数の確度スコアから、確度スコアヒストグラムを生成し、
(b)生成した確度スコアヒストグラムを表す正規分布、すなわち当該ヒストグラムにフィッティングさせた正規分布を決定し、
(c)この正規分布の分布パラメータ情報、例えば平均μ1及び分散σ1 2を、教師群(評価基準対象)の確度スコア分布情報である「基準スコア分布情報」とする
のである。
(a)上述したように取得された複数の確度スコアから、確度スコアヒストグラムを生成し、
(b)生成した確度スコアヒストグラムを表す正規分布、すなわち当該ヒストグラムにフィッティングさせた正規分布を決定し、
(c)この正規分布の分布パラメータ情報、例えば平均μ2及び分散σ2 2を、生徒(評価対象)の確度スコア分布情報である「対象スコア分布情報」とする
のである。
(1) μd=μ2-μ1
であって、分散σd 2が、
(2) σd 2=σ1 2+σ2 2を満たすような分布として生成される。
(3) pd=(2π)-0.5/σd=(2π)-0.5/(σ1 2+σ2 2)0.5
≒0.4/(σ1 2+σ2 2)0.5
によって算出される。この式(3)から分かるように、ピーク値pdは、生徒の正規分布の標準偏差σ2、すなわち分散σ2 2の単調減少関数となっており、したがって、ノンネイティブの生徒とネイティブの教師との発音の近さを表す良い指標となっている。
(a)予備的評価スコアとしての(「差の分布」の)ピーク値pdと、
(b)正解値としての、人間の評価者による評価スコアと
の組である複数の教師データによって構築された評価スコア推定モデルを用いて、評価スコアを決定するのである。
図2は、基準スコア分布決定部111、対象スコア分布決定部113及び評価スコア決定部114によって実施される、本発明の発音評価方法の一実施形態におけるフローを概略的に示す模式図である。
(S1)学習済みのLIDモデルを用いて、教師(評価基準対象)による発音の確度スコアを生成し、
(S2)教師(評価基準対象)の確度スコアヒストグラムを生成し、
(S3)ステップS2で生成したヒストグラムにフィッティングさせた正規分布を決定して、基準スコア分布情報(平均μ1及び分散σ1 2)を取得する。
(S4)ステップS1と同じ学習済みのLIDモデルを用いて、生徒(評価対象)による発音の確度スコアを生成し、
(S5)生徒(評価対象)の確度スコアヒストグラムを生成し、
(S6)ステップS5で生成したヒストグラムにフィッティングさせた正規分布を決定して、対象スコア分布情報(平均μ2及び分散σ2 2)を取得する。
(S7)ステップS3及びステップS6で決定した正規分布の「差の分布」を生成し、
(S8)生成した「差の分布」のピーク値pd(≒0.4/(σ1 2+σ2 2)0.5)を算出し、
(S9)算出したピーク値pd(予備的評価スコア)に基づき、評価スコア推定モデルを用いて、最終的な評価スコア、例えば上記の5段階のスコアを決定するのである。
図3、図4及び図5は、本発明による発音評価方法の実施例を説明するためのグラフである。ここで、図3には、基準となる教師群、及び生徒Aについての実施例が示されており、図4には、生徒Bについての実施例が示されており、図5には、生徒Cについての実施例が示されている。
101 通信インタフェース部
102 ネイティブコーパス
103 ユーザ発音保存部
104 評価スコア保存部
105 タッチパネル・ディスプレイ(TP・DP)
107 マイク(MC)
108 スピーカ(SP)
111、212 基準スコア分布決定部
111a、113a 言語識別部
112 基準スコア分布取得部
113 対象スコア分布決定部
114 評価スコア決定部
114a 差分布算出部
114b 評価スコア推定部
121、211 言語識別モデル構築部
122、213 評価スコア推定モデル構築部
131 通信制御部
132 入出力制御部
2 サーバ
Claims (10)
- 評価対象による所定言語の発音を評価する装置に搭載されたコンピュータを機能させる発音評価プログラムであって、
入力した発音が当該所定言語による発音である確度に係るスコアを出力する言語識別モデルを用いて取得されたスコアであって、評価基準対象による当該所定言語の発音に対するスコアを複数取得することにより決定された、当該評価基準対象のスコア分布情報を取得する基準スコア分布取得手段と、
当該言語識別モデルを用い、当該評価対象による当該所定言語の発音に対する当該スコアを複数取得して、当該評価対象のスコア分布情報を決定する対象スコア分布決定手段と、
当該評価対象のスコア分布情報と、当該評価基準対象のスコア分布情報との差の分布における分布パラメータに係る値に基づいて、当該評価対象による当該所定言語の発音に対する評価スコアを決定する評価スコア決定手段と
してコンピュータを機能させることを特徴とする発音評価プログラム。 - 前記評価スコア決定手段は、当該分布パラメータに係る値として分散に係る値を算出し、当該分散に係る値に基づいて、当該評価スコアを決定することを特徴とする請求項1に記載の発音評価プログラム。
- 前記評価スコア決定手段は、当該分布パラメータに係る値として当該差の分布における最大値を算出し、当該最大値に基づいて、当該評価スコアを決定することを特徴とする請求項1又は2に記載の発音評価プログラム。
- 前記評価スコア決定手段は、当該分布パラメータに係る値を、学習済みの評価スコア推定モデルに適用して当該評価スコアを決定することを特徴とする請求項1から3のいずれか1項に記載の発音評価プログラム。
- 前記基準スコア分布取得手段は、当該評価基準対象による当該所定言語の発音に対する複数の当該スコアによって生成されたヒストグラムを表す正規分布の分布パラメータを含む情報を、当該評価基準対象のスコア分布情報として取得し、
前記対象スコア分布決定手段は、取得した複数の当該スコアのヒストグラムを生成し、当該評価対象のスコア分布情報を、該ヒストグラムを表す正規分布の分布パラメータを含む情報とする
ことを特徴とする請求項1から4のいずれか1項に記載の発音評価プログラム。 - 前記対象スコア分布決定手段は、当該評価対象の当該スコアを新たに取得して、当該評価対象のスコア分布情報を更新し、
前記評価スコア決定手段は、更新された当該評価対象のスコア分布情報に係る差の分布における分布パラメータに係る値に基づいて、当該評価対象による当該所定言語の発音に対する評価スコアを更新する
ことを特徴とする請求項1から5のいずれか1項に記載の発音評価プログラム。 - 当該言語識別モデルを用い、当該評価基準対象による当該所定言語の発音に対する当該スコアを複数取得して、当該評価基準対象のスコア分布情報を決定し、前記基準スコア分布取得手段へ出力する基準スコア分布決定手段としてコンピュータを更に機能させることを特徴とする請求項1から6のいずれか1項に記載の発音評価プログラム。
- 当該評価対象は、当該所定言語の学習者であり、当該評価基準対象は、当該所定言語を母国語として話す複数の発音提供者であることを特徴とする請求項1から7のいずれか1項に記載の発音評価プログラム。
- 評価対象による所定言語の発音を評価する発音評価装置であって、
入力した発音が当該所定言語による発音である確度に係るスコアを出力する言語識別モデルを用いて取得されたスコアであって、評価基準対象による当該所定言語の発音に対するスコアを複数取得することにより決定された、当該評価基準対象のスコア分布情報を取得する基準スコア分布取得手段と、
当該言語識別モデルを用い、当該評価対象による当該所定言語の発音に対する当該スコアを複数取得して、当該評価対象のスコア分布情報を決定する対象スコア分布決定手段と、
当該評価対象のスコア分布情報と、当該評価基準対象のスコア分布情報との差の分布における分布パラメータに係る値に基づいて、当該評価対象による当該所定言語の発音に対する評価スコアを決定する評価スコア決定手段と
を有することを特徴とする発音評価装置。 - 評価対象による所定言語の発音を評価する装置に搭載されたコンピュータによって実行される発音評価方法であって、
入力した発音が当該所定言語による発音である確度に係るスコアを出力する言語識別モデルを用いて取得されたスコアであって、評価基準対象による当該所定言語の発音に対するスコアを複数取得することにより決定された、当該評価基準対象のスコア分布情報を取得し、一方で、当該言語識別モデルを用い、当該評価対象による当該所定言語の発音に対する当該スコアを複数取得して、当該評価対象のスコア分布情報を決定するステップと、
当該評価対象のスコア分布情報と、当該評価基準対象のスコア分布情報との差の分布における分布パラメータに係る値に基づいて、当該評価対象による当該所定言語の発音に対する評価スコアを決定するステップと
を有することを特徴とする発音評価方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018186432A JP7064413B2 (ja) | 2018-10-01 | 2018-10-01 | 言語識別モデルを用いた発音評価プログラム、装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018186432A JP7064413B2 (ja) | 2018-10-01 | 2018-10-01 | 言語識別モデルを用いた発音評価プログラム、装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020057129A JP2020057129A (ja) | 2020-04-09 |
JP7064413B2 true JP7064413B2 (ja) | 2022-05-10 |
Family
ID=70107713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018186432A Active JP7064413B2 (ja) | 2018-10-01 | 2018-10-01 | 言語識別モデルを用いた発音評価プログラム、装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7064413B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112908360B (zh) * | 2021-02-02 | 2024-06-07 | 早道(大连)教育科技有限公司 | 一种在线口语发音评价方法、装置及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100145698A1 (en) | 2008-12-01 | 2010-06-10 | Educational Testing Service | Systems and Methods for Assessment of Non-Native Spontaneous Speech |
JP2017090660A (ja) | 2015-11-10 | 2017-05-25 | 日本電信電話株式会社 | 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム |
-
2018
- 2018-10-01 JP JP2018186432A patent/JP7064413B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100145698A1 (en) | 2008-12-01 | 2010-06-10 | Educational Testing Service | Systems and Methods for Assessment of Non-Native Spontaneous Speech |
JP2017090660A (ja) | 2015-11-10 | 2017-05-25 | 日本電信電話株式会社 | 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020057129A (ja) | 2020-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10559299B1 (en) | Reconciliation between simulator and speech recognition output using sequence-to-sequence mapping | |
US9984682B1 (en) | Computer-implemented systems and methods for automatically generating an assessment of oral recitations of assessment items | |
AU2019347734B2 (en) | Conversational agent pipeline trained on synthetic data | |
CN105741832B (zh) | 一种基于深度学习的口语评测方法和系统 | |
US10621975B2 (en) | Machine training for native language and fluency identification | |
US8392190B2 (en) | Systems and methods for assessment of non-native spontaneous speech | |
US6226611B1 (en) | Method and system for automatic text-independent grading of pronunciation for language instruction | |
US20150079554A1 (en) | Language learning system and learning method | |
CN103559892B (zh) | 口语评测方法及系统 | |
CN108766415B (zh) | 一种语音测评方法 | |
JP6674706B2 (ja) | 学習者の口述音声から自動的に採点するプログラム、装置及び方法 | |
JP2007171944A (ja) | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム | |
Kyriakopoulos et al. | A deep learning approach to assessing non-native pronunciation of English using phone distances | |
KR20210059995A (ko) | 학습 기반의 외국어 말하기 평가 방법 및 그 시스템 | |
CN115132174A (zh) | 一种语音数据处理方法、装置、计算机设备及存储介质 | |
Qian et al. | The University of Birmingham 2017 SLaTE CALL Shared Task Systems. | |
JP7064413B2 (ja) | 言語識別モデルを用いた発音評価プログラム、装置及び方法 | |
CN110349567B (zh) | 语音信号的识别方法和装置、存储介质及电子装置 | |
KR20140131307A (ko) | 어학 학습 시스템 및 학습 방법 | |
JP7039511B2 (ja) | モデル間距離を用いた発音評価用のプログラム、装置及び方法 | |
JP2018031828A (ja) | 学習者の口述音声から自動的に採点するプログラム、装置及び方法 | |
KR20220032973A (ko) | 외국어 학습자의 외국어 문장 평가에 기반한 외국어 교육 제공 장치 및 방법 | |
KR20200036366A (ko) | 외국어 회화 학습 장치 및 방법 | |
CN113035237B (zh) | 语音测评方法、装置和计算机设备 | |
Necibi et al. | A statistical-based decision for arabic pronunciation assessment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220414 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220422 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7064413 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |