JP4716125B2 - 発音評定装置、およびプログラム - Google Patents
発音評定装置、およびプログラム Download PDFInfo
- Publication number
- JP4716125B2 JP4716125B2 JP2006212704A JP2006212704A JP4716125B2 JP 4716125 B2 JP4716125 B2 JP 4716125B2 JP 2006212704 A JP2006212704 A JP 2006212704A JP 2006212704 A JP2006212704 A JP 2006212704A JP 4716125 B2 JP4716125 B2 JP 4716125B2
- Authority
- JP
- Japan
- Prior art keywords
- hmm
- feature vector
- frame
- phoneme
- state number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 claims abstract description 127
- 238000004364 calculation method Methods 0.000 claims abstract description 126
- 238000011156 evaluation Methods 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 238000013518 transcription Methods 0.000 claims description 20
- 230000035897 transcription Effects 0.000 claims description 20
- 239000000470 constituent Substances 0.000 claims 1
- 230000011218 segmentation Effects 0.000 abstract 1
- 230000014509 gene expression Effects 0.000 description 46
- 238000000034 method Methods 0.000 description 39
- 230000006870 function Effects 0.000 description 27
- 238000012545 processing Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Landscapes
- Electrically Operated Instructional Devices (AREA)
Description
(実施の形態1)
(実施の形態2)
102 連結HMM格納部
103 音声受付部
104 フレーム区分部
105 特徴ベクトル系列取得部
106 第一最適状態番号系列取得部
107 第二最適状態番号系列取得部
108 フレーム状態最適パススコア算出部
109 発音区間取得部
110 代表値演算部
111 出力部
112 連結HMM構成部
608 フレーム音素最適パススコア算出部
1081、6081 演算式格納手段
1082 フレーム状態最適パススコア算出手段
6082 フレーム音素最適パススコア算出手段
Claims (6)
- 音韻毎の隠れマルコフモデルに基づくデータである母語音素HMMを格納している母語音素HMM格納部と、
発音評定の対象である正解トランスクリプションに従ってHMMに基づくデータを連結したデータである連結HMMを格納している連結HMM格納部と、
音声の入力を受け付ける音声受付部と、
前記音声受付部が受け付けた音声を、フレームに区分するフレーム区分部と、
前記区分された各フレームの特徴ベクトルを算出し、特徴ベクトル系列を取得する特徴ベクトル系列取得部と、
前記特徴ベクトル系列と前記母語音素HMMを取得し、前記特徴ベクトル系列と前記母語音素HMMを用いて、ビタビアルゴリズムにより第一の最適状態番号系列を取得する第一最適状態番号系列取得部と、
前記特徴ベクトル系列と前記連結HMMを取得し、前記特徴ベクトル系列と前記連結HMMを用いて、ビタビアルゴリズムにより第二の最適状態番号系列を取得する第二最適状態番号系列取得部と、
前記特徴ベクトル系列、前記母語音素HMM、前記第一の最適状態番号系列、および前記第二の最適状態番号系列を用いて、前記区分されたフレームごとに最適状態に対する確率を算出し、当該確率を用いて、前記区分されたフレームごとに発音の良し悪しを示すスコアを算出するフレーム状態最適パススコア算出部と、
前記フレーム状態最適パススコア算出部が算出したフレームごとのスコアを出力する出力部を具備する発音評定装置。 - 音韻毎の隠れマルコフモデルに基づくデータである母語音素HMMを格納している母語音素HMM格納部と、
発音評定の対象である正解トランスクリプションに従ってHMMに基づくデータを連結したデータである連結HMMを格納している連結HMM格納部と、
音声の入力を受け付ける音声受付部と、
前記音声受付部が受け付けた音声を、フレームに区分するフレーム区分部と、
前記区分された各フレームの特徴ベクトルを算出し、特徴ベクトル系列を取得する特徴ベクトル系列取得部と、
前記特徴ベクトル系列と前記母語音素HMMを取得し、前記特徴ベクトル系列と前記母語音素HMMを用いて、ビタビアルゴリズムにより第一の最適状態番号系列を取得する第一最適状態番号系列取得部と、
前記特徴ベクトル系列と前記連結HMMを取得し、前記特徴ベクトル系列と前記連結HMMを用いて、ビタビアルゴリズムにより第二の最適状態番号系列を取得する第二最適状態番号系列取得部と、
前記特徴ベクトル系列、前記母語音素HMM、前記第一の最適状態番号系列、および前記第二の最適状態番号系列を用いて、前記区分されたフレームごとに最適音素内の1以上の各状態に対する確率を算出し、当該1以上の確率を用いて、前記区分されたフレームごとに発音の良し悪しを示すスコアを算出するフレーム音素最適パススコア算出部と、
前記フレーム音素最適パススコア算出部が算出したフレームごとのスコアを出力する出力部を具備する発音評定装置。 - 前記音声受付部が受け付けた音声の発音区間を取得する発音区間取得部と、
前記発音区間ごとに、当該発音区間に対応する1以上のフレームごとの1以上のスコアを用いて、当該発音区間の代表のスコアを算出する代表値演算部をさらに具備し、
前記出力部は、少なくとも前記代表値演算部が算出した各発音区間の代表のスコアを出力する請求項1または請求項2記載の発音評定装置。 - 前記母語音素HMM格納部の母語音素HMMから、発音評定の対象である正解トランスクリプションに従って連結HMMを構成する連結HMM構成部をさらに具備し、
前記連結HMM格納部の連結HMMは、前記連結HMM構成部が構成した連結HMMである請求項1から請求項3いずれか記載の発音評定装置。 - コンピュータに、
音声の入力を受け付ける音声受付ステップと、
前記音声受付ステップで受け付けた音声を、フレームに区分するフレーム区分ステップと、
前記区分された各フレームの特徴ベクトルを算出し、特徴ベクトル系列を取得する特徴ベクトル系列取得ステップと、
前記特徴ベクトル系列と格納している母語音素HMMを取得し、前記特徴ベクトル系列と前記母語音素HMMを用いて、ビタビアルゴリズムにより第一の最適状態番号系列を取得する第一最適状態番号系列取得ステップと、
前記特徴ベクトル系列と格納している連結HMMを取得し、前記特徴ベクトル系列と前記連結HMMを用いて、ビタビアルゴリズムにより第二の最適状態番号系列を取得する第二最適状態番号系列取得ステップと、
前記特徴ベクトル系列、前記母語音素HMM、前記第一の最適状態番号系列、および前記第二の最適状態番号系列を用いて、前記区分されたフレームごとに最適状態に対する確率を算出し、当該確率を用いて、前記区分されたフレームごとに発音の良し悪しを示すスコアを算出するフレーム状態最適パススコア算出ステップと、
前記フレーム状態最適パススコア算出ステップで算出したフレームごとのスコアを出力する出力ステップを実行させるためのプログラム。 - コンピュータに、
音声の入力を受け付ける音声受付ステップと、
前記音声受付ステップで受け付けた音声を、フレームに区分するフレーム区分ステップと、
前記区分された各フレームの特徴ベクトルを算出し、特徴ベクトル系列を取得する特徴ベクトル系列取得ステップと、
前記特徴ベクトル系列と格納している母語音素HMMを取得し、前記特徴ベクトル系列と前記母語音素HMMを用いて、ビタビアルゴリズムにより第一の最適状態番号系列を取得する第一最適状態番号系列取得ステップと、
前記特徴ベクトル系列と格納している連結HMMを取得し、前記特徴ベクトル系列と前記連結HMMを用いて、ビタビアルゴリズムにより第二の最適状態番号系列を取得する第二最適状態番号系列取得ステップと、
前記特徴ベクトル系列、前記母語音素HMM、前記第一の最適状態番号系列、および前記第二の最適状態番号系列を用いて、前記区分されたフレームごとに最適音素内の1以上の各状態に対する確率を算出し、当該1以上の確率を用いて、前記区分されたフレームごとに発音の良し悪しを示すスコアを算出するフレーム音素最適パススコア算出ステップと、
前記フレーム音素最適パススコア算出ステップで算出したフレームごとのスコアを出力する出力ステップを実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006212704A JP4716125B2 (ja) | 2006-08-04 | 2006-08-04 | 発音評定装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006212704A JP4716125B2 (ja) | 2006-08-04 | 2006-08-04 | 発音評定装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008040035A JP2008040035A (ja) | 2008-02-21 |
JP4716125B2 true JP4716125B2 (ja) | 2011-07-06 |
Family
ID=39175131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006212704A Active JP4716125B2 (ja) | 2006-08-04 | 2006-08-04 | 発音評定装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4716125B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103500579A (zh) * | 2013-10-10 | 2014-01-08 | 中国联合网络通信集团有限公司 | 语音识别方法、装置及系统 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739869B (zh) * | 2008-11-19 | 2012-03-28 | 中国科学院自动化研究所 | 一种基于先验知识的发音评估与诊断系统 |
CN101645271B (zh) * | 2008-12-23 | 2011-12-07 | 中国科学院声学研究所 | 发音质量评估系统中的置信度快速求取方法 |
CN103985391A (zh) * | 2014-04-16 | 2014-08-13 | 柳超 | 无需标准读音的音素级的低功耗口语评价及缺陷诊断方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10222190A (ja) * | 1997-01-30 | 1998-08-21 | Motorola Inc | 発音測定装置および方法 |
JP2001265211A (ja) * | 2000-01-14 | 2001-09-28 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 外国語学習装置、外国語学習方法および媒体 |
JP2004053652A (ja) * | 2002-07-16 | 2004-02-19 | Asahi Kasei Corp | 発音判定システム、システム管理用サーバ及びプログラム |
JP2006227587A (ja) * | 2005-01-20 | 2006-08-31 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
-
2006
- 2006-08-04 JP JP2006212704A patent/JP4716125B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10222190A (ja) * | 1997-01-30 | 1998-08-21 | Motorola Inc | 発音測定装置および方法 |
JP2001265211A (ja) * | 2000-01-14 | 2001-09-28 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 外国語学習装置、外国語学習方法および媒体 |
JP2004053652A (ja) * | 2002-07-16 | 2004-02-19 | Asahi Kasei Corp | 発音判定システム、システム管理用サーバ及びプログラム |
JP2006227587A (ja) * | 2005-01-20 | 2006-08-31 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103500579A (zh) * | 2013-10-10 | 2014-01-08 | 中国联合网络通信集团有限公司 | 语音识别方法、装置及系统 |
CN103500579B (zh) * | 2013-10-10 | 2015-12-23 | 中国联合网络通信集团有限公司 | 语音识别方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP2008040035A (ja) | 2008-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6622505B2 (ja) | 音響モデル学習装置、音声合成装置、音響モデル学習方法、音声合成方法、プログラム | |
US20080059190A1 (en) | Speech unit selection using HMM acoustic models | |
JP5768093B2 (ja) | 音声処理システム | |
JP3933750B2 (ja) | 連続密度ヒドンマルコフモデルを用いた音声認識方法及び装置 | |
JP5059115B2 (ja) | 音声キーワードの特定方法、装置及び音声識別システム | |
US9058811B2 (en) | Speech synthesis with fuzzy heteronym prediction using decision trees | |
EP3021318A1 (en) | Speech synthesis apparatus and control method thereof | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
CN101276584A (zh) | 韵律图样产生装置、语音合成装置及其方法 | |
US8407053B2 (en) | Speech processing apparatus, method, and computer program product for synthesizing speech | |
JP5007401B2 (ja) | 発音評定装置、およびプログラム | |
JP6680933B2 (ja) | 音響モデル学習装置、音声合成装置、音響モデル学習方法、音声合成方法、プログラム | |
CN111292763B (zh) | 重音检测方法及装置、非瞬时性存储介质 | |
JP5411845B2 (ja) | 音声合成方法、音声合成装置及び音声合成プログラム | |
JP2007219286A (ja) | 音声のスタイル検出装置、その方法およびそのプログラム | |
JP6631883B2 (ja) | クロスリンガル音声合成用モデル学習装置、クロスリンガル音声合成用モデル学習方法、プログラム | |
JP4716125B2 (ja) | 発音評定装置、およびプログラム | |
JP2009086581A (ja) | 音声認識の話者モデルを作成する装置およびプログラム | |
JP4859125B2 (ja) | 発音評定装置、およびプログラム | |
JP6786065B2 (ja) | 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4753412B2 (ja) | 発音評定装置、およびプログラム | |
JP4417892B2 (ja) | 音声情報処理装置、音声情報処理方法および音声情報処理プログラム | |
JP4621936B2 (ja) | 音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム | |
Jyothi et al. | Revisiting word neighborhoods for speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090408 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4716125 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140408 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |