JP5794602B2 - 音声合成装置及び方法、並びに音声合成プログラム - Google Patents

音声合成装置及び方法、並びに音声合成プログラム Download PDF

Info

Publication number
JP5794602B2
JP5794602B2 JP2010038709A JP2010038709A JP5794602B2 JP 5794602 B2 JP5794602 B2 JP 5794602B2 JP 2010038709 A JP2010038709 A JP 2010038709A JP 2010038709 A JP2010038709 A JP 2010038709A JP 5794602 B2 JP5794602 B2 JP 5794602B2
Authority
JP
Japan
Prior art keywords
phonetic symbol
sound change
function
speech
learner
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010038709A
Other languages
English (en)
Other versions
JP2011175074A (ja
Inventor
秀信 國近
秀信 國近
友幸 有松
友幸 有松
章 竹内
章 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyushu Institute of Technology NUC
Original Assignee
Kyushu Institute of Technology NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu Institute of Technology NUC filed Critical Kyushu Institute of Technology NUC
Priority to JP2010038709A priority Critical patent/JP5794602B2/ja
Publication of JP2011175074A publication Critical patent/JP2011175074A/ja
Application granted granted Critical
Publication of JP5794602B2 publication Critical patent/JP5794602B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Description

本発明は、発音が前後の音の影響を受ける言語の言語テキストを音声合成する音声合成装置及び方法並びに音声合成プログラムに関する。
従来、言語テキストから合成された音声合成データに基づいて当該テキストを音声出力する音声合成装置、或いは多様な外国語テキストを用いて外国語の発音を学習することができるディクテーション学習支援装置が知られている。さらに、日本語テキストから標準的な発音による音声合成データを生成した後、その音声合成データを指定の方言(例えば大阪弁)の発音による音声合成データに変換して音声出力する技術も開発されている(特許文献1参照)。
しかし、英語では日本語と異なり、地域(国)によってイントネーション(上がり下がり)やストレス(強弱)等が変化するため、上記特許文献1の技術によっても、英語テキストを各地域(国)の発音で音声出力させることはできない。
このような問題を解決するために、特許文献2は、イントネーション(上がり下がり)やストレス(強弱)などを考慮し、英文テキストを音声出力する技術を開示している。また、その技術を用いたディクテーション学習支援装置を開示している。
特開2002−304186号公報 特開2008−250090号公報
望月源,神谷泰弘,奥村学,島津明「英語ディクテーション学習支援システムの構築」,教育システム情報学会誌,Vol.19,No.3,pp. 145-153(2002).
英単語が文中で発音される際には、前後の音の影響を受け、単独で発音した場合とは異なる発音になることがある。しかしながら、上記特許文献2の技術を適用しても、そのような音変化をともなう音声出力はできない。また、多様な英文テキストを用いて音変化を学習するためのディクテーション学習支援装置を実現することもできない。
本発明は、発音が前後の音の影響を受ける英語等の言語を音声合成するに際して、前後の音変化を考慮した音声合成装置、および多様な言語テキストを用いてその言語の音変化を学習することができるディクテーション学習支援装置を提供することを目的としている。
本発明の音声合成装置及び方法、並びにプログラムは、発音が前後の音の影響を受ける言語の言語テキストを音声合成するものであり、単語の音声記号を保持する音声記号辞書、及びこの音声記号辞書を参照し言語テキスト中の単語を音声記号へ変換する音声記号変換手段と、音が変化する条件と変化後の音声記号を保持する音変化規則辞書、及び音声記号変換手段により得られた音声記号と音変化規則辞書とを参照し、音変化規則辞書により保持される音変化が生じる条件に合致する音声記号が含まれていた場合、当該箇所を当該音変化規則辞書の変化後の音声記号へと置換する音声記号置換手段と、音声記号を音声出力するテキスト音声合成手段とから成る。
音声記号変換手段は、言語テキストを受け取り、単語へと分割し、各単語について、音声記号辞書を参照して音声記号へ変換する。テキスト音声合成手段は音声合成エンジンを用いて音声出力し、かつ、音声記号置換手段より受け取った音声記号について、音声記号辞書の音声記号表現法と音声合成エンジンの音声記号表現法とが異なる場合は、当該箇所を音声合成エンジンの表現法へと置換して音声出力する。
本発明は、さらに、言語テキストの問題を作成するためのオーサリング手段と、オーサリング手段により作成された問題群を保持する問題データベースと、問題データベースの中から所定数の問題を選定する問題選定手段と、問題選定手段により得られた問題の中から1問選択する出題手段と、出題手段により選択された問題を学習者により入力された言語テキスト文字列と比較することで正誤判定を行う正誤判定手段とを備え、出題手段により選択された問題の言語テキストを音声合成プログラムにより音声出力することにより、言語テキストを用いてその言語の音変化を学習するディクテーション学習支援装置を構成する。
さらに、判定結果を保持する学習者モデルに蓄積された履歴より学習者の弱点を発見する弱点発見手段を備え、問題選定手段は、学習者の弱点が記録されている場合は、該学習者の弱点を考慮して問題データベースより問題を所定数選択する。学習者モデルには、不正解と判定された音変化規則識別子も合わせて記録し、弱点発見手段は誤り頻度が高い音変化規則を同定し、当該音変化規則を学習者の弱点として学習者モデルに記録する。オーサリング手段は、教材作成者より受け取った問題の言語テキストを、音声記号変換手段および音声記号辞書により音声記号へ変換し、音変化規則辞書により保持される音変化が生じる条件に合致する音声記号が含まれていた場合に当該規則識別子、及び当該英単語の位置および当該言語テキストを問題データベースへ記録する。
本発明によれば、言語テキストがその言語の音変化規則に基づき音声出力されるため、その言語の自然な発音を確認できる。また、各学習者の弱点を考慮した上で、言語の音変化規則に基づいた音声によるディクテーション学習を行うことができるため、その言語の音変化を効果的に学習できる。
本発明に基づき構成した音声合成装置の概要を示す図である。 音声合成プログラムの処理手順の概要を説明する動作フロー図である。 音声記号変換機能の処理手順の概要を説明する動作フロー図である。 音声記号置換機能の処理手順を説明する動作フロー図である。 テキスト音声合成機能の処理手順を説明する動作フロー図である。 ディクテーション学習支援装置の概要を示す図である。 ディクテーション学習支援プログラムの処理手順の概要を説明する動作フロー図である。 オーサリング機能の処理手順を説明する動作フロー図である。 問題選定機能の処理手順を説明する動作フロー図である。 出題機能の処理手順を説明する動作フロー図である。 正誤判定機能の処理手順を説明する動作フロー図である。 弱点発見機能の処理手順を説明する動作フロー図である。
以下、例示に基づき本発明を説明する。図1は、本発明に基づき構成した音声合成装置の概要を示す図である。なお、以下、英語を例としてその音声合成について説明するが、本発明は、発音が前後の音の影響を受けるいかなる言語に対しても適用可能である。図1において、音声合成装置(2)は、英単語の音声記号を保持する音声記号辞書(4)、この音声記号辞書(4)を参照し英文テキスト(1)中の単語を音声記号へ変換する音声記号変換機能(3)、音が変化する条件と変化後の音声記号を保持する音変化規則辞書(6)、音声記号変換機能(3)により得られた英文テキスト(1)に対応した音声記号と音変化規則辞書(6)とを参照し、音声記号の記号列に置換する音声記号置換機能(5)、および、音声記号置換機能(5)により得られた記号列を音声出力するテキスト音声合成機能(7)から成る。
音声記号変換機能(3)は、英文テキスト(1)を受け取り、単語へと分割し、各単語について、音声記号辞書(4)を参照して音声記号へ変換する。なお、音声記号辞書(4)としては、従来より公知の辞書(プログラム)を用いることができる。
音変化規則辞書(6)は、音変化が生じる条件(変化前の音声記号)、および変化後の音声記号を保持する。その種類は、消失、連結、脱落および同化の4種類に大別される。さらに、破裂音や鼻音など音素の種類により20種類へ細分化される。
音声記号置換機能(5)は、音声記号変換機能(3)より英文テキスト(1)に対応した発音記号を受け取り、音変化規則辞書(6)により保持される音変化が生じる条件に合致する音声記号が含まれていた場合、当該箇所を当該音変化規則辞書(6)の変化後の音声記号へと置換し、音変化が生じないと判断された単語については元の英文テキスト(1)中の単語の綴りへ再変換する。なお、元の英文テキスト(1)中の単語の綴りへの再変換は、詳細は後述するように必ずしも必要としない。
テキスト音声合成機能(7)は、まず、音声記号置換機能(5)より生成された音変化を含む記号列を受け取る。続いて、音声記号で表記されている箇所について、音声記号辞書(4)の音声記号表現法と音声合成エンジン(8)の音声記号表現法とが異なる場合は、当該箇所を音声合成エンジン(8)の表現法へと変換する。その後、変換後の記号列を音声合成エンジン(8)を用いて音声出力する。なお、音声合成エンジン(8)としては、従来より公知のプログラムを用いて構成することができる。
次に、図1に例示した音声合成装置の動作について、図2〜図5を参照してさらに説明する。図2は、音声合成プログラムの処理手順の概要を説明する動作フロー図である。図2に示すように、音声合成装置(音声合成プログラム)は、まず、音声記号変換機能(3)により、英文テキスト(1)を音声記号へ変換する。次に、音声記号置換機能(5)により、音変化が生じる箇所の音声記号を置換する。最後に、テキスト音声合成機能(7)により、音変化した音声を出力する。以下、音声合成装置の主要な機能についてその詳細を説明する。
(音声記号変換機能)
図3は、音声記号変換機能の処理手順の概要を説明する動作フロー図である。音声記号変換機能(3)は、受け取った英文テキストを単語へと分割し、各単語について、音声記号辞書(4)を参照して音声記号へ変換する。
(音声記号置換機能)
図4は、音声記号置換機能の処理手順を説明する動作フロー図である。図1に示す音声記号変換機能(3)より受け取った音声記号列内の音声記号について、音変化規則辞書(6)により保持される音変化規則の適用条件と比較する。もし条件に一致した場合は、当該箇所を当該音変化規則の変化後の音声記号へと置換する。単語の音声記号の検査が終了し、その単語がいずれの音変化規則の適用条件とも一致しなかった場合は、その単語の発音記号を元の単語の綴りへ再変換する。なお、元の単語の綴りへの再変換は、出力音声の品質向上(イントネーションやストレス等を考慮した自然な音声出力)のために行うが、利用する音声合成エンジン(8)のため品質向上が望めない場合は、必ずしも必要としない。また、自然な音声出力を得るため、最終的に生成された記号列の適切な箇所へ、イントネーションやストレス等に相当する記号を挿入することもできる。
(1) 音変化規則
音変化規則の例を以下に示す。なお、カッコ内の文字列は音声記号であり、”,”は音素の区切りを表し、”,,”は単語の区切りを表す。
・[破裂音,,鼻音]ならば[鼻音]へ置換する。(消失)
なお、破裂音には[K]や[T]等があり、鼻音には[N]や[M]などがある。
・[D,,D]ならば[,,D]へ置換する。(脱落)… 音変化規則1
・[N,,A]ならば[N,A]へ置換する。(連結)
・[T,,Y]ならば[CH]へ置換する。(同化)… 音変化規則2
このような規則を、296作成したことにより、英語の音変化の大部分をカバーすることができた。もし、音変化規則を追加する必要が生じた場合は、同様にして音変化規則を作成し補充すればよい。また、他の種類の音変化に対応する必要がある場合は、必要に応じて音変化規則へ情報を追加すればよい。たとえば音変化の一つとして知られる「弱化」への対応をする場合は、音変化規則の適用条件へ単語の品詞を追加すればよい。また、国や地域の情報を追加することにより、さまざまな国や地域の音変化に対応することができる。
(2)置換例
たとえば、good dayの音声記号の記号列は[G,UH1,D,,D,EY1]であり、前述の音変化規則1の適用条件である[D,,D]を含む。したがって、当該箇所が[,,D]へ置換され、最終的に[G,UH1,,D,EY1]となる。また、meet youの音声記号の記号列は[M,IY1,T,,Y,UW1]であり、前述の音変化規則2の適用条件である[T,,Y]を含むため、当該箇所が[CH]へ置換され、[M,IY1,CH,UW1]となる。
(テキスト音声合成機能)
図5は、テキスト音声合成機能の処理手順を説明する動作フロー図である。テキスト音声合成機能(7)は、まず、音声記号置換機能(5)より受け取った記号列の中の音声記号について、音声記号辞書(4)の音声記号表現法と音声合成エンジン(8)の音声記号表現法とが異なる場合は、当該箇所を音声合成エンジン(8)の表現法へと置換する。その後、生成した記号列を音声合成エンジン(8)を用いて音声出力する。
次に、図6を参照して、上述の図1に例示した音声合成装置を用いたディクテーション学習支援装置について説明する。図6は、ディクテーション学習支援装置の概要を示す図である。ディクテーション学習支援装置(18)は、上述した音声合成装置(2)に加えて、教材作成者(10)が問題(英文テキスト)(11)を作成するためのオーサリング機能(19)、オーサリング機能(19)により作成された問題群を保持する問題データベース(22)、問題データベース(22)の中から学習者(12)の理解状態に合致した問題を選定する問題選定機能(14)、問題選定機能(14)により得られた問題の中から1問選択する出題機能(15)、出題機能(15)により選択された問題と学習者(12)により入力された英文テキスト文字列とを比較することで正誤判定を行う正誤判定機能(17)、正誤判定機能(17)による判定結果を保持する学習者モデル(23)、および、学習者モデル(23)に蓄積された履歴より学習者(12)の弱点を発見する弱点発見機能(24)から成る。
オーサリング機能(19)は、教材作成者(10)より多様な問題(英文テキスト)(11)を受け取り、音声記号変換機能(3)および音声記号辞書(4)により問題を音声記号へ変換し、音変化規則辞書(6)により保持される音変化が生じる条件に合致する音声記号が含まれていた場合に当該規則識別子、当該英単語の位置および当該英文テキストを問題データベース(22)へ記録する。
問題選定機能(14)は、学習者モデル(23)を参照し学習者(12)の弱点が記録されていない場合は、多様な種類の音変化規則識別子が付与された問題が選択されるよう配慮しながら問題データベース(22)よりランダムに問題を、所定数(例えば10問)選択する。学習者(12)の弱点が記録されている場合は、弱点と判断された音変化規則識別子が付与されている問題を問題データベース(22)よりランダムに所定数(例えば5問)選択し、それ以外の選択肢が付与されている問題の中から多様な種類の音変化規則識別子が付与された問題が選択されるよう配慮しつつ問題データベース(22)よりランダムに問題を所定数(例えば5問)選択する。
出題機能(15)は、直前の問題と同種の音変化を含む問題、および、既出の問題を選択しないよう配慮した上で、問題選定機能(14)より受け取った問題の中からランダムに1問選択する。選択した問題の英文テキストは、音声合成装置(2)に入力されて、詳細は図1を参照して説明したように、音声出力される一方、この英文テキストは、正誤判定機能(17)に入力される。
正誤判定機能(17)は、学習者(12)により入力された文字列と出題機能(15)により出題された問題とを公知の動的計画法(非特許文献1参照)によるマッチングにより比較し、単語および単語中の文字について一致(正解)、欠落(不正解)、置換(不正解)または過多(不正解)を検出し、当該結果を学習者(12)に報知するとともに学習者モデル(23)に記録する。
弱点発見機能(24)は、学習者モデル(23)に蓄積された履歴を参照し、最も誤り頻度が高い音変化規則を同定し、当該音変化規則を学習者(12)の弱点として学習者モデル(23)に記録する。
次に、図6に例示したディクテーション学習支援装置の動作について、図7〜図12を参照してさらに説明する。図7は、ディクテーション学習支援プログラムの処理手順の概要を説明する動作フロー図である。まず問題選定機能により、学習者の弱点を考慮した問題を問題データベース(22)より選定する。続いて、選定した問題をすべて出題するまで次の処理を繰り返す。出題機能により問題を1問選択し、音声合成プログラム(図2参照)により音声出力し、学習者より解答が入力されると正誤判定機能により正誤判定をおこなう。すべての問題を出題した後に、弱点発見機能により学習者の弱点を発見する。最後に、得点と弱点を表示する。
ディクテーション学習支援装置を利用した学習の流れの一例は次のとおりである。ディクテーション学習支援プログラムが起動されると、ディクテーション学習画面を表示するとともに、問題選定機能により学習者の弱点を考慮した問題を選定する。学習者が再生ボタンを押すと、本プログラムは、出題機能により問題を1問選択し、音声合成プログラムにより音声出力する。学習者が英文入力欄に解答を入力し採点ボタンを押すと、本プログラムは、正誤判定機能により正誤判定をおこない、その結果を正誤判定結果表示画面に表示する。出題、解答入力および正誤判定について、全ての問題を出題し終えるまで繰り返す。最後に、弱点発見機能により学習者の弱点を同定し、得点とともに得点・弱点表示画面に表示する。次に、ディクテーション学習支援装置の主要な機能についてその詳細を説明する。
(オーサリング機能)
図8は、オーサリング機能の処理手順を説明する動作フロー図である。オーサリング機能(19)は、教材作成者(10)が作成した問題ファイル(英文テキスト)(11)を読み込み、各英文について次の処理を行う。まず、音声記号変換機能(3)および音声記号辞書(4)により音声記号へ変換し、次に音変化規則辞書(6)が適用可能か否かを検査する。もし適用可能である場合は、全ての適用可能な音変化規則識別子と単語の位置および当該英文テキストを問題データベース(22)へ記録する。問題データベース(22)へ蓄積される情報例は、以下のとおりである。
問題識別子,“英文”,音変化規則識別子(音変化が生じる単語の位置)
以下に、データの例を示す。
23,”What do you want?”, 6(0,1)
56,”What did you do last night?”, 6(0,1),9(4,5),15(1,2)
なお、大学英語教育学会基本語改訂委員会編「大学英語教育学会基本語リスト JACET List of 8000 Basic Words」などを用いて英文中の単語レベルを調べ、その情報を記録することにより、単語のレベルを考慮した問題作成が可能となる。
(問題選定機能)
図9は、問題選定機能の処理手順を説明する動作フロー図である。問題選定機能(14)は、学習者モデル(23)を参照し学習者(12)の弱点が記録されていない場合は、多様な種類の音変化規則識別子が付与された問題が選択されるよう配慮しながら問題データベース(22)よりランダムに問題を10問選択する。弱点が記録されている場合は、弱点と判断された音変化規則識別子が付与された問題を問題データベース(22)よりランダムに5問選択する。さらに、それ以外の識別子が付与されている問題の中から、多様な種類の音変化規則識別子が付与された問題が選択されるよう配慮しつつ問題データベース(22)よりランダムに問題を5問選択する。なお、問題選定数を10問、また弱点に相当する問題数を5問として説明したが、任意に変更することもできる。また、大学英語教育学会基本語改訂委員会編「大学英語教育学会基本語リスト JACET List of 8000 Basic Words」などを用いることにより、単語のレベルを考慮した問題選定が可能となる。
(出題機能)
図10は、出題機能の処理手順を説明する動作フロー図である。出題機能(15)は、直前の問題と同種の音変化を含む問題、および、既出の問題を選択しないよう注意し、問題選定機能(14)より受け取った問題の中からランダムに1問選択する。
(正誤判定機能)
図11は、正誤判定機能の処理手順を説明する動作フロー図である。正誤判定機能(17)は、学習者により入力された英文テキストと出題機能により出題された問題文とを公知の動的計画法によるマッチングにより比較し、単語および単語中の文字について正解(一致)または不正解(欠落、置換、過多)を判定し、当該結果を学習者に報知するとともに学習者モデルへ記録する。もし音変化が生じる単語が間違っていた場合は、音変化規則識別子も合わせて記録する。なお、学習者により入力された英文テキストと出題機能により出題された問題文との比較は、動的計画法以外の、例えば、文字列の完全一致による比較手法などのいかなる比較手法も用いることができる。また、音変化規則に対応した説明をシステム内に用意しておき、不正解と判断された場合に、当該音変化規則の説明を表示しても良い。また、正誤判定結果を学習者へ報知する際には、最初から詳細な情報を提示するのではなく、熟考を促すため、ヒントから詳細情報へと段階的に情報提供することもできる。
(弱点発見機能)
図12は、弱点発見機能の処理手順を説明する動作フロー図である。弱点発見機能(24)は、まず学習者モデルを参照し、各音変化規則の誤り頻度を求める。続いて、最も誤り頻度が高い音変化規則を弱点と同定する。最後に、その結果を学習者モデルへ記録する。
各学習者の情報は、学習者ごとに異なるファイルへ保存される。学習者モデル(23)の情報例は、以下のとおりである。
・問題識別子,正誤判定結果,学習者が入力した英文,不正解の場合は誤りに関する情報(音変化規則識別子,誤りの種類(単語/文字,単語/文字の位置,学習者が入力した単語/文字,正しい単語/文字))
・弱点と判定された音変化規則識別子
以下に,データの例を示す.
23,正解,”What do you want?”
56,不正解,”What did you do las night?”,(9,置換(単語,4, las, last), 不足(文字,4,3,t))
弱点,9,10
なお、新たに機能が増えた場合は、必要に応じて学習者モデルの内容または形式を変更すればよい。
本発明の音声合成プログラム及びディクテーション学習支援プログラムは、Microsoft Windows XP以降のオペレーティングシステムがストレスなく動作する能力と、スピーカまたはヘッドフォン端子を有するコンピュータ上で動作する。また、コンピュータ上で動作するアプリケーションとして、Sun MicrosystemsのJava Runtime Environmentが望ましい。音声記号辞書(4)としては、Carnegie Mellon大学のThe CMU Pronouncing Dictionaryを利用できる。音声合成エンジンとしては、Microsoftの音声合成エンジンを利用できる。
[音声教材(音声ファイル)の作成]
本発明の音声合成プログラムを利用することにより、音声教材(音声ファイル)を作成することができる。ユーザが英文テキストを入力すると、音声合成プログラムにより音声出力をおこない、それを記録媒体(たとえばカセットテープなど)へ録音する。なお、音声はスピーカより出力するだけではなく、mp3などの形式で電子ファイルとして保存することも可能である。録音した音声は、教師が、教育現場において音声教材として使用できる。また、学習者自身が任意の英文を入力することで、その英文の音変化を確認することができる。その場合には、音変化が生じる場所や詳細な解説を提示することも可能である。
[音変化に関する学習形態の一例]
本発明の音声合成プログラムを利用することにより、音変化した音声と音変化していない音声とを聞き比べる学習をすることができる。まず学習者が英文を入力し、次に学習者はその英文を音変化させるか否かを指定する。音変化させると指定した場合は、音声合成プログラムを用いて音声出力する。音変化させない場合は、音声合成エンジンに英文をそのまま渡し音声出力する。
なお、音変化が生じる場所や詳細な解説を提示しても良い。また、音声出力にあわせ、再生部分の単語または文字の色を変化させても良い。
[通信教育/遠隔教育での利用]
本発明の音声合成プログラムは、通信教育などへの応用が可能である。通信教育受講者がCDなどの記録媒体またはダウンロードなどによりプログラムを受け取り、自宅のコンピュータへインストールする。問題の配布および学習者モデルの回収を通信教育業者がおこなう。また、Webサーバ上でプログラムを準備することで、通信教育受講者が自身のコンピュータへプログラムをインストールすることなく通信教育を実施することができる。
1 英文テキスト
2 音声合成装置
3 音声記号変換機能
4 音声記号辞書
5 音声記号置換機能
6 音変化規則辞書
7 テキスト音声合成機能
8 音声合成エンジン
10 教材作成者
11 問題(英文テキスト)
12 学習者
14 問題選定機能
15 出題機能
17 正誤判定機能
18 ディクテーション学習支援装置
19 オーサリング機能
22 問題データベース
23 学習者モデル
24 弱点発見機能

Claims (13)

  1. 発音が前後の音の影響を受ける言語の言語テキストを音声合成する音声合成装置において、
    単語の音声記号を保持する音声記号辞書、及びこの音声記号辞書を参照し言語テキスト中の単語を音声記号へ変換する音声記号変換手段と、
    音声が変化する条件と変化後の音声記号を保持する音変化規則辞書と、
    前記音変化規則辞書は少なくとも音声の消失、連結、脱落及び同化の音変化規則を含み、かつ、前記音声記号変換手段により得られた音声記号と前記音変化規則辞書とを参照し、前記音変化規則辞書により保持される音変化が生じる条件に合致する音声記号が含まれていた場合、当該箇所を当該音変化規則辞書の変化後の音声記号の記号列へと置換する音声記号置換手段と、
    前記置換した記号列を音声出力するテキスト音声合成手段と、
    から成る音声合成装置。
  2. 前記音声記号変換手段は、言語テキストを受け取り、単語へと分割し、各単語について、前記音声記号辞書を参照して音声記号へ変換する請求項1に記載の音声合成装置。
  3. 前記テキスト音声合成手段は音声合成エンジンを用いて音声出力し、かつ、前記音声記号置換手段より受け取った音声記号について、前記音声記号辞書の音声記号表現法と音声合成エンジンの音声記号表現法とが異なる場合は、当該箇所を音声合成エンジンの表現法へと置換して音声出力する請求項1に記載の音声合成装置。
  4. さらに、言語テキストの問題を作成するためのオーサリング手段と、
    前記オーサリング手段により作成された問題群を保持する問題データベースと、
    前記問題データベースの中から所定数の問題を選定する問題選定手段と、
    前記問題選定手段により得られた問題の中から1問選択する出題手段と、
    前記出題手段により選択された問題を、学習者により入力された言語テキスト文字列と比較することで正誤判定を行う正誤判定手段とを備え、
    前記出題手段により選択された問題の言語テキストを前記音声合成装置により音声出力することにより、その言語の音変化を学習するディクテーション学習支援装置を構成した請求項1に記載の音声合成装置。
  5. さらに、前記判定結果を保持する学習者モデルに蓄積された履歴より学習者の弱点を発見する弱点発見手段を備え、前記問題選定手段は、学習者の弱点が記録されている場合は、該学習者の弱点を考慮して問題データベースより問題を所定数選択する請求項4に記載の音声合成装置。
  6. 前記学習者モデルには、間違っていた判定結果である場合の音変化規則識別子も合わせて記録し、前記弱点発見手段は誤り頻度が高い音変化規則を同定し、当該音変化規則を学習者の弱点として学習者モデルに記録した請求項5に記載の音声合成装置。
  7. 前記オーサリング手段は、教材作成者より受け取った問題の言語テキストを、前記音声記号変換手段および前記音声記号辞書により音声記号へ変換し、前記音変化規則辞書により保持される音変化が生じる条件に合致する音声記号が含まれていた場合に当該音変化規則識別子、及び当該単語の位置および当該言語テキストを前記問題データベースへ記録する請求項6に記載の音声合成装置。
  8. 発音が前後の音の影響を受ける言語の言語テキストを音声合成する音声合成方法において、
    単語の音声記号を保持する音声記号辞書を参照し言語テキスト中の単語を音声記号へ変換し、
    前記変換された音声記号と、音声が変化する条件と変化後の音声記号を保持する音変化規則辞書を備え、該音変化規則辞書は少なくとも音声の消失、連結、脱落及び同化の音変化規則を含み、かつ、
    前記音変化規則辞書を参照し、前記音変化規則辞書により保持される音変化が生じる条件に合致する音声記号が含まれていた場合、当該箇所を当該音変化規則辞書の変化後の音声記号の記号列へと置換し、
    前記置換した記号列を音声出力する、
    ことから成る音声合成方法。
  9. 言語テキストの問題を作成するためのオーサリング機能と、該オーサリング機能により作成された問題群を保持する問題データベースとを備え、
    前記問題データベースの中から所定数の問題を選定し、かつ、この選定された問題の中から1問を選択し、
    前記選択された問題を音声出力し、
    前記選択された問題を、学習者により入力された言語テキスト文字列と比較することで正誤判定を行ない、
    言語テキストを用いてその言語の音変化を学習するディクテーション学習支援を行う請求項8に記載の音声合成方法。
  10. 前記判定結果を保持する学習者モデルに蓄積された履歴より学習者の弱点を発見し、かつ、学習者の弱点が記録されている場合は、該学習者の弱点を考慮して前記問題データベースより問題を所定数選択する請求項9に記載の音声合成方法。
  11. 発音が前後の音の影響を受ける言語の言語テキストを音声合成する音声合成プログラムにおいて、
    単語の音声記号を保持する音声記号辞書、及びこの音声記号辞書を参照し言語テキスト中の単語を音声記号へ変換する音声記号変換機能と、
    音声が変化する条件と変化後の音声記号を保持する音変化規則辞書、及びこの音変化規則辞書は少なくとも音声の消失、連結、脱落及び同化の音変化規則を含み、かつ、前記音声記号変換機能により得られた音声記号と前記音変化規則辞書とを参照し、前記音変化規則辞書により保持される音変化が生じる条件に合致する音声記号が含まれていた場合、当該箇所を当該音変化規則辞書の変化後の音声記号の記号列へと置換する音声記号置換機能と、
    前記置換した記号列を音声出力するテキスト音声合成機能と、
    から成る各機能をコンピュータに実現させるための音声合成プログラム。
  12. 言語テキストの問題を作成するためのオーサリング機能と、
    前記オーサリング機能により作成された問題群を保持する問題データベースと、
    前記問題データベースの中から所定数の問題を選定する問題選定機能と、
    前記問題選定機能により得られた問題の中から1問選択する出題機能と、
    前記出題機能により選択された問題を学習者により入力された言語テキスト文字列と比較することで正誤判定を行う正誤判定機能と、
    前記正誤判定機能による判定結果を保持する学習者モデルとを備え、
    前記出題機能により選択された問題の言語テキストを前記音声合成プログラムにより音声出力することにより、その言語の音変化を学習するディクテーション学習支援プログラムを構成した請求項11に記載の音声合成プログラム。
  13. さらに、前記判定結果を保持する前記学習者モデルに蓄積された履歴より学習者の弱点を発見する弱点発見機能を備え、前記問題選定機能は、学習者の弱点が記録されている場合は、該学習者の弱点を考慮して問題データベースより問題を所定数選択する請求項12に記載の音声合成プログラム。
JP2010038709A 2010-02-24 2010-02-24 音声合成装置及び方法、並びに音声合成プログラム Expired - Fee Related JP5794602B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010038709A JP5794602B2 (ja) 2010-02-24 2010-02-24 音声合成装置及び方法、並びに音声合成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010038709A JP5794602B2 (ja) 2010-02-24 2010-02-24 音声合成装置及び方法、並びに音声合成プログラム

Publications (2)

Publication Number Publication Date
JP2011175074A JP2011175074A (ja) 2011-09-08
JP5794602B2 true JP5794602B2 (ja) 2015-10-14

Family

ID=44687987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010038709A Expired - Fee Related JP5794602B2 (ja) 2010-02-24 2010-02-24 音声合成装置及び方法、並びに音声合成プログラム

Country Status (1)

Country Link
JP (1) JP5794602B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5955445B1 (ja) * 2015-10-28 2016-07-20 株式会社リクルートホールディングス 言語トレーニングシステム、言語トレーニング端末および言語トレーニングプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6494002B2 (ja) * 2015-03-31 2019-04-03 Necソリューションイノベータ株式会社 要約筆記学習支援システム、要約筆記学習支援装置、要約筆記学習の支援方法、及びプログラム
CN109389969B (zh) * 2018-10-29 2020-05-26 百度在线网络技术(北京)有限公司 语料库优化方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2848604B2 (ja) * 1988-02-03 1999-01-20 シャープ株式会社 音声合成装置
JPH07152392A (ja) * 1993-11-30 1995-06-16 Fujitsu Ltd 音声合成装置
JPH11282494A (ja) * 1998-03-27 1999-10-15 Brother Ind Ltd 音声合成装置および記憶媒体
JP2005172858A (ja) * 2003-12-05 2005-06-30 Nariko Matsuda 言語学習材料提供方法及び言語学習教材
JP2007249023A (ja) * 2006-03-17 2007-09-27 Canon Inc 音声合成装置及び音声合成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5955445B1 (ja) * 2015-10-28 2016-07-20 株式会社リクルートホールディングス 言語トレーニングシステム、言語トレーニング端末および言語トレーニングプログラム
WO2017073607A1 (ja) * 2015-10-28 2017-05-04 株式会社リクルートホールディングス 言語トレーニングシステム、言語トレーニング端末および言語トレーニングプログラム

Also Published As

Publication number Publication date
JP2011175074A (ja) 2011-09-08

Similar Documents

Publication Publication Date Title
EP1049072B1 (en) Graphical user interface and method for modifying pronunciations in text-to-speech and speech recognition systems
US7153139B2 (en) Language learning system and method with a visualized pronunciation suggestion
KR100974002B1 (ko) 영상 재생에 의한 외국어 뉘앙스 학습 시스템
WO2004063902B1 (en) Speech training method with color instruction
JP2001159865A (ja) 対話型語学指導のための方法および装置
CA2640779A1 (en) Computer-based language training work plan creation with specialized english materials
US20070009865A1 (en) Method, system, program and data set which are intended to facilitate language learning thorugh learning and comprehension of phonetics and phonology
JP6389289B2 (ja) 語学教材作成システム
US20100318346A1 (en) Second language pronunciation and spelling
JP5794602B2 (ja) 音声合成装置及び方法、並びに音声合成プログラム
Cheng Unfamiliar accented English negatively affects EFL listening comprehension: It helps to be a more able accent mimic
JP7093099B2 (ja) 音声再生装置及び音楽再生プログラム
Wilkinson et al. Open-Source Consumer-Grade Indic Text To Speech.
JP2016224283A (ja) 外国語の会話訓練システム
JP2000250401A (ja) 言語学習方法、言語学習装置およびプログラムを記録した媒体
JP6684853B2 (ja) 音声学習システム、および音声学習方法
KR100319448B1 (ko) 속도변환을 이용한 대화형 언어 교습 시스템 및 그 방법
JP6155102B2 (ja) 学習支援装置
JP2006139162A (ja) 語学学習装置
JP6712511B2 (ja) 音声学習システム、音声学習方法、及び記憶媒体
JP7338737B2 (ja) 電子機器、その制御方法、および、プログラム
KR102624908B1 (ko) 숫자를 이용한 한국어 발음교육 서비스 제공 시스템
JP7383325B1 (ja) 英語学習システム、英語教授方法及びプログラム
JP2009075526A (ja) 音声合成利用の総合的英語学習システム
Kruitbosch Pronunciation errors made by Dutch secondary school students in English.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131031

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150806

R150 Certificate of patent or registration of utility model

Ref document number: 5794602

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees