JP4924148B2 - 発音学習支援装置及び発音学習支援プログラム - Google Patents

発音学習支援装置及び発音学習支援プログラム Download PDF

Info

Publication number
JP4924148B2
JP4924148B2 JP2007092797A JP2007092797A JP4924148B2 JP 4924148 B2 JP4924148 B2 JP 4924148B2 JP 2007092797 A JP2007092797 A JP 2007092797A JP 2007092797 A JP2007092797 A JP 2007092797A JP 4924148 B2 JP4924148 B2 JP 4924148B2
Authority
JP
Japan
Prior art keywords
english
stress
data
intonation
correction coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007092797A
Other languages
English (en)
Other versions
JP2008250090A (ja
Inventor
利久 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2007092797A priority Critical patent/JP4924148B2/ja
Publication of JP2008250090A publication Critical patent/JP2008250090A/ja
Application granted granted Critical
Publication of JP4924148B2 publication Critical patent/JP4924148B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Description

本発明は、発音の学習を支援する発音学習支援装置及び発音学習支援プログラムに関する。
従来、音声出力の可能な電子辞書などの発音学習支援装置では、テキストから合成された音声合成データに基づいて当該テキストを音声出力することにより、多様なテキストについて発音の学習を行えるようになっている。
このような発音学習支援装置に関して、近年、日本語テキストから標準的な発音による音声合成データを生成した後、その音声合成データを指定の方言(例えば大阪弁)の発音による音声合成データに変換して音声出力する技術が開発されている(例えば、特許文献1参照)。
特開2002−304186号公報
しかしながら、英語では日本語と異なり、地域(国)によってイントネーション(上がり下がり)やストレス(強弱)等が変化するため、上記特許文献1の技術を単純に適用しても、英語テキストを各地域(国)の発音で音声出力させることはできない。
本発明の課題は、各地域の発音を学習することができる発音学習支援装置及び発音学習支援プログラムを提供することである。
請求項1記載の発明は、発音学習支援装置において、
英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて前記テキストから音声合成データを生成する標準ストレス音声合成データ生成手段と、
地域英語の種類ごとに、標準英語用の前記ストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、
前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定手段と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正手段と、
前記ストレスデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで音声出力する音声出力手段と、
を備えることを特徴とする。
請求項2記載の発明は、請求項1記載の発音学習支援装置において、
前記ストレス補正係数記憶手段は、
前記ストレス補正係数として、母音の音素の前記ストレスデータに対するストレス母音補正係数と、子音の音素の前記ストレスデータに対するストレス子音補正係数と、を記憶し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータのうち、母音の音素の前記ストレスデータを前記ストレス母音補正係数で補正する母音ストレスデータ補正手段と、
前記音声合成データにおける各ストレスデータのうち、子音の音素の前記ストレスデータを前記ストレス子音補正係数で補正する子音ストレスデータ補正手段と、
を有することを特徴とする。
請求項3記載の発明は、請求項1または2記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各音素に、当該音素の標準英語用のイントネーションデータを対応付けて前記音声合成データを生成する標準イントネーション音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、標準英語用の前記イントネーションデータに対するイントネーション補正係数を記憶するイントネーション補正係数記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、前記学習対象英語に対応する前記イントネーション補正係数で補正するイントネーションデータ補正手段を有し、
前記音声出力手段は、
前記イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のイントネーションで音声出力することを特徴とする。
請求項4記載の発明は、請求項3記載の発音学習支援装置において、
ユーザ操作に基づいて、前記学習対象英語の訛りレベルを設定する訛りレベル設定手段と、
各地域英語の種類と、当該地域英語の基となった基準地域英語の種類とを対応付けて記憶する基準地域英語記憶手段と、
を備え、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータを、下記の式(1)によって算出される前記ストレス補正係数A2で補正する訛りレベル対応ストレスデータ補正手段を有し、
前記イントネーションデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、下記の式(2)によって算出される前記イントネーション補正係数B2で補正する訛りレベル対応イントネーションデータ補正手段を有し、
前記音声出力手段は、
前記訛りレベル対応ストレスデータ補正手段及び前記訛りレベル対応イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記訛りレベル設定手段により設定された訛りレベルに対応する前記学習対象英語のストレス及びイントネーションで音声出力することを特徴とする。
2=A1×L/100+A0×(100−L)/100 …(1)
2=B1×L/100+B0×(100−L)/100 …(2)
(但し、式(1)中、「A1」は前記学習対象英語に対応する前記ストレス補正係数、「A0」は前記基準地域英語に対応する前記ストレス補正係数、「L」は前記訛りレベル設定手段により設定された訛りレベル(%)である。また、式(2)中、「B1」は前記学習対象英語に対応する前記イントネーション補正係数、「B0」は前記基準地域英語に対応する前記イントネーション補正係数である。)
請求項5記載の発明は、請求項1〜4の何れか一項に記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各単語に、当該単語の標準英語用の発音記号を対応付けて前記音声合成データを生成する標準発音記号音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、所定の英単語と、この所定の英単語についての当該地域英語特有の発音の発音記号と、を対応付けて記憶する補正発音記号記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける前記所定の英単語の発音記号を、前記学習対象英語特有の発音の発音記号に補正する発音記号補正手段を有し、
前記音声出力手段は、
前記発音記号補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の前記所定の単語を、前記学習対象英語特有の発音記号による発音で音声出力することを特徴とする。
請求項6記載の発明は、請求項1〜5の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
ユーザ操作に基づいて前記学習対象英語を指定することを特徴とする。
請求項7記載の発明は、請求項1〜5の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
前記学習対象英語をランダムに指定することを特徴とする。
請求項8記載の発明は、請求項1〜7の何れか一項に記載の発音学習支援装置において、
ユーザから文字列の入力操作を受ける文字列入力手段と、
前記音声出力手段により音声出力された前記テキストと、前記文字列入力手段により入力された文字列とを比較することでユーザに対するディクテーションテストの正誤を判定するとともに、当該判定結果をユーザに報知する正誤判定手段と、
を備えることを特徴とする。
請求項9記載の発明は、地域英語の種類ごとに英語の各音素の標準英語用のストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、音声出力部とを有する電子機器のコンピュータを制御して音声出力制御を行うための発音学習支援プログラムであって、前記コンピュータに、
英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて、前記テキストから音声合成データを生成する標準ストレス音声合成データ生成機能と、
前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定機能と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正機能と、
前記ストレスデータ補正機能による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで前記音声出力部に音声出力する制御を行なう音声出力機能と、
を実現させることを特徴とする。
本発明によれば、英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータが対応付けられて当該テキストから音声合成データが生成され、学習対象英語に対応するストレス補正係数で各ストレスデータが補正された後の音声合成データに基づいて、テキスト中の各音素が学習対象英語のストレスで音声出力されるので、各地域の正確な発音(ストレス)を学習することができる。
以下、図面を参照して、本発明に係る発音学習支援装置を適用した電子辞書の実施形態について説明する。
[外観構成]
図1(a)は本実施形態における電子辞書1の斜視外観図である。
この図に示すように、電子辞書1は、ディスプレイ10、スピーカ11及びキー群13を備えている。
ディスプレイ10は、ユーザによるキー群13の操作に応じた文字や符号等、各種データを表示する部分であり、LCD(Liquid Crystal Display)やELD(Electronic Luminescent Display)等によって構成されている。
スピーカ11は、ユーザによるキー群13の操作に応じた語句の音声を出力する部分である。
キー群13は、図1(b)に示すように、ユーザが電子辞書1を操作するための各種キーを有している。具体的には、キー群13は、訳/決定キー13bと、文字キー13cと、辞書選択キー13dと、カーソルキー13eと、シフトキー13fと、戻るキー13gと、音声出力キー13hと、発音学習キー13j等とを有している。
訳/決定キー13bは、検索の実行や、見出語の決定等に使用されるキーである。文字キー13cは、ユーザによる文字の入力等に使用されるキーであり、本実施の形態においては“A”〜“Z”キーを備えている。辞書選択キー13dは、後述の辞書データベース85a〜85c(図2参照)の選択に使用されるキーである。
カーソルキー13eは、ディスプレイ10内で反転表示等により示されるカーソルの移動に使用されるキーである。シフトキー13fは、日本語の語句を検索対象に設定するとき等に使用されるキーである。戻るキー13gは、前回表示した画面に戻るとき等に使用されるキーである。
音声出力キー13hは、スピーカ11にテキストを音声出力させるとき等に使用されるキーである。発音学習キー13jは、後述の地域訛り音声学習支援処理(図6参照)を実行させるとき等に使用されるキーである。
[内部構成]
図2は、電子辞書1の概略構成を示すブロック図である。
この図に示すように、電子辞書1は、表示部2、音声出力部3、入力部5、CPU6、フラッシュROM8及びRAM7を備えている。
表示部2は、上述のディスプレイ10を備えており、CPU6から入力される表示信号に基づいて各種情報をディスプレイ10に表示するようになっている。
音声出力部3は、上述のスピーカ11を備えており、CPU6から入力される音声出力信号に基づいてスピーカ11から音声出力するようになっている。
入力部5は、上述のキー群13を備えており、押下されたキーに対応する信号をCPU6に出力するようになっている。
CPU6は、入力される指示に応じて所定のプログラムに基づいた処理を実行し、各機能部への指示やデータの転送等を行い、電子辞書1を統括的に制御するようになっている。具体的には、CPU6は、入力部5から入力される操作信号等に応じてフラッシュROM8に格納された各種プログラムを読み出し、当該プログラムに従って処理を実行する。そして、CPU6は、処理結果をRAM7に保存するとともに、当該処理結果を表示・音声出力するための信号を表示部2や音声出力部3に適宜出力して、対応した内容を表示・音声出力させる。
フラッシュROM8は、電子辞書1の各種機能を実現するためのプログラムやデータを記憶するメモリである。本実施の形態においては、フラッシュROM8は、辞書検索プログラム81と、音声合成プログラム82と、本発明に係る発音学習支援プログラム84と、辞書データベース群85と、地域音声パラメータ記憶テーブル87と、発音記号補正テーブル群86等とを記憶している。
辞書検索プログラム81は、従来より公知の辞書検索処理、即ち、ユーザ操作で指定された指定見出語に対応する説明情報を検索して表示する処理をCPU6に実行させるためのプログラムである。
音声合成プログラム82は、標準英語(standard English)の発音で音声出力される音声合成データをCPU6に生成させるプログラムであり、本実施の形態においては、図3(a)に示すように、テキスト中の各単語に発音記号及び音素を対応付けるとともに、各音素にイントネーションデータと、母音及び子音のストレスデータとを対応付けて音声合成データを生成させるようになっている。このような音声合成プログラム82としては、従来より公知のプログラムを用いることができる。
なお、本実施の形態においては、世界各国で標準的に用いられている英語が標準英語として用いられており、この標準英語はアメリカ英語及びイギリス英語とは異なる英語となっている。また、発音記号として、国際音声記号(IPA(International Phonetic Alphabet))が用いられている。また、音声合成データにおけるイントネーションデータやストレスデータの数値は、大小によってイントネーション(上がり下がり)やストレス(強弱)の程度を示している。更に、図3(a)等の各ストレスデータの後に付記された「(母)」,「(子)」は、母音または子音の音素のストレスデータであることを示している。
発音学習支援プログラム84は、後述の地域訛り音声学習支援処理(図7,図8参照)をCPU6に実行させるためのプログラムである。
辞書データベース群85は、少なくとも1種類の辞書データベースを有しており、本実施の形態においては、アメリカ英語を学習するための英和辞書「リー○ーズ」,「ジー○アス」の辞書データベース85a,85bや、イギリス英語を学習するための英英辞書「オク○フォード」の辞書データベース85c等を有している。
これら辞書データベース85a〜85cには、例えば図4に1例を示すように、複数の見出語と、この見出語の発音記号と、見出語を詳細に説明する説明情報とが対応付けされて格納されている。ここで、アメリカ英語についての辞書データベース85a,85bには、アメリカ英語での模範的な発音の発音記号が格納されており、イギリス英語についての辞書データベース85cには、イギリス英語での模範的な発音の発音記号が格納されている。
地域音声パラメータ記憶テーブル87には、図5に示すように、地域(国)特有の英語、つまり地域英語ごとに地域音声パラメータ「P」が記憶されている。
ここで、地域音声パラメータ「P」とは、標準英語の発音を基準とした場合の発音傾向を表すパラメータであり、標準英語の発音に対する補正係数となっている。この地域音声パラメータ「P」として、本実施の形態においては、ストレス補正係数「A」及びイントネーション補正係数「B」が用いられており、更にストレス補正係数「A」として、ストレス子音補正係数「X」及びストレス母音補正係数「Y」が用いられている。
このうち、ストレス補正係数「A」とは、標準英語の発音のストレスデータ(以下、標準ストレスデータとする)に対する補正係数であり、ストレス子音補正係数「X」,ストレス母音補正係数「Y」とは、標準英語の発音の子音ストレスデータ(以下、標準子音ストレスデータとする),母音ストレスデータ(以下、標準母音ストレスデータとする)に対する補正係数である。また、イントネーション補正係数「B」とは、標準英語の発音のイントネーションデータ(以下、標準イントネーションデータとする)に対する補正係数である。
また、本実施の形態においては、地域英語として「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」及び「フィリピン英語」等が用いられており、これらの地域英語は基となった基準英語がイギリス英語であるか、アメリカ英語であるかによってイギリス系またはアメリカ系に分類され、各基準英語に対応付けされた状態となっている。具体的には、「イギリス英語」、「オーストラリア英語」及び「インド英語」はイギリス系に分類されており、標準英語の発音と比較して発音傾向がイギリス英語に近くなっている。また、「アメリカ英語」、「カナダ英語」及び「フィリピン英語」はアメリカ系に分類されており、標準英語の発音と比較して発音傾向がアメリカ英語に近くなっている。なお、これらの地域英語のうち、「オーストラリア英語」、「インド英語」、「カナダ英語」及び「フィリピン英語」については、各単語の発音が体系的に確定していないものの、所定の単語(以下、特有発音単語とする)については、基準英語(イギリス英語またはアメリカ英語)での模範的な発音と比較して規則的に発音記号が変化することが知られている。
発音記号補正テーブル群86は、「オーストラリア英語」、「インド英語」、「カナダ英語」及び「フィリピン英語」について発音記号補正テーブル86a〜86dを有している。
これら発音記号補正テーブル86a〜86dには、対応する地域英語における前記特有発音単語について、地域英語に対応する基準英語の種類と、当該基準英語での模範的な発音の発音記号と、地域英語に特有の発音の発音記号とが対応付けられて記憶されている。例えば、オーストラリア英語の発音記号補正テーブル86aには、図6に示すように、オーストラリア英語における各特有発音単語について、イギリス英語(基準英語)での模範的な発音の発音記号と、オーストラリア英語に特有の発音の発音記号等とが対応付けられて記憶されている。
また、上述の図2に示すように、RAM7は、CPU6が実行する各種プログラムや、これらプログラムの実行に係るデータ等を一時的に保持するメモリであり、本実施の形態においては、学習対象テキスト記憶領域71と、地域・訛りレベル記憶領域72と、地域音声パラメータ展開領域73と、標準英語音声データ記憶領域74と、学習対象英語音声データ記憶領域75とを備えている。
学習対象テキスト記憶領域71には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象とされるテキスト(以下、学習対象テキストとする)が記憶されるようになっている。
地域・訛りレベル記憶領域72には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象とされる地域英語(以下、学習対象英語とする)の種類と、当該学習対象英語の訛りレベル(%)とが記憶されるようになっている。
地域音声パラメータ展開領域73には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象英語の地域音声パラメータ「P」が記憶されるようになっている。
標準英語音声データ記憶領域74には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象テキストを標準英語の発音で音声出力部3に音声出力させる場合の音声合成データが記憶されるようになっている。
学習対象英語音声データ記憶領域75には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象テキストを学習対象英語の発音で音声出力部3に音声出力させる場合の音声合成データが記憶されるようになっている。
[地域訛り音声学習支援処理]
続いて、電子辞書1の動作について説明する。図7,図8は、CPU6がフラッシュROM8から発音学習支援プログラム84を読み出して実行する地域訛り音声学習支援処理の動作を説明するためのフローチャートである。
まず図7に示すように、発音学習キー13jが操作されると、CPU6は、ユーザによって学習対象テキストのランダム指定が選択されるか否かを判定する(ステップS1)。
このステップS1においてランダム指定が選択されたと判定した場合(ステップS1;Yes)には、CPU6は、フラッシュROM8内の英語コンテンツ、例えば辞書データベース85の中からランダムに英語のテキストを読み出し、学習対象テキストとして学習対象テキスト記憶領域71に記憶させた後(ステップS2)、後述のステップS4の処理に移行する。
また、ステップS1においてランダム指定が選択されないと判定した場合(ステップS1;No)には、CPU6は、ユーザ操作により学習対象テキストとして指定された英語のテキストを学習対象テキスト記憶領域71に記憶させる(ステップS3)。
次に、CPU6は、学習対象英語の種類及び訛りレベルがユーザによって指定されたか否かを判定し(ステップS4)、指定されないと判定した場合(ステップS4;No)には、学習対象英語の種類と訛りレベルとをランダムに指定して地域・訛りレベル記憶領域72に記憶させる(ステップS5)。
また、ステップS4において学習対象英語の種類及び訛りレベルが指定されたと判定した場合(ステップS4;Yes)には、CPU6は、当該学習対象英語の種類と、訛りレベルとを地域・訛りレベル記憶領域72に記憶させ(ステップS6)、後述のステップS7の処理に移行する。
次に、CPU6は、学習対象英語用の音声合成データを生成する地域訛り対応音声合成処理を行う(ステップS7)。
より詳細には、図8に示すように、まずCPU6は、音声合成プログラム82によって学習対象テキストから標準英語用の音声合成データ(発音記号、音素、標準ストレスデータ及び標準イントネーションデータ)を生成し、先頭から順に標準英語音声データ記憶領域74及び学習対象英語音声データ記憶領域75に記憶させる(ステップS71)。具体的には、例えば図3(a)に示すように、学習対象テキスト記憶領域71に学習対象テキスト「I can do it today.」が記憶されている場合には、当該学習対象テキストについての音声合成データが標準英語音声データ記憶領域74及び学習対象英語音声データ記憶領域75に記憶される。
次に、CPU6は、地域・訛りレベル記憶領域72内の訛りレベルが100%であるか否かを判定し(ステップS72)、100%であると判定した場合(ステップS72;Yes)には、地域音声パラメータ記憶テーブル87から学習対象英語の地域音声パラメータ「P」を読み出し、そのまま地域音声パラメータ展開領域73に記憶させた後(ステップS75)、後述のステップS76の処理に移行する。
これにより、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ100%に設定された場合には、図3(b)〜(d)の右側、図9(a)〜(c)の右側に示すように、設定された学習対象英語及び訛りレベルに対応する地域音声パラメータ「P」が地域音声パラメータ展開領域73に記憶されることとなる。
また、ステップS72において訛りレベルが100%ではないと判定した場合(ステップS72;No)には、CPU6は、地域音声パラメータ記憶テーブル87内の分類に基づいて学習対象英語の基準英語(イギリス英語またはアメリカ英語)を検出する(ステップS73)。
次に、CPU6は、地域音声パラメータ記憶テーブル87から学習対象英語及び基準英語の地域音声パラメータ「P」(後述のP1,P0)を読み出した後、訛りレベルに対応する学習対象英語の地域音声パラメータ「P」(後述のP2)を以下の式(3)に基づいて算出し、地域音声パラメータ展開領域73に記憶させる(ステップS74)。
2=P1×L/100+P0×(100−L)/100 …(3)
但し、式(1)中、「P1」,「P2」は補正前後での学習対象英語の地域音声パラメータ、「P0」は基準英語の地域音声パラメータ、「L」は訛りレベル(%)である。また、この式に基づいて地域音声パラメータ「P2」を算出するとは、具体的には、以下の式(1),(2)を計算することによりストレス補正係数「A2」(「X2」,「Y2」)及びイントネーション補正係数「B2」を算出することを意味する。
2=A1×L/100+A0×(100−L)/100 …(1)
2=B1×L/100+B0×(100−L)/100 …(2)
これにより、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが0%,20%,40%,60%,80%に設定された場合には、図10や、図11(b)〜(c)の右側,図12(a)〜(d)の右側に示すように、設定された学習対象英語及び訛りレベルに対応する地域音声パラメータ「P」が地域音声パラメータ展開領域73に記憶されることとなる。なお、これらの図では、参考として訛りレベルが100%の場合の地域音声パラメータ「P」も図示している。
次に、CPU6は、学習対象英語音声データ記憶領域75内で各音素に対応付けられた標準イントネーションデータそれぞれに対して地域音声パラメータ展開領域73内のイントネーション補正係数「A」を乗算した後、つまり、各標準イントネーションデータをイントネーション補正係数「A」で補正した後、各乗算結果に基づいて当該学習対象英語音声データ記憶領域75内の情報を更新する(ステップS76)。
これにより、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ100%に設定された場合には、図3(a)のイントネーションデータが、図3(b)〜(d)や図9(a)〜(c)のイントネーションデータに更新されることとなる。また、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが0%,20%,40%,60%,80%,100%に設定された場合には、図11(a)のイントネーションデータが、図11(b)〜(c)や図12(a)〜(d)のイントネーションデータに更新されることとなる。
次に、CPU6は、学習対象英語音声データ記憶領域75内で各音素に対応付けられた標準ストレスデータのうち、先頭の標準ストレスデータを読み出した後(ステップS77)、この標準ストレスデータと対応する音素が母音であるか否かを判定する(ステップS78)。
このステップS78において音素が母音であると判定した場合(ステップS78;Yes)には、CPU6は、読み出した標準ストレスデータ(標準母音ストレスデータ)に対して地域音声パラメータ展開領域73内のストレス母音補正係数「Y」を乗算した後、つまり、各標準母音ストレスデータをストレス母音補正係数「Y」で補正した後、この乗算結果に基づいて学習対象英語音声データ記憶領域75内の情報を更新し(ステップS79)、後述のステップS81に移行する。
一方、ステップS78において音素が母音でない、つまり子音であると判定した場合(ステップS78;No)には、CPU6は、読み出した標準ストレスデータ(標準子音ストレスデータ)に対して地域音声パラメータ展開領域73内のストレス子音補正係数「X」を乗算した後、つまり、各標準子音ストレスデータをストレス子音補正係数「X」で補正した後、この乗算結果に基づいて学習対象英語音声データ記憶領域75内の情報を更新する(ステップS80)。
これらステップS79,S80により、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ100%に設定された場合には、図3(a)のストレスデータが、図3(b)〜(d)や図9(a)〜(c)のストレスデータに更新されることとなる。また、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが0%,20%,40%,60%,80%,100%に設定された場合には、図11(a)のストレスデータが、図11(b)〜(c)や図12(a)〜(d)のストレスデータに更新されることとなる。
次に、CPU6は、読み出したストレスデータと対応する音素が学習対象テキストの最後の音素であるか否かを判定し(ステップS81)、最後の音素ではないと判定した場合(ステップS81;No)には、学習対象英語音声データ記憶領域75内における標準ストレスデータの格納順序に従って、次の標準ストレスデータを読み出し(ステップS82)、上述のステップS78に移行する。
また、ステップS81において最後の音素であると判定した場合(ステップS81;Yes)には、CPU6は、発音記号補正テーブル86a〜86d内の情報に基づいて、学習対象テキストにおける各単語のうち学習対象英語の特有発音単語について、学習対象英語音声データ記憶領域75内の発音記号及び音素を、学習対象単語特有の発音の発音記号に補正し(ステップS83)、地域訛り対応音声合成処理を終了する。
これにより、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ100%に設定された場合には、図3(a)の発音記号及び音素が、図3(b)〜(d)や図9(a)〜(c)の発音記号及び音素に更新されることとなる。また、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが0%,20%,40%,60%,80%,100%に設定された場合には、図11(a)の発音記号及び音素が、図11(b)〜(c)や図12(a)〜(d)の発音記号及び音素に更新されることとなる。
次に、図7に示すように、CPU6は、ユーザによってディクテーションテストの実行が選択されるか否かを判定し(ステップS9)、選択されないと判定した場合(ステップS9;No)には、学習対象テキストを表示部2に表示させた後(ステップS10)、学習対象英語音声データ記憶領域75内の音声合成データに基づいて学習対象英語の発音(ストレス、イントネーション、音)で学習対象テキストを音声出力部3に音声出力させ(ステップS11)、地域訛り音声学習支援処理を終了する。
また、ステップS9においてディクテーションテストの実行が選択されたと判定した場合(ステップS9;Yes)には、CPU6は、学習対象英語音声データ記憶領域75内の音声合成データに基づいて学習対象英語の発音(ストレス、イントネーション、音)で学習対象テキストを音声出力部3に音声出力させた後(ステップS13)、入力部5を介して当該学習対象テキストの内容をユーザに文字入力させる(ステップS14)。
そして、CPU6は、ユーザによる入力文字列の内容と学習対象テキストの内容とを比較することによって、ユーザに対するディクテーションテストの正誤を判定し(ステップS15)、正解である(内容が一致する)と判定した場合(ステップS15;Yes)には、正解の旨を示すメッセージを表示部2に表示させ(ステップS16)、地域訛り対応音声合成処理を終了する。また、ステップS15において不正解である(内容が一致しない)と判定した場合(ステップS15;No)には、CPU6は、不正解の旨を示すメッセージと、正解内容、つまり学習対象テキストの内容とを表示部2に表示させ(ステップS17)、地域訛り対応音声合成処理を終了する。
以上の電子辞書1によれば、図8のステップS71,S77〜S82や、図3,図9等に示したように、英語のテキスト中の各音素に当該音素の標準ストレスデータが対応付けられて当該テキストから音声合成データが生成された後、学習対象英語に対応するストレス補正係数「A」で音声合成データ中の各標準ストレスデータが補正され、この補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語のストレスで音声出力されるので、各地域の正確な発音(ストレス)を学習することができる。
また、図8のステップS78〜S82や、図3,図9等に示したように、学習対象英語に対応するストレス母音補正係数「Y」,ストレス子音補正係数「X」で音声合成データ中の母音の音素,子音の音素の各標準ストレスデータが補正され、この補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語のストレスで音声出力されるので、各地域のより正確な発音(ストレス)を学習することができる。
また、図8のステップS71,S76や、図3,図9等に示したように、テキスト中の各音素に当該音素の標準イントネーションデータが対応付けられて音声合成データが生成された後、学習対象英語に対応するイントネーション補正係数「B」で音声合成データ中の各イントネーションデータが補正され、この補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語のイントネーションで音声出力されるので、各地域の正確な発音(イントネーション)を学習することができる。
また、図8のステップS73,図10〜図12等に示したように、音声合成データにおける各標準ストレスデータがストレス補正係数A2で、各標準イントネーションデータがイントネーション補正係数B2でそれぞれ補正され、これらの補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語の訛りレベルに対応するストレス及びイントネーションで音声出力されるので、訛りレベルに対応した各地域の正確な発音(ストレス,イントネーション)を学習することができる。
また、図8のステップS83や、図3,図9等に示したように、テキスト中の各単語に当該単語の標準英語用の発音記号が対応付けられて音声合成データが生成された後、学習対象英語における特有発音単語の発音記号が学習対象英語特有の発音の発音記号に補正され、この補正後の音声合成データに基づいてテキスト中の特有発音単語が特有の発音で音声出力されるので、各地域のより正確な発音(音)を学習することができる。
また、図7のステップS3に示したように、ユーザ操作に基づいて学習対象英語が指定されるので、所望の地域の英語を学習対象英語とすることにより、当該地域の正確な発音を学習することができる。
また、図7のステップS2に示したように、学習対象英語がランダムに指定されるので、多様な地域英語について発音の学習効果を高めることができる。
また、図7のステップS13〜S17に示したように、ユーザに対するディクテーションテストの正誤が判定され、その判定結果がユーザに表示されるので、発音の学習効果を高めることができる。
なお、本発明を適用可能な実施形態は、上述した実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で適宜変更可能である。
例えば、本発明に係る発音学習支援装置を電子辞書1として説明したが、本発明が適用可能なものは、このような製品に限定されず、携帯電話やパソコンなどの電子機器全般に適用可能である。また、本発明に係る発音学習支援プログラムは、これらの電子機器に対して着脱可能なメモリカード、CD等に記憶されることとしてもよい。
本発明に係る発音学習支援装置を適用した電子辞書の概略構成を示す図であり、(a)は概観図であり、(b)は部分平面図である。 本発明に係る発音学習支援装置を適用した電子辞書の概略構成を示すブロック図である。 標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。 辞書データベースのデータ構造を示す図である。 地域音声パラメータ記憶テーブルのデータ構造を示す図である。 発音記号補正テーブルのデータ構造を示す図である。 地域訛り音声学習支援処理を示すフローチャートである。 地域訛り対応音声合成処理を示すフローチャートである。 標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。 訛りレベルの設定値ごとの地域音声パラメータを示す図である。 標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。 標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。
符号の説明
1 電子辞書(発音学習支援装置)
3 音声出力部(音声出力手段)
5 入力部(訛りレベル設定手段、文字列入力手段)
6 CPU(標準ストレス音声合成データ生成手段、学習対象英語指定手段、
ストレスデータ補正手段、母音ストレスデータ補正手段、
子音ストレスデータ補正手段、
標準イントネーション音声合成データ生成手段、
イントネーションデータ補正手段、
訛りレベル対応ストレスデータ補正手段、
訛りレベル対応イントネーションデータ補正手段、
標準発音記号音声合成データ生成手段、発音記号補正手段、
正誤判定手段)
84 発音学習支援プログラム
86a〜86d 発音記号補正テーブル(補正発音記号記憶手段)
87 地域音声パラメータ記憶テーブル(ストレス補正係数記憶手段、
イントネーション補正係数記憶手段、
基準地域英語記憶手段)

Claims (9)

  1. 英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて前記テキストから音声合成データを生成する標準ストレス音声合成データ生成手段と、
    地域英語の種類ごとに、標準英語用の前記ストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、
    前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定手段と、
    前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正手段と、
    前記ストレスデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで音声出力する音声出力手段と、
    を備えることを特徴とする発音学習支援装置。
  2. 請求項1記載の発音学習支援装置において、
    前記ストレス補正係数記憶手段は、
    前記ストレス補正係数として、母音の音素の前記ストレスデータに対するストレス母音補正係数と、子音の音素の前記ストレスデータに対するストレス子音補正係数と、を記憶し、
    前記ストレスデータ補正手段は、
    前記音声合成データにおける各ストレスデータのうち、母音の音素の前記ストレスデータを前記ストレス母音補正係数で補正する母音ストレスデータ補正手段と、
    前記音声合成データにおける各ストレスデータのうち、子音の音素の前記ストレスデータを前記ストレス子音補正係数で補正する子音ストレスデータ補正手段と、
    を有することを特徴とする発音学習支援装置。
  3. 請求項1または2記載の発音学習支援装置において、
    前記標準ストレス音声合成データ生成手段は、
    前記テキスト中の各音素に、当該音素の標準英語用のイントネーションデータを対応付けて前記音声合成データを生成する標準イントネーション音声合成データ生成手段を有し、
    前記ストレス補正係数記憶手段は、
    地域英語の種類ごとに、標準英語用の前記イントネーションデータに対するイントネーション補正係数を記憶するイントネーション補正係数記憶手段を有し、
    前記ストレスデータ補正手段は、
    前記音声合成データにおける各イントネーションデータを、前記学習対象英語に対応する前記イントネーション補正係数で補正するイントネーションデータ補正手段を有し、
    前記音声出力手段は、
    前記イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のイントネーションで音声出力することを特徴とする発音学習支援装置。
  4. 請求項3記載の発音学習支援装置において、
    ユーザ操作に基づいて、前記学習対象英語の訛りレベルを設定する訛りレベル設定手段と、
    各地域英語の種類と、当該地域英語の基となった基準地域英語の種類とを対応付けて記憶する基準地域英語記憶手段と、
    を備え、
    前記ストレスデータ補正手段は、
    前記音声合成データにおける各ストレスデータを、下記の式(1)によって算出される前記ストレス補正係数A2で補正する訛りレベル対応ストレスデータ補正手段を有し、
    前記イントネーションデータ補正手段は、
    前記音声合成データにおける各イントネーションデータを、下記の式(2)によって算出される前記イントネーション補正係数B2で補正する訛りレベル対応イントネーションデータ補正手段を有し、
    前記音声出力手段は、
    前記訛りレベル対応ストレスデータ補正手段及び前記訛りレベル対応イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記訛りレベル設定手段により設定された訛りレベルに対応する前記学習対象英語のストレス及びイントネーションで音声出力すること を特徴とする発音学習支援装置。
    A2=A1×L/100+A0×(100−L)/100 …(1)
    B2=B1×L/100+B0×(100−L)/100 …(2)
    (但し、式(1)中、「A1」は前記学習対象英語に対応する前記ストレス補正係数、「A0」は前記基準地域英語に対応する前記ストレス補正係数、「L」は前記訛りレベル設定手段により設定された訛りレベル(%)である。また、式(2)中、「B1」は前記学習対象英語に対応する前記イントネーション補正係数、「B0」は前記基準地域英語に対応する前記イントネーション補正係数である。)
  5. 請求項1〜4の何れか一項に記載の発音学習支援装置において、
    前記標準ストレス音声合成データ生成手段は、
    前記テキスト中の各単語に、当該単語の標準英語用の発音記号を対応付けて前記音声合成データを生成する標準発音記号音声合成データ生成手段を有し、
    前記ストレス補正係数記憶手段は、
    地域英語の種類ごとに、所定の英単語と、この所定の英単語についての当該地域英語特有の発音の発音記号と、を対応付けて記憶する補正発音記号記憶手段を有し、
    前記ストレスデータ補正手段は、
    前記音声合成データにおける前記所定の英単語の発音記号を、前記学習対象英語特有の発音の発音記号に補正する発音記号補正手段を有し、
    前記音声出力手段は、
    前記発音記号補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の前記所定の単語を、前記学習対象英語特有の発音記号による発音で音声出力することを特徴とする発音学習支援装置。
  6. 請求項1〜5の何れか一項に記載の発音学習支援装置において、
    前記学習対象英語指定手段は、
    ユーザ操作に基づいて前記学習対象英語を指定することを特徴とする発音学習支援装置。
  7. 請求項1〜5の何れか一項に記載の発音学習支援装置において、
    前記学習対象英語指定手段は、
    前記学習対象英語をランダムに指定することを特徴とする発音学習支援装置。
  8. 請求項1〜7の何れか一項に記載の発音学習支援装置において、
    ユーザから文字列の入力操作を受ける文字列入力手段と、
    前記音声出力手段により音声出力された前記テキストと、前記文字列入力手段により入力された文字列とを比較することでユーザに対するディクテーションテストの正誤を判定するとともに、当該判定結果をユーザに報知する正誤判定手段と、
    を備えることを特徴とする発音学習支援装置。
  9. 地域英語の種類ごとに英語の各音素の標準英語用のストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、音声出力部とを有する電子機器のコンピュータを制御して音声出力制御を行うための発音学習支援プログラムであって、前記コンピュータに、
    英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて、前記テキストから音声合成データを生成する標準ストレス音声合成データ生成機能と、
    前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定機能と、
    前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正機能と、
    前記ストレスデータ補正機能による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで前記音声出力部に音声出力する制御を行なう音声出力機能と、
    を実現させることを特徴とする発音学習支援プログラム。
JP2007092797A 2007-03-30 2007-03-30 発音学習支援装置及び発音学習支援プログラム Active JP4924148B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007092797A JP4924148B2 (ja) 2007-03-30 2007-03-30 発音学習支援装置及び発音学習支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007092797A JP4924148B2 (ja) 2007-03-30 2007-03-30 発音学習支援装置及び発音学習支援プログラム

Publications (2)

Publication Number Publication Date
JP2008250090A JP2008250090A (ja) 2008-10-16
JP4924148B2 true JP4924148B2 (ja) 2012-04-25

Family

ID=39975090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007092797A Active JP4924148B2 (ja) 2007-03-30 2007-03-30 発音学習支援装置及び発音学習支援プログラム

Country Status (1)

Country Link
JP (1) JP4924148B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102236847B1 (ko) * 2019-01-30 2021-04-06 주식회사 이볼케이노 단어의 컨셉 메이커를 이용한 언어 학습 시스템
CN115881087A (zh) 2021-09-27 2023-03-31 纳宝株式会社 用于按口音采集发音的提供音频参与服务的方法、装置及计算机程序

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09244682A (ja) * 1996-03-08 1997-09-19 Hitachi Ltd 音声認識・音声合成装置
JP2000112488A (ja) * 1998-09-30 2000-04-21 Fujitsu General Ltd 音声変換装置
JP2007071904A (ja) * 2005-09-02 2007-03-22 Yamaha Corp 地域別発音学習支援装置

Also Published As

Publication number Publication date
JP2008250090A (ja) 2008-10-16

Similar Documents

Publication Publication Date Title
JP2015036788A (ja) 外国語の発音学習装置
JP2010198241A (ja) 中国語入力装置およびプログラム
JP5119671B2 (ja) 音声出力装置及び音声出力プログラム
JP5079718B2 (ja) 外国語学習支援システム、及びプログラム
JP2011076384A (ja) 情報出力装置及び情報出力プログラム
JP4924148B2 (ja) 発音学習支援装置及び発音学習支援プログラム
JP6641680B2 (ja) 音声出力装置、音声出力プログラムおよび音声出力方法
JP5088109B2 (ja) 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置
JP4840051B2 (ja) 音声学習支援装置及び音声学習支援プログラム
JP4840052B2 (ja) 発音学習支援装置及び発音学習支援プログラム
JP4749437B2 (ja) 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム
JP5975033B2 (ja) 音声合成装置、音声合成方法および音声合成プログラム
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP2007086404A (ja) 音声合成装置
JP5125404B2 (ja) 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置
JP4749438B2 (ja) 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム
JPH11338498A (ja) 音声合成装置
JP4797307B2 (ja) 音声認識装置及び音声認識方法
JP5181578B2 (ja) 音声合成装置、音声合成方法及びコンピュータプログラム
JP4305515B2 (ja) 音声出力装置及び音声出力プログラム
JP2008058678A (ja) 音声出力装置及び音声出力プログラム
JP2015184285A (ja) 表示制御装置及びプログラム
JP2009098328A (ja) 音声合成装置及び方法
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111201

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120123

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4924148

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150