JP4924148B2

JP4924148B2 - 発音学習支援装置及び発音学習支援プログラム

Info

Publication number: JP4924148B2
Application number: JP2007092797A
Authority: JP
Inventors: 利久中村
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 2007-03-30
Filing date: 2007-03-30
Publication date: 2012-04-25
Anticipated expiration: 2027-03-30
Also published as: JP2008250090A

Description

本発明は、発音の学習を支援する発音学習支援装置及び発音学習支援プログラムに関する。

従来、音声出力の可能な電子辞書などの発音学習支援装置では、テキストから合成された音声合成データに基づいて当該テキストを音声出力することにより、多様なテキストについて発音の学習を行えるようになっている。

このような発音学習支援装置に関して、近年、日本語テキストから標準的な発音による音声合成データを生成した後、その音声合成データを指定の方言（例えば大阪弁）の発音による音声合成データに変換して音声出力する技術が開発されている（例えば、特許文献１参照）。
特開２００２−３０４１８６号公報

しかしながら、英語では日本語と異なり、地域（国）によってイントネーション（上がり下がり）やストレス（強弱）等が変化するため、上記特許文献１の技術を単純に適用しても、英語テキストを各地域（国）の発音で音声出力させることはできない。

本発明の課題は、各地域の発音を学習することができる発音学習支援装置及び発音学習支援プログラムを提供することである。

請求項１記載の発明は、発音学習支援装置において、
英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて前記テキストから音声合成データを生成する標準ストレス音声合成データ生成手段と、
地域英語の種類ごとに、標準英語用の前記ストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、
前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定手段と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正手段と、
前記ストレスデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで音声出力する音声出力手段と、
を備えることを特徴とする。

請求項２記載の発明は、請求項１記載の発音学習支援装置において、
前記ストレス補正係数記憶手段は、
前記ストレス補正係数として、母音の音素の前記ストレスデータに対するストレス母音補正係数と、子音の音素の前記ストレスデータに対するストレス子音補正係数と、を記憶し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータのうち、母音の音素の前記ストレスデータを前記ストレス母音補正係数で補正する母音ストレスデータ補正手段と、
前記音声合成データにおける各ストレスデータのうち、子音の音素の前記ストレスデータを前記ストレス子音補正係数で補正する子音ストレスデータ補正手段と、
を有することを特徴とする。

請求項３記載の発明は、請求項１または２記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各音素に、当該音素の標準英語用のイントネーションデータを対応付けて前記音声合成データを生成する標準イントネーション音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、標準英語用の前記イントネーションデータに対するイントネーション補正係数を記憶するイントネーション補正係数記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、前記学習対象英語に対応する前記イントネーション補正係数で補正するイントネーションデータ補正手段を有し、
前記音声出力手段は、
前記イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のイントネーションで音声出力することを特徴とする。

請求項４記載の発明は、請求項３記載の発音学習支援装置において、
ユーザ操作に基づいて、前記学習対象英語の訛りレベルを設定する訛りレベル設定手段と、
各地域英語の種類と、当該地域英語の基となった基準地域英語の種類とを対応付けて記憶する基準地域英語記憶手段と、
を備え、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータを、下記の式（１）によって算出される前記ストレス補正係数Ａ₂で補正する訛りレベル対応ストレスデータ補正手段を有し、
前記イントネーションデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、下記の式（２）によって算出される前記イントネーション補正係数Ｂ₂で補正する訛りレベル対応イントネーションデータ補正手段を有し、
前記音声出力手段は、
前記訛りレベル対応ストレスデータ補正手段及び前記訛りレベル対応イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記訛りレベル設定手段により設定された訛りレベルに対応する前記学習対象英語のストレス及びイントネーションで音声出力することを特徴とする。
Ａ₂＝Ａ₁×Ｌ／１００＋Ａ₀×（１００−Ｌ）／１００ …（１）
Ｂ₂＝Ｂ₁×Ｌ／１００＋Ｂ₀×（１００−Ｌ）／１００ …（２）
（但し、式（１）中、「Ａ₁」は前記学習対象英語に対応する前記ストレス補正係数、「Ａ₀」は前記基準地域英語に対応する前記ストレス補正係数、「Ｌ」は前記訛りレベル設定手段により設定された訛りレベル（％）である。また、式（２）中、「Ｂ₁」は前記学習対象英語に対応する前記イントネーション補正係数、「Ｂ₀」は前記基準地域英語に対応する前記イントネーション補正係数である。）

請求項５記載の発明は、請求項１〜４の何れか一項に記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各単語に、当該単語の標準英語用の発音記号を対応付けて前記音声合成データを生成する標準発音記号音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、所定の英単語と、この所定の英単語についての当該地域英語特有の発音の発音記号と、を対応付けて記憶する補正発音記号記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける前記所定の英単語の発音記号を、前記学習対象英語特有の発音の発音記号に補正する発音記号補正手段を有し、
前記音声出力手段は、
前記発音記号補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の前記所定の単語を、前記学習対象英語特有の発音記号による発音で音声出力することを特徴とする。

請求項６記載の発明は、請求項１〜５の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
ユーザ操作に基づいて前記学習対象英語を指定することを特徴とする。

請求項７記載の発明は、請求項１〜５の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
前記学習対象英語をランダムに指定することを特徴とする。

請求項８記載の発明は、請求項１〜７の何れか一項に記載の発音学習支援装置において、
ユーザから文字列の入力操作を受ける文字列入力手段と、
前記音声出力手段により音声出力された前記テキストと、前記文字列入力手段により入力された文字列とを比較することでユーザに対するディクテーションテストの正誤を判定するとともに、当該判定結果をユーザに報知する正誤判定手段と、
を備えることを特徴とする。

請求項９記載の発明は、地域英語の種類ごとに英語の各音素の標準英語用のストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、音声出力部とを有する電子機器のコンピュータを制御して音声出力制御を行うための発音学習支援プログラムであって、前記コンピュータに、
英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて、前記テキストから音声合成データを生成する標準ストレス音声合成データ生成機能と、
前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定機能と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正機能と、
前記ストレスデータ補正機能による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで前記音声出力部に音声出力する制御を行なう音声出力機能と、
を実現させることを特徴とする。

本発明によれば、英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータが対応付けられて当該テキストから音声合成データが生成され、学習対象英語に対応するストレス補正係数で各ストレスデータが補正された後の音声合成データに基づいて、テキスト中の各音素が学習対象英語のストレスで音声出力されるので、各地域の正確な発音（ストレス）を学習することができる。

以下、図面を参照して、本発明に係る発音学習支援装置を適用した電子辞書の実施形態について説明する。

［外観構成］
図１（ａ）は本実施形態における電子辞書１の斜視外観図である。
この図に示すように、電子辞書１は、ディスプレイ１０、スピーカ１１及びキー群１３を備えている。

ディスプレイ１０は、ユーザによるキー群１３の操作に応じた文字や符号等、各種データを表示する部分であり、ＬＣＤ（Liquid Crystal Display）やＥＬＤ（Electronic Luminescent Display）等によって構成されている。

スピーカ１１は、ユーザによるキー群１３の操作に応じた語句の音声を出力する部分である。

キー群１３は、図１（ｂ）に示すように、ユーザが電子辞書１を操作するための各種キーを有している。具体的には、キー群１３は、訳／決定キー１３ｂと、文字キー１３ｃと、辞書選択キー１３ｄと、カーソルキー１３ｅと、シフトキー１３ｆと、戻るキー１３ｇと、音声出力キー１３ｈと、発音学習キー１３ｊ等とを有している。

訳／決定キー１３ｂは、検索の実行や、見出語の決定等に使用されるキーである。文字キー１３ｃは、ユーザによる文字の入力等に使用されるキーであり、本実施の形態においては“Ａ”〜“Ｚ”キーを備えている。辞書選択キー１３ｄは、後述の辞書データベース８５ａ〜８５ｃ（図２参照）の選択に使用されるキーである。

カーソルキー１３ｅは、ディスプレイ１０内で反転表示等により示されるカーソルの移動に使用されるキーである。シフトキー１３ｆは、日本語の語句を検索対象に設定するとき等に使用されるキーである。戻るキー１３ｇは、前回表示した画面に戻るとき等に使用されるキーである。

音声出力キー１３ｈは、スピーカ１１にテキストを音声出力させるとき等に使用されるキーである。発音学習キー１３ｊは、後述の地域訛り音声学習支援処理（図６参照）を実行させるとき等に使用されるキーである。

［内部構成］
図２は、電子辞書１の概略構成を示すブロック図である。
この図に示すように、電子辞書１は、表示部２、音声出力部３、入力部５、ＣＰＵ６、フラッシュＲＯＭ８及びＲＡＭ７を備えている。

表示部２は、上述のディスプレイ１０を備えており、ＣＰＵ６から入力される表示信号に基づいて各種情報をディスプレイ１０に表示するようになっている。

音声出力部３は、上述のスピーカ１１を備えており、ＣＰＵ６から入力される音声出力信号に基づいてスピーカ１１から音声出力するようになっている。

入力部５は、上述のキー群１３を備えており、押下されたキーに対応する信号をＣＰＵ６に出力するようになっている。

ＣＰＵ６は、入力される指示に応じて所定のプログラムに基づいた処理を実行し、各機能部への指示やデータの転送等を行い、電子辞書１を統括的に制御するようになっている。具体的には、ＣＰＵ６は、入力部５から入力される操作信号等に応じてフラッシュＲＯＭ８に格納された各種プログラムを読み出し、当該プログラムに従って処理を実行する。そして、ＣＰＵ６は、処理結果をＲＡＭ７に保存するとともに、当該処理結果を表示・音声出力するための信号を表示部２や音声出力部３に適宜出力して、対応した内容を表示・音声出力させる。

フラッシュＲＯＭ８は、電子辞書１の各種機能を実現するためのプログラムやデータを記憶するメモリである。本実施の形態においては、フラッシュＲＯＭ８は、辞書検索プログラム８１と、音声合成プログラム８２と、本発明に係る発音学習支援プログラム８４と、辞書データベース群８５と、地域音声パラメータ記憶テーブル８７と、発音記号補正テーブル群８６等とを記憶している。

辞書検索プログラム８１は、従来より公知の辞書検索処理、即ち、ユーザ操作で指定された指定見出語に対応する説明情報を検索して表示する処理をＣＰＵ６に実行させるためのプログラムである。

音声合成プログラム８２は、標準英語（standard English）の発音で音声出力される音声合成データをＣＰＵ６に生成させるプログラムであり、本実施の形態においては、図３（ａ）に示すように、テキスト中の各単語に発音記号及び音素を対応付けるとともに、各音素にイントネーションデータと、母音及び子音のストレスデータとを対応付けて音声合成データを生成させるようになっている。このような音声合成プログラム８２としては、従来より公知のプログラムを用いることができる。

なお、本実施の形態においては、世界各国で標準的に用いられている英語が標準英語として用いられており、この標準英語はアメリカ英語及びイギリス英語とは異なる英語となっている。また、発音記号として、国際音声記号（ＩＰＡ（International Phonetic Alphabet））が用いられている。また、音声合成データにおけるイントネーションデータやストレスデータの数値は、大小によってイントネーション（上がり下がり）やストレス（強弱）の程度を示している。更に、図３（ａ）等の各ストレスデータの後に付記された「（母）」，「（子）」は、母音または子音の音素のストレスデータであることを示している。

発音学習支援プログラム８４は、後述の地域訛り音声学習支援処理（図７，図８参照）をＣＰＵ６に実行させるためのプログラムである。

辞書データベース群８５は、少なくとも１種類の辞書データベースを有しており、本実施の形態においては、アメリカ英語を学習するための英和辞書「リー○ーズ」，「ジー○アス」の辞書データベース８５ａ，８５ｂや、イギリス英語を学習するための英英辞書「オク○フォード」の辞書データベース８５ｃ等を有している。

これら辞書データベース８５ａ〜８５ｃには、例えば図４に１例を示すように、複数の見出語と、この見出語の発音記号と、見出語を詳細に説明する説明情報とが対応付けされて格納されている。ここで、アメリカ英語についての辞書データベース８５ａ，８５ｂには、アメリカ英語での模範的な発音の発音記号が格納されており、イギリス英語についての辞書データベース８５ｃには、イギリス英語での模範的な発音の発音記号が格納されている。

地域音声パラメータ記憶テーブル８７には、図５に示すように、地域（国）特有の英語、つまり地域英語ごとに地域音声パラメータ「Ｐ」が記憶されている。

ここで、地域音声パラメータ「Ｐ」とは、標準英語の発音を基準とした場合の発音傾向を表すパラメータであり、標準英語の発音に対する補正係数となっている。この地域音声パラメータ「Ｐ」として、本実施の形態においては、ストレス補正係数「Ａ」及びイントネーション補正係数「Ｂ」が用いられており、更にストレス補正係数「Ａ」として、ストレス子音補正係数「Ｘ」及びストレス母音補正係数「Ｙ」が用いられている。

このうち、ストレス補正係数「Ａ」とは、標準英語の発音のストレスデータ（以下、標準ストレスデータとする）に対する補正係数であり、ストレス子音補正係数「Ｘ」，ストレス母音補正係数「Ｙ」とは、標準英語の発音の子音ストレスデータ（以下、標準子音ストレスデータとする），母音ストレスデータ（以下、標準母音ストレスデータとする）に対する補正係数である。また、イントネーション補正係数「Ｂ」とは、標準英語の発音のイントネーションデータ（以下、標準イントネーションデータとする）に対する補正係数である。

また、本実施の形態においては、地域英語として「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」及び「フィリピン英語」等が用いられており、これらの地域英語は基となった基準英語がイギリス英語であるか、アメリカ英語であるかによってイギリス系またはアメリカ系に分類され、各基準英語に対応付けされた状態となっている。具体的には、「イギリス英語」、「オーストラリア英語」及び「インド英語」はイギリス系に分類されており、標準英語の発音と比較して発音傾向がイギリス英語に近くなっている。また、「アメリカ英語」、「カナダ英語」及び「フィリピン英語」はアメリカ系に分類されており、標準英語の発音と比較して発音傾向がアメリカ英語に近くなっている。なお、これらの地域英語のうち、「オーストラリア英語」、「インド英語」、「カナダ英語」及び「フィリピン英語」については、各単語の発音が体系的に確定していないものの、所定の単語（以下、特有発音単語とする）については、基準英語（イギリス英語またはアメリカ英語）での模範的な発音と比較して規則的に発音記号が変化することが知られている。

発音記号補正テーブル群８６は、「オーストラリア英語」、「インド英語」、「カナダ英語」及び「フィリピン英語」について発音記号補正テーブル８６ａ〜８６ｄを有している。

これら発音記号補正テーブル８６ａ〜８６ｄには、対応する地域英語における前記特有発音単語について、地域英語に対応する基準英語の種類と、当該基準英語での模範的な発音の発音記号と、地域英語に特有の発音の発音記号とが対応付けられて記憶されている。例えば、オーストラリア英語の発音記号補正テーブル８６ａには、図６に示すように、オーストラリア英語における各特有発音単語について、イギリス英語（基準英語）での模範的な発音の発音記号と、オーストラリア英語に特有の発音の発音記号等とが対応付けられて記憶されている。

また、上述の図２に示すように、ＲＡＭ７は、ＣＰＵ６が実行する各種プログラムや、これらプログラムの実行に係るデータ等を一時的に保持するメモリであり、本実施の形態においては、学習対象テキスト記憶領域７１と、地域・訛りレベル記憶領域７２と、地域音声パラメータ展開領域７３と、標準英語音声データ記憶領域７４と、学習対象英語音声データ記憶領域７５とを備えている。

学習対象テキスト記憶領域７１には、後述の地域訛り音声学習支援処理（図７，図８参照）において学習対象とされるテキスト（以下、学習対象テキストとする）が記憶されるようになっている。

地域・訛りレベル記憶領域７２には、後述の地域訛り音声学習支援処理（図７，図８参照）において学習対象とされる地域英語（以下、学習対象英語とする）の種類と、当該学習対象英語の訛りレベル（％）とが記憶されるようになっている。

地域音声パラメータ展開領域７３には、後述の地域訛り音声学習支援処理（図７，図８参照）において学習対象英語の地域音声パラメータ「Ｐ」が記憶されるようになっている。

標準英語音声データ記憶領域７４には、後述の地域訛り音声学習支援処理（図７，図８参照）において学習対象テキストを標準英語の発音で音声出力部３に音声出力させる場合の音声合成データが記憶されるようになっている。

学習対象英語音声データ記憶領域７５には、後述の地域訛り音声学習支援処理（図７，図８参照）において学習対象テキストを学習対象英語の発音で音声出力部３に音声出力させる場合の音声合成データが記憶されるようになっている。

［地域訛り音声学習支援処理］
続いて、電子辞書１の動作について説明する。図７，図８は、ＣＰＵ６がフラッシュＲＯＭ８から発音学習支援プログラム８４を読み出して実行する地域訛り音声学習支援処理の動作を説明するためのフローチャートである。

まず図７に示すように、発音学習キー１３ｊが操作されると、ＣＰＵ６は、ユーザによって学習対象テキストのランダム指定が選択されるか否かを判定する（ステップＳ１）。

このステップＳ１においてランダム指定が選択されたと判定した場合（ステップＳ１；Ｙｅｓ）には、ＣＰＵ６は、フラッシュＲＯＭ８内の英語コンテンツ、例えば辞書データベース８５の中からランダムに英語のテキストを読み出し、学習対象テキストとして学習対象テキスト記憶領域７１に記憶させた後（ステップＳ２）、後述のステップＳ４の処理に移行する。

また、ステップＳ１においてランダム指定が選択されないと判定した場合（ステップＳ１；Ｎｏ）には、ＣＰＵ６は、ユーザ操作により学習対象テキストとして指定された英語のテキストを学習対象テキスト記憶領域７１に記憶させる（ステップＳ３）。

次に、ＣＰＵ６は、学習対象英語の種類及び訛りレベルがユーザによって指定されたか否かを判定し（ステップＳ４）、指定されないと判定した場合（ステップＳ４；Ｎｏ）には、学習対象英語の種類と訛りレベルとをランダムに指定して地域・訛りレベル記憶領域７２に記憶させる（ステップＳ５）。

また、ステップＳ４において学習対象英語の種類及び訛りレベルが指定されたと判定した場合（ステップＳ４；Ｙｅｓ）には、ＣＰＵ６は、当該学習対象英語の種類と、訛りレベルとを地域・訛りレベル記憶領域７２に記憶させ（ステップＳ６）、後述のステップＳ７の処理に移行する。

次に、ＣＰＵ６は、学習対象英語用の音声合成データを生成する地域訛り対応音声合成処理を行う（ステップＳ７）。

より詳細には、図８に示すように、まずＣＰＵ６は、音声合成プログラム８２によって学習対象テキストから標準英語用の音声合成データ（発音記号、音素、標準ストレスデータ及び標準イントネーションデータ）を生成し、先頭から順に標準英語音声データ記憶領域７４及び学習対象英語音声データ記憶領域７５に記憶させる（ステップＳ７１）。具体的には、例えば図３（ａ）に示すように、学習対象テキスト記憶領域７１に学習対象テキスト「I can do it today.」が記憶されている場合には、当該学習対象テキストについての音声合成データが標準英語音声データ記憶領域７４及び学習対象英語音声データ記憶領域７５に記憶される。

次に、ＣＰＵ６は、地域・訛りレベル記憶領域７２内の訛りレベルが１００％であるか否かを判定し（ステップＳ７２）、１００％であると判定した場合（ステップＳ７２；Ｙｅｓ）には、地域音声パラメータ記憶テーブル８７から学習対象英語の地域音声パラメータ「Ｐ」を読み出し、そのまま地域音声パラメータ展開領域７３に記憶させた後（ステップＳ７５）、後述のステップＳ７６の処理に移行する。

これにより、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ１００％に設定された場合には、図３（ｂ）〜（ｄ）の右側、図９（ａ）〜（ｃ）の右側に示すように、設定された学習対象英語及び訛りレベルに対応する地域音声パラメータ「Ｐ」が地域音声パラメータ展開領域７３に記憶されることとなる。

また、ステップＳ７２において訛りレベルが１００％ではないと判定した場合（ステップＳ７２；Ｎｏ）には、ＣＰＵ６は、地域音声パラメータ記憶テーブル８７内の分類に基づいて学習対象英語の基準英語（イギリス英語またはアメリカ英語）を検出する（ステップＳ７３）。

次に、ＣＰＵ６は、地域音声パラメータ記憶テーブル８７から学習対象英語及び基準英語の地域音声パラメータ「Ｐ」（後述のＰ₁，Ｐ₀）を読み出した後、訛りレベルに対応する学習対象英語の地域音声パラメータ「Ｐ」（後述のＰ₂）を以下の式（３）に基づいて算出し、地域音声パラメータ展開領域７３に記憶させる（ステップＳ７４）。

Ｐ₂＝Ｐ₁×Ｌ／１００＋Ｐ₀×（１００−Ｌ）／１００ …（３）
但し、式（１）中、「Ｐ₁」，「Ｐ₂」は補正前後での学習対象英語の地域音声パラメータ、「Ｐ₀」は基準英語の地域音声パラメータ、「Ｌ」は訛りレベル（％）である。また、この式に基づいて地域音声パラメータ「Ｐ₂」を算出するとは、具体的には、以下の式（１），（２）を計算することによりストレス補正係数「Ａ₂」（「Ｘ₂」，「Ｙ₂」）及びイントネーション補正係数「Ｂ₂」を算出することを意味する。

Ａ₂＝Ａ₁×Ｌ／１００＋Ａ₀×（１００−Ｌ）／１００ …（１）
Ｂ₂＝Ｂ₁×Ｌ／１００＋Ｂ₀×（１００−Ｌ）／１００ …（２）

これにより、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが０％，２０％，４０％，６０％，８０％に設定された場合には、図１０や、図１１（ｂ）〜（ｃ）の右側，図１２（ａ）〜（ｄ）の右側に示すように、設定された学習対象英語及び訛りレベルに対応する地域音声パラメータ「Ｐ」が地域音声パラメータ展開領域７３に記憶されることとなる。なお、これらの図では、参考として訛りレベルが１００％の場合の地域音声パラメータ「Ｐ」も図示している。

次に、ＣＰＵ６は、学習対象英語音声データ記憶領域７５内で各音素に対応付けられた標準イントネーションデータそれぞれに対して地域音声パラメータ展開領域７３内のイントネーション補正係数「Ａ」を乗算した後、つまり、各標準イントネーションデータをイントネーション補正係数「Ａ」で補正した後、各乗算結果に基づいて当該学習対象英語音声データ記憶領域７５内の情報を更新する（ステップＳ７６）。

これにより、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ１００％に設定された場合には、図３（ａ）のイントネーションデータが、図３（ｂ）〜（ｄ）や図９（ａ）〜（ｃ）のイントネーションデータに更新されることとなる。また、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが０％，２０％，４０％，６０％，８０％，１００％に設定された場合には、図１１（ａ）のイントネーションデータが、図１１（ｂ）〜（ｃ）や図１２（ａ）〜（ｄ）のイントネーションデータに更新されることとなる。

次に、ＣＰＵ６は、学習対象英語音声データ記憶領域７５内で各音素に対応付けられた標準ストレスデータのうち、先頭の標準ストレスデータを読み出した後（ステップＳ７７）、この標準ストレスデータと対応する音素が母音であるか否かを判定する（ステップＳ７８）。

このステップＳ７８において音素が母音であると判定した場合（ステップＳ７８；Ｙｅｓ）には、ＣＰＵ６は、読み出した標準ストレスデータ（標準母音ストレスデータ）に対して地域音声パラメータ展開領域７３内のストレス母音補正係数「Ｙ」を乗算した後、つまり、各標準母音ストレスデータをストレス母音補正係数「Ｙ」で補正した後、この乗算結果に基づいて学習対象英語音声データ記憶領域７５内の情報を更新し（ステップＳ７９）、後述のステップＳ８１に移行する。

一方、ステップＳ７８において音素が母音でない、つまり子音であると判定した場合（ステップＳ７８；Ｎｏ）には、ＣＰＵ６は、読み出した標準ストレスデータ（標準子音ストレスデータ）に対して地域音声パラメータ展開領域７３内のストレス子音補正係数「Ｘ」を乗算した後、つまり、各標準子音ストレスデータをストレス子音補正係数「Ｘ」で補正した後、この乗算結果に基づいて学習対象英語音声データ記憶領域７５内の情報を更新する（ステップＳ８０）。

これらステップＳ７９，Ｓ８０により、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ１００％に設定された場合には、図３（ａ）のストレスデータが、図３（ｂ）〜（ｄ）や図９（ａ）〜（ｃ）のストレスデータに更新されることとなる。また、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが０％，２０％，４０％，６０％，８０％，１００％に設定された場合には、図１１（ａ）のストレスデータが、図１１（ｂ）〜（ｃ）や図１２（ａ）〜（ｄ）のストレスデータに更新されることとなる。

次に、ＣＰＵ６は、読み出したストレスデータと対応する音素が学習対象テキストの最後の音素であるか否かを判定し（ステップＳ８１）、最後の音素ではないと判定した場合（ステップＳ８１；Ｎｏ）には、学習対象英語音声データ記憶領域７５内における標準ストレスデータの格納順序に従って、次の標準ストレスデータを読み出し（ステップＳ８２）、上述のステップＳ７８に移行する。

また、ステップＳ８１において最後の音素であると判定した場合（ステップＳ８１；Ｙｅｓ）には、ＣＰＵ６は、発音記号補正テーブル８６ａ〜８６ｄ内の情報に基づいて、学習対象テキストにおける各単語のうち学習対象英語の特有発音単語について、学習対象英語音声データ記憶領域７５内の発音記号及び音素を、学習対象単語特有の発音の発音記号に補正し（ステップＳ８３）、地域訛り対応音声合成処理を終了する。

これにより、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ１００％に設定された場合には、図３（ａ）の発音記号及び音素が、図３（ｂ）〜（ｄ）や図９（ａ）〜（ｃ）の発音記号及び音素に更新されることとなる。また、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが０％，２０％，４０％，６０％，８０％，１００％に設定された場合には、図１１（ａ）の発音記号及び音素が、図１１（ｂ）〜（ｃ）や図１２（ａ）〜（ｄ）の発音記号及び音素に更新されることとなる。

次に、図７に示すように、ＣＰＵ６は、ユーザによってディクテーションテストの実行が選択されるか否かを判定し（ステップＳ９）、選択されないと判定した場合（ステップＳ９；Ｎｏ）には、学習対象テキストを表示部２に表示させた後（ステップＳ１０）、学習対象英語音声データ記憶領域７５内の音声合成データに基づいて学習対象英語の発音（ストレス、イントネーション、音）で学習対象テキストを音声出力部３に音声出力させ（ステップＳ１１）、地域訛り音声学習支援処理を終了する。

また、ステップＳ９においてディクテーションテストの実行が選択されたと判定した場合（ステップＳ９；Ｙｅｓ）には、ＣＰＵ６は、学習対象英語音声データ記憶領域７５内の音声合成データに基づいて学習対象英語の発音（ストレス、イントネーション、音）で学習対象テキストを音声出力部３に音声出力させた後（ステップＳ１３）、入力部５を介して当該学習対象テキストの内容をユーザに文字入力させる（ステップＳ１４）。

そして、ＣＰＵ６は、ユーザによる入力文字列の内容と学習対象テキストの内容とを比較することによって、ユーザに対するディクテーションテストの正誤を判定し（ステップＳ１５）、正解である（内容が一致する）と判定した場合（ステップＳ１５；Ｙｅｓ）には、正解の旨を示すメッセージを表示部２に表示させ（ステップＳ１６）、地域訛り対応音声合成処理を終了する。また、ステップＳ１５において不正解である（内容が一致しない）と判定した場合（ステップＳ１５；Ｎｏ）には、ＣＰＵ６は、不正解の旨を示すメッセージと、正解内容、つまり学習対象テキストの内容とを表示部２に表示させ（ステップＳ１７）、地域訛り対応音声合成処理を終了する。

以上の電子辞書１によれば、図８のステップＳ７１，Ｓ７７〜Ｓ８２や、図３，図９等に示したように、英語のテキスト中の各音素に当該音素の標準ストレスデータが対応付けられて当該テキストから音声合成データが生成された後、学習対象英語に対応するストレス補正係数「Ａ」で音声合成データ中の各標準ストレスデータが補正され、この補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語のストレスで音声出力されるので、各地域の正確な発音（ストレス）を学習することができる。

また、図８のステップＳ７８〜Ｓ８２や、図３，図９等に示したように、学習対象英語に対応するストレス母音補正係数「Ｙ」，ストレス子音補正係数「Ｘ」で音声合成データ中の母音の音素，子音の音素の各標準ストレスデータが補正され、この補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語のストレスで音声出力されるので、各地域のより正確な発音（ストレス）を学習することができる。

また、図８のステップＳ７１，Ｓ７６や、図３，図９等に示したように、テキスト中の各音素に当該音素の標準イントネーションデータが対応付けられて音声合成データが生成された後、学習対象英語に対応するイントネーション補正係数「Ｂ」で音声合成データ中の各イントネーションデータが補正され、この補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語のイントネーションで音声出力されるので、各地域の正確な発音（イントネーション）を学習することができる。

また、図８のステップＳ７３，図１０〜図１２等に示したように、音声合成データにおける各標準ストレスデータがストレス補正係数Ａ₂で、各標準イントネーションデータがイントネーション補正係数Ｂ₂でそれぞれ補正され、これらの補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語の訛りレベルに対応するストレス及びイントネーションで音声出力されるので、訛りレベルに対応した各地域の正確な発音（ストレス，イントネーション）を学習することができる。

また、図８のステップＳ８３や、図３，図９等に示したように、テキスト中の各単語に当該単語の標準英語用の発音記号が対応付けられて音声合成データが生成された後、学習対象英語における特有発音単語の発音記号が学習対象英語特有の発音の発音記号に補正され、この補正後の音声合成データに基づいてテキスト中の特有発音単語が特有の発音で音声出力されるので、各地域のより正確な発音（音）を学習することができる。

また、図７のステップＳ３に示したように、ユーザ操作に基づいて学習対象英語が指定されるので、所望の地域の英語を学習対象英語とすることにより、当該地域の正確な発音を学習することができる。

また、図７のステップＳ２に示したように、学習対象英語がランダムに指定されるので、多様な地域英語について発音の学習効果を高めることができる。

また、図７のステップＳ１３〜Ｓ１７に示したように、ユーザに対するディクテーションテストの正誤が判定され、その判定結果がユーザに表示されるので、発音の学習効果を高めることができる。

なお、本発明を適用可能な実施形態は、上述した実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で適宜変更可能である。

例えば、本発明に係る発音学習支援装置を電子辞書１として説明したが、本発明が適用可能なものは、このような製品に限定されず、携帯電話やパソコンなどの電子機器全般に適用可能である。また、本発明に係る発音学習支援プログラムは、これらの電子機器に対して着脱可能なメモリカード、ＣＤ等に記憶されることとしてもよい。

本発明に係る発音学習支援装置を適用した電子辞書の概略構成を示す図であり、（ａ）は概観図であり、（ｂ）は部分平面図である。本発明に係る発音学習支援装置を適用した電子辞書の概略構成を示すブロック図である。標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。辞書データベースのデータ構造を示す図である。地域音声パラメータ記憶テーブルのデータ構造を示す図である。発音記号補正テーブルのデータ構造を示す図である。地域訛り音声学習支援処理を示すフローチャートである。地域訛り対応音声合成処理を示すフローチャートである。標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。訛りレベルの設定値ごとの地域音声パラメータを示す図である。標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。

符号の説明

１電子辞書（発音学習支援装置）
３音声出力部（音声出力手段）
５入力部（訛りレベル設定手段、文字列入力手段）
６ＣＰＵ（標準ストレス音声合成データ生成手段、学習対象英語指定手段、
ストレスデータ補正手段、母音ストレスデータ補正手段、
子音ストレスデータ補正手段、
標準イントネーション音声合成データ生成手段、
イントネーションデータ補正手段、
訛りレベル対応ストレスデータ補正手段、
訛りレベル対応イントネーションデータ補正手段、
標準発音記号音声合成データ生成手段、発音記号補正手段、
正誤判定手段）
８４発音学習支援プログラム
８６ａ〜８６ｄ発音記号補正テーブル（補正発音記号記憶手段）
８７地域音声パラメータ記憶テーブル（ストレス補正係数記憶手段、
イントネーション補正係数記憶手段、
基準地域英語記憶手段）

Claims

英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて前記テキストから音声合成データを生成する標準ストレス音声合成データ生成手段と、
地域英語の種類ごとに、標準英語用の前記ストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、
前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定手段と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正手段と、
前記ストレスデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで音声出力する音声出力手段と、
を備えることを特徴とする発音学習支援装置。
請求項１記載の発音学習支援装置において、
前記ストレス補正係数記憶手段は、
前記ストレス補正係数として、母音の音素の前記ストレスデータに対するストレス母音補正係数と、子音の音素の前記ストレスデータに対するストレス子音補正係数と、を記憶し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータのうち、母音の音素の前記ストレスデータを前記ストレス母音補正係数で補正する母音ストレスデータ補正手段と、
前記音声合成データにおける各ストレスデータのうち、子音の音素の前記ストレスデータを前記ストレス子音補正係数で補正する子音ストレスデータ補正手段と、
を有することを特徴とする発音学習支援装置。
請求項１または２記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各音素に、当該音素の標準英語用のイントネーションデータを対応付けて前記音声合成データを生成する標準イントネーション音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、標準英語用の前記イントネーションデータに対するイントネーション補正係数を記憶するイントネーション補正係数記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、前記学習対象英語に対応する前記イントネーション補正係数で補正するイントネーションデータ補正手段を有し、
前記音声出力手段は、
前記イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のイントネーションで音声出力することを特徴とする発音学習支援装置。
請求項３記載の発音学習支援装置において、
ユーザ操作に基づいて、前記学習対象英語の訛りレベルを設定する訛りレベル設定手段と、
各地域英語の種類と、当該地域英語の基となった基準地域英語の種類とを対応付けて記憶する基準地域英語記憶手段と、
を備え、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータを、下記の式（１）によって算出される前記ストレス補正係数Ａ2で補正する訛りレベル対応ストレスデータ補正手段を有し、
前記イントネーションデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、下記の式（２）によって算出される前記イントネーション補正係数Ｂ2で補正する訛りレベル対応イントネーションデータ補正手段を有し、
前記音声出力手段は、
前記訛りレベル対応ストレスデータ補正手段及び前記訛りレベル対応イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記訛りレベル設定手段により設定された訛りレベルに対応する前記学習対象英語のストレス及びイントネーションで音声出力することを特徴とする発音学習支援装置。
Ａ2＝Ａ1×Ｌ／１００＋Ａ0×（１００−Ｌ）／１００ …（１）
Ｂ2＝Ｂ1×Ｌ／１００＋Ｂ0×（１００−Ｌ）／１００ …（２）
（但し、式（１）中、「Ａ1」は前記学習対象英語に対応する前記ストレス補正係数、「Ａ0」は前記基準地域英語に対応する前記ストレス補正係数、「Ｌ」は前記訛りレベル設定手段により設定された訛りレベル（％）である。また、式（２）中、「Ｂ1」は前記学習対象英語に対応する前記イントネーション補正係数、「Ｂ0」は前記基準地域英語に対応する前記イントネーション補正係数である。）
請求項１〜４の何れか一項に記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各単語に、当該単語の標準英語用の発音記号を対応付けて前記音声合成データを生成する標準発音記号音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、所定の英単語と、この所定の英単語についての当該地域英語特有の発音の発音記号と、を対応付けて記憶する補正発音記号記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける前記所定の英単語の発音記号を、前記学習対象英語特有の発音の発音記号に補正する発音記号補正手段を有し、
前記音声出力手段は、
前記発音記号補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の前記所定の単語を、前記学習対象英語特有の発音記号による発音で音声出力することを特徴とする発音学習支援装置。
請求項１〜５の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
ユーザ操作に基づいて前記学習対象英語を指定することを特徴とする発音学習支援装置。
請求項１〜５の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
前記学習対象英語をランダムに指定することを特徴とする発音学習支援装置。
請求項１〜７の何れか一項に記載の発音学習支援装置において、
ユーザから文字列の入力操作を受ける文字列入力手段と、
前記音声出力手段により音声出力された前記テキストと、前記文字列入力手段により入力された文字列とを比較することでユーザに対するディクテーションテストの正誤を判定するとともに、当該判定結果をユーザに報知する正誤判定手段と、
を備えることを特徴とする発音学習支援装置。
地域英語の種類ごとに英語の各音素の標準英語用のストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、音声出力部とを有する電子機器のコンピュータを制御して音声出力制御を行うための発音学習支援プログラムであって、前記コンピュータに、
英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて、前記テキストから音声合成データを生成する標準ストレス音声合成データ生成機能と、
前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定機能と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正機能と、
前記ストレスデータ補正機能による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで前記音声出力部に音声出力する制御を行なう音声出力機能と、
を実現させることを特徴とする発音学習支援プログラム。