JP5057764B2 - 音声合成装置及び音声合成プログラム - Google Patents

音声合成装置及び音声合成プログラム Download PDF

Info

Publication number
JP5057764B2
JP5057764B2 JP2006337212A JP2006337212A JP5057764B2 JP 5057764 B2 JP5057764 B2 JP 5057764B2 JP 2006337212 A JP2006337212 A JP 2006337212A JP 2006337212 A JP2006337212 A JP 2006337212A JP 5057764 B2 JP5057764 B2 JP 5057764B2
Authority
JP
Japan
Prior art keywords
word
phrase
sentence
voice
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006337212A
Other languages
English (en)
Other versions
JP2008152356A (ja
JP2008152356A5 (ja
Inventor
正人 平元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006337212A priority Critical patent/JP5057764B2/ja
Publication of JP2008152356A publication Critical patent/JP2008152356A/ja
Publication of JP2008152356A5 publication Critical patent/JP2008152356A5/ja
Application granted granted Critical
Publication of JP5057764B2 publication Critical patent/JP5057764B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

本発明は、英文などの外国語の文章をリスニングして学習するのに便利な音声合成装置及び音声合成プログラムに関する。
従来、文書を記憶する文書データベースと、文書データベースに記憶された文書中の語句より、音声出力された場合に同定し難い語句を判別し、同定し難いと判別された語句を、同定し易い同意の語句に置換する置換部と、置換後の文書を合成音声により読み上げる音声合成部と、音声出力部とを備えた文書処理装置が提案されている(例えば、特許文献1参照)。
すなわち、この文書処理装置は、読み出した文章を読み上げる場合に、音声出力された情報を聞いているユーザがその意味を理解できない語句を自動的に判定して、理解し易い語句に置き換えて、文章を読み上げるようになっている。例えば、「企業は利潤を追求して」という箇所があり、「追求する」が置換語辞書に置換対象語として登録されていた場合、「追求する」を置換語の「追い求める」に置換する。ここで「追求する」は活用語なので、置換語を同じ活用形である連用形に変換して「追い求め(て)」とし、「企業は利潤を追い求めて」と読み上げるようになっている。また、難語については、解析辞書中にマークを付けておくことで、難語でない語と置き換えるようになっている。さらに、外国語の単語の場合には、対訳辞書を用意しておき、その語の訳語を求め、それを読み上げるようにしたり、置き換えるのでなく原語の単語に訳語を追加する形で読み上げるようになっている。
また、機密を要する内容の受信時には、特定の単語を別の単語に読みかえるようにした音声合成装置も提案されている(例えば、特許文献2参照)。
特開平7−121537号公報 特開平6−216831号公報
上記特許文献1の文書処理装置では、ユーザがその意味を理解できない語句を自動的に判定して、理解し易い語句に自動的に置き換えるようになっているが、ユーザがその意味を理解できない語句は、ユーザの習熟度により異なるものであり、あるユーザが一つの語句を理解できないからといって、別のユーザも同じ語句が理解できないというものではない。そのため、別のユーザにとっては、このように語句を置き換えられても何ら意味を持たないことになる。特に、上記特許文献1の文書処理装置は日本語がベースであるが、外国語の場合には、本来理解可能な語句を別の語句に置き換えてしまうことによって、リスニングの学習という意味ではむしろマイナス効果となってしまうといった問題があった。また、外国語のリスニングの学習という観点からすれば、置き換える語句の内容や置き換えるタイミング等を充分に考慮しなければならないが、上記特許文献1の文書処理装置はそのような外国語のリスニングの学習といったことには全く対応していないため、置き換える語句の内容や置き換えるタイミング等は全く考慮されていない。
また、上記特許文献2の音声合成装置は、機密を要する内容の受信時には、特定の単語を別の単語に読みかえることによって、通信内容の機密保持を図ったものであり、外国語のリスニングの学習といったことには全く対応していない。
一方、大学入試試験では、2006年よりリスニングテストが実施され、リスニングによる学習は、今後重要になると考えられる。そのリスニングの学習において、従来は、リスニング中に難しい語句があり理解できない場合は、それをメモって、辞書などで調べる必要があった。また、難しい語句であるとの判断は、ユーザの習熟度により千差万別であり、全てのユーザに対して的確に難しい語句を理解できる語句に置き換えることは困難である。
本発明はかかる問題点を解決すべく創案されたもので、その目的は、英文などの文章をリスニングして学習するときに、聞き取れない語句や解らない語句の位置をユーザが指示することによって、次の音声出力時にはその語句を理解し易い語句に置き換えて文章を読み上げるようにした音声合成装置及び音声合成プログラムを提供することにある。
上記課題を解決するため、本発明の音声合成装置は、文章を記憶する文章記憶手段と、前記文章記憶手段から任意の文章を読み出す読出し手段と、前記文章を音声で出力する音声合成手段とを備え、前記読出し手段により読み出された文章を前記音声合成手段により音声で出力する音声合成装置において、前記文章を音声合成で音声出力中に語句を指示する指示手段と、前記指示手段により指示された語句を特定する語句特定手段と、前記語句特定手段で特定された語句を他の語句に置き換える置換手段と、を備え、前記指示手段により指示された語句を前記置換手段によって置き換えた他の語句に置き換えて音声出力することを特徴とするものである。
前記指示手段は、読み上げられている語句が解らないとき、ユーザがすぐに決定キーを押下することにより、その語句を指示(以下、マーキングともいう)する。また、マーキングは、表示された文章から解らない語句をペンなどで選択するようにしてもよい。さらに、文章のカンマや段落などの区切った一文単位でマーキングするようにしてもよい。
前記語句特定手段は、文章を読み上げる開始の時間と、マーキングされた時間を記憶し、経過した時間と読み上げる時間によりマーキングされた語句を特定する。また、実際に経過した時間より若干短くするように補正した時間で語句を特定してもよい。さらに、読み上げが終わった時点でマーキングされる場合があるので、マーキングされた1つ前の語句を特定するようにしてもよい。
前記置換手段は、類義語辞書や英英辞書で検索した結果、一致した言葉に置き換える。
前記制御切換手段は、マーキングされた難しい語句を見出し語にして、類義語辞書や英英辞書のデータを検索した結果、一致した語句に置き換える。そして、置き換えられた語句で表示する。この場合、マーキングされた語句を含んだ一文単位を置き換えてもよい。
この場合、文章中の置き換えられた語句の位置から再度音声出力を開始することを特徴とする。なお、置き換えて読み上げる(表示する場合も含む)のは、マーキングされた直後に行ってもよいし、マーキングした後に再度音声出力したときに行ってもよい。
具体的には、前記指示された語句が含まれる一文を音声出力後に、文章中の置き換えられた語句の位置から再度音声出力を開始するように構成してもよい。
また、前記指示された語句が含まれる一文を音声出力後に、文章中の置き換えられた語句の位置から再度音声出力を開始するとともに、指示された語句を含まない文については音声出力しないように構成してもよい。
また、本発明の音声合成装置は、習熟度レベルを設定する設定手段をさらに備え、前記置換手段は、前記語句特定手段で特定された語句を他の語句に置き換えるとき、設定された習熟度レベルに応じた語句に置き換えるように構成してもよい。例えば、習熟度レベルとして上級、中級、初級の3段階のレベルを用意し、上級に設定された場合には、単なる語句の置き換えのみとし、中級に設定された場合には、語句の置き換えに加え、語句の例文を併せて表示及び音声出力し、初級に設定された場合には、特定された語句をその日本語の翻訳文に置き換えて表示及び音声出力する。
また、本発明の音声合成装置は、語句ごとに指示した回数、または前記文章を読み出して音声出力した回数を記憶する回数記憶手段をさらに備え、前記回数記憶手段に記憶された回数に応じた語句置き換えるように構成してもよい。このような構成とすれば、例えば同じ語句を3回マーキングすると、その時点で初めて語句を置き換えるように構成することができる。
また、本発明の音声合成装置は、語句ごとに指示した回数、または前記文章を読み出して音声出力した回数を記憶する回数記憶手段と、語句の難易度を記憶する難易度レベル記憶手段とをさらに備え、前記回数記憶手段に記憶された回数に応じて、難易度レベルの低い語句置き換えるように構成してもよい。
具体的には、ある語句が1回マーキングされた場合、その語句の難易度レベルが例えば(4)であった場合には、その語句を難易度レベル(3)の語句に置き換え、置き換えた後の語句が再度マーキングされると、その語句を難易度レベル(2)の語句に置き換える。このように、同じ部分の語句をマーキングするたびに語句のレベルを順次下げていくことで、ユーザの学習レベルに合わせたリスニング学習を行うことができる。
また、本発明の音声合成装置は、前記音声出力する回数を任意に設定する音声出力回数設定手段をさらに備え、前記文章の音声出力回数が前記音声出力回数設定手段の設定回数を超えた場合、元の語句に戻す置き換えを行うように構成してもよい。
本発明の音声合成プログラムは、読出し手段により文章記憶手段から文章を読み出すステップと、音声合成手段により読み出した文章を音声で出力するステップと、前記文章を音声合成で音声出力中の語句が指示されると、該指示された語句を特定するステップと、置換手段により特定した語句を他の語句に置き換えるステップと、前記音声合成手段により置き換えた語句を音声出力するステップと、を実行することを特徴とするものである。
本発明によれば、英文などの文章をリスニングして学習するときに、音声出力が聞きとれない語句や解らない語句をユーザが指示すると、次に聞くときにはその聞きとれない語句等を理解し易い語句に置き換えて文章を読み上げるように構成したので、ユーザのレベルに合わせたリスニング学習が可能となり、学習するときの理解度を高めることができる。
以下、本発明の実施の形態について図面を参照して説明する。
図1は本実施形態の音声合成装置の構成例を示す機能ブロック図である。
本実施形態の音声合成装置は、大別すると、装置全体の動作制御を司る制御部1を中心として、各種キーを備えたキー入力部2、分離情報検出部3、表示部4、音声出力部5、制御データ記憶部11、プログラム記憶部12、辞書データ記憶部13、テキストデータ記憶部14、及び音声データ記憶部15から構成されている。
キー入力部2は、表示指示を行う検索キー21、リスニング中に聞きとれない語句や理解できない語句を指示(マーキング)する決定キー22、電源のオン/オフを兼用するメニューキー23、画面上のカーソルを左右に移動させたり、画面に表示された文章及び表示された文章の音声出力を前文章または次文章に移動させる左右キー24(24a,24b)、画面上のカーソルを上下に移動させたり、出力音声の音声量を調整する上下キー25(25a,25b)、プレイ/ポーズキー26などを備えている。
分離情報検出部3は、文章と文章の間、及びこの文章に対応する音声データと音声データの間にそれぞれ区切りとして挿入されている分離情報を検出する。
表示部4は、LCDパネル42と、このLCDパネル42を駆動して各種文章の表示や各種操作画面を表示する表示コントローラ41とからなる。
音声出力部5は、内蔵のスピーカ52と、このスピーカ52から出力する音声を合成する音声デコーダ51とからなる。音声出力は、例えばTTS(Text To Speach)機能を用いて行う。
制御データ記憶部11は、文章を各単語に分離したときの分離数をカウントする分離数カウンタ、決定キー22による指示された単語や語句の指示回数をカウントする単語数カウンタ、指示された単語や語句の難易度を記憶する難易度記憶部などを備えている。
プログラム記憶部12は、本装置によるリスニング処理動作全般を制御する制御プログラムを格納している。
辞書データ記憶部13は、類義語辞書や英英辞書などを記憶している。また、後述する各単語や語句の難易度レベルも記憶している。
テキストデータ記憶部14は、リスニング用の各種文書データを格納している。文書データは、例えばTOEIC用のコンテンツや、音声用電子辞書で使用される英語の例文のコンテンツなどが使用可能である。TOEIC(Test of English for International Communication)は、英語によるコミュニケーション能力を定量的に評価する世界共通のテストのことである。音声データ記憶部15は、例えば英語の各文章の音声データを格納している。
図2は、テキストデータ記憶部14に格納されているテキストデータ、及び音声データ記憶部15に格納されている前記テキストデータに対応した音声データのデータ構成例を示している。
すなわち、音声データ及びテキストデータには、それぞれ各文章A,B,Cの間に分離情報が配置されており、文章Cの最後に終了情報が配置されている。文章データが例えば「The XYZ space plan succeed third round of rocket launch yersterday.Restore international confidence in Japanese rockets.According to ABC news.」であった場合、文章Aは「The XYZ space plan succeed third round of rocket launch yersterday.」であり、文章Bは、「Restore international confidence in Japanese rockets.」であり、文章Cは、「According to ABC news.」である。ここで、例えば文章Cを語句単位に分割すると、「According to」、「ABC news」となる。
図3は、上記構成の音声合成装置の外観図である。この音声合成装置は、縦長の装置本体の上部側に表示部4が配置され、下部側に入力部2の各キー21〜26が配置されている。
図4は、辞書データ記憶部13に記憶されている辞書データの構成例を示している。
この辞書データは、本発明の特徴である語句の置き換えを行うときに使用される辞書データであり、置き換える前の元となる語句または単語と、その元となる語句または単語の難易度と、属性(品詞)と、置き換え用の語句または単語と、その語句または単語の難易度と、置き換える前の元となる語句または単語を使用した例文とで構成されている。例えば、置き換える前の元となる単語が「Accord」であった場合、その難易度は(4)であり、属性は「動詞」と「名詞」であり、属性が「動詞」の場合の置き換え用の単語は「agree」であり、その難易度は(4)であり、そのときの例文は「His words and actions do not・・・Accord・・・」である。また、属性が「名詞」の場合の置き換え用の単語は「harmony」であり、その難易度は(4)であり、そのときの例文は「reach accord on a building・・・Accord・・・」である。ここで、難易度は、数字が大きい方が難易度が高く、数字の小さい方が難易度が低いことを示している。ただし、単語(語句)の中には例文の無いものもある。
以下同様にして、頭文字順にaからzまでのすべての単語(語句)について、上記の辞書データが格納されている。
次に、上記構成の音声合成装置によるリスニング学習中の処理、特に語句または単語の置き換え処理動作について、具体的に実施例を上げて説明する。
本実施例1は、リスニング学習中に聞き取れない語句や理解できない語句があった場合に、その語句を理解できる他の語句に置き換える最も基本的な置き換え処理動作の実施例である。図5は、本実施例1による語句の置き換え例を示す説明図、図6は置き換え処理動作を示すフローチャートである。以下、図6に示すフローチャートに従い、図5に示す説明図を参照しつつ本実施例1の語句置き換え処理動作を説明する。
まず、入力部2のメニュー23を押して電源をオンし(ステップS1)、メニュー画面から今回リスニング用の文章を選択すると(ステップS2)、図5(a)に示すように、表示部4にリスニング用の文章が表示される。この状態でプレイ/ポーズキー26が押されると(ステップS3)、表示文章の左上から音声出力されてリスニングが開始される(ステップS4)。
この音声出力中において、制御部1は、入力部2の決定キー22が押されたか否かを常に監視する(ステップS5)。ここで、リスニング途中において、ユーザは、聞き取りにくい語句や理解できない語句があると、その時点で決定キー22を押す。例えば、図5(a)に示す文章において、画面下から1行目の「According to」が聞こえたときにユーザが決定キー22を押したとすると、制御部1は音声出力を停止し、図5(b)に示すように、表示画面上の文章の「According to」のところに下線を引く(ステップS6)。これを見たユーザが、この下線の個所で正しいことを確認後、プレイ/ポーズキー26を押すと、制御部1は、辞書データ記憶部13に記憶されている図4に示す辞書データから、「According to」の置き換え語句の候補の絞り込みを開始し(ステップS7)、置き換え語句として「Said by」を確定すると(ステップS8)、図5(c)に示すように、「According to」を「Said by」に置き換えた文章を画面に表示し、かつ、その置き換えた語句から再度音声出力を開始する(ステップS9)。ここで、ステップS8の置き換え語句の確定は、置き換える前の語句(単語)の属性(品詞)を判別し、同じ品詞の語句を選択する。すなわち、置き換える前の語句(単語)が名詞である場合には置き換え後の単語も名詞を選択し、形容詞のときには形容詞を選択し、副詞のときには副詞を選択する。
制御部1は、最初にリスニング用に選択された文章の最後まで音声出力するまで(ステップS10でYesと判断されるまで)の間、決定キー22が押されるたびに、上記ステップS4〜ステップS10の処理を繰り返し、文章の最後まで音声出力すると(ステップS10でYesと判断されると)、音声出力を終了する。このように、本実施例1では、ユーザが決定キー22を押すたびに、その押された語句を別の語句に置き換えてそこから音声出力を再度開始するようになっている。
上記実施例1では、リスニング途中において、例えば「According to」が聞こえたときにユーザが決定キー22を押すと、当該「According to」が選択されるようになっているが、ユーザが決定キー22を押すタイミングは一定ではないので、いつもこのタイミングで押せるとは限らない。タイミングがずれた場合には、別の語句が選択される場合もある。本実施例2は、このような場合に、選択する語句をユーザが確定するための実施例である。
すなわち、本実施例2では、リスニング途中において、「According to」が聞こえたときにユーザが決定キー22を押したつもりであったが、実際には図7(a)に示すように、「ABC news」に下線が引かれた場合、左右キー24(24a,24b)を用いて画面上のカーソル(図示省略)を「According to」の位置まで移動させる。これにより、図7(b)に示すように、「According to」に下線が引かれることになる。そして、下線の位置を確認したユーザがプレイ/ポーズキー26を押すことで、上記実施例1と同様、「According to」を「Said by」に置き換えた文章を画面に表示し、かつ、その置き換えた語句から再度音声出力を開始する。
このように、確定したい語句が違っていた場合には、左右キー24によって確定したい語句を選択することで、ユーザの所望する語句を簡単に確定することが可能となる。
上記実施例2では、決定キー22を押すタイミングのずれにより、ユーザが聞き取れなかった語句の位置と、実際に文章中に引かれた下線の位置とが異なっていた場合に、単純に左右キー24を操作して1単語ずつ下線を移動させて、聞き取れなかった語句に下線を引く構成としているが、本実施例3では、決定キー22が押されたとき、その押された時点から一定時間前までの単語を候補範囲として選択し、その中から聞き取れなかった語句(本実施例3では単語)を選択する実施例である。
すなわち、本実施例3では、決定キー24が押された時点から例えば3秒前までの単語を候補単語として選択する。具体的には、例えば図8(a)に示すように、「The XYZ space plan succeed third round of rocket launch yersterday.・・・」と音声出力された文章において、「succeed」が聞き取れなかったために、「yersterday」が発音される直前にユーザが決定キー22を押したとすると、この「yersterday」が発音される直前の時点t1から3秒前までの単語は、図8(b)に示すように、「launch」、「rocket」、「of」、「round」、「third」、「succeed」、「plan」、「space」、「XYZ」の9単語であり、その次の「The」は、t1から3.2秒後となるため、対象外となる。
図9は、上記で説明した候補単語をリストアップする処理手順を示すフローチャートである。候補単語をリストアップするため、制御部1の図示しないメモリ部には候補単語リストを格納する領域が設けられている。
すなわち、制御部1は、まずこの候補単語リストをクリアする(ステップS11)。そして、リスニング学習中において決定キー22か押されると、その押された時点t1の直前の再生単語を取得し(ステップS12)、これを候補単語リストに追加する(ステップS13)。上記の例で言えば、「launch」を取得し、これを候補単語リストに追加する(ステップS13)。
次に制御部1は、その一つ前の単語を取得し(ステップS14)、取得した単語が時点t1から3秒前以内に発音されたか否かを判断し(ステップS15)、3秒以内に発音された単語である場合(ステップS15でYesと判断された場合)には、ステップS13に戻ってその単語を候補単語リストに追加する。
このようなステップS13〜ステップS15の処理を、ステップS15で取得した単語が時点t1から3秒を超えていると判断されるまで繰り返して、処理を終了する。これにより、候補単語リストには、図8(b)に示す9個の単語がリストアップされることになる。
ここで、このリストアップされた図8(b)に示す候補単語リストを表示部4にそのまま表示して、その中からユーザが聞き取れなかった単語を直接選択するようにしてもよいが、本実施例3では、さらに、このリストアップされた候補単語リストをもとに、図10(a)に示すように候補絞り込みテーブルを作成する。この候補絞り込みテーブルは、各候補の単語と、その単語の発音された時間(時点t1の何秒前に発音されたかを示す時間)と、各単語に予め設定されている難易度と、属性とからなっている。ここで、制御部1は、これら9個の単語を難易度別にソートして、図10(b)に示すように、上位に難易度の高い単語がくるように並べ替えを行って表示部4に表示する。ユーザの学習レベルにもよるが、通常は難易度の高い単語に下線が引かれる場合が多いので、このように難易度順にソートして表示することで、ユーザの選択したい単語が上位にきている可能性が高く、より選び易い表示形態とすることができる。
上記実施例2では、語句を選択する場合に、ユーザ自身が左右キー24を操作して選択する実施例であった。また、上記実施例3も、候補単語リストの中から選択する実施例であったが、本実施例4では、最初の単語の選択を自動的に行う実施例である。
すなわち、本実施例4では、リスニング途中において、例えば「round」が聞こえたときにユーザが決定キー22を押したつもりであったが、実際には図11(a)に示すように、「of」に下線が引かれた場合、制御部1は、前置詞である「of」を選択するケースは少ないと判断し、この場合には一つ前の単語である「round」を自動的に選択する。なお、一つ前の単語も前置詞や代名詞であった場合にはさらにもう一つ前の単語を選択する。すなわち、選択する単語が前置詞や代名詞以外の単語のところまで戻るようになっている。これにより、決定キー22の押すタイミングが多少遅れた場合でも、ユーザが選択した単語に下線を引ける可能性が高くなる。
なお、このようにして単語を選択しても、それがユーザの選択した単語でなかった場合には、上記実施例2と同様に、その後は左右キー24の操作によって所望する単語を選択できるようにすればよい。
そして、下線の位置を確認したユーザがプレイ/ポーズキー26を押すことで、辞書データ記憶部13に記憶されている辞書データから、「round」の置き換え単語の候補の絞り込みを行う。絞り込みは、文章中の「round」の属性(品詞)を判別し、置き換え単語として同じ属性の単語、ここでは「cycle」を確定すると、図11(c)に示すように、「round」を「cycle」に置き換えた文章を画面に表示し、かつ、その置き換えた単語から再度音声出力を開始する。
このように、確定したい単語が違っていた場合には、装置側で自動的に判断して適当な単語を選択することで、ユーザの聞きとれなかった単語等を簡単に確定することが可能となる。
本実施例5は、選択した置き換え用の単語が複数個ある場合に、その中から一つの単語を確定する実施例である。
例えば、上記実施例4のケースの「round」は、辞書データ記憶部13に記憶されている辞書データによれば、属性の同じ名詞では、「sphere」と「set」と「tiem」の3個がある。従って、本実施例5では、図12に示すように、これらを斜線で区切って併記する形で置き換えて表示する。そして、その置き換えた単語から再度音声出力を開始する。すなわち、この場合には、併記した「sphere」、「set」、「time」を順次音声出力する。これにより、ユーザは、この文章で使われている「round」の意味が、「sphere」または「set」または「time」と置き換えたときと同じ意味であることを認識できるので、リスニング学習をより効果的に行うことができる。
本実施例6は、選択した置き換え用の単語が複数個ある場合に、上記実施例5のようにそれらを併記して表示し、かつ読み上げるのではなく、その中から一つの単語を確定する実施例である。以下、図13に示すフローチャートを参照して説明する。
例えば、上記実施例4のケースの「round」は、辞書データ記憶部13に記憶されている辞書データによれば、属性の同じ名詞では、「sphere」、「set」、「time」の3個存在する。従って、ステップS21で示すように、解らない単語として「round」が選択された場合、属性判断の結果、名詞と判断された場合には、次のステップS22での判断がYesとなり、ステップS23の構文解析を行って、3個の単語から1個の単語に絞ることになる。
ここで、構文解析自体は従来から行われている手法であるが、最も簡単な手法としては、1つ前の単語を参照して構文解析を行うことが考えられる。そして、1つ前の単語まで含めて構文解析しても置き換え単語の候補が絞れなかった場合には、さらに1つ前の単語まで含めて構文解析する。このようにして何個か前の単語まで含めて構文解析しても候補が絞れなかった場合には、次に1つ後ろの単語まで含めて構文解析を行い、それでも置き換え単語の候補が絞れなかった場合には、さらに1つ後ろの単語まで含めて構文解析を行う。このような手法により構文解析を行うことで、3個の単語「sphere」、「set」、「time」の中から最終的に1個の単語を置き換え単語として確定する。図13のステップS21において示している例文の場合、「round」の前の単語が「third」という数詞であるので、置き換え単語として「set」を選択し、ステップS24で示すように、「round」を「set」に置き換えて表示し、その置き換えた単語から再度音声出力を開始する。これにより、ユーザは、この文章で使われている「round」の意味が、「set」と置き換えたときと同じ意味であることを認識できるので、リスニング学習をより効果的に行うことができる。
なお、ステップS22での判断の結果がNo、すなわち置き換え単語の候補が1個しかなかった場合には、構文解析を行うことなく、その単語に置き換えて表示し(ステップS25)、その単語から再度音声出力を開始することになる。
本実施例7は、選択した置き換え用の単語が複数個ある場合に、上記実施例6のように構文解析を行うのではなく、難易度レベルによってその中から一つの単語を確定する実施例である。以下、図14に示すフローチャートを参照して説明する。
例えば、上記実施例4のケースの「round」は、辞書データ記憶部13に記憶されている辞書データによれば、属性の同じ名詞では、「sphere」、「set」、「time」の3個存在する。従って、ステップS31で示すように、解らない単語として「round」が選択された場合、属性判断の結果、名詞と判断された場合には、次のステップS32での判断がYesとなり、ステップS33に進む。
ステップS33では、3個の単語から1個の単語に絞るのに、辞書データ記憶部13に記憶されている辞書データの難易度レベルを利用する。具体的には、辞書データより、「round」の難易度レベルが(4)であるので、これより低い難易度レベルの単語を選択する。この場合、本実施例7では、「set」の難易度レベルが(3)、「time」の難易度レベルが(2)であり、両方とも「round」の難易度レベルより低い。従って、この場合には一つ下の難易度レベルを選択する。すなわち、置き換え単語として「set」を選択し、ステップS34で示すように、「round」を「set」に置き換えて表示し、その置き換えた単語から再度音声出力を開始する。これにより、ユーザは、この文章で使われている「round」の意味が、「set」と置き換えたときと同じ意味であることを認識できる。
なお、このような単語の置き換えによってもユーザが理解できず、「set」のところで再び決定キー22を押した場合には、上記ステップS31〜ステップS33の処理を再度実行し、ステップS33では、「set」の難易度レベル(3)より一つ下の難易度レベルである「time」を選択し、ステップS34′で示すように、「round」を「time」に置き換えて表示し、その置き換えた単語から再度音声出力を開始する。
なお、ステップS32での判断の結果がNo、すなわち置き換え単語の候補が1個しかなかった場合には、難易度レベルを参照することなく、その単語に置き換えて表示し(ステップS35)、その単語から再度音声出力を開始することになる。
本実施例8は、上記実施例6に上記実施例7をさらに組み合わせた実施例である。以下、図15に示すフローチャートを参照して説明する。
例えば、「round」は、辞書データ記憶部13に記憶されている辞書データによれば、属性の同じ名詞では、「sphere」、「set」、「time」の3個存在する。従って、解らない単語として「round」が選択された場合、ステップS41における属性判断の結果、名詞と判断された場合には、次のステップS42での判断がYesとなり、ステップS43の構文解析を行って、3個の単語から1個の単語に絞ることになる。
そして、構文解析を行った結果、3個の単語「sphere」、「set」、「time」の中から最終的に1個の単語を置き換え単語として選択できた場合(ステップS44でYesと判断された場合)には、「round」をその選択した単語に置き換えて表示し(ステップS47)、その置き換えた単語から再度音声出力を開始する。
一方、構文解析を行っても、3個の単語から1個の単語に絞ることができなかった場合(ステップS44でNoと判断された場合)には、置き換え候補の単語の難易度レベルが置き換え前の単語の難易度レベルより下か否かを判断し(ステップS45)、難易度レベルが下である場合(ステップS45でYesと判断された場合)には、上記実施例7と同様にして難易度の低い単語を選択し(ステップS46)、「round」をその選択した単語に置き換えて表示し(ステップS47)、その置き換えた単語から再度音声出力を開始する。
また、ステップS45において、置き換え候補の単語の難易度レベルが置き換え前の単語の難易度レベルと同じレベルである場合には、その同じ難易度レベルの単語に置き換えて表示し(ステップS47)、その単語から再度音声出力を開始する。ただし、置き換え候補の単語の難易度レベルが置き換え前の単語の難易度レベルより上である場合も、その単語に置き換えて表示し、その単語から再度音声出力を開始するようにしてもよい。または、この場合には単語の置き換えを行わないようにしてもよい。
なお、ステップS42での判断の結果がNo、すなわち置き換え単語の候補が1個しかなかった場合には、構文解析や難易度レベルによる判断を行うことなく、その単語に置き換えて表示し(ステップS47)、その単語から再度音声出力を開始することになる。
上記実施例1〜実施例8は、基本的に語句または単語の置き換えによる音声出力時の読み替え手法に関する実施例であったが、本実施例9は、このような語句または単語の置き換えによる読み替え時に、表示部4への文章表示の表示形態を工夫した実施例である。すなわち、本実施例9では、予めユーザが設定した習熟度レベル(上級、中級、初級)に応じて、置き換え語句または単語(ただし、本実施例9では語句)の表示形態を異ならせている。ここで、上級は例えば大学生以上のレベル、中級は高校生レベル、初級は中学生レベルに対応させることができる。ただし、このような対応関係に限定されるものではない。習熟度レベルの設定は、メニューキー23を操作して習熟度レベルの選択画面を表示し、その中から所望するレベルを選択することで設定するようにすればよい。
そして、習熟度レベルとして上級が設定された場合には、図16に符号61で例文を示すように、上記実施例1〜実施例8の場合と同様、語句のみを置き換えた文章を表示する。この例では、「According to」を単に「Said by」に置き換えている。
また、習熟度レベルとして中級が設定された場合には、符号62aで示すように、置き換えた語句「Said by」を含む文章と、置き換え前の語句を使用した例文「According to Mack,it’s a great movie」とを表示する。
また、習熟度レベルとして初級が設定された場合には、符号63で示すように、置き換える前の語句を直接日本語に訳し、その日本語訳「〜によりますと」に置き換えて表示する。
なお、習熟度レベルとして中級が設定された場合には、符号62bで示すように、置き換えた語句「Said by」を含む文章と、その置き換え語句を使用した例文「Said by Mack,it’s a great movie」とを表示するようにしてもよい。
このように、表示形態をユーザが選択できるようにすることで、ユーザの習熟度レベルに合わせたリスニング学習を行うことができる。
上記実施例1〜9は、マーキングされた時点で、その語句または単語を他の語句または単語に置き換えてそこから再度音声再生を開始する実施例であるが、本実施例10は、マーキングされてもその時点では語句または単語の置き換えをせず、一文章を読み上げた後、マーキングのところに戻り、その語句または単語を他の語句または単語に置き換えて再度音声再生する実施例である。
今回リスニング用の文章データが、例えば図5(a)に示す文章であったとし、この文章の左上から音声出力されてリスニングが開始されている途中において、ユーザが「round」のところとを音声出力中に決定キー22を押した場合、制御部1は、決定キー22によりマーキングされた単語「round」を一旦内部メモリに保存するとともに、そのまま音声出力を継続し、次にユーザが「According to」のところを音声出力中に決定キー22を押した場合、制御部1は、決定キー22によりマーキングされた語句「According to」を一旦内部メモリに保存するとともに、そのまま音声出力を継続する。そして、「ABC news」まで音声出力し終わると(すなわち、一文章の読み上げを終了すると)、制御部1は、内部メモリに保存しておいた「round」と「According to」を他の単語または語句に置き換える。例えば「round」を「set」に置き換え、「According to」を「Said by」に置き換える。そして、この場合には最初にマーキングされて置き換えられた「set」に戻って、その文章の最後まで再度音声出力を開始する。ただし、置き換えられた単語の前後の文章のみを再度音声出力するようにしてもよい。例えば、「round」の場合には、その前後の単語を含めて「third round of」と読み上げ、次に「Said by」のところまでスキップし、「Said by」については、その後の語句を含めて「Said by ABC news」と読み上げてもよい。
上記実施例10は、一文章を読み上げた後に、マーキングのところに戻る実施例であったが、本実施例10では、複数文章を読み上げた後で、マーキングのところに戻る実施例である。
例えば、複数文章を図17に示すように、文章1、文章2、文章3の3文章とし、文章1では単語aのところと単語bのところにマーキングされ、文章2についてはマーキングがなく、文章3では単語cのところにマーキングされたとする。この場合、制御部1は、上記実施9と同様、各マーキングされた語句または単語「a」,「b」,「c」を一旦内部メモリに保存し、文章3の最後まで読み上げを終了すると、内部メモリに保存しておいた「a」,「b」,「c」を他の語句または単語(例えば、「a′」,「b′」,「c′」に置き換える。そして、この場合には最初にマーキングされて置き換えられた「a′」に戻って、その文章1の最後まで再度音声出力を行い、次にマーキングされていない文章2をスキップし、文章3のマーキングされて置き換えられた「c′」からその文章3の最後まで再度音声出力する。ただし、置き換えられた語句または単語の前後の文章のみを再度音声出力するようにしてもよい。例えば、「a′」の場合には、その前後の単語を含めて「・・a′・・」と読み上げ、次に「b′」のところまでスキップし、その前後の単語を含めて「・・b′・・」と読み上げ、次に「c′」のところまでスキップし、その前後の単語を含めて「・・c′・・」と読み上げてもよい。
上記各実施例1〜11では、決定キー22が1回押されると、その時点で次に読み上げるときに他の語句または単語に置き換えているが、最初の1回目、または2回目までは語句または単語を置き換えることなく、ただ単に再度の読み直しを行うだけとし、同じ語句または単語の位置で決定キー22が例えば3回押されたときに、その3回目で初めて、他の語句または単語と置き換えるようにしてもよい。すなわち、その語句または単語が単に聞きとれなかっただけであった場合に、再度の読み上げで聞きとれる場合もあるため、このような場合は語句または単語の置き換えが不要だからである。
例えば、上記実施例7では、難易度レベルに応じて、同じ単語の位置で決定キー22が押されるたびに、難易度レベルの低い単語に順次置き換えてきく構成であったが、本実施例12では、このように同じ単語を何度もマーキングした場合に、例えば4回マーキングすると、その時点で元の単語に戻すようにした実施例である。
すなわち、実施例7を例にとると、ユーザが、決定キー22を押して(1回目)、「round」を選択した場合、次の音声出力では、この「round」を「set」に置き換えて音声出力し、このときにユーザが決定キー22を押して(2回目)、「set」を選択した場合、次の音声出力では、この「set」を「time」に置き換えて音声出力し、このときにユーザが決定キー22を押して(3回目)、「time」を選択した場合、難易度(1)の単語がある場合には、「time」をその難易度(1)の単語に置き換えて音声出力する。そして、このときにユーザが決定キー22を押して(4回目)、難易度(1)の単語を選択した場合、制御部1は、同じ単語の位置で4回決定キー22が押されたと判断し、この時点で元の単語、すなわち「round」に戻して音声出力する。
このように、同じ単語が何度がマーキングされて他の単語に置き換えられた場合に、そのマーキング回数が予め設定された回数になると、選択された単語を元々の単語に戻して音声出力するようにしてもよい。
本発明の音声合成装置の構成例を示す機能ブロック図である。 テキストデータ記憶部に格納されているテキストデータ、及び音声データ記憶部に格納されている前記テキストデータに対応した音声データのデータ構成例を示す説明図である。 本発明の音声合成装置の外観図である。 辞書データ記憶部に記憶されている辞書データの構成例を示す説明図である。 実施例1による語句の置き換え例を示す説明図である。 実施例1の語句置き換え処理動作を示すフローチャートである。 実施例2の語句置き換え処理動作によるマーキング位置の修正処理を説明する図である。 実施例3の候補単語リストを作成する手順を示す説明図である。 実施例3の候補単語リストを作成する手順を示すフローチャートである。 実施例3の候補単語リストを難易度順にソートする例を示す説明図である。 実施例4の置き換え処理動作によるマーキング位置の修正処理を説明する図である。 実施例5の置き換え処理動作を説明する図である。 実施例6の置き換え処理動作の手順を示すフローチャートである。 実施例7の置き換え処理動作の手順を示すフローチャートである。 実施例8の置き換え処理動作の手順を示すフローチャートである。 実施例9の置き換え処理による表示形態の例を示す説明図である。 実施例11の複数文章を読み上げた後で、マーキングのところに戻る実施例を説明する図である。
符号の説明
1 制御部
2 入力部
3 分離情報検出部
4 表示部
5 音声出力部
11 制御データ記憶部
12 プログラム記憶部
13 辞書データ記憶部
14 テキストデータ記憶部
15 音声データ記憶部
21 検索キー
22 決定キー
23 メニューキー
24 左右キー24
25 上下キー25
26 プレイ/ポーズキー
41 表示コントローラ
42 LCDパネル
51 音声デコーダ
52 内部スピーカ

Claims (9)

  1. 文章を記憶する文章記憶手段と、前記文章記憶手段から任意の文章を読み出す読出し手段と、前記文章を音声で出力する音声合成手段と、を備え、前記読出し手段により読み出された文章を前記音声合成手段により音声で出力する音声合成装置において、
    前記文章を音声合成で音声出力中に語句を指示する指示手段と、
    前記指示手段により指示された語句を特定する語句特定手段と、
    語句ごとに指示した回数、または前記文章を読み出して音声出力した回数を記憶する回数記憶手段と、
    前記語句特定手段で特定された語句を前記回数記憶手段に記憶された回数に応じた語句に置き換える置換手段と、
    を備え、
    前記指示手段により指示された語句を前記置換手段によって置き換えた語句に置き換えて音声出力することを特徴とする音声合成装置。
  2. 語句の難易度を記憶する難易度レベル記憶手段をさらに備え、
    前記置換手段は、前記回数記憶手段に記憶された回数に応じて、難易度レベルの低い語句に置き換えることを特徴とする請求項1に記載の音声合成装置。
  3. 文章中の置き換えられた語句の位置から再度音声出力を開始することを特徴とする請求項1または請求項2に記載の音声合成装置。
  4. 前記指示された語句が含まれる一文章を音声出力後に、文章中の置き換えられた語句の位置から再度音声出力を開始することを特徴とする請求項1または請求項2に記載の音声合成装置。
  5. 前記指示された語句が含まれる一文章を音声出力後に、文章中の置き換えられた語句の位置から再度音声出力を開始するとともに、指示された語句を含まない文については音声出力しないことを特徴とする請求項1または請求項2に記載の音声合成装置。
  6. 習熟度レベルを設定する設定手段をさらに備え、
    前記置換手段は、前記語句特定手段で特定された語句を前記記憶手段に記憶された回数に応じた語句に置き換えるとき、さらに、設定された習熟度レベルに応じた語句に置き換えることを特徴とする請求項1または請求項2に記載の音声合成装置。
  7. 前記音声出力する回数を任意に設定する音声出力回数設定手段をさらに備え、
    前記文章の音声出力回数が前記音声出力回数設定手段の設定回数を超えた場合、元の語句に戻す置き換えを行うことを特徴とする請求項1または請求項2に記載の音声合成装置。
  8. 読出し手段により文章記憶手段から文章を読み出すステップと、
    音声合成手段により読み出した文章を音声で出力するステップと、
    前記文章を音声合成で音声出力中の語句が指示手段により指示されると、該指示された語句を特定するステップと、
    語句ごとに指示した回数、または前記文章を読み出して音声出力した回数を回数記憶手段に記憶するステップと、
    前記指示手段により指示された語句を、前記回数記憶手段に記憶された回数に応じた語句に置換手段によって置き換えるステップと、
    前記音声合成手段により前記置き換えた語句を音声出力するステップと、
    を実行することを特徴とするコンピュータ読み取り可能な音声合成プログラム。
  9. 難易度レベル記憶手段により語句の難易度を記憶するステップをさらに備え、
    前記置換手段は、前記回数記憶手段に記憶された回数に応じて、難易度レベルの低い語句に置き換えること、
    を特徴とする請求項8に記載のコンピュータ読み取り可能な音声合成プログラム。
JP2006337212A 2006-12-14 2006-12-14 音声合成装置及び音声合成プログラム Expired - Fee Related JP5057764B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006337212A JP5057764B2 (ja) 2006-12-14 2006-12-14 音声合成装置及び音声合成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006337212A JP5057764B2 (ja) 2006-12-14 2006-12-14 音声合成装置及び音声合成プログラム

Publications (3)

Publication Number Publication Date
JP2008152356A JP2008152356A (ja) 2008-07-03
JP2008152356A5 JP2008152356A5 (ja) 2010-02-04
JP5057764B2 true JP5057764B2 (ja) 2012-10-24

Family

ID=39654497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006337212A Expired - Fee Related JP5057764B2 (ja) 2006-12-14 2006-12-14 音声合成装置及び音声合成プログラム

Country Status (1)

Country Link
JP (1) JP5057764B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5574241B2 (ja) * 2011-02-25 2014-08-20 独立行政法人情報通信研究機構 敬語誤用判定プログラム、及び敬語誤用判定装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0335296A (ja) * 1989-06-30 1991-02-15 Sharp Corp テキスト音声合成装置
JP3465861B2 (ja) * 1995-08-09 2003-11-10 株式会社リコー 情報出力装置
JP2000267687A (ja) * 1999-03-19 2000-09-29 Mitsubishi Electric Corp 音声応答装置

Also Published As

Publication number Publication date
JP2008152356A (ja) 2008-07-03

Similar Documents

Publication Publication Date Title
US20130196292A1 (en) Method and system for multimedia-based language-learning, and computer program therefor
JP2004347786A (ja) 音声表示出力制御装置、画像表示制御装置、および音声表示出力制御処理プログラム、画像表示制御処理プログラム
JP2008268684A (ja) 音声再生装置、電子辞書、音声再生方法、音声再生プログラム
JP5842452B2 (ja) 音声学習装置及び音声学習プログラム
JP2016045420A (ja) 発音学習支援装置およびプログラム
JP5083155B2 (ja) 辞書機能を備えた電子装置およびプログラム
CN110263334A (zh) 一种辅助外语学习的方法和可读存储介质
JP2008186376A (ja) 音声出力装置及び音声出力プログラム
JP2007219218A (ja) 語学学習用電子機器および訳文再生方法
JP5057764B2 (ja) 音声合成装置及び音声合成プログラム
JP6641680B2 (ja) 音声出力装置、音声出力プログラムおよび音声出力方法
JP4529625B2 (ja) 情報表示制御装置及びプログラム
JP2018146961A (ja) 音声再生装置及び音楽再生プログラム
JP2020140374A (ja) 電子図書再生装置及び電子図書再生プログラム
JP7013702B2 (ja) 学習支援装置、学習支援方法、及び、プログラム
KR20170097419A (ko) 한국어 학습 시스템 및 이를 이용한 한국어 학습 방법
JP2009175941A (ja) 電子辞書装置
JP2016157042A (ja) 電子機器およびプログラム
JP6752046B2 (ja) 電子機器、その制御方法および制御プログラム
JP2005292303A (ja) 情報表示制御装置、情報表示制御処理プログラム、および情報管理サーバ
JP2012098753A (ja) 音声表示出力制御装置、画像表示制御装置、および音声表示出力制御処理プログラム、画像表示制御処理プログラム
JP5733344B2 (ja) 電子装置、表示端末および本体装置
JP4985714B2 (ja) 音声表示出力制御装置、および音声表示出力制御処理プログラム
JP2008058678A (ja) 音声出力装置及び音声出力プログラム
JP4483509B2 (ja) 辞書情報表示制御装置及び辞書情報表示制御方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091211

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091211

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091211

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120731

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120731

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150810

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5057764

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees