JP2005106844A - 音声出力装置、サーバ及びプログラム - Google Patents

音声出力装置、サーバ及びプログラム Download PDF

Info

Publication number
JP2005106844A
JP2005106844A JP2003335873A JP2003335873A JP2005106844A JP 2005106844 A JP2005106844 A JP 2005106844A JP 2003335873 A JP2003335873 A JP 2003335873A JP 2003335873 A JP2003335873 A JP 2003335873A JP 2005106844 A JP2005106844 A JP 2005106844A
Authority
JP
Japan
Prior art keywords
word
phoneme
phonetic symbol
data
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003335873A
Other languages
English (en)
Inventor
Hideo Umehara
英生 梅原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2003335873A priority Critical patent/JP2005106844A/ja
Publication of JP2005106844A publication Critical patent/JP2005106844A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 発音記号に基づいた音声出力と、単語に対応づけられたネイティブの音声出力を比較して聞くことができる外国語の発音学習に適切な音声出力を実現すること。
【解決手段】 CPU10は、選択単語格納領域304に記憶された選択単語について、発音記号通りに音声を出力する場合には、音素テーブル206から発音記号に対応する音素データを抽出し、音声出力部60に出力する。また、当該選択単語について、ネイティブの発音を出力する場合には、単語音声テーブル210から単語音声データを抽出し、音声出力部60に出力する。
【選択図】 図2

Description

本発明は、音声出力装置、サーバ及びプログラムに関する。
従来から、英和辞典等の辞書データベース(以下、適宜データベースを「DB」という。)を内蔵した電子辞書装置と呼ばれる機器が知られている。辞書DBには、見出語と、当該見出語を説明・解説する説明情報とを対応づけた辞書データが多数蓄積記憶されている。
また、電子辞書装置には、辞書DBに含まれる見出語の音声データを多数蓄積記憶し、適宜再生・出力する音声出力装置があることが知られている。この音声出力装置は、外国語を母国語とするいわゆるネイティブが、単語毎に発音した音声を音声データとして記憶しており、所定の操作により、選択された単語の音声データを出力し、再生する。
さらに、選択された単語の音声データを再生出力する際に、音声データを再生・出力する速度を早くしたり、遅くしたりすることができる発明が知られている(例えば、特許文献1参照)。
特開2003−084789
しかし、ネイティブが発音する音声は、辞書DBに記憶されている発音記号通りには発音されておらず、発音記号とは異なることが多かった。例えば、発音記号には表記されていても、実際には発音が省略されることや、他の発音と連続して発音されることにより、別の発音になっている場合がある。これは、各発音記号が組み合わされ繋がった音声としてネイティブによって発音されるときに、一連の発音が微妙に変化してしまうからであった。
従って、ユーザが電子辞書装置において表示された発音記号に基づいて学習をしたとしても、ネイティブが発音する音声を聞き取ることが出来なかった。特に初学者が、発音記号に基づいた学習を行いたい場合に、ネイティブが発音する音声データをゆっくり再生したとしても、発音記号通りには発音されておらず、初学者が発音を理解するのは困難であった。
そこで、本発明は以上の課題に鑑みてなされたものであり、発音記号に基づいた音声出力と、単語に対応づけられたネイティブの音声出力を比較して聞くことができ、外国語の発音学習に適切な音声出力ができる音声出力装置を実現することを目的とすることである。
以上の課題を解決するため、請求項1に記載の発明の音声出力装置は、
単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶手段(例えば、ROM20;単語音声テーブル210)と、
各発音記号の音素データを記憶した音素記憶手段(例えば;ROM20;音素テーブル206)と、
前記単語記憶手段に記憶された各単語の発音データを記憶した発音記憶手段(例えば、ROM20;単語音声テーブル210)と、
前記単語記憶手段に記憶された単語の中から一の単語を選択する単語選択手段(例えば、図2のCPU10;図5のステップA22)と、
この単語選択手段により選択された単語に対応する発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶手段から読み出して順番に音声出力する音素出力手段(例えば、図2のCPU10;図6のステップB18)と、
前記選択された単語に対応する発音データを前記発音記憶手段から読み出して音声出力する単語音声出力手段(例えば、図2のCPU10;図6のステップB66)と、
を備えることを特徴とする。
また、請求項9に記載のプログラムは、
コンピュータに、
単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶機能(例えば、ROM20;単語音声テーブル210)と、
各発音記号の音素データを記憶した音素記憶機能(例えば;ROM20;音素テーブル206)と、
前記単語記憶機能に記憶された各単語の発音データを記憶した発音記憶機能(例えば、ROM20;単語音声テーブル210)と、
前記単語記憶機能に記憶された単語の中から一の単語を選択する単語選択機能(例えば、図2のCPU10;図5のステップA22)と、
この単語選択機能により選択された単語に対応する発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶機能から読み出して順番に音声出力する音素出力機能(例えば、図2のCPU10;図6のステップB18)と、
前記選択された単語に対応する発音データを前記発音記憶機能から読み出して音声出力する単語音声出力機能(例えば、図2のCPU10;図6のステップB66)と、
を実現させることを特徴とする。
請求項1又は9に記載の発明によれば、単語の発音記号列中の発音記号に対応する音素データを順に読み出すことにより単語を音声出力することができる。また、単語に対応する音声データに基づいて音声出力することができる。従って、同じ単語であっても、発音記号に基づいた音声と、単語に対応づけて記憶された音声とを出力することができ、ユーザは比較して音声を聞き取ることが可能となり、発音学習に適した利用ができる。
請求項2に記載の発明は、請求項1に記載の音声出力装置において、前記単語選択手段により選択された単語の発音記号列を前記単語記憶手段から読み出して表示するとともに、前記音素出力手段により順番に音声出力される音素データに対応する発音記号を順番に特別表示する発音記号表示手段(例えば、図2のCPU10;図6のステップB20)を更に備えることを特徴とする。
請求項2に記載の発明によれば、選択された単語に対応する音素データを順番に出力する際に、音素データに対応する発音記号が特別表示される。従って、現在出力されている音素データが、どの発音記号に対応しているかをユーザが容易に認識することが可能となり、発音学習の便宜に資することができる。
請求項3に記載の発明は、請求項1又は2に記載の音声出力装置において、多段階の音声出力速度による前記音素出力手段の音声出力を制御するとともに、前記音素出力手段と、前記単語音声出力手段との音声出力を切り替えることにより、前記単語選択手段により選択された単語の音声出力速度を段階的に変更する制御を行う出力制御手段(例えば、図2のCPU10;図6のステップB10)を更に備えることを特徴とする。
請求項3に記載の発明によれば、選択された単語の音声出力の速度を段階的に変更することができる。従って、選択された単語の音声出力を行う際に、ユーザは自分に適した再生速度を設定することが可能となる。
請求項4に記載の音声出力装置は、
単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶手段(例えば、図2のROM20;単語音声テーブル210)と、
各発音記号の音素データを記憶した音素記憶手段(例えば、図2のROM20;音素テーブル206)と、
前記単語記憶手段に記憶された単語の中から一の単語を選択する単語選択手段(例えば、図2のCPU10;図5のステップA22)と、
この単語選択手段により選択された単語に対応する発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶手段から読み出して順番に音声出力する音素出力手段(例えば、図2のCPU10;図6のステップB18)と、
前記音素出力手段による音声出力の速度を段階的に変更する制御を行う出力制御手段(例えば、図2のCPU10;図6のステップB10)と、
前記選択された単語の発音記号列を前記単語記憶手段から読み出して表示するとともに、前記音素出力手段により順番に音声出力される音素データに対応する発音記号を順番に特別表示する発音記号表示手段(例えば、図2のCPU10;図6のステップB20)と、
を備えることを特徴とする。
また、請求項10に記載のプログラムは、
コンピュータに、
単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶機能(例えば、図2のROM20;単語音声テーブル210)と、
各発音記号の音素データを記憶した音素記憶機能(例えば、図2のROM20;音素テーブル206)と、
前記単語記憶機能に記憶された単語の中から一の単語を選択する単語選択機能(例えば、図2のCPU10;図5のステップA22)と、
この単語選択機能により選択された単語に対応する発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶機能から読み出して順番に音声出力する音素出力機能(例えば、図2のCPU10;図6のステップB18)と、
前記音素出力機能による音声出力の速度を段階的に変更する制御を行う出力制御機能(例えば、図2のCPU10;図6のステップB10)と、
前記選択された単語の発音記号列を前記単語記憶機能から読み出して表示するとともに、前記音素出力機能により順番に音声出力される音素データに対応する発音記号を順番に特別表示する発音記号表示機能(例えば、図2のCPU10;図6のステップB20)と、
を実現させることを特徴とする。
請求項4又は10に記載の発明によれば、音素データを順に出力する際に、音声出力の速度を段階的に変更することができ、さらに表示されている音素データに対応する発音記号を特別表示することができる。従って、同じ単語であっても、速度を変更することが可能となることから、ユーザが所望の速度で音声を出力することが可能となる。
請求項5に記載の発明は、請求項3又は4に記載の音声出力装置において、
学習レベルを決定するレベル決定手段(例えば、図2のCPU10;図12のステップC30)を更に備えるとともに、
前記出力制御手段は、前記レベル決定手段により決定された学習レベルに応じて音声出力速度を変更するレベル適応変更手段(例えば、図2のCPう10;図13のステップD10)を有する、
ことを特徴とする。
請求項5に記載の発明によれば、学習レベルに応じて音声出力の速度を変更することができる。従って、ユーザは自分の学習レベルを決定することにより、学習レベルに適した音声出力の速度によって音声を出力することが可能となる。
請求項6に記載の発明は、請求項請求項5に記載の音声出力装置において、
前記単語選択手段により選択された単語毎の音声出力回数を記憶する出力回数記憶手段(例えば、図10のRAM32;学習履歴テーブル320)を更に備え、
前記レベル決定手段は、前記単語選択手段により選択された単語の音声出力回数を前記出力回数記憶手段から読み出し、読み出した音声出力回数に応じて学習レベルを決定する出力回数適応レベル決定手段(例えば、図2のCPU10;図13のステップD10)を有する、
ことを特徴とする。
請求項6に記載の発明によれば、選択された単語の音声出力回数に応じて学習レベルを決定し、学習レベルに適した音声出力の速度で音声を出力することが出来る。従って、ユーザは学習レベルを指定しなくとも、音声出力回数に応じた学習レベルに基づいて、学習レベルに適した音声出力速度によって音声を出力することが可能となる。
請求項7に記載のサーバは、
所定の通信回線を介して利用者端末と接続されるサーバにおいて、
単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶手段(例えば、図17の記憶部714)と、
各発音記号の音素データを記憶した音素記憶手段(例えば、図17の記憶部714)と、
前記単語記憶手段に記憶された各単語の発音データを記憶した発音記憶手段(例えば、図17の記憶部714)と、
前記単語記憶手段に記憶された単語の中から一の単語を前記利用者端末から受信する単語受信手段(例えば、図17の通信装置708)と、
この単語受信手段により受信された単語に対応する発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶手段から読み出して前記利用者端末に順番に送信する音素送信手段(例えば、図17の通信装置708)と、
前記選択された単語に対応する発音データを前記発音記憶手段から読み出して前記利用者端末に送信する単語音声送信手段(例えば、図17の通信装置708)と、
を備えることを特徴とする。
また、請求項11に記載のプログラムは、
所定の通信回線を介して利用者端末と接続されるコンピュータに、
単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶機能(例えば、図17の記憶部714)と、
各発音記号の音素データを記憶した音素記憶機能(例えば、図17の記憶部714)と、
前記単語記憶機能に記憶された各単語の発音データを記憶した発音記憶機能(例えば、図17の記憶部714)と、
前記単語記憶機能に記憶された単語の中から一の単語を前記利用者端末から受信する単語受信機能(例えば、図17の通信装置708)と、
この単語受信機能により受信された単語に対応する発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶機能から読み出して前記利用者端末に順番に送信する音素送信機能(例えば、図17の通信装置708)と、
前記選択された単語に対応する発音データを前記発音記憶機能から読み出して前記利用者端末に送信する単語音声送信機能(例えば、図17の通信装置708)と、
を実現させることを特徴とする。
請求項7又は11に記載の発明によれば、端末から受信した単語について、音素データを順番に送信することができ、利用者端末においては、受信された単語の発音記号列中の発音記号に対応する音素データを順に読み出すことにより単語を音声出力することができる。また、単語に対応する音声データを送信することができ、利用者端末においては、受信された単語に対応する音声データに基づいて音声出力することができる。
請求項8に記載のサーバは、
所定の通信回線を介して利用者端末と接続されるサーバにおいて、
単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶手段(例えば、図17の記憶部714)と、
各発音記号の音素データを記憶した音素記憶手段(例えば、図17の記憶部714)と、
前記単語記憶手段に記憶された単語の中から一の単語を前記利用者端末から受信する単語受信手段(例えば、図17の通信装置708)と、
この単語受信手段により受信された単語に対応する発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶手段から読み出して順番につなげることにより、再生速度が異なる複数の連続再生用合成音素データを生成する合成音素データ生成手段(例えば、図17のCPU702)と、
前記受信された単語の発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列を表示するとともに、前記生成された各連続再生用合成音素データの再生に同期して発音記号を順番に特別表示する制御を行う発音記号表示制御データを生成する発音記号表示データ生成手段(例えば、図17のCPU702)と、
前記合成音素データ生成手段により生成された連続再生用合成音素データ及び前記発音記号表示データ生成手段により生成された発音記号表示制御データを前記利用者端末に送信する送信手段(例えば、図17の通信装置708)と、
を備えることを特徴とする。
また、請求項12に記載のプログラムは、所定の通信回線を介して利用者端末と接続されるコンピュータに、
単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶機能(例えば、図17の記憶部714)と、
各発音記号の音素データを記憶した音素記憶機能(例えば、図17の記憶部714)と、
前記単語記憶機能に記憶された単語の中から一の単語を前記利用者端末から受信する単語受信機能(例えば、図17の通信装置708)と、
この単語受信機能により受信された単語に対応する発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶機能から読み出して順番につなげることにより、再生速度が異なる複数の連続再生用合成音素データを生成する合成音素データ生成機能(例えば、図17のCPU702)と、
前記受信された単語の発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列を表示するとともに、前記生成された各連続再生用合成音素データの再生に同期して発音記号を順番に特別表示する制御を行う発音記号表示制御データを生成する発音記号表示データ生成機能(例えば、図17のCPU702)と、
前記合成音素データ生成機能により生成された連続再生用合成音素データ及び前記発音記号表示データ生成機能により生成された発音記号表示制御データを前記利用者端末に送信する送信機能(例えば、図17の通信装置708)と、
を実現させることを特徴とする。
請求項8又は12に記載の発明は、受信した単語に対応する音素データを順に送信する際に、送信するタイミングを段階的に変更することができ、端末に表示されている音素データを特別表示する信号を送信することが可能となる。
請求項1又は9に記載の発明によれば、単語の発音記号列中の発音記号に対応する音素データを順に読み出すことにより単語を音声出力することができる。また、単語に対応する音声データに基づいて音声出力することができる。従って、同じ単語であっても、発音記号に基づいた音声と、単語に対応づけて記憶された音声とを出力することができ、ユーザは比較して音声を聞き取ることが可能となり、発音学習に適した利用ができる。
請求項2に記載の発明によれば、選択された単語に対応する音素データを順番に出力する際に、音素データに対応する発音記号が特別表示される。従って、現在出力されている音素データが、どの発音記号に対応しているかをユーザが容易に認識することが可能となり、発音学習の便宜に資することができる。
請求項3に記載の発明によれば、選択された単語の音声出力速度を段階的に変更することが出来る。従って、選択された単語の音声出力を行う際に、ユーザは自分に適した再生速度を設定することが可能となる。
請求項4又は10に記載の発明によれば、音素データを順に出力する際に、音声出力の速度を段階的に変更することができ、表示されている音素データに対応する発音記号を特別表示することが可能となる。従って、同じ単語であっても、速度を変更することが可能となることから、ユーザが所望の速度で音声を出力することができる。
請求項5に記載の発明によれば、学習レベルに応じて音声出力速度を変更することが出来る。従って、ユーザは自分の学習レベルを決定することにより、学習レベルに適した音声出力速度によって音声を出力することが可能となる。
請求項6に記載の発明によれば、選択された単語の音声出力回数に応じて学習レベルを決定し、学習レベルに適した音声出力速度で音声を出力することが出来る。従って、ユーザは学習レベルを指定しなくとも、音声出力回数に応じた学習レベルに基づいて、学習レベルに適した音声出力速度によって音声を出力することが可能となる。
請求項7又は11に記載の発明によれば、端末から受信した単語について、音素データを順番に送信することができ、利用者端末においては、受信された単語の発音記号列中の発音記号に対応する音素データを順に読み出すことにより単語を音声出力することができる。また、単語に対応する音声データを送信することができ、利用者端末においては、受信された単語に対応する音声データに基づいて音声出力することができる。
請求項8又は12に記載の発明は、受信した単語に対応する音素データを順に送信する際に、送信するタイミングを段階的に変更することができ、端末に表示されている音素データを特別表示する信号を送信することが可能となる。
〔第1の実施の形態〕
電子辞書装置には、国語辞典、英和辞典、和英辞典、類義語辞典等の各種電子辞書データベース(辞書DB)が内蔵されている。この辞書DBには、見出語に対応付けて、当該見出語を説明するための文字データや、画像データ、動画データ、音声データ等が記憶される。ユーザは、辞書種別を選択して入力文字を入力することにより、当該入力文字に対応する見出語の説明情報等を表示させることができる。尚、以下では、電子辞書装置に、英和辞典の辞書DBが内蔵されている場合を例にとって説明する。
[1.1 構成]
図1は、電子辞書装置1の概観図の一例である。同図に示すように、電子辞書装置1は、ディスプレイ3と、各種キー群5と、スピーカ6とを備えて構成されている。
ディスプレイ3は、上述した各種キーの押下に応じた文字や符号等、電子辞書装置1を使用するために必要な各種データが表示される部分である。ディスプレイ3は、LCD(Liquid Crystal Display)等により構成されている。また、スピーカ6は、電子辞書装置1から出力される音声データを、音声として出力する音声出力装置である。
各種キー群5を構成するキーにはそれぞれ固有の機能が割り当てられており、ユーザはこれらのキーを押下して電子辞書装置1を操作する。具体的には、文字入力キー、辞書種別の選択キー、指定した単語の用例表示キー、指定した単語の発音キー等を備える。
また、各種キー群5は決定キー7と、方向キー9と、用例キー11と、発音キー13とを備える。方向キー9は、例えば上下左右を示す4つのキーによって構成される。用例キー11が押下されると、見出語に対応する例文が表示される。
また、方向キー9は、各種設定画面等において設定項目を選択する際や、画面をスクロール表示させる際等に使用される。決定キー7は、各種モードを実行する際や、各種設定画面等において設定項目を決定する際等に使用される。用例キー11は、当該見出語に関する用例(例文)を表示する際に使用される。発音キー13は、選択された単語の音声を出力する際に使用される。
図2は、電子辞書装置1の構成を示すブロック図である。同図に示すように、電子辞書装置1は、CPU(Central Processing Unit)10と、ROM(Read Only Memory)20と、RAM(Random Access Memory)30と、入力部40と、表示部50と、音声出力部60と、バス70と、を備えている。
[1.1.1 記憶領域]
ROM20は、各種初期設定、ハードウェアの検査、あるいは必要なプログラムのロード等を行うための初期プログラムを格納する。CPU10は、電子辞書装置1の電源投入時においてこの初期プログラムを実行することにより、電子辞書装置1の動作環境を設定する。
また、ROM20は、メニュー表示処理、各種設定処理、各種検索処理等の電子辞書装置1の動作に係る各種プログラムや、電子辞書装置1の備える種々の機能を実現するためのプログラム等を格納すると共に、英和辞典DB202と、例文テーブル204と、音素テーブル206と、単音音声テーブル208と、単語音声テーブル210と、辞書検索プログラム212と、単語発音プログラム214とを格納する。
英和辞典DB202は、見出語と、説明情報と、例文番号とを対応づけて記憶している辞典DBである。図3(a)は、英和辞典DB202のデータ構成の一例を示した図である。英和辞典DB202は、見出語(例えば、「row」)と、説明情報(例えば、「/rou/[名詞]1…」)と、例文番号(例えば、「21、…」)とを対応づけて記憶している。CPU10は、入力部40から入力文字が入力されると、英和辞典DB202から入力文字に適合する見出語を検索し、対応する説明情報を表示部50に表示する。
例文テーブル204は、英和辞典DB202の見出語に対応する例文が記憶されているテーブルである。図3(b)は、例文テーブル204のデータ構成の一例を示した図である。例文テーブル204は、例文番号(例えば「21」)と、例文(「a row of houses 家並み」)とを対応付けて記憶している。ここで、例文番号は、英和辞典DB202において見出語に対応づけて記憶されている例文番号と同一である。
音素テーブル206は、発音記号(例えば、「r」)と、発音記号の音素データと、当該発音記号を人間が発音する場合における口腔内の様子を学習用に示した図(以下、適宜「発音図」という)とを対応づけて記憶している。後述する単語発音プログラム214において、発音記号に対応する音素データが、音声出力部60から出力され、表示部50に発音図が表示される。
単音音声テーブル208は、英語の発音において、一連に発音される母音又は子音と母音の組合せの音(以下、適宜「単音」という)に対応する発音記号となる単音発音記号列(例えば、「ro」)と、単音をネイティブが発音した際の音声を記憶した単音音声のデータ(以下、適宜「単音音声データ」という)を対応づけて記憶するテーブルである。
単語音声テーブル210は、単語(例えば、「row」)と、単語の発音を発音記号として表記した単語発音記号列(例えば、「rou」)と、単語をネイティブが発音した際の音声を記憶した単語音声のデータ(以下、適宜「単語音声データ」という)とを対応づけて記憶するテーブルである。
RAM30は、CPU10が実行する各種プログラムや、これらのプログラムの実行にかかるデータ等を一時的に保持する随時書き込み可能なメモリである。本実施形態では、入力文字格納領域302と、選択単語格納領域304と、単語発音記号列格納領域306との領域が確保されている。
入力文字格納領域302は、ユーザから入力された文字を、入力文字として記憶している領域である。例えば、入力部40からユーザにより「row」と入力された場合、CPU10は、入力文字格納領域302に「row」を記憶する。
選択単語格納領域304は、ユーザにより選択された単語を、選択単語として記憶している領域である。また、単語発音記号列格納領域306は、選択単語に対応する単語発音記号列を記憶している領域である。CPU10は、単語発音記号列格納領域306に記憶された単語発音記号列に基づいて、音声を出力する。
[1.1.2 CPU]
CPU10は、入力される指示に応じて所定のプログラムに基づいた処理を実行し、各機能部への指示やデータの転送を行う。具体的には、CPU10は、入力部40から入力される操作信号に応じてROM20に格納されたプログラムを読み出し、当該プログラムに従って処理を実行する。そして、CPU10は、処理結果を表示するための表示制御信号を適宜表示部50に出力して、対応した表示情報を表示する。
また、CPU10は、本実施の形態において、ROM20の辞書検索プログラム212に従った、辞書検索処理(図5参照)を実行すると共に、この辞書検索処理において、単語発音プログラム214に従った単語発音処理をサブルーチンとして実行する。
具体的には、CPU10は、辞書検索処理において、まず、入力文字に適合する見出語を検索し、当該見出語に対応する説明情報を表示する。そして、CPU10は、用例キー11が押下されると、当該見出語に対応づけられた例文を表示する。つぎに、CPU10は、発音キー13が押下されると、表示部50に表示されている中から単語を選択させ、選択された単語を選択単語格納領域304に記憶し、単語発音処理を実行する。
また、CPU10は、単語発音処理において、再生レベルをユーザに選択させる。ここで、再生レベルとは、単語を再生する速度に対応しているものであり、本実施の形態においては、4段階に分かれているものである。そして、選択された再生レベルが「発音記号[遅]」又は「発音記号[早]」であれば、CPU10は、選択単語の発音記号列を構成する発音記号の一つ一つの音素データに基づいて音声を出力する。また、選択された再生レベルが「単音」であれば、CPU10は、選択単語の発音記号列を構成する発音記号のうち、単音音声データに基づいて、音声を出力する。また、選択された再生レベルが「ネイティブ」であれば、CPU10は、選択単語に対応して記憶されている単語音声データに基づいて音声を出力する。
[1.1.3 入出力部]
入力部40は、仮名やアルファベット等の文字入力や機能選択等に必要なキー群を備えた入力装置であり、押下されたキーの信号をCPU10に出力する。この入力部40におけるキー入力により、入力文字の入力、辞書モードの選択、検索実行指示等の入力手段を実現する。なお、この入力部40は、キー群5に限られるわけではなく、タッチパネル等であってもよい。
表示部50は、CPU10から入力される表示信号に基づいて各種画面を表示するものであり、LCD(Liquid Crystal Display)等により構成される。なお、この表示部50は、図1に示すディスプレイ3に相当する。
音声出力部60は、CPU10から入力される音声データに基づいて、音声データを再生・出力するものであり、スピーカ等により構成される。なお、音声出力部60は、図1に示すスピーカ6に相当する。
バス70は、CPU10からのデータ等の電気信号を通す線路であり、CPU10と、ROM20と、RAM30と、入力部40と、表示部50と、音声出力部60とをそれぞれ接続する信号線である。
[1.2 処理の流れ]
[1.2.1 辞書検索処理]
次に、第1の実施の形態における電子辞書装置1の動作を図を参照して説明する。図5は、辞書検索処理に係る電子辞書装置1の動作を説明するためのフローチャートである。この辞書検索処理は、CPU10がROM20の辞書検索プログラム212を実行することによって実現される処理である。
まず、CPU10は入力文字が入力されたか否かを判定する(ステップA10)。もし、入力部40より入力文字が入力された場合には(ステップA10;Yes)、入力された文字を入力文字格納領域302に記憶する。次に、CPU10は、入力文字格納領域302に記憶された入力文字に一致する見出語を、英和辞典DB202から検索する(ステップA12)。そして、CPU10は、検索された見出語に対応づけられた説明情報を、英和辞典DB202から抽出し、表示部50に表示する(ステップA14)。
次に、CPU10は、用例キー11が押下されたか否かを検知する(ステップA16)。もし、用例キー11が押下された場合には(ステップA16;Yes)、CPU10は、英和辞典DB202から、見出語に対応づけられた例文番号を抽出する。そして、CPU10は、抽出された例文番号に対応づけられた例文を、例文テーブル204から抽出し、表示部50に表示する(ステップA18)。
次に、CPU10は、発音キー13が押下されたか否かを判定する(ステップA20)。ここで、発音キー13が押下されたと判定すると(ステップA20;Yes)、CPU10は、ユーザに単語を選択させる。具体的には、CPU10は、カーソルを表示部50に表示する。そして、方向キー9が押下されることにより、カーソルがキーに連動してカーソルが上下左右に移動する。そして、決定キー7が押下されると、選択状態となっている単語が選択され(ステップA22;Yes)、選択された単語を選択単語として、選択単語格納領域304に記憶する(ステップA24)。そして、CPU10は単語発音処理を実行する(ステップA26)。
[1.2.2 単語発音処理]
次に、単語発音処理について説明する。図6は、単語発音処理にかかる電子辞書装置1の動作を説明するためのフローチャートである。この単語発音処理は、CPU10が、ROM20の単語発音プログラム214を実行することによって実現される処理である。
まず、CPU10は、表示部50にウィンドウを表示し、再生レベルを選択させる(ステップB10)。そして、「発音記号毎に聞く[遅]」か、「発音記号毎に聞く[早]」か、「単音毎に聞く」か、「ネイティブを聞く」かを選択させる。ここで、CPU10は、「発音記号毎に聞く[遅]」が選択された場合には、ステップB12から実行する。また、CPU10は、「発音記号毎に聞く[早]」が選択された場合には、ステップB30から実行する。さらに、「単音毎に聞く」が選択された場合には、ステップB40から実行する。そして、「ネイティブを聞く」が選択された場合には、ステップB60から実行する。以下、それぞれの項目が選択された場合について、説明する。
[1.2.2(a) 発音記号毎に聞く[遅]]
まず、再生レベルとして「発音記号毎に聞く[遅]」が選択され場合について述べる(ステップB10;発音記号[遅])。まず、CPU10は、間隔時間を「50」msに設定する(ステップB12)。次に、CPU10は、単語音声テーブル210から、単語発音記号列を抽出して、単語発音記号列格納領域306に記憶する(ステップB14)。そして、CPU10は、単語発音記号列格納領域306に記憶された単語発音記号列を表示部50に表示する(ステップB16)。
次に、CPU10は、単語発音記号列より、一の発音記号を選択し、選択された発音記号に対応する音素データを音素テーブル206より抽出する。そして、CPU10は抽出された音素データに基づいて音声出力部60より出力する(ステップB18)。また、CPU10は、表示部50に表示された単語発音記号列のうち、選択された発音記号を特別表示する(ステップB20)。そして、CPU10は、選択された発音記号に対応する発音図を音素テーブル206から抽出し、表示部50に表示する。
次に、CPU10は、間隔時間「50」msを経過したか否かを判定し、間隔時間「50」msを経過した後には(ステップB24;Yes)、単語発音記号列に含まれる総ての発音記号列について処理を実行したか否かを判定する(ステップB26)。そして、単語発音記号列に処理が終了していない発音記号が含まれている場合には(ステップB26;No)、次の発音記号を抽出して、ステップB18から同様の処理を繰り返す。
[1.2.2(b) 発音記号毎に聞く[早]]
次に、再生レベルとして「発音記号毎に聞く[早]」が選択された場合について述べる(ステップB10;発音記号[早])。まず、CPU10は、間隔時間を「10」msに設定する(ステップB12)。そして、CPU10は、ステップB14からB26までを実行することにより、音素データに基づいて単語に対応する音声を出力する。
[1.2.2(c) 単音毎に聞く]
次に、再生レベルとして「単音毎に聞く」が選択された場合について述べる(ステップB10;単音)。まず、CPU10は、間隔時間を「10」msに設定する(ステップB40)。次に、CPU10は、選択単語に対応する単語発音記号列を単語音声テーブル210から抽出し、単語発音記号列格納領域306に記憶する(ステップB42)。そして、CPU10は、単語発音記号列を表示部50に表示する(ステップB44)。
次に、CPU10は、単音発音記号列に対応する音声データを単音音声テーブル208から抽出し、音声出力部60に出力する(ステップB46)。具体的には、単語発音記号列に含まれる発音記号列から、一致する単音発音記号列を単音音声テーブル208から抽出する。そして、CPU10は、出力した単音発音記号列の部分を特別表示する(ステップB48)。
次に、CPU10は、間隔時間が経過したか否かを判定する(ステップB50)。間隔時間を経過すると(ステップB50;Yes)、次に単語発音記号列に含まれる発音記号の総てを処理したか否かを判定する(ステップB52)。もし、処理をしていない発音記号が含まれている場合には(ステップB52;No)、次の発音単位に該当する発音記号列を抽出し、ステップB46より処理を継続する(ステップB54)。
[1.2.2(d) ネイティブ]
次に、再生レベルとして「ネイティブ」が選択された場合について述べる(ステップB10;ネイティブ)。まず、選択単語格納領域304に記憶された選択単語に対応する音声データを単語音声テーブル210から抽出する(ステップB60)。次に、CPU10は、選択単語に一致する単語を単語音声テーブル210から抽出し、対応する単語発音記号列を抽出する(ステップB62)。そして、CPU10は、抽出された単語発音記号列を表示部50に表示する(ステップB64)。そして、CPU10は、選択単語に対応する単語音声データを単語音声テーブル210から読み出して、音声出力部に出力する(ステップB66)。
[1.2.3 具体例]
これまでの処理について、図を用いて具体的に説明する。図7(a)は、CPU10が、入力文字を入力させるために表示している表示画面W100の一例を示した図である。ここで、領域R100に、入力文字「row」が入力されると、CPU10は、入力文字「row」を入力文字格納領域302に記憶する(ステップA10)。
図7(b)は、見出語「row」に対応する説明情報が表示されている表示画面W100の一例を示した図であり、英和辞典DB202から抽出された見出語と、当該見出語の説明情報とが表示されている。ここで、用例キー11が押下されると、用例マークが反転表示する(反転表示M100)。そして、CPU10は、決定キー7が押下されると、見出語「row」に対応する例文を表示する。具体的には、英和辞典DB202から、当該見出語に対応する例文番号を抽出する。そして、抽出された例文番号に対応する例文を、例文テーブル204から抽出し、表示部50に表示する。
図8(a)は、見出語「row」に対応する例文が一覧表示されている表示画面W100の一例を示した図である。ここで、発音キー13が押下されると(ステップA20)、CPU10は、表示部50に表示されている単語を選択させる(ステップA22)。ここで、単語「row」が選択され(ステップA22;Yes)、反転表示M102が付されている。また、単語「row」は選択単語として、選択単語格納領域304に記憶される。
図8(b)は、選択表示S100で選択した単語の上で、決定キー7が押下された後に表示された表示画面W100の一例を示した図である。表示画面W100には、選択された単語を音声出力する際の再生レベルを選択させるウィンドウW102が表示されている。ここで、再生レベルが選択されると、CPU10は、単語発音処理において、対応する処理を実行する。本図では、ラジオボタンにより、「発音記号毎に聞く[遅]」が選択されている。従って、CPU10は、単語発音処理においてステップB12より実行する。
図9(a)は、「発音記号毎に聞く[遅]」が選択され再生されている際の表示画面W100の一例である。表示画面W100には、現在再生出力中を示す表示ウィンドウW104が表示されている。CPU10は、選択単語「row」に対応する単語発音記号列「rou」を単語音声テーブル210から抽出し(ステップB14)、表示ウィンドウW104の領域R102に表示する(ステップB16)。次に、CPU10は、単語発音記号列から発音記号「r」を抽出し、発音記号「r」に対応する音素データを、音素テーブル206から抽出する。そして、抽出された音素データを音声出力部60に出力する。また、発音記号「r」を特別表示するために(ステップB20)、反転表示M104が付されている。また、CPU10は、発音記号「r」に対応する発音図を、音素テーブル206から抽出し、表示ウィンドウW104の領域R104に表示する(ステップB22)。
また、図9(b)は、再生レベルとして「ネイティブ」が選択された場合の表示画面W100の一例を示した図である。表示ウィンドウW106には、選択単語と、対応する発音記号列が表示されて、音声出力部60からは、単語音声データに基づいた音声が出力されている。
このように、第1の実施の形態によれば、単語を選択した後に、単語を再生するレベルを選択することにより、発音記号に基づいた忠実な音声を再生させるのか、ネイティブが発音するような音声を再生させるのかといった、任意の選択をすることが可能となる。
〔第2の実施の形態〕
次に、本発明を適用した第2の実施の形態について説明する。本実施の形態は、単語の発音を出力した回数に応じて、再生するレベルを自動的に決定するというものである。
[2.1 構成]
第2の実施の形態における電子辞書装置の構成は、第1の実施の形態において図2に示して説明した電子辞書装置1の構成において、ROM20を図10(b)に示すROM22に、RAM30を図10(c)に示すRAM32に置き換えた構成と同様であり、以下、同一の構成要素には同一の符号を付してその説明を省略する。また、各フローチャートにおいて、第1の実施の形態のフローチャートと同一処理内容のステップについては同一の符号を付して、異なる部分を中心に説明する。
図10(a)は、第2の実施の形態における各種キー群5を示した図である。第2の実施の形態においては、発音キー13に変えて、学習キー15を備えている。学習キー15が押下されることにより、選択された単語の音声を、学習履歴に応じて出力する。
図10(b)を参照して、ROM22の構成について説明する。図10(b)に示すように、ROM22は、英和辞典DB202と、例文テーブル204と、音素テーブル206と、単音音声テーブル208と、単語音声テーブル210と、例文音声テーブル220と、辞書学習プログラム222と、単語学習プログラム224と、例文学習プログラム226とを格納している。
例文音声テーブル220は、例文テーブル204に記憶されている例文をネイティブが発音した際の音声を記憶した例文音声のデータ(以下、適宜「例文音声データ」という)を記憶しているテーブルである。図11(a)は、例文音声テーブル220のデータ構造の一例を示したものである。例文音声テーブル220は、例文番号(例えば、「21」)と、例文音声データとを対応づけて記憶している。また、ここの例文番号は、例文テーブル204の例文番号に対応するものである。
辞書学習プログラム222は、本実施の形態における辞書学習処理を実現するためのプログラムであり、CPU10がこの辞書学習プログラム222を実行することで、辞書学習処理が実現される。また、この辞書学習処理において、単語学習プログラム224に従った単語学習処理と、例文学習プログラム226に従った例文学習処理とをサブルーチンとして実行する。CPU10は、入力文字に適合する見出語の例文を表示する。そして、学習キーを押下し、例文中の単語を選択すると、選択した単語の学習履歴に応じた単語、又は単語が含まれる例文の音声を再生する。そして、当該レベルにおいて、学習回数が5回に達すると次のレベルに移行する。
単語学習プログラム224は、本実施の形態における単語学習処理を実現するためのプログラムであり、CPU10がこの単語学習プログラム224を実行することで、単語学習処理が実現される。CPU10は、単語学習処理において、学習レベルを判定する。そして、学習レベルが「1」又は「2」であれば、CPU10は、選択単語の発音記号列を構成する発音記号の一つ一つの音素データを出力する。また、学習レベルが「3」であれば、CPU10は、選択単語の発音記号列を構成する発音記号のうち、単音音声データに基づいて、音声を出力する。また、学習レベルが「4」であれば、CPU10は、選択単語に対応する単語音声データに基づいて、音声を出力する。
例文学習プログラム226は、本実施の形態における例文学習処理を実現するためのプログラムであり、CPU10がこの例文学習プログラム226を実行することで、例文学習処理が実現される。CPU10は、例文学習処理において、まず選択単語を含む例文を特定する。次に、CPU10は、学習レベルを判定して、学習レベルが「5」又は「6」であれば、例文を構成する単語の単語音声データを抽出する。そして、CPU10は、例文を構成する単語音声データを連続して音声出力することにより、例文の単語の音声を出力する。また、CPU10は、学習レベルが「7」以上と判定すれば、例文に対応する例文音声データを抽出して、音声出力する。
また、図10(c)を参照して、RAM32の構成について説明する。図10(c)に示すように、RAM32は、入力文字格納領域302と、選択単語格納領域304と、単語発音記号列格納領域306と、学習履歴テーブル320とを格納している。
学習履歴テーブル320は、単語毎に発音音声を再生出力するための回数等を記憶しているテーブルである。図11(b)に学習履歴テーブル320のデータ構成の一例を示す。図11(b)に示すように、学習履歴テーブル320は、単語(例えば、「row」)と、学習レベル(例えば、「4」)と、当該学習レベル時において学習した回数(例えば、「1」)とを対応づけて記憶している。ここで、学習レベルは単語を再生・出力するときのレベルを表す値であり、「1」以上の整数である。また、学習回数は、当該学習レベルで何回学習したかを表す値であり、「0」以上の整数である。本実施の形態においては、学習回数が「5」回に到達すると、学習レベルが「1」加算され、学習回数が「0」にリセットされる。
[2.2 処理の流れ]
[2.2.1 辞書学習処理]
次に、第2の実施の形態における電子辞書装置1の動作について図を参照して説明する。図12は、辞書学習処理に係る電子辞書装置1の動作を説明するためのフローチャートである。この辞書学習処理は、CPU10がROM22の辞書学習プログラム222を実行することによって実現される処理である。
選択単語格納領域304に選択単語が記憶されると(ステップA24)、CPU10は、記憶された選択単語の学習レベル及び回数を学習履歴テーブル320より抽出する(ステップC26)。ここで、CPU10は、選択単語が学習履歴テーブル320に記憶されているか否かを判定する(ステップC28)。そして、CPU10は、記憶されていないと判定した場合には(ステップC28;No)、学習レベルをユーザに選択させる(ステップC30)。次に、CPU10は学習レベルが「4」以下であると判定した場合には(ステップC32;Yes)、単語学習処理を実行する(ステップC36)。また、他方、CPU10は学習レベルが「5」以上であると判定した場合には(ステップC32;No)、例文学習処理を実行する(ステップC34)。
次に、CPU10は、学習履歴テーブル320に記憶されている当該単語の学習回数に1加算する(ステップC38)。そして、学習履歴テーブル320に記憶されている当該単語の学習回数が「5」以上であれば(ステップC40;Yes)、CPU10は、当該単語の学習レベルに「1」加算し(ステップC42)て、学習回数を「0」にリセットする(ステップC44)。
[2.2.2 単語学習処理]
図13は、単語学習処理に係るコンピュータ1の動作を説明するためのフローチャートである。この単語学習処理は、CPU10が、ROM22に記憶された単語学習プログラム224を実行することによって実現される。
まず、CPU10は、辞書学習処理のステップC26で抽出した学習レベル又はステップC30で選択した学習レベルがいくつであるかを判定する(ステップD10)。ここで、学習レベルが「1」であれば、ステップB12から実行する。また、学習レベルが「2」であれば、ステップB30から実行する。また、学習レベルが「3」であれば、ステップB40から実行する。また、学習レベルが「4」であれば、ステップB60から実行する。
このように、単語学習処理によれば、単語に対応した現在の学習レベルに応じて、適宜単語の再生する速さ・レベルを決定して、単語の音声を出力することができる。
[2.2.3 例文学習処理]
図14は、例文学習処理に係るコンピュータ1の動作を説明するためのフローチャートである。この例文学習処理は、CPU10が、ROM22に記憶された例文学習プログラム226を実行することによって実現される。
まず、CPU10は、選択単語が含まれている例文を特定する(ステップE10)。次に、CPU10は、選択単語の学習レベルを判定する(ステップE12)。具体的には、CPU10は、選択単語格納領域304に記憶された単語と一致する単語を、学習履歴テーブル320より抽出する。そして、CPU10は、選択単語に対応する学習レベルを抽出し、抽出された学習レベルに基づいて判定する。
まず、学習レベルが「5」の場合(ステップE12;5)、CPU10は間隔時間を「500」msに設定する(ステップE14)。そして、CPU10は、ステップE10で特定した例文の最初の単語を決定する(ステップE16)。そして、CPU10は、決定された単語に対応する単語音声を単語音声テーブル210から抽出し(ステップE18)、音声出力部60に出力する(ステップE20)。また、CPU10は、単語音声を出力した単語について、特別表示する(ステップE22)。そして、CPU10は、間隔時間が経過すると(ステップE24;Yes)、例文に含まれている全ての単語について音声を出力したか否かを判定する(ステップE26)。そして、CPU10は、まだ例文に単語が残っていると判定した場合には(ステップE26;No)、次の単語を抽出し(ステップE28)、ステップE18から再度処理を実行する。
また、学習レベルが「6」の場合(ステップE12;6)、CPU10は間隔時間を「100」msに設定して(ステップE30)、ステップE16から同様に実行する。
他方、CPU10は、学習レベルが「7」以上の場合は、ステップE10で決定された例文に対応する例文音声データを、例文音声テーブル220から抽出し、音声出力部60に音声データを出力する(ステップE34)。
このように、例文学習処理によれば、学習レベルに応じて例文を再生する際に、単語毎に発音をするか、一連の例文として例文が再生されるかを決定し、出力することが可能となる。
[2.3 画面例]
ここで、図を用いて具体的に説明する。図15(a)は、見出語「row」に対応する例文を表示する表示画面W200の一例を示す図である。ここで、学習キー15が押下されると、単語を選択する状態となる。本図においては単語「row」が選択され、反転表示R200が付されている図である。ここで、選択された単語「row」は、選択単語として選択単語格納領域304に記憶される(図12のステップA24)。次に、単語「row」が学習履歴テーブル320に記憶されていない場合には(図12のステップC28;No)、CPU10は、学習レベルを選択させる。
図15(b)は、CPU10が、ユーザに学習レベルを選択させるために表示ウィンドウW202を表示した表示画面W200の一例を示す図である。ここで、ユーザによって「単語毎の例文を聞く[遅]」が選択されると(ラジオボタンS200)、学習レベルは「5」と記憶され、CPU10は例文学習処理を実行する(図12のステップC34)。
図16は、例文学習処理が実行されたときの表示画面W200の一例を示す図である。CPU10は、選択単語「row」を含む例文「a row of houses」を特定する。このとき、音声出力の対象となっていることを示す下線K200が付されている。次に、CPU10は、学習レベルが「5」であることから、間隔時間を「500」msに設定し、最初の単語を決定する。ここでは、単語「a」が決定され、対応する単語音声データを単語音声テーブル210より抽出する。そして、抽出された単語音声データを、CPU10は音声出力部60に出力し(図14のステップE20)、表示画面W200に表示されている単語「a」を特別表示する(図14のステップE22)。次に、CPU10は、間隔時間の「500」msが経過したら(図14のステップE24;Yes)、まだ例文に単語が残っていると判定し、次の単語「row」を抽出する(図14のステップE28)。CPU10は、同様に単語「row」に対応づけられた単語音声データを音声出力部60に出力し、単語「row」を特別表示する(図16の反転表示R204)。また、CPU10は、例文学習処理が実行されていることを示すために、その旨を表示ウィンドウW204で表示する。
このように、例文学習処理によれば、例文を音声出力する際に、例文を一連として記憶している例文音声データと、単語毎に記憶されている単語音声データとを切り替えて音声出力することが可能となる。従って、一単語ずつの単語音声データを出力することにより、ユーザは一単語ずつ発音を明確に聞き取ることができる。また、例文に対応づけられた例文音声データを音声出力することにより、ユーザはよりネイティブに近い発音で学習することが可能となる。
上述のように、第2の実施の形態によれば、選択された単語の音声出力回数に応じて学習レベルを決定し、学習レベルに適した音声出力速度で音声を出力することが出来る。従って、ユーザは学習レベルを指定しなくとも、音声出力回数に応じた学習レベルに基づいて、学習レベルに適した音声出力速度によって音声を出力することが可能となる。
[3.変形例]
上述した実施の形態では、電子辞典、電子事典などを含む電子辞書装置を適用例として説明したが、本発明の音声出力装置は、このような製品に限定されるものではなく、携帯電話、パソコン、電子時計、PDA(Personal Digital Assistants)などの電子機器全般に適用可能である。
また、上述した実施の形態では、選択単語として選択する単語は、例文中の単語として説明したが、これに限定されるわけではなく、例えば、見出語である場合や、説明情報中の単語であっても良いのは勿論である。また、選択するものは、単語に限定されるものではなく、例えば成句や複合語で有っても良い。
[3.1 学習レベルを初期値として記憶している場合]
上述した第2の実施の形態において、選択単語が学習履歴テーブル320に記憶されていない場合には、ユーザに学習レベルを選択させることとして説明したが、予め単語毎に学習レベルを記憶した重要度テーブルを有することとしてもよい。
具体的には、重要度テーブルには、予め単語と、学習レベルとを対応づけて記憶しておく。例えば、重要度の高い単語や、発音が難しいレベルの単語は学習レベル「1」を、重要度の低い単語や、発音が易しいレベルの単語は学習レベル「4」をそれぞれ記憶する。そして、図12のステップC28において、学習履歴テーブル320に、選択単語が記憶されていない場合には、重要度テーブルから、単語に対応した学習レベルを抽出する。そして、抽出した学習レベルに基づいて処理を行うことにより、ユーザが学習レベルを選択しなくとも、適切な学習レベルで単語の音声が出力される。
[3.2 クライアント/サーバモデルへの適用]
上述した実施の形態では、電子辞書装置1を、単体で動作する所謂スタンドアローン型の装置として説明した。しかし、本発明が適用可能な装置はこれに限られるものではない。通信装置を内蔵或いは接続可能に構成し、サーバと通信することによって本発明に係る装置を実現することも可能である。図面を参照して具体的に説明する。
図17は、通信装置を内蔵した電子辞書端末600と、サーバ700とが通信回線Nを介して通信可能に接続されたシステム構成の概略例を示す図である。サーバ700は、例えば汎用のワークステーションやサーバ用1コンピュータ等によって構成されるものであり、電子辞書端末600は、携帯電話機や、通信装置を内蔵したパソコン、通信装置を内蔵した電子辞書等により構成されるものである。通信回線Nは、有線/無線の電話網やインターネット網等である。
図17において、上述した実施の形態の電子辞書装置1の主要機能を有する機能ブロックを太線で示した。電子辞書装置1のCPU10が実行する辞書検索処理等はサーバ700のCPU702が実行する。また電子辞書装置1のROM20が記憶する英和辞典DBや辞書検索プログラム等はサーバ700の、ハードディスク等から構成される記憶部714が記憶する。また、説明情報表示処理等の実行に伴うデータはサーバ700のRAM712が記憶する。
一方、電子辞書装置1の入力部40は電子辞書端末600の入力部704に、電子辞書装置1の表示部50は電子辞書端末600の表示部606に、電子辞書装置1の音声出力部60は電子辞書端末600の音声出力部607に、それぞれ相当する。
すなわち、サーバ700がホスト(或いはサーバ)、電子辞書端末600が端末(或いはクライアント)に相当するホスト・端末のシステム(或いはクライアント/サーバ型のシステム)を形成する。そして、電子辞書端末600の入力部604から入力された入力文字等が通信装置608を介してサーバ700に送信され、サーバ700のCPU702が記憶部714に記憶された各種データ及び各種プログラムに従って辞書検索処理等を実行し、処理結果を通信装置608を通じて電子辞書端末600に送信して表示部606に表示させ、音声出力部607より音声データを出力する。ここで、サーバ700から電子辞書端末600に送信される音声データ等は、一度バッファに蓄積記憶され、総ての処理が終了した段階で、まとめて電子辞書端末600に送信される。
例えば、図6の単語発音処理において、利用者端末により再生レベル「発音記号[遅]」が選択されたとする。すると、再生レベルが「発音記号[遅]」である旨を受信したサーバ700は、ステップB14で読み出した単語発音記号列に含まれる発音記号を抽出し、ステップB18の段階で抽出された発音記号に対応する音素データをバッファに出力する。そして、残りの音素データについても順次バッファに蓄積記憶する。そして、総ての単語発音記号列について処理が終了した段階(ステップB26;Yes)で、音素データを合成し、電子辞書端末600に送信する。また、同様に、発音記号及び特別表示する制御を行う制御データ及び発音図についても、バッファに蓄積記憶し、総ての発音記号列に対する処理が終了した段階で、バッファに蓄積記憶されたデータを合成して、利用者端末600に送信する。
このように、サーバ700及び電子辞書端末600から構成されるシステムで、本発明を実現することも可能である。この場合、電子辞書端末600においては、英和辞典DBや辞書検索プログラム等を記憶しておく必要がなく、また辞書検索処理等を実行する必要もない。このため、演算処理能力が比較的低いCPU602や、記憶容量等が比較的小さいROM610等を具備する電子辞書端末600(例えば携帯電話)であってもよい。
電子辞書装置及び入力部の一例を示す図である。 第1の実施の形態における電子辞書のブロック図を示す図である。 第1の実施の形態における(a)英和辞典DB、(b)例文テーブル、(c)音素テーブルのデータ構成の一例を示す図である。 第1の実施の形態における(a)単音音声テーブル(b)単語音声テーブルのデータ構成の一例を示す図である。 第1の実施の形態における辞書検索処理のフローチャートを示す図である。 第1の実施の形態における単語発音処理のフローチャートを示す図である。 第1の実施の形態における表示画面の遷移の一例を示す図である。 第1の実施の形態における表示画面の遷移の一例を示す図である。 第1の実施の形態における表示画面の遷移の一例を示す図である。 第2の実施の形態における(a)入力部の一例、(b)ROMの構成、(c)RAMのデータ構成の一例を示す図である。 第2の実施の形態における(a)例文音声テーブル、(b)学習履歴テーブルの構成の一例を示す図である。 第2の実施の形態における辞書学習処理のフローチャートを示す図である。 第2の実施の形態における単語学習処理のフローチャートを示す図である。 第2の実施の形態における例文学習処理のフローチャートを示す図である。 第2の実施の形態における表示画面の遷移の一例を示す図である。 第2の実施の形態における表示画面の遷移の一例を示す図である。 本実施の形態の変形例におけるブロック図の一例を示す図である。
符号の説明
1 電子辞書装置
10 CPU
20、22 ROM
202 英和辞典DB
204 例文テーブル
206 音素テーブル
208 単音音声テーブル
210 単語音声テーブル
212 辞書検索プログラム
214 単語発音プログラム
220 例文音声テーブル
224 単語学習プログラム
226 例文学習プログラム
30、32 RAM
302 入力文字格納領域
304 選択単語格納領域
306 単語発音記号列格納領域
320 学習履歴テーブル
40 入力部
50 表示部
60 音声出力部

Claims (12)

  1. 単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶手段と、
    各発音記号の音素データを記憶した音素記憶手段と、
    前記単語記憶手段に記憶された各単語の発音データを記憶した発音記憶手段と、
    前記単語記憶手段に記憶された単語の中から一の単語を選択する単語選択手段と、
    この単語選択手段により選択された単語に対応する発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶手段から読み出して順番に音声出力する音素出力手段と、
    前記選択された単語に対応する発音データを前記発音記憶手段から読み出して音声出力する単語音声出力手段と、
    を備えることを特徴とする音声出力装置。
  2. 前記単語選択手段により選択された単語の発音記号列を前記単語記憶手段から読み出して表示するとともに、前記音素出力手段により順番に音声出力される音素データに対応する発音記号を順番に特別表示する発音記号表示手段を更に備えることを特徴とする請求項1に記載の音声出力装置。
  3. 多段階の音声出力速度による前記音素出力手段の音声出力を制御するとともに、前記音素出力手段と、前記単語音声出力手段との音声出力を切り替えることにより、前記単語選択手段により選択された単語の音声出力速度を段階的に変更する制御を行う出力制御手段を更に備えることを特徴とする請求項1又は2に記載の音声出力装置。
  4. 単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶手段と、
    各発音記号の音素データを記憶した音素記憶手段と、
    前記単語記憶手段に記憶された単語の中から一の単語を選択する単語選択手段と、
    この単語選択手段により選択された単語に対応する発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶手段から読み出して順番に音声出力する音素出力手段と、
    前記音素出力手段による音声出力の速度を段階的に変更する制御を行う出力制御手段と、
    前記選択された単語の発音記号列を前記単語記憶手段から読み出して表示するとともに、前記音素出力手段により順番に音声出力される音素データに対応する発音記号を順番に特別表示する発音記号表示手段と、
    を備えることを特徴とする音声出力装置。
  5. 学習レベルを決定するレベル決定手段を更に備えるとともに、
    前記出力制御手段は、前記レベル決定手段により決定された学習レベルに応じて音声出力速度を変更するレベル適応変更手段を有する、
    ことを特徴とする請求項3又は4に記載の音声出力装置。
  6. 前記単語選択手段により選択された単語毎の音声出力回数を記憶する出力回数記憶手段を更に備え、
    前記レベル決定手段は、前記単語選択手段により選択された単語の音声出力回数を前記出力回数記憶手段から読み出し、読み出した音声出力回数に応じて学習レベルを決定する出力回数適応レベル決定手段を有する、
    ことを特徴とする請求項5に記載の音声出力装置。
  7. 所定の通信回線を介して利用者端末と接続されるサーバにおいて、
    単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶手段と、
    各発音記号の音素データを記憶した音素記憶手段と、
    前記単語記憶手段に記憶された各単語の発音データを記憶した発音記憶手段と、
    前記単語記憶手段に記憶された単語の中から一の単語を前記利用者端末から受信する単語受信手段と、
    この単語受信手段により受信された単語に対応する発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶手段から読み出して前記利用者端末に順番に送信する音素送信手段と、
    前記選択された単語に対応する発音データを前記発音記憶手段から読み出して前記利用者端末に送信する単語音声送信手段と、
    を備えることを特徴とするサーバ。
  8. 所定の通信回線を介して利用者端末と接続されるサーバにおいて、
    単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶手段と、
    各発音記号の音素データを記憶した音素記憶手段と、
    前記単語記憶手段に記憶された単語の中から一の単語を前記利用者端末から受信する単語受信手段と、
    この単語受信手段により受信された単語に対応する発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶手段から読み出して順番につなげることにより、再生速度が異なる複数の連続再生用合成音素データを生成する合成音素データ生成手段と、
    前記受信された単語の発音記号列を前記単語記憶手段から読み出し、読み出した発音記号列を表示するとともに、前記生成された各連続再生用合成音素データの再生に同期して発音記号を順番に特別表示する制御を行う発音記号表示制御データを生成する発音記号表示データ生成手段と、
    前記合成音素データ生成手段により生成された連続再生用合成音素データ及び前記発音記号表示データ生成手段により生成された発音記号表示制御データを前記利用者端末に送信する送信手段と、
    を備えることを特徴とするサーバ。
  9. コンピュータに、
    単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶機能と、
    各発音記号の音素データを記憶した音素記憶機能と、
    前記単語記憶機能に記憶された各単語の発音データを記憶した発音記憶機能と、
    前記単語記憶機能に記憶された単語の中から一の単語を選択する単語選択機能と、
    この単語選択機能により選択された単語に対応する発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶機能から読み出して順番に音声出力する音素出力機能と、
    前記選択された単語に対応する発音データを前記発音記憶機能から読み出して音声出力する単語音声出力機能と、
    を実現させるためのプログラム。
  10. コンピュータに、
    単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶機能と、
    各発音記号の音素データを記憶した音素記憶機能と、
    前記単語記憶機能に記憶された単語の中から一の単語を選択する単語選択機能と、
    この単語選択機能により選択された単語に対応する発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶機能から読み出して順番に音声出力する音素出力機能と、
    前記音素出力機能による音声出力の速度を段階的に変更する制御を行う出力制御機能と、
    前記選択された単語の発音記号列を前記単語記憶機能から読み出して表示するとともに、前記音素出力機能により順番に音声出力される音素データに対応する発音記号を順番に特別表示する発音記号表示機能と、
    を実現させるためのプログラム。
  11. 所定の通信回線を介して利用者端末と接続されるコンピュータに、
    単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶機能と、
    各発音記号の音素データを記憶した音素記憶機能と、
    前記単語記憶機能に記憶された各単語の発音データを記憶した発音記憶機能と、
    前記単語記憶機能に記憶された単語の中から一の単語を前記利用者端末から受信する単語受信機能と、
    この単語受信機能により受信された単語に対応する発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶機能から読み出して前記利用者端末に順番に送信する音素送信機能と、
    前記選択された単語に対応する発音データを前記発音記憶機能から読み出して前記利用者端末に送信する単語音声送信機能と、
    を実現させるためのプログラム。
  12. 所定の通信回線を介して利用者端末と接続されるコンピュータに、
    単語と、発音記号により当該単語の音を一連に表した発音記号列とを対応付けて複数記憶した単語記憶機能と、
    各発音記号の音素データを記憶した音素記憶機能と、
    前記単語記憶機能に記憶された単語の中から一の単語を前記利用者端末から受信する単語受信機能と、
    この単語受信機能により受信された単語に対応する発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列に含まれる各発音記号の音素データを前記音素記憶機能から読み出して順番につなげることにより、再生速度が異なる複数の連続再生用合成音素データを生成する合成音素データ生成機能と、
    前記受信された単語の発音記号列を前記単語記憶機能から読み出し、読み出した発音記号列を表示するとともに、前記生成された各連続再生用合成音素データの再生に同期して発音記号を順番に特別表示する制御を行う発音記号表示制御データを生成する発音記号表示データ生成機能と、
    前記合成音素データ生成機能により生成された連続再生用合成音素データ及び前記発音記号表示データ生成機能により生成された発音記号表示制御データを前記利用者端末に送信する送信機能と、
    を実現させるためのプログラム。
JP2003335873A 2003-09-26 2003-09-26 音声出力装置、サーバ及びプログラム Pending JP2005106844A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003335873A JP2005106844A (ja) 2003-09-26 2003-09-26 音声出力装置、サーバ及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003335873A JP2005106844A (ja) 2003-09-26 2003-09-26 音声出力装置、サーバ及びプログラム

Publications (1)

Publication Number Publication Date
JP2005106844A true JP2005106844A (ja) 2005-04-21

Family

ID=34532180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003335873A Pending JP2005106844A (ja) 2003-09-26 2003-09-26 音声出力装置、サーバ及びプログラム

Country Status (1)

Country Link
JP (1) JP2005106844A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007271646A (ja) * 2006-03-30 2007-10-18 Casio Comput Co Ltd 情報出力装置及び情報出力プログラム
JP2008058678A (ja) * 2006-08-31 2008-03-13 Casio Comput Co Ltd 音声出力装置及び音声出力プログラム
JP2011170365A (ja) * 2011-03-25 2011-09-01 Casio Computer Co Ltd 情報出力装置及び情報出力プログラム
JP2012159683A (ja) * 2011-01-31 2012-08-23 Toshiba Corp 電子機器

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007271646A (ja) * 2006-03-30 2007-10-18 Casio Comput Co Ltd 情報出力装置及び情報出力プログラム
JP2008058678A (ja) * 2006-08-31 2008-03-13 Casio Comput Co Ltd 音声出力装置及び音声出力プログラム
JP2012159683A (ja) * 2011-01-31 2012-08-23 Toshiba Corp 電子機器
US8538758B2 (en) 2011-01-31 2013-09-17 Kabushiki Kaisha Toshiba Electronic apparatus
US9047858B2 (en) 2011-01-31 2015-06-02 Kabushiki Kaisha Toshiba Electronic apparatus
JP2011170365A (ja) * 2011-03-25 2011-09-01 Casio Computer Co Ltd 情報出力装置及び情報出力プログラム

Similar Documents

Publication Publication Date Title
US6321196B1 (en) Phonetic spelling for speech recognition
KR100378898B1 (ko) 발음 설정 방법, 컴퓨터 판독가능 매체를 포함하는 제조 물품 및, 그래픽 사용자 인터페이스 시스템
US6377925B1 (en) Electronic translator for assisting communications
JP3248981B2 (ja) 計算機
TWI554984B (zh) 電子裝置
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
JP5106608B2 (ja) 読み上げ支援装置、方法、およびプログラム
WO2010133072A1 (zh) 发音评测装置及其方法
JP2015036788A (ja) 外国語の発音学習装置
JP2007219218A (ja) 語学学習用電子機器および訳文再生方法
JP6641680B2 (ja) 音声出力装置、音声出力プログラムおよび音声出力方法
US20040102973A1 (en) Process, apparatus, and system for phonetic dictation and instruction
JP2005106844A (ja) 音声出力装置、サーバ及びプログラム
JP6752046B2 (ja) 電子機器、その制御方法および制御プログラム
JP2006284645A (ja) 音声再生装置およびその再生プログラムならびにその再生方法
JP2006031725A (ja) 文字処理装置
JPH07152532A (ja) 文章読み上げ装置
JP2009075526A (ja) 音声合成利用の総合的英語学習システム
JP5057764B2 (ja) 音声合成装置及び音声合成プログラム
JP2007148235A (ja) 情報表示制御装置及びプログラム
JP2009266024A (ja) 電子辞書装置および表示端末
JP2021043306A (ja) 電子機器、音声再生方法、およびプログラム
JP6464623B2 (ja) 音声出力装置、音声出力方法、プログラム、およびサーバ装置
JP2000330998A (ja) 発音電子辞書