JP3093498B2 - 文書読み上げ装置 - Google Patents
文書読み上げ装置Info
- Publication number
- JP3093498B2 JP3093498B2 JP04349198A JP34919892A JP3093498B2 JP 3093498 B2 JP3093498 B2 JP 3093498B2 JP 04349198 A JP04349198 A JP 04349198A JP 34919892 A JP34919892 A JP 34919892A JP 3093498 B2 JP3093498 B2 JP 3093498B2
- Authority
- JP
- Japan
- Prior art keywords
- reading
- word
- document
- data
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【0001】
【産業上の利用分野】この発明は、計算機上で処理可能
な文書データを音声として読み上げる文書読み上げ装置
に関する。
な文書データを音声として読み上げる文書読み上げ装置
に関する。
【0002】
【従来の技術】従来から、計算機上で処理可能な文書デ
ータを日本語解析処理や音声合成処理を用いて音声とし
て読み上げる文書読み上げ装置が知られている。この文
書読み上げ装置としては、文書の読み上げの際、読みの
種類が複数あるような単語に対して常に固定の代表的な
読みを出力するものが旧来は主であった。その後、文書
読み上げ装置は、複数の読みの中から任意の読みをオペ
レータが選択できるまでに至り、実用的なものとなって
いる。
ータを日本語解析処理や音声合成処理を用いて音声とし
て読み上げる文書読み上げ装置が知られている。この文
書読み上げ装置としては、文書の読み上げの際、読みの
種類が複数あるような単語に対して常に固定の代表的な
読みを出力するものが旧来は主であった。その後、文書
読み上げ装置は、複数の読みの中から任意の読みをオペ
レータが選択できるまでに至り、実用的なものとなって
いる。
【0003】このように任意の読みを選択できる文書読
み上げ装置では、単語の読みを現在のものから他のもの
に変更する場合、その作業を文書の読み上げ作業が行わ
れていない時間帯を選んで行う必要がある。ところが、
単語の読みが不当であることにオペレータが気付くの
は、実際に文書の読み上げが開始されてからの場合が多
く、このような場合オペレータは文書の読み上げ作業を
途中で一旦中断させてから単語読みの変更作業を行わな
ければならなかった。
み上げ装置では、単語の読みを現在のものから他のもの
に変更する場合、その作業を文書の読み上げ作業が行わ
れていない時間帯を選んで行う必要がある。ところが、
単語の読みが不当であることにオペレータが気付くの
は、実際に文書の読み上げが開始されてからの場合が多
く、このような場合オペレータは文書の読み上げ作業を
途中で一旦中断させてから単語読みの変更作業を行わな
ければならなかった。
【0004】
【発明が解決しようとする課題】このように従来の文書
読み上げ装置では、文書の読み上げ作業中に単語の読み
を変更したいとき、必ず文書の読み上げ作業を一旦中止
する必要があった。
読み上げ装置では、文書の読み上げ作業中に単語の読み
を変更したいとき、必ず文書の読み上げ作業を一旦中止
する必要があった。
【0005】本発明はこのような課題を解決するための
もので、文書の読み上げ作業を中断させることなく、文
書の読み上げ作業中に複数の読みを持つ単語の読みの中
から任意の読みをオペレータが自由に設定することので
きる文書読み上げ装置の提供を目的としている。
もので、文書の読み上げ作業を中断させることなく、文
書の読み上げ作業中に複数の読みを持つ単語の読みの中
から任意の読みをオペレータが自由に設定することので
きる文書読み上げ装置の提供を目的としている。
【0006】
【課題を解決するための手段】本発明の文書読み上げ装
置は上記した目的を達成するために、計算機上で処理可
能な文書データを音声として読み上げる文書読み上げ装
置において、文書データを格納する文書データ格納手段
と、文書解析に必要な単語に関する情報が単語辞書とし
て予め格納された単語辞書格納手段と、複数の読みを持
つ単語の最も優先順位が高い読みが記憶される単語読み
記憶手段と、前記文書データを前記単語辞書を参照しつ
つ解析してこの文書データを単語単位に切り分けた解析
結果を得ると共に、複数の読みを持つ単語に対して前記
単語読み記憶手段を参照して読みを決定する解析手段
と、前記解析手段の解析結果から音声データを生成する
音声データ生成手段と、前記音声データ生成手段により
生成された音声データから音声合成を行う音声合成手段
と、前記音声合成手段で合成された音声を増幅して読み
上げ文書として出力する音声発生手段と、前記音声デー
タ生成手段により生成された音声データからその読みを
示す表示データを生成する表示データ生成手段と、読み
上げ対象の文書データおよび前記表示データ生成手段に
より生成された表示データを表示する表示手段と、前記
表示手段の表示内容から読みを変更したい単語を指定
し、その読みを入力する入力手段と、前記入力手段によ
り指定された単語と入力された読みで前記単語読み記憶
手段の内容を更新する更新手段と、文書データの解析か
ら読み上げまての一連の作業を実行している期間中に、
前記入力手段による前記単語指定およびこの単語の読み
入力、並びに更新手段による更新をそれぞれ割り込み処
理にて実行するよう制御を行う制御手段とを具備するも
のである。
置は上記した目的を達成するために、計算機上で処理可
能な文書データを音声として読み上げる文書読み上げ装
置において、文書データを格納する文書データ格納手段
と、文書解析に必要な単語に関する情報が単語辞書とし
て予め格納された単語辞書格納手段と、複数の読みを持
つ単語の最も優先順位が高い読みが記憶される単語読み
記憶手段と、前記文書データを前記単語辞書を参照しつ
つ解析してこの文書データを単語単位に切り分けた解析
結果を得ると共に、複数の読みを持つ単語に対して前記
単語読み記憶手段を参照して読みを決定する解析手段
と、前記解析手段の解析結果から音声データを生成する
音声データ生成手段と、前記音声データ生成手段により
生成された音声データから音声合成を行う音声合成手段
と、前記音声合成手段で合成された音声を増幅して読み
上げ文書として出力する音声発生手段と、前記音声デー
タ生成手段により生成された音声データからその読みを
示す表示データを生成する表示データ生成手段と、読み
上げ対象の文書データおよび前記表示データ生成手段に
より生成された表示データを表示する表示手段と、前記
表示手段の表示内容から読みを変更したい単語を指定
し、その読みを入力する入力手段と、前記入力手段によ
り指定された単語と入力された読みで前記単語読み記憶
手段の内容を更新する更新手段と、文書データの解析か
ら読み上げまての一連の作業を実行している期間中に、
前記入力手段による前記単語指定およびこの単語の読み
入力、並びに更新手段による更新をそれぞれ割り込み処
理にて実行するよう制御を行う制御手段とを具備するも
のである。
【0007】
【作用】本発明では、文書データの解析から読み上げま
ての一連の作業を実行している期間中に単語の読みを変
更する場合、表示手段の表示内容から読みを変更したい
単語を指定し、その読みを入力する。すると更新手段
は、指定された単語と入力された読みで単語読み記憶手
段の内容を更新する。これらの処理は前記文書データの
解析から読み上げまての一連の処理に対する割り込み処
理として実行される。この後、解析手段は、更新後の単
語読み記憶手段の内容を参照して複数の読みを持つ単語
の読みを決定する。
ての一連の作業を実行している期間中に単語の読みを変
更する場合、表示手段の表示内容から読みを変更したい
単語を指定し、その読みを入力する。すると更新手段
は、指定された単語と入力された読みで単語読み記憶手
段の内容を更新する。これらの処理は前記文書データの
解析から読み上げまての一連の処理に対する割り込み処
理として実行される。この後、解析手段は、更新後の単
語読み記憶手段の内容を参照して複数の読みを持つ単語
の読みを決定する。
【0008】したがって、本発明によれば、文書の読み
上げ作業を中止させることなく、この読み上げ作業の実
行途中で任意の単語の読みの変更を割り込み処理として
行うことができ、読み上げ作業の効率向上を図ることが
できる。
上げ作業を中止させることなく、この読み上げ作業の実
行途中で任意の単語の読みの変更を割り込み処理として
行うことができ、読み上げ作業の効率向上を図ることが
できる。
【0009】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。
する。
【0010】図1は本発明に係る一実施例の文書読み上
げ装置の構成を示すブロック図である。
げ装置の構成を示すブロック図である。
【0011】同図に示す文書読み上げ装置は、装置全体
の制御を行う制御部1を中心に、キーボードやマウス等
の入力装置2、CRTやLCDなどの表示装置3、文書
データを格納した文書データ記憶部4、設定バッファ
5、単語辞書記憶部6、日本語解析部7、解析結果バッ
ファ8、読み暫定学習データ記憶部9、音声データ生成
規則記憶部10、音声データ生成部11、音声データ記
憶部12、音声合成装置13、スピーカなどの音声発生
装置14、表示データ作成部15、表示データ記憶部1
6、複数読み単語検出部17、表示位置検出部18をそ
れぞれ接続して構成される。
の制御を行う制御部1を中心に、キーボードやマウス等
の入力装置2、CRTやLCDなどの表示装置3、文書
データを格納した文書データ記憶部4、設定バッファ
5、単語辞書記憶部6、日本語解析部7、解析結果バッ
ファ8、読み暫定学習データ記憶部9、音声データ生成
規則記憶部10、音声データ生成部11、音声データ記
憶部12、音声合成装置13、スピーカなどの音声発生
装置14、表示データ作成部15、表示データ記憶部1
6、複数読み単語検出部17、表示位置検出部18をそ
れぞれ接続して構成される。
【0012】入力装置2は、読み上げの対象となる文書
の指定や、読み上げの条件、その他の入力に供される。
の指定や、読み上げの条件、その他の入力に供される。
【0013】表示装置3は、読み上げの対象となる文書
全体の表示や、実際に読み上げ処理を行っている部分的
な文書の表示、並びに前記部分的な文書の読みの表示、
その他に供される。
全体の表示や、実際に読み上げ処理を行っている部分的
な文書の表示、並びに前記部分的な文書の読みの表示、
その他に供される。
【0014】文書データ記憶部4は、例えば日本語ワー
ドプロセッサ等により作成された文書データやOCR
(Optical Character Reader) 等によって読み込んだ文
書データを記憶する。
ドプロセッサ等により作成された文書データやOCR
(Optical Character Reader) 等によって読み込んだ文
書データを記憶する。
【0015】設定バッファ5は、オペレータが入力装置
2を使って設定した読み上げの各種条件、例えば読み上
げの速度、音質、高さ、強さ等を記憶する。
2を使って設定した読み上げの各種条件、例えば読み上
げの速度、音質、高さ、強さ等を記憶する。
【0016】単語辞書記憶部6は、日本語解析部7にて
文書解析を行うために必要な単語に関する情報、例えば
品詞情報、読み情報、アクセント情報、意味情報、単語
間の共起情報、同じ読みの単語間の優先順位等を予め記
憶してなる。
文書解析を行うために必要な単語に関する情報、例えば
品詞情報、読み情報、アクセント情報、意味情報、単語
間の共起情報、同じ読みの単語間の優先順位等を予め記
憶してなる。
【0017】日本語解析部7は、読み上げ指定された文
書に対して単語辞書記憶部6の単語辞書を参照しながら
形態的、構文的、意味的な解析を行って文書を単語単位
に切り分けた解析結果を得ると共に、複数の読みを持つ
単語について、読み暫定学習データ記憶部9の内容を参
照してその読みを決定する。
書に対して単語辞書記憶部6の単語辞書を参照しながら
形態的、構文的、意味的な解析を行って文書を単語単位
に切り分けた解析結果を得ると共に、複数の読みを持つ
単語について、読み暫定学習データ記憶部9の内容を参
照してその読みを決定する。
【0018】解析結果バッファ8は、日本語解析部7で
得た解析結果を一時的に記憶する。読み暫定学習データ
記憶部9は、複数の読みを持つ単語について、その複数
の読みをそれぞれ優先順位を示して記憶する。それぞれ
の読みの優先順位は変更可能とされている。
得た解析結果を一時的に記憶する。読み暫定学習データ
記憶部9は、複数の読みを持つ単語について、その複数
の読みをそれぞれ優先順位を示して記憶する。それぞれ
の読みの優先順位は変更可能とされている。
【0019】音声データ生成規則記憶部10は、音声デ
ータ生成部11にて音声データを生成するために必要な
規則を予め記憶してなる。
ータ生成部11にて音声データを生成するために必要な
規則を予め記憶してなる。
【0020】音声データ生成部11は、解析結果バッフ
ァ8に記憶された解析結果を基に、音声データ生成規則
記憶部10内の音声データ生成規則に従って音声データ
の生成を行う。
ァ8に記憶された解析結果を基に、音声データ生成規則
記憶部10内の音声データ生成規則に従って音声データ
の生成を行う。
【0021】音声データ記憶部12は、音声データ生成
部11により生成された音声データを一時的に記憶す
る。
部11により生成された音声データを一時的に記憶す
る。
【0022】音声合成装置13は、音声データ記憶部1
2に記憶された音声データから、設定バッファ5に設定
された読み上げ条件に従って音声合成を行う。
2に記憶された音声データから、設定バッファ5に設定
された読み上げ条件に従って音声合成を行う。
【0023】音声発生装置14は、音声合成装置13よ
り出力された電気的な音声信号を増幅して読み上げ文書
として出力する表示データ作成部15は、音声データ記
憶部12に記憶された音声データからその読みとアクセ
ントの位置を可視的に表現した表示データ(カタカナを
用いた音韻列)を生成する。
り出力された電気的な音声信号を増幅して読み上げ文書
として出力する表示データ作成部15は、音声データ記
憶部12に記憶された音声データからその読みとアクセ
ントの位置を可視的に表現した表示データ(カタカナを
用いた音韻列)を生成する。
【0024】表示データ記憶部16は、読み上げ対象と
なる文書全体の表示データや、実際に読み上げ処理を行
っている部分的な文書の表示データ、並びに表示データ
作成部15により作成された表示データ等、表示装置3
に表示する表示データを記憶する。
なる文書全体の表示データや、実際に読み上げ処理を行
っている部分的な文書の表示データ、並びに表示データ
作成部15により作成された表示データ等、表示装置3
に表示する表示データを記憶する。
【0025】複数読み単語検出部17は、表示された文
書の中で複数の読みを持つ単語の検出を行う。この複数
読み単語検出部17により複数の読み持つ単語が検出さ
れた場合、オペレータに任意の読みの選択を促すべく、
表示装置3にこの単語に関する情報としてその単語のす
べての読み、品詞の種類等が表示される。
書の中で複数の読みを持つ単語の検出を行う。この複数
読み単語検出部17により複数の読み持つ単語が検出さ
れた場合、オペレータに任意の読みの選択を促すべく、
表示装置3にこの単語に関する情報としてその単語のす
べての読み、品詞の種類等が表示される。
【0026】表示位置検出部18は、前記の単語情報を
表示装置3画面上のどこに表示すべきかを判断する。
表示装置3画面上のどこに表示すべきかを判断する。
【0027】次に本実施例の文書読み上げ装置の動作を
説明する。図2はこの動作の流れを示すフローチャート
である。
説明する。図2はこの動作の流れを示すフローチャート
である。
【0028】まずオペレータは、表示装置3の表示内容
に従って対話的に、読み上げの対象となる文書の選択と
読み上げ条件の設定入力を行う(ステップ201、20
2)。 図3に読み上げの対象となる文書データの例を
示す。また図4は設定された読み上げ条件の例である。
図4に示すように、読み上げ条件としては、基本の読み
上げ速度、音質、音の高さ、音の強さ、読み上げ終了の
設定時間、強調文字の特殊読み上げの有無、強調文字の
特殊読み上げ時の変更点、読み上げの有無、休みの長
さ、単語の読みの次候補表示の手動/自動の切り替え等
がある。これらの読み上げ条件は設定バッファ5に記憶
される。
に従って対話的に、読み上げの対象となる文書の選択と
読み上げ条件の設定入力を行う(ステップ201、20
2)。 図3に読み上げの対象となる文書データの例を
示す。また図4は設定された読み上げ条件の例である。
図4に示すように、読み上げ条件としては、基本の読み
上げ速度、音質、音の高さ、音の強さ、読み上げ終了の
設定時間、強調文字の特殊読み上げの有無、強調文字の
特殊読み上げ時の変更点、読み上げの有無、休みの長
さ、単語の読みの次候補表示の手動/自動の切り替え等
がある。これらの読み上げ条件は設定バッファ5に記憶
される。
【0029】この後、読み上げの対象として指定された
文書データは制御部1を通じて日本語解析部7に送られ
る。日本語解析部7は、与えられた文書データに対し
て、単語辞書記憶部6内の単語辞書を参照しながら形態
的、構文的、意味的な解析を行い、文書を単語単位に切
り分けた解析結果を得る(ステップ203)。
文書データは制御部1を通じて日本語解析部7に送られ
る。日本語解析部7は、与えられた文書データに対し
て、単語辞書記憶部6内の単語辞書を参照しながら形態
的、構文的、意味的な解析を行い、文書を単語単位に切
り分けた解析結果を得る(ステップ203)。
【0030】図5に単語辞書の構造を示す。このよう
に、単語辞書は、個々の単語の見出し51ごとに、品詞
52、読み53、アクセントの形54、意味55、単語
間の共起56、その他57を格納してなっている。
に、単語辞書は、個々の単語の見出し51ごとに、品詞
52、読み53、アクセントの形54、意味55、単語
間の共起56、その他57を格納してなっている。
【0031】そしてこの日本語解析部7による文書解析
において、ある単語に対して複数の読みが存在する場
合、日本語解析部7は読み暫定学習データ記憶部9を参
照してここに優先順位が最も高いものとして定義されて
いる読みを当該単語の読みとして決定する(ステップ2
04)。
において、ある単語に対して複数の読みが存在する場
合、日本語解析部7は読み暫定学習データ記憶部9を参
照してここに優先順位が最も高いものとして定義されて
いる読みを当該単語の読みとして決定する(ステップ2
04)。
【0032】図6に読み暫定学習データ記憶部9の構造
を示す。このように読み暫定学習データ記憶部9には、
個々の単語ごとに複数の読みとアクセントの形が記憶さ
れ、それぞれの読みには優先順位が付与されている。こ
こでは左側に記述されている読みほど優先順位が高いこ
とを表している。なお、読み暫定学習データ記憶部9で
定義されていない単語については単語辞書記憶部6に記
憶されている読みの優先順位に従う。
を示す。このように読み暫定学習データ記憶部9には、
個々の単語ごとに複数の読みとアクセントの形が記憶さ
れ、それぞれの読みには優先順位が付与されている。こ
こでは左側に記述されている読みほど優先順位が高いこ
とを表している。なお、読み暫定学習データ記憶部9で
定義されていない単語については単語辞書記憶部6に記
憶されている読みの優先順位に従う。
【0033】このようにして解析された結果は、図7に
示すように、個々の単語71ごとに、その読み72、ア
クセントの形73、指数74、品詞75、活用形76を
示して解析結果バッファ8に記憶される。
示すように、個々の単語71ごとに、その読み72、ア
クセントの形73、指数74、品詞75、活用形76を
示して解析結果バッファ8に記憶される。
【0034】日本語解析部7は解析を終了すると制御部
1に対してその旨を示す信号を送る。この信号を受けた
制御部1は音声データ生成部11に対して起動をかけ
る。
1に対してその旨を示す信号を送る。この信号を受けた
制御部1は音声データ生成部11に対して起動をかけ
る。
【0035】音声データ生成部11は、解析結果バッフ
ァ8に記憶された解析結果に基づき、音声データ生成規
則記憶部10内の音声データ生成規則に従って音声デー
タの作成を行い、作成した音声データを音声データ記憶
部12に記憶する(ステップ205)。
ァ8に記憶された解析結果に基づき、音声データ生成規
則記憶部10内の音声データ生成規則に従って音声デー
タの作成を行い、作成した音声データを音声データ記憶
部12に記憶する(ステップ205)。
【0036】図8に音声データ作成規則の一例を示す。
この規則は、対象となる単語の品詞が五段動詞で、アク
セントの形が0形でなく、その活用形が未然形の場合
は、アクセントの形を0形にすることを表している。
この規則は、対象となる単語の品詞が五段動詞で、アク
セントの形が0形でなく、その活用形が未然形の場合
は、アクセントの形を0形にすることを表している。
【0037】図9は音声データ生成部11により生成さ
れた音声データの形式を示している。同図において、デ
ータ先頭部分の0.5 ;1 ;20;20はそれぞれ読み上げの
速度、音質、高さ、強さの値を示しており、これらの値
は設定バッファ5内の読み上げ条件に従って付与され
る。またカタカナ列は音声データを示しており、この音
声データにおいて「.」は読み上げの際の休み、「^」
はアクセントの位置をそれぞれ示している。
れた音声データの形式を示している。同図において、デ
ータ先頭部分の0.5 ;1 ;20;20はそれぞれ読み上げの
速度、音質、高さ、強さの値を示しており、これらの値
は設定バッファ5内の読み上げ条件に従って付与され
る。またカタカナ列は音声データを示しており、この音
声データにおいて「.」は読み上げの際の休み、「^」
はアクセントの位置をそれぞれ示している。
【0038】音声データ生成部11は音声データの生成
を終了すると、その旨を示す信号を制御部1に送る。制
御部1はこの信号を入力すると、音声データ記憶部12
に記憶された音声データを音声合成装置13に送る。
を終了すると、その旨を示す信号を制御部1に送る。制
御部1はこの信号を入力すると、音声データ記憶部12
に記憶された音声データを音声合成装置13に送る。
【0039】音声合成装置13は音声データを入力する
と、この音声データの先頭部分に付加された速度、音
質、高さ、強さ等の読み上げ条件に従い、この後に続く
音声データの一つ一つの音韻を電気的な音声信号に変換
することによる音声合成を行う。 音声合成装置13で
得た音声信号は、音声発生装置14に送られて実際の可
聴音となって出力される(ステップ206)。
と、この音声データの先頭部分に付加された速度、音
質、高さ、強さ等の読み上げ条件に従い、この後に続く
音声データの一つ一つの音韻を電気的な音声信号に変換
することによる音声合成を行う。 音声合成装置13で
得た音声信号は、音声発生装置14に送られて実際の可
聴音となって出力される(ステップ206)。
【0040】一方、制御部1は音声データを音声合成装
置13に送るのと同時に、音声データを表示データ作成
部15に送る。表示データ作成部15は、入力した音声
データからその読みとアクセントの位置を可視的に表現
した表示データ(カタカナを用いた音韻列)を生成し、
この表示データを表示データ記憶部16に記憶する。図
10にこの時の表示の様子を示す。同図に示すように、
文書の読み上げ中、表示装置3の画面には読み上げ対象
の文書データ101、現在実際に読み上げを行っている
部分的な文書データ102、並びにこの文書データ10
2に対する読みの表示データ103が表示される。この
とき、表示データ103にはアクセントとなる位置に
「^」のマークが付けられる。
置13に送るのと同時に、音声データを表示データ作成
部15に送る。表示データ作成部15は、入力した音声
データからその読みとアクセントの位置を可視的に表現
した表示データ(カタカナを用いた音韻列)を生成し、
この表示データを表示データ記憶部16に記憶する。図
10にこの時の表示の様子を示す。同図に示すように、
文書の読み上げ中、表示装置3の画面には読み上げ対象
の文書データ101、現在実際に読み上げを行っている
部分的な文書データ102、並びにこの文書データ10
2に対する読みの表示データ103が表示される。この
とき、表示データ103にはアクセントとなる位置に
「^」のマークが付けられる。
【0041】そして制御部1は、音声発生装置14から
の音声出力と同じタイミングで、表示装置3に表示され
た表示データ103を1文字ずつ着色、反転、下線等に
よって強調表現して行く。これにより、現在どの部分を
読み上げているかをオペレータに示す。図11にこのと
きの強調表示の例を示す。この例では、読み上げが終了
したところまでの文字がすべて反転によって強調表示さ
れている。
の音声出力と同じタイミングで、表示装置3に表示され
た表示データ103を1文字ずつ着色、反転、下線等に
よって強調表現して行く。これにより、現在どの部分を
読み上げているかをオペレータに示す。図11にこのと
きの強調表示の例を示す。この例では、読み上げが終了
したところまでの文字がすべて反転によって強調表示さ
れている。
【0042】この文書の読み上げ処理中において、ある
単語の読みを変更したい場合は次のような処理が行われ
る。以下この処理の流れを図12のフローチャートに従
って説明する。
単語の読みを変更したい場合は次のような処理が行われ
る。以下この処理の流れを図12のフローチャートに従
って説明する。
【0043】この処理は設定バッファ5において単語の
読みの次候補表示が手動に設定されているか自動に設定
されているかによって異なる(ステップ1201)。
読みの次候補表示が手動に設定されているか自動に設定
されているかによって異なる(ステップ1201)。
【0044】単語の読みの次候補表示が手動側に設定さ
れている場合、オペレータは入力装置2を使って、表示
装置3に表示されている文書中で読みを変更したい単語
の位置にカーソルを移動し、続いて単語情報の表示要求
を入力する(ステップ1202)。
れている場合、オペレータは入力装置2を使って、表示
装置3に表示されている文書中で読みを変更したい単語
の位置にカーソルを移動し、続いて単語情報の表示要求
を入力する(ステップ1202)。
【0045】制御部1はこの表示要求を受けると、表示
中のカーソルの位置を検出して、このカーソル位置に対
応する単語を判断する(ステップ1203)。そして制
御部1は単語辞書記憶部6内の単語辞書からこの単語に
関する情報を抽出し、図13に示すように、この単語情
報を表示装置3に表示する(ステップ1204)。
中のカーソルの位置を検出して、このカーソル位置に対
応する単語を判断する(ステップ1203)。そして制
御部1は単語辞書記憶部6内の単語辞書からこの単語に
関する情報を抽出し、図13に示すように、この単語情
報を表示装置3に表示する(ステップ1204)。
【0046】一方、単語の読みの次候補表示が手動に設
定されている場合、制御部1は複数読み単語検出部17
を起動する。複数読み単語検出部17は、現在読み上げ
中の文書データの中から複数の読みを持つ単語を検出す
る(ステップ1205、1206)。
定されている場合、制御部1は複数読み単語検出部17
を起動する。複数読み単語検出部17は、現在読み上げ
中の文書データの中から複数の読みを持つ単語を検出す
る(ステップ1205、1206)。
【0047】そして複数読み単語検出部17は複数の読
みを持つ単語を検出すると、制御部1に対して単語情報
の表示を指示する信号を送る。すると制御部1は、単語
辞書記憶部6内の単語辞書からこの単語に関する情報を
抽出し、この単語情報を表示装置3に表示する(ステッ
プ1204)。
みを持つ単語を検出すると、制御部1に対して単語情報
の表示を指示する信号を送る。すると制御部1は、単語
辞書記憶部6内の単語辞書からこの単語に関する情報を
抽出し、この単語情報を表示装置3に表示する(ステッ
プ1204)。
【0048】このとき、表示位置検出部18が現在読み
上げている文書中の指定した単語の後に続く部分と重な
らない位置を単語情報の表示位置として検出し、制御部
1にこの位置情報を与える。なお、どうしても重なる場
合は、前記文書の表示位置をずらして対応する。また、
このとき表示されている文書中の指定された単語を反
転、着色等により強調して表示する。
上げている文書中の指定した単語の後に続く部分と重な
らない位置を単語情報の表示位置として検出し、制御部
1にこの位置情報を与える。なお、どうしても重なる場
合は、前記文書の表示位置をずらして対応する。また、
このとき表示されている文書中の指定された単語を反
転、着色等により強調して表示する。
【0049】この後、オペレータが入力装置2を使っ
て、読みの変更指示として、表示装置3に表示されてい
る単語情報の中の任意の読みをカーソルで指定すると
(ステップ1207)、制御部1はカーソルの位置から
指定された単語の読みを判断し(ステップ1208)、
この読みで読み暫定学習データ記憶部9の内容を更新す
る(ステップ1209)。図14に更新後の読み暫定学
習データ記憶部9の内容の例を示す。
て、読みの変更指示として、表示装置3に表示されてい
る単語情報の中の任意の読みをカーソルで指定すると
(ステップ1207)、制御部1はカーソルの位置から
指定された単語の読みを判断し(ステップ1208)、
この読みで読み暫定学習データ記憶部9の内容を更新す
る(ステップ1209)。図14に更新後の読み暫定学
習データ記憶部9の内容の例を示す。
【0050】例えば、文書中の「市場」の単語に対し
て、オペレータは「いちば」という読みを期待していた
にも拘らず「しじょう」という読みが得られていたとす
る。この場合、オペレータはこの「市場」の単語をカー
ソル指定する。これによりこの「市場」という単語の単
語情報が表示装置3に表示され、オペレータはこの中か
ら正しい読みとして「いちば」を選択する。
て、オペレータは「いちば」という読みを期待していた
にも拘らず「しじょう」という読みが得られていたとす
る。この場合、オペレータはこの「市場」の単語をカー
ソル指定する。これによりこの「市場」という単語の単
語情報が表示装置3に表示され、オペレータはこの中か
ら正しい読みとして「いちば」を選択する。
【0051】この後の日本語解析部7による読み暫定学
習データ記憶部9を参照した解析により、図15に示す
ような音声データが得られ、音声データ記憶部12に記
憶される。
習データ記憶部9を参照した解析により、図15に示す
ような音声データが得られ、音声データ記憶部12に記
憶される。
【0052】なお、単語情報からの単語の読みの選択の
際、カーソルで指定された読みは一旦反転表示され、こ
の後、マウスのクリック操作が行われることなどによっ
て、制御部1は変更後の読みが選択されたものとして上
記の制御を実行する。この後、表示された単語情報は、
読みの次候補表示が手動の場合、オペレータからの単語
情報の表示中止を指示する信号の入力や読み暫定学習デ
ータ記憶部9の更新作業終了により消去される。また表
示された単語情報は、読みの次候補表示が自動の場合、
前記の場合の他に、次の複数の読みを持つ単語が複数読
み単語検出部17によって検出されたときに消去されて
次の単語の単語情報の表示に切り替えられる(ステップ
1210)。
際、カーソルで指定された読みは一旦反転表示され、こ
の後、マウスのクリック操作が行われることなどによっ
て、制御部1は変更後の読みが選択されたものとして上
記の制御を実行する。この後、表示された単語情報は、
読みの次候補表示が手動の場合、オペレータからの単語
情報の表示中止を指示する信号の入力や読み暫定学習デ
ータ記憶部9の更新作業終了により消去される。また表
示された単語情報は、読みの次候補表示が自動の場合、
前記の場合の他に、次の複数の読みを持つ単語が複数読
み単語検出部17によって検出されたときに消去されて
次の単語の単語情報の表示に切り替えられる(ステップ
1210)。
【0053】以降の文書解析では、日本語解析部7が図
14に示す読み暫定学習データ記憶部9の内容に従って
「市場」の単語に対して「いちば」の読みが得られるこ
とになる。
14に示す読み暫定学習データ記憶部9の内容に従って
「市場」の単語に対して「いちば」の読みが得られるこ
とになる。
【0054】以上の単語読みの変更処理は図2に示した
メインルーチンの実行中に割り込み処理として実行され
る。すなわち、制御部1は、文書の読み上げ実行途中で
上述の単語読みの変更処理を割り込み処理として実行す
る。単語読みの変更処理が終了すると、メインルーチン
に復帰し、文書の読み上げ作業が再開される。
メインルーチンの実行中に割り込み処理として実行され
る。すなわち、制御部1は、文書の読み上げ実行途中で
上述の単語読みの変更処理を割り込み処理として実行す
る。単語読みの変更処理が終了すると、メインルーチン
に復帰し、文書の読み上げ作業が再開される。
【0055】したがって、本実施例の文書読み上げ装置
によれば、文書の読み上げ作業を中止させることなく、
この読み上げ作業の実行途中で任意の単語の読みの変更
を割り込み処理として実行することができ、読み上げ作
業の効率向上を図ることができる。
によれば、文書の読み上げ作業を中止させることなく、
この読み上げ作業の実行途中で任意の単語の読みの変更
を割り込み処理として実行することができ、読み上げ作
業の効率向上を図ることができる。
【0056】
【発明の効果】以上説明したように本発明の文書読み上
げ装置によれば、文書の読み上げ作業を中止させること
なく、この読み上げ作業の実行途中で任意の単語の読み
の変更を割り込み処理として実行することができ、読み
上げ作業の効率向上を図ることができる。
げ装置によれば、文書の読み上げ作業を中止させること
なく、この読み上げ作業の実行途中で任意の単語の読み
の変更を割り込み処理として実行することができ、読み
上げ作業の効率向上を図ることができる。
【図1】本発明に係る一実施例の文書読み上げ装置の構
成を示すブロック図である。
成を示すブロック図である。
【図2】図1の文書読み上げ装置における文書読み上げ
のメインルーチンを示すフローチャートである。
のメインルーチンを示すフローチャートである。
【図3】読み上げの対象となる文書データの例を示す図
である。
である。
【図4】設定バッファに記憶される読み上げ条件の例を
示す図である。
示す図である。
【図5】単語辞書の構造を示す図である。
【図6】読み暫定学習データ記憶部の構造を示す図であ
る。
る。
【図7】日本語解析部による文書解析結果を示す図であ
る。
る。
【図8】音声データ作成規則の一例を示す図である。
【図9】音声データ生成部により生成された音声データ
の形式を示す図である。
の形式を示す図である。
【図10】文書データおよびこの文書の読みの表示デー
タの表示例を示す図である。
タの表示例を示す図である。
【図11】音声出力に同期した表示データの強調表示の
例を示す図である。
例を示す図である。
【図12】単語読みの変更処理の流れを示すフローチャ
ートである。
ートである。
【図13】単語読みの変更処理の際に表示装置に表示さ
れる単語情報の表示例を示す図である。
れる単語情報の表示例を示す図である。
【図14】単語読み変更後の読み暫定学習データ記憶部
の内容を示す図である。
の内容を示す図である。
【図15】単語読み変更後に得られた音声データの例を
示す図である。
示す図である。
1…制御部、2…入力装置、3…表示装置、4…文書デ
ータ記憶部、5…設定バッファ、6…単語辞書記憶部、
7…日本語解析部、8…解析結果バッファ、9…読み暫
定学習データ記憶部、10…音声データ生成規則記憶
部、11…音声データ生成部、12…音声データ生成
部、13…音声合成装置、14…音声発生装置、15…
表示データ作成部、16…表示データ記憶部、17…複
数読み単語検出部、18…表示位置検出部。
ータ記憶部、5…設定バッファ、6…単語辞書記憶部、
7…日本語解析部、8…解析結果バッファ、9…読み暫
定学習データ記憶部、10…音声データ生成規則記憶
部、11…音声データ生成部、12…音声データ生成
部、13…音声合成装置、14…音声発生装置、15…
表示データ作成部、16…表示データ記憶部、17…複
数読み単語検出部、18…表示位置検出部。
フロントページの続き (56)参考文献 特開 平4−312169(JP,A) 特開 平3−236099(JP,A) 特開 平1−119822(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 3/16 G06F 17/21 G10L 13/00
Claims (3)
- 【請求項1】 計算機上で処理可能な文書データを音声
として読み上げる文書読み上げ装置において、 文書データを格納する文書データ格納手段と、 文書解析に必要な単語に関する情報が単語辞書として予
め格納された単語辞書格納手段と、 複数の読みを持つ単語の最も優先順位が高い読みが記憶
される単語読み記憶手段と、 前記文書データを前記単語辞書を参照しつつ解析してこ
の文書データを単語単位に切り分けた解析結果を得ると
共に、複数の読みを持つ単語に対して前記単語読み記憶
手段を参照して読みを決定する解析手段と、 前記解析手段の解析結果から音声データを生成する音声
データ生成手段と、 前記音声データ生成手段により生成された音声データか
ら音声合成を行う音声合成手段と、 前記音声合成手段で合成された音声を増幅して読み上げ
文書として出力する音声発生手段と、 前記音声データ生成手段により生成された音声データか
らその読みを示す表示データを生成する表示データ生成
手段と、 読み上げ対象の文書データおよび前記表示データ生成手
段により生成された表示データを表示する表示手段と、 前記表示手段の表示内容から読みを変更したい単語を指
定し、その読みを入力する入力手段と、 前記入力手段により指定された単語と入力された読みで
前記単語読み記憶手段の内容を更新する更新手段と、 文書データの解析から読み上げまての一連の作業を実行
している期間中に、前記入力手段による前記単語指定お
よびこの単語の読み入力、並びに更新手段による更新を
それぞれ割り込み処理にて実行するよう制御を行う制御
手段とを具備することを特徴とする文書読み上げ装置。 - 【請求項2】 請求項1記載の文書読み上げ装置におい
て、 表示手段に表示された読み上げ対象の文書データ中で、
複数の読みを持つ単語を自動検索し、前記表示手段にこ
の単語を強調表示する手段をさらに有することを特徴と
する文書読み上げ装置。 - 【請求項3】 請求項1または2記載の文書読み上げ装
置において、 表示手段に複数の読みを持つ単語の読みの複数候補を表
示する読み候補表示手段と、 前記読み候補表示手段により表示された複数候補の中か
ら任意の候補を変更後の読みとして選択する選択手段と
をさらに有することを特徴とする文書読み上げ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04349198A JP3093498B2 (ja) | 1992-12-28 | 1992-12-28 | 文書読み上げ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04349198A JP3093498B2 (ja) | 1992-12-28 | 1992-12-28 | 文書読み上げ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06202843A JPH06202843A (ja) | 1994-07-22 |
JP3093498B2 true JP3093498B2 (ja) | 2000-10-03 |
Family
ID=18402139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04349198A Expired - Fee Related JP3093498B2 (ja) | 1992-12-28 | 1992-12-28 | 文書読み上げ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3093498B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3371761B2 (ja) * | 1997-06-19 | 2003-01-27 | 富士通株式会社 | 氏名読み音声合成装置 |
JP5838781B2 (ja) * | 2011-12-20 | 2016-01-06 | 富士通株式会社 | 複合語読み表示方法及びプログラム,並びに読み生成装置 |
JP5863598B2 (ja) * | 2012-08-20 | 2016-02-16 | 株式会社東芝 | 音声合成装置、方法およびプログラム |
-
1992
- 1992-12-28 JP JP04349198A patent/JP3093498B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH06202843A (ja) | 1994-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA1259410A (en) | Apparatus for making and editing dictionary entries in a text-to-speech conversion system | |
US5983184A (en) | Hyper text control through voice synthesis | |
US6068487A (en) | Speller for reading system | |
JP2008268477A (ja) | 韻律調整可能な音声合成装置 | |
JP3093498B2 (ja) | 文書読み上げ装置 | |
JPH07181992A (ja) | 文書読上げ装置及び方法 | |
JPH06119144A (ja) | 文書読み上げ装置 | |
JPH06195326A (ja) | 文書入力方法及び装置 | |
JP2580565B2 (ja) | 音声情報辞書作成装置 | |
JPH07210185A (ja) | 朗読情報作成装置および朗読装置 | |
JPH08272388A (ja) | 音声合成装置及びその方法 | |
JPH09325787A (ja) | 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置 | |
JPH06332899A (ja) | 文書読上装置 | |
JPH07134597A (ja) | 読み学習機能付き文書読み上げ装置及び文書読み上げ方法 | |
JP2801622B2 (ja) | テキスト音声合成方法 | |
JP3280729B2 (ja) | 発音記号作成装置 | |
JP2001014304A (ja) | 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体 | |
JP3142159B2 (ja) | 韻律記号生成装置 | |
JPH08221095A (ja) | 文章読み上げ方法 | |
JPH0969087A (ja) | 文書作成装置及び文書作成方法 | |
JPH04177526A (ja) | 文章読み上げ装置 | |
JP2966954B2 (ja) | 文書読上げ指示装置 | |
JPH10143503A (ja) | 音声ワードプロセッサ | |
JPH08194494A (ja) | 文解析方法および装置 | |
JPH05960Y2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000711 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080728 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090728 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |