JPH05189194A - 文書読み上げ装置 - Google Patents

文書読み上げ装置

Info

Publication number
JPH05189194A
JPH05189194A JP4002949A JP294992A JPH05189194A JP H05189194 A JPH05189194 A JP H05189194A JP 4002949 A JP4002949 A JP 4002949A JP 294992 A JP294992 A JP 294992A JP H05189194 A JPH05189194 A JP H05189194A
Authority
JP
Japan
Prior art keywords
reading
character string
document
japanese
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4002949A
Other languages
English (en)
Inventor
Hiromi Saito
裕美 斉藤
Kenichiro Kobayashi
賢一郎 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba AVE Co Ltd
Original Assignee
Toshiba Corp
Toshiba AVE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba AVE Co Ltd filed Critical Toshiba Corp
Priority to JP4002949A priority Critical patent/JPH05189194A/ja
Publication of JPH05189194A publication Critical patent/JPH05189194A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】特別な操作を必要とせずに、所望する読み方に
よって文書を読み上げることを可能とする。 【構成】日本語解析部14は、表記に関する形態情報
(品詞)、読み情報、アクセント情報等が予め登録され
た単語辞書26と、特定読み対応テーブル28を参照し
て日本語解析を行なう。この際、日本語解析部14は、
制御部10を介して与えられた文書から、特定の文字列
と同文字列に対する読みの指定を抽出して、特定読み対
応テーブル28に登録する。音声データ生成部16、音
声合成装置18は、日本語解析部14による解析結果に
基づいて、音声発声装置36から文書に応じた音声を発
声させる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語解析による結果
について音声合成を行ない、音声によって発声させる文
書読み上げ装置に関する。
【0002】
【従来の技術】近年、日本語文書を任意の音声で発声す
る文書読み上げ装置が開発されている。この種、文書読
み上げ装置では、読み上げの対象とする各単語に関する
形態情報、読み情報、アクセント情報等が登録された単
語辞書を参照しながら、日本語文書について日本語解析
が行われ、その結果に基づく音声合成処理によって音声
が発声される。
【0003】単語辞書に日本語文書中の各単語が登録さ
れている場合には、その単語に対応する正しい読みによ
って発声されるが、必ずしも全ての単語が登録されてい
るとは限らない。
【0004】従来の文書読み上げ装置は、予め用意され
た単語辞書に存在しない単語が、日本語文書中に出現し
た場合、漢字単位に適当な読みを対応させ、合成するこ
とにより単語に対応する読みを生成している。
【0005】
【発明が解決しようとする課題】このように従来の文書
読み上げ装置では、単語辞書に登録されていない単語に
ついては、漢字単位の読みの合成によって単語に対応す
る読みが生成されていた。このため、単語が複数の漢字
によってなる場合には、しばしば本来の読みと異なった
読みで発声されることがあった。
【0006】特に、出現頻度が少ない難読漢字や固有名
詞、さらに特別な読みで発声させたい単語は、単語辞書
に登録されていないことが多いため、これらの単語につ
いて誤った読みで発声されることが多かった。日本語文
書中では、難読漢字や固有名詞について、文書の最初に
出現した際に本来の読み方を示す部分(例えば括弧に囲
まれたひらがな読み)が付加されていることが多い。し
かしながら、正しい読みが付加されてあったとしても、
前述した漢字単位の読みを合成する方式では、付加され
た正しい読みによって発声されるとは限らなかった。
【0007】本発明は前記のような点に鑑みてなされた
もので、装置に対して特別な操作を必要とせずに、所望
する読み方によって文書を読み上げることが可能な文書
読み上げ装置を提供することである。
【0008】
【課題を解決するための手段】本発明は、複数の文字列
と各文字列についてそれぞれ対応する読みが予め登録さ
れている辞書と、任意の文字列と同文字列に対応する読
みを登録することが可能な記憶手段と、音声による読み
上げの対象となる文書から、特定文字列に対する読み及
び同読みに対応する前記特定文字列を抽出して前記記憶
手段に記憶させると共に、前記辞書に登録された内容及
び前記記憶手段に登録された内容に基づいて日本語解析
を行なう日本語解析手段と、前記日本語解析手段による
日本語解析の結果に基づいて音声を発声させる発声手段
とを具備したことを第1の特徴とする。
【0009】また本発明は、複数の文字列と各文字列に
ついてそれぞれ対応する読みが予め登録されている辞書
と、文字列と同文字列に対応する読みを登録することが
可能な記憶手段と、文書から特定文字列と同文字列に対
する読みを定義する記述を抽出して前記記憶手段に記憶
させると共に、前記辞書に登録された内容及び前記記憶
手段に登録された内容に基づいて、前記文書中の読み上
げの対象となる部分について日本語解析を行なう日本語
解析手段と、前記日本語解析手段による日本語解析の結
果に基づいて音声を発声させる発声手段とを具備したこ
とを第2の特徴とする。
【0010】
【作用】このような構成によれば、音声による読み上げ
の対象とする文書中から、例えば括弧などの特定の記号
により示された読み、及びこの読みに対応する特定文字
列(非表記音文字列)を抽出して日本語解析の際に参照
できるように記憶される。従って、文書中に出現する同
様の非表記音文字列についても、文書中で指定された本
来の読みによって統一して正しく読み上げることができ
る。
【0011】また、文書中に定義された文字列とその読
みを抽出し、日本語解析の際に参照できるように記憶さ
れる。従って、、文書中に出現する同様の非表記音文字
列についても、文書中で指定された本来の読みによって
統一して正しく読み上げることができる。すなわち、特
定の表記に対する読み方を文書の記述形式で対象文書の
中に設けることにより、容易に用語などの自由な読み方
を指示することができる。
【0012】
【実施例】以下、図面を参照して本発明の第1実施例に
ついて説明する。図1は第1実施例に係わる文書読上げ
装置の構成を示すブロック図である。図1において、制
御部10は、本装置全体の動作を制御するものである。
制御部10には、入力装置12、日本語解析部14、音
声データ生成部16、音声合成装置18、及び表示装置
20が接続され、起動や各部へのデータの入出力の指示
が行なわれる。また、制御部10には、文書データ記憶
部22、及び設定バッファ24が接続されている。
【0013】入力装置12は、キーボードなどによって
構成され、操作者から読み上げの対象となる文書の範囲
の指定や読み上げるときの音質や速度などの条件等を指
示するためのものである。
【0014】日本語解析部14は、制御部10から与え
られた文書データを、単語単位で解析し、音声データを
生成するためのもとになる各単語の読みやアクセントの
情報を求めるものである。また、日本語解析部14は、
文書中の指定読み部分、及びこれに対応する非表音文字
列を抽出して、特定読み対応テーブル28に登録(書き
替え)を行なう。日本語解析部14には、単語辞書2
6、特定読み対応テーブル28、解析結果バッファ30
が接続されている。
【0015】単語辞書26は、読み上げの対象とする各
単語(文書中の表記)に関する形態情報(品詞)、読み
情報、アクセント情報等が予め登録されたもので、日本
語解析部14による解析の際に参照される。
【0016】特定読み対応テーブル28は、文書中で定
められた読み方で読み上げるために、対象となる単語
(非表音文字列、後述する)と、その読みを対応づけて
登録するためのテーブルである。解析結果バッファ30
は、日本語解析部14における解析の結果(文書中の各
単語の読みやアクセント)を格納するためのものであ
る。
【0017】音声データ生成部16は、日本語解析部1
4によって得られた解析結果バッファ30に記憶された
情報をもとに、日本語の読み方の規則に従ってより自然
な発声情報(音声データ)に書き替えるものである。
【0018】音声データ生成部16には、設定バッファ
24、解析結果バッファ30、音声データ生成規則記憶
部32、及び音声データバッファ34が接続されてい
る。設定バッファ24は、入力装置12から入力され
た、文書読み上げ時の音質や速度などの条件を示す情報
を、制御部10を介して記憶するためのものである。音
声データ生成規則記憶部32は、発音やアクセントを日
本語の読み方として正しくするための規則を記憶するた
めのものである。音声データバッファ34は、音声デー
タ生成部16によって生成された音声データを記憶する
ためのものである。
【0019】音声合成装置18は、音声データはバッフ
ァ34に記憶された音声データに応じて、音声規則合成
により電気信号に変換するためのものである。音声合成
装置18には、音声発声装置36が接続されている。音
声発声装置36は、スピーカ等によって構成され、音声
合成装置18によって得られた電気信号に応じて、音声
を発声させるものである。
【0020】表示装置20は、操作者に読み上げの対象
となる文書の範囲の指定や読み上げる時の音質や速度な
どの条件を指示させるために、文書や指示等の各種情報
を表示する。
【0021】文書データ記憶部22は、計算機により処
理可能な形で表された文書データを記憶するためのもの
である。文書データは、ワードプロセッサなどで作成さ
れ、あるいはOCR(光学式文字読取装置)などにより
読み込まれ、あるいは外部記憶装置や通信手段によって
読み込まれたものである。
【0022】次に、文書読み上げ装置の動作の概略につ
いて、図2に示すフローチャートを参照しながら説明す
る。まず、入力装置12から所定の操作による指示が制
御部10に入力されると、文書読み上げ処理が開始され
る。操作者は、入力部12を介して、文書読み上げの対
象とする文書範囲や、文書を読み上げる際の音質や速度
などの条件を、表示装置20の表示を参照しながら設定
することができる。制御部10は、入力部12から入力
された条件を示す設定情報を、設定バッファ24に記憶
させる(ステップA1)。
【0023】制御部10は、文書データ記憶部22に記
憶された文書データから、対象とする文書を読み込み日
本語解析部14に送る(ステップA2)。日本語解析部
14は、与えられた文書データに対して、特定読み対応
テーブル28(詳細については後述する)、及び単語の
形態情報、読み情報、アクセント情報などが登録された
単語辞書26を参照しながら解析を行い、読み上げ対象
とする文書を単語単位に切り分け、各単語についての解
析結果を解析結果バッファ30に書き込む(ステップA
3)。続いて制御部10は、音声データ生成部16を起
動する。
【0024】音声データ生成部16は、解析結果バッフ
ァ30に記憶された解析結果について、音声データ生成
規則32を参照し、自然な音声発声のために発音やアク
セントの変更(編集)を行なう(ステップA4)。音声
データ生成部16は、編集によって得られた情報(音声
データ)を音声データバッファ34に記憶させる。この
際、音声データ生成部16は、設定バッファ24を参照
して設定された音質や速度で読み上げるための情報も付
加する。
【0025】制御部10は、音声合成装置18を起動す
る。音声合成装置18は、音声データバッファ34に記
憶された音声データに応じて、音声規則合成により電気
信号に変換し、音声発声装置36より発声させる(ステ
ップA5)。これにより一般の文書の読み上げが行われ
る。
【0026】日本語解析部14は、文書データを解析す
る際に、予め内容が登録された単語辞書26の他に特定
読み対応テーブル28を参照する。特定読み対応テーブ
ル28は、文書中で定められた読み方で読むために、対
象となる単語(漢字など)とその読みを登録しておくテ
ーブルである。
【0027】すなわち、日本語文書中には、難読漢字や
固有名詞について、文書の最初に出現した際に本来の読
み方を示す部分(例えば括弧に囲まれたひらがな読み)
が付加されていることが多い。この場合、読み方が付加
された難読漢字や固有名詞等の単語(以下、非表音文字
列と称する)については読み上げを行なわず、付加され
た読みの部分(以下、指定読み部分と称する)を読み上
げることで、文書本来の正しい読み方となる。
【0028】日本語解析部14は、読み上げ対象とする
文書を解析し、指定読み部分とこれに対応する非表音文
字列を文書中より抽出して、特定読み対応テーブル28
に順次登録する。
【0029】図3のフローチャートには、特定読み対応
テーブル28に対する登録を含む、日本語解析部14の
動作を示している。日本語解析部14は、処理対象とす
る文字位置を示す文字ポインタに応じて文書の解析を行
なう(ステップB1)。
【0030】日本語解析部14は、入力される文書中に
定められた読み方で読むべき非表音文字列部分、例えば
括弧に囲まれた指定読み部分が付加された文字列を識別
すると(ステップB2,B3)、その読みに従った読み
情報を解析結果バッファ30に記憶させる(ステップB
4)。また、日本語解析部14は、同時に非表音文字列
部分と指定読み部分の関係を、特定読み対応テーブル2
8に登録する(ステップB5)。
【0031】指定読み部分が付加されていない文字部分
について、日本語解析部14は、まず特定読み対応テー
ブル28を検索し(ステップB6)、ここに登録された
表記の文字または文字列であればその対応する読みを特
定読み対応テーブル28から得て解析結果バッファ30
に出力する(ステップB7)。
【0032】さらに、特定読み対応テーブル28にも存
在しない文字または文字列部分について、日本語解析部
14は、単語辞書26を検索して読み、及びアクセント
の情報を得て解析結果バッファ30に出力する(ステッ
プB8)。日本語解析部14は、以上の処理を、文字ポ
インタを更新しながら、処理対象とする文書データにつ
いて順次実行する(ステップB9)。
【0033】なお、単語辞書26の内部には各漢字単位
の音訓辞書も含まれているものとし、日本語解析部14
は、特定読み対応テーブル28及び単語辞書26中に単
語単位に登録されていない漢字文字あるいは文字列につ
いては、この漢字単位の音訓辞書を参照して読みを求め
る動作を行う。次に、具体例を用いて詳細な動作につい
て説明する。
【0034】入力装置12から必要な指示が入力された
後、文書データ記憶部22に記憶された文書データが日
本語解析部14に送られる。日本語解析部14が参照す
る単語辞書26は、例えば図4に示すような内容であ
り、各表記(単語)に対応して文法解析に必要な品詞情
報(形態)と出力するべき読み情報やアクセントの情報
が記載されている。
【0035】図4中、読み・アクセントの項目にある
「^」の記号は、その次の音韻にアクセントがあること
を示している。また、特定読み対応テーブル28は、例
えば図5に示すような形式内容であり、表記に対して出
力すべき読みの情報が対応づけられて記憶される。
【0036】初期状態では、特定読み対応テーブル28
には何も記憶されていない。日本語解析部14は、文書
データ記憶部22に記憶された文書データ中の文字列
を、順次特定読み対応テーブル28と単語辞書26を検
索しながら形態的に解析し単語ごとに分割する。解析さ
れた結果は、解析結果バッファ30に書き込まれる。図
6は入力文書である文書データの一部の例である。日本
語解析部14は、この文書データが与えられると以下の
ように動作する。
【0037】初めの非表音文字列“東海林”に対して、
「(」と「)」に挟まれた指定読み部分「(しょう
じ)」が付加されている。ここでは「(」と「)」に挟
まれた仮名部分が、非表音文字列に対する読み方である
と識別される。日本語解析部14は、解析結果バッファ
30に、指定読み部分「しょうじ」を記憶させる。な
お、図中、読み情報をカタカナで示している。
【0038】また、指定読み部分に対応する非表音文字
列の抽出は、一般的に例えば前方に連続する(直前の)
文字列の部分とし、さらに句読点などの特殊記号の後方
部分とすることができる。日本語解析部14は、指定読
み部分「しょうじ」と非表音文字列「東海林」とを対応
づけて、特定読み対応テーブル28に新規登録する。
【0039】指定読み部分「しょうじ」に続く文字列
「社長」に対して、日本語解析部14は、単語辞書26
を検索して得られる読み情報「シャチョウ」とその品詞
情報「名詞」を解析結果バッファ30に記憶させ、次の
「は」も同様に単語辞書26を検索して助詞の「は」と
して同様に記憶させる。この結果、解析結果バッファ3
0には、図7に示すようなデータが記憶される。先の非
表音文字列「東海林」についての品詞は不明である。
【0040】特定読み対応テーブル28に非表音文字列
「東海林」、及びその読み情報が登録された後、文書デ
ータ中に登録した非表音文字列と同じ文字列、例えば図
6に示す「東海林氏…」があった場合、日本語解析部1
4は、特定読み対応テーブル28を検索して、「東海
林」に対応する読み情報を得ることができる。「氏」に
ついては、単語辞書26から品詞、読み,アクセントの
データが得られる。
【0041】日本語解析部14による処理が終了する
と、音声データ生成部16が起動される。音声データ生
成部16は、解析結果バッファ30の内容をもとに音声
データ生成規則記憶部32を参照しながら音声データバ
ッファ34の作成を行なう。音声データ生成規則記憶部
32としては、例えば長音化、助詞「は」「へ」の読み
方、鼻濁音化、無声化などの音韻に関するものや、活用
変化、単語の複合化に伴うアクセントの移動や休止の位
置や長さの決定などの韻律情報に関するものがある。
【0042】先の例では長音部分を“ー”の記号で書き
換え、また名詞に続く助詞「は」の読みは「ワ」と書き
替えられる。なお、品詞無記入の用語は例えば名詞とし
て扱うこととしている。この結果、図8に示すような音
声データが音声データバッファ34に記憶される。
【0043】音声データ生成部16の処理が終了する
と、音声合成装置18は、音声データバッファ34に記
憶された音声データを基に、音声規則合成の手法によっ
て、各音韻列と、各種制御コードからなるデータ列を電
気的な音声記号に変換する。そして、音声合成装置18
は、電気記号をスピーカーなどの音声発生装置12を使
用して実際の合成音声として発声させる。
【0044】なお、特定読み対応テーブル28に記憶さ
れる内容は固定されず、処理対象とする文書データによ
って随時変更される。例えば、既に特定読み対応テーブ
ル28に登録されている表記(非表音文字列)と同一の
文字列に、異なる読み(指定読み部分)が指定された文
書データである場合、日本語解析部14は、先に非表音
文字列に対する読みに替えて、新たな読みデータを登録
する。
【0045】従って、例えば文書データに、新たに「東
海林(とうかいりん)…」という表現が出現すれば、以
降「東海林」については「トウカイリン」と読み上げら
れ、同時に特定読み対応テーブル28の登録内容が変更
される。
【0046】また、特定読み対応テーブル28に登録す
る非表音文字列は、単語辞書26に存在する表記でも可
能である。例えば、単語辞書26には、「資金」という
用語に対して「シキン」と読みが登録されているが、特
にこれを例えば「カネ」と読ませたい場合、同様にして
「資金(かね)…」と文書データ中で表現されれば、こ
れらの関係が特定読み対応テーブル28に登録される。
以降、「資金」については「カネ」と読み上げられる。
【0047】これは、図3のフローチャートに示すよう
に、特定読み対応テーブル28の登録内容に対する検索
は、単語辞書26より優先されるからである。特殊な読
み方を停止させたい場合は、例えば入力装置12からの
指示により、あるいは装置の電源スイッチオフ、初期化
用のスイッチを設けるなどして特定読み対応テーブル2
8を初期化することにより、単語辞書26に登録された
読みによって読み上げを行うことができる。
【0048】このようにして、第1の実施例における文
書の読み上げ装置では、括弧などの特定の記号により示
された指定の読みの文字列に従って、対応する非表音文
字列を本来の読みによって正しく読み上げることができ
る。
【0049】また、これらの関係を特定読み対応テーブ
ル28に記憶させ、以降この記憶された特定読み対応テ
ーブル28を検索することにより、以降の文書に出現す
る同一の非表音文字列についても、その都度その読み方
の指定がなくても同様統一された読み方で正しく読み上
げることができる。
【0050】さらに、特定読み対応テーブル28は、同
一の表記であっても新たに別の読み方を指定した文書が
出現した場合は、その都度新しい対応関係に更新される
ので、読み上げる文書の内容に応じて正しく読み上げる
ことができる。
【0051】また、通常の用語であっても特定の読み方
を指定した特定文書に対してはその特殊な読み方で読み
上げることができる。勿論、このように一旦作られた対
応データを初期化することにより、単語辞書26を検索
して標準的な読み方で読み上げることもできる。
【0052】なお、第1実施例では、非表音文字列に対
応する指定読み部分を、括弧に囲まれたひらがな読みの
場合を例にして説明したが、特定の記号で指定読み部分
を指定しても良いし、さらにルビを指定読み部分として
も良い。次に、第2実施例について説明する。
【0053】第2実施例における文書読み上げ装置は、
図1に示すブロック図中の日本語解析部14の動作及び
特定読み対応テーブル28に記憶される内容が異なる以
外、第1実施例における文書読み上げ装置と同一である
ので図1を参照して説明する。
【0054】第2実施例の日本語解析部14は、制御部
10から与えられた文書データを、単語単位で解析し、
音声データを生成するためのもとになる各単語の読みや
アクセントの情報を求めるものである。また、日本語解
析部14は、文書中で定義されている、特定の文字列部
分、読み、及び品詞情報の関係を抽出して、特定読み対
応テーブル28に登録(書き替え)を行なう。
【0055】図9のフローチャートには、特定読み対応
テーブル28に対する登録を含む、日本語解析部14の
動作を示している。日本語解析部14は、処理対象とす
る文字位置を示す文字ポインタに応じて文書の解析を行
なう(ステップC1)。
【0056】日本語解析部14は、入力される文書中
に、特定の表現形式によって定義された記述(特定の文
字列部分、読み、及び品詞情報)を識別すると(ステッ
プC2,C3)、その関係を、特定読み対応テーブル2
8に登録する(ステップC4)。
【0057】その他の、通常の記述形式による文字部分
について、日本語解析部14は、まず特定読み対応テー
ブル28を検索し(ステップC5)、ここに登録された
表記の文字または文字列であればその対応する読みを特
定読み対応テーブル28から得て解析結果バッファ30
に出力する(ステップC6)。
【0058】さらに、特定読み対応テーブル28にも存
在しない文字または文字列部分について、日本語解析部
14は、単語辞書26を検索して読み、及びアクセント
の情報を得て解析結果バッファ30に出力する(ステッ
プC7)。日本語解析部14は、以上の処理を、文字ポ
インタを更新しながら、処理対象とする文書データにつ
いて順次実行する(ステップC8)。次に、具体例を用
いて詳細な動作について説明する。
【0059】入力装置12から必要な指示が入力された
後、文書データ記憶部22に記憶された文書データが日
本語解析部14に送られる。日本語解析部14が参照す
る単語辞書26は、例えば図4に示すような内容であ
り、各表記(単語)に対応して文法解析に必要な品詞情
報(形態)と出力するべき読み情報やアクセントの情報
が記載されている。
【0060】また、特定読み対応テーブル28は、図1
0に示すように、単語辞書26と同様な形式内容であ
り、各表記(単語)に対して出力すべき読み情報、及び
品詞情報が対応づけられて記憶される。
【0061】初期状態では、特定読み対応テーブル28
には何も記憶されていない。図11は入力文書である文
書データの例である。日本語解析部14は、この文書デ
ータが与えられると以下のように動作する。
【0062】図11に示す文書の初めの2行、すなわち
文字列「@東海林:^ショウジ:名詞」と「@計算機:
マ^シン:名詞」が特定の表現形式によって定義された
記述部分である。第1行目の記述は、「東海林」という
表記に対して「ショウジ」という読み方を指定し、その
品詞が名詞であることを示している。
【0063】ここでは行頭の「@」の記号によって、読
み方の定義を記述した行であることを示している。この
行には、表記、読み情報、品詞の順に、記号「:」で区
分した記述形式で示される。
【0064】日本語解析部14は、この定義部分を識別
し、「東海林」とその指定の読み部分「^ショウジ」、
及び品詞「名詞」を対応づけて、特定読み対応テーブル
28に新規登録する。日本語解析部14は、同様に「計
算機」、その指定の読み部分「マシン」、及び品詞「名
詞」を特定読みテーブル28に登録する。
【0065】ここのように、特定読み対応テーブル28
に、品詞情報の指定ができるので、例えば動詞等の活用
語も単語辞書26と同様の形式で登録することができ
る。なお、アクセントの指定がない場合には、0型のア
クセントとする。
【0066】特定の表現形式によって定義された記述部
分に続く行部分、すなわち記号「@」が行頭にない行部
分は、通常の読み上げの対象とする文書部分である。日
本語解析部14は、通常の文書部分の文字列「東海林」
について、特定読み対応テーブル28を検索することに
より、この表記に対応する読みである「^ショウジ」を
得て、解析結果バッファ30に記憶させる。
【0067】続く文字列「社長」について、特定読み対
応テーブル28に登録されていないので、単語辞書26
を検索することにより、読みである「シャチョウ」を得
て、解析結果バッファ30に記憶させる。続く文字
「は」について、同様に単語辞書26を検索することに
より、助詞「は」と判別し、解析結果バッファ30に記
憶させる。この結果、解析結果バッファ30には、図1
2に示すようなデータが記憶される。
【0068】以下、解析結果バッファ30に記憶された
データに応じた文書読み上げの(合成音声として発生さ
せる)動作は、第1実施例の場合と同一であるので説明
を省略する。
【0069】なお、特定読み対応テーブル28に記憶さ
れる内容は固定されず、処理対象とする文書データによ
って随時変更される。例えば、既に特定読み対応テーブ
ル28に登録されている表記と同一の文字列に、異なる
読みが指定された場合、日本語解析部14は、先に非表
音文字列に対する読みに替えて、新たな読みデータを登
録する。
【0070】従って、例えば文書データに、新たに「@
東海林:トウカイリン:名詞」という定義の記述が出現
すれば、以降「東海林」については「トウカイリン」と
読み上げられ、特定読み対応テーブル28の「東海林」
に対応する読みが「トウカイリン」に変更される。
【0071】また、特定読み対応テーブル28に登録す
る文字列は、単語辞書26に存在する表記でも可能であ
る。例えば、単語辞書26には、「計算機」という用語
に対して「ケイサンキ」と読みが登録されているが、特
にこれを例えば「マシン」と読ませたい場合、図11に
示す文書中の第2行目のように定義すれば、これらの関
係が特定読み対応テーブル28に登録される。以降、
「計算機」については「マシン」と読み上げられる。
【0072】また、文書中で特定読み対応テーブル28
に登録された内容の削除を指定することができる。例え
ば、「@東海林::」というように、読みが空の定義が
された場合には、既に登録されている表記「計算機」の
登録を削除するように動作させれば良い。
【0073】このようにして、特定の文字列部分、読
み、及び品詞情報の関係を定義する記述部分を設けるだ
けで、この記述から特定読み関係テーブル28に定義さ
れた内容を登録するので、それ以降文書に出現する同一
の文字列について、定義した読みで発声させることがで
きる。
【0074】また、特定読み対応テーブル28に登録さ
れた内容は、同一の表記(文字列)に対して新たに別の
読み方を定義する記述を文書中に設けることにより、そ
の都度新規の対応関係に更新することができる。
【0075】勿論、一度、特定読み対応テーブル28に
記憶された内容を初期化することにより、単語辞書26
に登録された内容に基づいて、標準的な読み方で読み上
げることができる。
【0076】また、読み方を定義する記述によって、ア
クセント及び品詞情報をも指定できるので、特に装置に
対して特殊な操作を行わなくても、容易に単語辞書26
に対する新規追加と同様な機能が実現される。
【0077】なお、前記第2の実施例では、読みを定義
するための記述を、文書読み上げの対象とする文書のは
じめに設けているが、この位置は任意であり、文書途中
にあっても良い。また、記号「@」によって、読み方の
定義を記述した行であることを示すものとしているが、
この記号も特に限定されるものではない。
【0078】さらに、第1実施例、第2実施例の何れ
も、本装置のハードウェア構成を、特定読み対応テーブ
ル28の記憶部分を電池でバックアップするようにし
て、装置の停止スイッチを切っても記憶内容を保存させ
ることは可能である。これにより、1つの文書を何回か
に分けて読みたい場合など、一旦装置を停止しても再び
その続きの内容を以前登録した読み方で読み上げられ好
都合である。
【0079】
【発明の効果】以上のように本発明によれば、文書中か
ら特定の文字列と同文字列に対して指定される読み方を
抽出して登録し、この内容に基づいて日本語解析を行な
うので、装置に対して特別な操作を必要とせずに、所望
する読み方によって文書を読み上げることが可能となる
ものである。
【図面の簡単な説明】
【図1】本発明の実施例に係わる文書読み上げ装置の構
成を示すブロック図。
【図2】文書読み上げ装置の動作の概略を説明するため
のフローチャート。
【図3】第1実施例における日本語解析部14の動作を
説明するためのフローチャート。
【図4】単語辞書26の内容を説明するための図。
【図5】第1実施例における特定読み対応テーブル28
を説明するための図。
【図6】第1実施例を説明するための文書データの一例
を示す図。
【図7】第1実施例において解析結果バッファ30に記
憶されるデータの一例を示す図。
【図8】音声データバッファ34に記憶された音声デー
タの一例を示す図。
【図9】第2実施例における日本語解析部14の動作を
説明するためのフローチャート。
【図10】第2実施例における特定読み対応テーブル2
8を説明するための図。
【図11】第2実施例を説明するための文書データの一
例を示す図。
【図12】第2実施例において解析結果バッファ30に
記憶されるデータの一例を示す図。
【符号の説明】
10…制御部、12…入力装置、14…日本語解析部、
16…音声データ生成部、18…音声合成装置、20…
表示装置、22…文書データ記憶部、24…設定バッフ
ァ、26…単語辞書、28…特定読み対応テーブル、3
0…解析結果バッファ、32…音声データ生成規則記憶
部、34…音声データバッファ、36…音声発声装置。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数の文字列と各文字列についてそれぞ
    れ対応する読みが予め登録されている辞書と、 任意の文字列と同文字列に対応する読みを登録すること
    が可能な記憶手段と、 音声による読み上げの対象となる文書から、特定文字列
    に対する読み及び同読みに対応する前記特定文字列を抽
    出して前記記憶手段に記憶させると共に、前記辞書に登
    録された内容及び前記記憶手段に登録された内容に基づ
    いて日本語解析を行なう日本語解析手段と、 前記日本語解析手段による日本語解析の結果に基づいて
    音声を発声させる発声手段と、 を具備したことを特徴とする文書読み上げ装置。
  2. 【請求項2】 前記日本語解析手段は、前記記憶手段に
    登録された第1の特定文字列と同一の第2の特定文字列
    に対する読みを抽出した際に、前記記憶手段に登録され
    た前記第1の特定文字列に対する読みを変更することを
    特徴とする請求項1記載の文書読み上げ装置。
  3. 【請求項3】 複数の文字列と各文字列についてそれぞ
    れ対応する読みが予め登録されている辞書と、 文字列と同文字列に対応する読みを登録することが可能
    な記憶手段と、 文書から特定文字列と同文字列に対する読みを定義する
    記述を抽出して前記記憶手段に記憶させると共に、前記
    辞書に登録された内容及び前記記憶手段に登録された内
    容に基づいて、前記文書中の読み上げの対象となる部分
    について日本語解析を行なう日本語解析手段と、 前記日本語解析手段による日本語解析の結果に基づいて
    音声を発声させる発声手段と、 を具備したことを特徴とする文書読み上げ装置。
  4. 【請求項4】 前記日本語解析手段は、前記記憶手段に
    登録された第1の特定文字列と同一の第2の特定文字列
    に対する読みを定義する記述を抽出した際に、前記記憶
    手段に登録された前記第1の特定文字列に対する読みを
    変更することを特徴とする請求項3記載の文書読み上げ
    装置。
  5. 【請求項5】 前記記憶手段に記憶された内容を取り消
    すための初期化手段をさらに具備し、 前記初期化手段によって前記記憶手段に記憶された内容
    を取り消し、前記日本語解析手段による日本語解析を前
    記辞書に登録された内容のみに基づいて行なうことを特
    徴とする請求項1または請求項3記載の文書読み上げ装
    置。
  6. 【請求項6】 前記記憶手段は、非揮発性のものであ
    り、前記日本語解析手段によって変更されない限り登録
    された内容が保存されること特徴とする請求項2または
    請求項4記載の読み上げ装置。
JP4002949A 1992-01-10 1992-01-10 文書読み上げ装置 Pending JPH05189194A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4002949A JPH05189194A (ja) 1992-01-10 1992-01-10 文書読み上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4002949A JPH05189194A (ja) 1992-01-10 1992-01-10 文書読み上げ装置

Publications (1)

Publication Number Publication Date
JPH05189194A true JPH05189194A (ja) 1993-07-30

Family

ID=11543626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4002949A Pending JPH05189194A (ja) 1992-01-10 1992-01-10 文書読み上げ装置

Country Status (1)

Country Link
JP (1) JPH05189194A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010039277A (ja) * 2008-08-06 2010-02-18 Mitsubishi Electric Corp 音声合成装置
JP2013190595A (ja) * 2012-03-14 2013-09-26 Yamaha Corp 歌唱合成用シーケンスデータ編集装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010039277A (ja) * 2008-08-06 2010-02-18 Mitsubishi Electric Corp 音声合成装置
JP2013190595A (ja) * 2012-03-14 2013-09-26 Yamaha Corp 歌唱合成用シーケンスデータ編集装置

Similar Documents

Publication Publication Date Title
US7496498B2 (en) Front-end architecture for a multi-lingual text-to-speech system
US7155390B2 (en) Speech information processing method and apparatus and storage medium using a segment pitch pattern model
JPH10116089A (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
US20090204401A1 (en) Speech processing system, speech processing method, and speech processing program
JPH11249677A (ja) 音声合成装置の韻律制御方法
JPH05165486A (ja) テキスト音声変換装置
Stöber et al. Speech synthesis using multilevel selection and concatenation of units from large speech corpora
JPH0887297A (ja) 音声合成システム
JP2003271183A (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
JPH05189194A (ja) 文書読み上げ装置
JPH0634175B2 (ja) 文章読上げ装置
JPH05134691A (ja) 音声合成方法および装置
JPH06119144A (ja) 文書読み上げ装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JPH03217900A (ja) テキスト音声合成装置
JP2938466B2 (ja) テキスト音声合成システム
JPH0962286A (ja) 音声合成装置および音声合成方法
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体
JP3234371B2 (ja) 音声合成用音声持続時間処理方法及びその装置
JP3034554B2 (ja) 日本語文章読上げ装置及び方法
JP2001343987A (ja) 音声合成方法、および音声合成装置
JP2728440B2 (ja) 音声出力装置
JPH07152392A (ja) 音声合成装置
JPH02238494A (ja) 音声合成装置
JP3402480B2 (ja) 文書朗読装置